当扎克伯格夫妇在 2015 年宣布要“在本世纪末治愈所有疾病”时,大多数科学家根本没有把这当回事。不是因为这个目标显得过于狂妄,而是因为如果只是简单地把钱分散到全美各个实验室,这根本不可能实现。但这种质疑恰恰推动他们找到了一条独特的路径:与其资助更多的研究,不如先造出科学家们迫切需要的工具。
十年后的今天,这条路走得比预想的更远。11 月 7 日,在知名风险投资机构 a16z 的最新播客中,马克·扎克伯格(Mark Zuckerberg)和妻子、儿科医生普莉希拉·陈(Priscilla Chan)首次详细披露了他们的慈善机构 Chan Zuckerberg Initiative(CZI,陈-扎克伯格倡议)如何在 AI 革命中重新定义生命科学研究的节奏。
图丨相关对话(来源:YouTube)
就在播客录制的同一天,CZI 宣布了成立以来最重大的一次重组:将组织架构重组为统一的 Bio Hub 网络,全力聚焦 AI 与生物学的深度融合。更引人注目的是,他们收购了由前 Meta AI 研究员创立的蛋白质语言模型公司 Evolutionary Scale 的团队,并任命其首席科学家 Alex Rives 为 CZI 的科学负责人。这标志着 CZI 从广泛的社会议题中彻底抽身,将几乎全部资源投向了科学研究这个单一战场。
从工具建设者到 AI 时代的破局者
在旧金山湾区的医院实习时,普莉希拉遇到过太多让她无力的时刻。有些孩子能勉强确认携带某个基因突变,运气好的话医生能拿到一份几页纸的 PDF 文件,上面写着人类对这种疾病的全部了解。更多时候,孩子们只是被笼统地归入某个疾病类别,而她作为实习医生,需要把这寥寥几行信息翻译成实际的治疗方案。
“那时我才真正意识到基础科学的力量,”她在播客中回忆道,“没有基础科学的进步,就没有通向希望的道路。”
这种挫败感塑造了 CZI 的核心策略。扎克伯格用工程师的思维解释了他们的逻辑:纵观科学史,大多数重大突破都源于新工具的诞生,显微镜让人类看到了细菌,望远镜揭开了宇宙的面纱。“这就像写代码却无法调试一样,”他说,“你根本不知道问题出在哪里。”
但在生物医学领域,这类工具的开发存在一个尴尬的资金真空。美国国立卫生研究院(National Institutes of Health,NIH)的拨款体系将资金分散到成千上万个小额项目中,每个研究者都在追求短期可见的成果。而像虚拟细胞模型这样的大型工具平台,需要 1 亿到 10 亿美元的投入,研发周期长达 10 到 15 年,完全不符合传统科研资助的逻辑。
更尴尬的是,即便做出了工具,学术界也不会给予太多认可。“你不会因为造工具而获得学术声誉,”a16z 的主持人指出。这恰恰是慈善资本可以填补的空白——不求短期回报,不争学术荣誉,只聚焦于造出真正有用的东西。
十年前,当 CZI 开始资助单细胞测序技术标准化时,没人能预见这些数据会成为 AI 模型的训练语料。但当大型语言模型在 2022 年后爆发时,CZI 突然发现自己坐拥金矿。他们花费多年建立的 Cell Atlas(细胞图谱)项目和 CELLxGENE 平台,积累了超过 1 亿个细胞的标准化数据,成为训练生物 AI 模型最宝贵的资源。
“大型语言模型出现的时候,我们突然意识到,我们可以理解这些数据了,”普莉希拉说。生物学家眼中“疯狂激进”的目标,在 AI 研究者看来却“有点无聊,因为那会自动发生”。这种认知上的差异恰恰指向了 CZI 的价值所在:用 AI 工具加速生物学进展。
从数字人类到可编程的生物学
扎克伯格在播客中透露了一个令人惊讶的事实:直到 2025 年,生物学领域仍然没有一个类似元素周期表的基础性参考体系。这听起来几乎不可思议,但现实就是如此。这也是为什么 Cell Atlas 项目具有如此重大的意义。
Cell Atlas 的诞生其实充满偶然性。十年前,CZI 资助了几个实验室开始收集单细胞数据,很快研究者们就遇到了瓶颈:数据标注的速度跟不上数据生成的速度。为了解决这个问题,CZI 团队开发了一个标注工具,也就是后来的 CELLxGENE。但他们很快发现,因为大家都在用同一个标注工具,数据格式自然就统一了。
“这就像网络效应,”扎克伯格解释道。标准化的数据吸引了更多研究者贡献数据,社区开始自发成长。如今,CZI 只资助了 Cell Atlas 项目中 25% 的数据,其余 75% 都来自全球科学界的自发贡献。根据《自然》(Nature)杂志 2025 年 8 月的报道,CELLxGENE 现在已经包含了近 1 亿个细胞的数据,成为全球最大的标准化单细胞数据库。
但数据只是起点。CZI 真正的野心是建立“虚拟细胞”(virtual cell)——能够模拟细胞在不同状态下行为的高保真 AI 模型。这个愿景分为多个层次:从蛋白质到细胞结构,从单个细胞到整个免疫系统,每一层都需要专门的模型。
就在今年 4 月,CZI 发布了 TranscriptFormer 模型,这是基于跨越 15 亿年进化史的 12 个物种、1.12 亿个细胞训练出来的基础模型。它可以预测细胞类型、识别疾病状态,甚至推断基因之间的相互作用,而这些通过提示词即可完成,就像和 ChatGPT 对话一样。
图丨 TranscriptFormer 模型(来源:CZI)
更专业化的模型也在不断推出。扎克伯格在播客中提到了几个正在研发的模型:VariantFormer 可以预测 CRISPR 基因编辑的结果;一个扩散模型能够根据描述生成合成细胞的数字版本;而 CryoEM 模型则提供空间分辨率的细胞结构信息。
“这就像语言模型发展的路径,”他解释道,“你先训练出不同的专项能力,然后逐渐整合成越来越通用的模型。”最终目标是建立一个能够运行“生物学推理”(biological reasoning)的系统,它不仅能告诉你相关性,还能推理出因果关系。
这种“推理模型”还处于非常早期的阶段,但它的潜力是革命性的。正如 a16z 的主持人所说:“如果实验失败了,下一个问题就是为什么?”一个能够解释生物学机制的 AI,将彻底改变科学假设的生成方式。
三个 Bio Hub 在这个宏大叙事中扮演着不同的角色。旧金山的 Bio Hub 专注于深度成像和转录组学,芝加哥的团队研究组织工程和细胞通讯,纽约的项目则致力于细胞工程——让细胞能够记录周围环境的信息并反馈出来。这些看似分散的项目,实际上都在为同一个目标服务:生成训练虚拟细胞所需的多模态数据。
Alex Rives:AI 原生的生物学领袖
CZI 此次重组最重要举措之一,是任命 Alex Rives 为新的科学负责人。
“这其实挺有意思的,”扎克伯格在播客中说,“我们找的不是一个懂点 AI 的生物学家在领导,而是一个深刻理解生物学的 AI 研究者。这在某种程度上说明了我们认为相对权重应该放在哪里。”
图丨 Alex Rives(来源:Broad Institute)
Rives 的履历几乎完美契合了 CZI 的需求。他在 Meta 的基础 AI 研究实验室(FAIR)期间,领导开发了 ESM(Evolutionary Scale Modeling)系列模型,这被广泛认为是首个真正意义上的蛋白质大型语言模型。2019 年发布的 ESM1 模型为整个领域奠定了基础,后续的 ESM2 模型能够预测超过 6 亿个宏基因组蛋白质的结构。
2023 年 4 月,Rives 和几位 Meta 同事离开公司,创立了 Evolutionary Scale。一年后,他们发布了 ESM3 模型——一个能够生成全新蛋白质的生成式 AI。在一项实验中,ESM3 通过“推理链”(chain of thought)模拟了 5 亿年的进化过程,设计出了一种全新的荧光蛋白。这项工作为 Evolutionary Scale 赢得了 1.42 亿美元的种子轮融资,投资方包括前 GitHub CEO Nat Friedman 和风险投资公司 Lux Capital。
Rives 的加入不仅带来了顶尖的技术能力,更重要的是他对“可编程生物学”(programmable biology)的愿景。在 MIT 的一次演讲中,他曾说:“我们的目标是开发能够直接从序列中提炼生物设计原理的通用模型。”这与 CZI 构建虚拟细胞的战略高度一致。
值得注意的是,Rives 同时也是 MIT 和 Broad Institute 的教职成员,这种跨界身份将有助于 CZI 与学术界建立更紧密的联系。而 Evolutionary Scale 团队的加入,也意味着 CZI 现在拥有了从蛋白质到细胞、从单一模态到多模态的完整 AI 建模能力。
重组背后
CZI 的战略收缩其实早有预兆。成立之初,这个慈善机构的愿景宏大得惊人:改革美国教育、转变公共政策、治愈所有疾病。在过去十年间,CZI 累计承诺了超过 70 亿美元的资助。但扎克伯格夫妇逐渐意识到,在某些领域,慈善资本的影响力非常有限。
“我们想专注于一些不会每隔几年就被推翻的事情,”扎克伯格在采访中坦言。教育改革、住房政策这些领域高度依赖政治环境,投入再多也可能随着政府换届而付诸东流。相比之下,基础科学的进展具有累积性和不可逆性。今天发现的生物学规律,不会因为明天的选举而失效。
数据也支持了这个判断。普莉希拉在播客中透露,在 CZI 尝试的多个方向中,科学研究带来的回报“远远超过”其他领域。这让他们一次次加码,直到 Bio Hub 成为 CZI 事实上的核心。
2025 年初,在特朗普就职后,CZI 结束了基于多元化的招聘计划,裁减了负责多元化倡议的员工。4 月,普莉希拉创办的一所服务低收入学生的学校因失去资金而关闭。5 月,组织终止了几乎所有针对当地住房非营利组织的资助。这一系列动作背后,是一个清晰的信号:CZI 正在战略性撤退,将有限的资源集中到最有把握产生影响的领域。
新的 Bio Hub 架构强调的是“闭环”思维。普莉希拉在播客中详细解释了这个概念:当 AI 团队发现某个模型在特定领域表现不佳时,他们可以直接与实验团队沟通,设计新的实验来生成所需的数据。反过来,实验产生的丰富元数据又可以反馈到模型训练中。“这些人需要并肩工作,相互塑造彼此的工作,”她强调,“而不仅仅是写下规格说明书,然后说‘请交付这个’。”
这种紧密整合在传统学术机构中很难实现。大学教授们各自为政,跨学科合作往往流于形式。而 Bio Hub 采用的模式——将来自斯坦福、加州大学伯克利分校、加州大学旧金山分校等顶尖机构的研究者集中到同一个物理空间——正是为了打破这种壁垒。
“很多组织问题都可以通过让两个团队坐在一起来解决,”扎克伯格说,“不管组织结构图是什么样的,你们就坐在一起,直到把事情做成。”
从虚拟实验到精准医疗
虚拟细胞模型的价值不仅在于理解生物学,更在于改变科学研究的经济学。
普莉希拉用投资的思维框架解释了这一点:“现在申请科研经费很困难,湿实验室的工作既昂贵又缓慢。这不仅仅是钱的问题,还有时间。”一个年轻的研究者必须选择成功率相对较高的项目,以确保发表论文、获得终身教职。这种激励机制天然地让科学家规避风险。
但如果有了高质量的虚拟细胞模型,研究者可以先在计算机上进行实验,测试那些在传统框架下“太冒险”的想法。只有当虚拟实验显示出前景时,才投入昂贵的实验室资源。“你不需要 100% 的准确度就能产生价值,”普莉希拉说,“只要能得到方向性的信号,就能大大提高效率。”
这种思路也在重塑药物研发的逻辑。传统上,我们把患者按年龄、种族、病症分组,然后试探性地尝试不同药物。但每个人的生物学其实都是独特的——即便是同样被诊断为高血压或抑郁症的患者,其细胞层面的问题可能完全不同。
“我们真的应该把大多数疾病视为罕见病,”普莉希拉说,“因为每个人的生物学都不同。”单细胞转录组学让研究者能够追踪一个基因突变如何影响下游的细胞群体,哪些蛋白质表达异常,从而精确识别药物靶点。更重要的是,这种方法还能预测脱靶效应,因为你知道这个药物还会与身体其他部位的什么分子相互作用。
a16z 的投资组合中已经有创业公司在使用 CELLxGENE 的数据。有一家公司研究特发性肺纤维化(Idiopathic Pulmonary Fibrosis,IPF),“特发性”即意味着我们不知道其病因。研究者使用 CELLxGENE 分析了数百万个细胞,对比患者和健康人的成纤维细胞基因表达,试图找到新的药物靶点。这种工作在几年前根本无法想象。
图丨CELLxGENE(来源:CZI)
CZI 也在努力降低使用这些工具的门槛。CELLxGENE 的用户界面被刻意设计得不需要深厚的计算背景,让来自不同领域的研究者都能参与进来。2024 年 12 月,CZI 发布了 AI Cell Models Platform(AI 细胞模型平台),为每个模型配备了即用型的 Jupyter notebook,生物学家可以快速上手,无需复杂的调试。
此外,他们也在推进计算资源的共享。传统上,单个实验室可能拥有几十个 GPU。而 CZI 建立了一个拥有 1000 个 GPU 的集群,并计划扩展到 1 万个。这种规模的计算能力让研究者可以提出全新类型的科学问题。CZI 还启动了“驻留科学家”计划,邀请外部研究者申请使用这些资源,以换取数据和模型的开源共享。
生物学的“可编程”未来
在播客的最后,普莉希拉分享了她最近十年来的一个感受。过去十年,她一直羡慕营利性公司的创始人,因为市场会给出清晰的反馈。无论是私人估值还是股价,都能告诉你是否做对了。而慈善事业充满模糊性,你很难知道自己是否真的在产生影响。
“但现在十年过去了,”她说,“我们不仅实现了当初承诺的目标,实际产出甚至超出了预期。这是一个我可以抓住的信号。”
这个信号包括:Cell Atlas 从最初的几个实验室扩展到全球协作,75% 的数据来自外部贡献;CELLxGENE 成为近 1 亿个细胞数据的标准化平台;TranscriptFormer 等模型在没有标注数据的情况下就能识别细胞类型和疾病状态;数十家生物技术公司和制药巨头正在使用这些工具进行药物研发。
但扎克伯格也很清楚 CZI 的定位。“我们有客户,这对于慈善机构来说还挺厉害的,”他笑着说。Bio Hub 的“客户”是全球的科学家、创业者、制药公司,或者说,任何想要理解和操纵生物学的人。CZI 的角色是加速基础科学,而不是做药物开发本身。
“从加速基础科学,到资助许多人使用这些工具,再到生物技术公司开始研发新疗法,然后是制药公司大规模生产,最后是慈善机构在公共卫生端将疗法推广到全世界,”扎克伯格描绘了一条完整的链条,“这是一个巨大的生态系统,而我们在其中找到了一个独特的位置。”
这个位置正是工具建设者。在 AlphaFold 这样的突破性工作诞生几十年后,CZI 相信还有大量类似的工具等待被创造。而随着 AI 能力的指数级增长,这些工具将让“治愈所有疾病”从一个疯狂的目标变成一个可信的路线图。
“生物学界认为这太过激进,AI 界认为这太过无聊会自动发生,”扎克伯格总结道,“答案就在中间的某个地方,而这正是需要被连接的。”
从一个“不可能完成”的宏大愿景,到一个清晰聚焦的科学引擎,CZI 用了十年时间找到了自己的节奏。在 AI 重塑一切的时代,扎克伯格夫妇押注的不是通用人工智能或商业帝国,而是一个更基础的命题:如果我们真正理解了细胞如何工作,我们就能重新编程生物学本身。这个愿景听起来依然疯狂,但现在,至少科学家们愿意正视他们了。
参考资料:
1.https://www.youtube.com/watch?v=YnV8pgHtO5Y
2.https://www.nytimes.com/2025/11/06/technology/zuckerberg-chan-initiative-biohub.html?unlocked_article_code=1.zE8.14lC.J7ztKByGv7wm&smid=url-share
运营/排版:何晨龙