量子位 前天
80后诺奖得主:AlphaFold下一步融合大模型
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

正值AlphaFold问世五周年,其设计者、也是凭借 AlphaFold 获得诺贝尔化学奖的John Jumper公开表示:

AlphaFold 的下一步是与大模型融合。

不过具体方法并没有透露,或许已有所思路,甚至已经在进程之中。

五年期间,AlphaFold 已经帮助全球300 多万研究人员,预测了数亿种蛋白质的三维结构,并影响了超50 万篇相关论文。

可以说,这是继量子力学和分子生物学革命后,生命科学的又一次重大跃迁。

继最初的 " 结构预测革命 "、随后的 " 科研常规工具 " 化,AlphaFold 及其继承技术正在进入新的大模型阶段。

AlphaFold+ 大模型

即使是在 AI 浪潮不断涌来的今天,AlphaFold 仍然是AI+ 生命科学最具里程碑意义的一次落地。

作为一款由谷歌 DeepMind开发的 AI 科研工具,AlphaFold 能够精确预测蛋白质的三维结构。

利用存储在序列和结构数据库中的大量实验数据,该网络被训练以发现氨基酸序列之间的关联和模式。

2020 年首次公开 AlphaFold2 以来,它就迅速成为结构生物化学领域的坚实基座,接着又陆续推出了可预测多个蛋白质结构的 AlphaFold Multimer,以及迄今为止速度最快的 AlphaFold 3。

现在 AlphaFold 已经从最初单纯地蛋白质结构预测,发展到能够处理更为复杂的多分子复合体以及更广范围的生物分子交互。

科学家们也据此,实现了相当多的成果突破:

例如最近来自密苏里大学的研究团队,借助 AlphaFold,成功揭开了心血管疾病的秘密——坏胆固醇(LDL),并刊登上了《Nature》。

LDL 是动脉粥样硬化、冠心病等心脏疾病的主要风险因子,核心由ApoB100 蛋白组成,但由于其体积巨大、结构复杂,同时又与脂肪紧密缠绕,长期以来科学家都无法确认它的原子级三维结构。

于是他们利用 AlphaFold 先对其氨基酸序列进行结构预测,再将生成的模型拟合到密度图中,并逐步优化,直到与实验数据对齐。

最终揭示了 ApoB100 的笼状结构,为后续推动心血管疾病治疗提供了理论依据。

再比如说,利用 AlphaFold 研究蜜蜂的抗病性

该研究聚焦蜜蜂体内的关键蛋白Vitellogenin ( 简称 Vg ) ,该蛋白不仅支持群体后代喂养,还与蜜蜂的免疫力、抗压力息息相关。

在 AlphaFold 的帮助下,研究人员得以在两天时间内完成过去数年的工作,解密了 Vg 蛋白的近原子级结构模型,对濒危种群的保护起到了关键性指导作用。

另外,AlphaFold 在一些非常规用法上也依旧作用显著。

去年与 John Jumper 同获诺贝尔化学奖的计算生物学家David Baker,就正在尝试利用 AlphaFold 预测蛋白质合成设计的成功率。

或者有些团队也会将 AlphaFold 作为搜索引擎使用,在成千上万个候选蛋白中筛选出最有可能与目标蛋白结合的一种。

……

总之,AlphaFold 的作用不胜枚举,它已经不仅仅是单一的结构预测工具,更是当代实验设计的重要组成部分之一。

那么接下来 AlphaFold 又将何去何从呢?

据 John Jumper 所说,下一步将会是AlphaFold 与更广泛的 AI 大模型结合

AlphaFold 仍将继续推动结构预测成为研究流程中的基础一环,但与此同时,其结构预测能力也会同大模型强强结合,提升到能读懂科学文献数据、做科学推理的程度。

也就是说,接下来的 AlphaFold 在预测结构之外,或许还能提出假设、设计实验流程甚至自动生成研究思路。

对于一些更复杂的多分子多功能系统,例如蛋白之间的相互作用、核酸(DNA/RNA)的相互作用等,AlphaFold 也能更好地帮助理解对应的生物过程。

这就好比谷歌的另一个系统AlphaEvolve,使用一个大模型来生成问题的解决方案,然后再用第二个模型负责检查并过滤掉错误信息。

二者思路类似,不过一个面向数学和计算机科学领域,一个立足生物化学。

首位 "80 后 " 诺奖得主

负责领导开发 AlphaFold 的,则是 DeepMind 创始人兼 CEO哈萨比斯John Jumper

其中,John Jumper 还是最年轻的诺贝尔化学奖得主,也是首位 80 后诺奖得主

他本科就读于范德堡大学,主修数学和物理,随后又在剑桥大学获得理论凝聚态物理硕士,并在芝加哥大学博士期间转向理论化学。

他的博士论文就是研究如何将机器学习技术应用于蛋白质动力学研究。

2017 年,正在读博士后的他听说了谷歌 DeepMind 正在从游戏 AI 开发秘密转向蛋白质结构预测,于是他申请了这份工作。

事实上,在 AlphaFold 之前,谷歌 DeepMind 就尝试了名为"Foldit"的蛋白质折叠游戏,这还是因为哈萨比斯从剑桥求学时代起就对蛋白质折叠问题的关注,他希望通过预测蛋白质结构,找到解决阿尔茨海默症等疾病的方法。

但游戏终归只是游戏,在面对真实的分子结构上显然不够用,因为真实的蛋白质折叠的训练数据极为固定有限。

要确定一个蛋白质结构,往往需要耗费数月甚至数年时间,而这一过程已经持续了将近半个世纪

于是他们转向研发了AlphaFold

虽然初代 AlphaFold 在第 13 届 CASP(蛋白质结构预测关键评估赛事)中崭露头角,成功预测出 43 个蛋白质中的其中 25 个,力压其余的 97 名参赛者,证明了用" 机器学习 + 统计信息 "推断蛋白质结构是可行的。

但哈萨比斯坦言,当时的预测质量还不足以让生物学家在实际中应用,其针对复杂蛋白的准确性、泛化性还存在严重缺陷。

在意识到仅依靠标准的机器学习方法无法取得成功后,DeepMind 内部专门成立了一个攻坚小组,利用Transformer推翻重构了AlphaFold 2,并逐步融入生物学专业知识。

但早期的 AlphaFold 2 性能相比 AlphaFold 1 还有所下滑,这也一度让他们害怕方向是否存在错误。于是在这个阶段他们采取一种交替模式——

一方面尝试将旧系统性能压榨到极限,一方面给予新系统的研发团队自由试错的空间:允许短期的性能下降,只求不断尝试各种新想法。

直到某一天奇迹发生,它突然变得非常之好。

那天早上,团队其中一个成员上班打开电脑,突然发现 AlphaFold 2 在某一组蛋白质上表现出奇地好,预测的结构精度达到了1.5 埃,大约相当于一个原子的宽度。

但她的第一反应不是兴奋,而是害怕,因为结果好到让她确信自己犯了错误,于是接下来几天她和团队成员一起试图找出错误原因。

结果事实上,这里没有错误——换言之,新系统成功了

于是他们参加了CASP 14 竞赛,并集中精力攻克了一个名为 ORF8 的 SARS-CoV-2 冠状病毒蛋白。

其结果让人震惊,准确性均分从原先的 60+/100,提升至 92.4/100,而此前其它方法还停留在 40 分左右。

至此,这个困扰学界 50 余年的重大挑战——蛋白质折叠问题终于得到了解决方案。

而在取得突破之后,DeepMind 更是将 AlphaFold 的代码全部开源,并向全世界免费发布了 2 亿个蛋白质的结构预测数据。

AlphaFold 的出现,标志着生物化学领域正式向 AI 智能发展,也让哈萨比斯和 John Jumper 获得了 2024 年的诺贝尔化学奖。

诺奖组委会是这样评价这份工作的:

毫不夸张地说,AlphaFold 在结构生物化学领域引发了革命,并为设计前所未见的蛋白质开辟了全新的可能性。

但在此之前,John Jumper 接受采访时曾谦逊地表示,自己的获奖概率只有10%,他更多的是期待能有越来越多科学家利用 AlphaFold 实现医学和生物学的突破。

而现在,他对自己未来的规划是:

作为年轻的诺奖得主,这让我感到担忧。接下来我将尝试做一些深入研究的小事情,而对于第二次冲击诺贝尔奖,我认为那是个陷阱。

参考链接:

[ 1 ] https://www.technologyreview.com/2025/11/24/1128322/whats-next-for-alphafold-a-conversation-with-a-google-deepmind-nobel-laureate/

[ 2 ] https://www.nature.com/articles/d41586-025-03886-9

[ 3 ] https://deepmind.google/blog/revealing-a-key-protein-behind-heart-disease

[ 4 ] https://deepmind.google/blog/breeding-healthier-and-stronger-honeybees/

[ 5 ] https://www.youtube.com/watch?v=d95J8yzvjbQ

[ 6 ] https://x.com/GoogleDeepMind/status/1993350293703016451

[ 7 ] https://mp.weixin.qq.com/s/NenjAUac6mVKrs0ji6C-og

[ 8 ] https://fortune.com/2020/11/30/deepmind-solved-protein-folding-alphafold

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

 不到 2 周,量子位 MEET2026 智能未来大会就要来了!

‍张亚勤孙茂松等 AI 行业重磅嘉宾,以及百度高通亚马逊等头部 AI 企业已确认出席,RockAI、太初元碁、自变量、小宿科技等业内新秀也将参与分享,还有更多嘉宾即将揭晓  了解详情

      12 月 10 日

    北京金茂万丽酒店

,期待与你共论 AI 行业破局之道  

点亮星标

科技前沿进展每日见

评论
大家都在看