作者|吴思梦
编辑|岑峰
2026 年 6 月 3 日,计算机视觉与模式识别顶级会议(CVPR)在美国丹佛举行。在大会特邀演讲环节,前 DeepMind 蛋白质设计团队核心成员、2024 年诺贝尔化学奖获奖项目 AlphaFold 核心研究员,Latent Labs 创始人兼 CEO Simon Kohl 发表了题为 "Programmable Biology:Generative AI for Molecular Design" 的精彩演讲。
围绕当今药物发现领域最核心的痛点:一种新药从研发到上市平均耗时超过 10 年、花费超 20 亿美元,但九成候选药物最终失败。
而 Simon Kohl 认为,这一切的根源在于 " 我们从错误的分子出发 "。为此,他提出了一条从 " 结构预测 " 到 " 条件生成 " 再到 " 自主智能体 " 的技术跃迁路线。
演讲以 AlphaFold 2 为起点,回顾了蛋白质结构预测突破如何催生生成式药物设计;随后展示了 Latent Labs 的两代基础模型—— Latent — X1(通用蛋白结合物设计)与 Latent — X2(零样本抗体设计)——如何在湿实验室中实现媲美甚至超越传统万亿级筛选的命中率和亲和力;最终发布了全球首个实验室验证的抗体设计智能体 Latent — Y,仅需一条自然语言提示,即可自主完成从靶点分析到分子设计的全流程。
总结而言,从 AlphaFold 2 解决 " 序列到结构 " 的预测问题,到生成式 AI 实现 " 靶点到药物 " 的条件设计,再到智能体接管 " 端到端 " 的自主设计闭环——计算药物设计正以指数级速度演进,Simon Kohl 断言:生物学终将成为可编程的工程学科。
以下是 Simon Kohl 在 CVPR 2026 大会上发表的演讲精编稿,雷峰网 ( 公众号:雷峰网 ) · AI 科技评论基于原英文演讲内容进行了不改原意的翻译编辑:
《Programmable Biology : Generative AI for Molecular Design》
主讲人:Simon Kohl,Latent Labs 创始人兼 CEO
药物发现的困境:10 年、20 亿、九成失败
在进入正题之前,我想让大家先对 " 药物如何起效 " 建立共识。药物的作用机制,一言以蔽之,就是结合,并且通常是阻断。
比如司美格鲁肽(Semaglutide),它是一个合成肽类药物,通过结合并激活 GLP-1 受体来治疗二型糖尿病和肥胖症;再比如 Caplacizumab,这是一种源自羊驼的纳米抗体,通过阻断血小板间相互作用来治疗凝血障碍;还有曲妥珠单抗(Trastuzumab),一种人源化抗体片段,通过阻断 HER2 受体来治疗乳腺癌和胃癌。它们的共同点都是:结合并阻断靶点。
那么,今天的药物是如何被发现的呢?典型流程通常超过 10 年。
首先,你得找到一个初始筛选材料(Starting Material)——而在今天,行业内主要有三种主流方式。
第一种是体内免疫法(In vivo immunization)。大型药企真的在经营着庞大的羊驼和鲨鱼农场,试图从这些动物的免疫反应中筛选出抗体。但问题是,羊驼并不是人类;这些分子充其量只能算是一个起点——它们不仅不可控,而且不够精准。
第二种是超大规模库筛选(Massive library screening)。这种方法说白了,就是把成百上千亿的化合物 " 像扔意大利面一样往墙上砸,看哪个能粘住 "。这种方式虽然不需要动物,但筛选出来的分子通常亲和力很弱,而且成本极高、极其耗时。
第三种是 B 细胞挖掘(B-cell mining),也就是直接从疾病幸存者的血液中提取天然成熟的抗体。虽然这些是人类自带的抗体、亲和力极强,但这种方法高度依赖供体,根本无法实现规模化扩展,同时还面临着错综复杂的伦理和准入门槛。
获得起点后,还要在动物模型中证明安全性(约 3 年),再经过临床 I 期(安全性)、II 期(剂量)、III 期(大规模验证),最终能获得 FDA 批准的药物,十中无一。这就是当前药物发现的漏斗——超慢、超贵(20 亿美元 +)、90% 失败。
而我认为,这一切的根源在于我们从错误的分子出发。这正是我们在 Latent Labs 想要改变的——从头设计药物,让它们有更高的概率通过临床试验,更便宜、更快。
想象一个世界:针对任何疾病靶点,我们只需将靶点输入生成式模型,模型就能即时产出可用的药物分子。这需要高特异性结合、可制造性、低多反应性等一系列属性。这就是我们的愿景。
计算药物设计的五年加速:从 AlphaFold 2 到智能体
回顾计算药物设计领域过去五年的进展,我认为我们取得了巨大的进步,在某种程度上堪比大语言模型的能力跃升。
2020 年,AlphaFold 2 横空出世,解决了蛋白质结构预测问题——这是整个领域的 " 种子突破 "。
此后几年,RFdiffusion 和 ProteinMPNN 等首批蛋白质设计生成模型问世,目标是生成自然界不存在的、在实验室中能工作的蛋白质。2024 年,AlphaFold 3 发布,新增了蛋白质相互作用建模能力,这恰恰是药物设计所需的核心能力。随后,DeepMind 发布了 AlphaProteo(蛋白质结合物设计),Latent Labs 推出了 Latent — X1。
而在过去 12 个月中,抗体设计领域迎来了一系列突破——抗体设计被称为这一领域的 " 圣杯 ",比一般结合物设计难得多,且直接面向制药行业最核心的药物类别。Latent Labs 的 Latent — X2、Chai Discovery 的 Chai-2、Nabla Bio 的 JAM 等模型相继问世。最近,Latent Labs 发布了全球首个实验室验证的抗体设计智能体 Latent — Y。
我要强调的是:仅仅五六年间,我们就从 " 一切都在实验室做 " 跃迁到了 " 智能体在跑抗体设计 " ——这是指数级的加速。
蛋白质:比图像更脆弱的分子机器
在深入模型之前,让我先给一个蛋白质的入门介绍。蛋白质是生命必需的分子机器,由氨基酸链折叠成三维结构。从计算机科学的角度看,蛋白质是一条由 20 个字母(氨基酸)组成的字符串,每个字母对应特定的原子集合和生物化学性质。
关键在于:结构决定功能。而且蛋白质有一个非常特殊的性质——即使只有一个氨基酸突变,蛋白质也可能完全丧失功能。对 CVPR 的听众来说,一个精准的类比是:就像一个像素的错误就能毁掉一张图片——当然,人类视觉是鲁棒的,改变一个像素图片依然连贯,但蛋白质不是这样。
我以鸡蛋清蛋白为例:如果将其核心位置的赖氨酸突变为丙氨酸——仅仅是 " 一个字母的切换 " ——整个蛋白就会解体,失去结构和功能,变成无序蛋白。这种突变也是癌症的常见诱因。所以你完全不能弄错哪怕一个氨基酸。
这就引出了蛋白质折叠问题:1972 年,Anfinsen 在诺贝尔化学奖获奖演讲中提出了 " 热力学假说 " ——序列完全决定结构。此后,人们一直在试图计算解决这个问题。AlphaFold 2 正是这个 50 年难题的解答。
AlphaFold 2 在 CASP14 盲测中展现出了惊人的准确度,其在所有靶标上的 GDT_TS 中位数达到了 92.4,C α 原子的 RMSD 中位数仅为 0.96 Å。相比之下,第二名的方法中位数误差高达 2.8 Å,差距极其悬殊。
学术界普遍认定它解决了单链蛋白质结构预测问题,其预测精度已与实验结果不相上下。这一突破也直接推动了 2024 年诺贝尔化学奖授予 Hassabis、Jumper 和 Baker。
AlphaFold 2 的架构精髓:从进化信号到三维结构
AlphaFold 2 有三个核心输入:多序列比对(MSA)、配对表征和结构模板。其中 MSA 最为关键,进化过程中共同突变的残基往往在三维空间中接触,由此可从进化信号推断空间关系。配对表征则提供了一个 " 草稿板 ",让模型显式建模残基对之间的交互——消融实验证明这是极其关键的。结构模板则不那么重要,模型在无模板时表现几乎同样好。
从这些输入出发,模型构建两条表征轨道:MSA 表征栈和配对表征栈,通过我们称之为 EvoFormer 的创新架构让两者交互。EvoFormer 基于注意力机制,但融入了大量领域知识的归纳偏置。比如我们嵌入了尊重三角不等式的三角更新,在配对表征的交互中注入几何先验。最后,通过另一个网络将表征映射到三维空间。在 AlphaFold 2 中,这是用旋转和平移来参数化的,进一步注入了几何归纳偏置(尽管后来的 AlphaFold 3 发现这一步并非必需)。
AlphaFold 2 的成功还得益于其他创新机制,比如将模型末端的表征重新反馈回起点的迭代循环机制(Recycling),以及对下游应用至关重要的置信度预测(包括逐残基的 pLDDT 和残基对的 PAE 指标)。整个架构集成了大约 10 到 15 个核心创意,其中每一个都足以单独支撑一篇优秀的论文。
AlphaFold 2 的突破还带来了一个更深远的影响。正如计算机视觉领域中 ImageNet 催生了 AlexNet,进而演进出 Inception Score 和 FID 来加速生成模型迭代一样,在结构生物学中,PDB 数据集、CASP 评估以及作为 " 预测器(Oracle)" 的 AlphaFold 2,共同构建起了 " 数据集 → 评估 → 预测器 → 生成器 " 的产业飞轮。
这些预测器不仅让我们能在算法上快速迭代,更能帮助我们从海量设计中进行筛选和排序,准确挑出最值得进入湿实验室验证的候选分子。
从预测到创造:Latent — X1 与条件生成范式
AlphaFold 2 是 " 看 " 蛋白质的结构,但我们要 " 造 " 蛋白质。药物设计可以表述为一个条件生成任务:给定靶点的序列和结构,生成一个与之高特异性结合的分子。这种结合必须精确到原子层面,无论是氢键还是疏水相互作用都必须恰到好处。
在 Latent Labs,我们将靶点表示为原子坐标点云,并以此为条件,利用去噪扩散模型从高斯噪声中开始生成结合物,这便是 Latent — X1 的工作原理。在去噪轨迹中,你可以清晰地观察到模型如何从一团混沌中逐步 " 雕刻 " 出精确的结合物结构。
我们完整的 " 设计 - 验证 " 流程如下:
给定靶点→指定结合位点(残基级精确)→用 Latent — X1 生成结合物→用 AlphaFold 2/3 类模型交叉验证。
其中,在交叉验证环节,我们会重点观察预测结构与设计是否一致,并评估其置信度。
湿实验室验证环节至关重要。在 Latent Labs 位于旧金山的实验室中,我们在人类细胞系(如肾细胞)上表达设计出的分子,并用绿色荧光进行标记,同时移入带有橙色染料的靶点。一旦橙色信号被成功固定在细胞上,即宣告结合成功。鉴于单个氨基酸的偏差就可能让所有心血付诸东流,湿实验验证是把好最后一关的铁律。
作为一款基础模型,Latent — X1 并未针对特定的生物药模态进行刻意优化,这反而赋予了它在多场景下的优异表现。在纳米抗体(Nanobody)设计中,它成功命中了所有靶标,亲和力达到了纳摩尔甚至皮摩尔级别;在迷你结合蛋白(Mini-binder,包含 80-120 个氨基酸)的设计上,它同样全数命中基准靶标,亲和力挺进皮摩尔级,这已极其接近 " 药物级 " 的结合力。发布时的对比数据也证实,Latent — X1 在亲和力和命中率上均明显超越了同期的其他模型。
Latent — X2:零样本设计药物级抗体
2024 年 12 月,我们发布了 Latent — X2。其核心突破在于零样本设计药物级抗体。抗体是当今获批药物中最大的生物药类别,且仍在扩张。我们证实,Latent — X2 可以从头针对从未见过的靶点设计抗体,并且在纳米抗体、单域抗体等多种抗体格式上均能保持高亲和力。
在药物相似性(Drug-likeness)方面,Latent — X2 同样令人振奋。好的药物分子需要热稳定性高(熔点高)、单体性好(不自聚集,便于高密度储存和运输)、产量高(制造成本低)、多反应性低(无脱靶效应)、疏水性低(不易聚集)。传统上,这些属性的优化是一个 " 打地鼠 " 游戏:当你按下其中一个指标时,另一个指标就会随之恶化。
然而,由 Latent — X2 设计的分子中,有 47% 的候选物无需经历任何迭代优化,就能同时跨过所有关键指标的阈值,其整体水准已非常接近市面上现有的治疗性抗体。
更令人震撼的是环肽设计的对比实验。我们在 PHD2 和 KRAS 两个靶点上,将 Latent — X2 仅 10 个设计与万亿级随机筛选库的结果对比:在 PHD2 上,10 个设计的结合力比万亿级筛选的最优结果强两个数量级。
而在历史上被公认为 " 不可成药 " 的 KRAS 靶标上,这 10 个设计同样拿到了与万亿级筛选分庭抗礼的结合物。在效率上,AI 计算仅耗时 1 天,后续实验室验证花费 4 周;而传统筛选则需要耗费 3 到 6 个月的时间,并吞噬大量的人力和试剂成本。
我们还在与外部合作伙伴进行离子通道抑制项目。离子通道是介导神经元离子流的膜蛋白孔道,对镇痛药物具有重要意义,一直被认为是极具挑战性的靶标。如今,Latent — X2 设计的环肽已成功阻断了人类 NAV1.7 钠离子通道,成为了 " 用 AI 计算精度替代传统蛮力筛选 " 的经典范例。
Latent — Y:全球首个实验室验证的抗体设计智能体
在 Latent X 系列模型的基础上,我们更进了一步,创建了智能体系统 Latent — Y,这是全球首个实验室验证的抗体设计智能体,也是药物设计团队的 " 力量倍增器 "。
在此我为大家演示它的具体工作流。我们在提示框中输入一句简单的指令:" 生成阻断人 IL-6 的纳米抗体。" 接下来,智能体便开始独立接管后续流程:
整个过程中,智能体可以并行执行多个步骤,真正实现了研发效能的成倍放大。
实验室验证结果令人信服。仅凭类似 " 用纳米抗体阻断 PRLR 受体相互作用 " 的提示,无需任何迭代,就在实验室中获得了非常紧密的结合。
我们还对其进行了更有挑战性的压力测试:直接将一篇发表在 《Science》 或 《Nature》 上的论文 PDF 喂给智能体,让它自主识别文中描述的生物学功能并设计对应的纳米抗体。在针对 20 篇论文的测试中,面对人 Transferrin 受体 1(一种血脑屏障靶标)的设计任务,智能体产出的 40 个候选物中有 11 个在实验室中成功实现了结合。
开放问题与未来展望
不可否认,该领域目前依然存在诸多有待攻克的开放性问题。
首当其冲是蛋白质动力学。目前我们的模型本质上是静态建模,但蛋白质在自然界中是动态的柔性物体,这对酶催化等功能至关重要。分子动力学(MD)领域长期存在,但传统力场泛化性差,机器学习力场正在带来希望。问题一方面是力场精度,另一方面是计算量。也许 Jensen 和 NVIDIA 会帮我们解决这个问题。
第二是无法可靠预测人体药物响应。目前还不清楚需要什么才能解决这个问题,至少需要收集更多数据。第三是系统性毒性预测,同样是数据瓶颈:人体交互网络如此庞大,目前远未被充分理解,纯理论推导不可能,必须先收集足够的机器学习就绪数据。
展望未来 5 到 10 年,我相信以下趋势将自然发生:
最终,当所有这些技术进步汇聚在一起时,人类将拥有攻克所有疾病的武器。这听起来是一个极其乐观的论断,但我坚信这只是时间问题,而不是 " 能否实现 " 的问题。
我们正站在历史的拐点上:生物学终将成为一门可编程的工程学科。
Q&A 问答环节
听众 A: 既然输入是需要结合的靶点,那靶点本身的发现呢?这会不会成为新的瓶颈?
Simon Kohl:非常好的问题。靶点识别(Target ID)本身几乎就是一个独立的研究领域。老实说,我们并不缺靶点。但确实很多疾病会从更好的靶点中受益。我认为像我们这样的模型也能在这方面提供帮助——比如我之前提到的 " 研究试剂 " 方向,就是帮助更好地理解靶点生物学,确定疾病通路中该阻断哪些交互。这虽然是我今天描述内容的下游,但同样令人兴奋。
听众 B: 在湿实验室工作中,你们是否在构建细胞成像数据集,试图跳过某些层级直接基于靶点建模细胞结构?
Simon Kohl:这非常有趣。目前这个领域整体是数据瓶颈——我们从 PDB 等数据集中已经 " 榨干 " 了很多。我认为当前到临床的差距,恰恰需要更多类似你描述的数据集。问题是如何以高度可扩展的方式做到这一点,产出对机器学习友好的标准化的数据。这个领域并不缺数据,但数据是异构的、分散的、太小的、未同质化的。这类努力我们非常期待看到进展。
听众 C: Latent — Y 智能体目前停在湿实验环节,你们是否在推进自动化验证闭环?
Simon Kohl:是的,这正是一个自改进的思路。目前已有实验服务商提供 API 接口到他们的实验室,将这个 API 给智能体,我认为非常令人兴奋。当然有很多复杂性——没有一个实验室能覆盖所有空间,实验室也不像理想中那样模块化。但对更常见的工作流,这是非常可行的,我们已经在探索。
听众 D: 你展示了迷你结合蛋白和肽段的设计。你认为这些更简单的分子能否替代抗体药物?
Simon Kohl:我认为有可能。抗体通常需要静脉注射——它们无法通过我们的消化道生化环境,会被切碎。这就是为什么小分子仍有吸引力——可以口服进入血流。环肽因此特别值得关注。一旦我们能建模人体药物响应,我认为没有理由不能设计出非免疫原性、无毒性的迷你结合蛋白或肽段。但目前,人类蛋白支架提供了更好的起点,这是抗体如此流行的根本原因。
听众 E: 生成式 AI 能否帮助预测体外毒性?
Simon Kohl:这还是一个数据问题。人体交互网络太庞大了,远未被充分理解,纯理论推导今天不可能。如果我们有足够的数据来构建预测器,那就可以。某种程度上这是 " 无聊的回答 ",但确实需要先更多地探测系统,然后才能构建可泛化的预测器。
听众 F: 蛋白质动力学是一个开放挑战,你初步的想法是什么?
Simon Kohl:分子动力学(MD)是长期存在的领域,但经典力场泛化性差。人们现在在构建机器学习力场来改善这一点,已经展现出很大前景——部分原因正是经典力场的脆弱性。但问题有两方面:一是力场精度,二是计算量。目前要在足够的时间尺度或原子尺度上建模几乎不可能,但这并不意味着不会被解决——只是今天仍然困难。
听众 G: 从硅到湿实验室的过渡中,你们如何从数百万设计中选择最好的?
Simon Kohl:两方面。首先,生成模型本身必须足够好——如果未过滤的成功率太低,任何筛选器都救不了。其次,我们使用结构预测模型进行交叉验证——将设计折叠后看结构是否与设计一致,结合置信度指标和特定阈值。这使得我们在实验室中每个靶标最多只需测试不到 100 个设计。这只有当生成器和评分器都很强时才可能。
听众 H: 该领域的数据稀缺是否意味着需要长期依赖专业化架构?还是说会达到一个拐点,通用数据可以让基础模型绕过专业化设计?
Simon Kohl:领域内确实在向更大数据集和合成数据方向推进。也许不太为人所知的是,即使在 AlphaFold 2 中,合成数据(即自蒸馏自预测数据)与实验室数据的比例也是 3:1 ——我们用了更多的自我预测蒸馏数据来调优模型。关于专业化架构,确实在消减——即使在我们的工作中,今天使用的归纳偏置也少得多。随着数据增加,等变性等约束可以被更通用的系统替代。
听众 I: 对于分布外采样问题,你认为应该如何应对?是否存在根本性限制?
Simon Kohl:老实说,这没有我最初担心的那么严重。目前一些模型已经在相当分布外的情况下工作得不错——比如有些模型会产生自然界中不存在的、表面高度带电的蛋白质,但它们竟然表达得还不错。当然它们的药物设计属性可能不好。我认为有帮助的是:生成模型提供了一个很好的先验,而评分器进一步裁剪尾部。这是我的直觉——分布外不是巨大的问题。
>> 点击关注 CVPR 专题专区,获取年度综述、深度论文解读与行业趋势全盘点 <<
雷峰网原创文章,未经授权禁止转载。详情见转载须知。


登录后才可以发布评论哦
打开小程序可以发布评论哦