近日,恩和科技在《bioRxiv》发布 Biology Protocol Language(BPL)及其生成管线 BPL-COGEN,首次为生物实验协议建立了一套形式化的语言体系,打通了 Physical AI 进入物理世界的标准接口。
BPL 是专为生物实验协议设计的可编译、可验证的形式化语言。BPL-COGEN 把自然语言协议自动翻译为 BPL 程序,由一个 300 亿参数微调大语言模型与确定性编译器构成 " 生成—验证—修复 " 闭环。
在基于 300 篇《Nature Protocols》论文的基准测试中,BPL-COGEN 实现 95.1% 的首轮一致性,通过 2 轮编译 - 仿真闭环将正确率推进至 98.6%。目前,相关代码已在 GitLab 完全开源(MIT License)。
AI 已会 " 思考 ",但还不会 " 动手 "
当前,AI 已经能在数字世界生成假设与设计实验。材料科学领域已经出现自主驱动的 Self-driving Lab。但在生物学领域,无论上游 AI 多么强大,其输出最终仍须被翻译为物理操作,而这一过程,至今仍依赖自然语言文本。
这是一个半导体和软件行业几十年前就已跨越的问题。半导体设计通过 Verilog 和 VHDL 完成了从自然语言向硬件描述语言的跃迁,软件工程通过类型化语言确立了可验证的稳定性。生物学一直缺少与之对应的、具备编译器验证能力的底层语言,这正是当前 AI 驱动实验设计与可复现物理执行之间的速率限制环节。
代价是清晰的。《Nature》在 2016 年针对 1,576 名研究者的调查显示,超过 70% 的人无法复现他人实验,超过一半的人无法复现自己的实验(Baker, *Nature*, 2016)。恩和团队的论文进一步将问题归纳为三个维度:
协议精确度。典型指令中常隐藏浓度、时间、体积等多处未明分支点。几十条此类指令叠加,使实验可复现性完全依赖于人员的经验补全。
协议验证。自然语言缺乏在执行前模拟物理一致性的机制,内部逻辑错误往往只能靠人工判断甚至 " 实验失败 " 才能察觉。
跨平台可迁移性。一项跨四个实验室的合成生物学研究发现,名义一致的协议在不同实验室间产生了两倍以上的转化效率差异(Beal et al., 2016, 2020),根源不在生物本身,而在执行上下文的隐性差别。
科学的累积,源于方法可被复现与忠实传递。若协议无法被无歧义表达与跨环境复用,AI 生成的实验设计就无法稳定落地。
BPL 设计 : AI 负责生成,BPL-COGEN 负责仿真与验证
BPL 用形式化规范取代自然语言的歧义。在这套类型系统下,所有隐性参数都必须显式声明;任何违反物理规律的操作(如 " 将固态粉末加入空容器后取上清液 ")将在编译阶段直接被拦截,从而避免了错误流入真实实验台。
为配合这一语言体系,团队构建了 BPL-COGEN 自动化编译器。它将一个 300 亿参数微调大语言模型与确定性编译器耦合在 " 生成—验证—修复 " 的闭环机制中:自然语言 SOP 被归一化,转换为 BPL,根据编译器诊断反复修正,直到所有物理、量纲、状态约束全部满足。LLM 负责理解科学家的意图,编译器负责验证物理世界的约束。
实验验证:多维度证实三大难题的解决
团队从三个层面对 BPL-COGEN 进行系统性验证。
大规模文本评测。在 300 篇 Nature Protocols 论文上,BPL-COGEN 实现 95.1% 的首轮一致性。经 2 轮编译 - 仿真闭环达 98.6% 的迭代正确率。
分子生物学验证。同一份 BPL 源码同时编译至手动操作与自动化设备两种执行上下文,均产生可复现的实验结果。证明了协议在执行模态上的可迁移性。
分析化学迁移验证。在不同设备上下文之间迁移后,类胡萝卜素的表征获得了可比的分析结果,验证了协议的设备无关可迁移性。
这三项验证共同确认:BPL 与 BPL-COGEN 同时解决了长期困扰行业的协议精确度、可验证性、跨平台可迁移性三大核心难题。
在 SAION 物理 AI 平台中的定位
BPL 是恩和 SAION 物理 AI 平台 " 认知—控制—执行 " 三层架构中执行层的标准接口。向下,它下发指令到生物铸造厂的自动化设备与人类操作员;向上,它回流结构化的实验执行数据,驱动认知层与控制层的持续进化。
结合此前 SAION AI 平台在文献阅读到质粒设计与湿实验组装的 100% 正确率、质粒构建 90% 成功率,BPL 的引入使物理 AI 闭环的执行层首次具备了可验证、可迁移的标准协议基础。
在 AI+ 生物制造全球图景中的意义
生物制造领域 AI 技术的核心价值,在于能否真实推动兑现数千万元乃至数亿元的经济效益。当 AI 真正驱动产业链、产品、订单的经济价值兑现时,它在产业中才获得存在的意义。BPL 的提出,是恩和把 "AI 兑现产业价值 " 落到执行层的具体动作。
据相关机构预测,至 2035 年全球生物制造市场规模将达到约 6 万亿美元。纵观工业史,所有制造业从 " 作坊 " 走向 " 工业化 " 的关键点,都伴随着形式化协议标准的建立。作为首个具备 " 编译时物理验证 + 跨平台可迁移 " 双能力的工程级方案,BPL 为这一万亿级赛道的标准化推进提供了关键基础设施。
正如研究团队在论文中所指出的:BPL-COGEN 提供了生物领域物理具身 AI 所需的关键基础。只有当 AI 能够以一种可被验证的语言 " 说清楚自己想做什么 ",自主实验室代理才在工程上成为可能。生物制造的工程边界,正被重新定义。
论文原文:Song, R., Fu, Y., Zhao, Z., Yu, J., Yuan, Q., & Chen, C. T. ( 2026 ) . Towards autonomous biology: Compiler-Verified Protocols as a Foundation for Real World AI Execution. bioRxiv, 2026-05.


登录后才可以发布评论哦
打开小程序可以发布评论哦