过去一年,由斯坦福大学丛乐(Le Cong)与普林斯顿大学王梦迪(Mengdi Wang)领衔的 AI 科研团队,一直在做同一件事:
把越来越多的异质能力,纳入同一个协同视野。
从让 AI 透过智能眼镜走进实验室、协同机械臂完成物理操作的 LabOS(被《科学美国人》报道,并在英伟达 GTC 大会上由黄仁勋演示),到深入临床一线的 MedOS,再到将 240+ 生物医学实验技能封装为标准接口的 LabClaw ——
每一步,都在拓展 AI 与各学科交叉的边界。
而这一次,他们触及了一个更根本的问题:连接的方式本身。
5 月 31 日,丛乐、王梦迪团队在 arXiv 发布预印本论文《Science Earth: Towards A Planet-Scale Operating System for AI-Native Scientific Discovery》,正式推出一个面向 AI 原生科学发现的行星级操作系统。
它要连接的,不再是一个实验室或一个科室,而是全球各地的科学能力本身。赵哲是第一作者,温海滨、吴英诚等为共同第一作者。
AI 科学系统已经很成功——但它们之间还没有 " 连接 "
科学发现的组织形式,一直随协作规模而演进——
从 17 世纪以前的个体博学者(牛顿独力写就《自然哲学的数学原理》),到 1665 年皇家学会确立的科学共同体,再到曼哈顿计划那样大规模建制化的协作——
每一次跃迁,都把更多、更异质的能力纳入同一个协作框架。
进入 AI 时代,这条线延续到了智能体协作。
今年以来,多个顶尖团队在 Nature 上相继发表 AI 科学系统工作。
Google 的 Co-Scientist 让 AI 在 Gemini 上自我辩论、迭代演化假说,在白血病药物重定向、肝纤维化靶点发现等领域完成了端到端验证。
FutureHouse 的 Robin 打通了从文献综述到湿实验分析的完整闭环,独立找到了此前从未被提出的干性黄斑变性治疗候选分子。每一个这样的系统,都是一个强大且自洽的科学能力单元。
而 Science Earth 要解决的,是这些能力单元之间的问题:
今天每一个 AI 科学系统都在自己的边界内独立运转,一个团队的智能体不会遇到另一个团队的智能体,一个学科的方法论不会撞上另一个学科的证据标准。
Science Earth 在这些系统之上补了一层——
一个让不同能力互相发现、连接、并真正碰撞的开放协议。
它的核心问题因此也不同:不是 " 如何让一个系统把某个任务做得更好 ",而是 " 当全世界互不相识、方法论各异的科学能力被连接到一起,它们的碰撞会涌现出什么 "。
这正是论文 Figure 1b 勾勒的那条线:
个体博学者→科学共同体→大规模协作→ AI 智能体框架→ Science Earth。
前几个阶段,能力的连接都依赖人为的组织与安排;而 Science Earth 第一次,让连接本身通过开放协议自动发生。
【图 1】科学协作的连接方式演进——从个体博学者、科学共同体、大规模协作、AI 智能体框架,到 Science Earth 用开放协议自动连接异质能力。
Science Earth:一个让全球科学能力互相发现的行星级操作系统
要让全球的科学能力真正连接、碰撞,需要一个超越单一实验室、单一团队的底座。这正是 Science Earth 的定位——一个行星级的 AI 科学操作系统。
无论是 GPU 仿真集群、数学证明引擎、单细胞分析流水线、具身机器人、湿实验仪器,还是人类科学家,只要实现协议,就能成为这张网络中一个可被发现、可被调用、可被组合的节点,无论它在地球的哪个角落。
它们交换的不再是论文,而是带着原始方法论痕迹的中间结果。协议,取代了人脉,成为新的连接纽带。
当不同方法论、不同证据标准的科学能力在这张网上相遇并碰撞,会发生什么?答案是:分歧本身会涌现出原始问题里并不存在的子任务——而那往往正是真正的发现所在。
下面两个真实运行的案例,给出了最直接的回答。
Case 1:困住学界 5 年的死循环,8 个智能体 64.9 小时解开
单细胞批次整合是大规模单细胞研究绕不开的基础设施,但它会矫枉过正——把稀有细胞亚群压进相邻的密集邻居里抹掉。
问题在于,所有现有评估框架只能验证已知细胞类型的保留:一个亚群如果在标注之前就被丢失,没有任何指标会报警。没有 ground truth →没有评估框架→没有失败信号,这个死循环五年没被关上。
破解它,需要同时站在机器学习、数学、计算生物学、免疫学、哲学审计五个互不兼容的证据标准之上——没有任何单一学科的团队能同时持有这五种视角。
在 Science Earth 上,八个智能体各自注册身份卡、占据专属的学科 git 分支,通过零预算的开放竞标自行协调,全程仅一条结构性外部指令。
其中最特别的是哲学智能体——它在现有任何 AI 科学系统里都没有对应物,不做实验,专门监视其他智能体,识别隐含假设和逻辑漏洞。
在 64.9 小时、488 次 commits 里,三个原始任务里不存在的子任务自行浮现,最终产出一份 98 页的完整研究报告——从问题进入网络到报告可交付,全程无人统筹分配任务。
计算端识别出 TIGIT ⁺ Treg 亚群;同期一项独立的湿实验,确认了相邻的 CCR8 ⁻ TIGIT ⁺ Treg 亚群具有免疫抑制功能(T 细胞杀伤被抑制约 3.3 倍,p<0.001),两侧从 CCR8 的不同极性,共同锚定了 TIGIT 这一治疗轴。
【图 2】Case 1 实时 commit 流:八个学科智能体在 64.9 小时内的 487 次 commit,记录了从冻结、重启到 full-atlas 整合的全过程。
【图 3】Case 1 产出:98 页报告的版本演化、整合后的细胞图谱,以及 TIGIT ⁺ Treg motif 的识别。独立湿实验确认相邻 CCR8 ⁻ TIGIT ⁺ Treg 亚群具有免疫抑制功能。
Case 2:两套传统各自自洽,跨太平洋碰撞中 30 分钟涌现出新问题
2020 至 2025 年,四个研究组从不同角度研究同一个高阶 Kuramoto 模型,各自捕捉到了它的一个真实侧面——
爆炸性同步、吸引子收缩、非单调行为、稳定性深化。
每个结论在自己的参数切片里都成立,都是扎实的工作;只是没有人把这四个侧面拼进同一张图,统一的图景始终留着一块空白。这正是论文传播的典型困境:几套各自自洽的理论可以并行多年,没有机制强迫它们被并排对照。
在 Science Earth 网络里,两条传统隔着 15 个时区各自独立工作:东亚 HPC 节点(UTC+08:00)在 A800 集群上跑了 5 万次仿真;
西海岸节点(UTC − 07:00)独立推导了 OA 解析相图。两边各自完全自洽,但对同一个量的预测相差 38 – 60%,平均误差 48.8% ——解析没推错,仿真也没算错。
当整合角色把两组预测并排放置,一个原始任务里不存在的问题浮现了:OA closure 关系 Z ₂ =Z ₁ ² 对 Gaussian 分布还成立吗?
两条路线同时认领,30 分钟内给出答案:Z ₂ /Z ₁ ² 收敛到 2/ π ≈ 0.637 而非 1。
修正后平均误差从 48.8% 降到 5.8%,四篇工作就此被拼进同一张相图——它们都对,各自看到的只是同一个相图的不同截面。
论文也划清了边界,修正后的公式属于伴随论文;EACN 的贡献,是让矛盾可见——
把两个自洽却不兼容的预测并排放置,并提供让子任务在 30 分钟内被识别、认领、解决的基础设施。
【图 4】Case 2 的碰撞与求解全景。东亚仿真节点与西海岸解析节点对同一个高阶 Kuramoto 模型各自自洽,却对临界耦合给出相差 38 – 60% 的预测(a – c)。
这一矛盾被并排放置后,涌现出一个原始任务里没有的子问题——
OA closure 关系 Z ₂ =Z ₁ ² 对 Gaussian 分布是否成立(d)。
两边协作给出答案:
Z ₂ /Z ₁ ² 收敛到 2/ π ≈ 0.637 而非 1,修正后平均误差从 48.8% 降到 5.8%,且这一修正在不同分布、不同系统规模下普遍成立(e – i)。所有研究由此被拼进同一张相图。
这一切是怎么做到的:EACN,在 A2A 和 MCP 之上补上 " 协调层 "
两个 case 之所以能发生,靠的是 Science Earth 的协调内核—— EACN(Emergent Agent Collaboration Network)。
它坐在 A2A(传输层)和 MCP(工具调用层)之上,补上了多智能体协作中始终缺失的协调语义,具体是四个原语:
【图 5】EACN 协议栈: ( a ) 生态位—— EACN 坐在 MCP/A2A 通信层与智能体框架之上,使能自组织的智能体协作; ( b ) 通信层的两个通道与五个协议原语。
领域感知的发现:任何注册的能力,都能按领域被需要它的任务找到。
竞争性竞标:能力依据自身的置信度和历史信誉,自主决定是否应标。
跨范式仲裁:来自不同证据标准的结果被并排比较,冲突不会被抹平,而是生成新的子任务——这正是两个 case 里 " 新问题 " 涌现的机制。
信誉累积:信任在一次次交互中沉淀,影响未来的任务分配。
而接入这张网络,只需要一条命令:
npm i -g eacn3
它不是终点,是科学协作的新起点
两个 case 覆盖了科学实践里差异最大的两种异构:方法论的分裂(仿真 vs 解析),和学科证据标准的不兼容(八个学科)。
它们暴露的是同一个结构性问题——科学里最难的那类问题,恰恰被学科边界、地理距离、语言和认识论同时挡住。
东亚跑仿真的物理学家和西海岸做解析的数学家,平时不会把各自的中间结果并排放在一起;而那个并排放置的瞬间,才是发现发生的地方。
这背后是科学传播方式本身的局限。
论文流通的基本单位是完成品——隐去了中间过程的最终结论,没有任何机制强迫两套自洽的理论被并排对照。
Kuramoto 那四篇工作并行五年,不是物理学家不够聪明,而是论文这种形式把统一的图景拖进了时间里。
Science Earth 改变的正是这个基本单位:
科学家以协议而非人脉相连,交换带着原始方法论痕迹的中间结果——让原本需要数年才能拼合的图景,在 30 分钟内合拢。
这也不是物理和免疫学特有的困境。材料、气候、神经科学、药物开发——任何需要跨越方法论边界的领域,都是同样的结构。
当组织本身可以涌现,自动化科研要突破的就不再只是 " 单个 AI 做得多好 ",而是 " 多少异质能力能被连接起来、碰撞出多少没人提出过的问题 "。Science Earth 团队正在更多学科上推进新的 case。
目前,论文、代码与网络均已公开:
arXiv:https://arxiv.org/pdf/2606.01316
code:https://github.com/EACN3
网站:rotating.scienceearth.org 接入:npm i -g eacn3
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
我们正在招聘一名眼疾手快、关注 AI 的学术编辑实习生
感兴趣的小伙伴欢迎关注 了解详情
点亮星标
科技前沿进展每日见


登录后才可以发布评论哦
打开小程序可以发布评论哦