王梦迪、丛乐团队Science Earth：当组织本身开始涌现，全球科学能力第一次在同一张网上互相发现

过去一年，由斯坦福大学丛乐（Le Cong）与普林斯顿大学王梦迪（Mengdi Wang）领衔的 AI 科研团队，一直在做同一件事：

把越来越多的异质能力，纳入同一个协同视野。

从让 AI 透过智能眼镜走进实验室、协同机械臂完成物理操作的 LabOS（被《科学美国人》报道，并在英伟达 GTC 大会上由黄仁勋演示），到深入临床一线的 MedOS，再到将 240+ 生物医学实验技能封装为标准接口的 LabClaw ——

每一步，都在拓展 AI 与各学科交叉的边界。

而这一次，他们触及了一个更根本的问题：连接的方式本身。

5 月 31 日，丛乐、王梦迪团队在 arXiv 发布预印本论文《Science Earth: Towards A Planet-Scale Operating System for AI-Native Scientific Discovery》，正式推出一个面向 AI 原生科学发现的行星级操作系统。

它要连接的，不再是一个实验室或一个科室，而是全球各地的科学能力本身。赵哲是第一作者，温海滨、吴英诚等为共同第一作者。

AI 科学系统已经很成功——但它们之间还没有 " 连接 "

科学发现的组织形式，一直随协作规模而演进——

从 17 世纪以前的个体博学者（牛顿独力写就《自然哲学的数学原理》），到 1665 年皇家学会确立的科学共同体，再到曼哈顿计划那样大规模建制化的协作——

每一次跃迁，都把更多、更异质的能力纳入同一个协作框架。

进入 AI 时代，这条线延续到了智能体协作。

今年以来，多个顶尖团队在 Nature 上相继发表 AI 科学系统工作。

Google 的 Co-Scientist 让 AI 在 Gemini 上自我辩论、迭代演化假说，在白血病药物重定向、肝纤维化靶点发现等领域完成了端到端验证。

FutureHouse 的 Robin 打通了从文献综述到湿实验分析的完整闭环，独立找到了此前从未被提出的干性黄斑变性治疗候选分子。每一个这样的系统，都是一个强大且自洽的科学能力单元。

而 Science Earth 要解决的，是这些能力单元之间的问题：

今天每一个 AI 科学系统都在自己的边界内独立运转，一个团队的智能体不会遇到另一个团队的智能体，一个学科的方法论不会撞上另一个学科的证据标准。

Science Earth 在这些系统之上补了一层——

一个让不同能力互相发现、连接、并真正碰撞的开放协议。

它的核心问题因此也不同：不是 " 如何让一个系统把某个任务做得更好 "，而是 " 当全世界互不相识、方法论各异的科学能力被连接到一起，它们的碰撞会涌现出什么 "。

这正是论文 Figure 1b 勾勒的那条线：

个体博学者→科学共同体→大规模协作→ AI 智能体框架→ Science Earth。

前几个阶段，能力的连接都依赖人为的组织与安排；而 Science Earth 第一次，让连接本身通过开放协议自动发生。

【图 1】科学协作的连接方式演进——从个体博学者、科学共同体、大规模协作、AI 智能体框架，到 Science Earth 用开放协议自动连接异质能力。

Science Earth：一个让全球科学能力互相发现的行星级操作系统

要让全球的科学能力真正连接、碰撞，需要一个超越单一实验室、单一团队的底座。这正是 Science Earth 的定位——一个行星级的 AI 科学操作系统。

无论是 GPU 仿真集群、数学证明引擎、单细胞分析流水线、具身机器人、湿实验仪器，还是人类科学家，只要实现协议，就能成为这张网络中一个可被发现、可被调用、可被组合的节点，无论它在地球的哪个角落。

它们交换的不再是论文，而是带着原始方法论痕迹的中间结果。协议，取代了人脉，成为新的连接纽带。

当不同方法论、不同证据标准的科学能力在这张网上相遇并碰撞，会发生什么？答案是：分歧本身会涌现出原始问题里并不存在的子任务——而那往往正是真正的发现所在。

下面两个真实运行的案例，给出了最直接的回答。

Case 1：困住学界 5 年的死循环，8 个智能体 64.9 小时解开

单细胞批次整合是大规模单细胞研究绕不开的基础设施，但它会矫枉过正——把稀有细胞亚群压进相邻的密集邻居里抹掉。

问题在于，所有现有评估框架只能验证已知细胞类型的保留：一个亚群如果在标注之前就被丢失，没有任何指标会报警。没有 ground truth →没有评估框架→没有失败信号，这个死循环五年没被关上。

破解它，需要同时站在机器学习、数学、计算生物学、免疫学、哲学审计五个互不兼容的证据标准之上——没有任何单一学科的团队能同时持有这五种视角。

在 Science Earth 上，八个智能体各自注册身份卡、占据专属的学科 git 分支，通过零预算的开放竞标自行协调，全程仅一条结构性外部指令。

其中最特别的是哲学智能体——它在现有任何 AI 科学系统里都没有对应物，不做实验，专门监视其他智能体，识别隐含假设和逻辑漏洞。

在 64.9 小时、488 次 commits 里，三个原始任务里不存在的子任务自行浮现，最终产出一份 98 页的完整研究报告——从问题进入网络到报告可交付，全程无人统筹分配任务。

计算端识别出 TIGIT ⁺ Treg 亚群；同期一项独立的湿实验，确认了相邻的 CCR8 ⁻ TIGIT ⁺ Treg 亚群具有免疫抑制功能（T 细胞杀伤被抑制约 3.3 倍，p<0.001），两侧从 CCR8 的不同极性，共同锚定了 TIGIT 这一治疗轴。

【图 2】Case 1 实时 commit 流：八个学科智能体在 64.9 小时内的 487 次 commit，记录了从冻结、重启到 full-atlas 整合的全过程。

【图 3】Case 1 产出：98 页报告的版本演化、整合后的细胞图谱，以及 TIGIT ⁺ Treg motif 的识别。独立湿实验确认相邻 CCR8 ⁻ TIGIT ⁺ Treg 亚群具有免疫抑制功能。

Case 2：两套传统各自自洽，跨太平洋碰撞中 30 分钟涌现出新问题

2020 至 2025 年，四个研究组从不同角度研究同一个高阶 Kuramoto 模型，各自捕捉到了它的一个真实侧面——

爆炸性同步、吸引子收缩、非单调行为、稳定性深化。

每个结论在自己的参数切片里都成立，都是扎实的工作；只是没有人把这四个侧面拼进同一张图，统一的图景始终留着一块空白。这正是论文传播的典型困境：几套各自自洽的理论可以并行多年，没有机制强迫它们被并排对照。

在 Science Earth 网络里，两条传统隔着 15 个时区各自独立工作：东亚 HPC 节点（UTC+08:00）在 A800 集群上跑了 5 万次仿真；

西海岸节点（UTC − 07:00）独立推导了 OA 解析相图。两边各自完全自洽，但对同一个量的预测相差 38 – 60%，平均误差 48.8% ——解析没推错，仿真也没算错。

当整合角色把两组预测并排放置，一个原始任务里不存在的问题浮现了：OA closure 关系 Z ₂ =Z ₁ ² 对 Gaussian 分布还成立吗？

两条路线同时认领，30 分钟内给出答案：Z ₂ /Z ₁ ² 收敛到 2/ π ≈ 0.637 而非 1。

修正后平均误差从 48.8% 降到 5.8%，四篇工作就此被拼进同一张相图——它们都对，各自看到的只是同一个相图的不同截面。

论文也划清了边界，修正后的公式属于伴随论文；EACN 的贡献，是让矛盾可见——

把两个自洽却不兼容的预测并排放置，并提供让子任务在 30 分钟内被识别、认领、解决的基础设施。

【图 4】Case 2 的碰撞与求解全景。东亚仿真节点与西海岸解析节点对同一个高阶 Kuramoto 模型各自自洽，却对临界耦合给出相差 38 – 60% 的预测（a – c）。

这一矛盾被并排放置后，涌现出一个原始任务里没有的子问题——

OA closure 关系 Z ₂ =Z ₁ ² 对 Gaussian 分布是否成立（d）。

两边协作给出答案：

Z ₂ /Z ₁ ² 收敛到 2/ π ≈ 0.637 而非 1，修正后平均误差从 48.8% 降到 5.8%，且这一修正在不同分布、不同系统规模下普遍成立（e – i）。所有研究由此被拼进同一张相图。

这一切是怎么做到的：EACN，在 A2A 和 MCP 之上补上 " 协调层 "

两个 case 之所以能发生，靠的是 Science Earth 的协调内核—— EACN（Emergent Agent Collaboration Network）。

它坐在 A2A（传输层）和 MCP（工具调用层）之上，补上了多智能体协作中始终缺失的协调语义，具体是四个原语：

【图 5】EACN 协议栈： ( a ) 生态位—— EACN 坐在 MCP/A2A 通信层与智能体框架之上，使能自组织的智能体协作； ( b ) 通信层的两个通道与五个协议原语。

领域感知的发现：任何注册的能力，都能按领域被需要它的任务找到。

竞争性竞标：能力依据自身的置信度和历史信誉，自主决定是否应标。

跨范式仲裁：来自不同证据标准的结果被并排比较，冲突不会被抹平，而是生成新的子任务——这正是两个 case 里 " 新问题 " 涌现的机制。

信誉累积：信任在一次次交互中沉淀，影响未来的任务分配。

而接入这张网络，只需要一条命令：

npm i -g eacn3

它不是终点，是科学协作的新起点

两个 case 覆盖了科学实践里差异最大的两种异构：方法论的分裂（仿真 vs 解析），和学科证据标准的不兼容（八个学科）。

它们暴露的是同一个结构性问题——科学里最难的那类问题，恰恰被学科边界、地理距离、语言和认识论同时挡住。

东亚跑仿真的物理学家和西海岸做解析的数学家，平时不会把各自的中间结果并排放在一起；而那个并排放置的瞬间，才是发现发生的地方。

这背后是科学传播方式本身的局限。

论文流通的基本单位是完成品——隐去了中间过程的最终结论，没有任何机制强迫两套自洽的理论被并排对照。

Kuramoto 那四篇工作并行五年，不是物理学家不够聪明，而是论文这种形式把统一的图景拖进了时间里。

Science Earth 改变的正是这个基本单位：

科学家以协议而非人脉相连，交换带着原始方法论痕迹的中间结果——让原本需要数年才能拼合的图景，在 30 分钟内合拢。

这也不是物理和免疫学特有的困境。材料、气候、神经科学、药物开发——任何需要跨越方法论边界的领域，都是同样的结构。

当组织本身可以涌现，自动化科研要突破的就不再只是 " 单个 AI 做得多好 "，而是 " 多少异质能力能被连接起来、碰撞出多少没人提出过的问题 "。Science Earth 团队正在更多学科上推进新的 case。

目前，论文、代码与网络均已公开：

arXiv：https://arxiv.org/pdf/2606.01316

code：https://github.com/EACN3

网站：rotating.scienceearth.org 接入：npm i -g eacn3

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

我们正在招聘一名眼疾手快、关注 AI 的学术编辑实习生

感兴趣的小伙伴欢迎关注了解详情

点亮星标

科技前沿进展每日见

宙世代

一起剪