硅星人 7小时前
对话新烛时代汪跃:把物理知识装进AI,做可控核聚变的AI操作系统
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

电,正在成为 AI 时代最稀缺的东西之一。

据国际能源署(IEA)预测,到 2030 年,全球数据中心的用电量将接近 945 太瓦时,较 2024 年几乎翻倍。从 2024 年到 2030 年,数据中心用电量每年增长约 15%。

这个背景下,有一件事开始变得不那么像科幻小说了——可控核聚变。

核聚变的原理,是让氢的同位素在超高温下发生聚合反应,释放巨大能量,最终用来发电。原料是海水里就有的氘,几乎取之不尽;不产生碳排放,也没有核裂变那样的失控风险。如果跑通,它几乎是人类迄今想象过的最理想的能源方案。问题在于,它太难了,业界一直流传一句玩笑:可控核聚变永远还有五十年。

但最近,这句玩笑开始加速走向现实。

一方面是材料卡口打开了。2021 年,MIT 团队用高温超导材料制成的新型磁体,创下纪录——同等性能的聚变装置,体积缩小到原来的约 2%,建造周期从 30 年压到数年,聚变企业开始密集创办。

另一方面是 AI 进场了,而且时机刚好。随着全球聚变装置陆续建成、运行实验数据积累起来,AI 终于有了可以 " 喂 " 的东西——用数据建模、训练控制策略,让这件事从理论可能变成了工程探索。

AI 能做什么?先说清楚难在哪里。

氢的同位素被加热到上亿度时,会变成一种特殊的物质状态——等离子体,核聚变反应就发生在这团流体里。但问题是,它极其不稳定,稍有扰动就会坍缩、破裂,反应中止。只有让它稳定地维持足够长的时间,聚变才能持续发生,发出电来。传统方法靠经验,慢且很难规模化。

而 AI 的介入,正在让毫秒级的预测和实时控制等离子体变得可能。

谷歌旗下的 DeepMind,2022 年就用深度强化学习实现了对核聚变等离子体的控制,论文登上《Nature》。2025 年 10 月,DeepMind 又宣布与聚变公司 Commonwealth Fusion Systems 合作,用 AI 寻找控制聚变反应的最优路径——这背后的逻辑也不难理解:谷歌自己的 AI 数据中心就面临巨大的能源压力,它比任何人都希望聚变能早点跑通。

而国内第一个冲进这条赛道的创业公司,是北京中关村学院与中关村人工智能研究院联合孵化的新烛时代,刚宣布完成 6000 万元天使轮融资,由中科创星、鼎峰科创联合领投,水木清华校友基金跟投,也是目前国内唯一一家专门做 AI for Fusion 的创业团队。

我们和创始人之一、CTO 汪跃聊了聊。他此前在微软研究院做了近十年关于强化学习和 AI for Physics 的研究。这一次,他的创业逻辑很清晰:窗口正在打开,国内聚变装置陆续建起来,数据开始有了,AI 模型和工具也该出现了。

一、从研究员到创业者:AI For Fusion 的窗口期到了

硅星人:先介绍一下你创业之前的经历吧。

汪跃:我之前是在微软亚洲研究院,2016 年去实习,2020 年博士毕业后转为正式研究员,一直到 2025 年 1 月。这期间,我主要做两个方向:一个是强化学习,另一个是 AI for Physics,具体聚焦在流体动力学建模和控制等问题上。

硅星人:在微软做了那么久,为什么选择离开?

汪跃:我对微软研究院抱有无限的感激,在微软研究院的这么多年里面,我收获了太多的成长,但总感觉差一点什么,主要在于研究院非常大,个人没有办法做真正端到端打通的落地项目——可能是人力资源的限制,可能是战略方向的问题,总之很难从头到尾把一件具体的事做完。

离开的时候我有三个想法:一是想找一个更自由的环境做有影响力的研究;二是想接触更真实的社会世界——在微软被保护得很好,但那不是真实的;三是想做真正能落地的事情。

硅星人:从微软出来之后,是怎么一步步走到创业的?

汪跃:我去了刚成立不久中关村学院做研究员,算是一次创业预演。因为学院还在建设期,一个人需要参与很多事情——除了科研之外,也需要从学院建设的需求出发,做组织运营、对外合作以及资源链接等工作。在这个过程中,我和一些核聚变公司有了接触,也认识了现在的合伙人张伟,清华工程物理系毕业,核物理学科背景。我们聊了几个月之后,大家都意识到,AI for 核聚变是值得做的,而且如果想落地,就必须认真来做,光是横向合作写论文是不够的,于是就正式创办了新烛时代。

硅星人:在你们看来,为什么在现在到了一个落地窗口,而不是更早?

汪跃:我们观察到一个结构性的滞后:最前沿的 AI 工具和算法,对传统工业场景的渗透率非常低。

这里面有一个双方都缺乏想象力的问题。传统聚变专家对 AI 往往带着刻板印象。在他们眼里,AI 顶多是一个 " 极其强大的函数拟合器 ",应用范围也就局限在回归、分类或者传统的强化学习上。他们潜意识里认为 AI 只能处理有大量标注数据的 " 封闭问题 "。

反过来,做 AI 的专家对聚变工业的认知也严重不足。发论文的惯性路径,是把所有工业问题强制 " 框架化 " 到 AI 擅长的任务里——觉得聚变无非就是一个状态空间大、响应要求快的非线性控制问题,严重低估了真实工业场景中物理规律的强约束、极端破裂事件的稀疏性,以及对绝对安全的苛刻要求。

双方的认知还没有彻底打通,但这恰恰就是我们最大的机会所在:聚变行业对 AI 的真实需求,早就远远超出了 " 函数拟合 " 的范畴。谁能率先跳出这个框架,发展出应对开放、复杂科学挑战的全新 AI 能力,谁就能真正吃下这波红利。

更重要的是,两方现在同时成熟了。一边是民营聚变公司,大概 2022 年前后密集融资成立,这两年装置陆续建起来,数据开始积累——没有数据,AI 就没有起点;另一边是 AI 本身,经过这几年的发展,架构和工具足够成熟,可以作为我们改造的起点。

这两个条件,缺一个做不了,再晚的话,窗口期又会过去。

二、把物理规律装进神经网络:AI 控制等离子体,不能靠暴力 Scaling

硅星人:怎么定义你们,你们是一家什么公司?怎么定义 AI 在可控核聚变里的角色?

汪跃:我们定位是做驱动聚变装置运行的智慧大脑。

聚变里很多关键流程长期依赖专家经验、直觉和手工试错,这种模式对科研当然有价值,但不适合规模化、标准化地走向工程化。而我们是一家把前沿 AI 深度重构成 " 聚变可用形态 " 的公司,让 AI 把那些分散的、模糊的、难以言传的判断,变成可复制、可量化、可部署的流程和模型。

为了做到上面说的,我们现在在和上游的聚变公司,比如星环聚能等深度合作,通过提供 AI 能力,帮助其加速核聚变实验的效果和速度。

硅星人:现在核聚变实验最核心的瓶颈是什么?

汪跃:核聚变的实验,本质就是在控制等离子体(一种磁流体)。氘和氚在托卡马克设备里被加热到几百万度乃至上亿度,形成等离子体,能把它稳定约束住、维持足够长的时间,聚变反应才会发生,释放大量热能。

目前,行业正处于由实验验证向稳定量产过渡的关键阶段,的突破核心就在于 " 等离子体约束与控制 "。国内实现常态化运行的装置仍属少数,涵盖了国家科研机构与头部民营企业。其中,中科院等离子体物理研究所的 EAST 装置在今年初实现了 1066 秒的高约束模等离子体运行,刷新了世界纪录,但距离工程化应用仍有路要走。

如果从工程落地的角度来看,我们拆分成了四个难点:诊断、预测、控制、设计。

诊断的难点在于,它是一个典型的 " 不完整观测 " 问题——上亿度的等离子体内部是物理上的观测禁区,我们没法探入其中,只能依赖外部边缘的有限变量去反推内部全貌;预测的难点在于。比如像 " 等离子体破裂 " 这类极端事件的时间尺度极短,且一旦发生,试错代价极高;再到控制的环节,难度在于这本质上是一个高维、非线性、强约束的超高频实时反馈系统;最后是设计的难点,在于聚变实验以及装置设置等设计问题面临的参数空间浩如烟海,且受到极其复杂的多物理场耦合约束。

硅星人:你们准备怎么用 AI 解决上面的困难呢?

汪跃:诊断上,现在的做法是在托卡马克外周放一圈传感器,磁场、光学、甚至高速相机,通过测量外部信号反推里面发生了什么。这个反推有物理依据:对于反推内部磁场结构这一问题来说,如果假定等离子体内部形成了平衡态,它就必然满足一个叫 GS 方程的关系式,描述的是电磁力(向内的磁约束力)与等离子体压强(向外的膨胀力)之间的平衡。

通过这个方程,从外部传感器数据反推出等离子体的形状、磁通量、密度、温度——这也是我们做的第一步,通过 AI 去处理这些多模态信号的融合,判断等离子体的状态。

第二步是预测,本质是一个 next frame prediction 问题:你现在有磁通量、压强、密度、温度这些参数,下一时刻等离子体会往哪个方向运动?形状会怎么变化?更关键的是——如果我调整了外部线圈的电压,它内部会被扭曲成什么样?这有点像天气预报:风速、温度、气压、湿度,预测一小时后是不是下雨。

再到控制这一步,目的是把预测转化成实时决策。托卡马克有多个线圈分布在不同位置,控制频率大概是 10K 赫兹,也就是每 0.1 毫秒就要做一次决策。这个速度和维度,人是根本做不到的。

所以从诊断、预测到控制,这条链路是 AI 必须介入的核心场景。再往宏观一层还有设计——这次实验该怎么设计才能达到目标?现在完全靠专家经验,未来也是 AI 可以介入的地方。

硅星人:你们的模型也是 Transformer 架构吗,和通用类模型的不同点有哪些?

汪跃:是的,骨架是,因为本质是 next frame prediction。不同的地方,第一,我们处理的不是离散的文字 token,我们的 frame 是连续的高维物理场。

第二,是数据和方法。大语言模型的路子是数据足够大就 scaling up,暴力涌现,在聚变这里完全走不通,数据没有那么多 , 也没法等到数据积攒到足够了再开始工作。

我们的核心思路是把物理方程作为先验知识显式嵌入神经网络,形成物理信息神经网络(Physics-Informed Neural Network)。物理系统是白盒的—— GS 方程、MHD 方程我们都知道,把这些约束放进网络里,相当于在数据不足的时候给模型提供了额外的监督信号。

第三,是一个硬约束,控制模型必须极小、足够快,这样才能做到离子层面的控制。

我们的解法是不对称架构。预测模型可以非常大——它只用于训练阶段,不需要实时部署,大了反而能更充分地学习等离子体的物理规律;控制模型则必须极小,通过蒸馏从大的预测模型里提炼出来,再配合底层推理加速,确保能在 1 毫秒内输出信号。

就像游戏 AI 训练好了之后,上场只需要一个轻量级控制器,不需要带着整个预测模型一起跑。

硅星人:现在模型进行到哪一步了?

汪跃:整体还在起步阶段,有了数据后,在用数据训练,接下来会快速推进闭环实验——不在计算机里反复模拟,而是尽快拿到真实装置上去做验证,拿真实反馈,跟做机器人是一样的思路。目前,我们也和合作方共同研发,大家做到什么程度,我们怎么帮他们赋能,把成果适配过去。

三、中游服务商的生存逻辑,与一个能源大时代的押注

硅星人:所以你们的客户主要是核聚变公司,现在产业的上下游各是什么状态?

汪跃:如果把核聚变看作一个即将爆发的超级产业,产业链的逻辑其实非常清晰。我们的定位,是上游核心的 " AI 大脑 " 提供商。这个比喻我觉得比较好理解:如果全球聚变公司在造的是越来越强的 "CPU" 裸机,那我们在做的,就是跑在这些装置之上的 " 操作系统 " ——我们不造的托卡马克物理装置,我们专注提供不可或缺的 AI 诊断、预测、控制和设计能力,在这个产业链里做赋能者。

沿着我们往下看,整个产业链是这样分布的:

中游是 " 整机厂 "(装置研发与制造)。 也就是我们常说的国家队和各大民营聚变公司。目前全球拿了融资、正在冲刺的民营公司大概有数十家。国内的情况是,真正有装置在常态化运行的企业还屈指可数;很多 2025 年前后入局的团队,还需要两三年时间才能把物理设备彻底搭起来。我们的 AI 链路,直接服务的客户就是这些中游的 " 造星者 "。

下游则是最终的商业化应用(发电与并网)。 聚变要真正走向商业发电,装置的能量增益(Q 值)至少要大于 30 ——也就是说,输出的能量要是输入能量的 30 倍以上,才能覆盖掉整个系统运行的巨大工程损耗。这当然需要中游企业一步步去迭代,但令人兴奋的是,下游的商业需求已经提前引爆了。

为了填补 AI 算力带来的巨大能源缺口,像微软这样的科技巨头,已经开始直接和聚变初创公司 Helion Energy 签订长期的购电协议,谷歌也与联邦聚变系统公司(Commonwealth Fusion Systems,简称 CFS)达成电力采购协议,承诺未来购买他们发出来的电。下游巨头们用真金白银在投票,这也让整个行业确信:聚变发电不再是遥不可及的科幻,而是未来必然落地的确定性事件。

硅星人:你们现在是以什么方式跟核聚变公司合作的?

汪跃:目前本质是数据换服务、共同研发。我们需要他们的数据和装置做模型,他们需要我们的 AI 能力来提效。在全球范围,我们算是做的最早的聚焦 AI 赋能可控核聚变的商业公司,但这一定是接下来的趋势,大家也都在积极推进共研。

我们的判断是,一旦把模型在某台装置上跑通,能展示出可以减少无效实验——比如原本需要 100 次尝试才能完成的实验目标,以后可能 50 甚至 1 次就够了——对客户来说这个黏性非常强,谁先建立这个深度绑定,壁垒就在谁那里。这也是我们现在把服务好现有的合作伙伴、尽快打通从算法到装置的壁垒放在第一位,从而展现我们的工程落地能力、扩大合作覆盖面的原因。

硅星人:你怎么看能源这件事本身的长期价值?

汪跃:电会越来越不够。你想,现在大家用 AI 已经不是去网上搜东西了,豆包、 ChatGPT,这背后的算力消耗是搜索引擎的几个量级倍数。现在用量还比较低,因为普及率还没上来。但如果再往后走,不光是文字问答,还有视频生成、实时监控分析、各种物理世界的感知——这个增长是指数级的,没有人能预料五年十年以后会到什么规模。

硅星人:特别是美国那边,关于能源的焦虑会更大。

汪跃:是的,美国那边已经很明显了,火电厂新建阻力极大,风光发电本来就不稳定。国内现在相对还好,但中国的能源需求也在持续增长," 够用 " 是个动态概念,不能只看今天。

可控核聚变一旦商业化落地,它的优势是目前任何能源路线都无法比拟的。之前中国工程院院士李建刚也说过," 一杯海水就能提供相当于 300 升汽油的能量。" 它具备燃料无限、零碳排放和固有安全性三大绝对优势。

更重要的是,大家已经开始相信它可能真的能成——以前大家说聚变 " 永远五十年 ",但这两年材料技术进步了,AI 进来了,EAST 做出了 1066 秒的记录,NIF 在惯性约束也有突破,节奏明显在加快,国内十五五规划里也明确把聚变列为前沿重大方向。

李院士预测的是,最迟在 2030 年,我们就会见证 " 核聚变点亮的第一盏灯 "。

硅星人:从微软研究院的研究员,到北京中关村学院的研究员,再到现在新烛时代的 CTO,这一路走下来有什么感受?

汪跃:心态上发生了很多转变,挺有意思的。过去在研究院做研究,最大的挑战是拿严谨的逻辑去说服审稿人;但现在自己出来创业,是要实打实地取信于行业同行和客户。对我自己而言,核心目标从追求纯粹的 " 前沿学术创新 ",变成了磕技术到工程落地的 " 最后一公里 "。

搞科研是单点突破,把自己的 Paper 和课题做好、对自己负责就行;作为创业者,你必须具备全局观——背后站着跟你一起打拼的团队,有信任你的合作伙伴和投资人,还有等待交付的客户。

另一个感受是每天都面临新的挑战。创业之后,每天做的事都是之前没做过的,作为 CTO 既要推进技术路线,又要做合作对接,很多事情都要亲自盯。我本质上是一个对生命体验有着极致 " 新奇感 " 追求的人,这种从 0 到 1 的感觉对我来说是很大的驱动力。

当然,更重要的是,这件事本身有着极大的时代价值。一方面,可控核聚变是足以重塑人类文明的终极能源,能亲自投身进这个历史进程,是件很自豪的事儿。另一方面,在强化学习和 AI for Physics 这条路上,我也深耕了近十年。如果现在不创立新烛时代,不抓住这个产业爆发的奇点,将学术经验推向工程落地,这个历史窗口可能就永远对我关闭了。我不想在未来回望的时候留下这种遗憾。

评论
大家都在看