AI 最先征服的是屏幕,最难进入的是现实世界。在屏幕里,AI 犯错最多是答错一道题、写坏一段代码;到了现实世界,一旦出错,就会撞上车、人和道路。
过去三年,大语言模型、AI 编程和 Agent 平台挤进同一片数字战场,模型能力、价格和分发渠道都在快速内卷。但当黄仁勋在 CES 2026 上宣告机器人领域的 ChatGPT 时刻已经到来,把 " 物理 AI" 推到行业聚光灯中心的时候,一个新的问题浮出水面,从屏幕里走出来的 AI,要如何在真实的物理世界里站住脚?在黄仁勋的描述中,物理 AI 的核心在于让 AI 理解真实世界,并据此进行推理和规划行动。
同期,英伟达也在把 Physical AI 推向基础设施层面,Cosmos 用于世界模型和合成数据,GR00T 面向机器人学习与推理,Isaac Lab-Arena 用于评估,OSMO 则打通从边缘到云端的训练流程。它传递出的意思很明确,AI 走进物理世界,不只是模型能力问题,也是一整套仿真、训练、验证和部署基础设施的问题。
资本率先给出了回应。具身智能成了 2026 年最火热的赛道,融资额一路飙升,百亿估值的公司接连涌现。但热闹背后有一个更根本的问题,物理 AI 的门槛不在于谁喊概念更响、谁融资更多,而在于谁先拿到进入长赛道的 " 门票 ",即规模化数据、可持续现金流,以及真实世界里的量产验证。
物理 AI 不是一条单线赛道。具身智能、自动驾驶、工业机器人、边缘 AI,都在把 AI 从屏幕带进现实世界,它们之间也并非对立关系,更像是物理 AI 走向现实的不同入口,只是节奏各异。从今天的真实世界数据、现金流和量产验证看,自动驾驶可能是更早接近闭环的一支。

4 月 25 日,北京车展期间," 物理 AI" 成了多家智驾公司发布会上的高频词。Momenta R7 强化学习世界模型的量产首发,是其中值得关注的一个样本。R7 代表了 Momenta 这一代智驾系统的核心模型思路,在世界模型构建的虚拟环境中进行强化学习,让车在行动前先预演世界会怎样变化。按 Momenta 披露,搭载其系统的量产车辆规模已超过 80 万台,R7 是在这个量产基座上完成的一次架构升级。
为什么是自动驾驶
为什么物理 AI 没有像 ChatGPT 那样迅速爆发?一个被反复讨论的原因是成本结构。数字 AI 的数据来自互联网,天然大规模、低成本、易获取,验证也便宜,Agent 调用一个工具只需要一个 API 接口。物理世界的逻辑完全不同,数据采集难,测试周期长,试错代价高。OpenAI 早年同时布局机器人和语言模型,最终阶段性选择 GPT,背后正是这种成本结构差异。
但物理世界 " 可能是更大的一部分 "。这是 Momenta CEO 曹旭东在北京车展期间反复提到的一个判断。在他看来,自动驾驶是最先规模化跑通 " 数据闭环 " 和 " 商业闭环 " 的物理 AI 场景。体验提升带来商业化,商业化带来数据回流,数据再推动模型能力跃升,一旦这个循环转起来,进步的速度会远超直觉。他分享过一个观察," 任何一个人工智能应用,一旦接近人类的水平,就会在很短的时间内大幅超过人类的水平。" 前面可能花十年、二十年爬坡,但超越人可能就发生在一两年内。
从这个角度看,搭载 Momenta 系统的量产车辆规模超过 80 万台,意味着 Momenta 已经是少数成功在真实世界中积累物理 AI 数据、工程经验和商业闭环的公司之一。曹旭东认为,智驾领域正在呈现一种 " 摩尔定律 " 式的进步节奏,过去大约是两年十倍的提升速度,行业领军企业甚至可能做到一年十倍。

类似的判断也出现在硅谷。2026 年 CES 期间,Mobileye 宣布以约 9 亿美元收购人形机器人公司 Mentee Robotics,并把这视为进入 "Mobileye 3.0" 的一步。Mobileye 给出的理由是,自动驾驶和机器人共享一部分底层 Physical AI 能力,包括感知、世界建模、规划控制,以及不确定性下的决策。这说明,自动驾驶公司积累的能力,正在被重新理解为可以泛化到更广义物理 AI 的平台能力。
在模型里的世界先练车
" 世界模型 " 正在成为自动驾驶行业越来越重要的关键词。
2026 年 2 月,Waymo 发布了基于 Google DeepMind Genie 3 构建的 Waymo World Model,用于生成高真实度、可交互的自动驾驶仿真环境,尤其覆盖现实中难以大规模采集的长尾场景。Momenta R7 也处在这一大方向上,只是它强调的是强化学习世界模型的量产首发。这说明,世界模型不再只是自动驾驶论文里的概念,而是正在变成头部玩家处理长尾风险和仿真训练的共同语言。

按 Momenta 的拆解,这套世界模型分为三层。最底层是预训练,让系统拥有物理常识,依托量产车队产生的海量真实驾驶数据,将物理规律、常识与因果关系压缩进模型。在常识之上是仿真,核心是让系统理解 " 如果我的行为发生变化,世界将如何演变 "。最关键的一层是在世界模型中进行强化学习,系统从单纯的模仿学习走向 " 想象与探索 ",在虚拟世界里经历千万次推演,自主学会在复杂博弈中做出最优决策。
一个具体的例子,如果前车意外掉落一箱苹果,R7 能预判苹果滚落的轨迹与扩散范围,提前平稳减速并规划绕行路线。只依赖已有数据分布和真实路测,很难穷尽这类低频风险。世界模型正在把长尾问题从 " 碰巧遇到 " 转向 " 可推演、可训练 "。当然,这不意味着系统已经穷尽了所有极端风险,但方向已经明确。不过,世界模型也并不意味着可以绕开真实道路。仿真可以扩大长尾场景覆盖,却无法完全复制真实世界的不确定性,最终仍需要真实验证。这也解释了为什么 " 量产 " 和 " 真实道路闭环 " 在物理 AI 里如此重要。

如果借用数字 AI 的理解框架,世界模型预训练有点像让大模型先获得通识常识,而强化学习则是把常识对齐到更好的行为上。区别在于,数字 AI 对齐的是 " 回答更好 ",物理 AI 对齐的是在真实物理约束下更安全、更从容地行动。
物理 AI 的门槛
资本热不是问题,物理 AI 本来就需要长期资金。另据公开统计显示,2026 年前几个月,中国具身智能融资已进入百亿级密集爆发阶段。但资本只能更快地为试错扫清障碍,却买不来完整的物理世界周期。安全验证、供应链适配、车规级测试、功能安全认证,每一个环节都会把速度重新拉慢。
曹旭东给出了一个更量化的判断,物理 AI 需要一张 " 门票 ",这张门票的本质是能够长期支撑研发的现金流业务。实现规模化 L4 自动驾驶,累计投入至少需要百亿美元级;通用机器人可能进一步上升到几百亿甚至千亿美元级。单靠融资,长期看并不现实。
时间壁垒同样真实。自动驾驶软件具备接近零边际成本的规模效应,先发优势因此格外显著。以奔驰为例,2017 年投资 Momenta,是由奔驰董事长康林松亲自决策,但第一个量产项目上市是 2025 年下半年,整整八年。国际 OEM 的合作周期是五到七年,国内也要三年。而德系豪华所代表的全球最严苛标准,甚至需要更长时间,有时要长达十年。但一旦成功拿下,就有望迎来 " 赢者通吃 " 的局面,实现 " 马太效应 "。
这种技术和产业规模上的先发优势也会体现在对资本市场资源的更可持续的使用上,更加接近终局的公司在快速进入更成熟的资源池。
据媒体报道,Momenta 已向港交所秘密递交招股书,IPO 估值预期超千亿元,计划年内挂牌。2024 年下半年曾启动 Pre-IPO 融资,交割金额超 10 亿美元。
真正的测试场
如果说门票理论是一种行业推演,那么 BBA 的选择就是一种现实验证。
按 Momenta 披露,本届北京车展有超过 20 个品牌、60 余款车型搭载其方案,其中包括梅赛德斯 - 奔驰、奥迪、宝马的新发布车型。这组客户的意义不在于名单本身,而在于它们代表了全球汽车工业里门槛最高、最重视安全冗余的一批需求。能够进入这些品牌的量产体系,本身就是对一家 AI 公司技术成熟度和工程交付能力的高强度检验。
奥迪 AUDI 品牌产品研发执行副总裁 Martin Kraus 在北京车展的一场圆桌中说了一句很直白的话," 质量和安全标准是没得商量的。" 按他的说法,E7X 将成为奥迪家族全球范围内第一款搭载 L3 级自动驾驶系统的车型,也将是 Momenta 首款搭载 L3 系统的量产车型。

曹旭东把与 BBA 的合作过程概括为 " 打合 "," 高级的合作,永远是团结、碰撞、再团结。" 奔驰团队曾反复挑战一个极端场景,高速上没有灯光,一个摩托车骑手摔倒,戴着黑色头盔,头朝后方。这类碰撞的价值在于,它把 AI 能力拉进了传统汽车工业最严苛的安全语境里。据现场介绍,奔驰与 Momenta 累计测试里程达 80 亿公里,同时奔驰还坚持 " 油电同智 ",希望在油车上也实现接近电车的智能驾驶体验。
圆桌上,一位奥迪车主讲起京沪高速上的一次经历,前车连续追尾,系统帮他刹住并驶离超车道。他给母亲打电话," 你帮我把汤热一下,我要到家了。"
这比任何参数都更能解释安全标准的意义,它最后要回答的,是一个人能不能安全回家。
梅赛德斯 - 奔驰中国研发自动驾驶及车联网执行副总裁王忻在同一场圆桌中提到,AI 进入物理世界时," 这个虚拟人也需要有情感,它也要有‘害怕’ "。物理 AI 如果只理解物理规律,还不够,它最后要理解的是坐在车里的人如何感到安全和从容。
对中国 AI 公司来说,真正的全球竞争力不只是速度和成本,还要能进入全球汽车工业最复杂、也最难妥协的量产体系。
从行业视角看,Momenta 这样的公司在今天的物理 AI 版图里占据了一个特殊位置。它并不只是做一套智驾系统,而是在真实道路上积累物理 AI 所需的底层能力,包括数据闭环、世界模型训练、仿真验证、车规级安全和量产交付。今天这些能力服务于智能驾驶,未来也可能外溢到 Robotaxi、物流、低速无人车,甚至更广义的具身智能场景。
自动驾驶不是物理 AI 的终点。但它可能是这场长赛道上,最先被真实世界验证的一张门票。


登录后才可以发布评论哦
打开小程序可以发布评论哦