一场关于 " 物理 AI" 的全球竞赛,正在从 PPT 走向真实的战场。
这几天,聚光灯打在两家企业身上。
一边是小鹏汽车。11 月 5 日,何小鹏公布小鹏汽车的目标是成为面向全球的具身智能公司,并发布了四个 AI 应用(小鹏第二代 VLA 大模型、小鹏 Robotaxi、小鹏全新一代人形机器人 IRON、汇天飞行汽车)。这意味着小鹏试图告别 " 造车新势力 " 的标签,一脚踏入科技前沿的核心圈。

另一边是特斯拉。11 月 6 日的股东大会上,埃隆 · 马斯克的万亿美元薪酬激励计划即将接受投票。这份方案的解锁条件,与特斯拉在 AI 和机器人领域的战略深度捆绑。
如果你觉得这两件事只是巧合,那或许就低估了这股席卷全球的 " 物理 AI" 浪潮。英伟达 CEO 黄仁勋多次在公开场合断言 " 物理 AI" 就是 AI 的未来。当这位手握全球 AI 算力命脉的 " 军火商 " 都如此笃定时,一个问题随之而来:
在 " 物理 AI" 的赛道上,中国科技公司将如何抓住机会、突破卡位,给出 " 中国解法 "?
一部分目光聚焦在小鹏身上。乐观派认为,小鹏正在以一种更系统的方式,复制甚至超越特斯拉的成功路径,试图在全球智能产业的牌桌上,为中国争夺一个关键席位。
保守派则担心,从 " 造车新势力 " 到 " 全球具身智能公司 ",跨度之大、挑战之多,意味着小鹏的技术积累、资源投入与生态构建能力,都将面临前所未有的考验。
当 " 物理 AI" 成为科技圈新的集结号,小鹏的物理 AI 布局,是真正踩在了产业变革的鼓点上,找到了一个比特斯拉更落地的 " 中国答案 ",还是一场虽然美好、却落地艰难的资本游戏?或许,在理解了小鹏构建的 " 物理 AI" 版图后,答案就会变得清晰。
物理 AI,为什么是 AI 的终极战场?
最近被科技圈捧上神坛的 " 物理 AI" 到底是什么?它和我们熟悉的 ChatGPT 这类生成式 AI,又有什么根本的不同?
ChatGPT 靠 " 吃 " 互联网上的海量信息为生,能陪我们聊天,能写诗、作画。但它终究是一个关在瓶子里的 " 超级大脑 ",无论多聪明,也不能帮你倒一杯水。
物理 AI 则不同,它有眼睛(摄像头)、有耳朵(传感器)、有大脑(AI 模型),更有能交互的手和脚(机械臂、车轮)。关键是,它能从 " 瓶子 " 里走出来,进入复杂的物理世界,像人一样 " 思考 " 和 " 行动 "。
我们以一个司机开车的场景为例,感受物理 AI 的完整闭环:
当你的眼睛 " 看见 " 前方的红绿灯和行人,大脑会 " 看懂 " 它的含义——红灯意味着停止,行人可能会过马路。这就是感知与理解。
紧接着,你注意到一个皮球滚向马路,瞬间预判到可能会有孩子追出来,于是,你决定提前减速。这就是预测与决策。
最后,你的脚踩下了刹车,车速平稳地降了下来。这就是行动与交互。
从 " 看见 " 到 " 看懂 ",再到 " 预判 " 和 " 行动 ",这套行云流水的操作,正是物理 AI 追求的终极目标:让机器能自主、安全地完成这个闭环。
下一个问题是,为什么从黄仁勋、马斯克到何小鹏,这些身处牌局中心的玩家,会不约而同地押注物理 AI?
因为 AI 的价值,终究要落在改造物理世界上。无论是自动驾驶、工业制造还是家庭服务,最终都需要 AI 能指挥机器,在现实世界里 " 干活 "。
AI 一旦跨过这道坎,它就不再是飘在云端的工具,而是会成为像水和电一样的基础设施,重塑整个实体经济。对于中国而言,这更是我们从 " 制造大国 " 迈向 " 智能强国 ",必须抢占的战略制高点。
看清了这一点,我们再去看特斯拉,就会发现它最厉害的,不是电池或电机,而是被马斯克反复提及的 " 世界模型 "(World Model)。这套模型就像一个通用的 AI 大脑,既能训练自动驾驶汽车,也能调教 Optimus 人形机器人。
以自动驾驶为例,这个 " 世界模型 " 本质上是为 AI 司机创造了一个虚拟驾校。这个模拟世界可以生成任何可能的极端路况,让 AI 司机 " 练车 "。按照特斯拉的说法,AI 在一天之内就能学习相当于人类几百年驾驶时长的经验。特斯拉的 AI 就是通过这种方式以指数级的速度迭代。
既然有玩家在先,我们还需要完全自研吗?答案是肯定的,原因有二。
第一,是数据主权。智能汽车和机器人,本质上是移动的、全天候的 " 数据采集器 "。它们所 " 看见 " 的道路环境、工厂布局,乃至家庭隐私,相当于数字时代的国土疆域。将这等规模的敏感数据交由他国公司处理,无异于将命脉交予他人之手。
第二,是产业主导权。物理 AI,很可能就是下一代智能终端的 " 操作系统 "。如果我们在别人的地基上盖房,那就意味着,将利润最丰厚、最具话语权的核心技术让给他人,自己只能做应用层的组装和集成。
更何况,特斯拉的 " 世界模型 " 源于其获取的全球数据,而中国拥有全世界最复杂、最独特的道路场景和用户习惯,需要更好地理解并建模中国特有的物理环境。

可见,物理 AI 之争,超越商业与技术本身,它是一场关于国家产业安全与未来发展战略主动权的竞争。在这场战争中,中国必须拥有自己的核心技术和领军企业。那么,谁能扛起这面大旗?
小鹏的三张技术底牌
最近,市场的目光聚焦在小鹏汽车身上。在 2025 年小鹏科技日上,小鹏一口气发布了四个 AI 应用:小鹏第二代 VLA 大模型、小鹏 Robotaxi、小鹏全新一代人形机器人 IRON、汇天飞行汽车。看似是跨行业,其实是为 " 物理 AI" 一个目标服务。
要让 AI 进入复杂物理世界,首先要面对的问题就是 AI 如何思考、如何反应。小鹏给出的解决方案是第二代 VLA 大模型,它最核心的特点,是让 AI 拥有 " 直觉 "。
还是以前文提到的司机开车的场景为例,一个经验丰富的司机看到路边滚出的皮球,会下意识地踩下刹车,这个过程几乎没有复杂的逻辑推理。但传统的自动驾驶 AI 却做不到。它需要先 " 看 " 到皮球(视觉感知),然后把视觉信息 " 翻译 " 成机器可以理解的语言或指令(语言模型),再让系统 " 理解 " 这个指令的含义(规划决策),最后才 " 执行 " 刹车动作。中间的 " 翻译 " 环节,无疑拖慢了反应速度。
小鹏的第二代 VLA,就是要拿掉 " 翻译 " 环节,采用 " 视觉—隐式 Token —动作 " 的架构。这里的 " 隐式 Token" 可以理解为一种 AI 内部的、非语言的 " 心领神会 ",让 AI 从 " 看到 " 直接跳到 " 行动 "。这就像是给 AI 训练出了 " 肌肉记忆 " 或 " 直觉 "。它不再需要 " 思考 " 皮球的危险性,而是能凭借从海量数据学习到的物理规律,本能地做出反应。
在实际驾驶中,这种 "AI 直觉 " 会给用户带来什么改变?总结来说就是,反应更快,驾驶更拟人,不依赖地图时,也能更稳定、自主地驾驶。
例如,在没有高精地图覆盖的次级道路上,小鹏数据显示,其 " 小路 NGP"(在非主干道上的智能驾驶)功能的平均接管里程优化了 13 倍。同时,小鹏发布的 " 无导航超级漫游 "(Super-LCC)功能,也让车辆在无预设导航路径时,凭借对环境的实时理解进行驾驶辅助。
本质上,小鹏选择的技术路径是,教会 AI" 凭本能反应 "。这是智能体进入物理世界的第一步,也是最关键的一步。
有了能快速反应的 " 大脑 ",物理 AI 最终要落在能执行动作的 " 身体 " 上。小鹏没有为每个硬件都开发一个专门的 AI,而是把 " 大脑 " 用在三种不同的 " 身体 " 上:汽车、人形机器人和飞行汽车。这并非简单的 " 一芯多用 ",而是在培养全能型的 " 通才 "。

我们可以这样理解:AI 在驾驶汽车时学到的经验,比如如何识别红绿灯、如何预判行人意图,可以被无缝迁移到人形机器人身上,帮助它在复杂的商场里规划路径、避开行人。
在这个 " 跨域同源 " 的设计下,知识可以共享,经验可以复用,学习效率远高于训练三个独立的 " 专才 "。关键是,这套 " 一脑多用 " 的架构,更能解决物理 AI 落地的关键难题:如何让 AI 的能力突破单一场景,在复杂的现实世界中灵活应变、举一反三。
接下来的问题是," 大脑 " 和多功能的 " 身体 " 如何高效协同工作?这就触及了最底层的体系,就像我们身体的 " 神经系统 "。小鹏选择全栈自研,通俗地理解,就是打造一套稳定、自主可控的 " 神经系统 "。
我们可以用苹果的例子来理解 " 全栈自研 " 的分量。苹果之所以能构建起强大的生态壁垒,核心就在于它自己设计芯片(A 系列 /M 系列),自己开发操作系统(iOS/macOS),自己设计硬件(iPhone/Mac)。这种模式确保了指令从大脑到身体的传递过程中,损耗最小,响应最快。它以此实现了深度的优化与整合。
小鹏的路径颇为相似:从最底层的 " 图灵 AI 芯片 ",到中间的 " 操作系统 " 层 "VLA/VLM/VLT 大模型体系 ",再到上层的汽车、机器人、飞行汽车等硬件,所有核心环节都掌握在自己手中。这确保了其物理 AI 架构形成一个独立性、完整且不受制于人的闭环。
至此,小鹏的技术版图已经清晰:" 直觉式 "AI 模型 +" 跨域同源 " 的多种硬件 +" 全栈自研 " 的技术架构。
更落地的 " 中国方案 "
看清了小鹏的技术底牌,一个更现实的问题随之而来:这套架构在行业中究竟属于什么位置?小鹏又打算如何将其推向市场?
答案其实就藏在它的定位上。小鹏强调,它是 " 中国唯一实现物理 AI 全栈自研 " 的企业。
要理解这一点,最好的对标对象是华为。华为的盘古大模型体系中包含了世界模型技术,但其商业模式是向行业提供智能驾驶解决方案与算力服务,本质是向外输出通用能力,目前并不亲自下场制造硬件载体。它的角色,更像是物理 AI 时代的 " 英特尔 " 或 " 高通 "。
而小鹏确实是目前唯一一个展示 " 多类具身智能载体 + 统一 AI 大脑 + 关键硬件自研 " 布局的公司。这样做最大的好处就是,能实现深度的 " 软硬一体 ",带来的直接结果是,用户体验更流畅,技术迭代也更迅速。
这条路无疑耗资巨大、难度极高,但一旦走通,所构建的软硬一体生态,也将是别人最难复制和超越的壁垒。

那么,小鹏这套 " 全家桶 " 要怎么 " 卖 " 出去?
回顾科技史,任何一个新平台的崛起,都伴随着路线之争。在移动互联网时代,这表现为谷歌和苹果两种模式:谷歌通过开源的安卓系统,联合各大硬件厂商,构建了一个庞大 " 联邦 ";苹果凭借自研的 iOS 系统与 AppStore,打造了一个利润丰厚的 " 封闭帝国 "。
在智能驾驶领域,特斯拉是典型的 " 帝国 " 模式,通过 " 硬件(汽车)+ 软件(FSD)+ 数据(全球车队)+ 能源网络 " 的垂直整合,构建了封闭生态。在这个生态里,它享受品牌溢价和利润。
小鹏显然不是正面硬刚特斯拉,它更像在构建一个 " 联盟 "。从其最新的两个动作能看出这一意图:
第一招是输出核心技术。大众汽车已确认成为第二代 VLA,及小鹏自研图灵 AI 芯片的首发战略合作伙伴。这步棋很高明:与其让大家重复造轮子,不如让有影响力的玩家先用上自己的 " 轮子 "。这不仅能验证了技术的通用性,更能 " 借船出海 ",在全球范围内快速推广自己的技术标准。
第二招是开源核心工具包。小鹏宣布 Robotaxi 将开放 SDK(Robotaxi 业务的核心软件开发工具包),与全球伙伴共建 Robotaxi 生态,高德地图已加入。
小鹏的商业模式逐渐清晰:对内,通过 " 全栈自研 " 保证技术的领先与协同;对外,通过开放技术标准来吸引参与者、壮大生态。它显然不再满足做一家汽车制造商,而是希望成为物理 AI 时代的 " 平台服务商 " 甚至是 " 规则制定者 "。
结语
资本市场,本质上是为 " 未来 " 定价的地方。一家公司的价值,不仅取决于当期的财报,更在于未来的想象力。过去,资本市场常将小鹏与其他造车新势力一并看待,如今,随着 " 物理 AI" 战略的发布,小鹏的估值逻辑有望从 " 智能汽车公司 " 拉升到 " 全球具身智能平台 "。
支撑这个新逻辑的,有三个可见的转变:
一是从 " 卖车 " 转向 " 技术变现 "。与大众的合作是一个关键节点,它表明小鹏的 AI 技术可以作为独立产品产生价值,打开了技术授权这条更高利润的收入来源。
二是从硬件销售到生态服务。通过开源 Robotaxi 平台,小鹏正在构建一个可持续的服务模式,未来从自动驾驶服务中持续抽成。
三是从 " 造车 " 到 " 造智能体 "。其业务范畴已从汽车,扩展至能上天(飞行汽车)、能入地(机器人)的各类智能实体。
当然,这条路走起来并不轻松。小鹏在未来几年需要处理好几个现实问题:
第一是钱和人的分配。自研技术、同时做车、机器人和飞行汽车,每一样都很烧钱,也很依赖顶尖人才。怎么把钱花在刀刃上,确保几个业务都能稳步推进,是首要的课题。
值得关注的是,从小鹏 2025Q2 财报来看,公司基本面持续向好:毛利率已经连续多个季度正增长,在手现金储备增加到了 476 亿元。这些数字说明,小鹏在为物理 AI 大举投入的同时,当下的主业也在加速自己 " 造血 "。更有说服力的是,公司管理层依然维持了第四季度实现盈亏平衡的预期。

第二是用商业成果说话。再好的技术构想,最终都需要接受市场的检验。小鹏需要持续拿出实际进展,一步一步验证技术蓝图。
从长远来看,科技公司的价值往往建立在两个基础上:一是提前看到方向,二是能坚持走下去。小鹏选的这条路,踩在了 AI 与实体产业结合的趋势上。接下来就看它能否持续将技术转化为可用的产品,再将产品转化为可持续的商业模式了。


登录后才可以发布评论哦
打开小程序可以发布评论哦