AI革命下一站——物理AI有哪些新进展？

物理 AI 正从概念走向产业现实。浙商证券在最新发布的行业深度报告中指出，继感知 AI、生成式 AI、Agentic AI 之后，物理 AI 将成为 AI 技术演进的下一站——其核心在于让模型理解并预测真实世界状态，从而驱动自动驾驶、具身智能和工业软件等场景的深度变革。

在市场规模上，Coatue Management 预计物理 AI 市场规模至少可达 6 万亿美元，较数字 AI 高出约 50%。英伟达 CEO 黄仁勋在 2026 年 CES 上表示，物理 AI 可重塑价值约 50 万亿美元的制造和物流产业。与此同时，顶尖学者与科技巨头正密集入场：图灵奖得主杨立昆成立的 AMI Labs 完成 10.3 亿美元种子轮融资；AI 教母李飞飞联合创立的 World Labs 完成 10 亿美元新一轮融资，成立不到两年估值突破 50 亿美元；英伟达则宣布下一代芯片 Feynman 专为物理 AI 设计，预计 2028 年发布。

浙商证券认为，当前物理 AI 尚无固定实现范式，需由世界模型与 VLA（视觉—语言—动作模型）共同支撑。自动驾驶、具身智能和工业软件构成物理 AI 最核心的三大落地场景，其中自动驾驶有望率先跑通 " 数据闭环 " 与 " 商业闭环 "。报告建议重点关注具备世界模型能力的公司，以及上述三大场景中的软硬件标的。

技术定义：从生成式 AI 到物理 AI 的范式跃迁

浙商证券报告指出，物理 AI 是可以理解真实世界的 AI 系统，需要回答两个核心问题：世界接下来如何变化，以及实体发生动作之后世界会如何反应。相较于生成式 AI 局限于数字世界的语言理解与内容生成，物理 AI 的工作空间在真实物理世界，核心能力涵盖感知、行动与控制，价值体现于工业控制、具身智能和无人驾驶等实体场景。

黄仁勋将 AI 技术演进总结为三代范式：从感知 AI 到生成式 AI，再到 Agentic AI，下一站将是物理 AI —— " 能够运行、推理、计划和行动的 AI"。

物理 AI 的模型能力亦经历三个阶段的演进。1.0 时代依赖硬编码规则，场景适应性差；2.0 时代转向数据驱动，依靠海量数据模仿学习，但缺乏对物理世界的真正理解；当前进入 3.0 推理驱动时代，以世界模型 +VLA+ 强化学习为核心，具备环境推理、因果理解与规划能力，支持复杂任务的闭环决策。

核心技术：世界模型与 VLA 尚未形成统一范式

浙商证券报告强调，当前物理 AI 的实现依赖世界模型与 VLA 两大核心组件，但两者均处于技术路线尚未收敛的阶段。

世界模型的原始概念来自强化学习领域，指 AI 智能体通过在内部构建外部世界表征，从而在 " 脑海中 " 预演行动方案。其核心价值在于，真实世界具有不可逆性，传统仿真也无法支持智能体进行 " 决策—观察结果 " 的反复试错循环，而世界模型则可构建无限逼近真实世界的虚拟环境，以更低成本、更安全的方式支撑 AI 训练。

谷歌 DeepMind CEO Demis Hassabis 在 2026 年 CNBC 开年采访中判断：AGI 还差一块拼图，可能正是世界模型。

目前，世界模型在学术领域形成四条主流技术路线：观测级生成式模型强在 " 逼真 "，以 Sora 为代表；潜在空间模型强在 " 效率 "，以 JEPA 系列为代表；强化学习导向模型强在 " 决策 "，以 Dreamer 系列为代表；以对象为中心的模型强在 " 可解释性 "，以 SlotFormer 为代表。李飞飞认为，世界模型需具备生成式、多模态、交互式三种能力。

VLA 模型（视觉—语言—动作模型）则通过端到端学习，在统一模型中将视觉和语言模态的任务语义映射到具体操作，省略手工设计规则与模块对接。自 2023 年谷歌 DeepMind 发布 RT-2 以来，VLA 研究进入新阶段，斯坦福于 2024 年发布首个开源 7B 参数通用机器人操控 VLA 模型 OpenVLA，英伟达于 2025 年发布面向通用人形机器人的开源 VLA 基础模型 GR00T N1。

三大落地场景：自动驾驶、具身智能与工业软件

自动驾驶是浙商证券认为最有望率先跑通物理 AI" 数据闭环 " 与 " 商业闭环 " 的场景。每年全球车辆累计行驶里程约 13 万亿英里，可持续采集的多模态真实数据、清晰的商业收费模式以及可规模化复制的产业链，为自动驾驶构建独特优势。

2026 年北京车展上，物理 AI 已成为隐形主线。自动驾驶解决方案商层面，小马智行 CTO 楼天城发布世界模型 2.0，核心突破在于赋予 AI 自我诊断与定向进化能力；Momenta 正式发布 R7 强化学习世界模型；轻舟智航宣布战略重心从 " 无人驾驶 " 全面升级为 " 通用物理 AI"。车企层面，小鹏计划将 2026 年物理 AI 相关研发投入提升至 70 亿元；吉利发布 WAM 世界行为模型，并宣布与英伟达在物理 AI 领域深度协同；奇瑞官宣与英伟达达成全球战略合作，聚焦辅助驾驶、座舱 AI 和机器人三大领域。

具身智能被浙商证券定义为物理 AI" 感知—理解—推理—行动 " 闭环的核心载体。物理 AI 技术栈的演进，正推动机器人从 " 刚性自动化 " 走向 " 真实自主 " ——相比传统机器人，物理 AI 赋能的机器人可处理不可预测和未知零部件，减少人工编码工作量，加快部署速度。

工业软件被定位为物理 AI 训练、验证、部署和运维的 " 控制台 "。报告认为，工业软件数据不可复制、安全合规要求高、云边端协同复杂，构成较强护城河，与物理 AI 之间呈互补共生、双向赋能关系：工业软件为物理 AI 提供物理底座、高质量数据与验证环境；物理 AI 则为工业软件提供智能加速、自动化决策与闭环优化能力。CAE 仿真、数字孪生、工业控制、工业 IoT、能源调度、EDA/CAD 均是主要受益场景。

宙世代

一起剪

相关标签