物理 AI 正从概念走向产业现实。浙商证券在最新发布的行业深度报告中指出,继感知 AI、生成式 AI、Agentic AI 之后,物理 AI 将成为 AI 技术演进的下一站——其核心在于让模型理解并预测真实世界状态,从而驱动自动驾驶、具身智能和工业软件等场景的深度变革。
在市场规模上,Coatue Management 预计物理 AI 市场规模至少可达 6 万亿美元,较数字 AI 高出约 50%。英伟达 CEO 黄仁勋在 2026 年 CES 上表示,物理 AI 可重塑价值约 50 万亿美元的制造和物流产业。与此同时,顶尖学者与科技巨头正密集入场:图灵奖得主杨立昆成立的 AMI Labs 完成 10.3 亿美元种子轮融资;AI 教母李飞飞联合创立的 World Labs 完成 10 亿美元新一轮融资,成立不到两年估值突破 50 亿美元;英伟达则宣布下一代芯片 Feynman 专为物理 AI 设计,预计 2028 年发布。
浙商证券认为,当前物理 AI 尚无固定实现范式,需由世界模型与 VLA(视觉—语言—动作模型)共同支撑。自动驾驶、具身智能和工业软件构成物理 AI 最核心的三大落地场景,其中自动驾驶有望率先跑通 " 数据闭环 " 与 " 商业闭环 "。报告建议重点关注具备世界模型能力的公司,以及上述三大场景中的软硬件标的。
技术定义:从生成式 AI 到物理 AI 的范式跃迁
浙商证券报告指出,物理 AI 是可以理解真实世界的 AI 系统,需要回答两个核心问题:世界接下来如何变化,以及实体发生动作之后世界会如何反应。相较于生成式 AI 局限于数字世界的语言理解与内容生成,物理 AI 的工作空间在真实物理世界,核心能力涵盖感知、行动与控制,价值体现于工业控制、具身智能和无人驾驶等实体场景。

黄仁勋将 AI 技术演进总结为三代范式:从感知 AI 到生成式 AI,再到 Agentic AI,下一站将是物理 AI —— " 能够运行、推理、计划和行动的 AI"。
物理 AI 的模型能力亦经历三个阶段的演进。1.0 时代依赖硬编码规则,场景适应性差;2.0 时代转向数据驱动,依靠海量数据模仿学习,但缺乏对物理世界的真正理解;当前进入 3.0 推理驱动时代,以世界模型 +VLA+ 强化学习为核心,具备环境推理、因果理解与规划能力,支持复杂任务的闭环决策。

核心技术:世界模型与 VLA 尚未形成统一范式
浙商证券报告强调,当前物理 AI 的实现依赖世界模型与 VLA 两大核心组件,但两者均处于技术路线尚未收敛的阶段。
世界模型的原始概念来自强化学习领域,指 AI 智能体通过在内部构建外部世界表征,从而在 " 脑海中 " 预演行动方案。其核心价值在于,真实世界具有不可逆性,传统仿真也无法支持智能体进行 " 决策—观察结果 " 的反复试错循环,而世界模型则可构建无限逼近真实世界的虚拟环境,以更低成本、更安全的方式支撑 AI 训练。
谷歌 DeepMind CEO Demis Hassabis 在 2026 年 CNBC 开年采访中判断:AGI 还差一块拼图,可能正是世界模型。
目前,世界模型在学术领域形成四条主流技术路线:观测级生成式模型强在 " 逼真 ",以 Sora 为代表;潜在空间模型强在 " 效率 ",以 JEPA 系列为代表;强化学习导向模型强在 " 决策 ",以 Dreamer 系列为代表;以对象为中心的模型强在 " 可解释性 ",以 SlotFormer 为代表。李飞飞认为,世界模型需具备生成式、多模态、交互式三种能力。
VLA 模型(视觉—语言—动作模型)则通过端到端学习,在统一模型中将视觉和语言模态的任务语义映射到具体操作,省略手工设计规则与模块对接。自 2023 年谷歌 DeepMind 发布 RT-2 以来,VLA 研究进入新阶段,斯坦福于 2024 年发布首个开源 7B 参数通用机器人操控 VLA 模型 OpenVLA,英伟达于 2025 年发布面向通用人形机器人的开源 VLA 基础模型 GR00T N1。

三大落地场景:自动驾驶、具身智能与工业软件
自动驾驶是浙商证券认为最有望率先跑通物理 AI" 数据闭环 " 与 " 商业闭环 " 的场景。每年全球车辆累计行驶里程约 13 万亿英里,可持续采集的多模态真实数据、清晰的商业收费模式以及可规模化复制的产业链,为自动驾驶构建独特优势。

2026 年北京车展上,物理 AI 已成为隐形主线。自动驾驶解决方案商层面,小马智行 CTO 楼天城发布世界模型 2.0,核心突破在于赋予 AI 自我诊断与定向进化能力;Momenta 正式发布 R7 强化学习世界模型;轻舟智航宣布战略重心从 " 无人驾驶 " 全面升级为 " 通用物理 AI"。车企层面,小鹏计划将 2026 年物理 AI 相关研发投入提升至 70 亿元;吉利发布 WAM 世界行为模型,并宣布与英伟达在物理 AI 领域深度协同;奇瑞官宣与英伟达达成全球战略合作,聚焦辅助驾驶、座舱 AI 和机器人三大领域。
具身智能被浙商证券定义为物理 AI" 感知—理解—推理—行动 " 闭环的核心载体。物理 AI 技术栈的演进,正推动机器人从 " 刚性自动化 " 走向 " 真实自主 " ——相比传统机器人,物理 AI 赋能的机器人可处理不可预测和未知零部件,减少人工编码工作量,加快部署速度。

工业软件被定位为物理 AI 训练、验证、部署和运维的 " 控制台 "。报告认为,工业软件数据不可复制、安全合规要求高、云边端协同复杂,构成较强护城河,与物理 AI 之间呈互补共生、双向赋能关系:工业软件为物理 AI 提供物理底座、高质量数据与验证环境;物理 AI 则为工业软件提供智能加速、自动化决策与闭环优化能力。CAE 仿真、数字孪生、工业控制、工业 IoT、能源调度、EDA/CAD 均是主要受益场景。



登录后才可以发布评论哦
打开小程序可以发布评论哦