「阿里」迈进“物理世界”,首个具身大模型 Qwen-Robot 发布

（来源：即智 Ultra）

物理世界智能仍处于起步阶段。

6 月 16 日消息，「阿里巴巴」发布千问具身智能大模型 Qwen-Robot 系列，包含 VLA 操作模型 Qwen-RobotManip、VLN 移动模型 Qwen-RobotNav 和世界模型 Qwen-RobotWorld 三大模型。

其核心是突破 " 语言规划≠物理执行 " 的鸿沟，分别对齐语言与三类物理动作，同时支持上层智能体统一调度，形成 " 感知 - 规划 - 执行 - 验证 " 的闭环。让多模态大模型真正落地物理世界，三个模型既可独立部署，也能协同组成具身智能 " 通用底座 "。

开放式任务执行：Qwen-Omni 可随机生成任务并实时评判，Qwen-RobotManip 无需预定义任务列表即可即时执行；

长程操作与失败恢复：Qwen3.5 作为上层规划器，将复杂指令拆解为原子任务，下层 VLA 专注执行，遇到失败时动态调整子任务，大幅提升复杂场景成功率（如桌面清理任务）；

智能体导航与具身问答：结合导航模型可在真实建筑中完成 " 找可用卫生间 " 这类长程探索任务，能根据现场线索（如停用标识）动态重规划，返回实证支撑的结果，在多个具身问答基准上超过此前最优水平。

据悉，Qwen-Robot 是千问大模型从数字智能体→物理智能体的重要跨越，未来将搭载于更多形态机器人，使其在复杂现实环境中具备自主感知、决策与长程执行能力。

* 编者申明：本文部分内容来源网络，涉及观点仅供交流和分享。如有侵犯，请及时与我们联系。

宙世代