(来源:即智 Ultra)

物理世界智能仍处于起步阶段。
6 月 16 日消息,「阿里巴巴」发布千问具身智能大模型 Qwen-Robot 系列,包含 VLA 操作模型 Qwen-RobotManip、VLN 移动模型 Qwen-RobotNav 和世界模型 Qwen-RobotWorld 三大模型。

其核心是突破 " 语言规划≠物理执行 " 的鸿沟,分别对齐语言与三类物理动作,同时支持上层智能体统一调度,形成 " 感知 - 规划 - 执行 - 验证 " 的闭环。让多模态大模型真正落地物理世界,三个模型既可独立部署,也能协同组成具身智能 " 通用底座 "。
开放式任务执行:Qwen-Omni 可随机生成任务并实时评判,Qwen-RobotManip 无需预定义任务列表即可即时执行;
长程操作与失败恢复:Qwen3.5 作为上层规划器,将复杂指令拆解为原子任务,下层 VLA 专注执行,遇到失败时动态调整子任务,大幅提升复杂场景成功率(如桌面清理任务);
智能体导航与具身问答:结合导航模型可在真实建筑中完成 " 找可用卫生间 " 这类长程探索任务,能根据现场线索(如停用标识)动态重规划,返回实证支撑的结果,在多个具身问答基准上超过此前最优水平。
据悉,Qwen-Robot 是千问大模型从数字智能体→物理智能体的重要跨越,未来将搭载于更多形态机器人,使其在复杂现实环境中具备自主感知、决策与长程执行能力。


* 编者申明:本文部分内容来源网络,涉及观点仅供交流和分享。如有侵犯,请及时与我们联系。


登录后才可以发布评论哦
打开小程序可以发布评论哦