阿里发布Qwen-Robot系列具身智能大模型

在汽车产业加速向智能化、电动化转型的当下，具身智能（Embodied AI）正成为定义下一代智能终端的关键变量。盖世汽车获悉，阿里巴巴近日正式发布千问大模型家族首个完整的具身智能模型系列—— Qwen-Robot，以一套涵盖 " 手、脚、脑 " 的全栈技术矩阵，为包括车载机器人在内的各类智能体迈向规模化落地提供了坚实的技术支撑。

图片来源：千问大模型

此次发布的 Qwen-Robot 系列包含三大核心模型：专注于精细操作的视觉 - 语言 - 动作（VLA）模型 Qwen-RobotManip、负责空间理解与路径规划的视觉 - 语言 - 导航（VLN）模型 Qwen-RobotNav，以及构建环境认知的世界模型 Qwen-RobotWorld。这一组合被形象地比喻为给机器人装上了 " 灵巧的手 "、" 认路的脚 " 和 " 会思考的大脑 "。

从技术架构来看，Qwen-RobotManip 作为 VLA 操作模型，解决了传统机器人控制中任务泛化能力弱的痛点，能够理解自然语言指令并直接输出动作轨迹，极大提升了机械臂在非结构化环境下的操作上限。而 Qwen-RobotNav 则强化了移动机器人的空间感知与决策闭环能力，这对于厂区物流 AGV 及未来具备自动驾驶能力的移动空间至关重要。

尤为值得一提的是 Qwen-RobotWorld 世界模型，它通过对物理世界的建模与仿真，赋予了机器人预测环境变化的能力，是实现高阶自动驾驶仿真测试和机器人自主学习的关键基础设施。

宙世代

一起剪

相关标签