原标题:《中国具身智能公司千寻智能开源最新模型,超越 Pi0.5 登顶全球榜单》

1 月 12 日,在近期举行的 RoboChallenge 评测中,由中国具身智能公司千寻智能研发的具身智能模型 Spirit v1.5 获得综合排名第一。该模型在任务得分与成功率两个维度上均超过了此前的 Pi0.5 模型。

图:RoboChallenge 榜单截图
RoboChallenge 是由 Dexmal、Hugging Face 等机构于 2025 年联合发起的标准化评测体系,主要验证具身智能模型的跨平台能力,重点评估真实机器人在处理复杂指令理解、多步操作规划及跨场景执行时的稳定性。
RoboChallenge 的评分体系不仅关注任务完成度,还对模型的空间定位、遮挡处理、长时序稳定性以及面对新任务时的迁移效率进行评估,这对模型的泛化性和执行准确性提出了较高要求。
从评测结果来看,Spirit v1.5 在多项复杂任务中保持了较高的成功率,尤其在多任务连续执行、复杂指令拆解以及跨构型迁移等维度表现出稳定性。截止目前的评测周期,其综合得分位于榜单首位。
在公布成绩的同时,千寻智能同步开源了用于此次榜单测试的基础模型、模型权重及核心代码,以供公众与研究社区进行独立验证或基于此模型开展进一步研究。

图:英伟达机器人事业部总监兼杰出科学家 Jim Fan 点赞
据官方介绍,Spirit v1.5 采用了 Vision-Language-Action ( VLA ) 统一建模框架,可以将视觉感知、语言理解与动作生成整合在同一决策流中,以减少模块串联带来的信息损耗并提升长程任务中的整体稳定性。
在训练方法上,Spirit v1.5 调整了数据策略,未依赖高度筛选的 " 干净 " 演示数据,而是在预训练阶段引入了开放式、多样化的数据采集范式。这种方式不再严格限定任务脚本,而是以 " 完成有意义目标 " 为导向,允许在操作过程中自然串联多个子任务与原子技能,使模型在训练阶段接触到包括遮挡、失败恢复及自然过渡在内的接近真实世界的复杂性。
相关消融实验显示,在相同数据规模下,基于多样化数据预训练的模型在新任务上的迁移效率明显高于基于传统演示数据训练的模型,且达到相同性能所需的计算资源显著减少。这一结果也解释了 Spirit v1.5 在 RoboChallenge 多构型、未见任务评测中的表现。


登录后才可以发布评论哦
打开小程序可以发布评论哦