网通社汽车频道 05-13
小米开源XiaomiOneVL框架,统一VLA与世界模型实现自动驾驶推理速度与精度突破
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

5 月 13 日,小米正式发布并开源 XiaomiOneVL 一步式潜空间语言视觉推理框架。该框架首次将视觉语言动作(VLA)、世界模型和潜空间推理等技术路线统一于同一架构中,在自动驾驶领域的感知、推理与规划任务中实现性能提升。XiaomiOneVL 在 ROADWork、Impromptu 和 Alpamayo-R1 三项主流基准上达到当前最优(SOTA)水平,并在 NAVSIM 基准上表现优异。其推理精度超越显式思维链(CoT)方法,推理速度与 " 仅答案 " 预测的潜空间 CoT 方案相当。该框架支持语言与视觉双维度可解释性,可同时以文字说明决策原因并以预测画面展示未来场景。小米已开源 XiaomiOneVL 的模型权重、训练与推理代码,并公开技术报告及项目主页供业界使用。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

开源 小米 自动驾驶
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论