驱动之家 05-13
小米自动驾驶模型Xiaomi OneVL开源:业内率先统一VLA、世界模型路线
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 5 月 13 日消息,今日,小米正式发布并开源 Xiaomi OneVL 自动驾驶模型。

该模型在业内率先实现 VLA、世界模型、潜空间推理等多个技术路线的统一,在具备 XLA 模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案。

其在精度上超越显式 CoT、在速度上对齐 " 仅答案 " 预测的潜空间 CoT 方案。

过去,VLA 和世界模型是自动驾驶领域两条相对独立的技术路线:VLA 专注于理解场景并输出驾驶动作,世界模型专注于预测未来场景的演变。

Xiaomi   OneVL 通过潜空间推理,首次将两者统一到同一套框架中。

在涵盖感知、推理与规划的多个主流基准上,Xiaomi OneVL 全面刷新潜在推理方法的性能上限:

在 ROADWork、Impromptu、Alpamayo-R1 三项基准上均达到 SOTA,并在 NAVSIM 上取得优越性能,PDM-score 达到 88.84,首次在潜空间推理中超越显式 CoT(88.29);

目前唯一在所有基准上超越显式自回归 CoT 的隐式推理方法;

挂载 MLP 回归头变体,延迟进一步压到 0.24s ( 4.16 Hz ) ,仅为 VLA 自回归推理的 5.4%,为量产车端实时部署提供了可行路径。

消融实验进一步验证,压缩物理世界的动态信息能带来显著的性能提升。

同时,Xiaomi OneVL 能为模型决策提供语言和视觉双维度的可解释性——既能用文字说明 " 为什么这样开 ",也能用预测画面展示 " 接下来会发生什么 "。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

自动驾驶 开源 小米 中超
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论