网通社汽车频道 前天
小米发布并开源自动驾驶模型 Xiaomi OneVL,统一 VLA 与世界模型框架
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

小米于 5 月 13 日正式发布并开源自动驾驶模型 XiaomiOneVL,该模型采用一步式潜空间语言视觉推理框架。小米创始人、董事长兼 CEO 雷军表示,XiaomiOneVL 在业内首次通过潜空间推理,将视觉语言动作模型(VLA)与世界模型整合至同一套框架中。该模型在推理、规划等多个主流基准测试中,刷新了潜空间推理方法的性能上限。 据官方介绍,XiaomiOneVL 在融合 XLA 模型强大推理能力的基础上,显著提升了推理速度与精度。其潜空间推理方案在精度上优于显式思维链(CoT)方法,在速度上与 " 仅答案 " 预测的潜空间 CoT 方案相当。小米已全面开源 XiaomiOneVL 的模型权重及训练、推理代码,并开放技术报告、项目主页和代码仓库供全球开发者与研究人员使用。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

小米 开源 自动驾驶 创始人 雷军
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论