小米发布并开源自动驾驶模型 Xiaomi OneVL，统一 VLA 与世界模型框架

小米于 5 月 13 日正式发布并开源自动驾驶模型 XiaomiOneVL，该模型采用一步式潜空间语言视觉推理框架。小米创始人、董事长兼 CEO 雷军表示，XiaomiOneVL 在业内首次通过潜空间推理，将视觉语言动作模型（VLA）与世界模型整合至同一套框架中。该模型在推理、规划等多个主流基准测试中，刷新了潜空间推理方法的性能上限。据官方介绍，XiaomiOneVL 在融合 XLA 模型强大推理能力的基础上，显著提升了推理速度与精度。其潜空间推理方案在精度上优于显式思维链（CoT）方法，在速度上与 " 仅答案 " 预测的潜空间 CoT 方案相当。小米已全面开源 XiaomiOneVL 的模型权重及训练、推理代码，并开放技术报告、项目主页和代码仓库供全球开发者与研究人员使用。