手机中国 6小时前
首次!小米汽车发布Xiaomi Auto World Model全新框架
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【CNMO 科技消息】5 月 26 日,小米汽车正式发布 Xiaomi Auto World Model 全新框架,为业界辅助驾驶世界模型提供了新的框架路径,推动行业从 " 场景感知 " 向 " 认知推演、场景进化 " 的高阶形态跃迁。

小米汽车

该框架是小米首次将三维重建与视频生成深度耦合的一体化架构,以 " 重建锚定几何、生成填补想象 " 的新范式,打破行业长期采用的重建与生成分离的技术路线。在 Waymo、nuScenes 等主流基准测试中全面取得 SOTA,并已在小米汽车合成数据、仿真测试、智能座舱三大核心场景完成业务落地。

CNMO 科技注意到,该框架将重建模块(WorldRec)与生成模块(WorldGen)深度耦合。WorldRec 通过稀疏三维锚点表征,高效构建精确的 3D 场景几何;WorldGen 则在重建约束下补全未观测区域和未来帧,支持最长 1 分钟的视频生成。两者互相增益,实现了高稳定性、高一致性、高真实性的协同效果。

在重建领域,WorldRec 在公开的 Waymo 数据集上全面领先此前 SOTA 方法 DGGT,PSNR 达到 28.48,超出约 1 个点;在 nuScenes 零样本泛化测试中依然保持领先,对新场景适应能力强。在生成领域,WorldGen 在 H20 GPU 上单视角生成速度达 0.19 秒 / 帧,三视角为 0.46 秒 / 帧,比同为自回归方法的 Epona(1.06 秒 / 帧)快 5.6 倍。支持高达 81 帧连续生成(10Hz/30Hz,最长 1 分钟),而大多数公开基线仅能生成 8-16 帧。在 nuScenes 数据集上,WorldGen 取得 FVD 64.97 和 FID 7.04 的成绩,FVD 指标超越了所有对比的同类模型。

值得一提的是,Xiaomi Auto World Model 已在小米汽车三大实际场景中落地:

合成数据生成:已交付超过 10 万 clips 高质量合成数据,直接用于感知模型训练,提升车辆在危险场景下的识别能力。

仿真测试:构建闭环仿真环境,优化测试效率,可在仿真中复现真实事故进行定向优化。

辅助驾驶学堂:利用世界模型动态生成第一人称驾驶教学视频,目前已上线小米全车型的辅助驾驶学堂 - 实景模拟场景。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

小米汽车 waymo 小米 教学 事故
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论