网通社快报 6 月 1 日,英伟达在 GTC 台北大会正式发布面向 L4 级自动驾驶出租车研发的开源视觉 - 语言 - 动作(VLA)推理模型 Alpamayo 2 Super。该模型参数规模达 320 亿,较前代 100 亿参数版本提升 3 倍,基于 Cosmos 世界基础模型构建,具备感知、推理与行动能力,其推理代码将于今年夏季在 GitHub 开放,模型权重同步发布于 Hugging Face 平台。

Alpamayo 2 Super 针对长尾场景逻辑推理、三维空间感知及轨迹预测能力进行增强,支持全车环视 360 度环境感知,覆盖前后及侧方视野。模型新增元动作输出能力,可预判礼让、变道、停车等高层级驾驶行为,并提供可解释决策依据以满足安全验证和合规监管要求。作为教师模型,Alpamayo 2 Super 可通过知识蒸馏压缩为轻量化模型,部署于 DRIVE AGX Thor 车载芯片及 DRIVE Hyperion 系统,解决传统模仿学习难以应对罕见复杂场景的问题。
配套工具链方面,英伟达同步推出开源闭环强化学习框架 AlpaGym,支持在仿真环境中实现决策与感知的持续循环训练。OmniDreams 角色模型基于 Cosmos 构建,可大规模生成逼真且多样化的长尾驾驶场景数据。Omniverse NuRec 神经重建函数库能在单块 GPU 上以 25ms 以内的速度完成真实世界重建与渲染,帮助开发者实时评估模型感知效果。CoC 因果链自动标注管道已在 GitHub 开源,可将数据标注周期从数月缩短至数日。
目前比亚迪、吉利、极氪、小米及小马智行等企业已采用或正在基于 NVIDIA DRIVE Hyperion 平台开发智能驾驶系统。富士康计划于 2028 年在高雄落地相关项目,VinFast 在东南亚、优步在慕尼黑及沙特 HUMAIN 也正基于该平台推进 L4 级自动驾驶出租车规模化部署。英伟达创始人兼 CEO 黄仁勋表示,这是汽车安全推理的转折点,Alpamayo 系列模型自发布以来下载量已接近 40 万次。
此次发布的模型与工具构建了从数据采集、训练到部署的全流程支持体系,通过开源策略降低了 L4 级自动驾驶系统的研发门槛,为车载算力平台提供了标准化的软件栈参考。


登录后才可以发布评论哦
打开小程序可以发布评论哦