英伟达于 6 月 1 日正式推出 Alpamayo2Super,一款拥有 320 亿参数的视觉 - 语言 - 动作(VLA)开源推理模型,用于支持 L4 级自动驾驶出租车的研发。该模型属于 Alpamayo 系列,具备感知、推理与行动能力,并强调可解释性以满足安全验证和合规监管要求。 Alpamayo2Super 参数规模较前代 100 亿参数版本提升至 3 倍,基于英伟达 Cosmos 构建,在长尾场景下的逻辑推理、三维空间感知与轨迹预测能力显著增强。模型支持全车环视 360 度环境感知,覆盖前后及侧方视野,提升变道、并线、路口通行等操作的安全性;新增元动作输出能力,可预判礼让、变道、停车等高层级驾驶行为;同时具备推理式自动标注与二维目标定位功能,将标注周期从数月缩短至数日。 该模型还优化了因果链溯源与轨迹生成质量,适用于传统模仿学习难以应对的罕见及复杂场景。作为教师模型,Alpamayo2Super 可通过知识蒸馏压缩为轻量化模型,部署于英伟达 DRIVEAGXThor 车载芯片上。 伴随模型发布,英伟达同步推出多项工具与能力:NVIDIAAlpaGym 为开源闭环强化学习平台,可在仿真环境中实现 " 决策 - 感知 " 持续循环训练;NVIDIAOmniDreams 可生成逼真且多样化的长尾驾驶场景;NVIDIAOmniverseNuRec 提供神经重建能力,基于真实车队数据批量生成合成训练数据。此外,英伟达在 GitHub 开源了因果链自动标注流程,支持从原始行车视频自动生成带因果关联的标注数据。 Alpamayo 系列模型自发布以来下载量已接近 40 万次,并获台北国际电脑展(COMPUTEX)车载技术与智能座舱类最佳选择奖。Alpamayo2Super 的推理代码预计于今年夏季上线 GitHub,模型权重将同步发布于 HuggingFace 平台。 目前,比亚迪、吉利、极氪、小米及小马智行等中国车企与自动驾驶公司已采用或正在基于 NVIDIAHyperion 平台开发智能驾驶系统。


登录后才可以发布评论哦
打开小程序可以发布评论哦