VLA 玩家新增一员,表现已超过端到端上限。
作者 | 张睿
编辑 | 志豪
VLA 模型领域又来了一位新玩家。
车东西 8 月 27 日消息,日前,元戎启行发布了全新一代辅助驾驶平台—— DeepRoute IO 2.0。
▲元戎启行发布 DeepRoute IO 2.0
该平台搭载元戎启行自研的 VLA(Vision-Language-Action,视觉 - 语言 - 动作)模型,融合视觉感知、语义理解与动作决策三大能力,对比传统端到端模型,VLA 模型更擅长应对复杂路况。
▲ VLA(Vision-Language-Action)模型
据介绍,元戎启行 DeepRoute IO 2.0 平台以 " 多模态 + 多芯片 + 多车型 " 适配为核心设计理念,支持激光雷达与纯视觉版本,可面向多种主流乘用车平台开展定制化部署。
元戎启行方面表示,截至目前基于 DeepRoute IO 2.0 平台已达成 5 个车型的定点合作项目,首批量产车也即将进入市场。
元戎启行 CEO 周光表示,"VLA 模型融合了语言模型,具备强大的思维链能力,能摆脱传统端到端模型的黑盒难题,并将信息串联、分析,从而推理出因果关系。此外,它天然集成海量知识库,泛化能力更强,能够更好地适应复杂多变的真实道路环境。"
另外,周光还表示,VLA 模型的表现目前处于持续提升阶段,但 VLA 模型的下限已超过端到端上限,未来会越来越好。
01.
VLA 模型带来 4 大功能 支持防御性驾驶策略
在此次发布会上,元戎启行展示了其 VLA 模型的 4 大功能:空间语义理解、异形障碍物识别、文字类引导牌理解、记忆语音控车。
▲元戎启行 DeepRoute IO 2.0 平台 4 大功能
空间语义理解是元戎启行 VLA 模型的重点能力。该功能可在视野受限的动态或静态盲区环境中(如公交车遮挡、复杂路口、桥洞等)感知潜在风险,主动对盲区进行 " 预防性预判 "。
▲ DeepRoute IO 2.0 系统空间语义理解能力
系统可在风险出现前提前减速、稳妥通行,具备拟人化的防御性驾驶策略。周光表示:" 必须让 AI 学会害怕,这才是对安全真正的重视。"
▲ DeepRoute IO 2.0 系统具备防御性驾驶策略
其余三项能力分别是:异形障碍物识别使系统能够识别并应对如施工锥桶、超载小货车等非结构化障碍;文字类引导牌识别让系统 " 看懂路标 ",可解析潮汐车道、公交专用道等文字信息;记忆语音控车功能支持自然语言指令交互,并逐步学习用户偏好。
▲ DeepRoute IO 2.0 系统异形障碍物识别能力
此外,元戎启行方面表示,其城市领航辅助系统总计已获得超过 10 款车型的定点合作,并已经有近 10 万辆量产车型交付,包括 SUV、MPV、越野车等多个车型。
▲元戎启行已交付近 10 万辆具备城市领航辅助系统车型
02.
VLA 模型幻觉现象已经很少 将拓展至人形机器人
在发布会后,元戎启行 CEO 周光接受了车东西在内媒体的采访,回答了有关 VLA 模型等方面的问题,以下是部分重点问题的整理,在不改变原意的情况下有删减。
▲元戎启行 CEO 周光
1、激光雷达短期仍有其价值
关于特斯拉 CEO 马斯克提到的 " 激光雷达会让自动驾驶越来越不安全 " 的观点,周光表示他认为激光雷达目前对通用障碍物识别仍有重要作用,大模型的知识库能力可以识别很多未知障碍物。
周光相信随着大模型技术的发展,视觉会在感知中扮演越来越重要的角色。短期来看,激光雷达受限于技术发展和数据集的成熟度,仍有其价值,而长期来看,大模型有望逐步解决现在依赖激光雷达的部分任务。
2、VLA 模型的研发和训练本身与芯片无关
关于元戎启行 VLA 模型针对不同芯片平台,在算法和训练上做了哪些优化,周光表示 VLA 模型的研发和训练本身与芯片无关,训练完成后才会进行部署适配,不同芯片平台主要影响的是工程部署的工作量,并不会改变训练方式或模型架构。
3、VLA 模型幻觉现象已经很少
关于 VLA 模型是否也会出现 " 幻觉 ",周光表示预训练阶段确实可能产生幻觉,但通过后训练对齐技术,已经能极大抑制这一现象。现在主流大模型(如豆包、千问)幻觉现象已经很少,这方面已有较好的解决方案。
4、VLA 模型将拓展至人形机器人
关于 VLA 模型是否会拓展至人形机器人,车用和机器人用的 VLA 模型是否是同一套,周光表示 VLA 模型本身是通用架构,不再为特定场景定制。元戎启行年初发布的 RoadAGI 策略时就表示,未来这一技术可泛化至多种移动场景,包括小区、电梯、办公室等室内外环境。
周光还提到现在很多机器人还依赖遥控或巡线技术,而元戎启行希望能实现真正自主、通用的移动能力。
5、出海的关键在于合规
关于元戎启行在出海方面计划和 VLA 模型对出海的帮助,周光表示出海的关键在于合规,而随着 AI 模型正越来越通用化,互联网数据训练的基础模型已具备较强泛化能力,不存在 " 中国模型只懂中国 " 的说法。
03.
结语:元戎启行加速 VLA 模型上车
在发布会上,周光总结道:"10 万是一个起点,随着高阶辅助驾驶市场的加速打开,我们相信,像元戎启行这样具备核心技术能力的公司将迎来更大的市场空间。"
未来,元戎启行表示将围绕 VLA 模型持续拓展应用边界,在乘用车市场加速量产部署的同时,推进基于量产车平台的 Robotaxi 业务。
另外,元戎启行希望 VLA 模型在更多可移动智能体上延展复用,逐步实现从单点功能到通用智能体的系统演进。
登录后才可以发布评论哦
打开小程序可以发布评论哦