车东西 08-27
元戎启行周光:必须让AI学会害怕!VLA模型已获5款车型定点
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

VLA 玩家新增一员,表现已超过端到端上限。

作者 |  张睿

编辑 |  志豪

VLA 模型领域又来了一位新玩家。

车东西 8 月 27 日消息,日前,元戎启行发布了全新一代辅助驾驶平台—— DeepRoute IO 2.0。

▲元戎启行发布 DeepRoute IO 2.0

该平台搭载元戎启行自研的 VLA(Vision-Language-Action,视觉 - 语言 - 动作)模型,融合视觉感知、语义理解与动作决策三大能力,对比传统端到端模型,VLA 模型更擅长应对复杂路况。

▲ VLA(Vision-Language-Action)模型

据介绍,元戎启行 DeepRoute IO 2.0 平台以 " 多模态 + 多芯片 + 多车型 " 适配为核心设计理念,支持激光雷达与纯视觉版本,可面向多种主流乘用车平台开展定制化部署。

元戎启行方面表示,截至目前基于 DeepRoute IO 2.0 平台已达成 5 个车型的定点合作项目,首批量产车也即将进入市场。

元戎启行 CEO 周光表示,"VLA 模型融合了语言模型,具备强大的思维链能力,能摆脱传统端到端模型的黑盒难题,并将信息串联、分析,从而推理出因果关系。此外,它天然集成海量知识库,泛化能力更强,能够更好地适应复杂多变的真实道路环境。"

另外,周光还表示,VLA 模型的表现目前处于持续提升阶段,但 VLA 模型的下限已超过端到端上限,未来会越来越好。

01.

VLA 模型带来 4 大功能 支持防御性驾驶策略

在此次发布会上,元戎启行展示了其 VLA 模型的 4 大功能:空间语义理解、异形障碍物识别、文字类引导牌理解、记忆语音控车。

▲元戎启行 DeepRoute IO 2.0 平台 4 大功能

空间语义理解是元戎启行 VLA 模型的重点能力。该功能可在视野受限的动态或静态盲区环境中(如公交车遮挡、复杂路口、桥洞等)感知潜在风险,主动对盲区进行 " 预防性预判 "。

▲ DeepRoute IO 2.0 系统空间语义理解能力

系统可在风险出现前提前减速、稳妥通行,具备拟人化的防御性驾驶策略。周光表示:" 必须让 AI 学会害怕,这才是对安全真正的重视。"

▲ DeepRoute IO 2.0 系统具备防御性驾驶策略

其余三项能力分别是:异形障碍物识别使系统能够识别并应对如施工锥桶、超载小货车等非结构化障碍;文字类引导牌识别让系统 " 看懂路标 ",可解析潮汐车道、公交专用道等文字信息;记忆语音控车功能支持自然语言指令交互,并逐步学习用户偏好。

▲ DeepRoute IO 2.0 系统异形障碍物识别能力

此外,元戎启行方面表示,其城市领航辅助系统总计已获得超过 10 款车型的定点合作,并已经有近 10 万辆量产车型交付,包括 SUV、MPV、越野车等多个车型。

▲元戎启行已交付近 10 万辆具备城市领航辅助系统车型

02.

VLA 模型幻觉现象已经很少 将拓展至人形机器人

在发布会后,元戎启行 CEO 周光接受了车东西在内媒体的采访,回答了有关 VLA 模型等方面的问题,以下是部分重点问题的整理,在不改变原意的情况下有删减。

▲元戎启行 CEO 周光

1、激光雷达短期仍有其价值

关于特斯拉 CEO 马斯克提到的 " 激光雷达会让自动驾驶越来越不安全 " 的观点,周光表示他认为激光雷达目前对通用障碍物识别仍有重要作用,大模型的知识库能力可以识别很多未知障碍物。

周光相信随着大模型技术的发展,视觉会在感知中扮演越来越重要的角色。短期来看,激光雷达受限于技术发展和数据集的成熟度,仍有其价值,而长期来看,大模型有望逐步解决现在依赖激光雷达的部分任务。

2、VLA 模型的研发和训练本身与芯片无关

关于元戎启行 VLA 模型针对不同芯片平台,在算法和训练上做了哪些优化,周光表示 VLA 模型的研发和训练本身与芯片无关,训练完成后才会进行部署适配,不同芯片平台主要影响的是工程部署的工作量,并不会改变训练方式或模型架构。

3、VLA 模型幻觉现象已经很少

关于 VLA 模型是否也会出现 " 幻觉 ",周光表示预训练阶段确实可能产生幻觉,但通过后训练对齐技术,已经能极大抑制这一现象。现在主流大模型(如豆包、千问)幻觉现象已经很少,这方面已有较好的解决方案。

4、VLA 模型将拓展至人形机器人

关于 VLA 模型是否会拓展至人形机器人,车用和机器人用的 VLA 模型是否是同一套,周光表示 VLA 模型本身是通用架构,不再为特定场景定制。元戎启行年初发布的 RoadAGI 策略时就表示,未来这一技术可泛化至多种移动场景,包括小区、电梯、办公室等室内外环境。

周光还提到现在很多机器人还依赖遥控或巡线技术,而元戎启行希望能实现真正自主、通用的移动能力。

5、出海的关键在于合规

关于元戎启行在出海方面计划和 VLA 模型对出海的帮助,周光表示出海的关键在于合规,而随着 AI 模型正越来越通用化,互联网数据训练的基础模型已具备较强泛化能力,不存在 " 中国模型只懂中国 " 的说法。

03.

结语:元戎启行加速 VLA 模型上车

在发布会上,周光总结道:"10 万是一个起点,随着高阶辅助驾驶市场的加速打开,我们相信,像元戎启行这样具备核心技术能力的公司将迎来更大的市场空间。"

未来,元戎启行表示将围绕 VLA 模型持续拓展应用边界,在乘用车市场加速量产部署的同时,推进基于量产车平台的 Robotaxi 业务。

另外,元戎启行希望 VLA 模型在更多可移动智能体上延展复用,逐步实现从单点功能到通用智能体的系统演进。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 元戎启行 周光 异形 激光雷达
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论