雷锋网新智驾 04-28
智能驾驶开「卷」端到端,谁能摘到皇冠上的明珠?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

北京车展仍在继续。

和 2023 年的上海、广州车展一样,智能驾驶依旧是这次车展绕不开的主题,但同时市场也在迅速变化,技术迭代的速度正超乎所有人的意料。

" 从去年的上海车展到今年的北京车展,智能驾驶的发展突飞猛进,连我自己都被惊讶到。"

理想汽车智能驾驶副总裁朗咸朋博士在北京车展期间地平线的生态圆桌论坛上讲道," 去年大家还在讲高速 NOA、讲 Transformer 和 BEV,今年行业却已对城市 NOA 司空见惯,几乎都在讲无图方案和端到端。"

一个更明显的变化是,智能驾驶的核心正回归至消费者本质——更好用、更拟人、更安全,为了提高 L2+ 级智能驾驶功能的市场渗透率,如今行业关于城区 NOA 的规模化较量,正从比拼开城速度转向比拼日活。

而日活,将成为衡量城区 NOA 是否好用的关键指标,消费者对于智驾功能的实际体验评价、喜好也正被各车企放至愈加重要的位置。

然而一个问题是,从实际体验来看,城区 NOA 目前尚未达到用户眼中 " 可用 " 标准,距离 " 爱用 " 更是相距甚远。

" 城区 NOA 真正做到让消费者愿意用是很难的。目前城区 NOA 的激活时间其实还是非常低的。" 元戎启行 CEO 周光则如此表示," 就算是愿意用了,但很多时候,这些功能给消费者带来的是惊吓,而不是惊喜。可能一次(不顺利的体验)就会让消费者戒掉。"

从 " 可用 " 到 " 好用 ",高阶智驾的路还要走多久?如今众多车企与 Tier1 们几乎无人不谈的端到端会是这个转折点的答案吗?端到端量产落地的最佳解法又会是什么?

高阶智驾 " 开城大战 " 内卷加速:用户体验仍是 " 痛点 "

各家车企关于高阶智驾 " 开城大战 " 的火药味一路蔓延到了北京车展中。

" 城市 NOA 在全国都能开我们肯定是第一,我们的目标是到今年年内,在国内大部分地区甚至小区内都可以开。" 小鹏汽车 CEO 何小鹏在北京车展接受新智驾等媒体采访时如此表示。

小米汽车首次参展即虹吸巨大流量,雷军在车展上自信喊话," 小米 SU7 的高速 NOA 绝对可以媲美华为、小鹏。" 同时雷军还宣布,小米 SU7 的城市 NOA 将会在 5 月份开始推送。

与此同时,仰望汽车的仰望 U7 将在今年第三季度开通城市领航功能、魏牌的蓝山智驾版将在 5 月进行大规模 NOA 试驾体验、极越汽车计划在今年实现城市 NOA 覆盖全国 ......

从时间节点看,国内一众新能源品牌正在进入高阶智驾 " 全国都能开 "" 有路就能开 " 的规模化量产新阶段。

然而实际上,这两年车企在大规模落地高阶智能驾驶方案时却遇到了不小的挑战。

在中高阶智驾方案,由于技术的不成熟,本应给消费者带来极致体验的功能却无法发挥出应有的效果,从而吸引消费者买单。

麦肯锡在《2024 麦肯锡中国汽车消费者洞察》报告中指出,消费者对各类自动驾驶功能的兴趣正在提升,但愿意为之额外付费的意愿却在下降;其中一线城市的付费意愿下降尤为明显。

事实上,虽然目前城区 NOA 功能上车已久,各家车企对城区 NOA 功能的落地和推广也都相当看重,但从市场反馈的情况来看,大多数车企的城市 NOA 仍处于起步阶段,尚且无法满足用户的智驾需求,要么适用场景有限,要么驾驶体验不佳,难以称得上好用。

地平线就在这次的北京车展上指出,智驾系统将经历从可用、好用到爱用的三个发展阶段

•可用:以满足物理指标为目标,聚焦场景通过率、通勤效率等物理指标,但在体验上要么 " 怂 " 要么 " 莽 ",只能达到 " 可用 " 的标准。

•好用:在物理指标基础上,以达到拟人化体验为目标,聚焦实现更优雅从容随时可激活的体验,达到用户心中 " 好用 " 的标准,真正改变消费者的认知。

•爱用:以达到智驾平权为目标,聚焦通过极致的应用和量产效率,让高阶智驾体验人人可及,真正让每个消费者 " 爱用 "。

而当下量产的以城区 NOA 为代表的高阶智驾系统尚未充分达到用户眼中的 " 可用 " 状态,城市 NOA 目前的 " 怂 "" 莽 "" 急 "" 贵 " 四大问题成为阻碍消费者为之付费的关键因素:

1. 怂:拥堵更添堵,导致体验接管;

2. 莽:抢行太莽撞,导致安全接管;

3. 急:为快速开城,系统可用性下降;

4. 贵:不利于功能普惠与大规模市场落地。

以 MPI 为例,目前用户在开启城区 NOA 功能时,基本几十公里就得人工接管一次,离达到 " 轻松好用 " 相去甚远,以路口转弯这类典型高频场景为例,目前用户在开启城区 NOA 功能时,通常都会因为系统 fullstop 或轨迹生硬而选择接管,离达到 " 轻松好用 " 相去甚远。

用户体验不佳,再加上成本过高、全场景 NOA 受高精地图覆盖限制,城区 NOA 功能仅能在有限的、少数高线城市开通,且过于激进的去高精地图也一定程度带来了系统性能下降,经常随机出现各种退功能问题,使得这些功能的实际用户使用频率并不高,从而进一步造成功能迭代开发难度大、周期长的问题。

要想进一步提高智能驾驶的市场渗透率,2024 年,智驾功能的改善和迭代必须转向实用与场景优化,以 " 用户粘性 " 作为自身核心竞争点

而在价格战愈加白热化的当下,如何在有限的成本下实现更好的功能体验,又如何让下一代高阶智驾系统兼顾通行效率和拟人化体验?

地平线认为,技术重构是实现全场景高阶智能驾驶系统量产的唯一途径。

2023 年特斯拉公布 FSD V12 版本,将城市街道驾驶堆栈升级为端到端神经网络这一技术路线,由此一股名为 " 端到端 " 热潮开始席卷国内智驾圈,在今年的北京车展上,更是逐渐升温,成为各车企和 Tier1 们口中放不下的关键字之一。

从 " 能用 " 到 " 好用 " 的跨越:端到端开启下一个洗牌局

所谓端到端,指的是一种新型的 AI 模型,采用 BEV+Transformer 技术架构等方式来实现感知决策一体化,以达到输入原始数据后便能输出最终执行指令的效果。这项技术令该版本比以往减少了数十万代码,让汽车在没有数据连接的情况下仍可在不熟悉的路段地形上行驶。

一位算法方案开发工程师曾对新智驾指出,"将感知与决策融合到同一个模型中,使得端到端模型能有效避免联级之间的误差值,无需任何人工规则介入,更加接近人类驾驶行为的高阶智驾。"

2023 年,特斯拉 FSD V12 展示了端到端模型上车的效果后,国内主流车企与 Tier1 意识到这是一个未来趋势,开始快马加鞭地追赶。

在过去,智能驾驶从业者大多将整个自动驾驶任务划分为感知、预测、决策、控制等模块,由于每个模块的技术栈相差很大,且难度高,所以每个工程师都独立负责其中一或两个模块。

因此目前已量产的智驾模型,也大多采用传统模块化的架构,即按照感知、预测等功能来划分成不同的多个小模型,每个模型都要单独对其进行训练和优化,且下游规控环节仍以规则为主。

与传统模块化架构不同的是,端到端模型是由多个小模型(即神经网络)级联而成,并且只需通过训练这一个大模型,就能达到优化和提升各个功能模块的能力,从而减少传统架构下对逐一模块训练所带来的研发成本。 

(新智驾整理制图)

技术落地大战爆发前夕,抢先一步的是学术预研。

学术界对端到端的研究始于 1988 年的 ALVINN,随后发展出端到端 CNN 原型系统。

地平线则早在 2016 年便率先提出了自动驾驶端到端的演进理念,并在 2017 年就开始采用训练端到端系统,同时发布软件框架 Hugo。

2022 年,地平线又提出行业领先的自动驾驶感知端到端算法 Sparse4D,2023 年,由地平线学者一作的业界首个公开发表的端到端自动驾驶大模型 UniAD,荣获 CVPR 2023 最佳论文。

论文中, UniAD 框架被首次提出,成为业界首个感知决策一体化的自动驾驶通用模型。

基于此,研究人员将感知、预测和规划等三大类主任务、六小类子任务(目标检测、目标跟踪、场景建图、轨迹预测、栅格预测和路径规划)整合到统一的基于 Transformer 的端到端网络框架下,实现全栈关键任务驾驶通用模型。

与此同时,地平线还积累了基于蒙特卡洛树搜索的端到端深度学习算法,大幅提升了智驾系统在复杂交通环境中的感知和交互式博弈能力。

一业界高管向新智驾透露,"实力强的企业将有望在 1-2 年内推出端到端模型,慢慢地,供应商与常规企业也会跟进,这是一个可以确定的趋势。"

比如在 2023 年 12 月,理想汽车完成了 OTA5.0 更新。从发布的 AD Max 3.0 来看,在端到端架构的支持下,理想汽车整合了 BEV 大模型、MPC 模型预测控制以及时空联合规划等能力,还新增了 Occupancy 占用网络算法。同时,理想还利用自研的神经先验网络 NPN(NeuralPriorNet)为 BEV 打 " 补丁 "。

此外,为了处理复杂的交通红绿灯信息,理想汽车曾表示,其采用信号灯通行意图网络 TIN(Traffic Intention Net)来解决,而 TIN 正是端到端模型。

何小鹏也在这次的北京车展上透露,小鹏汽车将在第二季度上车端到端大模型 AI 智驾,这一大模型的应用将过去基于图片的算法框架,转为视频流。

在各家竞相追逐端到端模型上车之际,业界被反复追问——端到端模型是否会成为高阶智能驾驶的技术终局?

业内人士向新智驾表示,智能驾驶技术最终的发展方向应是更贴近人类开车的行为模式,至少与人类驾驶行为相似的模块之间具有更强更紧密的关联

在他看来,高阶智能驾驶最终的技术架构应是完全端到端的方案,以摄像头、毫米波雷达、激光雷达等多传感器、多模态的输入,作为端到端的输入端,车辆的控制命令成为输出端,跳过了中间的定位、预测、规划、决策等模块,只有输入和输出这两端,这是将来的技术框架。

综合来看,端到端的路线意味着系统更大的部分是由数据驱动的模块所构建,那么就意味着由人所维护的模块相应的比例会降低,那么这样的话,整个系统就更容易维护。

且端到端架构通过一个模型实现多种模型的功能,研发人员只需要针对这一个模型进行整体训练、调整优化,即可实现性能上的提升,因此可以更好地集中资源,实现功能聚焦。

更关键的是,端到端模型方案的潜力在于拥有更高的性能上限。由于任务更少、避免了大量重复处理,端到端自动驾驶可以提高计算效率,并且可以通过不断扩展数据来提升系统的能力上限。

功能聚焦、易维护、拥有更高性能上限、更接近人类驾驶行为 ......端到端系统无疑是驱动城区 NOA 迈向 " 好用、爱用 " 的最优实现路径

而随着端到端系统的加速落地,行业关于高阶智能驾驶的比拼也将迎来新节点。

事实上,端到端自动驾驶技术目前存在的发展瓶颈仍然是传统的三大问题——算法、算力和数据。

其中算力平台需要支持更大规模的端到端的自动驾驶系统里面的网络;数据层面需要有海量的、非常多样性的,能够覆盖普通用户生活场景中绝大部分 case 的数据;而算法方面则需要探索可解释、可干预性强的端到端自动驾驶系统。

谁能率先打通这三大关卡,无疑谁就能在这场关于端到端的洗牌局中更拥有走到最后的底气和决胜牌面。

端到端量产落地之路:软硬协同是最佳解法

这意味着,各行业玩家们必须解决复杂嵌入式计算机系统技术和极致工程能力的双重挑战,做到软硬件高效协同

这一方面需要各企业不断拓展 ODD,需要在尽可能大的地域空间及各种天气条件下实现尽可能高的产品性能。

另一方面还要提升功能的性能和体验,实现 NCA、ICA+、ICA、VPA、APA 等工作模式并无缝切换,并且每个模式的系统性能都要打磨到最优以提升系统处理 hard case 的能力。

目前行业里的玩家在落地高阶智驾时通常有两种类型的技术策略。

第一种是侧重于功能体验和性能的提升,但是 ODD 的拓展做得不够,依然非常狭窄;第二种是侧重于拓展更广的 ODD,但是功能水平却非常狭窄和有限。

要想二者兼顾,需要开发者同时具备很强的软件与硬件能力,以及极致的工程能力,同时在两个维度实现突破。

事实上,更高端的计算方案和传感器等硬件配置,决定了性能的下限,更先进的软件技术架构,则决定了性能的上限,软硬协同无疑是当下实现端到端高效量产落地的最佳路径之一。

而在地平线创始人余凯看来,软硬协同是地平线的独特优势,依托领先的前沿软件算法研究,去设计最先进的硬件计算架构,然后支持最先进的算法,使芯片架构与应用软件配合得严丝合缝,能使计算方案效率非常高。

而在这次的北京车展上,凭借前沿的端到端软件算法技术,地平线发布结合端到端技术的量产级高阶智能驾驶系统 SuperDrive,就试图提供打造 " 好用 " 智驾方案的解法。

一方面,SuperDrive 通过三网合一的感知端到端架构,将智驾系统的遮挡准召率提升 70%,对当前行业感知架构时延高、规则多、负载重的问题进行了有效解决。

另一方面,SuperDrive 通过数据驱动的交互博弈大幅提升了智驾系统在复杂交通环境中的感知和交互式博弈能力,做到在拥堵场景下变道成功率提升 50%,路口通行效率提升 67%。

同时,SuperDrive 还具备无高精地图的感知能力,能做到对高精地图轻依赖,从而快速上线各城市 NOA 功能,做到高效拓城。

在计算方案层面,SuperDrive 则与征程 6 旗舰版协同,试图打造出最佳的软硬结合高阶智驾系统,让好用的城区 NOA 方案加速规模化量产落地,实现人人可及

事实上,除了 SuperDrive 这套城市 NOA 方案,在北京车展上,地平线还发布了业内期待已久的征程 6 智能驾驶计算方案。

征程 6 系列共推出六个版本,包括征程 6B、征程 6L、征程 6E、征程 6M、征程 6H、征程 6P,其中征程 6 旗舰版——征程 6P,算力 560 TOPS,面向的就是高阶智驾市场,其拥有高集成度、高算力、高效率、高处理能力、高接入能力以及高安全等六大产品特性。

根据介绍,单颗征程 6 旗舰即可支持感知、规划决策、控制等全栈计算任务,支持全场景 NOA 功能。

与此同时,征程 6P 还在高性能的前提下做到了高性价比,基于征程 6P 的硬件系统成本可以做到 1 万元以下

另一方面,Transformer 也是实现端到端自动驾驶的重要技术。

如果把端到端比作高阶智能驾驶要前往的终点,BEV+Transformer 更像是旅途中的一座桥梁,也可将其视为一种工具,而 Occupancy 占用网络则是一种可叠加使用的辅助 " 武器 "。

而地平线无论在算法上还是计算方案上,都实现了对 Transformer 的最佳支持。

在算法层面,UniAD 是行业首个感知决策一体化端到端模型,在 nuScenes 所有任务上都达到了最佳性能。

地平线的纯视觉自动驾驶算法 Sparse4D 则是其接棒 BEV+Transformer 的下一代架构。在今年 1 月份,地平线还将 Sparse4D 系列算法开源,以推动行业更多开发者共同参与到端到端自动驾驶、稀疏感知等前沿技术方向的探索中。

在硬件层面,地平线新一代 BPU 纳什架构,原生支持大参数量 Transformer 模型,并提供业内同级最强的 Transformer 计算性能,为先进的端到端系统的部署提供有力支持。

而在相关技术栈方面,地平线搭建的促进软件开发和定制的各种工具,诸如算法开发工具链天工开物、嵌入式中间件踏歌、软件开发平台艾迪等等,也体现了其强大的软硬件综合能力。

更低成本、更高性能上限、更高效协同的全栈式软硬件能力,让高阶智能驾驶系统 SuperDrive+ 征程 6 旗舰版的协同指向了一个终极方向——帮助产业玩家更高效地实现基于端到端模型的高阶智驾大规模量产落地。

据地平线透露,在合作车企方面,地平线的 SuperDrive 方案已经与多家车企和顶级 Tier 1 达成合作,预计到今年第四季度将会有标准量产方案推出,而到明年第三季度,首款搭载 SuperDrive 方案的车型也将进入交付期

从可用到好用,国内的汽车高阶智能驾驶之路刚刚走向转折点,要想在关于端到端这场火热的战事中胜出,作为国内智能驾驶方案的头部供应商,地平线的征程刚刚开始。

雷峰网 # 雷峰网 # 雷峰网

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

智能驾驶 北京车展 ceo 小米 雷军
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论