蔚来世界模型升级背后:智驾竞争正在从算法走向基建

今天相信很多蔚来和乐道的车主都等到了一个大动作—— NWM 2.5 版本的全量推送。

表面上看，这是一次关于蔚来世界模型的常规 OTA。但如果仔细看这次推送的覆盖面：它不仅横跨了蔚来和乐道两个独立品牌，还往回兼容了包括 2022 年交付的初版 ET7 在内的所有 NT2 车型。

这意味着，搭载四颗 Orin 的高配平台、单颗 Orin 的下沉平台，甚至是搭载了自研神玑芯片上的最新 NT3 平台，这几十万辆跨度长达三四年、硬件底子千差万别的车，要在同一时间节点，接上同一套最新的大模型算法，并且还要做到核心体验的基本一致。

这事儿有多难？在刚结束的这场蔚来智驾沟通会上，蔚来智能驾驶研发高级副总裁任少卿久违露面，他花了大半场的时间，都在外界解释他们是怎么啃下这块硬骨头的。

这背后所反映的则是智能驾驶竞争的一个新阶段：当端到端、世界模型逐渐成为行业共识，算法本身，其实已经不再是企业间唯一的、甚至不再是最坚固的壁垒了。

智驾的下半场，拼的早就不是谁能在社交媒体上发一段惊艳的零接管 Demo 视频，而是谁能在底层搭起一套工程、数据、算力、验证的庞大基础设施。

过去几年，行业更关注谁先开城、谁首发端到端、谁摆脱了高精地图。比拼的是具体的功能：变道果不果断、路口通行率高不高、泊车好不好用。

但这次 NWM 2.5 的推送，蔚来想证明的并不是我有个新算法很强，而是我有一套能让新算法跨品牌、跨车型、跨平台持续上车的基础设施。

智驾技术的迭代是有规律的。从早期的规则驱动，到 BEV 感知，再到如今的世界模型和多模态统一网络。每一次技术升级，都代表了背后模型复杂度的飙升。

模型越大，越不是算法团队关起门来能搞定的事。它已经变成了一项极其硬核、极其烧钱的系统工程。

它需要足够一致的传感器输入，足够高效的推理部署工具链，足够自动化的数据筛选体系，以及能覆盖长尾风险的庞大验证系统。这正是为什么，智驾的竞争逻辑，正在从比拼某一个算法模型，全面转向比拼底层的 AI 基建体系。

为什么基建开始变得比算法更重要？因为「烧数据」的时代到了。

沟通会上，蔚来表示，模型性能的线性增长，需要数据量的指数级暴增。想提升 3 个百分点的性能，可能需要 10 倍的数据；提升 6 个点，需要 100 倍。

在这个阶段，如果光有一个聪明的算法大脑，却没有输送养分的血管体系，模型很快就会触及天花板。

一套先进的世界模型要落地，门槛极高。你需要：

硬件一致性：传感器布局不能五花八门，否则模型没法通用；

算力与带宽：芯片不仅要算力高，更要内存带宽足够大，才能满足大模型的吞吐；

软件工程能力：必须有高效的部署框架，否则算法更新了，车端根本跑不动；

数据与验证：得有成体系的量产车队帮你去大马路上偶遇那些百年不遇的 Corner Case。

智驾下半场，车企比拼的对象变了。不再是比谁家先喊出新概念，而是比拼谁家的芯片、工具链和软件架构能真正支撑大模型的持续迭代。

第一层基建，早期硬件冗余

蔚来的第一层基建，是早年埋下的硬件冗余。

2021 年初，蔚来首发 ET7，坚持使用车顶激光雷达和 7 个 800 万像素摄像头。在当时，这种方案被很多人吐槽成本过高、算力浪费。

但几年后的今天，这种统一且高规格的传感器布局，成了老车能够持续升级的基础。放到今天来看，当年那些被群嘲的「硬件冗余」，真实价值终于开始显现了。

蔚来在沟通会上抛出了一个极其关键的商业逻辑——智驾硬件的部署，必须要能撑得住两代以上的软件迭代。

这其实揭示了一个行业规律：智能车的硬件冗余不是天然正确的。只有当后续的软件、算法和数据体系能够持续利用这些硬件时，冗余才会变成资产，否则它只是纯粹的成本。

蔚来今天能让老车主用上最新的世界模型，就是在兑现当年在传感器统一性上的投资。

当然，硬件的物理限制依然存在。比如这次的 NWM 2.5，乐道的单 Orin 平台推送时间会稍晚，之后更新频率也会相对低一些。这说明，虽然通过模型压缩和剪枝能做到核心体验一致，但在部署效率和极限能力上，单芯片与四芯片依然有客观差距。硬件能力，始终是决定模型上车速度的重要底座。

第二层基建，AI infra 和工具链

把云端的大模型塞进车端芯片，是一项极具挑战的工程。这是蔚来的第二层基建，也是全场最硬核的技术部分。

早在 2020 年，蔚来就决定放弃英伟达官方的全套工具链（仅保留底层的 CUDA 层），开始自研推理引擎、部署框架和 AI 编译器。

原因很简单：自研芯片能不能跑出价值，不只取决于芯片本身，更取决于有没有配套的软件工具链。如果没有强大的编译器，自研芯片就只是一块昂贵的硅板。

传统的模型部署，就像老法师手工打磨零件，慢且高度依赖个人经验，算法迭代快了根本跟不上。而蔚来自研的 AI 编译器，做到了自动的算子优化和自动图优化。算法工程师把模型架构一改，编译器自动跑一下，大部分底层的适配就自动生成了，推理效率还能比通用工具链提升 20% 以上。结合 AI Agent 自动化流程，蔚来把模型上车的部署时间，从原来的几天硬生生压缩到了 2 个小时以内。这就解释了为什么蔚来能同时搞定多平台适配。

在聊到自研的神玑 NX9031 芯片时，有一个细节非常有意思。早在 2020 年年底到 2021 年初，蔚来团队就在内部反复推演一个问题：下一代的神经网络，会不会变成纯 Transformer 架构？

当时的主流还是 CNN（卷积神经网络），大家觉得 Transformer 还没那么通用。但蔚来内部最终拍板：考虑到自家芯片一用就要管好几年，未来一定会走向纯 Transformer。

这个预判，直接决定了神玑芯片的核心设计指标，芯片并没有盲目堆 TOPS 算力，而是把单颗芯片的内存带宽做到了 500 GB/s 以上。

这也能够看出，如今智驾芯片的竞争标准也在不断改变。随着 Transformer 和世界模型上车，内存带宽、工具链效率和模型跨平台部署能力，远比单纯的算力数字更重要。

第三层：数据闭环和验证系统

这一层可以说是整个基建体系的核心。

过去大家理解的「数据闭环」，就是派测试车队上街采数据，然后回传云端训练。但在真正的 AI 大模型面前，这招早就落伍了。

在蔚来看来：数据并不是零成本的拷贝，数据的本质，其实是算力。你要找到针对某个新模型的缺陷数据，就必须让这个模型在海量真实场景里去跑。

去哪弄这些场景？靠几百辆测试车去街上盲开？测试员开一天，可能都遇不到一个值得记录的奇葩场景。如果花钱去买成规模的数据，那指数级增长数据的成本能把任何一家车企拖垮。

蔚来的解法是，把几十万辆已经卖出去的量产车，编织成一个庞大的「算力调度池」。

简单来说，蔚来会把待验证的新模型，静默下发到真实用户的车上。你开你的车，原有智驾系统该怎么工作就怎么工作，但在后台，这套影子模型也在默默跟着运算。一旦它发现自己的判断和人类老司机的操作不一样，它就会把这个罕见的高价值 Case 标记下来，并回传到云端。

这其实是一次零打扰的大规模实盘演练。老用户的 NT2 车型和新用户的 NT3 车型，都在这个池子里默默贡献着算力。

智驾能力越往后走，测试和验证变得和训练一样重要。因为一套真正好用的智驾系统，从来不是模型能不能在一条固定的体验路线上表现惊艳，而是它能不能在极其复杂的城市、恶劣的天气和各种长尾场景里不出错。

在验证环节同样如此。今天测一个新版本，早就不可能靠跑个几百公里来定性了。蔚来现在的底线是，在群体智能验证系统里，用超过 1,000 项的细分指标，让模型在后台跑出每周超过 4,000 万公里的伴生测试里程。

正是因为有这套数据和验证基建兜底，蔚来才敢对外公布那些硬核的安全数据：在人驾情况下的主动安全防线的里程数量，已经推到了近 700 万公里，今年还要朝着 800 万、1,000 万公里冲刺。

智驾行业从来不缺新名词，端到端、世界模型、闭环强化学习在内的新技术会不断涌现，特斯拉的 FSD 最终也会进入中国这片复杂的试验场。

真正的下半场规则已经很清晰了：新算法会越来越快被同行追上，真正拉开身位差距的，是算法背后的基建能力。

这个基建，是硬件的统一性规划，是高带宽芯片与 AI 编译器的咬合，是把量产车队化作验证网络的调度能力，更是跨品牌、跨平台的 OTA 工程落地能力。

智能驾驶的竞争，正在从「谁的算法更先进」，彻底变成「谁能更快、更安全、更稳定地把先进算法，变成几十万用户每天都能用的底气」。这，才是蔚来这场智驾沟通会真正亮出的底牌。

最后我们也整理了一些沟通会的核心 QA 问题。

Q：友商也在做自研大算力芯片，为什么蔚来能率先在多平台上落地？

A：我们在过去几年，尤其是在去年 25 年去做这个自研芯片量产过程当中，在 24 年开始，到 25 年流片回， 24 年流片回来之后，到 25 年 3 月份量产，我们其实做了大量的工作。

在 AI infra 的这个层面，其实我们从 20 年就开始在布局，做了大量的工作。尤其是我们的推理引擎，我们的部署框架，以及说我们的 AI 编译器。因为有了 20 年开始起家的时候的一些积累，所以在我们自研芯片上来之后。很多的工程的效率其实已经达到了一定的程度，芯片流片回来之后，我们其实很快的就做到了跨芯片的兼容，

Q：物理世界的 AI 算法路线像是 VIO、世界模型，现在是否有了一个清晰的走向？

A：目前正在逐渐收敛。回顾智驾的发展，从 2016 年到 2022 年，物理世界 AI 算法演进其实非常缓慢主要是 BEV 加上 OCC。整个行业处于一个拼人力、拼测试车的流水线工程阶段。

但从 2022 年开始，行业迎来了大爆发，技术路线从高度确定变成了充满机会的不确定。蔚来在 2023 年下半年果断进行了组织架构变革，打破了原有的流水线模式，将资源向预研创新倾斜。我们坚决选择了「世界模型」路线，核心初衷有两点：一是用无监督 / 自监督的方式训练，摆脱对海量人工标注的依赖；二是打造一个多模态混合的统一网络。庆幸的是，我们踩准了这波技术周期的节奏。

Q：蔚来下一代自研芯片的规划是怎样的？

A：目前大家看到的是蔚来的第一代自研芯片神玑 9031。毋庸置疑，我们肯定会继续研发第二代芯片。目前内部正处于方案讨论和定型的阶段，所以暂时还不能对外披露具体的参数和细节。

Q：蔚来 NT3 平台车型比如 ET9 增加了侧向激光雷达，对实际体验有什么具体提升？

A：蔚来搭载的是目前全行业最好的侧向激光雷达，探测距离可达 70-80 米。侧向与前向激光雷达拼接后，能实现 350 度的高精度观测。

在日常普通驾驶中，用户可能感觉不到它的存在。但它就像「安全气囊」，专为解决极其罕见的 Corner Case 而生。比如在雨夜的快速路上，侧后方有未开灯的暗色车辆或小目标高速驶来时，纯视觉很容易失效，这时候侧向激光雷达就能发挥救命的作用，极大保障高速变道和城区的安全性。

Q：在世界模型下，带激光雷达的版本和纯视觉的版本，表现差异大吗？

A：在日常的用户体感和体验上，多一颗或少一颗传感器带来的差异是非常小的。如果日常驾驶就能明显感觉出差异，说明这一代平台的感知融合做得太差了。两者真正的差异主要体现在对极端恶劣天气和罕见场景的兜底能力上。

Q：乐道第一代是纯视觉 + 单 Orin，能同步推送到世界模型的版本吗？进度为什么晚一点？

A：乐道很快就会推送新版本。在最近的内部盲评中，新版本相比当前版本有了质的飞跃

进度相对较晚的原因与纯视觉传感器无关，完全是因为算力差距。多算力平台主要解决的是跨芯片工程兼容问题；但在单 Orin 平台上，我们需要投入大量的研发资源去做模型压缩，把庞大的世界模型放进小算力芯片中，同时还必须彻底消除模型压缩可能带来的安全隐患。

Q：为了把模型放进小算力芯片，蔚来是选择用筛选后的数据重新训练小模型，还是用大模型进行「蒸馏」？

A：这两条技术路线在蔚来内部都非常成熟。具体用哪种，取决于跑出来的实际效果。

但在当前的智驾模型迭代中，使用「蒸馏」的概率更大。当我们开发出新的架构比如更端到端的建模、更先进的横纵向控车方式，我们希望把这些新特性带到单 Orin 平台上。相比于从头训练，用现有的大模型去蒸馏出小模型，能够以最高效的性价比实现架构特性的迁移。

Q：蔚来目前 NWM 2.5 当前的智驾在行业内处于什么位置，有没有对比过特斯拉 FSD？

A：内部体验过特斯拉 FSD。客观承认，特斯拉在数据体量和训练算力资源上是世界领先的，计算量甚至比国内公司高出一个量级以上。

但在算法架构层面，蔚来今年上半年推出的「世界模型 + 闭环强化学习」体系，是绝对不弱于特斯拉的，甚至在国内处于领先身位。蔚来现在的课题是：如何在算力资源少于特斯拉的情况下，通过更优的架构达到类似甚至更好的结果。

Q：为什么在当下这个节点，大家突然觉得蔚来的智驾能力有了质的飞跃？蔚来觉得智驾下一个里程碑是什么？

A：能力飞跃是三层因素叠加的结果：底层硬件的预埋 + 数据体系的多年夯实 + 2023 年踩中了「世界模型 + 闭环强化学习」的算法红利。这三者结合，让我们能用更低的算力成本跑出更好的结果。

接下来的里程碑：我们不拘泥于 L3 或 L4 的名词，核心预期是大幅拉长用户的「零接管时间」。最终目标是将现在的安全事故率再降低一个数量级，让智驾比人类自己开安全十倍甚至百倍。

Q：特斯拉 FSD 预计很快入华，蔚来觉得这对国内智驾行业会有什么影响？

A：对中国智驾行业是巨大的利好。首先在技术层面，它提供了一个公平竞技的舞台。虽然特斯拉算力庞大，但在架构和体验上，我们有信心与之「掰手腕」。这能向市场证明中国本土企业的智驾能力是世界顶尖的。

其次在商业层面，特斯拉坚持软件收费模式。FSD 入华将极大地教育国内市场，改善中国智驾的商业环境。只有健康的商业模式，才能支撑车企在用户买车 3 年、5 年后，依然有资源为其提供持续的智驾更新，这对用户长远利益是最好的。

Q：既然友商已经推出了接近 L3 的城市 NOA 兜底策略，蔚来对于 L3、L4 的落地时间表是怎样的？

A：在政策法规层面，蔚来是工信部首批 L3/L4 准入名单中的车企，一直在配合政府做核心的验证工作。

在技术层面，基于数据化的世界模型架构，我们的安全性正在飞速提升。接下来只要通过深度跨域打通解决好系统底层延时和冗余设计问题，我们在技术上就已经 Ready。只要国家法规一旦宣布放开，蔚来的 L3/L4 功能一定会是行业内第一批上线的。