在理想 i8 发布会举行之前,理想汽车董事长兼 CEO 李想与前同事、维他动力联合创始人赵哲伦分享了自己关于 " 选择 " 的长期主义哲学。
" 要选‘长’的,这件事情最好要很长时间才能成功,如果是个很短时间就能成功的,就意味着所有人都能成功,反而没什么壁垒。选‘长’的,跟时间做朋友,就有耐心了。" 李想说。
当晚,外界都以为理想 i8 是唯一主角。但这是一场有双主角的发布会,李想在现场宣布,理想 VLA 司机大模型将随理想 i8 一同交付。
作为发布会上的另一个主角—— VLA 其实更能反映李想的长期主义哲学。
2025 年的智能驾驶战场,弥漫着 " 短平快 " 的焦虑。数据上,部分车企依赖人工采集 " 老司机数据 ",甚至雇佣数百人实车路测,成本高昂却效率低下。算法上,端到端 +VLM 架构遭遇瓶颈——训练数据突破 1000 万 Clips 后,性能增长缓慢。评测上,实车测试无法复现极端场景,接管里程的数字繁荣背后隐藏着极端场景的未解难题。
面对这些现象,李想曾用这样一句话提醒公司乃至整个行业——端到端模型像猴子开车,它能够学习人类行为,但并不理解物理世界。
李想的犀利比喻,直指行业痛点——短期可落地的技术≠真正智能。基于这样的信念,理想没有简单粗暴地用规则算法 " 修补 " 端到端缺陷,而是选择了一条更艰难的长期主义道路:推翻现有架构,自研 VLA 司机大模型。
为何 VLA 是 " 正确的事 "
区别于端到端架构的模仿学习,VLA 司机大模型的优势是通过强化学习不断进化,让机器理解 " 为什么这样做 "。这不仅关乎技术路线,更是一场关于用户体验、商业效率与技术野心的深刻重构。
首先,VLA 能像经验丰富的司机一样预判风险(如盲区车辆切入)。理想汽车自动驾驶研发高级副总裁郎咸朋希望,未来 VLA 能将事故里程(MPA)提升至人类驾驶的 10 倍,做到 600 万公里才出一次事故(当前理想辅助驾驶为 350-400 万公里 / 次事故,人类驾驶约 60 万公里 / 次事故)。
其次,VLA 还能 " 越开越像你 "。激进派车主获得高效变道,稳健派车主享受平顺巡航—— VLA 通过持续学习用户习惯,让车辆 " 越开越像主人 "。郎咸朋描绘未来:" 强化学习是有这个能力来支撑它这个车越开越像你的风格或体验,之前端到端可能还不具备这样的能力。"
郎咸朋透露,未来不同家庭成员上车,系统将通过 Face ID 自动切换至其偏好的驾驶风格,车辆真正成为懂你的 " 个性化司机 "。
理想没有让自己陷入 " 百万公里实车测试 " 的重资产泥潭,而是选择用 VLA 撕开了行业的成本伪装。当然,仿真不是为了省钱所做出的选择,它是能跑赢技术迭代的选择——实车测试永远追不上 Corner Case 的产生速度。
郎咸朋揭示了效率本质:" 任何技术的提升一定伴随着研发流程的变革,工业时代来临后,刀耕火种的流程被机械化替代……而进入了 VLA 大模型时代,测试效率是提升能力的核心因素。"
2025 年上半年,理想依托世界模型的仿真测试累计里程已突破 4000 万公里,每天的测试里程最大的峰值可达到 30 万公里,这是实车测试无法企及的速度与规模。
郎咸朋点明 VLA 快速迭代的秘诀:"VLA 评测就像之前的实车评测一样……我们的 VLA 仿真评测已经在超级对齐里做好了基础,现在已经有超过 40 多万个场景评测了。" 这构成了对手难以短时间复制的核心壁垒。
在 VLA 的长跑中,理想展现出惊人的战略定力——精准平衡短期妥协与长期收益。
在用户端,理想接受初期功能保守,例如地库限速最初为 10 km/h ,现在逐渐提升到 15km/h,换取绝对安全冗余。但郎咸朋承诺 " 进一步提升能力并且做好测试之后,我们会逐步打开这个能力的车速上限 "。
在技术端,理想牺牲端到端短期数据优势(堆 Clip 数),换取 VLA 的 " 思维涌现 " 能力。郎咸朋对比鲜明:" 如果还是沿着端到端思路去做所谓 VLA,你的速度一定会变慢……首先你要训 1 亿个 Clips 需要多大的训练算力?"
同时,理想专注构建仿真评测壁垒。郎咸朋清醒判断:VLA 仍处技术周期早期,首要任务是 " 很好地验证这套系统 "。
市场反应印证了 VLA 的长线价值。今年 1 月发布的《理想智能驾驶 2024 年出行报告》显示,理想汽车智能驾驶试驾率达到 72.4%,试驾满意度为 92%,30 万以及 40 万以上车型 AD Max 交付量占比分别为 75.4%、84.6%。
可以看出,理想辅助驾驶不再是用户购车决策中的弱势项,而是驱动品牌销量增长的重要因素,这也是 VLA 司机大模型与理想 i8 一同发布、一同交付的原因。
郎咸朋希望,2025 年底将 MPI 接管里程提升至 400-500km,到明年能够达到 1000km。" 明年我们如果到了 1000km 的 MPI 水平,可能会给用户这种感觉真的到了一个 VLA 的 ChatGPT 的时刻。" 理想汽车自动驾驶高级算法专家詹锟说。
对 VLA 的坚定选择,背后是理想的技术信仰。VLA 是理想对行业本质问题的回答:真正的智能不是 " 能做什么 ",而是 " 为何这样做 "。
数据、算法、算力、工程四重难题
自研 VLA,这是人迹罕至的路,郎咸朋的团队知道,啃下这块 " 硬骨头 ",需要一场从数据、算法、算力到工程能力的全方位 " 长征 "。
在数据问题上,截至 2025 年 7 月,理想积攒了累计 43 亿公里辅助驾驶里程、12 亿公里有效回传数据——这是理想从 2020 年理想 ONE 时代就开始布局的 " 数据金矿 "。
接下来是数据清洗的 " 炼金术 "。理想剔除了近 1/4" 不合规驾驶行为 ",仅保留 " 老司机数据 "。理想汽车自动驾驶高级算法专家湛逸飞解释:" 我们需要的数据用一个词总结叫‘老司机数据’。" 他们在云端部署模型,甚至利用大模型对数据进行 " 老司机 " 标准的严苛筛选。
为了实现世界模型的颠覆性革命,理想做出了一个大胆决策:用仿真测试替代 90% 实车路测。通过三维重建与场景泛化技术,1:1 还原极端场景。这源于一个严峻的事实,即实车测试永远无法 100% 还原事故现场。
湛逸飞透露,依托强大的世界模型,单日峰值测试里程达到 30 万公里,2025 年上半年累计超 4000 万公里。
这并非一蹴而就。2024 年,理想进行了 150 多万公里实车测试,并非为了数据本身,而是为了验证和校准仿真环境的可靠性。湛逸飞坦言,最初世界模型仿真复现率是存在问题的,团队通过一年时间,针对漏洞进行大量工程和算法优化,将仿真一致性提升至 99.9% 以上。
在算法问题上,李想曾尖锐评价端到端模型 " 像猴子开车 " ——能模仿动作,却无逻辑思维。VLA 的突破,核心在于赋予机器 " 思考的能力 "。
CoT 思维链(Chain-of-Thought)是 VLA 的核心突破。它能实时呈现决策逻辑(如屏幕显示 " 拒绝逆行因安全合规 "),彻底解决端到端 " 无脑执行 " 的痛点。换句话说,理想不是在教 AI 开车,而是在教它理解人类世界的规则。
面对大模型部署车端的世纪难题,理想选择了最硬核的自研之路。
推理速度慢?今年,理想汽车将成为首个在 Thor-U 部署 VLA 模型(4B 的 MoE 混合专家模型)的车企。理想汽车自动驾驶高级算法专家詹锟自豪地说:" 目前没有任何一个架构是这样的,这是我们与基座团队共同研发,专门对嵌入式芯片做了定制的 MoE 混合专家架构,在这个架构上我们才能达到这样的效果。"
轨迹生成时延高?理想不是直接使用标准 Diffusion,而是进行了推理的压缩。詹锟揭秘:" 以前 Diffusion 可能要推理 10 步骤,我们使用了 flow matching 流匹配只需要推理 2 步就可以了,这方面的压缩也是导致我们真正能够部署 VLA 的本质原因。" 效果就是,轨迹生成时延仅 15 毫秒。
模型部署难?理想将 32B 云端大模型蒸馏至 3.2B 车端 MoE 模型。詹锟团队完成了看似不可能的任务:" 我们最早训练了一个 32B 的云端大模型……把它做出的思考和推理流程蒸馏到 3.2B 的 MoE 模型上。"
在算力问题上, 理想关心 " 有效算力 "。最终,理想在 Thor 芯片上实现 700TOPS 有效算力。詹锟解释秘诀:" 传统的训练一般都会拿 FP32 去做训练 ... 我们有一个训练过程叫 QAT(量化感知训练)……在训练过程中,我把参数就把它变成 INT8 或 FP8。"
詹锟回顾攻坚过程:" 我们的工程团队、部署团队做了非常多的工作,包括我们魔改 CUDA 的底层,重写 PTX 底层指令,才能实现现在的效果。"
为了打破 " 芯片歧视链 ",理想让 Orin X 芯片和 Thor 芯片车型都能获得 VLA,这源于理想工程部署能力的一贯积累。" 从早期在地平线 J3 部署高速 NOA,到在 Orin 芯片上部署大模型,再到现在在 Thor 芯片上部署 VLA 高频快速的大模型……很多技巧和分析方法,以及基础设施的工具链都继承下来了。" 詹锟说。
数据、算法、算力和工程能力的四位一体,构筑了理想 VLA 的护城河。而这场啃硬骨头的长跑,旨在回答一个问题:真正的智能,是理解 " 为何这样做 "。
技术背后的价值观
当 VLA 司机在双向单车道上拒绝执行 " 左转避开三轮车 " 的指令时,一场关于机器价值观的公开拷问被引爆。这不是技术故障,而是理想团队主动选择的安全底线。郎咸朋深知,VLA 的每一步突破,都伴随着尖锐的质疑与艰难的权衡——这是啃硬骨头必然付出的代价。
如何应对用户信任带来的风险,是理想正在面对的第一个问题。
" 请左转避开三轮车。" ——面对这样的指令,VLA 在双向单车道上陷入沉默。詹锟表示,这不是技术故障,是价值观的主动选择。
一方面,复杂指令存在 " 通识门槛 ",例如 " 前进 10 米 " 依赖物理常识涌现。詹锟解释核心原理:" 当量级达到一定规模时,会涌现出组合泛化的能力……它懂了数字,懂了米数,就能组合应用。" 但这需要海量数据与迭代时间。
另一方面,交互权责存在模糊地带。用户闲聊提及 " 左转 " 可能误触发指令,理想 i8 发布会上播放的岳云鹏驾驶 VLA 车辆的视频,就以一种轻松的表达方式展现了这个问题。
" 我们现在肯定是为了保持准确,防止出现一些误判,比如你本来不想操控车的行为,突然去操控了,这肯定是存在一些还需要迭代和优化的地方。" 詹锟坦言挑战。而理想的解决方案指向 " 统一大脑 ",让车辆对用户的想法有更精准的理解。
如何应对效率、安全、舒适的 " 不可能三角 ",是理想正在面对的第二个问题。
郎咸朋强调,理想的选择,是安全大于舒适和效率。按照这一原则,现阶段车辆即便走错路,VLA 也不会通过一些危险的驾驶动作进行纠正。只有在保证安全的前提下,VLA 才会去努力让行程更舒适和更高效。
当然,任何选择都会付出代价。" 代价就是初期体验保守。" 郎咸朋坦言,他同时承诺,我们会逐步打开能力上限。
如何应对行业内卷背景下的对手围剿和外界质疑,是理想正在面对的第三个问题。
对于理想而言,那些采取 " 短平快 " 打法的对手,它们炫耀参数的行为并不值得自己焦虑,因为单纯的参数优势,就像厨师夸耀灶台火力旺一样,其实,食客只在乎菜是否烧糊了。
从落地节奏看,质疑声认为 " 端到端生命周期仅 1 年,VLA 是否昙花一现 ",郎咸朋表示:"VLA 架构会延续到机器人繁荣之后,才可能被其它技术替代,它是一个相对长期的架构,技术潜力非常大,也更像人类的智能发展规律。"
面对各种质疑,理想应对之道的根基是三大原则:一是安全绝对优先,MPA 事故里程目标 600 万公里(优于人类驾驶员 10 倍),用数据兑现承诺;二是有效算力至上,以 FP8/INT4 量化革命让每颗芯片 " 鞠躬尽瘁 ";三是用户共建迭代,134 万车主接管数据驱动强化学习。
写在最后
理想汽车的 VLA" 长征 ",远非一场单纯的技术突围。它是在智能驾驶喧嚣的竞技场上,对行业浮躁与捷径诱惑的一次 " 拨乱反正 "。当整个行业被 " 短平快 " 的焦虑裹挟,沉溺于算力参数的军备竞赛时,理想选择了一条布满荆棘的自研之路。
这条路的艰难显而易见,但理想的创新内核,恰恰体现在这份对困难的坦然拥抱与主动选择上。李想所言的 " 选择‘长’的 ",其深意不仅在于时间的长度,更在于路径的深度——深入本质,重构规则。
登录后才可以发布评论哦
打开小程序可以发布评论哦