何小鹏郎咸朋激辩VLA，谁裸奔，谁豪赌？

更深刻了解汽车产业变革

出品：电动星球

作者：毓肥

封面由 AI 生成

12 月的中国智能驾驶圈，从一场「裸跑」和「反驳」中走向舆论顶峰。

昨天，理想汽车自动驾驶负责人郎咸朋发表一篇长微博，回应了宇树科技创始人王兴兴此前称「VLA 模型是相对傻瓜的架构」的论点。

长微博里面，郎咸朋提到两个核心观点：「VLA 就是自动驾驶最好的模型方案」、「具身智能最终拼的是系统能力」。

郎咸朋的回应斩钉截铁，也成为了当天智能驾驶舆论场的绝对热点。

无独有偶，仅仅 24 小时后，小鹏汽车创始人何小鹏也发了一条长微博，主题也是 VLA。甚至于，何小鹏将他对 VLA 的态度升级到新高峰，为此不惜下重注。

他在微博中表示，他和自动驾驶团队打了一个赌。

赌约的内容是如果到了 2026 年 8 月 30 日，小鹏的 VLA 在国内可以达到 FSD V14.2 在硅谷的整体效果，何小鹏就会在硅谷参考小鹏当前的总部餐厅，筹建一个非常特色的中国风味食堂。

而反之无法实现的话，小鹏汽车自动驾驶中心负责人刘先明，就要承诺在金门大桥裸跑。

24 小时内两条长微博，先后引爆新造车智能驾驶话题。

小鹏汽车和理想汽车，目前都是坚定的 VLA 路线布道者。小鹏刚刚在 AI Day 发布的 VLA 2.0，将于 12 月正式开启先锋内测；理想则将在 OTA 8.1 里面进一步升级了强化学习驱动的 VLA 大模型体验。

而另一边，华为和蔚来们则在世界模型的路上狂奔。

华为靳玉志曾经提到「我们不走 VLA 路线，WA （世界模型）才是最终解决方案」；蔚来李斌则承诺，「蔚来世界模型会在行业里回到数一数二的位置」。

高阶辅助驾驶还在质变前夕不断酝酿，但车企仍需证明自身的技术先进性。

这一次 VLA 激辩，背后究竟是创新、突破，还是内卷、厮杀？

今晚给大家提供点思考弹药。

VLA 的高呼

两条长微博的共同点有很多，都是为 VLA 鼓与呼，都给出了掷地有声的结论。

回顾下前情，宇树科技王兴兴对 VLA 和世界模型的发言，来自于今年 8 月 9 日北京世界机器人大会上。

彼时这句话相当于引爆了大模型舆论场——不过不是机器人大模型，反而是智能驾驶大模型。

经过新一轮 AI 洗礼，智能驾驶是具身智能的子集已经成为业界共识，这是背景。

也正因如此，王兴兴的观点马上就被反对 VLA 的网友作为论据，反驳 VLA 阵营的车企和智能驾驶公司。

虽然郎咸朋的长微博回应距离 8 月份已经有些日子，但这并不影响他写下理想汽车的决心，比如那句「VLA 就是自动驾驶最好的模型方案」。

事实上，VLA 的最核心技术亮点，就在于 VLA 路线定鼎论文的标题里面。

VLA，vision-language-action 视觉语言动作大模型，最早在 2023 年 7 月谷歌 DeepMind 团队的《RT-2: Vision-Language-Action Models》中提及。

论文的副标题是：「Vision-Language-Action Models Transfer Web Knowledge to Robotic Control」，VLA 大模型将网络知识转化为机器人控制。

两年半前 VLA 开山之作，对应着两年半之后郎咸朋那句「我们是在用 GPT 的方式做自动驾驶」。

这里指的并不是理想 VLA 大模型已经对标 GPT 5，而是 VLA 的本质，乃至于自动驾驶大模型的发展方向，都在于用现实世界的通用知识，不断圆满「长尾场景」的解决方案。

或者换个更简单的说法，VLA 让智能驾驶拥有更接近人类的社会经验。

比如下半年各家 VLA 都在卷的新功能——「手势识别」，就是「社会经验」的体现，让智能驾驶正确判断到底是有人要搭便车，还是交警指挥你通行。

第一个在发布会上演示此功能的车企，正是小鹏汽车。

今天下午何小鹏的长微博虽然没郎咸朋那么长，但他的决心是更明显的，毕竟下了个「裸跑」的赌约。

至于为什么不是何小鹏本人裸跑，因为 7 年前 G3 上市的时候，他就已经对赌过裸跑了，最终 G3 确实卖得不错，不然 ...

回到 1 个月前的小鹏汽车 AI Day，何小鹏官宣小鹏汽车 VLA 2.0 将在四季度正式开启先锋用户内测。

在小鹏的 PPT 里，VLA 2.0 的核心进化在于，去掉了传统意义上的「L」，直接用隐式逻辑生成动作指令。

何小鹏认为这样将极大程度上降低 VLA 大模型的延迟，并且将城中村等毛细道路的接管里程提高了 13 倍。

不过，伴随着小鹏 VLA 2.0 而来的，是另一个提问：VLA 去掉 L，是不是更像世界模型了？

这要回到大模型进化的本质：尽可能减少信息传递的损耗，提升信息传递的效率。

VLA 去 L 化，和世界模型的底层优化方向确实是一致的——减少对思维链的依赖，提升图像 token 化的信息利用效率，进而实现更强的智能驾驶性能。

但这绝对不意味着 VLA 和世界模型，现在、马上、立刻，就已经分出了胜负，更不意味着 VLA 阵营正在向世界模型靠拢。

甚至于，VLA 和世界模型，互相都在呈现出「合流」的趋势。

譬如 VLA 这边，小鹏正在让模型直接从视频流中学习时空规律培养直觉，而理想也用世界模型在云端做数据生成、做仿真测试和强化训练。

甚至世界模型的绝对推崇者，称 VLA 是在「死记硬背」的 Yann LeCun，他最新提出的 AGI 概念「JEPA Joint Embedding Predictive Architecture（联合嵌入预测架构）」，也大量吸取了 VLA 技术路线的成果。

比如他也认为 VLA 对现实世界的交互非常高效，比如他也认为真正的 JEPA 世界模型需要拥有类似于 VLA 逻辑的、负责感知和评估的部分。

至于有没有 L，对于 Yann LeCun 和谷歌，以及现在的何小鹏们来说，从来就不重要。

还记得前面提到谷歌开创 VLA 赛道论文的标题吗？知识转化为控制，哪里有语言？

但是让 VLA 占据更高的舆论阵地，对于理想和小鹏来说很重要。

绝不松手的话语权

从技术创新迷人的泥沼中挣出，最后我们聊聊智能驾驶营销燥热的空气。

时间是最好的试金石，2021 年 AI Day 上马斯克那句「想要实现 FSD，特斯拉必须解决现实世界的 AI」，现在看来似乎很直白浅显，却是早已被马斯克占据的绝对营销顶峰。

因为第一个掷地有声的，才有资格被溯源。

无论是郎咸朋的长微博、三季度财报会议上李想本人长达 20 分钟的演讲，还是今天何小鹏的赌约，都是中国新造车对智能驾驶话语权绝不放手的紧迫性。

技术进步有质变之后的璀璨，但更多的是量变期间的平淡。2025 年智驾营销踩刹车之后，造词运动暂告一段落，口号大赛也偃旗息鼓。

但向消费者传递车企领先性的任务依然沉重，一边是 FSD V14 正准备卷土重来，另一边则是机器人公司迅速站在了 AI 舞台中央。

甚至何小鹏都直言，「我们的第一个版本还达不到 FSD V14.2 的水准」——也许这就是裸跑赌约的直接原因。

理想和小鹏表现出了紧迫感，但它们绝对不是唯二感受到紧迫的。

最后站在媒体角度，我们希望这种紧迫感，可以尽快转化为用户的惊喜，也必须转化为用户的惊喜。

（完）

宙世代

一起剪

相关标签