Techweb 05-08
李想详解AI战略:从信息工具迈向生产力,理想汽车押注“司机大模型”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

TechWeb 文 / 卞海川

在距离上次 "AI Talk" 整整 130 天之后,理想汽车创始人兼 CEO 李想再度接受张小珺专访,系统阐述了理想汽车在人工智能,特别是 " 司机大模型 "(VLA)方面的最新进展。

人工智能尚未减少工作时长,核心挑战仍是 " 熵增 "

" 人工智能发展得这么快,但我每天的工作时长并没有减少。" 李想的一句开场白引发共鸣。在他看来,当前大多数人仍将 AI 视为信息工具,而信息的质量受限于索引机制,尤其是 RAG(检索增强生成)依赖的源头往往已 " 失真 ",导致 " 推理很认真,但结果是错的 "。

李想进一步提出 AI 工具的三层分级:信息工具、辅助工具、生产工具。

" 只有成为生产工具,人工智能才真正实现爆发。" 他强调,AI 若无法切实改善产出质量、压缩时间成本,就无法对工作效率产生实质影响。

拥抱 DeepSeek,加速理想 VLA 模型推进 9 个月

对于中国大模型行业,李想毫不掩饰自己的赞誉:" 无论是 DeepSeek 还是千问,中国 AI 在基础模型、推理模型、多模态能力上已经跟美国的距离基本上拉近了。"

李想对 DeepSeek 以及其创始人梁文锋给出了高度评价,包括 " 自律 "、" 会在全世界范围之内去研究和学习最佳实践和最好的方法论的人 "。

李想介绍了他从 DeepSeek 上吸取到的经验。DeepSeek 运用了人类的最佳实践,比如说 DeepSeek V3 采用了一个 671B 的 MoE(混合专家模型)。

专家能力如何构建?李想认为,DeepSeek 展示了一个最佳实践:第一步一定要先搞研究。

" 任何时候当我们想去改变和提升能力,第一步一定是搞研究,第二步是研发,第三步是把能力表达出来,第四步是能力变成业务的价值。这四个步骤是个极简的人类最佳实践,但我们经常做着就忘掉了,看到什么东西就直接去启动研发,而没有去搞研究。" 李想说道。

正是基于 DeepSeek 的开源,理想汽车在 VLA 司机大模型的语言能力研发上提速显著,节省了近 9 个月的时间和数亿元成本。

" 我们内心很简单:DeepSeek 帮助我们太大,所以我们决定开源自研的星环 OS 系统作为回馈。" 李想表示,就是 DeepSeek 给我们带来那么大的帮助,我们应该给对社会贡献点什么,不让行业那么卷。说白了纯粹是感谢 DeepSeek。

为什么有了 DeepSeek,理想还要自研基座模型?李想回应说:" 核心在场景需求不同,我们要做车载多模态交互,尤其是 VLA(视觉语言行动模型)——需要 3D/2D 视觉融合,叠加汽车、交通、家庭场景的专业语料,这些垂直领域的数据和训练逻辑,是通用模型没覆盖的。"

理想汽车的 AI 主航道:打造司机级大模型

目前的 L2、L2+ 组合驾驶辅助仍属于辅助工具阶段,而 VLA 能够让 AI 真正成为司机,成为交通领域的专业生产工具。对理想汽车而言, 未来的 VLA 就是一个像人类司机一样工作的司机大模型 "。

在李想看来,辅助驾驶的真正突破点是 VLA ——一个能像人类司机一样观察、理解并执行行动的多模态大模型。

他将 VLA 的发展划分为三阶段:

1. 昆虫智能阶段:依赖规则算法、高精地图,智能程度有限;比较像蚂蚁的行动和完成任务的一个方式。

2. 哺乳动物阶段:通过端到端学习模仿人类操作,泛化能力增强;去面对它从来没有学到的、特别复杂的,其实就会遇到问题。

3. 人类智能阶段:VLA 具备理解物理世界的能力,结合 3D 视觉、语言理解和行动执行," 像司机一样工作 "。

李想总结称,它会像人类一样的用 3D 的 vision 和 2D 的组合,去看整个真实的物理世界,也包含它能够去看懂导航软件是怎么在运行的,而不是像 VLM 那样只能看到一张图片。另外一方面,它有自己的整个脑系统,不但要看到物理世界,还能够理解这个物理世界。它有它的 language,然后它也有它的 CoT(思维链),有推理的能力。

目前,理想正在训练一个 32B 参数量级的 VL(视觉 - 语言)基座模型,加入了高清 2D 图像、3D 视觉、交通语言语料及 VL 联合语料(如导航与行为的关联)。

基于此前李想对于人工智能的判断,他认为,只有让辅助驾驶变成一个真正的司机,它才是一个生产力工具,不只是一个辅助工具。

最新公布的视频显示,基于 VLA 模型的辅助驾驶系统,驾驶员可以用语音操控车辆,包括走收费站的人工通道、掉头、靠边停车、停在停车场的 C3 区域等等,这都是辅助驾驶从未有过的体验。

对于行业普遍存在的对辅助驾驶安全性的质疑,李想则表示," 这正是黎明前的黑暗 "。他表示,正因为辅助驾驶行业遇到了问题,我最喜欢、最开心的方式,就是去解决行业解决不了的问题,这是我们自己坚决相信的。

李想认为,只要人类会雇佣司机,人工智能技术是把类似这样的一些功能和角色,去变成真正的生产力、生产工具,然后进行替代。

成长带来能量,在痛苦中保持正能量

今年 7 月,理想汽车将迎来成立十周年。李想表示,创业路上苦多于甜,他选择保留那些有价值的美好片段,用来激励自己保持正能量。" 创业确实不容易,但是没必要苦哈哈的。苦和甜是一个硬币的正反面,取决于看哪一面。" 他将企业遭遇的打击视为必须面对的挑战,也正是这些挑战,赋予了理想汽车更多的能力。

谈及如何成为更有能量的人,李想认为,关键在于关注自我,接受自身的优点和不足,并用成长替代改变——成长意味着增强能力。除此之外,李想强调亲密关系同样重要,关注他人的成长也能带来能量,家人和同事能够和他形成互补,相互支撑。" 我需要家人和同事甚至超过了他们需要我,首先是我需要他们,然后才是他们需要我,我们在一起能够形成非常强的脑力和心力。" 李想表示。

回顾几次创业经历,李想表示,从高中创办个人网站至今,自己的思维方式没有什么变化:遇到问题解决问题,解决别人不愿解决的难题,解决用户的痛点,不断向他人学习。不同的是,如今面临的问题更复杂、服务的用户群体更多、公司规模和组织也更庞大。" 几次创业一路走来,最难时有人相助,遇坑也能迅速爬出,一帮人齐心协力变得更好,这是种幸运,也没什么可后悔的。"

AI 的真正爆发,不仅是技术参数的跃升,更是从 " 参考 " 到 " 生产 " 的范式转移。司机大模型,或许正是理想汽车投向未来的一张王牌。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

李想 ai 人工智能 创始人 美国
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论