车东西 2小时前
李想首度回应造芯!弃用传统GPU路线,200人团队苦干四年
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者 | Janson

编辑 | 志豪

理想汽车自研芯片马赫 M100 已到量产装车前夜。

车东西 5 月 12 日消息,就在刚刚,理想汽车 CEO 李想在微博公开了理想自研汽车芯片马赫 M100 的开发版,并附上了一段小作文,回应外界造芯质疑,讲述了造芯初衷。

▲李想公开 M100 芯片真容

李想说,理想自研芯片并不是为了证明 " 自己也能做 ",也不是为了追逐概念,而是为了让 AI 能在物理世界真正运行起来。

按照他的说法,理想想做的是芯片、操作系统、大模型、硬件和云服务的全链条设计,而不是只在某一个环节做到领先。

李想还提到,拼单项冠军的时代已经过去,AI 时代比拼的是系统化能力,是芯片架构、操作系统、模型、编译器、硬件设计和生产工艺的联合设计能力。

这也解释了马赫 M100 为什么会被放在全新一代理想 L9 Livis 上作为核心卖点。

▲ M100 芯片外观

不过,相比一颗芯片本身,外界更关心的是:在车市竞争越来越激烈、价格战持续加深、理想自身也经历产品节奏调整的背景下,为什么还要把自研芯片这种高投入、长周期、强不确定性的项目推到台前?

但从理想方面对外公开的信息来看,理想内部并没有把 " 芯片做出来 " 视为终点。

理想汽车 CTO 谢炎曾公开透露,马赫 M100 在车展前北京车展前夕的业务目标达成度只有约 60%,真正的成功要看搭载这颗芯片的新一代 L9 能否在辅助驾驶、整车体验和市场表现上同时被验证。

换句话说,马赫 M100 的目标是 " 理想能不能通过自研芯片,把 AI 能力变成用户愿意买单的产品体验 "。

01.

马赫 M100 的看点

不走 GPU 路线,押注数据流架构

公开信息显示,即将在本周五也就是 5 月 15 日发布的全新 L9 Livis 将搭载两颗马赫 M100,芯片采用台积电 N5A 工艺,单颗算力 1280TOPS,双芯总算力 2560TOPS。

▲ M100 与 Thor U 规格对比

对此,理想方面称这是是运行 VLA 大模型时的 " 有效算力 ",单颗马赫 M100 的有效算力约为英伟达 Thor U 的 3 倍,双芯组合约为 Thor U 的 5-6 倍。

▲ M100 与 Thor U 跑 UniAD 效率对比

不过,马赫 M100 最有话题度的地方还是理想选择了一条相对少见的技术路线:数据流架构。

在传统理解里,车企自研芯片往往有两种路径:一种是做更强的通用计算平台,尽量接近英伟达这类成熟供应商;另一种是做高度定制的专用加速器,用更低成本跑特定任务。

理想的选择介于两者之间。马赫 M100 试图用数据流架构提升 AI 推理效率,同时保留对不同模型和任务的适配能力。

车东西发现,理想在论文《M100: An Orchestrated Dataflow Architecture Powering General AI Computing》(M100:面向通用 AI 计算的协同编排式数据流架构)中称,M100 面向自动驾驶相关任务、大语言模型和智能人机交互等车端 AI 推理需求,通过编译器与架构协同设计来编排计算,更关键的是编排数据在时间和空间上的移动。

这套路线的核心,是减少传统架构中大量 " 搬数据 " 的损耗。

论文中提到,M100 在很大程度上弱化了缓存式设计,张量计算由编译器和运行时管理的数据流驱动,在计算单元、片上存储和片外存储之间流动,从而提升效率和可扩展性。

▲ M100 时空调度器子图映射和张量流

如果换成更容易理解的说法,传统 GPU 更像一个大型仓储系统,计算单元需要不断去全局内存和缓存里取数据、放数据。

而理想希望马赫 M100 更像一条被提前规划好的流水线,数据按照编译器安排好的路线流到该去的计算单元,减少中间等待和反复搬运。

" 数据流架构 + 编译器协同 " 被视为马赫 M100 区别于传统 GPU 路线的关键。

针对这一特点,论文第一作者,理想汽车 CTO 谢炎在近期也做了公开阐述。

他并不把马赫 M100 定义为一颗单纯服务于辅助驾驶的芯片,而称其为 AI 推理芯片。

按照他的说法,理想未来希望把辅助驾驶、座舱 AI、底盘控制乃至机器人业务里的 AI 计算尽可能集中到同一个体系中,而不是在车上分散布置多个小计算单元。

▲ M100 芯片架构

据悉,这背后有两个现实考量。

第一,车端 AI 的计算量会持续增长。理想下一代自动驾驶架构 MindVLA-o1 引入 3DViT、世界模型、多模态推理和统一行为生成等能力,对车端推理算力提出更高要求;

第二,理想想降低对外部芯片供应节奏的依赖。毕竟,外购高端芯片成本较高,自研如果能实现性能和成本优势,就能在大规模装车后摊薄研发投入,并带来持续的单车成本收益。

不过,马赫 M100 的风险也同样清晰。数据流架构把部分复杂度从硬件转移到了软件、编译器和工具链上。

理想汽车方面表示,马赫 M100 第一版模型从更新到完成车端适配曾花了两个月,后来缩短到不到一周,未来目标是一天内完成适配。

也就是说,马赫 M100 的性能不能只看纸面参数,它最终取决于理想能否持续把模型、编译器、操作系统和芯片做成一个稳定、高效、可迭代的闭环。

02.

理想为什么一定要做芯片

算成本账再到全栈控制权

理想自研芯片的历史线并不长,但节奏很明确,公开资料显示,理想在 2022 年启动自研芯片项目,到目前也不过 4 年。

同时,马赫 M100 也并不是由一个外界想象中动辄数百上千人的庞大芯片团队做出来的。CTO 谢炎加入理想时,芯片团队只有两名员工,不到一个月后只剩一人,项目早期相当长时间里,团队规模也只有二三十人。

目前,理想芯片团队约 200 人,仍小于行业里常见的完整芯片团队规模。

从芯片定义的角度来看,理想一开始没有选择 " 先做小芯片练手 ",理想要解决的核心问题,是车端 AI 推理计算。因此,马赫 M100 从立项开始就瞄准高算力、高效率和量产可用,而不是做一个低风险的试验项目。

这听起来激进,但放在理想的产品逻辑里并不难理解。

理想过去最强的能力是把家庭用户需求做成明确产品标签:空间、舒适、续航、座舱体验,这些都更偏 " 可感知配置 "。

但到了 AI 时代,产品差异化越来越依赖底层系统能力。

▲ M100 芯片主板设计

李想曾在年初为 L9 Livis 预热时说过,要把马赫 M100 放进 " 眼睛、模型、芯片、操作系统 " 组成的完整技术栈里。

因此,马赫 M100 不是一个孤立的硬件项目,而是理想从 " 配置定义产品 " 走向 " 系统定义体验 " 的关键拼图。

它要支撑的不只是城区辅助驾驶,还包括车内多模态交互、主动服务、底盘和整车控制,以及更远期的机器人相关业务。

对此,谢炎也提到,马赫 M100 不是 ASIC 意义上的单一用途芯片,而是可编程的处理单元,目标是适配持续变化的 AI 算法。

定义好了芯片目标,成本同样是理想绕不开的一笔账。

理想方面表示,高端车型使用外部高算力芯片的成本不低,单车可能需要 1600-2000 美元(约合人民币 1.1-1.4 万元),未来还可能上升。

如果自研芯片能把采购成本降一半,同时支撑两到三年的车型周期,就有机会覆盖研发团队投入。这一点在理想汽车 2025 年三季度财报电话会也有所提及。

当然,外界对车企自研芯片的质疑也合理。

毕竟芯片不是只有架构设计,还涉及流片、验证、车规可靠性、供应链、软件生态和长期迭代。

▲理想 L9 Livis

马赫 M100 虽然已经点亮并完成测试,但芯片上车只是开始,真正检验要等到新车交付后,看辅助驾驶能力、整车体验和商业表现能否形成正循环。

但从芯片定义到成本核算再到实际装车,这一套流程跑下来本身也是理想自研芯片最关键的行业意义。

自研芯片并非简单的 " 国产替代 ",也不是单纯的 " 供应链降本 ",而是车企是否有能力掌握 AI 时代的核心技术节奏。

苹果、特斯拉给行业提供过类似参照——当软件、芯片、操作系统和终端体验被同一家公司统筹,产品迭代效率可能会发生变化。但这条路也意味着更高的组织成本和更长的验证周期。

03.

结语:马赫 M100 大考将至

其实,马赫 M100 的技术路线有新意,参数也足够抓眼球,但真正的说服力不在发布会,而在用户每天使用时能不能感受到更快响应、更稳定能力和更自然的车内 AI 体验。

AI 时代的车企,是否必须掌握自己的核心算力?马赫 M100 给出了理想的答案。

但这个答案是否成立,还要由全新 L9 Livis 的实际表现、后续车型搭载规模,以及第二代、第三代芯片的持续迭代来验证。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

芯片 马赫 李想 gpu 英伟达
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论