李想举起5nm自研AI芯片，甩出关键细节

芯东西（公众号：aichip001）

作者 | ZeR0

编辑 | 漠影

芯东西 6 月 15 日报道，刚刚，理想汽车在 Livis Day 活动上展示了其采用 5nm 制程的自研 AI 芯片马赫 M100，披露架构细节，并称这是 " 全球首款动态数据流 AI 芯片 "。

不久前，理想马赫 M100 已搭载在其最新上市的全新理想 L9 车型上，随着车型上市交付，已经实现落地商用。

马赫 M100 采用5nm车规级工艺，基于数据流架构设计，算力达1280TOPS，算力利用率达82%。

" 给我拍张照片，要不网上留下的都是我举桌子的。" 理想汽车董事长兼 CEO 李想举起马赫 M100 芯片说，" 这张照片，在我旁边标上「全世界性能最强的 AI 芯片」。"

理想汽车基座模型负责人詹锟谈道，双马赫 M100 芯片算力达到2560TOPS，模仿学习规模提升50%，强化学习规模提升15 倍，模型参数量提升10 倍，模型计算量提升15 倍。

理想汽车 CTO 谢炎详细解读了马赫 M100 芯片，称这是 "全世界量产的最强大的车规级算力芯片"。

他解释说，基于 SMT 架构的 GPGPU，达到 82% 的实际算力利用率是非常困难的。

AI 的计算天然是并行的。数据是张量的，关系是确定的，数据流动路径是清晰的。让数据的流动来驱动计算的发生，让架构本身围绕 AI 的计算形态来设计，这就是数据流架构。

" 它是用完全不同的思路造出来一栋完全不同的房子。" 谢炎谈道，" 冯 · 诺伊曼架构用 70 年推动了通用计算的辉煌，今天我们以马赫 M100 为起点，希望用数据流架构接过历史这一棒，继续推动 AI 计算再辉煌 70 年。"

马赫 M100 芯片 SoC 把超过一半的面积给了神经网络处理器（NPU）。NPU 包含 56 个计算单元，提供 1280TOPS AI 算力。

CPU 部分由 24 核 Arm Cortex-A78AE 核心组成，主频为 2.3GHz，这是车载旗舰级大核，负责安全和系统控制。

另外还有 8 路LPDDR5X子系统实现273GB/s高带宽，提供片外大容量内存高速通道。

据谢炎分享，与全球智驾领域主流芯片英伟达 Thor-U 直接对比，基于 CNN 的骨干网络、UniAD 和理想马赫 VLA 模型，每一个测试，马赫 M100 全部超越 Thor-U，不是略微领先，而是数倍的性能差距。

除了智能驾驶外，马赫 M100 还能跑其他大模型，比如部署 Qwen3.5-35B-A3B 通用大模型。

英伟达桌面超算 DGX-Spark 的售价 4 万元，测试结果显示，马赫 M100 的 prefill 速度是 DGX-Spark 的2.7 倍，decode 速度是 DGX-Spark 的1.5 倍。

" 这是一个装在车里的芯片，比一台 4 万块的桌面超算跑得更快。" 谢炎说。

今年马赫 M100 芯片架构的论文已经入选国际顶会—— ISCA 2026 国际计算机体系结构研讨会工业分区。

谢炎强调道，理想汽车是汽车行业中历史上第一家在 ISCA 工业分区获得论文录取的企业，与其同期入选的是谷歌、美光、Meta、Ampere、MongoBoost 等。

理想汽车提出并实践了一种创新的架构思路，马赫 M100 架构团队将于6 月 30 日在 ISCA 2026 会议现场进行主题分享。

最好的芯片还不够，理想在马赫 M100 的基础上构建了一套完整的具身智能系统，包括心脏、眼睛、大脑、手脚、神经系统，这些模块协同工作，形成一个整体。

星环 OS 是理想为 AI 原生设计的操作系统，" 感知 - 决策 - 执行 " 全链路深度融合，通过系统协同，把端到端延时压缩到0.28 秒，反应速度比人类快40%。

安全也是马赫 M100 最重要的价值之一。理想将把密钥保护、设备身份、可信启动链、关键权限管控全部前置到芯片设计中，再通过全栈自研的软件实现统一调度，让芯片、编译器、操作系统、AI 算法在同一套可信的基础上协同运行，这是覆盖全链路的纵深防御体系。

随着马赫 M100 量产部署，理想汽车已实现芯片编译器、操作系统、AI 算法及域控制器的全栈自研，系统的每一行代码、每一处硬件设计、每一套运行逻辑全部由理想自己掌控。

马赫 M100 的能力远不止于智能驾驶，它已经跑通了车上所有智能化场景，能运行大语言模型、支持智能代理，将驱动具身智能，还会支持更多我们今天还没有想到的 AI 场景，并将持续进化。

谢炎总结说，这就是理想造芯片的原因，不是为了今天，是为了接下来的 70 年。

宙世代