
芯东西(公众号:aichip001)
作者 | ZeR0
编辑 | 漠影
芯东西 6 月 15 日报道,刚刚,理想汽车在 Livis Day 活动上展示了其采用 5nm 制程的自研 AI 芯片马赫 M100,披露架构细节,并称这是 " 全球首款动态数据流 AI 芯片 "。
不久前,理想马赫 M100 已搭载在其最新上市的全新理想 L9 车型上,随着车型上市交付,已经实现落地商用。

马赫 M100 采用5nm车规级工艺,基于数据流架构设计,算力达1280TOPS,算力利用率达82%。

" 给我拍张照片,要不网上留下的都是我举桌子的。" 理想汽车董事长兼 CEO 李想举起马赫 M100 芯片说," 这张照片,在我旁边标上「全世界性能最强的 AI 芯片」。"

理想汽车基座模型负责人詹锟谈道,双马赫 M100 芯片算力达到2560TOPS,模仿学习规模提升50%,强化学习规模提升15 倍,模型参数量提升10 倍,模型计算量提升15 倍。

理想汽车 CTO 谢炎详细解读了马赫 M100 芯片,称这是 "全世界量产的最强大的车规级算力芯片"。
他解释说,基于 SMT 架构的 GPGPU,达到 82% 的实际算力利用率是非常困难的。

AI 的计算天然是并行的。数据是张量的,关系是确定的,数据流动路径是清晰的。让数据的流动来驱动计算的发生,让架构本身围绕 AI 的计算形态来设计,这就是数据流架构。
" 它是用完全不同的思路造出来一栋完全不同的房子。" 谢炎谈道," 冯 · 诺伊曼架构用 70 年推动了通用计算的辉煌,今天我们以马赫 M100 为起点,希望用数据流架构接过历史这一棒,继续推动 AI 计算再辉煌 70 年。"
马赫 M100 芯片 SoC 把超过一半的面积给了神经网络处理器(NPU)。NPU 包含 56 个计算单元,提供 1280TOPS AI 算力。

CPU 部分由 24 核 Arm Cortex-A78AE 核心组成,主频为 2.3GHz,这是车载旗舰级大核,负责安全和系统控制。

另外还有 8 路LPDDR5X子系统实现273GB/s高带宽,提供片外大容量内存高速通道。
据谢炎分享,与全球智驾领域主流芯片英伟达 Thor-U 直接对比,基于 CNN 的骨干网络、UniAD 和理想马赫 VLA 模型,每一个测试,马赫 M100 全部超越 Thor-U,不是略微领先,而是数倍的性能差距。

除了智能驾驶外,马赫 M100 还能跑其他大模型,比如部署 Qwen3.5-35B-A3B 通用大模型。
英伟达桌面超算 DGX-Spark 的售价 4 万元,测试结果显示,马赫 M100 的 prefill 速度是 DGX-Spark 的2.7 倍,decode 速度是 DGX-Spark 的1.5 倍。

" 这是一个装在车里的芯片,比一台 4 万块的桌面超算跑得更快。" 谢炎说。
今年马赫 M100 芯片架构的论文已经入选国际顶会—— ISCA 2026 国际计算机体系结构研讨会工业分区。
谢炎强调道,理想汽车是汽车行业中历史上第一家在 ISCA 工业分区获得论文录取的企业,与其同期入选的是谷歌、美光、Meta、Ampere、MongoBoost 等。

理想汽车提出并实践了一种创新的架构思路,马赫 M100 架构团队将于6 月 30 日在 ISCA 2026 会议现场进行主题分享。
最好的芯片还不够,理想在马赫 M100 的基础上构建了一套完整的具身智能系统,包括心脏、眼睛、大脑、手脚、神经系统,这些模块协同工作,形成一个整体。

星环 OS 是理想为 AI 原生设计的操作系统," 感知 - 决策 - 执行 " 全链路深度融合,通过系统协同,把端到端延时压缩到0.28 秒,反应速度比人类快40%。

安全也是马赫 M100 最重要的价值之一。理想将把密钥保护、设备身份、可信启动链、关键权限管控全部前置到芯片设计中,再通过全栈自研的软件实现统一调度,让芯片、编译器、操作系统、AI 算法在同一套可信的基础上协同运行,这是覆盖全链路的纵深防御体系。

随着马赫 M100 量产部署,理想汽车已实现芯片编译器、操作系统、AI 算法及域控制器的全栈自研,系统的每一行代码、每一处硬件设计、每一套运行逻辑全部由理想自己掌控。

马赫 M100 的能力远不止于智能驾驶,它已经跑通了车上所有智能化场景,能运行大语言模型、支持智能代理,将驱动具身智能,还会支持更多我们今天还没有想到的 AI 场景,并将持续进化。

谢炎总结说,这就是理想造芯片的原因,不是为了今天,是为了接下来的 70 年。


登录后才可以发布评论哦
打开小程序可以发布评论哦