迈特芯发布3D-LPU技术路线图：率先布局词元循环经济——端侧AI芯片生态

深圳市迈特芯科技有限公司亮相 2026 第十届集微大会端侧 AI 峰会，正式发布面向词元循环经济的 3D-LPU 技术路线图，率先提出 " 低韬高词元 " 端侧推理新范式，以 3D 分布式 TPU 架构突破行业 " 功耗 - 算力 - 内存墙 " 三重瓶颈。

行业背景：推理需求十年万倍，词元循环经济崛起

当前 AI 推理需求正在迎来爆发式增长，预计未来推理需求将是今天的 10,000 倍。整个行业正经历支持词元循环（词元生成及词元消费）的范式转移——词元不仅需要被高效生成，更需要在云、边、端各层级被持续消费与闭环调度。

词元循环经济

然而，受限于云端的高延迟与数据隐私问题，真正支持智能体自主运行的本地终端算力始终是短板。迈特芯创始人、南科大教授余浩在本次峰会上指出：

「低韬（低延迟）、高词元效率」的端侧AI 是词元循环经济的核心基础设施，也是下一代 AI 生态的竞争制高点。

云 · 边 · 端三层协同：构建词元循环生态

围绕多层级词元生态，迈特芯正式公布云、边、端三层协同布局：

多层级词元生态协同

云端 OPC 级「词元推理机」：支持 700B 超大规模模型，面向数据中心与行业旗舰应用；

边侧企业级「词元推理卡」：面向 70B 模型，适配 AI-NAS 盒子、AI 工作站等企业级场景；

端侧家庭级「词元推理芯」：针对 7B 模型，赋能 AI 手机、AI 学习本、AI 医疗本及具身终端。

三层架构打通了从数据中心到个人终端的算力链路，实现词元的高效生成与持续流通，真正建立起可运转的词元循环经济。

核心技术：3D-LPU 重构端侧推理架构

针对端侧大模型芯片（LPU）现有方案的三大痛点—— " 功耗 - 算力 - 成本 " 的不可能三角、内存墙瓶颈、场景适配矛盾——迈特芯发布基于 3D-DRAM 近存计算的 3D 分布式 TPU（3D-LPU）技术路线，从架构层面提出根本性解决方案。

3D-LPU 架构简图

关键技术突破

立方脉动计算（Cubic Systolic）：相比 Google Atomic Systolic，能效提升 1.24 倍，面积减少 20%，动态功耗降低 42%；

3D 分布式 IO 直连：计算单元与内存垂直直通，带宽高达 600 GBps，带宽利用率达 80%（传统 2D NoC 仅 10 – 50%）；

极低能耗传输：能效比从 7.0 – 9.5 pJ/bit 提升至 0.8 – 1.5 pJ/bit，总功耗从 33.6 – 45.6W 降至 3.8 – 7.2W，互连延迟从 20 – 40ns 缩短至 5ns 以内。

核心性能指标

平均功耗 ~5W | 带宽 600 GBps | 带宽利用率 ~80% | 推理速度 80 – 100 tokens/s | 词元能效比领先竞品 10 倍

技术路线图：从验证到量产四步跨越

依托全栈自研的核心优势，迈特芯正加速推进 " 芯 - 端 - 云 " 一体化布局，通过以下四个关键节点，稳步实现从实验室验证到终端生态落地的四阶段跃迁路径：

2023 年：完成 TPU IP 验证，立方脉动架构全面超越标量脉动基准指标；

2024 年：完成分布式 LLM-TPU FPGA 验证（VCU128 平台），实现 75 tokens/s 推理、带宽利用率 75%，优于 A100 GPU 方案；

2025 年：推进 3D 分布式 LLM-TPU 流片（MetaChip，全国产供应链），于 2026 年初正式流片；

2026 年：推出 LPU 终端 AIOS —— MetaClaw（大麦机器人），正式进入规模化产品落地阶段。

产品矩阵：从单芯到推理卡，覆盖全场景

迈特芯基于 3D-LPU 技术路线推出覆盖多算力层级的产品矩阵：

MC_mega_188（Base 系列）：3D DRAM 2.5GB，适配 0.5B – 3B 模型，超低功耗，针对消费电子终端（AI 手机、可穿戴）；

MC_mega_288/488（Pro 系列）：3D DRAM 5GB/10GB，适配 4B – 9B 模型，面向 AI 平板、AI-PC 及具身智能终端；

4 芯 MC_mega_488（Pro+ 系列）推理卡：3D DRAM 40GB，支持 27B/35B 模型，针对 AI-NAS 盒子与边缘计算场景；

8 芯 MC_mega_488（Pro Max 系列）推理卡：3D DRAM 80GB，支持 122B 超大模型，面向行业级 token 工厂。

近期规划产品中，35B-MOE 推理卡（功耗约 40W，算力约 40 TOPS）可实现 80 tokens/s，120B-MOE 推理卡（功耗约 80W，算力约 80 TOPS）可实现 40 tokens/s，均已完成 Qwen、GLM、MiniCPM 等主流开源大模型的适配验证。

MetaClaw 大麦机器人：端侧 AI 智能体落地标杆

迈特芯同步发布旗舰家庭 AIOS 方案 MetaClaw（大麦机器人），以 LPU 为算力底座，构建软硬一体化的端侧智能体生态：

南向生态：深度兼容千问 Qwen、面壁 MiniCPM、谷歌 Gemma 等主流大模型；

北向应用：自研数十种 Skill 技能包，通过飞书、QQ、钉钉等分身实现远程调度与本地执行；

MetaBook 本地知识库：支持 PDF/Word/PPT/ 视频等多格式本地知识管理，个人数据全程不出设备；

多虾协同：单 Agent 到多 Agent 协作，实现「观察 - 决策 - 执行」全自治闭环；

具身智能：联动 IoT 与四足机器人（龙虾狗）、机械臂（龙虾臂），将 AI 算力延伸至物理世界。

MetaClaw 正式落地「龙虾终端」产品生态，涵盖龙虾盒子、龙虾平板、AI-NAS、AI 学习本、AI 医疗本及具身机器人等多条产品线，形成完整的家庭 AI 生态闭环。

市场前景：千亿赛道，国产替代加速

2025 年被业界公认为「端侧 AI 元年」。据测算，全球端侧 AI 市场将从 2025 年的 3219 亿元增长至 2029 年的 1.2 万亿元，复合年增长率高达 39.6%。预计到 2028 年，全球 GenAI 智能手机、AI PC 及可穿戴设备出货量将达 40 亿台。

在国产替代浪潮下，迈特芯 3D-LPU 全国产供应链的路线具有天然战略优势。公司已与国内头部大厂在终端、数通、具身等领域展开联合业务开发，并与麒麟软件、全志科技等合作伙伴构建产业生态联盟。公司将持续以自主研发的低功耗大模型推理芯片（LPU）为核心，推动 AI 算力从云端走向本地，赋能智能终端从 " 感知 " 向 " 决策 - 执行 " 闭环进化。

2026 年底目标：样片量产 | 2027 年：大规模规模化落地 | 持续迭代 14nm/7nm 工艺，词元能效比持续提升

关于迈特芯

深圳市迈特芯科技有限公司于 2023 年在深圳成立，专注于端侧大模型 AI 协处理器芯片研发。公司以「让每个设备成为懂你的个人智能体」为愿景，致力于成为全球端侧大模型芯片领军企业。

公司由国家特聘专家、万人领军人才、3DIC 国际最佳论文获得者余浩教授领衔，核心团队汇聚国家领军人才、吴文俊人工智能奖得主，以及来自华为、中兴、大疆、微软等行业大厂的资深专家，具备丰富的芯片量产及产业化落地经验。

宙世代

一起剪

相关标签