芯榜 昨天
迈特芯发布3D-LPU技术路线图:率先布局词元循环经济——端侧AI芯片生态
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

深圳市迈特芯科技有限公司亮相 2026 第十届集微大会端侧 AI 峰会,正式发布面向词元循环经济的 3D-LPU 技术路线图,率先提出 " 低韬高词元 " 端侧推理新范式,以 3D 分布式 TPU 架构突破行业 " 功耗 - 算力 - 内存墙 " 三重瓶颈。

行业背景:推理需求十年万倍,词元循环经济崛起

当前 AI 推理需求正在迎来爆发式增长,预计未来推理需求将是今天的 10,000 倍。整个行业正经历支持词元循环(词元生成及词元消费)的范式转移——词元不仅需要被高效生成,更需要在云、边、端各层级被持续消费与闭环调度。

词元循环经济

然而,受限于云端的高延迟与数据隐私问题,真正支持智能体自主运行的本地终端算力始终是短板。迈特芯创始人、南科大教授余浩在本次峰会上指出:

「低韬(低延迟)、高词元效率」的端侧AI 是词元循环经济的核心基础设施,也是下一代 AI 生态的竞争制高点。

云 · 边 · 端三层协同:构建词元循环生态

围绕多层级词元生态,迈特芯正式公布云、边、端三层协同布局:

多层级词元生态协同

云端   OPC 级「词元推理机」:支持 700B 超大规模模型,面向数据中心与行业旗舰应用;

边侧企业级「词元推理卡」:面向 70B 模型,适配 AI-NAS 盒子、AI 工作站等企业级场景;

端侧家庭级「词元推理芯」:针对 7B 模型,赋能 AI 手机、AI 学习本、AI 医疗本及具身终端。

三层架构打通了从数据中心到个人终端的算力链路,实现词元的高效生成与持续流通,真正建立起可运转的词元循环经济。

核心技术:3D-LPU 重构端侧推理架构

针对端侧大模型芯片(LPU)现有方案的三大痛点—— " 功耗 - 算力 - 成本 " 的不可能三角、内存墙瓶颈、场景适配矛盾——迈特芯发布基于 3D-DRAM 近存计算的 3D 分布式 TPU(3D-LPU)技术路线,从架构层面提出根本性解决方案。

3D-LPU 架构简图

关键技术突破

立方脉动计算(Cubic Systolic):相比 Google Atomic Systolic,能效提升 1.24 倍,面积减少 20%,动态功耗降低 42%;

3D 分布式 IO 直连:计算单元与内存垂直直通,带宽高达 600 GBps,带宽利用率达 80%(传统 2D NoC 仅 10 – 50%);

极低能耗传输:能效比从 7.0 – 9.5 pJ/bit 提升至 0.8 – 1.5 pJ/bit,总功耗从 33.6 – 45.6W 降至 3.8 – 7.2W,互连延迟从 20 – 40ns 缩短至 5ns 以内。

核心性能指标

平均功耗   ~5W |   带宽 600 GBps   |   带宽利用率 ~80%   |   推理速度 80 – 100 tokens/s   |   词元能效比领先竞品 10 倍

技术路线图:从验证到量产四步跨越 

依托全栈自研的核心优势,迈特芯正加速推进 " 芯 - 端 - 云 " 一体化布局,通过以下四个关键节点,稳步实现从实验室验证到终端生态落地的四阶段跃迁路径:

2023 年:完成 TPU IP 验证,立方脉动架构全面超越标量脉动基准指标;

2024 年:完成分布式 LLM-TPU FPGA 验证(VCU128 平台),实现 75 tokens/s 推理、带宽利用率 75%,优于 A100 GPU 方案;

2025 年:推进 3D 分布式 LLM-TPU 流片(MetaChip,全国产供应链),于 2026 年初正式流片;

2026 年:推出 LPU 终端 AIOS —— MetaClaw(大麦机器人),正式进入规模化产品落地阶段。

产品矩阵:从单芯到推理卡,覆盖全场景

迈特芯基于 3D-LPU 技术路线推出覆盖多算力层级的产品矩阵:

MC_mega_188(Base 系列):3D DRAM 2.5GB,适配 0.5B – 3B 模型,超低功耗,针对消费电子终端(AI 手机、可穿戴);

MC_mega_288/488(Pro 系列):3D DRAM 5GB/10GB,适配 4B – 9B 模型,面向 AI 平板、AI-PC 及具身智能终端;

4 芯 MC_mega_488(Pro+ 系列)推理卡:3D DRAM 40GB,支持 27B/35B 模型,针对 AI-NAS 盒子与边缘计算场景;

8 芯 MC_mega_488(Pro Max 系列)推理卡:3D DRAM 80GB,支持 122B 超大模型,面向行业级 token 工厂。

近期规划产品中,35B-MOE 推理卡(功耗约 40W,算力约 40 TOPS)可实现 80 tokens/s,120B-MOE 推理卡(功耗约 80W,算力约 80 TOPS)可实现 40 tokens/s,均已完成 Qwen、GLM、MiniCPM 等主流开源大模型的适配验证。

MetaClaw 大麦机器人:端侧 AI 智能体落地标杆

迈特芯同步发布旗舰家庭 AIOS 方案 MetaClaw(大麦机器人),以 LPU 为算力底座,构建软硬一体化的端侧智能体生态:

南向生态:深度兼容千问 Qwen、面壁 MiniCPM、谷歌 Gemma 等主流大模型;

北向应用:自研数十种 Skill 技能包,通过飞书、QQ、钉钉等分身实现远程调度与本地执行;

MetaBook 本地知识库:支持 PDF/Word/PPT/ 视频等多格式本地知识管理,个人数据全程不出设备;

多虾协同:单 Agent 到多 Agent 协作,实现「观察 - 决策 - 执行」全自治闭环;

具身智能:联动 IoT 与四足机器人(龙虾狗)、机械臂(龙虾臂),将 AI 算力延伸至物理世界。

MetaClaw 正式落地「龙虾终端」产品生态,涵盖龙虾盒子、龙虾平板、AI-NAS、AI 学习本、AI 医疗本及具身机器人等多条产品线,形成完整的家庭 AI 生态闭环。

市场前景:千亿赛道,国产替代加速

2025 年被业界公认为「端侧 AI 元年」。据测算,全球端侧 AI 市场将从 2025 年的 3219 亿元增长至 2029 年的 1.2 万亿元,复合年增长率高达 39.6%。预计到 2028 年,全球 GenAI 智能手机、AI PC 及可穿戴设备出货量将达 40 亿台。

在国产替代浪潮下,迈特芯 3D-LPU 全国产供应链的路线具有天然战略优势。公司已与国内头部大厂在终端、数通、具身等领域展开联合业务开发,并与麒麟软件、全志科技等合作伙伴构建产业生态联盟。公司将持续以自主研发的低功耗大模型推理芯片(LPU)为核心,推动 AI 算力从云端走向本地,赋能智能终端从 " 感知 " 向 " 决策 - 执行 " 闭环进化。

2026 年底目标:样片量产 |   2027 年:大规模规模化落地   |   持续迭代 14nm/7nm 工艺,词元能效比持续提升

关于迈特芯

深圳市迈特芯科技有限公司于 2023 年在深圳成立,专注于端侧大模型 AI 协处理器芯片研发。公司以「让每个设备成为懂你的个人智能体」为愿景,致力于成为全球端侧大模型芯片领军企业。

公司由国家特聘专家、万人领军人才、3DIC 国际最佳论文获得者余浩教授领衔,核心团队汇聚国家领军人才、吴文俊人工智能奖得主,以及来自华为、中兴、大疆、微软等行业大厂的资深专家,具备丰富的芯片量产及产业化落地经验。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 创始人
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论