深圳市迈特芯科技有限公司亮相 2026 第十届集微大会端侧 AI 峰会,正式发布面向词元循环经济的 3D-LPU 技术路线图,率先提出 " 低韬高词元 " 端侧推理新范式,以 3D 分布式 TPU 架构突破行业 " 功耗 - 算力 - 内存墙 " 三重瓶颈。
行业背景:推理需求十年万倍,词元循环经济崛起
当前 AI 推理需求正在迎来爆发式增长,预计未来推理需求将是今天的 10,000 倍。整个行业正经历支持词元循环(词元生成及词元消费)的范式转移——词元不仅需要被高效生成,更需要在云、边、端各层级被持续消费与闭环调度。
词元循环经济
然而,受限于云端的高延迟与数据隐私问题,真正支持智能体自主运行的本地终端算力始终是短板。迈特芯创始人、南科大教授余浩在本次峰会上指出:
「低韬(低延迟)、高词元效率」的端侧AI 是词元循环经济的核心基础设施,也是下一代 AI 生态的竞争制高点。
云 · 边 · 端三层协同:构建词元循环生态
围绕多层级词元生态,迈特芯正式公布云、边、端三层协同布局:
多层级词元生态协同
云端 OPC 级「词元推理机」:支持 700B 超大规模模型,面向数据中心与行业旗舰应用;
边侧企业级「词元推理卡」:面向 70B 模型,适配 AI-NAS 盒子、AI 工作站等企业级场景;
端侧家庭级「词元推理芯」:针对 7B 模型,赋能 AI 手机、AI 学习本、AI 医疗本及具身终端。
三层架构打通了从数据中心到个人终端的算力链路,实现词元的高效生成与持续流通,真正建立起可运转的词元循环经济。
核心技术:3D-LPU 重构端侧推理架构
针对端侧大模型芯片(LPU)现有方案的三大痛点—— " 功耗 - 算力 - 成本 " 的不可能三角、内存墙瓶颈、场景适配矛盾——迈特芯发布基于 3D-DRAM 近存计算的 3D 分布式 TPU(3D-LPU)技术路线,从架构层面提出根本性解决方案。
3D-LPU 架构简图
关键技术突破
立方脉动计算(Cubic Systolic):相比 Google Atomic Systolic,能效提升 1.24 倍,面积减少 20%,动态功耗降低 42%;
3D 分布式 IO 直连:计算单元与内存垂直直通,带宽高达 600 GBps,带宽利用率达 80%(传统 2D NoC 仅 10 – 50%);
极低能耗传输:能效比从 7.0 – 9.5 pJ/bit 提升至 0.8 – 1.5 pJ/bit,总功耗从 33.6 – 45.6W 降至 3.8 – 7.2W,互连延迟从 20 – 40ns 缩短至 5ns 以内。
核心性能指标
平均功耗 ~5W | 带宽 600 GBps | 带宽利用率 ~80% | 推理速度 80 – 100 tokens/s | 词元能效比领先竞品 10 倍
技术路线图:从验证到量产四步跨越
依托全栈自研的核心优势,迈特芯正加速推进 " 芯 - 端 - 云 " 一体化布局,通过以下四个关键节点,稳步实现从实验室验证到终端生态落地的四阶段跃迁路径:
2023 年:完成 TPU IP 验证,立方脉动架构全面超越标量脉动基准指标;
2024 年:完成分布式 LLM-TPU FPGA 验证(VCU128 平台),实现 75 tokens/s 推理、带宽利用率 75%,优于 A100 GPU 方案;
2025 年:推进 3D 分布式 LLM-TPU 流片(MetaChip,全国产供应链),于 2026 年初正式流片;
2026 年:推出 LPU 终端 AIOS —— MetaClaw(大麦机器人),正式进入规模化产品落地阶段。
产品矩阵:从单芯到推理卡,覆盖全场景
迈特芯基于 3D-LPU 技术路线推出覆盖多算力层级的产品矩阵:
MC_mega_188(Base 系列):3D DRAM 2.5GB,适配 0.5B – 3B 模型,超低功耗,针对消费电子终端(AI 手机、可穿戴);
MC_mega_288/488(Pro 系列):3D DRAM 5GB/10GB,适配 4B – 9B 模型,面向 AI 平板、AI-PC 及具身智能终端;
4 芯 MC_mega_488(Pro+ 系列)推理卡:3D DRAM 40GB,支持 27B/35B 模型,针对 AI-NAS 盒子与边缘计算场景;
8 芯 MC_mega_488(Pro Max 系列)推理卡:3D DRAM 80GB,支持 122B 超大模型,面向行业级 token 工厂。
近期规划产品中,35B-MOE 推理卡(功耗约 40W,算力约 40 TOPS)可实现 80 tokens/s,120B-MOE 推理卡(功耗约 80W,算力约 80 TOPS)可实现 40 tokens/s,均已完成 Qwen、GLM、MiniCPM 等主流开源大模型的适配验证。
MetaClaw 大麦机器人:端侧 AI 智能体落地标杆
迈特芯同步发布旗舰家庭 AIOS 方案 MetaClaw(大麦机器人),以 LPU 为算力底座,构建软硬一体化的端侧智能体生态:
南向生态:深度兼容千问 Qwen、面壁 MiniCPM、谷歌 Gemma 等主流大模型;
北向应用:自研数十种 Skill 技能包,通过飞书、QQ、钉钉等分身实现远程调度与本地执行;
MetaBook 本地知识库:支持 PDF/Word/PPT/ 视频等多格式本地知识管理,个人数据全程不出设备;
多虾协同:单 Agent 到多 Agent 协作,实现「观察 - 决策 - 执行」全自治闭环;
具身智能:联动 IoT 与四足机器人(龙虾狗)、机械臂(龙虾臂),将 AI 算力延伸至物理世界。
MetaClaw 正式落地「龙虾终端」产品生态,涵盖龙虾盒子、龙虾平板、AI-NAS、AI 学习本、AI 医疗本及具身机器人等多条产品线,形成完整的家庭 AI 生态闭环。
市场前景:千亿赛道,国产替代加速
2025 年被业界公认为「端侧 AI 元年」。据测算,全球端侧 AI 市场将从 2025 年的 3219 亿元增长至 2029 年的 1.2 万亿元,复合年增长率高达 39.6%。预计到 2028 年,全球 GenAI 智能手机、AI PC 及可穿戴设备出货量将达 40 亿台。
在国产替代浪潮下,迈特芯 3D-LPU 全国产供应链的路线具有天然战略优势。公司已与国内头部大厂在终端、数通、具身等领域展开联合业务开发,并与麒麟软件、全志科技等合作伙伴构建产业生态联盟。公司将持续以自主研发的低功耗大模型推理芯片(LPU)为核心,推动 AI 算力从云端走向本地,赋能智能终端从 " 感知 " 向 " 决策 - 执行 " 闭环进化。
2026 年底目标:样片量产 | 2027 年:大规模规模化落地 | 持续迭代 14nm/7nm 工艺,词元能效比持续提升
关于迈特芯
深圳市迈特芯科技有限公司于 2023 年在深圳成立,专注于端侧大模型 AI 协处理器芯片研发。公司以「让每个设备成为懂你的个人智能体」为愿景,致力于成为全球端侧大模型芯片领军企业。
公司由国家特聘专家、万人领军人才、3DIC 国际最佳论文获得者余浩教授领衔,核心团队汇聚国家领军人才、吴文俊人工智能奖得主,以及来自华为、中兴、大疆、微软等行业大厂的资深专家,具备丰富的芯片量产及产业化落地经验。


登录后才可以发布评论哦
打开小程序可以发布评论哦