算苗3D TokenPU正式流片引领国产AI云端大算力芯片再升级

中国北京（2026年6月17日）— 专注 3D 架构 AI 云端大算力芯片研发设计的算苗科技今日宣布，旗下面向大模型推理的 3D TokenPU 芯片 A4E 已于 6 月 15 日正式流片，标志着中国在高端 AI 算力芯片领域，实现依托国产供应链、采用 3D 混合堆叠架构的大模型专用处理器落地，有望为国内大模型产业提供自主可控、高性能、高性价比的算力支撑。

大模型时代原生设计专注推理能效比

当前，AI 产业正加速由训练向推理迁移。德勤预测，未来超 80% 的算力需求将集中在推理侧。然而，大模型推理长期受制于 " 内存墙、算力墙、通信墙 " 三大核心瓶颈，尤其是数据在存储器与处理器之间的频繁搬运，造成高达 80% 的能耗和 70% 的成本压力。

作为大模型时代原生的算力芯片企业，算苗科技首创 3D TokenPU 架构，跳出通用 GPU 的设计思路，专攻推理场景极致性能。第一代产品 A4E 将 8 层存储晶圆垂直堆叠在计算逻辑晶圆上，通过硅通孔（TSV）与凸点（bump）技术实现微米级互联，将传统芯片间的 " 毫米级 " 传输距离压缩两个数量级，带来 16TB/s 的超大访存带宽，有效缓解数据饥饿问题。

在架构设计方面，算苗科技引入 Tile-Native

软硬件协同理念，将 Tile 作为数据搬运、存储和计算的基本单元，实现 " 一次搬运、多次复用 " 的高效模式。硬件原生支持 Tile 级数据调度与多精度动态切换，软件端则构建适配 LLVM、Triton 等开源生态的编译工具栈，兼顾开发者友好性与算子优化效率。这种 " 硬件架构 - 软件工具 - 算法特性 " 的闭环优化，为大模型推理提供了更高性能和更低 TCO（总拥有成本）。

" 我们不是在别人的赛道上追赶，而是在开辟新的方向。" 算苗科技创始人兼 CEO 汪福全博士表示，"3D TokenPU 专为大模型 Token 处理而生，不必单纯依赖制程缩小，就能实现算力密度、能效比的跨越式提升。"

从设计到制造自主可控面向量产

算苗科技已构建起覆盖芯片设计、核心 IP、制造、封装的国产化供应链体系。A4E 芯片基于自研 RISC-V 架构与自研 IP、自研软件体系打造，与国内头部供应链伙伴深度合作，采用成熟国产工艺也可实现卓越推理性能。在工程化量产层面，算苗团队核心成员已在高通量存算一体芯片项目中，完成万片级 3D 混合堆叠晶圆的量产，是全球少数掌握该技术的团队之一。同时，公司构建了高精尖人才梯队，研发人员占比超 80%，核心骨干来自中科院、清华、北大等顶尖院校，兼具深厚的半导体工程化落地与 AI 前沿算法研究能力。

携手客户深耕千亿级推理市场

当前全球大模型推理市场已迈入千亿美金规模，中国市场也达到数千亿人民币规模。算苗 3D TokenPU 的核心客户为头部大模型厂商，目前已联手客户开展近一年的深度研发工作；从芯片定义阶段便锚定真实推理场景需求，针对性完成架构与底层算法深度调优，实现 AI 算力和大模型算法的极致匹配。

算苗 3D TokenPU 大算力芯片的技术路线与产业化潜力，也获得了资本市场的高度认可。公司已先后完成多轮融资，投资方覆盖国资平台、头部市场化基金与一线产业资本，包括国开金融、北京顺禧、源码资本、石溪资本、联想创投、襄禾资本等。

宙世代

一起剪

相关标签