芯榜 05-20
平头哥发布新AI芯片(4代路线图公布)
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

平头哥:全栈布局 GPU、CPU、网络、存储

5 月 20 日,在 2026 阿里云峰会上,阿里发布基于平头哥新一代 AI 芯片真武 M890 的 128 卡超节点服务器,搭载互联芯片 ICN Switch 1.0,通信时延低至百纳秒级,可让 128 张 AI 芯片组成一台计算机,满足海量 Agent 并发推理和大模型训练需求。目前,该超节点服务器已上线阿里云百炼,支持 Qwen、DeepSeek、Kimi 等主流模型。

Agent 时代,算力集群需要承载成千上万个 Agent 同时运行,每个 Agent 在一次任务中可能连续发起数十次模型调用,这对通信时延和带宽有极高要求。磐久 AL128 超节点服务器基于自研 AI 芯片和互联芯片打造,通过单机柜 128 卡紧密耦合互联,P2P 时延低于 150ns,单柜带宽达到 Pb/s 级,可支海量 Agent 的并发请求。

首次亮相的真武 M890 采用自研并行计算架构,内置 144GB 显存,性能是真武 810E 的 3 倍,片间互联带宽达到 800GB/s,芯片原生支持 FP32 到 FP4 等多种数据精度,可应用于高精度训练、低精度和超低精度推理的全场景,低精度推理场景下,不仅可以保证模型输出质量,还能显著降低单次推理的算力开销。

平头哥互联芯片 ICN Switch 1.0 支持自研 ICN 互联总线协议和 PCCL 通信库,吞吐量达 25.6Tbps,可支持真武 M890 的高效互联,提升 AI 集群的算力效率。

真武 M890 搭配 ICN Switch 1.0 芯片,可实现 64 卡全带宽互联,显著提升大规模智算集群计算的效率与稳定性。基于平头哥自研 T-Head SAIL 软件栈的软硬协同,可最大程度释放芯片的算力。

大会现场,平头哥首次公布真武系列 AI 芯片的规划,未来两年将陆续推出算力更强的真武 V900、真武 J900 两代芯片,以满足 Agent 时代千行百业的 AI 算力需求。目前,真武系列芯片已累计出货 56 万片,服务了中国电信、中国一汽、浦发银行等 20 多个行业的 400 多家客户。

随着 Agent 应用的爆发,AI 的核心任务逐渐从纯对话转向任务执行,这不仅需要高 AI 算力支撑,其任务规划、状态管理、工具调用等环节极其依赖 CPU,CPU 成为影响 Agent 执行效率的关键部件。平头哥拥有自研的服务器 CPU 倚天系列,可与真武 AI 芯片高效协同,大幅提升 AI 推理效率,有效应对 Agent 高并发任务的负载压力。

目前,平头哥已推出真武系列 AI 芯片、倚天系列 Arm 服务器 CPU、磐脉系列智能网卡、镇岳系列存储主控芯片、ICN Switch 互联芯片等数据中心核心芯片,实现算力、网力和存力的全栈自研。

平头哥发布新一代 AI 芯片,披露路线图

平头哥规划了 2024 – 2028 年的四代产品,核心围绕自研并行计算架构升级、性能 3 倍提升、显存与片间互联带宽持续扩容展开:

2024 年 Q2:真武 810E

高易用训推一体 AI 芯片,搭载 96GB 显存,700GB/s 片间互联带宽。

2026 年 Q2:真武 M890

全面升级自研并行计算架构,性能提升 3 倍,配备 144GB 显存,800GB/s 片间互联带宽。

2027 年 Q3:真武 V900

深度迭代自研并行计算架构,性能再提升 3 倍,显存扩容至 216GB,片间互联带宽达 1200GB/s。

2028 年 Q3:真武 J900

实现自研并行计算架构跨越革新,持续突破性能上限。

-- 完 --

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论