时代周报 昨天
阿里也要“复制”英伟达?自研AI芯片、超节点同步亮相,真武GPU已出货56万片
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

本文来源:时代周报 作者:朱成呈 闫晓寒

AI 基础设施的竞争,正在从单卡算力转向系统能力。

5 月 20 日,阿里发布基于平头哥新一代 AI 芯片真武 M890 的 128 卡超节点服务器,并同步推出互联芯片 ICN Switch 1.0。按照官方披露,其通信时延最低可压缩至百纳秒级,128 张 AI 芯片可被组成 " 一台计算机 ",用于大模型训练与海量 Agent 并发推理。

这是阿里首次较为完整地展示其 AI 基础设施的全栈路线。目前,平头哥已推出真武系列 AI 芯片、倚天系列 Arm 服务器 CPU、磐脉系列智能网卡、镇岳系列存储主控芯片、ICN Switch 互联芯片等数据中心核心芯片,实现算力、网力和存力的全栈自研。

其中,首次亮相的真武 M890 采用自研并行计算架构,内置 144GB 显存,性能是真武 810E 的 3 倍,片间互联带宽达到 800GB/s,芯片原生支持 FP32 到 FP4 等多种数据精度,可应用于高精度训练、低精度和超低精度推理的全场景。

不过,若单看 GPU 性能,真武 M890 与英伟达 H200 仍存在差距。阿里此次真正要追赶的,似乎并不只是单颗 GPU 性能,而是英伟达的整套 AI 基础设施体系。从芯片、互联协议到超节点,阿里开始尝试构建自己的 NVLink 生态。

深度科技研究院院长张孝荣向时代周报记者表示," 在现有国产方案中,128 卡超节点与 150 纳秒时延,这个指标属于领先水平,可以比肩国际主流。但需要注意,真武卡(性能对标 A800)本身尚未达到国际一流水平。"

" 与英伟达相比,阿里方案在时延这一最难攻克的指标上已实现反超,但在带宽和生态成熟度上仍有差距。" 半导体资深专家张国斌向时代周报记者指出,英伟达的优势在于 NVLink 生态成熟,CUDA 对 NVLink 的内存统一编址支持已迭代多年,软件栈完善。此外,英伟达 NVL72 可通过 NVLink Switch 扩展至 576 卡,国产方案目前主要聚焦 Scale-up(单节点内互联)。

新晋 " 全栈自研 " 玩家

随着大模型从 Chatbot 向 Agent 演进,计算负载重心正发生偏移。Agent 不仅需要 GPU 进行模型推理,更依赖高性能 CPU 处理复杂逻辑编排、工具调用与内存管理。

国泰海通证券研报指出,智能体 AI 带来的 CPU 算力需求结构性爆发,过去 CPU 与 GPU 配比约为 1:4 或 1:8,现在正向 1:1 靠拢,特定场景下 CPU 数量可能超过 GPU。

英伟达 CEO 黄仁勋曾公开表示,未来世界上将会出现数十亿个智能体,这些智能体将使用工具,就像人类今天使用电脑,届时所有的思考和编排行为都将在 GPU 上进行。

这一趋势下,全球主要算力厂商均开始强化 CPU 布局。

今年 1 月,英伟达推出首款面向 Agentic AI 设计的定制 CPU Vera。当地时间 5 月 20 日,英伟达管理层在财报电话会上表示,预计今年 CPU 收入有望达到 200 亿美元,并表示相信公司能够获得足够供应以支撑持续增长。

国内厂商中,平头哥已形成 "GPU+CPU" 的协同路线。其自研倚天系列服务器 CPU,可与真武 AI 芯片协同工作,以提升 AI 推理效率,有效应对 Agent 高并发任务的负载压力。事实上,早在 2021 年,平头哥便发布首颗通用服务器 CPU 倚天 710。这也是国内首款基于 ARMv9 架构、实现大规模商业化量产的 5nm 数据中心芯片。

目前,平头哥公开的产品体系包括真武(AI)、倚天(CPU)、磐脉(网卡)、镇岳(存储)以及 ICN Switch 互联芯片,已初步覆盖 AI 数据中心核心基础设施。国内能够与平头哥形成类似 " 全栈化 " 布局的厂商并不多。其中,华为早在 2019 年便提出,公司已同时具备 CPU、NPU、存储控制、网络互连、智能管理五大关键芯片能力。

相比之下,多数国产 AI 芯片企业仍集中于单一方向突破。例如,百度昆仑芯、寒武纪只有 AI 芯片,并没有 CPU、网卡以及存储芯片。张国斌认为,全栈自研在国内确实是极少数玩家的游戏。华为是六边形战士,平头哥是新晋挑战者,其他厂商均为单点突破。

与华为昇腾路径互补

" 阿里平头哥兼容 CUDA,侧重阿里云原生与推理场景。华为昇腾采用达芬奇架构及 CANN 软件栈,追求技术完全自主,并在政企信创市场深耕。" 张孝荣认为,二者路径互补,各有侧重。

这种差异,本质上对应两种产业模式。平头哥是典型的云厂商自研芯片模式。所有产品先满足阿里云内部需求,再考虑外销。换言之,平头哥并不急于成为独立芯片供应商,其目标更偏向通过自研硬件提升阿里云整体算力效率。这一路径与谷歌 TPU 模式相似,客户购买的是云服务,而非芯片本身。

相比之下,华为则更接近英伟达模式。昇腾芯片、Atlas 服务器、超节点方案直接销售给政企客户、运营商、互联网厂商。张国斌认为,平头哥的芯片与阿里云业务深度耦合,优化方向明确,如 Agentic 推理、通义千问适配,但外销意愿和能力存疑;华为则更早建立独立生态,客户覆盖政府、金融、运营商等。

从市场份额看,国产 AI 芯片仍处于追赶阶段。IDC 数据显示,2025 年中国 AI 加速卡出货量约 400 万片,其中英伟达占据约 55% 的份额,仍居主导地位;国内厂商合计约 165 万片,占比约 41%。具体来看,华为昇腾出货约 81.2 万片,位列第二;阿里平头哥约 26.5 万片,位列第四。

截至目前,真武系列芯片已累计出货 56 万片,服务中国电信、中国一汽、浦发银行等 20 多个行业的 400 多家客户。与此同时,平头哥也首次披露真武系列后续规划——未来两年将陆续推出真武 V900、真武 J900 两代芯片,以满足 Agentic 时代千行百业的 AI 算力需求。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英伟达 阿里 ai芯片 gpu 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论