本文来源:时代周报 作者:朱成呈 闫晓寒

AI 基础设施的竞争,正在从单卡算力转向系统能力。
5 月 20 日,阿里发布基于平头哥新一代 AI 芯片真武 M890 的 128 卡超节点服务器,并同步推出互联芯片 ICN Switch 1.0。按照官方披露,其通信时延最低可压缩至百纳秒级,128 张 AI 芯片可被组成 " 一台计算机 ",用于大模型训练与海量 Agent 并发推理。
这是阿里首次较为完整地展示其 AI 基础设施的全栈路线。目前,平头哥已推出真武系列 AI 芯片、倚天系列 Arm 服务器 CPU、磐脉系列智能网卡、镇岳系列存储主控芯片、ICN Switch 互联芯片等数据中心核心芯片,实现算力、网力和存力的全栈自研。
其中,首次亮相的真武 M890 采用自研并行计算架构,内置 144GB 显存,性能是真武 810E 的 3 倍,片间互联带宽达到 800GB/s,芯片原生支持 FP32 到 FP4 等多种数据精度,可应用于高精度训练、低精度和超低精度推理的全场景。
不过,若单看 GPU 性能,真武 M890 与英伟达 H200 仍存在差距。阿里此次真正要追赶的,似乎并不只是单颗 GPU 性能,而是英伟达的整套 AI 基础设施体系。从芯片、互联协议到超节点,阿里开始尝试构建自己的 NVLink 生态。
深度科技研究院院长张孝荣向时代周报记者表示," 在现有国产方案中,128 卡超节点与 150 纳秒时延,这个指标属于领先水平,可以比肩国际主流。但需要注意,真武卡(性能对标 A800)本身尚未达到国际一流水平。"
" 与英伟达相比,阿里方案在时延这一最难攻克的指标上已实现反超,但在带宽和生态成熟度上仍有差距。" 半导体资深专家张国斌向时代周报记者指出,英伟达的优势在于 NVLink 生态成熟,CUDA 对 NVLink 的内存统一编址支持已迭代多年,软件栈完善。此外,英伟达 NVL72 可通过 NVLink Switch 扩展至 576 卡,国产方案目前主要聚焦 Scale-up(单节点内互联)。
新晋 " 全栈自研 " 玩家
随着大模型从 Chatbot 向 Agent 演进,计算负载重心正发生偏移。Agent 不仅需要 GPU 进行模型推理,更依赖高性能 CPU 处理复杂逻辑编排、工具调用与内存管理。
国泰海通证券研报指出,智能体 AI 带来的 CPU 算力需求结构性爆发,过去 CPU 与 GPU 配比约为 1:4 或 1:8,现在正向 1:1 靠拢,特定场景下 CPU 数量可能超过 GPU。
英伟达 CEO 黄仁勋曾公开表示,未来世界上将会出现数十亿个智能体,这些智能体将使用工具,就像人类今天使用电脑,届时所有的思考和编排行为都将在 GPU 上进行。
这一趋势下,全球主要算力厂商均开始强化 CPU 布局。
今年 1 月,英伟达推出首款面向 Agentic AI 设计的定制 CPU Vera。当地时间 5 月 20 日,英伟达管理层在财报电话会上表示,预计今年 CPU 收入有望达到 200 亿美元,并表示相信公司能够获得足够供应以支撑持续增长。
国内厂商中,平头哥已形成 "GPU+CPU" 的协同路线。其自研倚天系列服务器 CPU,可与真武 AI 芯片协同工作,以提升 AI 推理效率,有效应对 Agent 高并发任务的负载压力。事实上,早在 2021 年,平头哥便发布首颗通用服务器 CPU 倚天 710。这也是国内首款基于 ARMv9 架构、实现大规模商业化量产的 5nm 数据中心芯片。
目前,平头哥公开的产品体系包括真武(AI)、倚天(CPU)、磐脉(网卡)、镇岳(存储)以及 ICN Switch 互联芯片,已初步覆盖 AI 数据中心核心基础设施。国内能够与平头哥形成类似 " 全栈化 " 布局的厂商并不多。其中,华为早在 2019 年便提出,公司已同时具备 CPU、NPU、存储控制、网络互连、智能管理五大关键芯片能力。
相比之下,多数国产 AI 芯片企业仍集中于单一方向突破。例如,百度昆仑芯、寒武纪只有 AI 芯片,并没有 CPU、网卡以及存储芯片。张国斌认为,全栈自研在国内确实是极少数玩家的游戏。华为是六边形战士,平头哥是新晋挑战者,其他厂商均为单点突破。
与华为昇腾路径互补
" 阿里平头哥兼容 CUDA,侧重阿里云原生与推理场景。华为昇腾采用达芬奇架构及 CANN 软件栈,追求技术完全自主,并在政企信创市场深耕。" 张孝荣认为,二者路径互补,各有侧重。
这种差异,本质上对应两种产业模式。平头哥是典型的云厂商自研芯片模式。所有产品先满足阿里云内部需求,再考虑外销。换言之,平头哥并不急于成为独立芯片供应商,其目标更偏向通过自研硬件提升阿里云整体算力效率。这一路径与谷歌 TPU 模式相似,客户购买的是云服务,而非芯片本身。
相比之下,华为则更接近英伟达模式。昇腾芯片、Atlas 服务器、超节点方案直接销售给政企客户、运营商、互联网厂商。张国斌认为,平头哥的芯片与阿里云业务深度耦合,优化方向明确,如 Agentic 推理、通义千问适配,但外销意愿和能力存疑;华为则更早建立独立生态,客户覆盖政府、金融、运营商等。
从市场份额看,国产 AI 芯片仍处于追赶阶段。IDC 数据显示,2025 年中国 AI 加速卡出货量约 400 万片,其中英伟达占据约 55% 的份额,仍居主导地位;国内厂商合计约 165 万片,占比约 41%。具体来看,华为昇腾出货约 81.2 万片,位列第二;阿里平头哥约 26.5 万片,位列第四。
截至目前,真武系列芯片已累计出货 56 万片,服务中国电信、中国一汽、浦发银行等 20 多个行业的 400 多家客户。与此同时,平头哥也首次披露真武系列后续规划——未来两年将陆续推出真武 V900、真武 J900 两代芯片,以满足 Agentic 时代千行百业的 AI 算力需求。


登录后才可以发布评论哦
打开小程序可以发布评论哦