真武芯片亮相，标志着阿里AI“三位一体”基本告成

今天（2026 年 1 月 29 日），对于中国 AI 产业，乃至中国芯片产业而言，是一个很有意义的日子：平头哥（阿里巴巴集团芯片业务主体）官网公布了一款名为 " 真武 810E" 的高端 AI 芯片。在此之前，关于平头哥自研 PPU 的说法，早已在市面上广为流传，还曾登上《新闻联播》——其中出现的少量技术参数，引发了国内芯片圈子的热烈讨论。现在，平头哥自研 PPU" 真武 "，终于正式出现在外界视野之中了。

请注意：虽然这是 " 真武 " 的第一次公开亮相，但是在此之前，它早已投入实用了，规模还颇大：迄今已经在阿里云实现了多个万卡集群部署，服务了国家电网、中科院、小鹏汽车、新浪微博……等各行各业的 400 多家客户。它不是一款停留在 PPT 上的芯片，也不是一款还在早期试用阶段的芯片，而是已经扎扎实实地积累了大量客户案例、形成了一定的生态系统。早在半年多以前，我的一位阿里云的朋友就表示：" 我觉得平头哥自研芯片的水平不比市面上的主流方案差。" 当时我半信半疑，现在我差不多能理解他的自信了。

" 真武 " 的水平究竟有多高？对这个问题，我让 Gemini 大模型总结了主流英文媒体的报道，大致结论如下：

96GB 显存、700GB/s 片间互联，具备与 H20 类似的竞争力；

已经大规模使用于阿里千问大模型的训练和推理流程之中；

ICN 片间互联技术，以及 AI 产品软件栈，均为平头哥自主研发、独立知识产权。

下一代产品的研发也早在如火如荼的进行之中了。

我的个人观点是，在 AI 推理任务上，" 真武 " 显然胜任，并且在一定范围内具备较强的性价比；在训练任务上，目前可了解的信息还太少，但应该也只是时间问题。如果未来一段时间内，千问大模型的新版本部分乃至全部使用 PPU 训练，我也不会感到奇怪；当然这个过程会很复杂，不能急于求成。

在美国长期 " 算力封锁 "、国内算力紧缺的情况下，平头哥自研 PPU 的亮相，绝不仅仅是一次技术发布，更具备重要的战略意义。它意味着中国 AI 产业对算力的选择更多、回旋空间更大了，其中的自研产品比例更高了。自从 2018 年正式成立以来，平头哥已经走过了八个年头，" 真武 " 是多年以来坚持自主研发路线的结晶。这条道路不容易走，但是飞轮一旦转动起来，前途是很远大的。

不过，今天我想聊的，不仅是芯片这个话题。毕竟 AI 是一个很长的产业链，芯片是其中的重要一环，但不是唯一一环。从上游的算力硬件（以芯片为核心），到中游的云服务，到下游的基础大模型——至少在这三个环节都有布局，才算是布局了整个产业链。而放眼全球，哪些科技公司堪称在三个环节都有较强的技术实力呢？我数来数去，也只有两家：谷歌、阿里巴巴。

先说谷歌：自研芯片 TPU 的实力有目共睹，而且已经向第三方大规模出货；谷歌云的增长势头极快，而且大部分新增收入来自 AI；基座大模型 Gemini 最近一年多高歌猛进，大有反超 GPT 的势头。谷歌的 " 全栈技术实力 "，在硅谷无人能敌，而且三个环节之间形成了良好的协同效应：TPU 降低了 Gemini 的训练和推理成本，Gemini 与谷歌云共同构成了 "AI+ 云 " 生态，而谷歌云和 Gemini 的成功又构成了对 TPU 最好的广告。谷歌因此成为了 2025 年股价表现最好的硅谷科技巨头，市值突破了 4 万亿美元。

反观另外两个云计算巨头——亚马逊和微软，其布局都谈不上完整。亚马逊的自研芯片 Trainium 有一定的技术实力，但是比谷歌 TPU 落后很多，外部客户群也尚未建立起来；亚马逊的自研基座大模型也是水平一般，主要依靠对 Anthropic 等外部开发商的投资。至于微软，自研芯片的发展程度还不及亚马逊，至于基座大模型更是基本依赖对 OpenAI 的投资。这两巨头的 AI 战略，都是聚焦于云平台一个环节，另外两个环节则只投入有限资源，依靠投资和合作进行布局。这是一种 " 聪明 "、" 省力 "，但是对全产业链掌控能力不足的路线。

而阿里则选择了与谷歌一致的那条更艰难的路线：全栈自研，在 AI 芯片、云计算和基座大模型三个环节均追求顶尖的自主研发。大模型端的通义实验室，云平台端的阿里云，再加上 AI 芯片端的平头哥，共同构成了所谓 " 通云哥 " 的 AI 大三角，或曰 " 三位一体 " 的 AI 全栈技术能力。这个模式，投入巨大、研发周期长、风险集中，但是一旦成功，其回报十分可观，而且可以构筑起难以撼动的竞争壁垒。在我看来，谷歌 AI 帝国从 2023 年的风雨飘摇，嬗变到 2025 年的春风得意，其中发挥决定性作用的就是全栈自研能力。

在云计算环节，阿里云的技术实力早已毋庸置疑，它是与微软 Azure、亚马逊 AWS、谷歌 GCP 并列的全球四大公有云平台之一，其基础设施覆盖全球 29 个地域、服务 500 多万客户；阿里云的 " 飞天 "，是国内唯一自研的云计算操作系统。2025 年云栖大会上，吴泳铭曾提出阿里要做 " 超级 AI 云 "，成为全球仅有的 5-6 个 " 超级云计算平台 " 之一。至少从研发和技术基建角度看，上面的说法并不夸张，还有很强的可行性。

在基座大模型环节，通义实验室的水平同样不需要证明。就我个人而言，用的最多的两个国产大模型，就是千问和 DeepSeek。沙利文 ( Frost & Sullivan ) 的研究显示，2025 年上半年中国企业级大模型调用市场，千问的占比名列第一。在海外，千问的开源版本尤其受欢迎，是 Hugging Face 等平台上讨论最多的开源大模型家族之一（或许还可以去掉 " 之一 "）。就在去年，新加坡国家人工智能计划 ( AISG ) 放弃了 Meta 的 LLaMA 系列大模型，转向了千问开源架构。从这个角度看，千问比 Gemini 和 GPT 更加全面，因为后两者基本都聚焦于闭源赛道。

至于芯片环节，在 " 真武 " 公布之前，市面上对阿里的真实水平，其实并不了解。AI 圈子的很多朋友都告诉我：" 平头哥在国产 AI 芯片厂商当中处于第一梯队，甚至可能是最先进的之一。" 然而，在今天之前，大家对于 PPU 的技术参数、应用范围，还是只有模糊的认识。现在官方信息来了，相信今后还会有更多、更全面的信息披露。无论从什么角度看，平头哥 PPU 在国产芯片当中的领先位置，从现在开始应该无人能质疑了。

2025 年，是谷歌 TPU 的爆发之年，Gemini 的成功促使越来越多的外部客户订购 TPU；未来几年，谷歌很可能超过 AMD，成为全球排名第二的 GPU 厂商。同样的事情完全有可能发生在平头哥身上——千问大模型越先进、其中的 "PPU 比例 " 越高，" 真武 " 以及后续的 PPU 产品就越好卖。如果外部客户产生了兴趣，可以先通过阿里云租用 PPU 算力，再决定是否采购 PPU。在长期，PPU 的外部需求肯定是 " 两条腿走路 "，通过阿里云交付的算力以及客户直接采购的算力，其规模都会很大，带动每 token 的边际成本越来越低，形成 " 通云哥 " 的生态正循环。

" 通云哥 " 的黄金三角已经成型，从今往后，对于阿里的 AI 战略，外界不应采取孤立的研究方式，而是应该将其视为一个有机整体去研究。所有大厂都在讲 "AI 生态 "，但是迄今为止，真正构筑了完整全面的自研 AI 生态的，在国内也仅有阿里一家。人类才刚刚进入 AI 时代，迈向 AGI（通用人工智能）的长征才开了一个头，未来五年、十年乃至更长的时间里，阿里的 AI 生态将为全世界的 AI 产业带来什么样的贡献和影响？没人知道答案，我只知道肯定是十分巨大、深远的。

宙世代

一起剪

相关标签