互联网怪盗团 4小时前
真武芯片亮相,标志着阿里AI“三位一体”基本告成
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

今天(2026 年 1 月 29 日),对于中国 AI 产业,乃至中国芯片产业而言,是一个很有意义的日子:平头哥(阿里巴巴集团芯片业务主体)官网公布了一款名为 " 真武 810E" 的高端 AI 芯片。在此之前,关于平头哥自研 PPU 的说法,早已在市面上广为流传,还曾登上《新闻联播》——其中出现的少量技术参数,引发了国内芯片圈子的热烈讨论。现在,平头哥自研 PPU" 真武 ",终于正式出现在外界视野之中了。

请注意:虽然这是 " 真武 " 的第一次公开亮相,但是在此之前,它早已投入实用了,规模还颇大:迄今已经在阿里云实现了多个万卡集群部署,服务了国家电网、中科院、小鹏汽车、新浪微博……等各行各业的 400 多家客户。它不是一款停留在 PPT 上的芯片,也不是一款还在早期试用阶段的芯片,而是已经扎扎实实地积累了大量客户案例、形成了一定的生态系统。早在半年多以前,我的一位阿里云的朋友就表示:" 我觉得平头哥自研芯片的水平不比市面上的主流方案差。" 当时我半信半疑,现在我差不多能理解他的自信了。

" 真武 " 的水平究竟有多高?对这个问题,我让 Gemini 大模型总结了主流英文媒体的报道,大致结论如下:

96GB 显存、700GB/s 片间互联,具备与 H20 类似的竞争力;

已经大规模使用于阿里千问大模型的训练和推理流程之中;

ICN 片间互联技术,以及 AI 产品软件栈,均为平头哥自主研发、独立知识产权。

下一代产品的研发也早在如火如荼的进行之中了。

我的个人观点是,在 AI 推理任务上," 真武 " 显然胜任,并且在一定范围内具备较强的性价比;在训练任务上,目前可了解的信息还太少,但应该也只是时间问题。如果未来一段时间内,千问大模型的新版本部分乃至全部使用 PPU 训练,我也不会感到奇怪;当然这个过程会很复杂,不能急于求成。

在美国长期 " 算力封锁 "、国内算力紧缺的情况下,平头哥自研 PPU 的亮相,绝不仅仅是一次技术发布,更具备重要的战略意义。它意味着中国 AI 产业对算力的选择更多、回旋空间更大了,其中的自研产品比例更高了。自从 2018 年正式成立以来,平头哥已经走过了八个年头," 真武 " 是多年以来坚持自主研发路线的结晶。这条道路不容易走,但是飞轮一旦转动起来,前途是很远大的。

不过,今天我想聊的,不仅是芯片这个话题。毕竟 AI 是一个很长的产业链,芯片是其中的重要一环,但不是唯一一环。从上游的算力硬件(以芯片为核心),到中游的云服务,到下游的基础大模型——至少在这三个环节都有布局,才算是布局了整个产业链。而放眼全球,哪些科技公司堪称在三个环节都有较强的技术实力呢?我数来数去,也只有两家:谷歌、阿里巴巴。

先说谷歌:自研芯片 TPU 的实力有目共睹,而且已经向第三方大规模出货;谷歌云的增长势头极快,而且大部分新增收入来自 AI;基座大模型 Gemini 最近一年多高歌猛进,大有反超 GPT 的势头。谷歌的 " 全栈技术实力 ",在硅谷无人能敌,而且三个环节之间形成了良好的协同效应:TPU 降低了 Gemini 的训练和推理成本,Gemini 与谷歌云共同构成了 "AI+ 云 " 生态,而谷歌云和 Gemini 的成功又构成了对 TPU 最好的广告。谷歌因此成为了 2025 年股价表现最好的硅谷科技巨头,市值突破了 4 万亿美元。

反观另外两个云计算巨头——亚马逊和微软,其布局都谈不上完整。亚马逊的自研芯片 Trainium 有一定的技术实力,但是比谷歌 TPU 落后很多,外部客户群也尚未建立起来;亚马逊的自研基座大模型也是水平一般,主要依靠对 Anthropic 等外部开发商的投资。至于微软,自研芯片的发展程度还不及亚马逊,至于基座大模型更是基本依赖对 OpenAI 的投资。这两巨头的 AI 战略,都是聚焦于云平台一个环节,另外两个环节则只投入有限资源,依靠投资和合作进行布局。这是一种 " 聪明 "、" 省力 ",但是对全产业链掌控能力不足的路线。

而阿里则选择了与谷歌一致的那条更艰难的路线:全栈自研,在 AI 芯片、云计算和基座大模型三个环节均追求顶尖的自主研发。大模型端的通义实验室,云平台端的阿里云,再加上 AI 芯片端的平头哥,共同构成了所谓 " 通云哥 " 的 AI 大三角,或曰 " 三位一体 " 的 AI 全栈技术能力。这个模式,投入巨大、研发周期长、风险集中,但是一旦成功,其回报十分可观,而且可以构筑起难以撼动的竞争壁垒。在我看来,谷歌 AI 帝国从 2023 年的风雨飘摇,嬗变到 2025 年的春风得意,其中发挥决定性作用的就是全栈自研能力。

在云计算环节,阿里云的技术实力早已毋庸置疑,它是与微软 Azure、亚马逊 AWS、谷歌 GCP 并列的全球四大公有云平台之一,其基础设施覆盖全球 29 个地域、服务 500 多万客户;阿里云的 " 飞天 ",是国内唯一自研的云计算操作系统。2025 年云栖大会上,吴泳铭曾提出阿里要做 " 超级 AI 云 ",成为全球仅有的 5-6 个 " 超级云计算平台 " 之一。至少从研发和技术基建角度看,上面的说法并不夸张,还有很强的可行性。

在基座大模型环节,通义实验室的水平同样不需要证明。就我个人而言,用的最多的两个国产大模型,就是千问和 DeepSeek。沙利文 ( Frost & Sullivan ) 的研究显示,2025 年上半年中国企业级大模型调用市场,千问的占比名列第一。在海外,千问的开源版本尤其受欢迎,是 Hugging Face 等平台上讨论最多的开源大模型家族之一(或许还可以去掉 " 之一 ")。就在去年,新加坡国家人工智能计划 ( AISG ) 放弃了 Meta 的 LLaMA 系列大模型,转向了千问开源架构。从这个角度看,千问比 Gemini 和 GPT 更加全面,因为后两者基本都聚焦于闭源赛道。

至于芯片环节,在 " 真武 " 公布之前,市面上对阿里的真实水平,其实并不了解。AI 圈子的很多朋友都告诉我:" 平头哥在国产 AI 芯片厂商当中处于第一梯队,甚至可能是最先进的之一。" 然而,在今天之前,大家对于 PPU 的技术参数、应用范围,还是只有模糊的认识。现在官方信息来了,相信今后还会有更多、更全面的信息披露。无论从什么角度看,平头哥 PPU 在国产芯片当中的领先位置,从现在开始应该无人能质疑了。

2025 年,是谷歌 TPU 的爆发之年,Gemini 的成功促使越来越多的外部客户订购 TPU;未来几年,谷歌很可能超过 AMD,成为全球排名第二的 GPU 厂商。同样的事情完全有可能发生在平头哥身上——千问大模型越先进、其中的 "PPU 比例 " 越高," 真武 " 以及后续的 PPU 产品就越好卖。如果外部客户产生了兴趣,可以先通过阿里云租用 PPU 算力,再决定是否采购 PPU。在长期,PPU 的外部需求肯定是 " 两条腿走路 ",通过阿里云交付的算力以及客户直接采购的算力,其规模都会很大,带动每 token 的边际成本越来越低,形成 " 通云哥 " 的生态正循环。

" 通云哥 " 的黄金三角已经成型,从今往后,对于阿里的 AI 战略,外界不应采取孤立的研究方式,而是应该将其视为一个有机整体去研究。所有大厂都在讲 "AI 生态 ",但是迄今为止,真正构筑了完整全面的自研 AI 生态的,在国内也仅有阿里一家。人类才刚刚进入 AI 时代,迈向 AGI(通用人工智能)的长征才开了一个头,未来五年、十年乃至更长的时间里,阿里的 AI 生态将为全世界的 AI 产业带来什么样的贡献和影响?没人知道答案,我只知道肯定是十分巨大、深远的。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 阿里云 小鹏汽车 芯片 平头哥
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论