真故研究室 3小时前
阿里的芯片豪赌
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

撰文 | 范文斐
编辑 | 张   霞

2026 年 5 月 20 日,在阿里云峰会上,平头哥发布了两颗新芯片:新一代算力芯片真武 M890,以及配套的互联芯片 ICN Switch 1.0。

基于这两款芯片,阿里云打造了 128 卡超节点服务器,并推出全新 " 芯 - 云 - 模型 - 推理 " 技术体系,全面进入 "Agentic 时代 "。

八年前,阿里云的服务器 CPU 几乎全靠英特尔,算力加速卡要向英伟达采购。

中兴被制裁,给这家互联网巨头敲响了警钟。自己的命脉捏在别人手里," 就像被人卡住了脖子,连呼吸都不自由 "。

阿里造芯是一场豪赌。这场豪赌,一开始就没退路。

#01

一家电商公司想要造芯片

造芯的故事,要从造云讲起。

2008 年,马云从微软亚洲研究院挖来一位叫王坚的心理学博士,任命他为阿里首席架构师。王坚不会写代码,这在当时的技术圈引起了不小的骚动。

那时候,阿里和所有中国互联网公司一样,面前横亘着三座大山:IBM 的小型机、Oracle 的数据库、EMC 的存储。业内管这叫 "IOE"。阿里每年都要向这些海外巨头,支付一大笔软硬件费用。

最先让中国互联网公司感到 " 卡脖子 " 的,其实不是芯片,是这些软硬件基础设施。

王坚给马云算了一笔账:按当时阿里的发展速度,十年后,光是服务器和数据库的采购费用,就足以拖垮公司。

为此,王坚在内部启动了 " 去 IOE" 工程,方向是云计算,并立下铁规:从 2010 年起,不再购买小型机。

2008 年的中国几乎没人知道云计算该怎么做。当时,亚马逊的 AWS 才刚起步,国内连一个像样的云服务都没有。2010 年深圳 IT 领袖峰会上,李彦宏说云计算是 " 新瓶装旧酒 ",马化腾说要等上几百年甚至一千年。

王坚带着团队从零开始搭建 " 飞天 " 操作系统。没人知道这条路该怎么走,每一个技术决策都可能出错。阿里云首任技术总监林晨曦后来形容:" 就像一支军队在攻占一个看起来不可能攻克的山头,一批冲锋者倒下了,下一批接着顶上。"

林晨曦从集团其他业务线拉来了一些内部客户试用,其中包括阿里金融。但系统极不稳定,经常每隔几小时就崩溃一次。

最难熬的是 2010 年到 2012 年。飞天系统必须突破 "5K" 瓶颈(单集群调度 5000 台服务器)。团队没日没夜地干,换来的却是一个接一个的系统故障。来自各业务线的怒火对准王坚。

2011 年底,时任阿里金融总裁的胡晓明带着团队找到王坚。他们先是集体鞠躬,然后下了通牒:如果春节期间系统再出问题,阿里金融将放弃使用阿里云。

让一个心理学博士来主导公司的底层技术架构,阿里内部很多人想不通。

阿里内网上,有人发帖说:" 马云,你被王坚忽悠了,阿里云根本不可能实现!" 这篇帖子迅速获得了 2000 多个点赞。那几年,阿里云连续拿集团最低分,离职率高达七八成。有员工在辞职信里写:" 我觉得再干下去,也看不到任何希望。"

在一片谩骂声中,马云亲自回复了那篇帖子:" 博士是人,不是神!给他一点时间。" 他定下的基调是,每年投 10 个亿,连续投 10 年,做不出来再说。

从 2009 年到 2013 年,阿里云在试错中前行。2013 年 5 月,阿里集团最后一台 IBM 小型机在支付宝下线。同年 7 月,淘宝最后一个 Oracle 数据库下线。8 月,飞天系统突破 5000 台,阿里云成为全球首个对外提供 5K 云计算服务能力的公司。

王坚后来当选中国工程院院士,成了民营企业里的第一人。

他主要解决了软件层面的问题,把阿里从 IBM 和 Oracle 的生态绑定里解放了出来。

但核心的底层芯片仍然掌握在国外厂商手中。想要真正把命运掌握在自己手里,阿里还必须去另一层 " 芯 "。

#02

生死一赌

2018 年 4 月,美国商务部对中兴通讯发出制裁禁令。消息像一盆冰水浇在整个中国科技界头上。

对阿里而言,危机感更为具体。阿里云的数据中心里,成千上万台服务器昼夜运转,CPU 印着 Intel 的 Logo,加速卡贴着 NVIDIA 的标签。如果断供,这朵亚洲最大的公有云将面临瘫痪。

张建锋说的 " 呼吸不自由 ",正是这种悬顶之剑下的焦虑。

阿里在芯片领域的布局比外界知道的要早。2015 年,阿里接触了杭州中天微系统有限公司。这家公司手握近百项发明专利,是当时国内唯一拥有自主嵌入式 CPU 架构并实现大规模量产的芯片设计公司,但产品主要卖给智慧城市、智能家居这些预算有限的领域。

阿里看中了它的技术底子,双方合作开发 " 云芯片 "。此后阿里两度注资,成为其第一大股东。

中兴事件后,阿里迅速行动,于 2018 年 4 月全资收购中天微。同年 9 月的云栖大会上,阿里将中天微与达摩院自研芯片团队整合,成立独立的芯片公司 " 平头哥半导体 "。CTO 张建锋决定从头搭建一套完全开源、不受外国管辖的算力底座。

图|张建锋在 2018 年云栖大会上宣布平头哥成立

关于名字,团队原本提议叫 " 蜂鸟 ",寓意小而快。马云改成了 " 平头哥 "。平头哥是蜜獾在中国网络文化里的昵称,体型不大,但狮子豺狼都不怕,被公认为 " 世界上最无所畏惧的动物 "。马云认为芯片江湖凶险,需要这种 " 不服就干 " 的劲头。

公司成立后,摆在平头哥面前的第一个难题是:走哪条路?

当时数据中心里跑的主流芯片,几乎都基于一种叫 x86 的架构。这套规则是英特尔和 AMD 在几十年前写定的,专利墙高筑,外人根本进不去。想造 x86 芯片,得先向他们买授权,费用高到足以让一家初创公司直接破产。万一哪天欧美一纸禁令下来,授权说停就停。

这条路,说到底还是给别人打工。

平头哥内部开了一场决定命运的大会。十几位负责人围坐一桌,争论要不要押注 RISC-V。这是一种完全开源的芯片架构,任何人都可以拿去用,不用交专利费,也没有人能单方面收回你的使用权。

但这个架构还太年轻,性能跟不上,软件生态几乎为零。做出来的芯片,大概率只用在温湿度传感器、智能门锁上。

中天微自研的 C-Sky 体系已经耕耘多年,并且实现了大规模量产,放弃它去押注一个 " 新玩具 ",等于把已经跑通的生意推倒重来。

经过多轮激烈讨论,十几位负责人全票通过了 RISC-V。理由只有一个:即使遭遇最极端制裁,这套架构也不会断供。

" 选择 RISC-V 不是为了追求技术先进,而是为了生存。" 一位参与决策的平头哥早期员工后来回忆," 我们需要一个绝对安全的‘逃生通道’。"

孟建熠是中天微出身,后来成为平头哥半导体技术负责人。2016 年,他参加了 RISC-V 在中国的第一次峰会,现场来了五六百人。" 一个新生的架构,就能吸引这么多人,说明它有很强的生命力。" 他回忆。

2019 年 7 月,平头哥发布玄铁 910,成为当时性能最强的 RISC-V IP 核之一,但更多是技术验证。当时几乎没人相信 RISC-V 能撑起高性能计算。

更务实的一条线,也在同步进行。2021 年云栖大会,平头哥推出了倚天 710。这颗芯片没有采用 RISC-V,而是 ARM 架构。

ARM 是由一家英国公司写好规则,然后卖授权给苹果、高通、华为这些公司。它最大的特点是低功耗,全球手机芯片几乎全是 ARM 架构。平头哥用 ARM 做倚天 710,走的是务实的中间路线,生态成熟、能快速出货。

这是阿里第一颗 " 为云而生 " 的 CPU,5nm 工艺,600 亿晶体管,性能超越同期业界标杆 20% 以上。张建锋在发布会上明确表态:" 这颗芯片不出售,主要是阿里云自用 "。

不对外卖,只给自己用,既保证了自己有底牌,又不至于跟英特尔、AMD 撕破脸。到 2022 年底,倚天 710 已在阿里云数据中心大规模部署。

就在阿里刚刚在传统云计算芯片领域站稳脚跟时,新的风暴来了。2022 年底,ChatGPT 横空出世,全球科技竞争的焦点骤然转向 AI 大模型。

这一次,被卡住的 " 脖子 ",换成了 AI 算力的核心 GPU。

#03

自研芯片如何走出阿里

大模型时代,算力的硬通货是 GPU,而全球的供给几乎被英伟达垄断。2022 年后,美国接连出台的出口管制措施,使得国内企业连英伟达的 " 特供版 " 芯片都一卡难求。

阿里再次被逼到墙角。外购无门,转向国产 AI 芯片厂商时,又遇到了另一种尴尬。

2023 年前后,国内三大运营商正大力建设智算中心。他们采购量大、价格不敏感,成为芯片厂商眼中的香饽饽。相比之下,阿里这种既懂技术、又对性能和成本极度挑剔的互联网大厂,反倒成了 " 难伺候 " 的客户

有国产芯片厂商的销售私下表示,运营商的订单利润高、交付简单,优先级自然排在阿里前面。

" 花钱都当不了大爷,那就只能自己动手。" 一位接近平头哥的人士说。

其实阿里自研通用 GPU(内部代号 PPU)的计划启动更早。大约在 2020 年,项目就已秘密立项,由达摩院计算技术实验室核心团队负责。2023 年初,PPU 就在阿里内部完成了研发和场景验证,但团队选择了沉默。

不同于 "AI 芯片四小龙 " 高调融资、频繁发声,阿里既无融资压力,也不愿过早亮底牌。从 2020 年到 2025 年底,几乎没有对外透露任何消息。

转机出现在 2025 年 9 月。美国媒体 The Information 爆料,平头哥 PPU 性能已接近英伟达 H20。

几乎同期,央视《新闻联播》画面中出现该芯片参数:96GB HBM2e 显存、700GB/s 片间互联带宽、整卡功耗 400W。纸面指标已超过当时主流的 A800 和多数国产 GPU。

2026 年 1 月 29 日,这颗芯片亮相。平头哥官网上线产品页,正式命名为 " 真武 810E"。官方信息显示,它已在阿里云多个万卡集群部署,用于通义千问的训练与推理。

市场真正关心的其实是,自研芯片到底能不能独立赚钱?

很长时间里,外界质疑平头哥只是 " 阿里内部的降本工具 "。含光 800 主要用于淘宝搜索,玄铁多服务于阿里生态 IoT,倚天 710 也只自用。

2024 年之后,局面变了。

2025 年,平头哥中标中国联通 " 三江源绿电智算中心 " 项目,总签约算力 3579P,其中平头哥提供 1945P,占比 54%。这是国产 AI 芯片首次在国家级智算项目中拿下过半份额。

同年,小鹏汽车和比亚迪分别下了超万片的 PPU 外部订单。到 2026 年初,平头哥外部客户已超过 400 家,覆盖金融、能源、汽车、政务等多个领域。IDC 数据显示,2025 年上半年国产 AI 芯片市场,华为昇腾居首,平头哥位列第二。

一位阿里云销售透露,对某些互联网公司的推荐算法业务,使用平头哥芯片能把推理成本降低 20% 以上。性价比,成为打开外部市场的关键武器。

这意味着,平头哥的芯片已不再只是内部 " 备胎 ",已经具备了真正对外商业化的能力。

2026 年 3 月 24 日玄铁 C950 发布会上,达摩院同时推出 Vector 和 Matrix 加速引擎,让 RISC-V CPU 首次原生支持 Qwen3、DeepSeek V3 等千亿参数大模型。中国工程院院士倪光南在现场表示,RISC-V 正从 " 备选 " 走向 " 主流 "。

图|玄铁 C950 发布会现场

同月,阿里云宣布对真武 810E 等自研算力产品提价 5%-34%。有了自研芯片托底,定价权终于回到自己手里。

至此,阿里手中凑齐了三张牌:平头哥的算力芯片、阿里云的平台、通义大模型。内部将其称为 " 通云哥 " 战略,构成了一个从底层芯片到云计算、再到上层 AI 应用的全栈闭环。

目前全球范围内,能打通 " 芯片 - 云 - 大模型 - 应用 " 全链条的公司屈指可数。除了手握 TPU 的谷歌,微软、亚马逊、Meta 等巨头至今仍大量依赖英伟达芯片。

2026 年 4 月,吴泳铭在内部信中宣布成立集团技术委员会并亲自担任组长,同时升级通义大模型事业部。他提出目标:未来五年,云和 AI 商业化收入(含 MaaS)突破 1000 亿美元。

从当年担心被 " 卡脖子 ",到逐步掌握部分算力自主能力,阿里走了一条漫长且充满不确定的路。

这条造芯路,很难被简单地归结为一个关于技术突破的励志故事。它更像一家中国公司在复杂全球供应链中,给自己建一块缓冲带的长期尝试。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论