9 月 18 日,上海举行的华为全联接大会(HC 大会)上,华为轮值董事长徐直军一上台,就提起了年初由 DeepSeek 引起的这场全民狂欢。
" 从今年春节开始到 4 月 30 日,经过多团队的协同作战,终于使昇腾(Ascend )910B/910C 的推理能力达成了客户的基本需求。" 徐直军说到,DeepSeek 横空出世吼,一时间众多政府机构、央企响应接入 DeepSeek,作为算力提供商,华为也必须跟进响应。
华为自 2018 年首次发布昇腾 310 芯片、2019 年推出昇腾 910 芯片以来,持续投入 AI 基础算力的研发与创新。虽然 DeepSeek 开创的模式大幅减少了算力需求,但徐直军认为,要走向 AGI 和物理 AI,华为认为,算力,过去是、未来也将继续是人工智能的关键。
1、华为发布多款芯片产品,规划已经设到了 2028 年
徐直军宣布,面向未来,华为已规划三个系列的昇腾芯片,包括950、960 和 970 系列。
其中,昇腾 950 系列包含两颗芯片:950PR 和 950DT,950PR 将于 2026 年一季度上市,950DT 将于 2026 年四季度上市。
昇腾 960 芯片将于 2027 年四季度上市,昇腾 970 芯片则预计是 2028 年四季度上市。
华为昇腾芯片发布规划;图片由作者拍摄
与上一代相比,昇腾 950 在多个方面实现根本性技术提升:新增支持 FP8/MXFP8/HIF8、MXFP4 等低精度数据格式,算力分别达到 1 PFLOPS 和 2 PFLOPS,大幅提升训练与推理效率;大幅提升向量算力,支持更精细粒度内存访问;互联带宽提升 2.5 倍,达到 2TB/s;并搭载自研 HBM 技术 HIBL1.0 和 HIZQ2.0。
在通算领域,华为规划了鲲鹏 950与鲲鹏 960,分别将于 2026 年第四季度和 2028 年第一季度上市,围绕支持超节点和更多核、更高性能持续演进。
此外,华为正式发布了面向超节点的互联协议——灵衢,并开放灵衢 2.0 技术规范。自 2019 年开始研究,灵衢 1.0 已开启商用验证,如今灵衢 2.0 的开放,旨在邀请产业界基于灵衢研发相关产品和部件,共建灵衢开放生态。
2、发布全球最强算力超节点
由于国际政治等复杂原因,徐直军也在发布会上直言,华为单片芯片的算力表现比不过英伟达," 但华为有三十年在连接技术的积累,华为的超节点计算机,能做到世界上算力最强,满足全世界在 AI 训练推理上的巨大需求。"
超节点(SuperPod)是眼下是智算发展的重要趋势。徐直军认为,超节点在物理上由多台机器组成,但逻辑上以一台机器学习、思考、推理。
在具体的超节点业务进展上,华为发布了 Atlas 950 SuperPoD 和 Atlas 960 SuperPoD。其中基于昇腾 950 芯片的 Atlas 950 超节点支持 8192 卡规模,由 128 个计算柜和 32 个互联柜组成,占地面积约 1000 平方米,FP8 算力达 8EFlops,FP4 算力达 16EFlops,互联带宽高达 16 PB,相当于当前全球互联网总带宽的 10 倍以上。
华为发布了 Atlas 950 SuperPoD 展示;图片由作者拍摄
昇腾 950 超节点将于 2026 年第四季度上市,徐直军强调,Atlas 950 超节点将是 2026~2028 年间全球算力最强的 AI 超节点。
而另外的Atlas 960 超节点,支持 15488 卡,由 176 个计算柜和 44 个互联柜组成,算力、内存和带宽在 Atlas 950 基础上再度翻番,计划于 2027 年四季度上市。
徐直军特别提到,超节点的价值不仅限于制造、通信和计算等传统业务领域。在互联网产业广泛应用的推荐系统方面也有重要作用。华为基于泰山 950 和 Atlas 950 可构建混合超节点,为下一代深度推荐系统开创全新的架构方向。
不过,大规模超节点虽然将智能计算和通用计算能力大大提升,但其中的互联技术仍有不成熟的地方。
例如,如何实现 8192 卡乃至 15488 卡规模的可靠互联,就是行业亟待解决的技术难题。目前产业界许多已发布的超节点方案未能实现大规模部署,其核心瓶颈并非芯片本身,而是互联技术尚未成熟,具体体现是两方面的挑战:
一是如何做到长距离而且高可靠。大规模超节点机柜多,柜间联接距离长达 1000 至 2000 米。当前电互联技术在高速信号传输时距离受限,最多仅支持两个机柜互联;而光互联技术虽能满足长距离连接需求,却无法达到单一计算机系统所要求的高可靠性。
二是如何实现超大带宽与超低时延。当前跨机柜卡间互联带宽与超节点需求存在 5 倍以上差距,时延最好仅能达到 3 微秒左右,与 Atlas 950/960 设计目标仍有 24% 的差距。在时延已逼近物理极限的情况下,每 0.1 微秒的提升都极具挑战。
徐直军阐述了两方面的解决途径。
华为在超节点层面的技术积累;图片由作者拍摄
首先,为了解决长距离且高可靠问题,华为在互联协议的物理层、数据链路层、网络层、传输层等每一层都引入了高可靠机制;同时在光路引入了百纳秒级故障检测和保护切换,当出现光模块闪断或故障时,让应用无感;并且,华为重新定义和设计了光器件、光模块和互联芯片。这些创新和设计让光互联的可靠性提升 100 倍,且互联距离超过 200 米,实现了电的可靠和光的距离。
其次,为了解决大带宽且低时延问题,华为突破了多端口聚合与高密封装技术,以及平等架构和统一协议,实现了 TB 级的超大带宽,2.1 微秒的超低时延。
" 正是因为一系列系统性、原创性的技术创新,我们才攻克了超节点互联技术,满足了高可靠、全光互联、高带宽、低时延的互联要求,让大规模超节点成为了可能。" 徐直军说到。