钛媒体 10小时前
AI数据中心供电架构的范式革命—当800V高压直流遇上万亿参数大模型,谁是产业链的隐形冠军?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | 邱吉洲聊 AIDC 电源模块

【导语】

上一篇文章我们探讨了 AI 芯片的电力革命,这场电力革命是关于 AI 芯片 ( GPU, TPU 等 ) 板卡上最后数十毫米到数毫米的供电技术和产品,本文我们要探讨的是从城市的中压变电站或者大型数据中心的中压变电站(10-35KV AC)到数据中心机柜内的 AI 芯片全栈供电架构的范式革命。

2026 年,英伟达 B300 系列 GPU 单卡功耗突破 1400W,一个满载的 NVL144 机柜功耗已逼近 1000kW ——这相当于 1500 个普通家庭的用电总和。

在 AI 算力以指数级膨胀的背后,一场静默却决绝的供电架构革命正在每一个数据中心内部酝酿。交流电统治了电网一百多年,但今天,它正在被 " 赶出 " 数据中心。从中低压到 800V 高压,从分立电源模块到芯片级集成稳压器——这场变革的终局,指向一个前所未见的世界:端到端的全直流供电体系。

这不仅是工程技术的演进,更是一张正在徐徐展开的价值数千亿的产业链投资地图。

一、算力狂奔倒逼供电革命:机架功率密度的指数级跃迁

如果要用一个词概括 AI 数据中心过去十年的变化,那就是 " 密度 " ——算力密度、热密度、以及最容易被忽视的功率密度。

十年前,一个标准机架的功耗不过 5-10kW。一台 2U 服务器塞两颗至强 CPU、几块硬盘,功耗控制在几百瓦,风冷绰绰有余。那时,交流供电体系(AC UPS +   逐机 AC/DC PSU)是行业标配——效率差几个百分点不是大事,因为总功耗基数太小,省下来的电费还不够买一套新设备。

AI 的出现让这个 " 舒适区 " 瞬间崩塌。

当前最新一代 AI 服务器电源的功率密度已经达到 100W/in ³,未来将突破 180W/in ³。单机架功耗从十几 kW 一路飙升至 100kW+,传统的 " 低压交流分布式 " 架构暴露了致命缺陷:每一级 AC/DC 转换都在发热,铜排截面积随电流平方暴涨,机架内部空间被电源模块和散热系统吃得一干二净——留给 GPU 算力的空间反而越来越小。

正如 Google 在 APEC 2025 上展示的路线图:供电架构正在经历一场从 " 低压交流分布式 " 向 " 高压直流集中式 " 的根本性转变。这绝不是修修补补,而是一次彻底的范式革命。

英伟达   GPU 芯片功率演进路线图

英伟达 Kyber AI 数据中心服务器

二、HVDC 800V:为什么高压直流是终局答案?

从中压变电站到 AI GPU 芯片的直流供电链路

HVDC(高压直流供电)并非新概念,通信基站里 48V 直流供电用了很多年。但在 AI 数据中心这个功耗怪兽面前,800V 高压直流的经济性和技术优势被放大到了堪称 " 暴力 " 的程度。

OCP 2025 的数据很直白:HVDC 800V 供电架构可将端到端能效提升 5 个百分点。在单机架 100kW+ 的功耗体量下,5% 意味着每个机架每年省下的电费就足以覆盖 HVDC 设备的全生命周期成本。更关键的是,高压直流架构天然简化了系统拓扑——故障率显著下降,维护成本锐减 70%。最直接的经济账是:机架内不再需要逐个配置 AC/DC PSU,CAPEX 和 OPEX 双双跳水。

有一组数字容易被投资人忽略,但在工程层面堪称降维打击:

· ± 400V HVDC   vs    传统 ± 48V:铜用量减少 70%

· ± 800V HVDC   vs    传统 ± 48V:铜用量减少 80%

· ± 1000V HVDC vs   传统 ± 48V:铜用量减少 84%

在铜价居高不下的今天,80% 的铜材节省意味着物料成本断崖式下降——不是降几个点,是砍掉大半。与此同时,分布损耗从 ± 48V 时的 3.2% 骤降至 ± 1000V 时的 0.25%,接近一个数量级的跨越。用更少的铜,传输更多的功率,损耗还更小——高压直流的三重红利,在物理定律层面是无解的。

据 QYResearch 及公开数据,全球 AIDC HVDC 市场正站在爆发前夜。800V 架构预计 2027 年进入大规模部署,届时 HVDC 电源系统、高压 DC/DC 转换模块、固态变压器(SST)等关键设备将构筑一个年增量超百亿美金的增量市场。值得强调的是,这不仅是新增装机,更是一次存量的全面替换——现有数据中心的交流供电体系,在未来十年将被逐步翻新为直流架构。

三、端到端全直流:重新想象电网与数据中心的边界

如果 HVDC 800V 是数据中心供电的 " 主动脉 ",那么全直流架构就是让每一个 " 器官 " 都讲同一种语言。

传统数据中心的供电链路堪称冗长:中压交流电网(10-35kV AC)进站后,要经过工频变压器→低压配电→ UPS → AC/DC PSU 这一长串环节,至少 3-4 级 AC/DC 转换,每一级都是效率的 " 收费站 "。

SST固态变压器的出现,让这一切可以浓缩为一步。基于 SiC/GaN 等第三代半导体器件的高频开关技术,SST 可以直接将数十千伏的中压交流电一步转换为 800V 直流电。相比传统工频变压器——那种重达数吨、嗡嗡作响的铁芯铜线巨兽—— SST 的体积缩小 80% 以上,效率可达 98%+,而且天然支持双向功率流动和智能电网调度。这不是 " 改善 ",是把整个变电站装进了一个柜子。

800V 直流母线一旦建立,一个更宏大的图景随之展开——新能源的接入变得出奇简单:

光伏发电:光伏组件输出的本就是直流电。通过 DC/DC 变换器直接汇入 800V 母线,省去逆变器环节,效率白白多出 3-5 个百分点。

储能系统:锂电池储能系统的直流输出与 800V 直流母线天然亲和,无需交流耦合转换,充放电效率更高,响应速度更快。在电网峰谷价差拉大的背景下,储能的经济性进一步凸显。

风力发电:风机输出虽为交流,但经过 AC/DC 整流后即可平滑接入 800V 母线,比传统并网方案简洁得多。

最终,AI 数据中心将不再是电网末梢的被动负荷,而是一个 " 源网荷储 " 协同的能源微网节点——白天光伏直驱,夜间储能接力,风电随时补位,电网仅作后备。这套架构在 " 东数西算 " 和 " 绿电 + 算力 " 的双重国家战略下,政策适配度拉满,碳排放核算上也占尽先机。

四、800V → 50V → 1V:数据中心的电力 " 物流 " 到底有多复杂?

把 800V 直流母线看作数据中心的 " 特高压主干网 ",那么每一级 DCDC 转换就是 " 城市配电网 " 加 " 入户最后一公里 "。这条链路的效率,决定了 GPU 核心收到的每一瓦电,沿途被 " 雁过拔毛 " 了多少次。

AI 数据中心服务器

800V 高压直流首先经过隔离型 DCDC 转换器降至 50V 左右的中压直流。这一级是整个链条中最靠近 " 危险区 " 的环节,技术挑战层层叠加:

·  800V 的超高输入电压,直接筛掉了所有硅基器件——只有 SiC MOSFET(1200V/1700V 耐压等级)扛得住;

·  16:1 的高降压比要求拓扑设计精妙,LLC 谐振、移相全桥等软开关方案是主战场,效率每提高 0.5% 都是硬仗;

·  安全隔离是刚需,变压器的设计直接封死了效率和功率密度的天花板;

·  功率密度军备竞赛:单个砖块模块需要输出 10kW 甚至更高,体积却被死死限定在手掌大小。

在这个环节,英伟达走得最为激进,已直接押注 800VDC → 50VDC 路线,从元器件耐压到安规距离,全部留足余量,为未来的 ± 800VDC 系统提前铺路。相比之下,Google 的策略更为务实:采用 ± 400VDC 的过渡方案,利用两个并联 400V 电源的中点接 PE 将正负轨的电压应力减半,对器件耐压和安规距离的要求大幅降低,更容易在短期内规模落地。两条路线,一个激进一个稳健,背后是对技术成熟度和供应链就绪度的不同判断。

50V 中压进入机架后,由 IBC(中间总线转换器)进一步降压至 12V 或 6V,直接供给 GPU/TPU/NPU/CPU 板卡。这一级的关键词只有一个字:大。大电流—— NVIDIA H200 单卡电流动辄数百安培,IBC 必须在巴掌大的模块内驯服这股洪流。行业普遍采用固定变比方案(如 4:1 或 8:1)来压缩模块体积、提升效率,同时靠多模块并联来分摊热负荷。

这可能是当前 AIDC 供电领域最值得投资者紧盯的一张牌。英伟达正在推动一种堪称 " 跳过一代 " 的方案——彻底消灭 50V 中压级,直接将 800VDC 降至 12VDC 送到 XPU 板卡。

逻辑非常直白:每一级转换就是一级损耗、一组发热、一堆空间占用。砍掉一级,就是砍掉一个故障点加一个效率黑洞。但代价是什么?800V 到 12V 的降压比高达 66:1 ——这是一次从高压直流到低压大电流的极限跨越,对拓扑创新、磁件设计、控制算法的要求是指数级提升的。

如果这条路被英伟达工程化打通,意味着整个机架的中压配电层将被一笔勾销,数据中心供电拓扑将彻底重写。当然,现实中的英伟达并非孤注一掷—— " 两条腿走路 " 才是真实的项目状态:800V → 12V 和 800V → 50V 两套方案并行推进,最终哪条路线胜出,答案大概率会写在 2027-2028 年的规模化验证数据里。

五、最后一英寸的战争:VPD 与芯片集成 IVR

电压从 800V 一路降到 12V,看起来已经完成了 " 长征 "。但真正的硬仗,发生在离芯片仅几厘米的地方。

传统方案:12V 或 6V 进入 GPU 板卡,由十几甚至几十相分立 Buck 转换器(DrMOS+ 电感 + 电容阵列)将电压进一步拉低至核心所需的 0.6-1.2V。问题藏在物理距离里——从板卡边缘的电源入口,到芯片下方密如蛛网的供电网络(PDN),PCB 铜箔走线几厘米的距离引入的寄生阻抗,足以在瞬态电流跳变时制造严重的 IR 压降和响应延迟。GPU 频率越高、电流变化越剧烈,这个 " 最后一英寸 " 的问题就越致命。

VPD(Vertical Power Delivery,垂直供电)的思路粗暴而有效:不再把电源放在板卡边缘,而是直接置于 XPU 芯片的正下方(或正上方),通过垂直互连结构将供电路径从几十毫米压缩到区区几毫米。

·  供电回路电感断崖式下降,瞬态响应能力呈数量级提升—— GPU 突发满载时,电压不会先 " 跌一个坑 " 再拉回来;

·  IR 压降大幅收窄,效率净提升 1-2 个百分点。听起来不多?对于单卡功耗 1400W 的 B300 来说,2% 就是足足 28W ——省下来的不是电费,是从散热系统里抢回来的热预算。

VPD 解决的是 " 供电位置 " 问题,IVR(Integrated Voltage Regulator,集成稳压器)解决的是 " 集成深度 " 问题——把最后一级的降压功能直接嵌入到 XPU 封装内部甚至 Die 上,用硅基电感、片上电容替代一切分立器件。

听上去像科幻?Intel 的数据中心 CPU 已经量产搭载 FIVR(全集成电压调节器);台积电的 CoWoS 先进封装,使得在 GPU 封装基板内嵌入部分供电功能成为可工程化的选项。VPD+IVR 的组合拳,本质上是将供电网络从 " 板级 " 往下压缩到 " 封装级 " 再压缩到 " 芯片级 "。这对于传统分立电源器件供应商是一道凛冽的寒风吹来,但对于先进封装和硅基无源器件的玩家,则是一扇正在被撞开的万亿级新大门。

六、四条技术轴线正在同步共振

AIDC 供电架构的演变不是单点突破,而是四条技术轴线在同一时间窗口内形成共振。理解这种共振,才能看清投资机会的时间梯度。

高压化:从中低压交流到 800V/1000V 高压直流,电压等级数十倍攀升,换来的是铜材用量断崖式减少、传输损耗数量级下降、以及系统拓扑的大幅简化。800V 不是终点,± 1000V 已在视野之内。

直流化:从 "AC-DC-AC-DC" 的多次反复转换,到 "AC-DC" 一次到位后全链路直流配送。每消灭一段交流,就消灭一组整流损耗、一组无功环流、一组 EMI 滤波器。当数据中心内部彻底告别交流电,供电效率的天花板将被整体抬高。

高密化:功率密度从 100W/in ³ 向 180W/in ³ + 冲刺。SiC 和 GaN 器件让开关频率从几十 kHz 跃入数百 kHz,磁性元件体积随之骤缩——高频化是高密化的唯一物理通道。

智能化:AI 算法开始反向赋能电源管理:动态负载预测提前调配功率资源,智能削峰填谷平滑瞬态冲击,故障预判把被动抢修变为主动预防。电源不再是 " 傻供电 ",而是一个嵌入能源大脑的智能节点。

关键节点:800V HVDC 架构预计 2027 年进入大规模部署,这将成为整个产业链从 " 试水 " 到 " 放量 " 的分水岭。

七、散热:功率密度引爆的 " 热天花板 "

当功率密度持续向 180W/in ³ 逼近,散热不再是配角,而是决定方案生死的硬约束。液冷已经从 " 锦上添花 " 变成了 " 没有不行 "。

高功率液冷电源:电源模块自身必须接受液冷,与机柜的 CDU 和液冷管路一体化设计。" 风冷电源 + 液冷芯片 " 的分体模式正在被彻底抛弃,走向 " 全链路液冷 " ——从母线到芯片,每一个发热环节都被液体接管。

微流体冷却:利用微米级通道将冷却液精确输送至芯片表面,实现冷却介质与发热点的 " 零距离 " 热交换。本质上,这是在封装内部构建一个微缩版的散热网络——当宏观尺度的液冷逼近极限,微观尺度的流体管理就是下一个战场。

瞬态功率管理:AI 训练和推理的功耗曲线极其 " 神经质 " ——毫秒级内从怠速跳到满载再跳回来。传统电源的 " 恒压硬扛 " 模式在这种高频剧烈波动下效率崩塌。一种新思路正在兴起:用 Nyobolt 电池系统(能量密度是超级电容的 20 倍,循环寿命超百万次)和 EPIC 削峰填谷模块(峰值 40kW@200ms),在电源和 GPU 之间插入 " 电化学缓冲层 ",用储能吸收瞬态尖峰、填补瞬态谷底,让主电源始终运行在平稳的平均功率点上。——这不只是供电问题,这本质上是在 GPU 侧做 " 电力套利 "。

八、产业链投资地图:谁在 " 电力高速公路 " 上设收费站?

AIDC 供电架构的范式革命,本质是把数据中心从 " 电网的末端负荷 " 升级为 " 能源网络的核心节点 "。每一次转换、每一个器件、每一种材料,都是这条高速公路上的收费站——而且一旦铺开,换不掉的。以下按产业链环节逐一梳理。

在 800V/1000V 高压场景下,传统硅基 IGBT 和 MOSFET 的开关损耗和导通损耗已无法接受。SiC MOSFET 和 GaN HEMT 不是 " 更好的选择 ",而是 " 唯一的选择 "。从衬底到外延到器件到模块,国内产业链正在加速闭环。

高压大电流场景对 PCB 的要求全面升级:更高耐压、更厚铜箔、更优散热。HVDC 电源模块和高压 DCDC 转换器的 PCB 从 " 配角 " 变成了 " 关键器件 "。

800V → 50V 的高压砖块 DCDC 模块是整个架构中最不可替代的 " 电力路由器 "。50V → 12V/6V 的 IBC、以及板级多相电源同样是确定性的增量市场。这一环节壁垒最高、毛利率最厚、国产替代空间最大。

高频化、大电流化对被动元器件的耐压、温度特性、频率响应提出了苛刻要求。LLC 谐振电容、高压 MLCC 滤波电容、高频大电流功率电感——单台 AI 服务器的用量是传统服务器的 5-10 倍。

电源模块液冷化是确定性趋势——当功率密度超过某个阈值,风冷的物理极限就被锁死了。冷板、CDU、液冷管路,以及更远的微流体芯片级散热,构成了一条与功率密度正相关的 " 影子赛道 "。

VPD 和 IVR 从实验室走向产线,核心瓶颈不在电路设计,在封装。台积电 CoWoS、Intel EMIB 等 2.5D/3D 封装技术,以及硅电容、硅基电感等异质集成无源器件,是芯片级供电落地的先决条件。投资这一环节需要更长的耐心,但天花板也最高。

九、投资时钟:别只看方向,更要看节奏

AIDC 供电架构的演进是一场十年为单位的持久战。不同的产业环节,落地节奏差着好几年。在正确的时间买正确的环节,比在任何时间买所有环节,回报可能差一个数量级。

核心受益:高压 DCDC 砖块电源、SiC 功率器件、HVDC 配电设备、PCB 及铜材。  800V HVDC 从头部 CSP 的试点项目走向规模部署,设备采购进入第一波放量期。这一阶段是 " 谁有产能谁赢 " 的供给驱动行情。

核心受益:VPD 电源模块、多相 DrMOS、高频 MLCC、高频电感、液冷散热。  GPU 功耗继续攀升,板上供电电压从 12V 向 6V 过渡,VPD 从旗舰 GPU 向全系列渗透。液冷从机柜级下沉到模块级,散热产业链的价值量被重新定价。

核心受益:先进封装、硅基无源器件、微流体冷却、芯片级 IVR。供电功能深度嵌入芯片封装——这可能是对传统分立电源产业链最彻底的一次 " 创造性破坏 "。投资人需要同时关注:谁在受益,以及谁在被颠覆。

片尾语:电力也有自己的 " 摩尔定律 "

过去二十年,所有人都在谈论芯片的摩尔定律——晶体管密度每 18-24 个月翻一番。但在聚光灯之外,驱动这些晶体管的电力系统也在悄无声息地遵循自己的指数曲线:电压等级逐年攀升,转换效率无限逼近物理极限,功率密度以年化 15-20% 的速度膨胀。

从交流到直流,从中低压到 800V 高压,从机架内的分立电源到芯片内部的集成稳压器—— AIDC 供电架构的每一次跃迁,本质上都是在释放被电能转换损耗锁死的那部分算力。

对于身处其中的创业公司和投资人,这不是一个关于 " 电源 " 的窄众故事。这是一场关乎 AI 基础设施底座的重构,一张正在徐徐展开的千亿级产业链投资地图——而地图上的路标,正指向高压、直流、高密度、芯片级集成的同一方向。

【免责声明】本文仅供信息参考与行业研究,不构成任何投资建议。文中涉及的上市公司信息来源于公开资料,投资者应独立判断并承担投资风险。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

数据中心 ai 英伟达 gpu 产业链
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论