
Token 狂飙 300 倍,我们的智算 " 地基 " 如何托举这场 AI 洪峰?
文|赵艳秋
编|牛慧
" 如果看上层智算的发展速度,你就知道我们基础设施层面临多大压力。" 华为中国数字能源数据中心能源拓展部部长石忆开门见山地说。
生成式 AI 的增速惊人,可能是移动互联网的 " 三倍速 "。根据国家数据局的信息,2024 年初全国日均 token 使用量为 1000 亿,到 2025 年 6 月底已飙升至日均 30 万亿,18 个月增长约 300 倍。有业内人士感叹,如果势头持续下去,"token" 这个单位恐怕都要换了,否则难以计量这场爆发式增长。
这场由 AI 驱动的智能化浪潮,正在把智算基础设施推向前所未有的挑战与拐点。
AI 在狂飙," 地基 " 在冒烟?
今年以来,国内 token 用量呈现 " 六路并进 " 大潮:互联网大厂都在大力投资,全力改写自身产品矩阵;金融行业从 " 单点试水 " 进入 " 全栈渗透 ";制造业用智能体重构更柔性的业务流,超越日企 " 精益制造 ";创业公司中 " 下一个黑马企业 " 已诞生;具身智能、视频生成有望成长为新一代万亿级产业;全国生成式 AI 用户今年 6 月已达 5.15 亿人。
" 我们处在一个最好的时代。" 石忆说,无论是工业变革,还是信息变革,AI 带来了前所未有的机遇。在这样的背景之下,2025 年中国智算中心建设继续 " 高歌猛进 ",智算中心年复合增长率在 40%~46% 之间。
但在高速扩张的同时,智算中心的结构性矛盾与运营痛点也集中暴露。石忆最近与很多客户交流发现,大家还有几个共同的焦虑。比如对智算中心的安全担忧,高能耗、高功率引发的一系列问题,以及对 " 建成即过时 " 的担忧。
" 这也是一个很焦虑的时代。" 石忆说。具体来说,当下基础设施面临几大核心挑战:
首先是安全性挑战。智算中心正迅速高密化,一个 10MW 智算中心承载的算力,是通算中心的 100 多倍,其上运行的大模型训练与推理极多,一旦断电宕机,将造成巨大经济损失。
其次是快速交付挑战。为更快上线业务,OTT 客户普遍要求数据中心在 6 – 12 个月内投运,而传统数据中心通常需 18 – 24 个月以上。
再次是数据中心弹性挑战。客户最焦虑的是 " 建成即过时 "。随着摩尔定律失效," 后摩尔时代 " 接棒,芯片一年一迭代,但数据中心寿命动辄十年,如何不被技术浪潮 " 反噬 "?
第四是运营变现压力。随着数据中心高密化,供配电系统侵占白空间,导致可运营面积缩水," 这种状况必须改变。" 石忆说。
最后是资源挑战。大型智算中心能耗堪比中小城市,能耗、土地、水资源消耗激增,运营商 OPEX 压力、资源供需矛盾正成为行业的最大瓶颈。
为应对上述挑战,石忆谈及,华为提出 AIDC 建设理念 "RAS",即要打造安全可靠 ( Reliable ) ,弹性敏捷 ( Agile ) ,绿色低碳 ( Sustainable ) 的智算底座。
安全、弹性与每一瓦电的较量
在 "RAS" 建设理念中,安全可靠是智算底座的基石。" 它就像人的健康一样,是前面的‘ 1 ’,其他都是后面的‘ 0 ’。" 石忆说。围绕这一核心,华为从架构、产品到运维,重构了数据中心的全生命周期体系。
在架构层面,通过分布式设计降低故障波及范围,并将储能系统隔离部署,规避潜在连锁灾害;在产品层面,以全流程质量管控确保可靠性,华为 UPS 可靠性达业界 2 倍;在智能化层面,数据中心 " 服务 AI" 也 " 由 AI 驱动 ",过去一年,华为投入海量资源进行算法开发,实现锂电 " 上电即上云 " 的主动预警。
面对 AI 高速演进,弹性敏捷成为新的竞争点。客户最大担忧是 " 建成即过时 "," 弹性数据中心是唯一选择。" 石忆说。华为通过系统解耦、模块化和标准化,使供电、制冷、IT 子系统相互独立,灵活部署。预制化交付让大量工序前置工厂,现场施工周期缩短超六成。例如华为云(芜湖)数据中心项目,仅用三个月完成交付,为行业树立新标杆。
在高密度时代,绿色低碳成为可持续发展的底线。" 电力就是算力的上限 " 已成行业共识,石忆强调,关键是高效用电,来解决算和电的根源性矛盾。华为 UPS 在 S-ECO 模式下效率高达 99.1%;通过 AI 协同制冷,让能源与算力设施 " 联合作战 ",显著降低 PUE。以 500MW 数据中心为例,PUE 每降低 0.1,一年可节省电费约 2 亿元。
同时,越来越多智算中心建设在风光电富集区,实现 " 绿电直供、就地消纳 "。在储能环节,传统铅酸电池正在被高效、占地更小、可智能管理的锂电池替代。华为推动锂电标准化,并推出 " 锂电池管理安全卫士 " 系统。目前,锂电方案已在多个项目中落地。
石忆强调,安全靠的是高质量,而高质量不是低成本的产物。从数据中心 10 至 15 年的生命周期看,一次中断造成的损失远超在可靠与绿色基础设施上的投入。真正的矛盾,不在安全与低碳之间,而在短期成本与长期价值之间。
" 软着陆 " 与 " 快起飞 "
在数据中心建设中,新建与改造并重。全国在网机架已达千万级,不少设备服役超过 8 年,逐步进入改造期。许多客户担心改造意味着 " 大动干戈 ",石忆表示,通过场景化解决方案,企业可实现 " 软着陆 "。而对需从通算迈向高密智算的场景,新建过程中需要 " 快起飞 "。
在金融等对可靠性要求极高的行业,核心是不影响现有业务连续性。在实践案例中,中金数据昆山中心通过部署华为高质量 UPS 实现系统无感升级;上交所金桥数据中心通过部署 iCooling@AI 能效解决方案,年均 PUE 降低 0.25,年省电累计 240 万度。
对缺乏专业运维团队或希望 " 开箱即用 " 的政务、教育、制造等用户,华为提供一体化微模块数据中心,东莞滨海湾新区快速上线 DeepSeek 政务应用,国家气象局构建风云三号数据中心,实现业务快速上线,备电系统采用智能锂电柜,节省 70% 占地并支持预测性维护。
对于从通算迈向高密智算的场景,华为通过全预制化、模块化方案,将原本需要 1-2 年的建设周期,压缩至半年甚至更短。
中国移动呼和浩特数据中心采用华为 EHU 间接蒸发冷却、电力模块和 iCooling@AI 能效调优解决方案,降低制冷能耗 10%,节省配电面积 40%,PUE 低至 1.15。博大数据前海智算中心通过采用华为电力模块 3.0,打造省地、省电、省时、省心的供配电系统,节省占地 40%,全链效率提升至 97.8%,成为智算建设的新标杆。
这些能力背后,是华为覆盖从硬件到云的全栈体系。通过计算产品与基础设施协同设计,每代产品均在华为云大规模验证,实现性能与能效双优。
在这个既澎湃又焦虑的时代,谁能在安全、弹性与绿色中取得平衡,谁就能在下一场智能浪潮中赢得先机。
© 本文为数智前线(szqx1991)原创内容
进群、转载或商务合作联系后台
文章精选
 
    

登录后才可以发布评论哦
打开小程序可以发布评论哦