IT时报 07-23
上海首次验证“算电协同”新模式
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

" 算电共生 " 新范式从构想走进现实

作者/   IT 时报记者    毛宇

编辑/   钱立富  

7 月初,上海临港智算谷的机房内,一场静默的 " 迁徙 " 正在上演——中国电信旗下临港算力(上海)科技有限公司接到国网上海市电力公司的调峰指令后,短短 3 分钟内,正在运行的人工智能推理任务便跨越千里,平稳转移至湖北十堰的算力中心。实时监测屏上,临港智算中心的单机用电负荷同步下降 75%,转移至十堰的任务进展顺利。

" 此次迁移采取精准的动态路由与无感知流量切换技术,将业务负载智能地分配至最优算力节点。" 临港算力(上海)科技有限公司市场部负责人曹春表示。

这场 " 算力迁徙 ",是全国首次生产环境下的算电协同跨域调度。中国电信临港算力公司与国家电网上海市电力公司协同联动,不仅打通了算力与电力跨省域调度的新通路,更标志着数字时代 " 算电共生 " 的新范式从构想走进现实。

临港之问

激增的算力与紧绷的电网如何共生

" 在临港,算力使用带来的电力消耗每年正以 20% 以上的速度增长。" 曹春告诉《IT 时报》记者,而智算中心正是承载算力使用的 " 用电大户 "。随着大模型训练、人工智能推理等需求爆发,这一数字还在持续攀升。

作为上海人工智能产业的核心承载区,临港新片区的算力需求早已不是 " 线性增长 "。临港智算谷自 2021 年成立以来,已建成大规模算力集群,成为 " 算力浦江 " 智算行动的核心节点。" 我们不仅要满足企业对算力的需求,更要考虑如何与城市电力供应‘和谐共生’。" 曹春坦言,这是所有数据中心运营者面临的共同挑战。

挑战的另一端,是电网的 " 紧绷感 "。上海作为超大型城市,电力负荷峰谷差超过 40%,每到夏季用电高峰,保障电力稳定供应就成了国网上海市电力公司的重点工作,为此出台了多项措施,其中之一就是通过虚拟电厂激励本地高负荷用户自主降荷。" 这给了我们探索算电协同的契机。" 曹春说道。

图源:unsplash

而这源于前期的技术积淀和经验积累。

2023 年,上海电信就与国网上海电力搭建协同平台,通过启动柴油发电机参与虚拟电厂调峰,积累了丰富的需求侧响应经验。" 到今年,我们的智算中心完成了算力调度能力建设,千卡集群长距离调度、多源备电参与虚拟电厂实测等技术都过了关。" 曹春说,当国网提出基于电力调峰的算力转移需求时," 我们知道,时机到了。"

技术破局

打破 " 物理边界 " 实现 " 无感迁徙 "

" 要让算力像水流一样,哪里电力宽裕就流向哪里,核心在于打破物理边界的调度平台。" 临港算力(上海)科技有限公司数碳专项组总监袁潇洋站在调度平台大屏前,指着实时跳动的数据流解释。这个跨地域智能算电协同调度平台,正是此次 " 算力迁徙 " 的 " 指挥中枢 "。

平台的 " 大脑 ",是一套轻量化、高性能的流量治理系统。" 你看,当临港的电力负荷达到阈值,系统会自动扫描全国可调度的算力节点——湖北十堰此时电力充裕,且算力集群与临港的架构配置匹配,就会被选为最优目标。" 袁潇洋指向屏幕上的绿色节点说道," 这就是精准动态路由技术的作用,它能实时计算路径、匹配资源,比人工调度快上数倍。"

更关键的是 " 无感切换 " 技术。在普通人看来,任务转移可能只是屏幕上的一个进度条,但背后藏着复杂的逻辑:当调度指令下达,系统会先在十堰节点 " 预热 " 算力,同步任务缓存数据,再通过毫秒级的流量切换,让用户请求无缝转接。" 就像你坐车时打电话,从一个基站切换到另一个基站,但通话不会断,你也感觉不到," 袁潇洋表示," 这次转移的通用大模型推理任务,涉及多轮对话场景,必须保证上下文连贯,我们的技术做到了零丢包、低延迟 "。

支撑这套技术的,是扎实的硬件基础。

临港智算中心的机房里,一排排搭载 GPU 的服务器正在运行," 我们的算力集群不仅规模大,还做了标准化适配,不管是推理还是训练任务,都能快速‘拎包入住’到各类机房场景。" 袁潇洋补充道,他们还研究了不同任务的 " 可调性 "," 比如训练任务可以通过暂停参与时间调度,推理任务更强调实时性,可以通过转移参与空间调度。这些特征模型让调度更精准 "。

资源管理的细节同样重要。" 空载服务器会通过操作系统电源管理进行降频,非瓶颈部件的功耗会大大降低。" 袁潇洋说,这些 " 精打细算 " 的措施,让算力转移的降荷效果更显著——此次转移后,临港单机负荷下降 75%,就是技术叠加管理的结果。

未来图景

算电协同从 " 首次 " 到 " 常态 "

这场 " 千里迁徙 " 的意义,远不止于一次技术验证。

对电网而言,它打开了 " 柔性调峰 " 的新空间。" 过去调峰像‘拆积木’,只能停掉整个设备;现在像‘挪积木’,把任务移走就行。" 袁潇洋同记者算了一笔账,临港智算谷若将全量算力资源投入虚拟电厂响应,最多可降低 8 兆瓦负荷,这相当于为临港地区新建一座小型调峰电站。

不仅如此,此次电信的算力调度能力还突破了自有边界,不仅可以畅通互调中国电信内部的算力资源,也打通了电信合作伙伴的机房资源。

未来,随着更多节点加入,这种 " 跨省互济 " 可能成为常态——东部用电高峰时,算力去西部;西部紧张时,再回迁至东部,让电网负荷像 " 潮汐 " 一样自然流动。

对算力产业来说,这是 " 降本增效 " 的实在路径。

" 国网的调峰补贴能直接降低运营成本,而算力跨域调度让资源利用率提高了 20% 以上。" 曹春透露,已有不少 AI 企业来咨询这种模式," 他们关心的不仅是算力够不够,还有用电稳不稳、成本优不优,算电协同正好解决了这些痛点。"

更深远的是对绿色发展的推动。临港智算中心正实现 100% 绿电供应,包含自建光伏、海风直送、隔墙储能,当算力可以追着绿电走,数据中心的 " 碳足迹 " 将大幅缩减。

这场始于临港的首次实践,令算力与电力走向交织共生的 " 经纬网 " 关系,共同编织着数字时代更高效、更绿色的未来。曹春表示,他们下一步要做的,是令 " 首次 " 逐渐转变为 " 日常 "," 当算电协同像水电煤一样便捷,数字经济的根基会更稳,绿色发展的底气也会更足 "。

排版/ 季嘉颖

图片/ 上海电信   unsplash

来源/《IT 时报》公众号 vittimes

E   N   D

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

上海 人工智能 中国电信 物理 十堰
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论