科创板日报 07-29
大模型推理爆发在即 国产芯片推进超节点布局!算力成本仍待优化
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

《科创板日报》7 月 29 日讯(记者 黄心怡)在 2025 世界人工智能大会上,英国皇家工程院院士郭毅可在演讲中指出,全球 AI 算力需求正以每两年 750 倍的速率极速扩张,中国云端 AI 芯片市场将在 2027 年突破 480 亿美元规模,国产 GPU 替代率预计超 80%。这不仅昭示数据中心成为科技竞争主战场,更预示着 " 普惠算力 " 将如同基础设施般支撑十亿级开发者生态。

《科创板日报》注意到,此次有两个超节点算力产品分别荣获了大会的人工智能引领者奖 ( SAIL 奖 ) TOP30 和 WAIC" 镇馆之宝 " 大奖。

其中,华为 384 超节点真机获本届大会的 " 镇馆之宝 " 奖项。在华为展区中,首次亮相的华为 384 超节点真机与基于 CloudMatrix 384 超节点的华为云新一代昇腾 AI 云服务备受关注。超节点首创将 384 颗昇腾 NPU 和 192 颗鲲鹏 CPU 通过全新高速网络 MatrixLink 全对等互联,形成一台超级 "AI 服务器 ",算力规模 300 PFlops。

目前,华为云 CloudMatrix 384 超节点已在行业中得到应用,包括支撑新浪 " 智慧小浪 " 推理交付效率 50% 以上,支撑硅基流动每天为 600 万用户提供推理服务,支持中科院自研模型训练框架,构建 AI4S 科研大模型;推动面壁智能 " 小钢炮 " 模型推理业务性能提升;为 360" 超级搜索 " 纳米 AI 搜索提供性能领先、贴合需求的 AI 算力;助力讯飞大模型实现推理性能等。

而曦智科技联合壁仞科技、中兴通讯申报的 " 分布式 OCS 全光互连芯片及超节点应用创新方案 ",斩获本届 "SAIL" 奖。

基于该技术方案,上海仪电联合曦智科技、壁仞科技、中兴通讯,正式发布国内首个光互连光交换 GPU 超节点——光跃 LightSphere X。该超节点基于曦智科技全球首创的分布式光交换技术,采用硅光技术的光互连光交换芯片和壁仞科技自主原创架构的大算力通用 GPU 液冷模组与全新载板互连,并搭载中兴通讯高性能 AI 国产服务器及仪电智算云平台软件,构建起高带宽、低延迟、灵活可扩展的自主可控智算集群,即将于上海仪电智算中心落地。

《科创板日报》获悉,燧原科技云燧 ESL 超节点系统正在测试中,单节点最高 64 卡全带宽互联,采用液冷方案,实现高性价比、高密度、高能效,可实现 9216GB 单节点存储容量、230TB/s 单节点存储带宽、51.2TB/s 单节点聚合带宽、单节点可支持 PD 分离优化。

燧原展区集中还展示了庆阳、无锡、宜昌等智算中心的部署成果,以及 " 燧原 ® S60" 人工智能推理卡在泛互联网领域的大规模商业化应用。此外,展区还展出了 2025 年初推出的 DeepSeek 一体机系列产品。

另一家国产 GPU 芯片厂商沐曦发布了旗舰 GPU 曦云 C600,首发训推一体技术全栈方案。该芯片基于沐曦自主知识产权核心 GPU IP 架构,集成大容量存储与多精度混合算力,支持 MetaXLink 超节点扩展技术,并内置 ECC/RAS 多重安全防护模块,为金融、政务等关键领域提供算力基座。

现场,沐曦与中国电子技术标准化研究院共同为 " 人工智能芯片技术研究及开源生态创新联合实验室 " 揭牌,双方将重点突破 AI 芯片标准制定与开源生态建设。

摩尔线程展示了以全功能 GPU 为核心的 " 云边端 " 全栈 AI 产品和解决方案,并首次提出 "AI 工厂 " 理念。摩尔线程创始人兼 CEO 张建中表示,摩尔线程将构建新一代 AI 训练基础设施,为 AGI 时代打造生产先进模型的 " 超级工厂 "。 当单节点效率达到新高度,如何实现大规模集群的高效协作成为新的挑战。摩尔线程自研 KUAE 计算集群通过 5D 大规模分布式并行计算技术,实现上千节点的高效协作,推动 AI 基础设施从单点优化迈向系统工程级突破。

目前国产芯片在大模型的训练和推理中正在发挥更大的作用。

阶跃星辰联合近 10 家芯片及基础设施厂商,共同发起 " 模芯生态创新联盟 "。该联盟的首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现阶跃星辰新一代基础大模型 Step 3 的搭载和运行。沐曦、天数智芯和燧原科技等也已初步实现运行 Step 3。其它联盟厂商的适配工作正在开展。

此外,华为昇腾 910B 加速卡正式上线由无问芯穹与模速空间联合运营的全国首个 " 算力生态超市 " ——模速空间算力生态平台

大会期间还举行了模速空间算力生态平台 2.0 的发布仪式,这标志着模速空间、华为昇腾、无问芯穹三方共同开启 " 百亿生态共建 " 合作。作为全球最大人工智能孵化器——上海模速空间,日均 Token 调用量已成功突破 100 亿大关,累计服务 10 余个智慧场景、支撑 100 多个前沿 AI 创新应用,单应用月活高达数千万。

无问芯穹联合创始人、CEO 夏立雪透露,无穹 AI 云的底层是一张深度覆盖全国的广域算力网,目前已成功覆盖 " 东数西算 " 国家战略布局的关键节点,汇聚了来自 26 个省市、53 个核心数据中心的庞大算力资源,整合超 15 种主流芯片架构的异构算力池,总算力规模超 25000P。基于强大的广域高性能专线内网互联互通,企业能够按需在不同地域、不同型号的算力资源之间进行实时切换与无缝迁移。

在无问芯穹与上海算法创新研究院的合作中,无界智算平台以 " 全链路解决方案 " 升级服务,帮助上海算创院实现大模型研发效率的飞跃,成功基于 3000 卡沐曦国产 GPU 集群,稳定支撑百亿参数大模型训练长达 600 小时不间断,创造了国产算力模型训练的记录

在与云南移动的合作中,无界智算平效利用 2000 张华为昇腾 910B 智算加速卡,实现了千亿参数模型的分布式部署与大规模推理。

上海首个人工智能终端软硬适配优化中试平台在会上启动。无问芯穹与上海创智学院、理想汽车、联想集团、江城实验室、信通院、智元机器人、上海英和、中兴通讯、爱芯元智、上海仪电、中科睿芯、岩芯数智、兆芯集成十余家伙伴,启动人工智能终端中试平台的首期建设。

对于国产芯片在大模型浪潮下的机遇与挑战,燧原科技创始人赵立东在阶跃星辰 Step 3 大模型发布会上表示,国产 AI 芯片面前有两座大山,一是高端芯片制造,二是生态。"在生态方面,当前处于高性能推理爆发的时间点,机遇在于大模型和芯片如何深度优化性能,并降低成本。" 业内一直在强调算力普惠,但现在既不普、也不惠,这恰恰是国产模型跟国产芯片合作的重要契机。"

壁仞科技创始人张文同样认为,如何降低大模型的推理成本是一大痛点。此外,先进 AI 芯片的产能对于国内 AI 持续健康发展非常关键。"AI 三个要素是数据、算法和算力。在数据、算法方面中国是不落后的,算力方面需要一点时间追赶,相信能通过时间慢慢追上来。

除了芯片企业,多家 AI 基础设施厂商也带来了新进展。

中国电信在会上发布算网一体服务。中国电信董事长柯瑞文表示,算间网络是基础,实现全国算力一张网,算网一体化调度是关键,实现全国调度一体化。通过算网一体服务,能够有效降低算网使用成本,提高算力使用效率。

柯瑞文称,将打造大容量、低时延、高速无损的新一代智算网络,支持用户便捷入算,实现算间高效传输;发挥云网融合优势,推动算网深度协同,通过智能云,实现对跨域、异构算力资源的灵活调度,为客户提供一云多芯、分布式、可便捷获取的智算服务。

九章智算云 Alaya NeW Cloud 正式发布了其 GPU 算力服务平台 Aladdin。过去三个月,Aladdin 平台的用户已覆盖清华大学、北京大学、复旦大学、哈尔滨工业大学、上海交通大学等全国多数 " 双一流 " 高校的 AI 研究团队。另外,平台用户中还包含诸多海外高校,QS 前 100 高校占比 80% 以上。

数据中心是 AI 能耗的主要领域。大会期间,施耐德电气商业价值研究院正式发布《算电协同——数据中心的能源挑战与应对》洞察报告,其中指出,随着全球算力需求的爆发式增长,数据中心将面临供电稳定性、成本控制和碳排放管理三重挑战。为推进算力与电力两大系统的协同优化,施耐德电气提出 " 算电协同 " 三层架构及系统化解决方案。为应对 AI 能耗挑战,施耐德电气带来了 SmartCool 2.0 末端空调节能解决方案,融合机器学习技术,可基于 IT 负载需求进行秒级同频动态制冷输出管理。

中信国际电讯展示了基础设施方面的布局。据悉,公司已在全球五大洲部署了丰富资源,包括近 170 个网络服务节点、21 座云平台、30+ 数据中心及 3 座全天候运营的安全运营中心(SOCs)。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

华为 中兴通讯 芯片 科创板 gpu
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论