极客网 2025-12-29
AI框架进化论:昇思MindSpore左手“技术摸高”,右手“好用易用”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

即将过去的 2025 年," 超节点 " 成为 AI 领域的热门关键词。随着大模型参数规模持续变大,主流硬件厂商纷纷布局超节点,推动 AI 算力基础设施迈入了 " 超节点时代 "。算力架构革新之下,被誉为 "AI 领域操作系统 " 的 AI 框架,也迎来新的架构范式。

12月 25 日在 "AI 之城 " 杭州举行的昇思人工智能框架峰会上,昇思 MindSpore 聚焦超节点技术创新,重磅打造昇思 HyperParallel 架构,激发超节点架构优势,充分释放硬件算力,加速 Agentic AI、全模态等新模型结构和新训推范式创新,引领 AI 框架迈入 " 超节点时代 "。

" 技术摸高 " 的同时,深耕开源领域 5 年多的昇思 MindSpore 还以 " 好用易用 " 为核心,构筑了开发友好的领先生态。目前昇思 MindSpore 全球下载量超 1300 万,覆盖 156 个国家和地区,社区贡献者超 5.2 万,合入请求达 12 万 +;完善地支持超过 25 种不同系列大模型,携手 2000+ 合作伙伴落地 3100+ 行业应用,支撑近 2500 篇学术论文创新,成为国内最具创新活力的 AI 框架开源社区。

昇思 MindSpore 开源社区理事长 丁诚

从本次峰会成果看,昇思 MindSpore 紧扣 AI 时代变革脉搏,一手抓技术突破,一手抓生态易用,正携手全球开发者共建繁荣开源生态,赋能千行百业智能化转型,释放 AI 创新的澎湃动能。  

技术摸高:AI 框架正式迈入 " 超节点时代 "  

回顾开源 5 年来的征程,昇思 MindSpore 从原生大规模并行,到端边云全场景部署,再到科学计算加速,每一步都精准踩中了 AI 发展的关键进程。此番昇思 HyperParallel 架构的诞生,则是对模型发展驱动 AI 基础设施从 " 服务器集群时代 " 迈入 " 超节点时代 " 的最新回应。

面对模型规模走向长序列和稀疏的十万亿级,模型结构走向非规则化,训推范式走向异构化的主流趋势,昇思 HyperParallel 架构通过 HyperOffload 多级智能卸载、HyperMPMD 异构非规则并行、HyperShard 声明式并行编程三大技术创新,把超节点当作一台 " 超级计算机 " 来统一编程和调度,相当于给复杂的算力网络装上了 " 智慧大脑 ",能够释放超节点架构的极致潜能。

昇思 MindSpore 开源社区技术委员会主席 金雪锋

其中,HyperOffload 就像给模型训练 " 减负扩容 ",让计算与状态分离,借助超节点的池化存储能力破解昂贵的 HBM 存储瓶颈,让片上内存变为缓存,内存池为存储,不仅让训练性能提升 20% 以上,更将推理序列长度拉长 70% 以上,提供更好的性价比。

HyperMPMD 好比给算力分配 " 精准导航 ",让并行模式从 SPMD 升级为 MPMD,充分发挥超节点对等计算的优势,实现细粒度并行切分与通算并发,为强化学习、全模态等场景提供灵活、均衡的并行能力,将算力利用率提升 15% 以上。

HyperShard 则是给开发者 " 松绑减负 ",让并行编程从繁琐的命令式转为简洁的声明式,屏蔽超节点集群拓扑的复杂性,为全模态等模型提供极简组合编程体验,实现新算法并行化改造时间小于 1 天,并行策略调优也从天级缩减至小时级。

一言以蔽之,三重进化的昇思 MindSpore 为超节点而生,可加速 Agentic AI、全模态等新模型结构和新训推范式创新,并为千行百业的大模型落地 " 降本提质增效 "。

好用易用:" 内外兼修 " 加速开发者 AI 创新进程  

毋庸讳言,一切技术最终的价值,都要体现在应用落地上。为此,昇思 MindSpore 在持续开展技术摸高的同时,已在 " 内外兼修 " 全链路优化,为开发者打造好用易用的 AI 框架,加速他们的 AI 创新进程。

" 内功 " 方面,昇思 MindSpore 通过框架的执行优化、自动微分、图优化、集群调优等能力,不断提升框架性能;并通过图模式 AKG、并行寻优等组件间高度解耦,实现原子化开放,为昇思社区的广大开发者提供架构灵活、组件化可复用的 AI 框架。

在这个维度,昇思 MindSpore 在使能千行万业智能升级过程中,完善地支持超过 25 种不同系列大模型,携手 2000+ 合作伙伴落地 3100+ 行业应用实践,足以证明昇思已实现好用易用,给开发者提供丝滑的开发体验;而快速增长的社区下载量、贡献者及合入请求,则表明越来越多开发者已在社区实现 " 自闭环 ",可以基于昇思 MindSpore 的创新技术做好模型创新。 

" 外功 " 方面,昇思 MindSpore 主动拥抱业界主流生态及社区,包括 SGlang、vLLM、verl、Areal、openRLHF、LLama-factory、OpenCompass 等,将解耦的组件能力使能三方主流开源社区,发挥核心 AI 框架能力,支持好其他头部社区生态的发展,并组织布道活动共同推动开发者应用创新。

在这个维度,昇思 MindSpore 已经全量支持 vLLM 社区核心特性对接,并且在一体机等关键领域场景形态下,不用修改代码就可以通过编译加速获得超过 15% 的性能收益;近期 MindSpore 框架的代码也已经正式贡献合入了 SGLang 社区主仓,丰富了社区后端生态的拓展,现已支持 SGLang 用户使用 Mindspore 在 Qwen3 和 DeepSeek 模型上开展高效部署。

全面进化:携手加速 AI 产业实践和科研创新

" 两手抓、两手硬 " 之下,开源 5 年来的昇思 MindSpore 得到了全面进化,正携手行业伙伴及开发者面向下一个 5 年,共建更加繁荣的开源生态,进一步夯实 AI 框架这一产业智能化的核心基石,加速 AI 产业实践和科研创新。

在 Al for Science 领域,中国商飞上海飞机设计研究院基于昇思 MindSpore AI 框架持续创新,推出业界首个民机超临界翼型气动设计智能体—— " 御风 · 智翼 ",构建了基于工程经验的超临界翼型智能一站式解决方案,实现设计效率与设计质量的双重提升,以 AI 突破科学计算边界,助力中国大飞机的新发展。

在大模型领域,面壁智能在基于昇思 MindSpore 构建分布式大模型训练引擎 BMTrain 的基础之上,研究打造更加高效的稀疏模型架构 BlockFFN,实现以更少的参数激活量获得更强大的模型能力,提升模型密度,从而加快小尺寸模型在各种终端设备上的普惠落地,迎接通用人工智能时代的加速到来。

在金融领域,招商银行基于昇思 MindSpore 多维混合并行策略,在大规模的分布式运行链上开展多轮训练及微调,高效稳定地打造了金融领域的专家模型,并深度赋能公司的金融知识问答、业务模型定制等核心业务应用,推动银行业发展从传统的数字化银行转变为数智化银行。

在 AI 人才培养方面,北京师范大学结合产业对大模型的诉求,依托昇思 MindSpore 打造 " 课 - 训 - 赛 - 产 " 一体化 AI 人才培养全链条,赋能师生从知识学习者成长为昇思社区开发者和布道师,并在全国范围内开展实战型师资培训,培育 AI 教育种子力量,凝聚多方合力共建开放共赢的 AI 人才生态。

如此种种,昇思 MindSpore 全链路赋能大模型创新落地,并拉通 " 产学研 " 需求支持 AI 人才培养,已助力大量开发者成为 AI 产业发展的中坚力量,与时代共舞。

写在最后:

2025 年,超节点成为业界 AI 基础建设的共识,支撑大模型持续创新。面向 2026 年,随着昇思 MindSpore 再进化,打造超节点时代 AI 框架的 " 最优解 ",必将进一步加速新模型结构和新训推范式创新,支撑爆发在即的 Agentic AI 等新场景应用,让开发者基于昇思开展更多 AI 创新,赢在智能时代!

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 人工智能 开源 技术创新 基础设施
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论