动点科技 07-03
摩尔线程夸娥智算中心解决方案扩展至万卡规模
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

动点科技获悉,7 月 3 日,摩尔线程宣布其 AI 旗舰产品夸娥(KUAE)智算集群解决方案从当前的千卡级别大幅扩展至万卡规模。

在集群计算性能方面,全新一代夸娥智算集群实现单集群规模超万卡,浮点运算能力达到 10Exa-Flops,大幅提升单集群计算性能,能够为万亿参数级别大模型训练提供坚实算力基础。在集群稳定性方面,摩尔线程夸娥万卡集群平均无故障运行时间超过 15 天,最长可实现大模型稳定训练 30 天以上,周均训练有效率在 99% 以上。

MFU 是评估大模型训练效率的通用指标,可以直接反应端到端的集群训练效率。夸娥万卡集群在系统软件、框架、算法等层面一系列优化,实现大模型的高效率训练,MFU 最高可达到 60%。

夸娥万卡集群是一个通用加速计算平台,计算能力为通用场景设计,可加速 LLM、MoE、多模态、Mamba 等不同架构、不同模态的大模型。同时,基于高效易用的 MUSA 编程语言、完整兼容 CUDA 能力和自动化迁移工具 Musify,加速新模型 "Day0" 级迁移,实现生态适配 "Instant On",助力客户业务快速上线。

此外,摩尔线程联合中国移动通讯集团青海有限公司、中国联通青海公司、北京德道信科集团、中国能源建设股份有限公司总承包公司、桂林华崛大数据科技有限公司(排名不分先后)分别就三个万卡集群项目进行了战略签约,多方聚力共同构建国产 GPU 集群。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

摩尔 青海 ai 自动化
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论