近日,中国移动自主研发的九天 35B 通用大模型即将正式发布。作为中国移动重要的生态合作伙伴及 "AI 能力联合舰队 " 的核心算力成员,摩尔线程基于旗舰级 AI 训推一体全功能 GPU MTT S5000,依托成熟的 MUSA 软件栈与高性能算子优化,已率先完成九天 35B 模型的全流程适配与推理验证。这不仅是国产 GPU 与央企大模型的深度协同,更意味着国产 AI 算力已具备支撑行业级大模型规模化落地的核心能力。
软硬协同优化,释放极致性能
本次适配中,摩尔线程基于自研 MUSA 软件栈与 SGLang-MUSA 高性能推理引擎,深度打通九天 35B 模型推理全链路。MTT S5000 基于第四代 MUSA" 平湖 " 架构打造,单卡 AI 稠密算力可达 1000 TFLOPS,支持从 FP8 到 FP64 全精度计算,为大模型推理提供了坚实的硬件底座,精准匹配九天 35B 大模型在长文本处理与高并发响应方面的核心需求。
为追求极致效率,摩尔线程通过 MUSA C 开发框架、muDNN 计算库与 MATE 开源算子库的全栈优化,针对九天 35B 模型特有的注意力机制与长序列推理进行深度适配,确保模型在 MTT S5000 上高效执行。实测表明,在标准推理场景下,MTT S5000 可稳定支撑九天 35B 模型的高并发请求,充分满足各行业对大模型低时延、高可靠的部署要求。
国产 GPU+ 央企大模型,夯实全栈算力底座
中移九天 35B 大模型作为中国移动 " 九天 " 基座核心产品,具备高安全、高可控、全自主的央企特性,已通过生成式 AI 服务双备案与 A 级安全认证,广泛适配数智化转型场景。此次摩尔线程 MTT S5000 快速完成适配,不仅验证国产 GPU 生态成熟度与响应速度,更构建 " 国产 GPU + 央企大模型 " 全栈国产化方案,为中国移动算网融合、AI 能力规模化输出提供关键支撑,助力千行百业智能化升级。
作为中国移动深度生态伙伴,摩尔线程积极参与移动云智算中心、万卡级集群建设,近期更联合中国移动研究院、之江实验室等产业伙伴,共同发布《OISA 高密超节点参考设计技术规范》,推动国产 AI 算力基础设施的标准化与高密度演进。未来,摩尔线程将持续依托 AI 智算产品与 MUSA 全栈技术,携手中国移动及更多产业伙伴,深化智算基础设施与 AI 应用的协同创新,加速构建自主可控、高效可靠的新一代 AI 基础设施,为千行百业智能化升级提供坚实底座。


登录后才可以发布评论哦
打开小程序可以发布评论哦