国产GPU率先支撑央企大模型，S5000完成九天35B大模型适配

近日，中国移动自主研发的九天 35B 通用大模型即将正式发布。作为中国移动重要的生态合作伙伴及 "AI 能力联合舰队 " 的核心算力成员，摩尔线程基于旗舰级 AI 训推一体全功能 GPU MTT S5000，依托成熟的 MUSA 软件栈与高性能算子优化，已率先完成九天 35B 模型的全流程适配与推理验证。这不仅是国产 GPU 与央企大模型的深度协同，更意味着国产 AI 算力已具备支撑行业级大模型规模化落地的核心能力。

软硬协同优化，释放极致性能

本次适配中，摩尔线程基于自研 MUSA 软件栈与 SGLang-MUSA 高性能推理引擎，深度打通九天 35B 模型推理全链路。MTT S5000 基于第四代 MUSA" 平湖 " 架构打造，单卡 AI 稠密算力可达 1000 TFLOPS，支持从 FP8 到 FP64 全精度计算，为大模型推理提供了坚实的硬件底座，精准匹配九天 35B 大模型在长文本处理与高并发响应方面的核心需求。

为追求极致效率，摩尔线程通过 MUSA C 开发框架、muDNN 计算库与 MATE 开源算子库的全栈优化，针对九天 35B 模型特有的注意力机制与长序列推理进行深度适配，确保模型在 MTT S5000 上高效执行。实测表明，在标准推理场景下，MTT S5000 可稳定支撑九天 35B 模型的高并发请求，充分满足各行业对大模型低时延、高可靠的部署要求。

国产 GPU+ 央企大模型，夯实全栈算力底座

中移九天 35B 大模型作为中国移动 " 九天 " 基座核心产品，具备高安全、高可控、全自主的央企特性，已通过生成式 AI 服务双备案与 A 级安全认证，广泛适配数智化转型场景。此次摩尔线程 MTT S5000 快速完成适配，不仅验证国产 GPU 生态成熟度与响应速度，更构建 " 国产 GPU + 央企大模型 " 全栈国产化方案，为中国移动算网融合、AI 能力规模化输出提供关键支撑，助力千行百业智能化升级。

作为中国移动深度生态伙伴，摩尔线程积极参与移动云智算中心、万卡级集群建设，近期更联合中国移动研究院、之江实验室等产业伙伴，共同发布《OISA 高密超节点参考设计技术规范》，推动国产 AI 算力基础设施的标准化与高密度演进。未来，摩尔线程将持续依托 AI 智算产品与 MUSA 全栈技术，携手中国移动及更多产业伙伴，深化智算基础设施与 AI 应用的协同创新，加速构建自主可控、高效可靠的新一代 AI 基础设施，为千行百业智能化升级提供坚实底座。

宙世代

一起剪

相关标签