摩尔线程宣布开源MusaCoder：首个国产全功能GPU全栈训练代码大模型

快科技 6 月 10 日消息，今日，摩尔线程宣布正式发布并开源 MusaCoder，这是面向 GPU 底层算子生成的专用代码大模型。

摩尔线程表示，MusaCoder 是业内首个基于国产 GPU 算力底座完成全链路训练与验证的开源代码大模型，其完整后训练流程均在基于 MTT S5000 构建的夸娥智算集群上完成。

据介绍，MusaCoder 包含 9B 和 27B 两个参数规模，主要面向 GPU 底层算子生成任务设计，重点支持从 PyTorch 标准算子自动生成高性能 CUDA/MUSA 原生 Kernel 代码。

这一能力可降低开发者手写底层 GPU 算子的门槛，提升 GPU 高性能计算场景下的代码生成、验证和优化效率。

性能方面，在 KernelBench 评测中，MusaCoder-27B-RL 取得 Overall Pass@8 93.2%、Avg.@8 88.60% 的成绩，超越 Claude Opus 4.7、DeepSeek-V4 Pro、GLM-5.1、Kimi K2.6 等主流 SOTA 代码模型，达到当前行业领先水平。

摩尔线程称，MusaCoder 的 SFT（监督微调）、RFT（拒绝采样微调）、RL（强化学习）、异步 rollout、在线编译执行验证及 reward 计算等全栈训练与验证流程，均依托 MTT S5000 构建的夸娥智算集群完成。

这也意味着，国产 GPU 不仅能够支撑大模型推理和常规微调任务，也能够稳定承载代码大模型后训练全周期算力需求。

尤其是在 GPU Kernel 生成这类任务中，训练系统需要频繁进行代码生成、编译、执行、验证和反馈计算，对硬件、编译栈、运行时、调度系统和评测基础设施都提出了更高要求。

MusaCoder 训练总流程

宙世代

一起剪

相关标签