驱动之家 前天
摩尔线程宣布开源MusaCoder:首个国产全功能GPU全栈训练代码大模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 6 月 10 日消息,今日,摩尔线程宣布正式发布并开源 MusaCoder,这是面向 GPU 底层算子生成的专用代码大模型。

摩尔线程表示,MusaCoder 是业内首个基于国产 GPU 算力底座完成全链路训练与验证的开源代码大模型,其完整后训练流程均在基于 MTT S5000 构建的夸娥智算集群上完成。

据介绍,MusaCoder 包含 9B 和 27B 两个参数规模,主要面向 GPU 底层算子生成任务设计,重点支持从 PyTorch 标准算子自动生成高性能 CUDA/MUSA 原生 Kernel 代码。

这一能力可降低开发者手写底层 GPU 算子的门槛,提升 GPU 高性能计算场景下的代码生成、验证和优化效率。

性能方面,在 KernelBench 评测中,MusaCoder-27B-RL 取得 Overall Pass@8 93.2%、Avg.@8 88.60% 的成绩,超越 Claude Opus 4.7、DeepSeek-V4 Pro、GLM-5.1、Kimi K2.6 等主流 SOTA 代码模型,达到当前行业领先水平。

摩尔线程称,MusaCoder 的 SFT(监督微调)、RFT(拒绝采样微调)、RL(强化学习)、异步 rollout、在线编译执行验证及 reward 计算等全栈训练与验证流程,均依托 MTT S5000 构建的夸娥智算集群完成。

这也意味着,国产 GPU 不仅能够支撑大模型推理和常规微调任务,也能够稳定承载代码大模型后训练全周期算力需求。

尤其是在 GPU Kernel 生成这类任务中,训练系统需要频繁进行代码生成、编译、执行、验证和反馈计算,对硬件、编译栈、运行时、调度系统和评测基础设施都提出了更高要求。

MusaCoder 训练总流程

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

摩尔 kimi gpu 开源 基础设施
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论