

中经记者 李玉洋 北京报道
" 今天其实行业人都很焦虑,每天讨论的话题就是我们今天用了多少 Token(词元)。我们已经真正进入了词元时代。"5 月 18 日,摩尔线程(688795.SH)创始人、董事长兼首席执行官张建中在年度产品发布会上表示,因为 Token,IoT 的含义从 Internet of Things 转变为 Intelligence of Things,这得益于 Agentic AI 在过去几个月中的迅速发展。
《中国经营报》记者注意到,摩尔线程通过此次发布会全面展示了 " 云—边—端 " 全栈智算矩阵:从万卡级规模的夸娥智算集群,到自研 " 长江 "SoC 驱动的智能终端 MTT AICUBE 和 MTT AIBOOK;从数字世界智能体 " 小麦 ",到加速物理 AI 落地的首个全栈具身智能仿真平台 MT Lambda,再到持续进化的 MUSA 生态。
对于当前常被讨论的 AI 工厂(Factory),张建中把其分为模型训练工厂(Model Factory)、词元生产工厂(Token Factory)和智能体生产工厂(Agent Factory)。而摩尔线程在 Agentic AI 时代要做的是帮助产业打造 AI 基础设施,服务每个用户的需求。
Token 消耗量指数级增加
" 夸娥(KUAE)智算集群是摩尔线程的核心战略。" 张建中表示,大模型的训练对于产业界,尤其是大模型公司来说非常关键,当前大模型版本的迭代周期变得越来越短," 从早期的三个月变成两个月,甚至一个月,有的希望两个礼拜就快速迭代上市 "。
他提到虽然国内模型与国外模型仍有差距,但国内开源策略非常有价值,中国大模型推理用户群体服务数量全球第一,因此日均消耗 Token 量也急剧增加,而 Token 消耗量的指数级增加,对于我国是一个巨大的增长机会。
" 在全场景消耗 Token 应用中,早期 AI Coding 和 AIGC,也就是写代码和生成视频这两个是最顶级的 Killer Apps,但是今天‘龙虾’(OpenClaw)这样的 Agentic AI 应用已经占据了大半壁江山。" 张建中表示,Agent 的崛起,加上 Coding 和 AIGC,让整个 AI 的应用场景变得更加广泛," 摩尔线程希望通过夸娥去满足模型训练、推理和智能体的应用,满足整个市场的需要 "。
据介绍,目前,摩尔线程的夸娥万卡级智算集群已成功落地,多项关键指标达到国际主流水平,在 Dense 大模型训练中的模型算力利用率(MFU)达 60%,在 MoE 大模型上达 40%,有效训练时长达 90%,训练线性扩展效率达 95%。
事实上,大模型训练是一项极为复杂的系统性工程,涵盖预训练(Pre-train)、持续预训练(CPT)、长文本训练、微调(SFT)及强化学习(RL)等流程。为赋能开发者,摩尔线程推出夸娥训练套件,覆盖大模型预训练和后训练全链路,包括训练框架、AI 框架及训练辅助工具等核心组件,专门优化了对强化学习的支持,兼容业界主流的 VeRL 训推一体与 Slime 训推分离框架,并完成了对多项微调框架的适配。
在推理端,摩尔线程展现了其深厚的生态底蕴与 " 发布即适配 "(Day-0 适配)的响应速度。目前,摩尔线程已全面适配 DeepSeek、GLM、MiniMax、Kimi、Qwen 等国内头部大模型,以及主流的语音、视觉理解及多模态模型。值得一提的是,摩尔线程在推理框架 SGLang 主线代码中获得了官方原生支持,并开源了 vLLM-MUSA,可原生获得摩尔线程 GPU 加速能力,大幅提升推理效率。
发布首款家庭智能设备
为满足 Token 时代爆发的端侧算力需求,摩尔线程立足自研 " 长江 " 智能 SoC,正式宣布全面深化端侧 AI 战略布局,并发布首款面向家庭场景的消费级产品—— MTT AICUBE,实现了算力从云端智算集群向边缘和终端的延伸。
据介绍,作为该端侧战略的关键落子,MTT AICUBE 重新定义了家庭智能设备的形态与体验。它不仅仅是一台计算硬件,更是摩尔线程以全域智能体 " 小麦 " 为核心,以端侧本地算力为引擎,以全闪存私有云为数据底座,以全栈自研 OS 为系统支撑,将 " 端云一体 " 的能力首次完整带入家庭场景。
从 " 龙虾 " 引发的自主执行热潮,到 AI Agent 任务执行规模的指数级增长,智能体正以前所未有的速度进入每个人的生活。在摩尔线程看来,家庭正成为端侧智能体落地的关键场景。
"AICUBE 是家庭 AI 中枢。" 张建中表示,MTT AICUBE 三位一体,是 AI Agent + AI PC + AI NAS 的结合,其内置的 " 小麦 " 智能体预装 60 余项技能(Skills),支持超 36 款 App 的跨应用控制。
同时,摩尔线程还宣布 MTT AIBOOK 全面升级,AIBOOK 在 MTT AIOS 原生 Linux 系统下,预装原生 " 龙虾 " 智能体,支持多智能体协作,为智能体应用的开发、调试与部署提供完整的闭环解决方案。
除 AICUBE 与 AIBOOK 外,摩尔线程以 " 长江 " 智能 SoC 为核心还构建了专为嵌入式边缘场景设计的 MTT E300 AI 模组,支持混合精度计算,为工业质检、能源巡检、智慧教室、具身智能、智能汽车及低空经济等典型场景提供高效、低延迟、强可靠的边缘 AI 能力。
值得一提的是,摩尔线程发布了其首个全栈具身智能仿真平台 MT Lambda。张建中表示,尽管仿真训练平台能加速机器人的训练周期,但仍面临三大挑战:一是缺少大量的数据,数据的获取成本非常高;二是用真机训练风险高,代价也太高;三是场景不易泛化。
据介绍,MT Lambda 平台构建了从底层算力、核心引擎到上层框架及工具的完整解决方案:底层基于全功能 GPU,实现渲染、物理、AI 计算在同一芯片中完成,数据 " 零拷贝 ";中间层深度融合自研物理、渲染、AI 三大引擎;上层则提供 MT Lambda-Lab 具身策略开发与训练平台以及 MT Lambda-Sim 高保真物理仿真与渲染平台。
在具身智能领域,摩尔线程依托夸娥智算集群、仿真平台及端侧 SoC 芯片,已经形成云边端协同的产品与能力布局。同时,摩尔线程积极拓展具身生态 " 朋友圈 ",通过与光轮智能在合成数据等关键领域共筑国产具身智能仿真底座,以及与光线云联合打造 RaysTwins 具身仿真平台等深度合作,共同推动技术成果加速转化落地。
据介绍,作为贯穿摩尔线程全功能 GPU 硬件与全栈软件体系的底层架构,MUSA 已全面实现对业界主流 CUDA 生态的深度兼容。摩尔线程最新发布的 MUSA SDK 5.1.0,对标 CUDA 12.8,从驱动与运行时新增 248 个 API,兼容接口数达到 761,到核心数学库的 100% 对齐,从覆盖 55 类核心 AI 算子,到完整支持 PyTorch 全部 3194 个算子,MUSA 软件栈全链路覆盖了底层驱动、编译器、算子加速库、训练与推理框架,让国产 GPU 真正具备 " 即插即用 " 的开放能力。
来源:《中国经营报》
编辑:吴清
校对:张国刚
审核:李正豪


登录后才可以发布评论哦
打开小程序可以发布评论哦