算力荒的焦虑已无需渲染。
5 月的一个北京夜晚,创始人、董事长兼首席执行官张建中在摩尔线程 2026 年产品发布会现场透露一组数据:当前国内每天仅某一款应用的 Token 消耗量就已突破 140 万亿——而此前的预测,是整个市场总消耗量在 30 万亿到 180 万亿之间。
为抗住这源源不断的算力需求,一个可靠的人工智能基础设施必不可少。但算力只是故事的一半。" 场景最后还是要通过笔记本、手机或者其他终端来实现。" 一位投资人告诉雷峰网。
从云端到终端,从算力到生态——这场发布会上,摩尔线程展示了一张完整的版图。
从 " 小麦 " 到具身智能,摩尔线程补齐物理 AI 版图
试问 token 消耗的第一来源,自然是当下备受关注的 AI Agent。
IDC 预测,到 2030 年全球活跃 AI 智能体将达 22.16 亿。中国企业 AI 智能体数量将在 2031 年突破 3.5 亿规模,年复合增长率达到 135% 以上。
国内的热情更是传导至政策端。2026 年政府工作报告首次把 " 智能体 " 三个字写了进去—— 2027 年普及率目标超 70%,2030 年超 90%。
但不可忽视的是,当前市面上不少智能体在主动服务、长期记忆等能力上仍有短板,而摩尔线程本次首发的全域智能体 " 小麦 ",可谓恰逢其时。

比 OpenClaw 的分数高出 20% 左右、综合评分远超其他国产同类型产品——摩尔线程推动建立的可视化测评系统 MTClaw Evaluation System 给到了多维度的评估,张建中重点介绍了其中三个特性:
" 事办得全 " ——在 7 × 24 小时服务里," 小麦 " 基于原生 Linux 环境支持超 36 种 APP 的控制,具备 60 多种复杂 skill,可无缝衔接 90 个以上 CLI 工具。
" 事办得好 " ——借由二维拓扑记忆系统,小麦在融合短时和长时记忆的基础上不断归纳总结习得的知识。
" 事办得快 " ——基于摩尔线程自研架构 MTClaw,小麦在调用高频工具时,成功率已超过 95%,端到端任务执行效率相比使用框架前提升了 7 倍。
" 我们希望‘小麦’迅速落地到千家万户。" 张建中直言。
于是,摩尔线程首款面向家庭的消费级产品—— MTT AICUBE,成了小麦的第一个 " 家 "。在现场,张建中用 " 三位一体 " —— AI Agent、AI PC、AI NAS ——来定义这块迷你智能立方体。

支撑这款家庭 AI 中枢的算力底座,其实在去年摩尔线程首届 MUSA 开发者大会上早有预告。内置 CPU、GPU、NPU 和 VPU,摩尔线程首颗自研智能 SoC 芯片 " 长江 " 实现了 50TOPS 异构算力,内存可达 32GB。
而用户对超群记忆力、数据不上云的安全需求则有赖于标配的 1TB 全闪 SSD 以及 12TB 的可扩展空间。
以家庭照片和视频为例,AICUBE 可自动整理相册、生成纪念视频、实时视频超分,满足家庭 " 存得下、找得到、用得起来 " 的需求。
如果说 AICUBE 把 " 小麦 " 留在了家里,那么 MTT AIBOOK 则把它装进了背包。直面当下 OPC(个人公司)风口,这款此前同样官宣过的 AI PC,能在本地能同时跑 12 个以上智能体,直连 90 多款工具,协同完成全链路工作。

稳定运行背后,是摩尔线程打造的原生 AI 操作系统在做支撑——相对 Windows 更轻量、更实时、更可靠。
雷峰网注意到,开箱即用是 MTT AIBOOK 的另一大亮点。出厂预装 OpenClaw 的同时,也为用户准备了可一键切换的 MTClaw。此外,内置的 PES 应用市场方便用户随时下载新应用;提供的 Windows 虚拟机和安卓预置容器,让用户可以在不同系统环境中无缝运行各类软件。
为了免除消费者的后顾之忧,摩尔线程还联合趋境科技,为每位 AIBOOK 用户提供 7 × 24 小时远程技术支持。
从 AICUBE 到 AIBOOK," 小麦 " 学会了处理数字事务。但张建中想更进一步——让智能体走进物理世界,真正动手干活。
他指出,训练一个能在物理世界中自主行动的智能体,面临真实数据稀缺且采集成本高、真机训练风险大和场景难以泛化的挑战。要解决这些问题,不能靠真机硬摔,而需要一个高保真的仿真环境。
MT Lambda 由此而生。作为国内首个全栈国产化具身智能仿真平台,它硬件上依托支持光线追踪的 S5000 GPU 和夸娥集群,软件上融合开源 MujoCo、Newton 及自研 AlphaCore 引擎,最终实现多物理场的统一求解与更快更逼真的渲染速度。现场机器狗灵活的一举一动,便是最直观的注脚。

据张建中介绍,当前摩尔线程已经联合光轮智能、智源研究院和光线云等合作伙伴,打通从数据合成到模型训练再到策略部署的闭环。同时,他也呼吁更多同行者加入其产业生态圈 "PES 联盟 ",共同推进具身智能仿真与训练。
夸娥万卡集群与 MUSA 生态,支撑算力爆发的洪流
支撑智能体和仿真平台的,正是摩尔线程的云端底座——在 S5000 基础上搭建的夸娥万卡集群。而它的核心考验同样在于够不够稳定和高效。

以大模型训练需求为例,张建中指出,客户不愿换用国产智算集群,根源并非软件或兼容问题,而是集群能不能 "7 × 24 小时不停机 "。
摩尔线程用具体测评数据给出了答案:有效训练时长占比超过 90%,稠密模型 MFU 超 40%,MoE 模型 MFU 超 60%。
交出可靠答卷的同时,摩尔线程还啃下 " 精度 " 和 " 扩展稳定性 " 这两块硬骨头,确保每一个训练步骤跟国际主流产品保持精度对齐,在万卡规模下保持 95% 左右的线性扩展率。
预训练只是第一步。后训练,尤其是强化学习阶段,模型需要反复生成回答、接收反馈、迭代更新,对推理吞吐量和稳定性的要求极高。
为此,摩尔线程在训练框架中集成了 SGLang 和 vLLM 两大开源推理引擎,保障数据的高效生成。在此基础上,摩尔线程还尝试使用训推分离 Slime 方案和训推一体 VeRL 方案,两者的提升效果均肉眼可见。
转向需求更火爆的推理场景,夸娥集群的 " 强悍 " 在 AI 漫剧和短剧创作上体现得淋漓尽致。张建中直言," 以前只有好莱坞导演花大价钱才能制作的大片,现在短时间就能生成。"
这背后依托的,正是摩尔线程在夸娥集群上部署的全流程智能生产流水线——涵盖文生视频、语言理解、剧本创作等模型,配合自研语音生成引擎 " 摩语精灵 ",能够精准复刻或转换声音。
无论是训练还是推理性能的充分发挥,都需要软件栈做支撑,而这恰恰是摩尔线程近年来持续加码的方向。目前,MUSA 已完整支持 700 多个核心 API,驱动与运行时全部免费开放。

算子层面,摩尔线程的核心数据库实现 100% 兼容,55 类算子覆盖所有核心 AI 算子,MuDNN 性能与原生态基本持平;PyTorch 算子层做到 100% 兼容,SDK 升级至 5.1 版本;针对大语言模型最常用的 FlashAttention,摩尔线程将其算子效率优化至 95%,大幅缩短了 Transformer 和 MoE 用户的适配时间。
聚焦国内算子开发社区,摩尔线程一方面将国产 AI 编程语言 TileLang 集成至开源主线,GEMM 算子效率超 95%,Attention 效率超 90%;另一方面还与智源研究院合作,推进基于 Triton 的算子开发。
值得注意的还有摩尔线程的 AI 编程神器 MUSACODE。张建中表示,开发者无需学习 MUSA 代码,直接用自然语言就能与其交互,或通过与 " 小麦 " 的对话生成 MUSA Kernel 或算子。据张建中透露,MUSACODE 已原生集成在 AIBOOK 的 VSCode 中。
此外,MUSA 还新增了对编译器 Fortran 的支持,便于传统代码的迁移。
夜色渐深,发布会结束后的展区里,有人对着 " 小麦 " 说话,有人翻看 MUSA 教学书籍,有人围观多智能体协同演示……人潮久久未散。
算力焦虑还在,但国产的答案,一年比一年具体了。


登录后才可以发布评论哦
打开小程序可以发布评论哦