摩尔线程描绘了更大的蓝图：从全功能GPU到Agent全场景落地

算力荒的焦虑已无需渲染。

5 月的一个北京夜晚，创始人、董事长兼首席执行官张建中在摩尔线程 2026 年产品发布会现场透露一组数据：当前国内每天仅某一款应用的 Token 消耗量就已突破 140 万亿——而此前的预测，是整个市场总消耗量在 30 万亿到 180 万亿之间。

为抗住这源源不断的算力需求，一个可靠的人工智能基础设施必不可少。但算力只是故事的一半。" 场景最后还是要通过笔记本、手机或者其他终端来实现。" 一位投资人告诉雷峰网。

从云端到终端，从算力到生态——这场发布会上，摩尔线程展示了一张完整的版图。

从 " 小麦 " 到具身智能，摩尔线程补齐物理 AI 版图

试问 token 消耗的第一来源，自然是当下备受关注的 AI Agent。

IDC 预测，到 2030 年全球活跃 AI 智能体将达 22.16 亿。中国企业 AI 智能体数量将在 2031 年突破 3.5 亿规模，年复合增长率达到 135% 以上。

国内的热情更是传导至政策端。2026 年政府工作报告首次把 " 智能体 " 三个字写了进去—— 2027 年普及率目标超 70%，2030 年超 90%。

但不可忽视的是，当前市面上不少智能体在主动服务、长期记忆等能力上仍有短板，而摩尔线程本次首发的全域智能体 " 小麦 "，可谓恰逢其时。

比 OpenClaw 的分数高出 20% 左右、综合评分远超其他国产同类型产品——摩尔线程推动建立的可视化测评系统 MTClaw Evaluation System 给到了多维度的评估，张建中重点介绍了其中三个特性：

" 事办得全 " ——在 7 × 24 小时服务里，" 小麦 " 基于原生 Linux 环境支持超 36 种 APP 的控制，具备 60 多种复杂 skill，可无缝衔接 90 个以上 CLI 工具。

" 事办得好 " ——借由二维拓扑记忆系统，小麦在融合短时和长时记忆的基础上不断归纳总结习得的知识。

" 事办得快 " ——基于摩尔线程自研架构 MTClaw，小麦在调用高频工具时，成功率已超过 95%，端到端任务执行效率相比使用框架前提升了 7 倍。

" 我们希望‘小麦’迅速落地到千家万户。" 张建中直言。

于是，摩尔线程首款面向家庭的消费级产品—— MTT AICUBE，成了小麦的第一个 " 家 "。在现场，张建中用 " 三位一体 " —— AI Agent、AI PC、AI NAS ——来定义这块迷你智能立方体。

支撑这款家庭 AI 中枢的算力底座，其实在去年摩尔线程首届 MUSA 开发者大会上早有预告。内置 CPU、GPU、NPU 和 VPU，摩尔线程首颗自研智能 SoC 芯片 " 长江 " 实现了 50TOPS 异构算力，内存可达 32GB。

而用户对超群记忆力、数据不上云的安全需求则有赖于标配的 1TB 全闪 SSD 以及 12TB 的可扩展空间。

以家庭照片和视频为例，AICUBE 可自动整理相册、生成纪念视频、实时视频超分，满足家庭 " 存得下、找得到、用得起来 " 的需求。

如果说 AICUBE 把 " 小麦 " 留在了家里，那么 MTT AIBOOK 则把它装进了背包。直面当下 OPC（个人公司）风口，这款此前同样官宣过的 AI PC，能在本地能同时跑 12 个以上智能体，直连 90 多款工具，协同完成全链路工作。

稳定运行背后，是摩尔线程打造的原生 AI 操作系统在做支撑——相对 Windows 更轻量、更实时、更可靠。

雷峰网注意到，开箱即用是 MTT AIBOOK 的另一大亮点。出厂预装 OpenClaw 的同时，也为用户准备了可一键切换的 MTClaw。此外，内置的 PES 应用市场方便用户随时下载新应用；提供的 Windows 虚拟机和安卓预置容器，让用户可以在不同系统环境中无缝运行各类软件。

为了免除消费者的后顾之忧，摩尔线程还联合趋境科技，为每位 AIBOOK 用户提供 7 × 24 小时远程技术支持。

从 AICUBE 到 AIBOOK，" 小麦 " 学会了处理数字事务。但张建中想更进一步——让智能体走进物理世界，真正动手干活。

他指出，训练一个能在物理世界中自主行动的智能体，面临真实数据稀缺且采集成本高、真机训练风险大和场景难以泛化的挑战。要解决这些问题，不能靠真机硬摔，而需要一个高保真的仿真环境。

MT Lambda 由此而生。作为国内首个全栈国产化具身智能仿真平台，它硬件上依托支持光线追踪的 S5000 GPU 和夸娥集群，软件上融合开源 MujoCo、Newton 及自研 AlphaCore 引擎，最终实现多物理场的统一求解与更快更逼真的渲染速度。现场机器狗灵活的一举一动，便是最直观的注脚。

据张建中介绍，当前摩尔线程已经联合光轮智能、智源研究院和光线云等合作伙伴，打通从数据合成到模型训练再到策略部署的闭环。同时，他也呼吁更多同行者加入其产业生态圈 "PES 联盟 "，共同推进具身智能仿真与训练。

夸娥万卡集群与 MUSA 生态，支撑算力爆发的洪流

支撑智能体和仿真平台的，正是摩尔线程的云端底座——在 S5000 基础上搭建的夸娥万卡集群。而它的核心考验同样在于够不够稳定和高效。

以大模型训练需求为例，张建中指出，客户不愿换用国产智算集群，根源并非软件或兼容问题，而是集群能不能 "7 × 24 小时不停机 "。

摩尔线程用具体测评数据给出了答案：有效训练时长占比超过 90%，稠密模型 MFU 超 40%，MoE 模型 MFU 超 60%。

交出可靠答卷的同时，摩尔线程还啃下 " 精度 " 和 " 扩展稳定性 " 这两块硬骨头，确保每一个训练步骤跟国际主流产品保持精度对齐，在万卡规模下保持 95% 左右的线性扩展率。

预训练只是第一步。后训练，尤其是强化学习阶段，模型需要反复生成回答、接收反馈、迭代更新，对推理吞吐量和稳定性的要求极高。

为此，摩尔线程在训练框架中集成了 SGLang 和 vLLM 两大开源推理引擎，保障数据的高效生成。在此基础上，摩尔线程还尝试使用训推分离 Slime 方案和训推一体 VeRL 方案，两者的提升效果均肉眼可见。

转向需求更火爆的推理场景，夸娥集群的 " 强悍 " 在 AI 漫剧和短剧创作上体现得淋漓尽致。张建中直言，" 以前只有好莱坞导演花大价钱才能制作的大片，现在短时间就能生成。"

这背后依托的，正是摩尔线程在夸娥集群上部署的全流程智能生产流水线——涵盖文生视频、语言理解、剧本创作等模型，配合自研语音生成引擎 " 摩语精灵 "，能够精准复刻或转换声音。

无论是训练还是推理性能的充分发挥，都需要软件栈做支撑，而这恰恰是摩尔线程近年来持续加码的方向。目前，MUSA 已完整支持 700 多个核心 API，驱动与运行时全部免费开放。

算子层面，摩尔线程的核心数据库实现 100% 兼容，55 类算子覆盖所有核心 AI 算子，MuDNN 性能与原生态基本持平；PyTorch 算子层做到 100% 兼容，SDK 升级至 5.1 版本；针对大语言模型最常用的 FlashAttention，摩尔线程将其算子效率优化至 95%，大幅缩短了 Transformer 和 MoE 用户的适配时间。

聚焦国内算子开发社区，摩尔线程一方面将国产 AI 编程语言 TileLang 集成至开源主线，GEMM 算子效率超 95%，Attention 效率超 90%；另一方面还与智源研究院合作，推进基于 Triton 的算子开发。

值得注意的还有摩尔线程的 AI 编程神器 MUSACODE。张建中表示，开发者无需学习 MUSA 代码，直接用自然语言就能与其交互，或通过与 " 小麦 " 的对话生成 MUSA Kernel 或算子。据张建中透露，MUSACODE 已原生集成在 AIBOOK 的 VSCode 中。

此外，MUSA 还新增了对编译器 Fortran 的支持，便于传统代码的迁移。

夜色渐深，发布会结束后的展区里，有人对着 " 小麦 " 说话，有人翻看 MUSA 教学书籍，有人围观多智能体协同演示……人潮久久未散。

算力焦虑还在，但国产的答案，一年比一年具体了。

宙世代

一起剪

相关标签