大模型狂飙的尽头，这家国产 GPU 厂商要把算力放在客厅

AI 算力的故事，正在走向两个相反的方向。

云端这边，万卡、十万卡集群是行业标配，算力越堆越高，皆因头部应用日均消耗的 Token 已经突破百万亿。

落到普通人这边，云端训练出的聪明模型，往往变成手机里一个要联网等几秒钟才回话的对话框。

算力走进生活的最后一公里，应该是什么样的？

一个做国产 GPU 的公司，在前几天的发布会上，一口气更新了好几款端侧产品，有家庭智能中枢、AI PC、Agent，还有具身智能相关的工作。

本周一，摩尔线程 2026 年发布会上，除了常规的 GPU 显卡更新、夸娥万卡级智算集群的迭代，一台只有手掌大、整块镁铝合金一体 CNC 雕出来的小盒子被搬上了台。

它叫 MTT AICUBE，按官方说法是「一台面向家庭的 AI 智算中枢」。更直观的解释，AICUBE 就是一个能够本地运行模型并管理家庭数据的「AI 电脑」，它能听懂我们的各种需求、能跑本地模型、甚至能存全家照片和视频。

这场发布会上至少有三件硬件冲着端侧去：面向客厅的 AICUBE、面向开发者的 AIBOOK、面向工业的 E300 模组。

摩尔线程创始人、董事长兼 CEO 张建中在台上讲，「过去我们谈论很多 IoT 是 Internet of Things，那今天的 IoT 应该叫 Intelligence of Things。」

那么一家做万卡集群的 GPU 公司，为什么要把战线拉到客厅？

做 GPU 的公司很多，但选择哪条路

做 GPU 的玩家不少，但路线分化其实很清楚。

一类像壁仞、天数智芯，走的是纯 AI 训练和推理路线，把算力拉到极致，图形渲染能力几乎为零；另一类像景嘉微和砺算，图形能力扎实，但 AI 推理的短板明显。沐曦走的是接近 AMD 的路子，数据中心训推为核心，图形是后来才补的产品线，且还在研发中。

这些路线都有各自清晰的商业逻辑，但每一条都有一道隐形的边界。路线决定了一张芯片能去哪里、不能去哪里。

摩尔线程从成立起选的就是另一套逻辑：全功能 GPU。它采用的 MUSA 架构不会在「图形」和「计算」之间做分割或取舍，同一套芯片可以同时承载 AI 计算、图形渲染、科学计算、物理仿真与超高清视频处理五种能力。

这种多能力的整合，正是真实端侧场景里的刚需。

一颗只懂得矩阵运算的芯片，很难要它同时做到驱动客厅里的 4K 云游戏、实时数字人；抑或现在爆火的具身智能机器人，AI 决策和物理世界理解也在并行发生；纯 AI 加速路线的厂商，可以把算力做到顶，但很难进入千家万户、千行百业，进入到同时发生多种计算需求的显示场景。

换句话说，「全功能」是一个只有在端侧才能被真正检验的说法。

摩尔线程的架构，注定它要走出数据中心，往边缘和终端走。这次的三款端侧硬件，是这场延伸的起点。

把数据中心放进你的客厅

AICUBE 放在桌上，比一台 Mac mini 高了一头。整块镁铝合金一体 CNC 雕刻出来，外接 HDMI 或者 Type-C 接口即可连接电视和显示屏。并且，AICUBE 还配备了 4 个麦克风阵列和立体声扬声器，完美适配了语音交互的需求。

这个产品的定位是「家庭 AI 中枢」，规格层面是 32GB 或 64GB 统一内存，1TB 全闪 SSD 起步，支持最高 12TB 扩展。算力来自摩尔线程自研的「长江」SoC —— CPU、GPU、NPU、VPU 异构集成，AI 算力 50TOPS。

它是当今 AI 需求的「三位一体」：AI Agent 的执行能力、AI PC 的算力、AI NAS 的私有存储。

在现场的演示过程中，产品经理使用 AICUBE 完成了语音播放电影、旅行规划、自动保存文件、AI 生成朋友圈文案等功能。从这个角度看，AICUBE 很像一台 Mac mini，但是内置了一个 AI Siri 语音交互系统，再加一个 NAS。

但它真正有意思的地方，是把「数据中心」整合进了一个家庭可接受的形态。

在家庭中我们可能遇到各种场景，无论是当做智能音箱，或者就是一个 NAS 来使用—— AICUBE 存在的意义，更在于它是全功能 GPU 架构在最难场景下的一场压力测试。

算力足够跑本地大模型，体积轻松塞得进电视柜，功耗低到能 7 × 24 小时静音运行，数据要锁在本地不上云，操作要老人和小孩都能用语音直接调用。

以上这五大约束，任何一个单拿出来都不难。但它们要同时成立，而且要成立在一个售价面向普通家庭的消费级产品上，这才是端侧全功能 GPU 的设计目标。

数据中心不需要面对这些约束。它可以用水冷、高压供电、专业运维来回避物理限制；数据隐私可以靠网络隔离和权限管理来处理；至于「谁来用」这个问题更是不存在，毕竟如今的数据中心 AI 算力供不应求。

现在大部分家庭 AI 服务还在依赖云端。语音指令、照片、视频全要上传服务器。本地化、能同时管存储、跑模型、联动多个 APP 的设备，消费市场上几乎空白。

AICUBE 不仅解决了那些限制，内置的「小麦」智能体还预装了 60 多项技能，可以跨 36 款以上 App 做控制。摩尔线程的官方数据显示，「小麦」对高频工具调用成功率超过 95%，任务执行速度比通用智能体快 7 倍。

MTT AICUBE 在 6 月 18 号京东预售，这些数字很快就会在真实场景中得到验证，走进我们的客厅。

但从架构角度看，AICUBE 是全功能 GPU 在最难一类场景下的压力测试。毕竟数据中心的资源可以轻松调度，而端侧只有一颗芯片。

摩尔线程这颗「长江」SoC 在一颗芯片里同时跑 AI 推理、3D 图形渲染、4K 视频编解码、NAS 存储调度，是真实地做到了在紧凑的物理空间里，协调多种计算单元的实时调度。

张建中在台上还说了一句话：「推理不是某一颗芯片的事情，推理更像是一个解决方案。」AICUBE 大概就是这套解决方案在家庭场景的第一个样本。

「长江」流向何方？

作为自研的智能 SoC，「长江」和摩尔线程包括云端 GPU 在内的全系列产品共享一套 MUSA 架构，只是被压缩到了端侧的物理形态。

「长江」有 8 个主频 2.65GHz 的全大核 CPU、全功能 GPU、高能效 NPU 异构集成，最高支持 64GB LPDDR5X 统一内存。

围绕这颗 SoC，摩尔线程在端侧的另外几款产品也在加速落地。

AIBOOK 面向开发者，被定义为「为智能体而生」的笔记本电脑。

底层跑的是基于 Ubuntu 改造的原生 Linux 系统 MTT AIOS，预装「龙虾」 ( OpenClaw ) 智能体，本地能同时稳定跑十几个 AI Agent，对接 90 多个 CLI 工具接口，支持虚拟化 Windows 和容器化 Android 多系统。

AIBOOK 的预期使命，是在英伟达控制的 CUDA 之外，给国产 GPU 构建一套从开发、调试到部署的闭环工具链，让 MUSA 生态从「能用」走到「有人用」——从最基础的笔记本形态开始。

MUSA 则是摩尔线程的 GPU 架构，包含从芯片、硬件、软件栈到生态的统一架构体系，全栈对标 CUDA。

过去几年，摩尔线程也一直在对 MUSA 软件栈进行优化：DeepSeek、Qwen、Kimi、MiniMax 这些国内头部模型现在都能顺利支持，vLLM 的官方后端也已接入，SGLang 主线代码更是提供了原生适配，PyTorch 的算子覆盖率到了 100%。

MUSA 的适配性已经做的相当扎实，也显著追上了与 CUDA 之间的差距。

但生态这件事，光有适配还不够。MUSA 社区的生长需要优秀的地推和开发者深度参与。摩尔线程希望 AIBOOK 能够在工具链普及和 MUSA 的推广上起到关键作用。完整的 MUSA 软件栈，让大模型开发者可以顺利地在这台笔记本上直接完成模型训练的诸多核心阶段步骤。

本质上，AIBOOK 是摩尔线程与英伟达 DGX 桌面系列产品对标的开始。

押注端侧，降低迁移成本

尽管路途遥远，MUSA 生态正在证明自己有持续迭代的潜力。

从 AIBOOK 到 AICUBE，从云端显卡到仿真平台，这些产品共同构成了摩尔线程的完整拼图：当云端训练、边缘推理与终端交互共享同一套 MUSA 架构时，国产算力的迁移成本、适配门槛与生态碎片化问题，才有可能被系统性解决。

回望摩尔线程的迭代史，早期的游戏显卡 MTT S80 自 2022 年推出，从只能跑 DX9 到能跑《黑神话：悟空》，实现中国 Top 50 热门游戏 100% 兼容，并针对其中 44 款已完成专门优化，靠的是底层重构和持续的驱动迭代。这套工程能力，也套用到这次的端侧产品上。

更长一点看，摩尔线程押的是另一件事：当算力同时出现在数据中心、开发者桌面、工业现场和家庭客厅，谁能在每个场景都有入口，谁手里的牌就比只守住数据中心的玩家更好打。

迁移成本、适配门槛与生态建设，这些目前都是摩尔线程端侧战略中的关键考量。

而从硬件显卡的持续迭代，MUSA 生态的逐步完善，从底层 100% 兼容主流 CUDA 生态，到全面适配国内 Top 5 开源大模型，这种速度与系统级优化能力，很明显是摩尔线程重要的护城河，也让他们在端侧的发力有了明显优势。

张建中在台上说，「对于用户，如果买不到国外的计算芯片，用摩尔线程的 GPU，你不会有任何后顾之忧」。

这份自信的背后，正是国产算力迈向成熟，在每一种形态、每一个场景中站稳脚跟的必经之路。

过去的物联网（IoT）是 Internet of Things，在摩尔线程的叙事里，未来的万物互联将全面演进为 Intelligence of Things（智能物联网）。

至少端侧这条路，摩尔线程是认真要走的。

文｜杜晨、张子豪

宙世代

一起剪

相关标签