Agent时代的终端竞赛，赢在CPU！

智东西

作者 | 毕伟豪

编辑 | 漠影

智东西 6 月 12 日报道，这两年，随着 Claude Code、Codex 越来越能打，龙虾（OpenClaw）、爱马仕（Hermes）这类开源 AI 助手接连爆火，" 智能体 " 热度飙升，Agent 时代就此到来。

现在，越来越多的人从聊天机器人转到 Agent，开始使用各种工具来完成日常生活中的任务，相比于简单对话，Agent 的 Token 的消耗量是巨大的。

因为现在的 Agent 可以真正帮人干活，比如写软件、盯股市、做 PPT、剪视频等等，以前聊天机器人回答问题，通常仅需一两步推理，而现在一个金融 Agent，要同时跑行情分析、财报解读、交易决策等多项任务，一项任务就需要几十步甚至上百步连续推理，算力需求根本不在一个量级。

不久前，英伟达 CEO 黄仁勋在访谈中做出了这样的判断：Agent 时代，算力需求将暴涨到生成式 AI 的 1000 倍，整个行业会被推着进入全新的竞争阶段。

算力需求指数级的增长带来了两个问题：第一是普通人该如何部署 Agent、配置和使用前沿 AI 工具，第二则是黄仁勋所说的 1000 倍的算力缺口由谁来填补。

前沿 Agent 安装部署难度高、配置复杂，而云端模型调用的延迟、Token 消耗量、数据隐私安全等问题，正在推高端侧推理需求，人们需要一台真正能降低 Agent 使用门槛、并且可以在端侧执行更多、更复杂任务的主机。

一、1000 倍算力缺口，AI 主机的硬门槛为什么在 CPU

黄仁勋所说的 1000 倍算力缺口不可能全由云端填补，AIPC 走进市场，将推理更多转移到端侧，正是重要的解法。但以前的 AIPC 只是把机器当成了能跑大模型的 PC，而不是为 Agent 推理专门设计的计算机。

一台从内到外均为 Agent 推理而生的 AIPC，在这个时代的优势逐渐凸显，能在本地使用 Agent 执行任务，也可以凭借软硬件优化提高计算效率，节省 Token 开支。

而一款好的主机，核心在于芯片，对于芯片而言，不论是端侧、边缘还是云端，CPU 的重要性都不言而喻。AMD CEO 苏姿丰曾在采访中直言，每个 Agent 运行过程里都在持续调度 CPU，GPU 只在调用模型那一步起作用，其余分配任务、搬运数据、调工具都走 CPU。

因此，未来 Agent 执行的任务越复杂，CPU 的分量就越重，只有为 Agent 专门设计的芯片，才能更好满足 Agent 爆发带来的需求。

此芯 P1 就是这样一颗芯片，在架构层面，它为 Agent 推理做了定向优化：12 核 Arm v9.2 CPU，主频可达 3.2GHz，集成 10 核 Arm Immortalis-G720 GPU 以及专用 NPU，异构总算力达 45TOPS，可以为大模型的本地化部署提供开箱即用的算力支撑。

作为专为 Agent 而生的 AI 主机，联想 AI 主机 mini 搭载此芯 P1，这也是此芯和联想在共同定义 "Agentic Compute" 新标准过程中的产品，要让更多人享受到 Agent 时代的前沿成果。

这台千元级别的主机，体积只有 Mac mini 的一半，平均功耗仅 15W，运行噪音低于 30 分贝，却能释放此芯 P1 的 45TOPS 综合算力，在多个 Agent 使用场景中表现稳定。

二、三大场景开箱即用，千元级主机让 Agent 走进生活

这台搭载此芯 P1 的联想 AI 主机 mini，预装了天禧 Claw，开箱即用，支持多成员共享，数据隔离、记忆独立，一个仅有巴掌大小的千元级主机，将使用 Agent 的门槛直接砍到了底。

Agent 确实好用，但部署 Agent、接模型 API，配置以及使用那些前沿工具，本身就存在门槛，对大多数人来说，" 开箱即用 " 才是接触 Agent 最现实的路径。如何让 Agent 走进每个人、每个家庭的生活，是无数厂商思考的问题。

联想 AI 主机 mini 依靠天禧 Claw，可以实现 7 × 24 小时无人值守，全天候服务，并且无需部署和配置，真正实现了 Agent 开箱即用，门槛接近于零，同时设备支持手机、平板等多端互联以及多成员独立使用，随时随地都能调用 Agent 完成任务。

在炒股、自媒体创作、家庭共享这些需要 Agent 需要持续运行、多步推理、同时处理海量信息的场景中，这台搭载此芯 P1 的主机表现很稳。

三、超长上下文硬扛金融场景，一颗芯片给 Agent 兜底

金融场景中，数据源又杂又多，实时行情流和静态财报混在一起，还不能丢失信息，这让 Agent 的工作负载压力变得非常大。

比如一个散户通过配置，让 Agent 同时盯着股市、财经媒体、大公司官网和社交平台，说一句 " 盯着新能源板块，有变动立刻弹窗发给我 "，Agent 就得同时消化好几种不同格式的信息，做深度推理。

如果上下文窗口不够长，Agent 在处理半路上很可能自动丢掉前面的关键数据，给出建立在残缺信息上的判断，这在金融场景中，是相当致命的。

搭载此芯 P1 的联想 AI 主机 mini，最高支持 200K 超长上下文，对需要 Agent 持续盯盘的用户来说，上下文长度直接等于安全底线，这种超长的上下文窗口，让联想 AI 主机 mini 在金融场景中非常能打。

能满足金融场景的使用需求，对其他需要长上下文推理的日常场景自然如鱼得水。

四、端侧低成本推理，Token 不再花钱如流水，Agent 常驻后台

很多自媒体创作者已然成为 Agent 的重度用户，搜热点、列大纲、写文案、配图排版等等，每一步背后都有 Agent 的身影。

聊天机器人一次对话通常仅有一到两轮推理，而 Agent 完成一个创作任务可能是十几轮甚至几十轮连续推理，全程走云端大模型 API 的话，一天 Token 费轻松超过一顿外卖，一个月的账单可能会非常惊人，放在端侧推理支出就更加可控。

联想 AI 主机 mini 就是这个思路，尽可能把工作搬到本地，从而大幅度降低 Token 的消耗。

搭载此芯 P1 的联想 AI 主机 mini 支持运行本地轻量模型，可稳定承载 13B – 35B 生产级 Agent 部署，外加拓展卡可支持 7B-122B 模型运行，远超主流 7B 离线部署边界，简单任务可以在本地实现闭环。

同时，此芯 P1 针对 Agent 场景做了定向优化，首发搭载 Ubuntu 26.04 和 Linux 7.0 kernel，P1 的异构算力驱动、NPU 调度、内存管理都在这些系统上做了深度适配。

其 12 核 Armv9.2 CPU 设计可以实现 Agent 执行任务时的精细化调度，在多任务并行时具有优秀的能效表现，NPU 设计也能提高模型的计算效率。

在实际测试中，搭载此芯 P1 的联想 AI 主机 mini 将执行复杂任务的 Token 消耗量降低了 60%，速度提升 50%-70%。

低成本推理是 Agent 普及的经济前提，当推理成本降下来，Agent 才可能从偶尔用一下变成日常跑在后台。

五、家庭共享零门槛，蓝牙配网、无需键鼠

AI 硬件翻车最多的地方不是跑分低，是买回家只有一个人会用，空有强大算力，却不能共享。传统 mini 主机的开箱流程是：翻键鼠、找网线、插显示器、进 BIOS 调试，这种操作过程本身就是一堵墙。

老人查菜谱、小孩问作业，一台主机放在电视柜上，全家人各用各的 Agent，对着手机说话就行。

这个体验能立住，靠芯片在底层撑起三条线：多用户、多任务并行处理靠 12 核 CPU 的设计；一个人折腾崩了系统，独立 Recovery 分区配合一键恢复，全家不受影响；64GB LPDDR5 内存低功耗运行，带宽高达 100GB/s，能够实现 24 小时待机，兼顾功耗与性能平衡。

面向家庭和中小团队的 AI 主机，安全信任是另一个硬需求。此芯 P1 在芯片层充分利用了 Arm v9.2 的安全特性，包括 PACBTI 指针认证、MTE 内存标签扩展和 Secure EL2 硬件虚拟化，多人共用一台机器跑各自的 Agent，数据不串区，保证安全性。

P1 还过了 Arm SystemReady L6 认证，这是数据中心级的硬件合规标准，主流 Linux 发行版可以开箱直装。而 OTA 在线升级，可以让芯片算力释放能力随系统迭代持续提升，买回家的硬件能够越用越好用。

结语：为 Agent 推理而生的芯片，正在重写 AI 硬件的规则

AI 主机这个概念喊了两年，但真正能让 Agent 从聊天框里走出来的硬件，不是塞个大模型进机箱，也不是给 PC 换个壳贴个 AI 标签。

芯片得在底层回答这些问题：Agent 推理能不能一次处理足够长的上下文，端侧推理能否执行更多更复杂的任务，多任务并发时系统能不能稳住。

此芯 P1 选了 Agentic Compute 这条路，从芯片架构的第一行代码开始，就为 Agent 推理做定向设计，通过 " 端云协同，端侧常驻 " 的模式，打造为 Agent 而生的计算能力。

未来，评判一台 AI 主机优劣的标准，将从跑分多高，逐渐变成 Agent 跑得省不省、稳不稳，Agentic Compute 时代，AI 主机的规则正在重写。

宙世代

一起剪

相关标签