
作者 | 毕伟豪
编辑 | 漠影
智东西 6 月 12 日报道,这两年,随着 Claude Code、Codex 越来越能打,龙虾(OpenClaw)、爱马仕(Hermes)这类开源 AI 助手接连爆火," 智能体 " 热度飙升,Agent 时代就此到来。

因为现在的 Agent 可以真正帮人干活,比如写软件、盯股市、做 PPT、剪视频等等,以前聊天机器人回答问题,通常仅需一两步推理,而现在一个金融 Agent,要同时跑行情分析、财报解读、交易决策等多项任务,一项任务就需要几十步甚至上百步连续推理,算力需求根本不在一个量级。


前沿 Agent 安装部署难度高、配置复杂,而云端模型调用的延迟、Token 消耗量、数据隐私安全等问题,正在推高端侧推理需求,人们需要一台真正能降低 Agent 使用门槛、并且可以在端侧执行更多、更复杂任务的主机。
一、1000 倍算力缺口,AI 主机的硬门槛为什么在 CPU
黄仁勋所说的 1000 倍算力缺口不可能全由云端填补,AIPC 走进市场,将推理更多转移到端侧,正是重要的解法。但以前的 AIPC 只是把机器当成了能跑大模型的 PC,而不是为 Agent 推理专门设计的计算机。
一台从内到外均为 Agent 推理而生的 AIPC,在这个时代的优势逐渐凸显,能在本地使用 Agent 执行任务,也可以凭借软硬件优化提高计算效率,节省 Token 开支。
而一款好的主机,核心在于芯片,对于芯片而言,不论是端侧、边缘还是云端,CPU 的重要性都不言而喻。AMD CEO 苏姿丰曾在采访中直言,每个 Agent 运行过程里都在持续调度 CPU,GPU 只在调用模型那一步起作用,其余分配任务、搬运数据、调工具都走 CPU。

此芯 P1 就是这样一颗芯片,在架构层面,它为 Agent 推理做了定向优化:12 核 Arm v9.2 CPU,主频可达 3.2GHz,集成 10 核 Arm Immortalis-G720 GPU 以及专用 NPU,异构总算力达 45TOPS,可以为大模型的本地化部署提供开箱即用的算力支撑。
作为专为 Agent 而生的 AI 主机,联想 AI 主机 mini 搭载此芯 P1,这也是此芯和联想在共同定义 "Agentic Compute" 新标准过程中的产品,要让更多人享受到 Agent 时代的前沿成果。
这台千元级别的主机,体积只有 Mac mini 的一半,平均功耗仅 15W,运行噪音低于 30 分贝,却能释放此芯 P1 的 45TOPS 综合算力,在多个 Agent 使用场景中表现稳定。
二、三大场景开箱即用,千元级主机让 Agent 走进生活
这台搭载此芯 P1 的联想 AI 主机 mini,预装了天禧 Claw,开箱即用,支持多成员共享,数据隔离、记忆独立,一个仅有巴掌大小的千元级主机,将使用 Agent 的门槛直接砍到了底。



三、超长上下文硬扛金融场景,一颗芯片给 Agent 兜底
金融场景中,数据源又杂又多,实时行情流和静态财报混在一起,还不能丢失信息,这让 Agent 的工作负载压力变得非常大。
比如一个散户通过配置,让 Agent 同时盯着股市、财经媒体、大公司官网和社交平台,说一句 " 盯着新能源板块,有变动立刻弹窗发给我 ",Agent 就得同时消化好几种不同格式的信息,做深度推理。

搭载此芯 P1 的联想 AI 主机 mini,最高支持 200K 超长上下文,对需要 Agent 持续盯盘的用户来说,上下文长度直接等于安全底线,这种超长的上下文窗口,让联想 AI 主机 mini 在金融场景中非常能打。
能满足金融场景的使用需求,对其他需要长上下文推理的日常场景自然如鱼得水。
四、端侧低成本推理,Token 不再花钱如流水,Agent 常驻后台
很多自媒体创作者已然成为 Agent 的重度用户,搜热点、列大纲、写文案、配图排版等等,每一步背后都有 Agent 的身影。
聊天机器人一次对话通常仅有一到两轮推理,而 Agent 完成一个创作任务可能是十几轮甚至几十轮连续推理,全程走云端大模型 API 的话,一天 Token 费轻松超过一顿外卖,一个月的账单可能会非常惊人,放在端侧推理支出就更加可控。
联想 AI 主机 mini 就是这个思路,尽可能把工作搬到本地,从而大幅度降低 Token 的消耗。

同时,此芯 P1 针对 Agent 场景做了定向优化,首发搭载 Ubuntu 26.04 和 Linux 7.0 kernel,P1 的异构算力驱动、NPU 调度、内存管理都在这些系统上做了深度适配。
其 12 核 Armv9.2 CPU 设计可以实现 Agent 执行任务时的精细化调度,在多任务并行时具有优秀的能效表现,NPU 设计也能提高模型的计算效率。
在实际测试中,搭载此芯 P1 的联想 AI 主机 mini 将执行复杂任务的 Token 消耗量降低了 60%,速度提升 50%-70%。
低成本推理是 Agent 普及的经济前提,当推理成本降下来,Agent 才可能从偶尔用一下变成日常跑在后台。
五、家庭共享零门槛,蓝牙配网、无需键鼠
AI 硬件翻车最多的地方不是跑分低,是买回家只有一个人会用,空有强大算力,却不能共享。传统 mini 主机的开箱流程是:翻键鼠、找网线、插显示器、进 BIOS 调试,这种操作过程本身就是一堵墙。


面向家庭和中小团队的 AI 主机,安全信任是另一个硬需求。此芯 P1 在芯片层充分利用了 Arm v9.2 的安全特性,包括 PACBTI 指针认证、MTE 内存标签扩展和 Secure EL2 硬件虚拟化,多人共用一台机器跑各自的 Agent,数据不串区,保证安全性。
P1 还过了 Arm SystemReady L6 认证,这是数据中心级的硬件合规标准,主流 Linux 发行版可以开箱直装。而 OTA 在线升级,可以让芯片算力释放能力随系统迭代持续提升,买回家的硬件能够越用越好用。
结语:为 Agent 推理而生的芯片,正在重写 AI 硬件的规则
AI 主机这个概念喊了两年,但真正能让 Agent 从聊天框里走出来的硬件,不是塞个大模型进机箱,也不是给 PC 换个壳贴个 AI 标签。
芯片得在底层回答这些问题:Agent 推理能不能一次处理足够长的上下文,端侧推理能否执行更多更复杂的任务,多任务并发时系统能不能稳住。
此芯 P1 选了 Agentic Compute 这条路,从芯片架构的第一行代码开始,就为 Agent 推理做定向设计,通过 " 端云协同,端侧常驻 " 的模式,打造为 Agent 而生的计算能力。
未来,评判一台 AI 主机优劣的标准,将从跑分多高,逐渐变成 Agent 跑得省不省、稳不稳,Agentic Compute 时代,AI 主机的规则正在重写。


登录后才可以发布评论哦
打开小程序可以发布评论哦