文|奇点研究社,作者 | 孟雯
过去三年,端侧 AI 始终处于一种尴尬状态。
手机厂商在讲端侧大模型,PC 厂商在讲 AI PC,汽车厂商在讲智能座舱,几乎所有人都在描绘同一个未来:AI 不再住在云端,而是直接运行在用户身边的设备里。
但每次走到落地环节,故事总会卡住。模型能跑,却跑不快;功能能做,却做不深;演示看起来惊艳,真正交到用户手里却变成了阉割版体验。
问题不在 AI 本身,大模型的能力突飞猛进,Agent 开始具备规划、推理和执行复杂任务的能力,但终端硬件的发展速度,远远跟不上 AI 的进化速度。
刚刚结束的 Computex,黄仁勋发布了英伟达的 PC 处理器 RTX Spark,号称全球首款专为 " 个人智能体 " 打造的 Windows PC 超级芯片,戴尔、惠普、联想、微软 Surface,首批合作名单几乎是整个 Windows PC 行业的点名册,预计今年秋天开始出货。

这未必是一款立刻改变 PC 市场格局的产品,但却是端侧 AI 发展三年来重要的硬件信号,它意味着那些过去只能在云端完成的任务,有机会被搬到本地设备上运行。
AI PC 的故事讲了三年,终于等来一个像样的底座。
01 端侧 AI 的硬件天花板被打破
在谈及 RTX Spark 之前,我们要先搞清楚,AI PC 喊了三年,究竟走到了哪一步?
如果从供给侧来看,这个行业其实已经完成了绝大部分准备工作。芯片厂商解决了本地推理的硬件问题,英特尔推出 Core Ultra 系列、AMD 发布 Ryzen AI 平台、高通凭借骁龙 X Elite 重返 PC 市场,NPU 成为新一代处理器发布会上出现频率最高的关键词。

DeepSeek、通义千问等大模型也开始推出面向端侧的轻量化版本,让本地运行 AI 成为可能。
整机厂的投入更是几乎不计成本。联想先后发布 YOGA AI 元启和小新 AI PC 系列,戴尔把整条产品线重新命名向 AI 靠拢,华硕、惠普、华为也都把 AI PC 列为核心战略。
根据 Canalys 数据,2024 年全球 AI PC 出货量已达到约 4800 万台,占全年 PC 出货量近 20%;机构预测 2025 年这一比例将进一步提升至 40% 以上。

但供给侧的整装待发,并没有在需求侧激起相应的水花。行业回答的是 "AI 能否进入 PC",用户关心的是 AI 进入 PC 之后,能帮我做什么?
大多数消费者不会因为电脑拥有 45 TOPS 还是 60 TOPS 的 NPU 算力而产生换机冲动。戴尔高管曾在采访中提到:消费者并不是基于 AI 来购买的,事实上 AI 可能让他们更困惑,而不是帮助他们理解一个具体的结果。
这句话戳中了 AI PC 的症结,行业一直在强调算力,却始终没有创造出足够强烈的换机理由。再往下追问,为什么行业始终没能创造出有吸引力的 AI 应用?
症结的根源,是算力底座本身就不够用。
2024 年微软提出 Copilot+ PC 认证标准时,核心门槛是 NPU 算力不低于 40 TOPS。这个标准在当时有其合理性,NPU 功耗低、适合处理轻量的本地 AI 任务,比如实时字幕、图像识别、语义搜索等。
但随着智能体的繁荣,端侧 AI 的发展目标已经改变,过去大家讨论的是 " 如何让 AI 在设备上跑起来 ",现在大家讨论的是 " 如何让 Agent 在设备上干活 "。

两者对于硬件的要求完全不在一个量级。NPU 本质上仍然是一种高度专用化的计算单元。它擅长规则明确、流程固定的任务。一旦遇到需要复杂推理和多步规划的 Agent 任务,就显得力不从心了。
传统 Windows PC 的 CPU 和 GPU 各自独占内存,数据在两者之间搬运的成本极高。当 AI 模型的参数量动辄以十亿计,这种割裂的内存设计成为了物理瓶颈,不是算力不够,而是数据根本 " 喂不进去 "。
而这个问题,英伟达想用 RTX Spark 一次性解决。
RTX Spark 的核心创新是通过 NVLink-C2C 技术将 CPU 和 GPU 深度绑定,实现了 600GB/s 的双向内存带宽,这项技术原本只存在于数据中心级别的 Grace Hopper 超级芯片上。

统一内存架构带来的最大改变,是 CPU 和 GPU 能够共享同一块内存池。这套架构此前在消费级市场只有一个玩家做到过,就是苹果的 M 系列芯片。
但英伟达拥有苹果没有的东西:CUDA。
很多人把 CUDA 理解为一个开发工具,实际上,它更像是 AI 时代最重要的基础设施。过去二十年,CUDA 已经成为全球 AI 开发者最熟悉的开发环境。PyTorch、TensorRT、llama.cpp 等主流 AI 开发工具的第一适配平台都是 CUDA,全球绝大多数 AI 模型的训练和推理管线都建立在 CUDA 之上。
把原本属于数据中心的能力,下放到消费级 PC,才是 RTX Spark 的杀手锏。
高通的 Snapdragon X2 Elite Extreme 的 NPU 算力在纸面上更高(约 80 TOPS 对比 RTX Spark 的神经处理单元),但高通没有 CUDA,它的 AI 加速依赖 QNN 框架,与主流 AI 开发者生态之间存在一道不小的鸿沟。
苹果的 M5 芯片在端侧 AI 性能和能效上依然是基准,是行业标杆,但苹果运行的是 macOS,而非 Windows 生态。
对整个 Windows 生态而言,RTX Spark 带来的意义显然不同。
而且英伟达选择的入场时机也很巧妙。过去十年,高通几乎承担了 Windows ARM 生态的拓荒工作。Prism 模拟层逐渐成熟,Windows ARM 开始具备日常使用能力。
与此同时,苹果 M 系列证明了 ARM 架构可以在性能和功耗上同时超越 x86。英伟达等到路修好了,才开着 CUDA 这辆 " 重卡 " 驶来。
不过 RTX Spark 目前还未上市,价格未知,市场反应尚待验证。天风国际分析师郭明錤根据供应链调查判断,搭载 N1X 和 N1 芯片的设备未来两年出货量约 1000 万台,主要面向对本地端 AI 算力有需求的重度用户,这是一个相当小众的开始。

RTX Spark 之所以会引发如此高的关注,在于它释放出一个信号:在端侧本地运行百亿参数模型,不再是极客的专属游戏,而是即将走入消费市场的 " 标配 "。
02 英伟达下场,联想等到 " 东风 "
在 RTX Spark 的首发合作名单里,联想的出现并不意外。
联想是目前全球 AI PC 市场份额最大的整机厂,微软披露的数据显示其在 Windows AI PC 细分市场的全球份额达到 31%。当英伟达需要第一批把 RTX Spark 推向消费者的合作伙伴时,联想几乎是最自然的选择。
Computex 2026 展台上,联想展示了 Yoga Pro 9n:一台 15 英寸的笔记本,搭载 RTX Spark 平台,定位创作者、AI 开发者和专业用户。

对于英伟达来说,RTX Spark 不是数据中心产品,而是面向消费者的新平台。
再强的芯片,也需要整机厂把它送到用户手里,而联想是全球最大的 PC 厂商,也是目前 AI PC 布局最激进的玩家之一。
从 2024 年开始,杨元庆便不断向外界强调 " 混合式 AI" 的概念。在个人端,联想推出天禧 AI 智能体,希望成为用户跨设备的个人助手;在企业端,推出擎天 AI 平台以及覆盖多个行业场景的智能体矩阵。

在联想的构想中,未来用户不再打开一个个应用完成工作,而是直接向智能体提出需求,由 AI 自主规划任务、调用工具、协调资源并完成执行。
能看出,联想想讲述 " 下一代人机交互入口 " 的故事,这套逻辑成立的前提,便是端侧算力足够强大。RTX Spark 的出现,第一次让这个缺口有了被补上的可能。
这也是为什么联想比其他 PC 厂商更值得关注,因为它并不是今天才开始布局 AI,过去几年积累的软件能力和生态能力,决定了它有机会成为第一批把算力升级转化为用户体验升级的厂商。
数据也支撑这个判断:联想上个财年 AI 相关业务收入同比增长 105%,AI PC 渗透率占其全部 PC 出货量的 30%。
联想已经为 AI PC 投入了足够长的时间和资源,当新的算力平台出现时,自然会比大多数整机厂更容易吃到第一波红利。
不过机会和挑战往往同时出现。联想擅长供应链管理、渠道能力和规模化制造,可 AI 时代竞争的重点,正在转向智能体体验、软件生态和用户留存。
此外,联想同时是英伟达、AMD、高通、英特尔四家芯片巨头的合作伙伴,杨元庆的说法是 " 不同芯片厂商有不同长项,AI 云端是英伟达,PC 终端是英特尔 AMD,移动端是高通 "。

这套多元化逻辑有其合理性,但也意味着联想必须在所有方向上同步投入,在软件层保持对每一代新芯片的快速适配。
英伟达的 RTX Spark 路线图已经规划了三代产品,每一代迭代都要求联想的软件栈跟上,这也是一个持续的工程压力。
当 RTX Spark 带来新一轮算力跃迁之后,联想能否把这种硬件升级转化为用户真正能够感知的体验升级,是一大考验。如果把视野再放大一些,这个难题其实也不仅仅属于联想。
03 高端之外,数十亿终端的潜力战场
RTX Spark 能够满足有足够购买力、有本地 AI 算力需求的高端 PC 用户,但端侧 AI 的战场,远比这宽广。
全球有超 400 亿台智能终端设备,包括手机、汽车、可穿戴设备、智能家居等,这些设备不可能搭载 RTX Spark 级别的芯片,它们的算力预算以 TOPS 计,不以 Petaflop 计;它们的功耗窗口以毫瓦计,不以瓦计。
但它们同样需要在本地运行 AI,同样需要在断网、弱网环境下完成感知、理解和决策。
如何在极度受限的端侧设备上,把 AI 能力做到极致?这是 RTX Spark 照不到的战场,也是端侧 AI 普及的关键。
这也是国产厂商面壁智能试图回答的问题。面壁的核心产品 MiniCPM 系列端侧小模型,专为资源受限设备设计,从 AI 手机、AI PC,到智能座舱、可穿戴设备都有落地。

面壁提出的 " 密度定律 " 认为,大模型的知识密度每 3.3 个月翻一番,模型会变得越来越小,但能力越来越强,这是一个关于小模型效率的长期押注。
今年 5 月,面壁发布的 MiniCPM5-1B,在部分能力维度上已经超越了 GPT-4o 的早期版本,而参数量只有 10 亿。
面壁和英伟达的 RTX Spark 也是一种互补。RTX Spark 打开了高端 PC 端侧 AI 的天花板,面壁做的是在资源受限条件下让更多设备获得 AI 能力。
RTX Spark 打开了高端 PC 端侧 AI 的天花板,让复杂 Agent 能够在本地跑起来;面壁则在资源受限终端上,让更多设备获得可用 AI 能力。
一个是 " 算力充足,如何释放潜力 ",一个是 " 算力受限,如何用好每一个 TOPS"。
面壁 CEO 李大海曾说,2026 年装上面壁端侧模型的设备数将达到 2025 年的 10 倍。这意味着端侧 AI 的普及不会仅依赖高端 PC,也需要在低算力设备上建立可持续的小模型生态。
谁能在更小的资源预算内提供更好的体验,谁就有机会胜出。
英伟达的入场,像一声发令枪,把开发者的注意力和资本的目光引向端侧,推动更多应用开始针对本地 AI 能力进行优化。
这些势能会漫过 RTX Spark 本身,扩散到整个端侧 AI 生态。
当然,理想与现实之间还隔着几道坎,Windows ARM 的软件适配率仍然不足 30%,消费市场对 AI PC 的真实换机意愿还存在争议。
但谁又能说今天的小众,不会成为明天的主流,就像 2020 年苹果发布 M1 的时候,没人能预见五年后它在笔记本电脑处理器的市场份额几乎与 AMD 持平。

从 Tegra 的移动芯片失败,到收购 ARM 的折戟、Grace CPU 在数据中心的试水,再到今天 RTX Spark 的正式入场,英伟达用二十年时间,把 AI 算力从数据中心搬到了个人电脑。
RTX Spark 未必就是最终答案,其销量、价格、软件生态和市场接受度,都还有待验证,但它改变了端侧 AI 产业的起跑线。
这样看来,英伟达更像搭台者,联想、面壁,以及所有试图在端侧 AI 重写规则的人,才是主角。


登录后才可以发布评论哦
打开小程序可以发布评论哦