©️深响原创 · 作者|吕玥
由 " 智能体(Agent)" 主导的 AI 产业风暴正席卷而来。
能规划、推理、执行的智能体,正全面渗透进手机、电脑、汽车、工厂……而这种渗透正把算力需求推向一个从未经历过的量级。不同于传统对话场景单次交互的有限消耗,智能体完成复杂任务需要数十次甚至上百轮推理验证,单任务 Token 消耗实现几何级增长。
IDC 预测,全球年度 Token 消耗将从 2025 年的 0.0005 PetaTokens 暴增至 2030 年的 152,667 PetaTokens,年复合增长率高达惊人的 3418%。在近日举办的 COMPUTEX 2026 上,高通 CEO 克里斯蒂亚诺 · 安蒙也给出了更细节的数据:2026 年全球每 10 秒 Token 需求约 317 亿,到 2030 年将飙升至 1.27 万亿,增长超 40 倍。2030 年全球 Token 总需求将达到千万亿级别。
图源:IDC
Token 需求指数级爆发,也直接暴露了集中式 AI 的诸多瓶颈。
经济层面最为直观,Token 消耗的爆发直接推高了算力成本,使传统依托集中式算力的商业模式面临严峻的盈利挑战。
技术层面矛盾也不少:一是算力调度效率难以满足场景需求,比如工业控制、自动驾驶等实时性要求极高的场景对云端推理带来的延迟根本无法接受;二是智能体在复杂无线环境中运行,易受网络带宽和系统稳定性影响,协同效率明显下降;三是大量企业拥有高价值的小样本私有数据,这类数据因安全合规要求无法出域,与集中式 AI 的训练推理模式天然不适配。
落到用户体验层面看,用户接触智能体的设备会越来越多样,若将所有推理任务集中到云端处理,很难无缝感知不同设备间的用户身份变化和上下文信息迁移,容易出现体验割裂感。
于是行业共识已然形成:从集中式 AI 到分布式 AI 成为必然趋势。资本市场的关注点也在迁移,行业拐点已至。未来的核心问题不再是 " 有没有足够算力 ",而是 " 如何把推理能力部署在最合适的位置 " ——云端、边缘侧、终端协同,在成本、功耗、延迟与隐私之间找到平衡。这是道复杂的命题。
而对此,高通正尝试给出它的解法。过去四十年,外界对高通的认知多停留在移动设备芯片巨头,但近五年来,它已悄然转身,深入 AI 领域书写全新叙事。在 COMPUTEX2026 上,高通 CEO 安蒙面对分布式 AI 的大势,从底层技术基因到全场景产品落地,给出了属于高通的时代答案。
01 技术平移:移动设备芯片里练出 AI 底座
之所以说分布式 AI 存在复杂性,是因为其对于底层基础设施提出了与过去完全不同的要求。
一是算力部署方式的变化。过去大模型训练主要集中在云端,而智能体时代的推理任务分散到手机、PC、汽车、机器人、可穿戴设备等不同终端中。不同场景对算力需求差异很大,这就需要 AI 系统具备端、边、云之间的全链路算力调度能力。
二是智能体的交互场景对实时性与稳定性的要求很高,比如工业机器人运动控制、自动驾驶动态决策等场景都要求毫秒级响应,无法承担云端往返带来的等待时间。这意味着 AI 推理能力需要更多下沉到本地终端,同时保证设备之间的信息同步与稳定。
三是当 AI 开始同时运行于多种设备之间时,协同工作也成为必需。否则,AI 能力将被割裂在一个个独立设备之中以信息孤岛的形式运行,难以形成真正连续的智能体验。
四是智能体时代的 AI 开始从 " 被动响应 " 走向 " 主动感知 ",这意味着终端设备不仅需要具备持续情境感知能力,还需要能够在本地长期运行轻量化、个性化模型。
五是能效比的极致优化。所有移动和嵌入式终端都受限于电池容量和散热设计,不可能无限制提升算力输出,这就要求必须在保证推理性能的同时尽可能压低功耗,做到用最少的电量完成更多的推理任务,才能支撑终端 AI 的长期稳定运行。
面对这些严苛的要求,高通从移动设备芯片时代积累的技术基因展现出了高度的契合性。这并非巧合,而是技术路线演进的内在一致性。
首先,高通最核心的一项能力就在于高性能低功耗计算。
从早期的 Kryo CPU 到如今自研的 Oryon CPU,高通长期深耕移动 CPU 架构设计与工艺适配,这为端侧 AI 推理提供了稳定高效的算力底座。同时,专用于 AI 推理任务的 Hexagon NPU,在核心工作负载中展现出远超通用处理器的能效优势。两者协同后,使得端侧设备无需依赖大体积电池和复杂散热系统,即可实现持续的高性能 AI 推理。
不止如此,全栈连接能力同样是高通在分布式 AI 时代的重要底层优势。
从 CDMA 起家的高通,手握 5G/6G 蜂窝连接、Wi-Fi 7、蓝牙等核心技术,并形成了完整连接能力体系。在分布式推理场景中,当 AI 智能体需要在不同设备间联网协作时,高通的连接技术正好保障了高速、稳定且低延迟的数据传输。
更关键的是,高通坚持的统一架构路线也在 AI 时代开始显现价值。
高通将 Oryon CPU、Adreno GPU、Hexagon NPU、ISP 以及传感器中枢高度集成于 SoC 之中,不仅实现了跨终端的算力分层互补,还能够高效处理丰富的端侧传感数据,支持多模态输入与复杂边缘场景。这就能够支持 AI 能力在不同设备与不同算力层级之间迁移与协同。这不仅降低了开发成本,也避免了分布式 AI 生态进一步碎片化,为未来端边云打通协同打好底层基础。
这三项技术能力的组合,构成了高通转型的底座。高通并不是从零开始造轮子,而是通过技术平移和复制,把过去所积累的 " 硬功夫 " 搬到了 AI 世界。
更重要的是,这种技术平移不仅是工程学上的胜利,也是商业价值的重构——高通精准切入了高增长的 AI 推理基础设施市场。过去,资本市场对于高通的定价逻辑,很大程度上仍建立在智能手机周期之上;但现在高通的商业护城河完全拓宽,将推动资本市场对其估值逻辑的重新评估。
02 计算连续体:一根贯穿毫瓦到千瓦的算力绳索
有技术底座还不够,接下来的问题是:智能体不会局限于某一个位置。它们会根据成本、性能和上下文,在终端设备、边缘、本地环境和数据中心之间动态迁移。简单任务可能在手机或眼镜本地完成,复杂规划则调用边缘节点甚至云端大模型协同处理,而环境感知、实时交互等能力又需要始终停留在距离用户最近的位置。
换句话说,智能体时代真正重要的,不再只是 " 有没有足够多的算力 ",而是如何让不同层级的算力高效协同、自由流动。高通要做的,正是让这种流动成为可能。
在 COMPUTEX 2026 上,高通 CEO 安蒙首次提出了智能体 AI 规模化部署的核心概念——计算连续体(compute continuum),这也是高通对于分布式 AI 时代的一次整体回答。
所谓 " 计算连续体 ",是构建一套覆盖从毫瓦级到千瓦级的完整计算能力体系,实现算力从端侧到云端的无缝贯通。如果用更具象化方式理解,这其实是一根贯穿整个智能设备生态的 " 算力绳索 "。绳索的起点是毫瓦级的可穿戴设备,中段则串联起手机、PC、汽车、机器人等不同算力层级的设备;而绳索的终点则延伸至作为 " 算力心脏 " 的千瓦级数据中心,由此形成完整的算力闭环。
事实上,分布式 AI 时代的核心瓶颈正是不同层级算力之间的流动效率低。一项完整的 AI 任务往往需要多个层级协同完成,若缺乏统一的算力链条,不同层级之间就会出现 " 算力断点 ",最终导致延迟累积、成本叠加以及体验割裂。
而这也正是 " 计算连续体 " 破局的关键所在。
其核心价值首先体现在智能算力调度能力。不同类型的 AI 任务将被动态分配到最合适的算力层级:轻量级任务无需频繁调用云端,避免资源浪费;复杂任务则不必强行压在终端本地运行,从而避免能耗过载与性能瓶颈。同时安蒙在演讲中也强调未来行业将不再区分讨论 " 云端 " 和 " 终端 ",因为两者最终会成为一个统一的系统,计算连续体正是在这个系统中兼顾性能与响应速度。
与此同时,这种架构也有助于降低整体 TCO(总拥有成本)。集中式 AI 模式下,所有任务都需要调用云端算力,随着 Token 需求指数级增长,成本压力会快速放大。而通过端侧与边缘侧的算力分流,高通试图减少 AI 系统对于超大规模云端算力的单点依赖,让 AI 规模化落地不再伴随成本的线性增长。这并非构想,安蒙在 Computex 2026 上展示了两组数据:基于 Claude Code 的 AI Coding 场景中,通过分布式智能体 AI 调度,相同结果下可以节省 140 万 Token,成本降低 60%;网页开发场景中,Token 可减少 30%,成本降低 4 倍。
重要的是,这套架构也意味着 " 一次开发、多端部署 " 开始成为可能。对于 OEM 厂商与开发者而言,AI 能力不再需要为不同终端重复开发与适配,而可以在手机、PC、汽车、机器人等不同设备之间迁移与协同。这不仅降低了生态开发成本,也进一步推动了智能体 AI 在更多终端场景中的规模化扩展。
在这一过程中,终端的重要性其实也被重新定义。因为未来设备不再只是用户操作,而是智能体也在操作。智能体需要基于环境、位置、用户习惯等情境信息,长期提供全时、全域服务,这意味着终端设备不仅需要具备高性能低功耗 CPU 与专用 AI 加速器,还需要拥有持续感知环境的低功耗计算单元。换句话说,终端不再只是 "AI 的入口 ",而正在逐渐成为 AI 长期运行的原生载体。
整体来看," 计算连续体 " 背后所反映的不仅仅是一次产品线扩张,而是高通对于 AI 产业基础设施的一次重新定义。
03 端边云生态构建,做系统级 AI 解决方案提供者
从理论概念回到现实落地,当 " 计算连续体 " 铺就了算力网络后,智能体如何真正触达用户?普通用户并不关心推理任务究竟运行在哪一个算力层级,他们真正关心的是:设备是否足够智能、响应是否及时、体验是否连续,以及数据是否安全。
而这也是高通如今正构建 " 端 - 边 - 云 " 生态的价值所在。
过去,高通最强的能力集中在 " 端 "。无论是手机还是其他可穿戴设备,不仅是用户接触 AI 的主要入口,也是高通技术积累的 " 原生载体 "。而在 AI 时代,这些终端正在被重新定义。
比如手机方面,高通目前在旗舰 Android 阵营仍保持着绝对优势。此次大会上,安蒙也给出了一个关键判断:" 以前一切都围绕手机——操作系统、应用、其他可穿戴设备都围绕手机生态系统。但现在智能体成为数字体验的中心,包括手机在内的其他设备都围绕着智能体,而不再是手机的延伸。" 也正是因此,高通正推动智能手机从传统的 " 应用中心 " 向 "Agent 中心 " 演进,让手机成为个人智能体长期驻留、持续运行与跨设备协同的核心节点。
可穿戴设备方面,今年 3 月 MWC 巴塞罗那期间,高通发布了骁龙可穿戴平台至尊版(Snapdragon Wear Elite),将 AI 运算能力下放至智能手表、胸针、挂坠等微型可穿戴设备中。在安蒙看来这类设备的重要性甚至可能超出行业预期。因为当智能体成为数字世界的中心之后,眼镜、耳机等贴近人体感官的设备将成为最自然的 AI 入口。
骁龙可穿戴平台至尊版(Snapdragon Wear Elite)
PC 领域同样有一系列新动作。近期,高通正式推出全新入门级处理器骁龙 ( ® ) C 平台,支持流畅网页浏览、视频流媒体和常见生产力应用,并配备集成式 NPU,为 300 美元及以上价位的入门级笔记本电脑引入 AI 能力。
在持续提升端侧优势的同时,高通也进一步补齐了 " 边 "(汽车、机器人)和 " 云 "(数据中心)。
边缘侧,汽车已经成为高通最清晰的第二增长曲线之一,近些年业务持续保持高速增长,其核心在于逐渐形成了 " 连接芯片 + 数字座舱芯片 +ADAS 芯片 " 的平台化能力组合。在演讲中,安蒙也系统阐述了 " 汽车双层智能 " 的概念:未来汽车中将同时运行两套智能系统,一个服务于驾驶者,一个负责驾驶汽车。" 而高通的优势就在于能够将两套智能能力整合于统一平台之中。
机器人则是另一个非常关键的新方向。近期高通发布了 Dragonwing IQ10 机器人参考设计(RRD),其意义并不只是推出一颗新的机器人芯片,而是开始直接提供覆盖硬件、软件、中间件以及 AI 运维能力的完整机器人平台。过去机器人企业往往需要自行完成芯片、连接、传感器、AI 运行时以及软件栈的大量系统集成工作,开发周期长、工程复杂度极高。而现在,高通正尝试把这些能力进一步标准化与平台化,帮助 OEM 厂商和开发者更快从原型验证走向量产部署。
同时安蒙透露,高通目前已经与 VinMotion、Neura Robotics 等机器人企业展开合作,并即将公布与 Figure AI 的进一步合作,这意味着高通的机器人解决方案在多年量产经验之上,正在通过系统性的平台加速具身 AI 的创新与落地。
云端,安蒙在 COMPUTEX 上预告了全新的数据中心业务品牌——高通飞龙(Dragonfly),至此高通的产品组合覆盖到了计算连续体的每一层。同时高通目前也已经与超大规模云服务商以及全球合作伙伴展开实际部署合作,其数据中心产品已经进入商业验证阶段。
整体来看,高通的角色已在改变。未来真正决定 AI 规模化落地的并不只是模型参数,而是谁能够建立一套覆盖云边端、同时兼顾算力、连接、软件与生态协同的完整基础设施体系。而高通正在尝试卡位的,正是这一位置。
而站在这一位置所指向的未来,正在我们眼前展开:
智能体将在手机、汽车、机器人、云端之间智能协同。6G,正是这幅图景中的关键一块——高通已将其定义为 "AI 原生网络 "。与过去几代通信技术主要解决人与人、人与信息连接不同,6G 从诞生开始就瞄准了智能体之间的大规模协同。6G 时代,AI 能力将被直接嵌入网络基础设施中,网络本身就能感知、推理、调度。AI 不再只是运行在设备中的功能,而会成为像互联网一样无处不在的基础能力。
具体布局已经铺开。2026 年 3 月巴塞罗那 MWC 上,高通与全球近 60 家企业达成 6G 发展共识;致力于在 2028 年展示符合 6G 规范的预商用终端与网络,并自 2029 年起启动全球化、可互操作的商用 6G 系统的初期部署。
资本市场已为高通的未来投下了信任票。
近几个月,摩根大通、美银证券等多家机构基于高通在 AI 领域的多元化布局,相继上调了公司目标价及评级。资本市场真正关注的,从来不是某一代产品短期表现如何,而是看企业是否拥有穿越产业周期的长期成长空间。这一轮密集的估值调整,直接表达了资本市场对高通从 " 单一芯片供应商 " 到 " 端到端的系统级 AI 解决方案提供者 " 这一身份迭代的认同。高通作为未来连接智能体、设备与算力网络的基础设施提供者,正被赋予新的战略价值。
接下来的 6 月 24 日纽约高通投资者日,安蒙表示将披露更多关于数据中心的路线图细节,给出更清晰的量化指引。而在那之前,已经可以确定的是:在智能体 AI 的新纪元里,高通无疑是值得期待的核心标的之一。


登录后才可以发布评论哦
打开小程序可以发布评论哦