高通的目标早已不只是卖芯片。
作者|田思奇
编辑|栗子
过去几年,产业竞争主要围绕模型参数规模、训练数据质量以及云端算力储备展开。无论是大模型能力的提升,还是生成式 AI 的快速普及,本质上都建立在更强的训练和推理能力之上。
但当 Agent 开始从聊天窗口走向真实世界,新的挑战也随之出现。
COMPUTEX 现场,高通公司总裁兼 CEO 安蒙(Cristiano Amon)展示了多个相关场景:
智能家居 Agent 能够根据用户安排自动为晚间聚会调整灯光、音乐和设备状态;车载 Agent 结合摄像头信息与云端数据,实时回答路况、餐厅和门店相关问题;办公 Agent 则可以读取邮件、日程和本地文件,自动生成每日工作简报并提出后续建议。
对用户而言,这些能力呈现为一次自然且连续的体验;但对底层系统而言,其背后涉及跨设备、跨场景、跨算力层级的协同计算。如何在不同计算节点之间实现高效协同,正在成为 Agent 时代的重要课题。
因此,高通提出把 2026 年定义为 "Agent 之年 ",并进一步强化其战略——打造覆盖计算连续体(compute continuum)的统一计算架构,让每一次 Token 计算都发生在最适合的位置。
「甲子光年」观察认为,相比发布某一款芯片或终端新品,高通想回答一个更根本的问题:在 Agent 成为 AI 主要交互形态之后,支撑其运行的计算体系应该如何重构,以及终端、边缘端和云端之间应当建立怎样的新型协作关系。
对于长期被视为芯片厂商的高通而言,过去最大的价值来自移动计算时代。现在,它将证明智能体时代,高通作为底层计算平台的潜力。
1. 从端侧AI到 Token 经济:高通的战略升维
智能体正在改写 AI 产业最底层的经济逻辑。
每一次环境感知、每一次工具调用、每一次跨设备任务接力,都会产生新的推理请求和 Token 消耗。行业测算显示,Agent 模式下的单任务 Token 消耗可达到传统聊天机器人的 50 至 200 倍。
安蒙也提到:普通对话任务平均消耗约 1 万 Token,复杂推理任务约 10 万 Token,自主运行的 Agent 任务则可能达到 100 万 Token 级别。
根据行业数据,2026 年全球AI系统每 10 秒产生的 Token 需求量约为 317 亿,到 2030 年这一数字有望增长至 1.27 万亿,四年增长 40 倍。
覆盖个人 AI 和工业 AI 的端侧和边缘推理,已经成为产业规模化发展的刚性需求。Token 正在成为新的数字资源,其流向和分配方式将直接决定未来 AI 基础设施的价值格局。
在安蒙看来,智能体并不是传统软件功能的延伸,而是一次计算架构的重构。今天绝大多数设备都围绕用户主动发起操作设计,但 Agent 需要持续承接上下文,在后台自主规划任务、调用工具和协调资源。随着越来越多 Agent 开始以机器速度运行,终端硬件、操作系统和软件架构都需要重新设计。
这种变化也改变了计算体系中的价值分工。
过去几年,行业讨论 AI 硬件时,更多聚焦 GPU、NPU 等专用加速器的峰值性能。智能体时代,这种单点能力的重要性正在下降。
因为智能体的核心工作不只是生成内容,还包括理解意图、拆解目标、规划路径、控制流程以及跨设备协同。这类综合能力高度依赖 CPU、软件栈和系统级调度能力。
对于高通而言,这也是一次角色转变的契机。
近两年,手机、电脑或汽车座舱和智驾芯片或许是高通最鲜明的产业标签。进入智能体时代,手机依然是距离用户最近、使用频率最高、承载个人数据最多的智能入口,但智能体不会停留在手机里。它会沿着 PC、可穿戴设备、汽车、机器人和云端持续流转,根据任务需求动态调用不同层级的算力资源。
因此,高通讨论的已经不只是端侧 AI。随着 AI 从单点应用演变为分布式智能系统,产业竞争开始从单一设备能力转向全局协同能力。决定价值高低的,不再只是某个终端能够运行多大的模型,而是谁能够在终端、边缘与云端之间建立起稳定、高效且低成本的运行体系。
计算连续体,就是高通给出的答案。这一战略跳出了端侧与云端的二元对立。隐私敏感、低时延任务更适合在终端或边缘侧完成,复杂生成和深度推理则交由云端处理。计算连续体的核心目标,赋能从个人终端到数据中心的各类设备,跨越算力谱系实现分布式智能。
要让这一战略成立,还需要产品体系、设备生态和连接网络共同支撑。这也构成了高通 COMPUTEX 三大支柱的逻辑起点。
2. 三大支柱,让 Agent 进入真实世界
与移动互联网时代依赖新终端普及不同,Agent 时代首先建立在海量存量设备之上。
安蒙提到,目前全球持有的 60 亿部手机、20 亿台 PC、20 亿台个人 AI 设备和 10 亿辆联网汽车,构成了 Agent 天然的运行网络。高通三大支柱的意义,正是在这些既有设备基础上推动智能体规模化落地。
第一根支柱是规模化覆盖,它回答智能体在哪里运行。
Agent 天然具有分布式特征,无法依赖单一算力载体完成全部任务。高通构建起覆盖毫瓦级可穿戴终端到千瓦级数据中心的完整算力谱系,横跨可穿戴设备、手机、AI PC、XR、汽车、机器人、IoT 以及云端推理平台。
截至目前,高通累计出货 43 亿颗具备AI能力的芯片,拥有行业最大的端侧 AI 部署基础之一。
所以高通并非从零开始构建 Agent 生态,而是在既有终端网络上承接智能体落地。随着 AI 越来越依赖实时感知与上下文理解,手机、耳机、眼镜、汽车和机器人都将成为推理入口。相比单一云厂商或单一设备厂商,高通横跨多个终端品类的布局,使其天然覆盖智能体最主要的运行场景。
第二根支柱是 AI 原生设备与系统,它回答智能体如何真正进入用户生活。
如今终端 AI 化浪潮全面提速,为智能体常态化落地打开场景空间。Canalys 预测,到 2026 年末,全球 AI 手机累计出货量将突破 10 亿台;Gartner 预计,同年 AI PC 出货量达到 1.43 亿台,占 PC 市场 55%;Omdia 预计,2026 年 AI 眼镜出货量将超过 1500 万台。AI 正在从应用层进入设备架构层,AI 原生终端逐渐成为行业主流。
Omdia 还分析认为,AI 原生设备的关键,不再是继续给单个终端增加功能,而是让智能围绕用户持续流动。今天的手机、PC、耳机、手表、车舱与家居设备仍大多是信息孤岛,用户被迫充当系统集成者。智能体时代需要一种新的系统架构:手机不再一机包办,而是成为个人 AI 网络的锚点,负责承载用户信任、上下文与本地算力;眼镜、耳机、可穿戴和汽车则成为感知与执行节点。
这和高通提出的EOY(Ecosystem of You)理念相呼应。手机仍是个人 AI 的核心,负责存储用户上下文和本地记忆;AI PC 承担生产力任务;眼镜和耳机提供视觉与听觉入口;可穿戴设备负责持续感知;汽车则延伸出行场景。不同设备不再独立运行,而是围绕用户需求协同工作。
安蒙在演讲中提出,未来的设备会拥有 " 双重角色 "。一个是由用户操作设备,这也是当前所有设备的设计方式。但与此同时,智能体也会自主操作设备,而这就是未来设备的使用方式。相比传统设备等待用户点击和输入,AI 原生系统需要持续理解意图、保留上下文,并允许任务在不同设备之间自然接续。
这一趋势正在推动个人 AI 从 " 人找服务 " 转向 " 服务找人 "。用户需要的也不再是单个设备上的 AI 功能,而是跨设备、跨场景持续存在的智能体验。
这种体验离不开端云协同架构。端侧负责即时感知、本地记忆和低时延执行,云端负责复杂生成和深度推理。两者按需协同,使个人 AI 能够同时满足实时性、隐私性和复杂任务处理需求。
与此同时,近身智能与物理 AI 持续拓宽产业边界,将智能体从消费电子场景延伸至真实物理世界。
汽车、机器人和工业设备正在成为 Agent 落地的重要场景。
安蒙认为,汽车产业正在从软件定义汽车进一步演进至 AI 定义汽车。车辆既运行自身的物理 AI 系统,也成为个人 Agent 网络的一部分,共享用户上下文与任务信息。
机器人则需要分层计算架构:底层负责实时控制,中间层负责场景理解,上层负责推理与规划。这种分层体系,本质上也是计算连续体在物理世界的体现。
第三根支柱是智能连接,它回答智能体如何协同。
分布式智能体体系中,连接不再只是数据传输通道,而是任务接力、状态同步和上下文流转的基础设施。一个完整任务可能在手机上发起,在 PC 上处理,在云端完成推理,再由汽车或可穿戴设备接续执行,对网络的低时延、高可靠和算力感知能力提出更高要求。
高通整合5G、Wi-Fi、蓝牙、UWB、卫星通信等能力,并前瞻布局 6G 网络,希望让网络不仅传输数据,也能够参与任务调度和算力协同。
高通将6G 定义为首个面向 AI 时代设计的无线技术。安蒙表示,除了连接能力之外,6G 还将承担分布式计算和全域感知功能。海量联网终端形成的无线网络,本身就能够成为智能体的重要环境感知来源,为 AI 持续提供实时上下文信息。
三大支柱共同构成高通在智能体时代的核心能力。规模化覆盖提供运行基础,AI 原生系统提供落地入口,智能连接提供协同能力。高通试图证明的并非某个芯片的领先优势,而是其连接终端、边缘与云端的系统级能力。
过去十年,消费电子行业竞争的是设备;未来十年,竞争的对象将变成系统。而高通争夺的位置,也正在从终端芯片市场延伸至智能体时代的基础设施层。
3. 智能体时代的价值重估
安蒙在 COMPUTEX 上提出了一个容易被忽略的判断:未来软件行业服务的对象,将不再只有人类用户。
过去几十年,软件产品围绕人的点击、输入和操作设计。无论是办公软件、浏览器、电商平台还是企业系统,本质上都是人在发出指令,软件负责响应。
而随着 Agent 开始自主规划任务、调用工具、访问服务并持续执行流程,软件第一次迎来了第二类用户——智能体。
越来越多操作不会由人亲自完成,而是由 Agent 代为完成。用户不再逐个打开应用、搜索信息、整理文件、安排日程,而是提出目标,由 Agent 自动调用多个系统完成任务。
这也是资本市场重新审视高通的背景。
过去很长时间里,市场对高通的估值逻辑高度绑定智能手机和 PC 周期。安卓旗舰份额、手机出货量、授权业务以及移动 SoC 竞争,共同构成了投资者理解高通的主要框架。即便高通持续拓展汽车、IoT 等业务,外界依然习惯将其归类为一家芯片厂商。
但智能体时代,为高通提供了彻底摆脱换机周期束缚的机会。
移动互联网时代的增长来自设备增量,而智能体时代的增长开始来自推理增量。价值不再完全取决于卖出多少设备,而取决于这些设备上的 Agent 运行得有多频繁、处理了多少任务、调用了多少服务。对于资本市场而言,由持续推理驱动的市场,拥有远高于换机周期的长期想象空间。
这种变化已经开始反映在高通的业务结构之中。
2026 财年第二季度,高通营收达到 106 亿美元,其中汽车业务收入 13.26 亿美元,同比增长 38%;IoT 业务收入 17.26 亿美元,同比增长 9%。汽车与 IoT 业务合计收入已经超过 30 亿美元,并持续保持快于传统移动业务的增长速度。
更重要的是,这些业务背后存在共同特征:它们都是 Agent 未来的重要运行节点。汽车正在成为移动计算平台,机器人正在成为物理世界的执行终端,工业设备正在成为边缘智能节点。过去彼此独立的业务板块,开始被统一纳入同一套智能体运行体系之中。
因此,高通真正试图建立的,并不是多个分散的新业务,而是一套覆盖终端、边缘与云端的智能计算网络。这也是高通持续强化高通 AI 软件栈和跨终端统一开发体系的原因。
对于开发者而言,这是一次开发、多端部署;对于企业而言,则意味着统一架构下的持续运维和成本优化;对于高通而言,则是从芯片供应商向系统平台提供者演进。
数据中心推理业务,则为这一体系打开了全新的增长点。
安蒙在演讲中提出,未来不需要再区分云端与边缘,因为他们最终会融合为一个完整系统。过去行业习惯把终端、边缘和云端视为彼此独立的市场,但智能体工作流天然跨越多个算力层级。一次任务可能始于手机,在边缘节点完成即时处理,最终调用云端推理能力生成结果。用户感知到的是一次连续体验,而非多个系统之间的切换。
这也是高通进入数据中心的真正原因。数据中心不再是一条独立产品线,而是计算连续体不可缺少的一部分。随着 AI200、AI250 等推理产品推进,以及 Dragonfly 数据中心品牌发布,高通率先完成了从终端、边缘延伸至云端推理的完整能力版图。
从这个角度看,市场对高通的重估,本质上也是对 AI 产业价值重心迁移的重估。
移动互联网时代,决定产业格局的是终端入口;大模型时代,决定产业格局的是训练集群;而智能体时代,决定价值归属的将是连接终端、边缘与云端的系统能力。谁能够让智能持续运行、跨设备协同、跨场景流转,谁就更有机会占据下一阶段 AI 基础设施的核心位置。
在智能体时代,同时覆盖手机、PC、可穿戴、汽车和 IoT 并不只是产品数量问题,更意味着统一软件栈、统一连接体系和统一 AI 部署能力。多厂商拥有单一终端优势,或者拥有云端优势,但能够同时覆盖多个核心终端形态并保持统一架构的企业寥寥无几。
手机和 PC 等终端仍然是高通最重要的起点,但已经不再是全部想象空间。高通希望市场看到的,不再是一家受换机周期驱动的芯片公司,而是智能体时代连接数字世界与物理世界、连接个人设备与云端推理网络的底层平台。
随着 AI 从工具走向计算基础设施,从应用走向交互操作系统,高通争夺的也不只是下一代芯片市场,而是下一代计算体系中的核心话语权。
(封面图及文中图片来自:高通公司总裁兼 CEO 安蒙 COMPUTEX 演讲)


登录后才可以发布评论哦
打开小程序可以发布评论哦