中国电子报 10-09
AI智能体走向终端,需要哪些芯片?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

2025 年被视为 AI 智能体(Agent)的元年,也是智能体走向终端设备、提升应用普及的时间窗口。在近期举办的 "2025 骁龙峰会 · 中国 " 上," 智能体 " 被芯片供应商、手机 OEM、PC OEM 及广大 AI 技术解决方案提供商频频提及。荣耀终端股份有限公司产品线总裁方飞在峰会现场表示,2025 年将开启 " 手机智能体与性能的引擎时代 ";小米 AI 产品经理李豪杰向《中国电子报》记者表示,小米的个性化端侧 AI 除了让智能体更懂用户,生成内容的时候可以不需要输入之外,还具备感知能力;金山办公生态合作总经理张宁介绍了基于 WPS 灵犀的 " 原生 Office 办公智能体 "。

芯片是终端设备的算力引擎。智能体要走入硬件配置(相对云端)受限的终端侧,不仅对芯片的性能参数和架构设计提出了新的要求,也推动芯片供应商与终端 OEM 进行更加精细的联合研发、底层调优及功能开发,加速解锁更多的功能特性与用户体验。

"2025 骁龙峰会 · 中国 "Demo 体验区

从算力、内存到感知,智能体全方位考验终端芯片能力

根据谷歌云的定义,AI 智能体可以同时处理文本、语音、视频、音频、代码等多模态信息,执行复杂的多步骤操作,实现自主学习、适应并独立做出决策。相比 AI 助理,智能体不再被动响应用户的要求,而是以目标为导向,自主、主动地执行任务。

AI 智能体、AI 助理、聊天机器人的特征(来源:谷歌云)

智能体的功能很大程度上得益于生成式 AI 和 AI 基础模型的多模态功能。而多模态的多元数据类型和多样算力需求,需要以 NPU 为核心且 NPU、CPU、GPU 协同工作的异构计算矩阵。高通本次发布的第五代骁龙 8 至尊版搭载了异构 AI 引擎,包含作为通用加速单元的自研 Oryon CPU 和 Adreno GPU,以及作为引擎核心的全新 Hexagon NPU,三个加速单元各有侧重又协同工作。比如 Oryon CPU 负责即时响应任务,包含独立显存的 Adreno GPU 能够加速 AI 负载并实现更快的推理响应,Hexagon NPU 专注于持续运行的大语言模型和复杂推理任务。此外,该 AI 引擎还集成了高通传感器中枢,在保护数据隐私的基础上 , 围绕用户构建更加深入、个性化的个人知识图谱。

AI 工作负载主要包括由标量、向量和张量数学组成的神经网络层计算以及非线性激活函数。Hexagon NPU 提供了三种硬件加速单元,分别对应标量、向量、张量三种常见数据类型及相应的工作负载。其中,12 个标量加速器用于处理图像识别、音频分析等经典 AI 任务,同时支持大语言模型推理;8 个向量加速器用于加速复杂的像素级图像模型,并在大语言模型场景上支持更长的上下文窗口;张量加速器用于加速更大、更复杂的多媒体用例以及 LVM(视觉大模型)。

同样值得注意的是,内存带宽对大模型的端侧部署至关重要,直接影响大模型的训练效率和推理速度。面向大模型的内存带宽瓶颈,第五代骁龙 8 至尊版首次支持 64 位内存架构,使 NPU 可访问超过 4GB RAM,从而更高效地支持更大参数的端侧模型部署。此外,第五代骁龙 8 至尊版支持的 LP DDR5x 内存频率达到 5.2GHz,进一步提升了大模型的推理速度。

降低内存占用同样是部署 AI 大模型——尤其是本地化、轻量化部署的重中之重。量化成为解决这一问题的关键技术,通过降低模型参数精度,减少内存需求,并保持模型的大部分准确性。最新一代的 Hexagon NPU 支持 INT2 和 FP8 精度,为开发者提供更加灵活的模型部署方式。其中 FP8 在加快计算速度的同时降低内存占用,使大模型走向边缘设备成为可能,越来越成为大模型技术团队的主流选择。

" 在三十亿参数的大语言模型上,我们(第五代骁龙 8 至尊版的 NPU)的出字速度最快能够达到 220token/s 以上。" 高通技术公司产品市场总监万卫星在峰会现场表示。

高通全新 Hexagon NPU 可实现最快 220Tokens 每秒以上的出字速度

在 AI 智能体所需的异构计算架构中,CPU 和 GPU 的作用同样关键。第五代骁龙 8 至尊版搭载了当前业界最快的移动端 CPU 和具备独立显存的 GPU,为 AI 负载提供更加全面的算力支撑。

其中,第三代 Qualcomm Oryon CPU 是迄今全球最快的移动端 CPU,采用 4.60GHz 的超级内核和 3.62GHz 的性能内核,以及每簇 12MB 的缓存,支持矩阵加速,使第五代骁龙 8 至尊版的单核性能提升 20%,多核性能提升 17%,CPU 能效提升 35%。

而新一代高通 Adreno GPU 在性能提升 23%、光追性能提升 25%、能效优化 20% 的基础上,首次引入独立高速显存。这一 18MB 的专用图形缓存,不仅带来 10% 的整机功耗降低和最多 38% 的游戏性能提升,也为 GPU 上运行的其他用例带来性能和功耗上的收益,比如实时分析视频、识别关键瞬间、相册增强等一系列 AI 影像功能,并实现更快的推理响应。

除了智能手机,AI PC 也是 AI 智能体的重要落点。本次骁龙峰会上,高通发布了面向 PC 平台的骁龙 X2 Elite Extreme 和骁龙 X2 Elite。其中,骁龙 X2 Elite Extreme 集成了 3nm 制程的第三代 Qualcomm Oryon CPU,拥有 12 个超级核心、6 个性能核心,是首款主频达到 5GHz 的 ARM 兼容 CPU。该处理器还搭载了面向笔记本电脑的全球最快 NPU,支持 80TOPS AI 处理能力,可在 Windows 11 AI+ PC 上支持并发 AI 体验。

" 为了支持生成式 AI 和智能体 AI,我们(骁龙 X2 Elite Extreme)配备了全新的强大 NPU,能够提供 80TOPS 的推理性能。" 高通技术公司产品管理副总裁 Nitin Kumar 表示。

骁龙 X 系列产品组合中的全新一代旗舰平台,提供高达 80TOPS 的 AI 处理能力

芯片厂商与 OEM 深度协同,共同推动底层技术创新

面向终端平台的用户需求与限制因素,手机、PC 等终端 OEM 与高通团队联合研发,使旗舰产品更充分地发挥芯片能力,解锁更多功能特性与用户体验。而 AI 智能体的部署要求,使 OEM 与高通的合作更加紧密,在硬件设计、交互框架、技术部署、功能开发、底层调优等方面取得诸多进展,并在骁龙峰会带来了多项首发技术与体验。

" 智能体的核心是模型。" 荣耀终端股份有限公司产品线总裁方飞表示。在峰会现场,荣耀展示的图像 AI 追色功能引发现场观众阵阵惊呼。其背后是荣耀与高通联合研发的高效能端侧 AI 模型方案。

首先,荣耀与高通团队通过端侧低 bit 量化技术,使端侧模型存储空间节省 30%、推理速度提升 15%、推理功耗下降 20%。通常来说,低 bit 量化技术在端侧落地,将显著优化功耗、内存、性能等模型体验,但也会导致对应的精度损失增大。荣耀与高通携手,在最新旗舰芯片上实现了垂域场景的 2-bit 量化商用准出,在精度达标的前提下,进一步降低内存占用、提升推理性能并减少推理功耗,推动量化技术从单纯的软件压缩,演变为与硬件设计深度耦合的计算范式。

其次,双方推出了新一代向量化检索技术,通过将文本、图像、视频等数据编码为稠密向量,构建语义层的高效索引,推动检索性能提升 400%。

再次,双方一起构建端侧多模态感知能力,使个人知识库的构建更加便捷高效。采用低比特量化技术的多模态模型,能够高效、精准地理解手机端的文本、图片、视频等各类数据,将其转化为结构化的信息与知识,在提升效率的同时进一步降低计算和存储开销。

基于双方多个技术层面的联合研发,荣耀首发了 " 智能体驱动的图像 AI 追色 " 功能。在现场展示中,方飞通过语音指令,让荣耀智能体 YOYO 将一张电影海报保存为追色模板 " 爱乐之城 ",并找到 " 周末在故宫拍摄的照片 "。YOYO 基于低 bit 量化存储和向量检索技术,即刻完成对指定图片的搜索。随着方飞说 " 把这张图片追色成‘爱乐之城’模板 ",YOYO 将故宫照片的风格色调变成了 " 爱乐之城 " 的海报风格。

方飞演示 " 智能体驱动的图像 AI 追色 " 功能

而 PC 作为更具生产力属性的终端,正在通过 AI 能力衍生出跨文件、跨应用的全局检索和信息整理能力,并基于多模态大模型重构人机交互体验。

金山办公生态合作总经理张宁表示,过去半年,金山办公与高通工程师团队紧密合作,基于骁龙 AI PC 进行架构适配,以充分发挥骁龙 X 系列平台性能。在个人办公方面,根据金山办公 9 月的预发布版本,WPS Office 已经在骁龙平台上实现显著的性能提升,启动速度相比竞品提升 20%,打开 15MB Excel 速度领先 10%,打开 10MB PPT 速度领先 10%。金山办公将于今年 12 月底正式交付面向骁龙 AI PC 的 WPS Office,届时中国用户将能作为首批用户感受更流畅、跨平台的统一办公体验。企业协作方面,金山办公于今年 7 月发布了 WPS AI 3.0 版本—— WPS 灵犀。

" 有了 WPS 灵犀,用户只需通过自然语言、多轮对话即可完成文档创作、演示文稿生成及语音助手等功能,是真正意义上的原生 Office 办公智能体。我们相信,未来 WPS 灵犀与骁龙 AI PC 的硬件能力有更深的合作机会,形成协同增效的办公生态。" 张宁说道。

2025 年是高通成立四十周年,也是其在华发展的第三十年,而 AI 将是高通与中国合作伙伴下一个三十年的重中之重。高通中国区董事长孟樸在展望高通与中国生态伙伴合作前景时表示:" 站在 AI 与连接重构终端、重塑体验并开启全新智能时代的新起点,让我们以创新引领方向,以合作汇聚力量,共同开创下一个更加辉煌的三十年。" 高通公司首席运营官兼首席财务官 Akash Palkhiwala 表示,高通将携手中国合作伙伴,在智能手机上实现更多 AI 赋能的功能和优化,将智能体 AI 的体验引入更多终端;同时与中国的 AI 模型提供商和开发者合作,共同推动更多 AI 应用案例的探索与落地。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 骁龙 芯片 gpu 谷歌云
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论