全球智能手机市场经历两年下滑,在 2024 年一扫颓势,根据 Canalys 数据,出货量增长 7%。今年上半年继续增长 4%。
同时,CounterPoint Research 发布报告称,600 美元以上的高端机型上半年同比增速达到 8%,创下历史新高 [ 1 ] 。
终端设备的竞争也是核心零部件的竞争,SoC 厂商自然身处其中,扮演重要角色。叠加生成式 AI 带来的算力跃进,联发科凭借天玑系列芯片,稳稳地站上了出货量第一的位置。
今年 9 月,联发科推出 AI 算力翻倍的旗舰 SoC 天玑 9500。在人工智能向终端设备渗透的加速周期,军备竞赛的第一枪就此打响。
架构的胜利
移动 SoC 的设计是个系统性工程。决定楼层高度的是地基,决定芯片能力上限的是底层架构。
如果把开发一颗芯片比作建造一座大楼,芯片架构设计就是建筑方案设计,根据 " 大楼 " 的定位和需求,确定楼层数、风格、电梯和楼梯布局。
天玑系列连续几代性能稳步提升的背后,是联发科对芯片架构大刀阔斧的改造过程。
2023 年发布的天玑 9300,用行业首发的全大核 CPU 架构完成了多核性能的逆袭。今年的天玑 9500 沿用 "1+3+4" 的第三代全大核架构,同时抛弃了 Cortex-X4 系超大核,全面转投性能更强的 C1 系列架构。
所谓 "1+3+4",指 1 个 C1-Ultra,3 个 C1-Premium,均为最新一代 C1 系超大核,外加 4 个 C1-Pro。
C1-Ultra 作为 " 黑鹰 "Cortex-X925 的后一代,结合台积电第三代 3nm 制程,不仅让天玑系列首次迈入 "4" 开头时代——主频高达 4.21GHz,同时还实现了 IPC 的两位数提升。
相比上代产品,天玑 9500 的单核性能提升 32%,多核性能增加 17%。
业内常用时钟频率和 IPC(Instruction Per Clock)的乘积来衡量 CPU 的性能。简单来说,前者相当于单位时间搬砖的次数,后者相当于一次搬多少块砖。
理论上两者越大越好,但人干活会出汗,芯片计算会发热。高频需要更高的电压支持,代价是发热量和耗电量急剧增加。
天玑 9500 通过 C1-Ultra 更宽的指令流水线、更聪明的乱序执行和升级的预取技术,进一步实现了 IPC 的突破。更高的 IPC,意味着更低频率的等效性能——在有限中尽可能创造无限,是芯片架构的魅力所在。
CPU 架构以外,天玑 9500 的更大的亮点在于 GPU 和 NPU 性能双突破。
GPU 采用最新一代 Mali G1-Ultra MC12,凭借联发科与 ARM 联合研发的全新 "Drage" 架构,光追性能提升超过一倍,游戏画面的流畅性进一步提升。同时,能效比提升超过 40%,有效延长手机续航。
而 NPU 方面,创新采用 " 超性能 + 超能效 " 的双 NPU 架构,算力较上一代直接翻倍,其中超能效 NPU 引入 " 存算一体 " 架构,通过减少数据搬运能耗和延迟,提升 AI 计算效率,实现轻负载 AI 模型 Always-On 运算,让 " 随时响应 " 和 " 长续航 " 得以兼容,赋能主动式 AI 应用。
缓存的进一步扩容,是天玑 9500 的隐藏 " 大招 "。
苹果从 2013 年的 A7 开始效仿桌面处理器加入 L3 缓存,时至今日,最新发布的 A19 Pro 相比前代产品,最后一级缓存整整提高了 50%。
苹果保持大缓存设计习惯的背后,是因为 CPU 和内存性能之间存在剪刀差。在处理器内部,CGN(CPU、GPU、NPU)通常要从内存调取数据,做对应的计算工作,最后再把结果搬回内存。
因此决定计算快慢的,除了 CGN 的计算速度之外,还有数据的 " 搬运速度 ",当数据搬运速度低于计算速度,就造成了 " 内存墙 ",拖垮计算效率。
这种情况下,缓存作为数据的临时仓库,便成为近年来堆料的核心阵地,也是天玑系列一以贯之的设计思路。
在前代产品的基础上,天玑 9500 再接再厉,L3 从 12MB 大幅增加到 16MB,SLC 维持 10MB 水平,为需要密集计算的应用打下基础。
激进的 IPC 升级," 存算一体 " 架构的引入,加上缓存针对性的扩容,组合成了联发科的芯片设计水平的代表作,也将移动 SoC 的技术竞争推向了新的高度。
摆正算力和功耗的天平
半导体行业一个普遍共识是,没有完美的芯片,只有完美的 Trade-off。
在芯片设计中,性能 ( Performance ) 、功耗 ( Power)、面积 ( Area ) 组成了一个不可能三角,芯片设计能力的体现,始终是在不可能的三角中寻找最平衡的区间。
当智能手机大踏步进入 AI 时代,对 " 平衡 " 的把控能力就更加迫切。
由于网络延迟和隐私保护等原因,近年来,AI 推理从云端向端侧迁移,既是行业共识,也是不可逆转的趋势。与之对应,算力瓶颈俨然成为困扰终端厂商的棘手问题。
微软首席电气工程师保罗・楚诺克算过一笔账 [ 2 ] ,按照 61% 的利用率,每块 H100 一年要消耗大约 3740 度电,相当于一个美国家庭的平均功耗。云端训练芯片对功耗可以宽容,但端侧要求明显严苛。
在寸土寸金的手机里,芯片设计公司追逐的圣杯,是在功耗恒定的情况下挤出更多算力,即 " 计算效率 "。
这种设计思路既推动了 NPU(神经网络加速器)的脱颖而出,也贴合了天玑 9500 的设计哲学:既要保证 "算力够用 ",又要解决 " 功耗降不下来 " 的难题。
根据英特尔研究,一个采用 7nm 制程的 AI 芯片,光数据搬运产生的功耗就高达 35pJ/bit,占总功耗的 63.7%。也就是说,减少数据搬运,是降低功耗的重要途径。
因此在天玑 9500 中,联发科采用了创造性的双 NPU 架构,两颗 NPU 各司其职,一个作为性能核心支持端侧运行参数量大的模型,另一个采用 " 存算一体 " 架构,作为能效核心,运行参数量较小的模型。
所谓 " 存算一体 " 架构,核心是将 NPU 内部的计算单元与缓存融为一体,从根本减少搬运路程。使得天玑 9500 将 AI 算力提高到 100TOPS 的同时,最大程度避免了高功耗问题。
端侧大模型搭配小模型是智能手机 AI 部署的一大趋势。天玑 9500 的超能效 NPU,可以实现轻负载 AI 模型 Always-On 运算,对实时翻译和对话式 AI 这类应用来说,用户体验可以从 " 请求 - 响应 " 变成 " 随时响应 "。模型始终在线,但更加省电。
在权威机构 ETHZ 的 AI Benchmark 测试里,天玑 9500 斩获 AI 性能榜单冠军。
和端侧 AI 类似,手机游戏同样受困于性能和功耗的两难抉择,一直以来也是检验芯片实力的 " 照妖镜 "。对算力和功耗的平衡艺术,在剑与魔法的世界公平的考验着每一家芯片设计公司。
消费电子领域,硬件与软件大多互为催化剂,游戏公司对画质和沉浸式体验的追逐,会倒逼芯片公司发力游戏体验。后者性能的提升,又会推动前者的进步。
从天玑 9200 首发移动端硬件光线追踪开始,联发科接连布局全局光照效果、OMM 追光引擎,让移动端游戏体验直逼主机级效果。天玑 9500 再接再厉,通过在移动端率先支持主机级 Ray-tracing Pipeline 技术,带来了前所未有的沉浸式主机级光追效果。
除此之外,天玑 9500 首发 GPU Dynamic Cache (动态缓存)架构,让 GPU 可以利用 SLC 系统级高速缓存,从而进一步降低功耗,同样意在提高游戏体验。
在性能和能耗这个困扰手机游戏多年的命题上,天玑 9500 通过几代产品的技术积累,提供了一个尽可能完美的解决方案。
按照测算,天玑 9500 支持的光追下游戏帧率从 9300 的 60 帧跃升至行业领先的 120 帧,功耗逆势降低 14%,将反差做到了极致。
在一个又一个场景中创造惊艳的体验,是对物理学最浪漫的诠释。
稳稳站上第一梯队
2007 年的第一代 iPhone 发布会上,乔布斯拿出手机拨通了位于旧金山的一家星巴克电话,玩笑称要预定 4000 份拿铁,店员不明所以,但现场观众掌声雷动——这一幕被现场的媒体定格,成为了电子产业史上绕不开的里程碑。
然而,乔布斯玩笑式的电话,却成为未来十多年里,产业界求索的图腾。
2011 年,苹果智能语音助手 Siri 随 iPhone 4S 隆重登场,掀开了消费电子产业对人工智能的想象。时至今日,大量 AI 功能被塞进手机里的同时,两大趋势越发凸显:
一是 AI 不再是相机美颜和语音助手的附属功能,反而变成重构手机体验的新引擎;
二是智能手机的竞争焦点,逐步从比拼硬件参数向软硬强耦合的产品力转移,其根本思路就是围绕真实场景,针对用户需求做突破。
2011 年,Siri 第一次亮相
结合 IDC 的定义,30TOPS 是 AI 手机 SoC 的入门槛。这从事实层面将时间线拉到了天玑 9300 上市的 2023 年。
人工智能时代赋予联发科的角色,不是纯粹的 " 算力供应商 ",而是基于对用户需求场景的深刻洞察,将代码和电路变成实实在在的用户体验,支撑起无从察觉却无处不在的智能未来。
从解决大模型入端带来的算力激增与功耗约束之间的矛盾,到满足游戏用户对 GPU 极致渲染能力与持久续航之间的双重期待,用户需求为先,一直是联发科设计研发的出发点。
在今年的天玑开发者大会上,联发科提出了 Agentic AI UX 的五大愿景:主动及时、知你懂你、互动协助、学习进化、专属隐私信息守护。在天玑 9500 上,联发科与终端厂商联合打造的量产的端侧 AI 功能,恰恰是这种愿景的延伸与产物。
在与 vivo 的合作中,联发科为后者定制的 NPU,帮助其实现了全球首发的视频录制功能,为 vivo X300 系列提供了强大的追焦系统,可支持毫秒级运动追踪与瞬时快门响应,还打造了能够 " 学习进化 " 的 AI 定制美颜功能。
在 OPPO 最新旗舰 Find X9 上,针对搜索这一场景,联发科通过系统级整合赋能 OPPO AI 端侧落地,与 OPPO 共同打造了 " 知你懂你 " 的 AI 意图搜索应用,帮助用户实现一键即搜。
为了改善文生图与文生文这两个普及最广、工作场景中效率提升最为显著的 AI 应用,天玑 9500 凭借内置的生成式 AI 引擎 2.0 与 Transformer 专用固化电路,实现了多项端侧 AI 能力的突破:
支持 4K 超高画质文生图在手机端侧直接生成,同时将文生文大语言模型的端侧响应速度提升了一倍。由此最大程度解决了高并发时段响应延迟、生成效率低下的问题。
上网、游戏、办公……真实的需求场景始终是放大芯片与大众需求的连接器,使得芯片这个技术与资本高度密集的产业,始终有足够的市场和动力,快速向前滚动和发展。
当人工智能的蔓延再次冲击原本井然有序的市场格局,联发科用务实的研发理念和对市场需求的理解,一步步站上了全球芯片设计产业的第一梯队。
AI 时代的到来,市场纷纷大讲未来,联发科对于未来有着清晰的技术规划和持续投资,更加值得关注的是,这家厂商同样注重当下——从引领端侧视频生成、4K 文生图等等这些落地应用,我们看到,先进的 AI,更是触手可及的 AI。
当 " 天玑 "(Dimensity)这个芯片品牌在 2019 年第一次亮相时,恐怕很少有人能预料,联发科在此后的手机市场变化中所扮演的角色,更难以想象,一代又一代的天玑芯片所创造的持续价值。
参考资料
[ 1 ] 2025 年上半年全球高端智能手机销量创历史新高,CounterPoint Research
[ 2 ] 算力巨兽能耗惊人:英伟达 H100 AI 芯片总耗电量将超欧洲小国,IT 之家
作者:徐珊珊
登录后才可以发布评论哦
打开小程序可以发布评论哦