钛媒体 10-29
高通新发AI推理芯片,瞄准每年3000亿美元市场
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | 电厂,作者 | 董温淑,编辑 | 高宇雷

北京时间 10 月 27 日晚间,高通发布了 AI200 及 AI250 两款 AI 数据中心芯片,以及基于两款芯片的加速卡和机架级解决方案;两款芯片计划分别于 2026 和 2027 年投入商用。

这也是继高通在 2019 年发布 Cloud AI 100、2023 年发布 Cloud AI 100 Ultra 后,又一次推出数据中心 AI 推理新品。

消息发布当天,高通股价急剧拉升,盘中一度飙升 22% 达 205 美元,这也是高通自 2024 年 6 月下旬以来的最高股价,最终闭盘收于每股 188 美元,涨幅为 11.09%。包括摩根大通、美银证券、TD Cowen 等多家投行更新了对高通的评级并维持买入,最高买入价格看至 200 美元。

同一天,高通还宣布将与沙特阿拉伯 AI 企业 "HUMAIN" 合作,推进 AI200 和 AI250 落地应用。

随着 AI 应用需求暴增,市场对 AI 推理芯片需求水涨船高。今年英伟达、谷歌、华为均已公布 AI 推理芯片新品。面向 AI 推理的蓝海市场,各家比拼的将不仅是技术能力,更是跑马圈地的速度。

对高通而言,此次对 AI 推理的发力不仅是涉足热门方向,也是推进其数据中心业务布局的最新一步。近年,高通曾多次公开展露其对数据中心市场的兴趣,除了 AI 推理芯片,高通同样在数据中心 CPU 等方向展开了产品布局。

在官宣 AI200 及 AI250 发布的新闻稿最后,高通也写道:高通致力于制定一个按年推进节奏的数据中心路线图,专注于提供行业领先的 AI 推理性能、能源效率及 TCO(总拥有成本)。

跻身 2025 数据中心推理芯片竞速赛道

"AI 推理 " 指已经过训练的模型经过部署后,对新输入的数据进行逻辑推导与预测。与之对应的则是 "AI 训练 ",指模型通过分析庞大的数据集、学习其中的模式与关系。

在实际应用中 AI 训练与推理芯片之间并没有严格、明确的划分,但相较训练场景要求芯片具备绝对强大的并行计算能力,推理场景更强调芯片的能效、时延、成本等综合性能。本次发布的高通新品同样着力于针对总拥有成本 ( TCO ) 和性能进行平衡设计。

据官方信息,AI200 及 AI250 基于高通 NPU 技术,其中基于 AI200 的机架级 AI 推理解决方案支持每张卡 768GB 的 LPDDR(低功耗双倍数据速率内存),以提高内存容量和降低成本;而 AI250 解决方案将首次使用基于近内存计算的创新内存架构,有效内存带宽大幅提升且功耗更低。

此外两种机架解决方案均采用直接液冷散热方案,采用 PCIe 进行纵向扩展,采用以太网进行横向扩展,采用机密计算以确保安全的 AI 工作负载,单机架功耗为 160kW。

高通新品于此时亮相是想踩中 AI 推理市场爆发的宝贵时间窗口。

今年以来,AI 推理市场动态频出。比如 9 月份,AI 推理创企 Groq 官宣已达成 7.5 亿美元的新融资,并称接下来计划建成 " 全球最大推理数据中心 "。

同样在 9 月份,OpenAI 已与老牌云计算巨头甲骨文达成合作的消息在市场中广为流传,据称 OpenAI 已敲定将在 5 年内从甲骨文采购逾 3000 亿美元的推理算力——这也是有史以来经披露的最大云计算合同。消息一出,甲骨文股价一度急剧拉升,单日最大涨幅超 36%。

而据巴克莱银行旗下研究机构预测,到 2026 年,AI 推理计算需求将占通用人工智能总计算需求的 70% 以上,推理计算的需求甚至可以超过训练计算需求、达到后者的 4.5 倍;而现有芯片资源可能难以满足这一需求,需增加当前预测 4 倍的芯片资本支出,总额或将接近 3000 亿美元。

面向巨大的需求缺口,包括高通在内的许多厂商正在摩拳擦掌。

今年 4 月,谷歌于 Google Cloud Next 25 大会上发布了 TPU 芯片 "Ironwood",号称其为首个专门为大规模 AI 推理而设计的 TPU 加速器。

9 月,英伟达发布了针对 AI 视频生成和软件开发等大规模上下文处理任务的 "RubinCPX" GPU。后者基于 Rubin 架构打造,能够在计算密集型的上下文推理阶段实现突破性性能表现,计划于 2026 年底上市。

同样于 9 月举办的华为全联接大会上,昇腾多系列新品亮相,其中 "950PR" 将于 2026 年第一季度对外推出、着力提升推理 Prefill(AI 推理过程中的关键阶段)性能。

换句话说,从 2026 年开始,高通将与英伟达、谷歌、华为等企业在 AI 推理的赛场上同台竞技。以巴克莱所预测的 3000 亿美元资本支出推算,即便占据到 1% 的市场份额,对高通而言也是不容小觑的营收增长。

" 重返 " 数据中心市场,发掘业绩新引擎

高通并未说明 AI200 和 AI250 所采用的制程及基本架构方案,但考虑到 AI100 并非 GPU 而是 ASIC,新款产品有可能也采用了 ASIC 的基础架构。ASIC (专用集成电路)是一种为特定任务设计的全定制芯片,相较 GPU,在能效方面表现更优。

尽管已经在 6 年内推出多款 AI 推理芯片,高通 AI 推理业务贡献的营收几乎可以忽略不计。

7 月底公布、截至 6 月 30 日的 2025 第三财季业绩报告显示,高通 QCT 半导体业务该季营收为 89.93 亿美元,主要来自手机芯片、汽车芯片、物联网业务;QTL 技术授权板块营收为 13.18 亿美元。

过往多年,高通曾多番尝试开发数据中心产品,但成效甚微。2018 年,高通服务器芯片负责人 Anand Chandrasekher 官宣离职,并传出整个服务器部门裁员 50% 的消息,被市场解读为高通已放弃这一业务方向。

直到 2024 年,Amon 于 Computex 2024 展会接受采访时确认高通将重返数据中心市场,并从 2025 年开始推进产品动作。

2025 年 5 月,高通表示计划采用英伟达技术,来定制生产数据中心 CPU,用以搭配和连接英伟达 GPU 使用、助力英伟达 GPU 实现更加快速的通信。

6 月,高通宣布其间接全资子公司 Aqua Acquisition Sub LLC 将以 24 亿美元收购半导体 IP 企业 Alphawave,后者的优势在于拥有高端接口 IP,能够增强高通在数据中心市场的竞争力。此桩收购预计在 2026 年第一季度完成。

此外,高通近日宣布与沙特阿拉伯的 HUMAIN 合作,HUMAIN 正在开发阿拉伯语多模态大语言模型(ALLaM),并计划将其与高通的边缘设备生态深度集成,形成从芯片到应用的完整技术闭环。

而在与沙特阿拉伯公司 HUMAIN 的合作中,高通将为该项目提供 " 全球人工智能推理服务 ",使之成为世界上首个完全优化的边缘到云混合人工智能(项目),使沙特阿拉伯成为全球人工智能中心。

尽管布局节奏紧凑,数据中心板块为高通贡献营收仍需时间。

7 月底,2025 第三财季业绩说明会,高通总裁兼 CEO Cristiano Amon 曾在电话会中讲到,公司正积极拓展 AI 芯片布局,已经与一家超大规模云端服务供应商展开深入洽谈,最快将于 2028 会计年度开始贡献数据中心相关营收。

除了 AI,高通也在极力推进产品在智慧驾驶、物联网等多元化场景的落地。

考虑到苹果与高通的基带购买协议将于 2026 年末到期,而苹果是高通营收占比约 20% 的单一大客户," 能否在苹果‘撤出’后培育新的营收支柱?" 将是市场亟待高通解答的命题。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

高通 芯片 数据中心 ai 摩根大通
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论