科技行者 3小时前
高通重新定义高通:不再只是芯片公司,而是全栈AI解决方案公司
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

作者:高飞

是时候重估高通了。因为这家公司刚对自己做了一番 AI 时代的重新定义。

重估的分水岭则是今早的高通投资者日活动。

CEO 安蒙(Cristiano Amon)在台上提到,6 月底这个活动日期距离他正式就任 CEO 刚好五年,而他大约 30 年前以工程师的身份加入了这家公司。五年前的投资者日上,他提出了业务多元化转型目标。五年后的这场活动,是对那份答卷的一次完整更新。

这场活动说是投资者日,但也可以叫技术发布日。

安蒙宣布了高通正式进入数据中心市场,发布了服务器 CPU、AI 推理加速器和数据中心连接产品的完整路线图,并设定了 2029 财年 150 亿美元的数据中心收入目标。同日,微软 CEO Satya Nadella 和 Meta 创始人 Mark Zuckerberg 分别通过视频确认,将在各自的下一代数据中心中部署高通的芯片。

数据中心还只是高通在这场活动上展开的版图的一部分。加上已有的汽车、工业 IoT 和机器人业务,高通把 2029 财年非手机收入目标从 18 个月前设定的 220 亿美元直接翻倍到 400 亿。

华尔街有一条老经验:当一家公司同时做很多不相干的生意,投资者不会把每块业务的价值简单地做 " 加法 ",反而会打折。因为管理层会精力分散,资源互相抢占,各业务之间没有协同。这叫 " 多元化折价 "。

这一次,市场却给出了积极的反应。活动结束后,高通盘后股价涨了超过 15%。

原因何在?

其实,投资者在意的并不是表面的多元化,而是要看这些业务是否共享某种底层资产。如果做 A 的同时让 B 变得更强、更有优势,投资者是愿意给溢价的。因为这时候是在对业务做乘法。

安蒙说:" 对高通来说永远不算晚。人们可能因为不同的事情不认同这家公司,但没有人会否认高通拥有扎实的技术能力。"

显然,这一次华尔街认为高通所做的正是乘法。

第一个乘号:设计一次,部署四个市场

高通做端侧芯片 40 年,核心命题一直是三件事的平衡:性能、功耗、成本。性能要高,不然用户体验差;功耗要低,不然续航撑不住;成本要可控,消费电子追求的就是大众化。三者互相牵制,同时做好的难度很大。

同时覆盖手机、PC、汽车和数据中心四个市场,每个市场各做一套芯片,研发成本会自然要成倍增加。

高通的做法是:把芯片的核心组件设计成可复用的模块,同一个模块根据目标产品的功耗和性能需求,调整数量和配置。

具体来说,高通有两个关键的自研模块。一个是 CPU 核心 Oryon,负责通用计算。Oryon 最早用在 PC 芯片 Snapdragon X 系列上,随后部署到 Snapdragon 8 Elite 手机芯片和 Snapdragon Ride/Cockpit Elite 汽车平台,现在以 250+ 核心的配置成为数据中心 CPU 的基础。

另一个是 AI 推理单元 Hexagon NPU(神经网络处理器),专门处理 AI 计算。同一个 NPU 架构,手机里跑端侧大模型,汽车里跑 ADAS(高级驾驶辅助)视觉处理,工业场景里跑机器视觉,数据中心里跑大规模推理。

核心设计只做一次,研发成本被分摊到手机的数十亿颗年出货、PC 的百万级、汽车的千万级和刚起步的数据中心上。而一家只做服务器 CPU 的公司,同样的研发投入只能靠一个市场消化。

安蒙在台上提供了一组制造数据:高通每年完成超过 75 款芯片流片(tape out 芯片设计定稿并送交制造),出货 400 亿个组件。75 款流片背后不是 75 套独立设计,而是同一套核心模块在不同产品中的 75 种排列组合。

第二个乘号:手机里练出来的方法论,在数据中心值钱了

模块复用解释了成本结构,但还没解释差异化。

在数据中心 AI 芯片领域,已有占主导地位的公司。英伟达有更成熟的 GPU、更完整的软件栈、更深的客户关系。英伟达之外,玩家也依然不少,甚至 OpenAI 也参与联合研发了一款定制 AI 推理芯片。

所以,高通凭什么在这个市场有竞争力?

数据中心负责人 Tony Pialis 在台上给出了一种诠释。

Pialis 是高通去年底收购的高速连接芯片公司 Alphawave Semi 的联合创始人,现在负责高通的整个数据中心业务。他发布了一个叫 HBC(High Bandwidth Compute,高带宽计算)的新架构,并以此为基础推出了高通的数据中心品牌 " 飞龙 "(Dragonfly)。

理解 HBC 需要先理解为什么内存对 AI 芯片这么重要。AI 大模型在做推理时,需要不断从内存中读取数十亿甚至上千亿个参数,计算完再写回去。芯片算得再快,如果数据搬运跟不上,算力就空转。所以在推理场景下,内存带宽往往比计算能力更先碰到天花板。

当前的主流解法是这样的:在 GPU 旁边堆几堆 HBM(高带宽内存),中间用一种叫 silicon interposer 的昂贵基板连接。数据在 GPU 和 HBM 之间反复搬运,本身就消耗大量电力,而 HBM 供不应求、interposer 产能紧张,进一步推高了成本。

HBC 走了一条不同的路:通过 3D 堆叠将计算单元直接贴在内存下方,不需要 interposer,数据不用远距离搬运。而且,它用的内存不是 HBM,而是 LPDDR,一种功耗更低的内存规格。

LPDDR 就是高通在手机上用了几十年的那种内存。

换句话说,HBC 的设计思路,让计算靠近内存、减少数据搬运距离,和高通在手机 SoC 上做了几十年的事是同源的。手机电池容量有限,5 瓦功耗预算里塞进 CPU、GPU、NPU、基带和图像处理器,这迫使高通 40 年来持续优化、最大化每一瓦的计算产出。

这套能力过去在数据中心并不受重视,但当 AI 推理规模爆发、数据中心动辄需要几百兆瓦到吉瓦级电力时," 每瓦产出最多智能 " 成了数据中心采购清单上越来越重要的一项。

Pialis 给出的数据是:HBC 在高吞吐工作负载下,每瓦带宽是竞对 HBM 方案的 6 倍。搭载 HBC Gen 1 的 AI250,单卡有效内存带宽设计指标为 133 TB/s,较上一代 AI200 提升 18 倍。搭载 HBC Gen 2 的 AI300,提升 54 倍。

他在台上还提了一个判断:"Tokens per watt replaces flops。" 过去数据中心芯片比的是 flops,即每秒能完成多少次浮点运算,算力越大越好。Pialis 认为新的标准应该是 tokens per watt,即每消耗一瓦电能产出多少个 AI 推理结果(token)。

这组数字还需要产品交付后验证。但开篇提到的 Nadella 和 Zuckerberg 的视频站台,至少说明两家全球最大的 AI 基础设施买家已经在内部完成了技术评估,并愿意在产品量产之前就公开背书。

所以,乘法的第二个乘号,在设计方法论层:低功耗设计从手机端迁移到了数据中心。过去 " 功耗 " 是手机续航的事,现在成了数据中心总拥有成本的事。同一种能力,在新场景里兑现了新价值。

第三个乘号:软件层补上一环

前两个乘号高通早就有。

但芯片不是一种即插即用的东西,而是需要开发侧的软件支持。

如果手机上开发的 AI 应用不能直接跑在汽车或数据中心上,每个产品线有各自的 SDK,开发者生态是断裂的。

而开发者生态恰恰是一条最深的护城河。以经营近 20 年的 CUDA 软件平台,全球数百万 AI 开发者的代码都写在这套体系上,换芯片就意味着重写代码。高通要进数据中心,光有硬件差异化不够,必须给开发者一条迁移路径。

投资者日当天,高通宣布以约 39 亿美元收购 AI 软件公司 Modular。联合创始人兼 CEO Chris Lattner 在编程语言和编译器领域有很高的声誉。他创造了 LLVM(全球主要手机平台和大量数据中心使用的编译器基础设施)和 Apple 的 Swift 编程语言,后来又在 Google 主导构建了 TPU AI 芯片的软件栈。

他对 Modular 的定位是:" 这是首个从设计之初就为了统一边缘和数据中心而构建的软件平台。"

Modular 的 MAX 推理引擎能让开发者写一次代码,从 IoT 芯片到飞龙数据中心服务器都能跑,不需要针对每种芯片重写。联合创始人兼总裁 Tim Davis 说,Modular 在第三方硬件上执行 AI 推理工作负载时速度最高可提升 50%。

Lattner 做了一个类比:" 今天感觉很像当年在 Apple 即将腾飞的时候。" 所以:"Silicon no longer, now it's about solutions。"

同一天宣布的还有与 Hugging Face 的战略合作。Hugging Face 是全球最大的开源 AI 模型社区,拥有 1600 万名开发者和超过 300 万个开放模型。合作的安排是:Hugging Face 的推理和存储服务将映射到高通全线产品,开发者可以通过自动化工具将开源模型直接部署到从手机到数据中心的所有高通平台,不需要针对每种硬件单独适配。Hugging Face 联合创始人兼 CEO Clem Delangue 说,目标是让开放模型在任何地方运行,从手中的设备到数据中心的整机柜。

Modular 提供的是运行时,让代码跨硬件跑通。Hugging Face 提供的是生态入口,1600 万开发者的模型库和部署工具链。双管齐下,软件层逐渐趋近完整。加上去年收购的开源硬件社区 Arduino 及其 3300 万活跃用户,高通在过去一年里沿着开发者生态不断落子,从硬件入口到运行时到模型库,逐层补齐。

如果 Lattner 说的成立,有了统一的软件层,手机和汽车的数十亿设备装机量反过来为数据中心产品提供开发者基础和客户关系,而不是每进一个新市场就从零开始搭建生态。

高通就真从一家按颗数卖芯片的公司变成按平台卖解决方案的公司了。

400 亿背后的算术

高通首席财务官 Akash Palkhiwala 把高通的历史概括为三次转型:从连接公司到计算公司,从手机公司到全边缘设备公司,现在从设备公司到 " 云 + 设备公司 "。非手机业务从 2025 到 2029 年的年复合增长率要达到约 40%,同期每股收益目标超过 18 美元(Non-GAAP),远高于分析师此前预期。

安蒙用了一个概念来描述高通的版图:从毫瓦级到千瓦级的整个计算连续体。比如,2 毫瓦是一颗 IoT 传感器的功耗,200 千瓦是一个数据中心机柜的功耗。高通的赌注是,这个频谱上的每一个节点都能从同一套底层资产中获益。

安蒙把过去几年的做法称为 " 潜艇策略 "。收购 Alphawave、开发 HBC、签约 hyperscaler,这些动作过去几年逐一完成,但每一步单独拿出来都不够构成一个完整故事。只有拼到一起,真实的样子才浮出水面。这或许也解释了为什么华尔街此前的预期偏差这么大:能力不是从零发布的,而是选择了一个时间点集中释放。

另外,高通公司的再定义,在全球所有市场中叠加最密集的地方之一即是中国。

理由很多。比如其一:同一批合作伙伴在多条产品线上同时部署高通平台:荣耀既出搭载骁龙 X 系列的 AI PC,也在手机上用骁龙 8 Elite;零跑的旗舰车型 D19 搭载了双骁龙 8797 中央计算平台,是全球首款将座舱和驾驶融合在同一芯片组上的量产车;小米、Rokid 在 AI 眼镜上部署骁龙 AR1;骁龙数字底盘自 2021 年至今支撑了中国车企超过 300 款在售车型。中国产业链从新平台到量产的压缩周期,让模块复用策略在这里获得了最快的规模验证。

AI 落地速度是其二。安蒙提供了一个判断,终端专为用户操作而设计;而现在,随着智能体的发展,它将主动接管设备的运行,并帮用户执行操作。这一趋势已开始显现,智能体体验的创新也正率先在中国落地。

当然,乘法能不能算通,也要看具体的时间表。高通飞龙 C1000 要 2028 年才量产,HBC Gen 1 要 2027 年中才交付。高通面对的挑战和它描述的机会一样具体。

但安蒙在台上引用了一个预测:2026 到 2030 年全球 token 需求将增长约 40 倍,数据中心电力供应日益成为硬约束。如果趋势确立,那过去 40 年被手机电池倒逼而来的能力,在接下来的 AI 基础设施竞争中或许比过去任何时候都会奏效。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

高通 数据中心 ai 芯片 ceo
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论