富国银行最新研报给市场递了个风:亚马逊 AWS 可能加深与高通的 AI 芯片合作,将 AI200 这类新一代推理芯片纳入采购清单。如果成真,这将是 AWS 在降低推理成本战略上的一步关键落子。
AWS 的算账逻辑很明确。随着生成式 AI 推理请求暴增,芯片成本与功耗直接吃掉利润。报告指出,AWS 的方向就是靠自研或第三方定制芯片,把单次推理的成本压到更低,以拉升运营利润率。这时候,高通的 AI200 芯片恰好踩在节拍上。

这颗 2025 年 10 月发布的 AI200,单颗最高支持 768GB 超大内存,专门配套了机架级 AI 推理方案,面向大型语言模型、多模态模型等重型工作负载。大内存设计让芯片能直接处理更大的模型分片,减少数据传输开销,这正是推理场景里省钱的关键。
富国银行分析认为,随着 AI200 在 2026 年扩大部署,AWS 很有可能成为高通最重要的超大规模云端客户。底气之一来自前代产品 AI100 Ultra 的试水成绩——该芯片已在 AWS 上提供服务,且与竞品相比展现出 " 相对强劲 " 的性价比。这个铺垫让高通更有筹码去谈更深的合作。
但研报终究是研报,不等于合同。AWS 自家的 Trainium 和 Inferentia 芯片同样在疯狂迭代,内外芯片之间怎样分工、会不会产生内耗,都是未知数。况且 AI200 要到 2026 年才规模化部署,中间变数不少。高通想靠一颗 768GB 内存芯片啃下 AWS 的推理大单,还得看实际性能与交付能力能不能打。


登录后才可以发布评论哦
打开小程序可以发布评论哦