闪存猎手 21小时前
高通AI200芯片或搭上AWS,768GB内存专打推理成本
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

富国银行最新研报给市场递了个风:亚马逊 AWS 可能加深与高通的 AI 芯片合作,将 AI200 这类新一代推理芯片纳入采购清单。如果成真,这将是 AWS 在降低推理成本战略上的一步关键落子。

AWS 的算账逻辑很明确。随着生成式 AI 推理请求暴增,芯片成本与功耗直接吃掉利润。报告指出,AWS 的方向就是靠自研或第三方定制芯片,把单次推理的成本压到更低,以拉升运营利润率。这时候,高通的 AI200 芯片恰好踩在节拍上。

这颗 2025 年 10 月发布的 AI200,单颗最高支持 768GB 超大内存,专门配套了机架级 AI 推理方案,面向大型语言模型、多模态模型等重型工作负载。大内存设计让芯片能直接处理更大的模型分片,减少数据传输开销,这正是推理场景里省钱的关键。

富国银行分析认为,随着 AI200 在 2026 年扩大部署,AWS 很有可能成为高通最重要的超大规模云端客户。底气之一来自前代产品 AI100 Ultra 的试水成绩——该芯片已在 AWS 上提供服务,且与竞品相比展现出 " 相对强劲 " 的性价比。这个铺垫让高通更有筹码去谈更深的合作。

但研报终究是研报,不等于合同。AWS 自家的 Trainium 和 Inferentia 芯片同样在疯狂迭代,内外芯片之间怎样分工、会不会产生内耗,都是未知数。况且 AI200 要到 2026 年才规模化部署,中间变数不少。高通想靠一颗 768GB 内存芯片啃下 AWS 的推理大单,还得看实际性能与交付能力能不能打。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

高通 亚马逊 芯片 aws 富国银行
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论