2025 年 12 月 1 日至 12 月 4 日,AWS 在拉斯维加斯举行了一年一度的 re:Invent。

在这次活动期间,AWS 方面将绝大多数时间都用在了介绍他们新的 AI 智能体服务上。相比之下,用于讲述新一代基础设施、特别是芯片相关话题的篇幅明显就少了很多。

但相比 " 专业向 " 的各种云计算和智能体相关业务,今年 AWS 的新芯片依旧给我们留下了深刻的印象。在此前的相关内容里,我们三易生活已经详细解读了 Graviton 5、Trainium 4 等最新款 AWS 自研芯片的性能指标。
不过除了单纯的性能之外,在详细剖析 AWS 的这些自研芯片、参观 re:Invent 2025 的展区,并与 AWS 方面相关人士进行了深入的沟通后,我们认为还有必要来聊聊 AWS 的 " 芯片观 "。
自研的意义是什么?不是荣誉而是责任
纵观 AWS 目前的整个自研芯片产品线,它们基本可以分为三个类别,即通用处理器 Graviton、AI 训练芯片 Trainium,以及网络、存储和虚拟化加速系统 Nitro。

为什么是这三个类别?关于这一点,AWS 过去其实也有过多次表述。简单总结一下,就是他们一开始觉得早期的数据库网络架构不合理,于是就自己设计了一套新的芯片来改善性能;后来觉得外部处理器和 AI 加速器性价比不高,所以干脆也自己研发了对应的方案。

毫无疑问," 务实 " 就是 AWS 在自研芯片业务上最为显著的特征。一方面,日前我们与 AWS 副总裁暨杰出工程师 Ali Saidi 进行了深入的沟通,并在《再次自研新处理器,AWS 的硬件思路有些与众不同》中提及,AWS 对于和 ARM 的长期合作毫不 " 避讳 "。因为在他们的认知中,纠结处理器 IP 是否 " 自研 " 并无意义,能够让芯片更好地服务于客户需求,让客户少花钱、多办事,它才更有价值。
另一方面,AWS 高级副总裁 Peter Desantis 在他的演讲中更是明确提及,AWS 从不会在研发芯片时考虑 " 跑分好看 " 这样的因素,因为他们一切的芯片设计都只为改善具体的业务需求。

比如在最新的 Graviton 5 通用处理器上可以看到,它单颗芯片将核心数量提高到了 192 核,同时缓存达到了前代的 5 倍。AWS 为什么要把处理器的规模造这么 " 大 " 呢?根据官方给出的理由,这主要是为了让客户在部署大规模算力时,尽可能地减少跨处理器的数据传输场景。这样一来,一是可以用更少的机架提供更高的性能,从而降低系统的总功耗;其次也意味着核间延迟大幅下降,更适合对 DPC 敏感的计算需求。

除此之外,Peter Desantis 还提到了 " 自研芯片 " 一个有趣的优势。他指出,传统的第三方处理器通常会在硅晶片上额外覆盖一层金属顶盖,这不只是为了保护处理器,同时也是为了改善处理器的 " 卖相 "。但这就意味着这些处理器的热量实际上变得不易散出,既增加了散热消耗、还会降低性能。

相比之下,AWS 的自研芯片从一开始就是 " 自产自用 ",既然不需要考虑外销,自然也就可以大胆地采用 " 开盖 " 设计。当然,有些朋友可能会觉得,这样的处理器 " 造型不好看 ",但如果你这么想,很显然是没能真正意识到 AWS 芯片 " 自产自用 " 的意义。
正是因为有自研的底气,所以才能更加开放包容
相比来自第三方供应商的处理器实例,AWS 自研的 Graviton、Trainium 能够提供低得多的算力价格。所以它们确实就受到了大量客户的欢迎。特别是在模型训练方面,目前 AWS 几乎有一半的训练负载都是运行在自研的 Trainium 设备上。

但不难发现,在 re:Invent 2025 期间,AWS 同样接连发布了基于新款 AMD 处理器、英特尔处理器、英伟达计算卡,甚至是苹果 M 系列芯片的多款实例。

这是为什么呢?一方面,在发布这些新的实例时,AWS 方面并不避讳介绍它们(在某些特定方面)相比于 Graviton 的实例,依然会有性能优势。也就是说,尽管 " 性价比 " 已经是 AWS 最为知名的优势之一,但这并不意味着他们就会因此忽视那些更追求高频率,追求特定架构或指令集客户的需求。

而且关于 AWS 未来的算力业务,此次活动中还有两个特别小的细节值得关注。一是 AWS 已经明确预告,下一代的 Trainium 芯片将支持 NVLink 通信,或将支持与英伟达算力卡组成 " 协同架构 "。二是 AMD 今年将他们的 MI350 加速器也带到了 re:Invent 2025 的展示环节。经过我们三易生活在现场的确认,AWS 方面确实正打算引入更多厂商的 AI 算力方案。
换句话说,就算 AWS 的自研处理器很强大、性价比又很高,但他们绝不会强迫客户 " 只能用我们的自研芯片 "。相反,充分尊重和满足客户的多样性需求,反而更能让人体会到他们在自研芯片已经足够强大之后,才有的那种从容。
尊重市场、尊重客观规律,客户才会尊重你
说到 " 自研芯片 " 的生态建设,目前业内有两种截然不同的思路。其中一种认为,那些先行者已经有了太多年的技术和口碑积累、在软件生态上已经形成了巨大的技术壁垒。所以新入局者要想有所突破,就应该不按照前人的经验,做一套与竞争对手完全互不兼容的生态。因为只有这样,才能避免陷入 " 总是追赶 " 的窘境。而且只要生态不兼容,自然也就变得无法被直接(拿来和竞争对手)进行比较,在市场宣传上也能占到一些便宜。

但从我们三易生活与 AWS 相关团队的沟通结果来看,AWS 方面显然并不同意这样的做法。用他们的话来说,他们不可能去要求开发者、要求客户为了他们的自研芯片,就放弃过去的编程习惯,或者是放弃对那些先行者竞品芯片的兼容性。
在这样的前提下,是不是就意味着 AWS 的自研芯片就永远都追不上先行者了呢?从目前的市场表现来看,答案显然是否定的。AWS 不仅 " 追了上来 ",而且得到了越来越多客户以及软件生态的认可。

AWS 的诀窍是什么?其实我们在前面已经说到。一是比强大的竞争对手更加尊重客户。因为竞品的芯片或许总体性能很强,但当面对具体的某个使用场景时,未必就一定是 " 完全无法超越 "。AWS 靠的就是他们庞大的客户群体,通过在芯片设计阶段就瞄准了具体的客户需求,放弃那些 " 单纯为了好看 "、" 单纯对跑分有利 " 的指标,造出更贴近实际需求的芯片。

另一点则更加朴素,那就是更有诚意的价格。的确,某些竞争对手的硬件或许非常强大,但那些 " 大而全 " 的产品往往也就意味着难以降低的整体成本。相比之下,AWS 一直坚持自研芯片业务的低价格策略。这不只是令他们在早期芯片性能不那么有竞争力的阶段成功 " 挺了过来 ",而且也使得 AWS 的芯片近年越来越显现出被行业所认可的规模和口碑优势。


登录后才可以发布评论哦
打开小程序可以发布评论哦