钛媒体 03-16
英伟达GTC 2026前瞻!200亿美元“窃壳”Groq:黄仁勋亲手切开推理算力蛋糕
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

GTC 2026 即将开幕,黄仁勋准备掏出的不再是单纯刷新参数的怪兽级 GPU,而是一张价值 200 亿美元的明牌——一款基于 SRAM(静态随机存取存储器)的专用推理芯片。

这标志着英伟达历史上最大规模收购案(吞并 Groq 核心资产)的底层技术正式落地。但这绝不是一次常规的产品迭代,黄仁勋正在亲手打破自己维持了多年的神话:" 一颗通用 GPU 可以包打天下 "。

在笔者看来,这轮架构调整的表象是硬件路线的演进,底层却是英伟达面对科技巨头 " 诸侯割据 " 与监管高压时,极其老辣的防御性进攻。

物理定律写死的 " 算力阶级分化 "

外界有一种极其粗暴的误读,认为英伟达转向 SRAM 是为了 " 抛弃 HBM"。这在半导体的物理规律上根本站不住脚。

标准的 SRAM 单元需要 6 个晶体管(6T)来存储 1 个比特,而 HBM 依赖的 DRAM 只需要 1 个晶体管加 1 个电容(1T1C)。这种先天的物理结构差异,导致 SRAM 的硅片面积是 DRAM 的 5 到 10 倍。这意味着 SRAM 速度极快,但极其昂贵且根本做不出大容量,它装不下动辄数千亿参数的大模型。

英伟达真正的算盘,是搞 "算力的阶级分化"。

过去,无论是炼大模型还是日常的 AI 问答,大家都在抢极其昂贵且缺货的 HBM 和 GPU。但现在,AI 的重心已经彻底滑向了 " 推理(Inference)"。思科等机构的最新预测显示,到 2027 年,高达 75% 的 AI 工作负载将全面转向实时推理。

面对这种不可逆的趋势,英伟达给出了路线图切分:

一边是即将登场的下一代 Vera Rubin 架构,继续把 GPU 和 HBM 的堆料推向极致,死死锁住云厂商的 " 大模型训练 " 底座;

另一边,就是这次基于 Groq 技术推出的 LPU(语言处理单元)。它用片上 SRAM 替代片外存储,彻底干掉数据搬运的延迟,专门用来收割那些对实时性要求极高、单次请求成本极敏感的场景。

规避审查的残酷清场:200 亿美元的 " 窃壳 " 游戏

为什么一向推崇通用计算的英伟达,会突然调转车头搞起专用推理架构?

答案是被逼出来的。

就在近期,业界传出 Meta 计划在 2027 年将部分推理工作负载切给谷歌 TPU。当大模型逐渐走向同质化,推理成本的极致压缩就成了生死线。如果英伟达继续强迫所有客户用 " 杀鸡用牛刀 " 的 GPU 去做低延迟推理,大客户迟早会跑向谷歌、AMD,甚至是以 Groq 为代表的初创公司。

为了掐灭这个苗头,黄仁勋在 2025 年底砸出了 200 亿美元。但最绝的不是金额,而是操盘手法

如果英伟达直接全盘收购 Groq,这笔交易必定会被美国 FTC 和欧盟的反垄断监管机构以 " 垄断 AI 算力 " 为由直接毙掉。因此,英伟达采取了极其狡猾的 " 资产收购 + 技术授权 + 核心团队挖角(Acquihire)" 模式。

他们花 200 亿美元买断了 Groq 的核心专利使用权,并把创始人 Jonathan Ross 连同两百多名核心工程师直接 " 收编 " 进英伟达。而 Groq 这家公司的空壳,在名义上依然作为独立实体存在。

这是一种合法但极其残酷的" 掏空 " 式并购。黄仁勋用 200 亿美元的 " 过路费 ",绕开了反垄断的红线,兵不血刃地干掉了最危险的推理端刺客,顺手接收了 Groq 生态上超过 200 万名开发者。

算力洗牌:裁判下场,没有中间商赚差价

这套 "GPU 主内(训练),SRAM 主外(推理)" 的组合拳一旦打出,整个算力产业链的利润池将面临残酷的重新分配。

首先,HBM 的神话将被祛魅。它依然是训练端不可或缺的皇冠明珠,但那种 " 只要搞 AI 就必须买 HBM" 的非理性繁荣将一去不复返。

其次,留给其他芯片创业公司的单点突破空间被焊死。过去几年,无数初创公司拿着 " 比英伟达推理快 X 倍 " 的 PPT 找融资。如今,当裁判员自己下场推出极致低延迟的专用芯片,并且将其无缝接入英伟达庞大的 CUDA 软件生态栈时,单靠底层架构创新就能撕开一道口子的时代,正式终结了。

当所有人都以为 GTC 2026 将是一场关于 " 算力规模有多大 " 的肌肉秀时,黄仁勋其实不关心 SRAM 和 HBM 谁替代谁,他只关心如何用最密不透风的产品矩阵,把每一分流向 AI 数据中心的钱都截留在自己的口袋里。

这早就不是一场比拼芯片跑分的极客游戏,而是商业帝国捍卫战。(本文首发钛媒体 App, 作者|硅谷 Technews,编辑|宝叔) 

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英伟达 黄仁勋 gpu ai 物理
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论