当地时间周一,备受瞩目的英伟达年度 GTC 开发者大会即将在美国加州圣何塞拉开帷幕,CEO 黄仁勋的主题演讲历来被视为 AI 产业的重要风向标。
对投资者而言,本届大会最值得关注的,是英伟达战略重心的从训练向推理的变化以及其供应链布局的调整。
综合 The Information 和 The Deep View 等媒体信息,本次 GTC 或将释放三大关键信号:
第一,英伟达可能借助整合 Groq 技术大举切入 AI 推理市场;
第二,芯片代工环节短期内或从台积电部分转向三星;
第三,机器人物理 AI 及开源模型生态有望进一步扩展。
发力推理市场,Groq 芯片成关键抓手
当前 AI 产业正从 " 训练优先 " 逐步转向 " 推理驱动 "。在训练领域,英伟达凭借 GPU 建立起牢固的技术与生态优势;但在推理市场,Cerebras 等竞争者正以更高速度、更低成本的方案争夺份额。
在这一背景下,市场高度关注英伟达的应对策略。据 The Information,黄仁勋预计将在大会上宣布一套融合英伟达与 Groq 技术的新型芯片系统。其背后,是英伟达在去年底斥资约 200 亿美元获得 Groq 技术许可。
Groq 开发的芯片被称为 LPU(Language Processing Unit),专门针对推理工作负载进行优化。这也将是英伟达首次将另一家公司的 AI 处理器直接整合进其服务器机架体系。
供应链重构与首批大客户落定
新系统的制造与商业落地,同样是资本市场关注的焦点。
据 The Information,Groq LPU 预计将在今年下半年由三星代工生产。这一安排意义重大,因为这可能成为英伟达服务器芯片首次由台积电以外的代工厂制造,从而打破其长期依赖单一供应商的格局。
不过,据上述媒体援引知情人士透露,这一变化或主要是阶段性的。由于下一代 LPU 需要与英伟达未来 AI 芯片更紧密整合,后续生产仍可能回归台积电。
在需求端,英伟达预计将宣布 OpenAI 成为该系统的首批客户之一。这一芯片系统可能被用于驱动 AI 代理执行编码等任务。
底层架构变化与未来技术路线
对关注芯片技术的投资者而言,英伟达 -Groq 系统的架构设计也透露出潜在的整合挑战与机会。
据 The Information,新机架结构将与现有系统明显不同:每个机架将搭载 256 颗 Groq 芯片。同时,Intel 处理器将在系统中负责通信管理。这一设计也暗示,英伟达现有架构尚未与 LPU 完全融合。
不过,英伟达显然有更长远的计划。据 The Information,两名参与开发的知情人士透露,公司内部正在探索将 LPU 更深层整合进未来产品路线图。其中一个方案,是将 Groq 处理器与下一代 Feynman GPU(Rubin 架构后继产品)融合为单芯片,以提升性能并降低整体成本。
物理 AI 与开源模型生态扩展
除了算力基础设施,AI 应用生态同样是 GTC 大会的重要看点。
随着 "AI 摩尔定律 " 持续推进——算力效率约每四个月翻倍——英伟达在机器人和物理 AI 领域的布局备受关注。尤其是在中国人形机器人产业加速发展的背景下,英伟达及其合作伙伴能否在自动驾驶等场景中提供更具成本优势的解决方案,将成为市场关注焦点。
与此同时,英伟达在开源模型领域也在快速推进。此前公司已发布 1200 亿参数的 Nemotron 3 Super 模型,并表示将推出参数规模扩大四倍的 Nemotron 4 Ultra。模型能力的提升,有望进一步降低企业 AI 推理成本,并改善整体投资回报率。
本届 GTC 释放的信号,或将在很大程度上影响 2026 年 AI 产业格局。


登录后才可以发布评论哦
打开小程序可以发布评论哦