钛媒体快报 03-19
黄仁勋GTC2025演讲速览:基于新推理软件的DeepSeek-R1 吞吐量提高30倍,官宣下一代超级芯片Vera Rubin
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

钛媒体 App 3 月 19 日消息,在 18 日的英伟达 GTC 2025 大会主题演讲中,英伟达 CEO 黄仁勋再次身穿皮衣登场。演讲要点如下:

1.DeepSeek-R1 推理实现突破,发布开源推理软件 NVIDIA Dynamo。在 GPU 数量相同的情况下,Dynamo 可将 NVIDIA Hopper ™ 平台上运行 Llama 模型的 AI 工厂性能和收益翻倍。在由 GB200 NVL72 机架组成的大型集群上运行 DeepSeek-R1 模型时,NVIDIA Dynamo 的智能推理优化也可将每个 GPU 生成的 token 数量提高 30 倍以上。

2. 官宣下一代超级芯片 Vera Rubin,Vera Rubin 将在 2026 年下半年开始出货时接替 Blackwell Ultra 芯片。Vera CPU 的内存是 Grace 的 4.2 倍,内存带宽是 Grace 的 2.4 倍。结合 Vera 的 88 个 CPU 内核,英伟达称该芯片的整体性能将是前一代产品的两倍。

3. 英伟达 Grace Blackwell 解决方案已全面投产。Grace Blackwell 系列包括多个产品,如 GB200 和 B200,这些产品采用台积电 4nm 工艺制造,拥有高达 2080 亿个晶体管。黄仁勋还展示了使用 Grace Blackwell 的各厂商数据中心机架,可以看到包括联想、戴尔、微软、亚马逊 AWS、Meta、谷歌等。

4. 发布 DGX Spark 和 DGX Station 两款个人 AI 计算机。DGX 个人 AI 超级计算机由 Grace Blackwell 支持。开发 DGX Spark 和 DGX Station 的全球系统制造商包括华硕、戴尔、惠普和联想。华硕、BOXX、戴尔、惠普、Lambda 和 Supermicro 等制造合作伙伴预计将在今年晚些时候推出 DGX Station。

5. 再下一代 AI 芯片架构命名 Feynman,2028 年登场。黄仁勋在一个路线图 PPT 中宣布,Rubin 之后的下一代命名 Feynman,取自著名物理学家理查德 · 费曼,其以对量子力学的路径积分表述、量子电动力学、过冷液氦的超流性以及粒子物理学中部分子模型的研究闻名于世。根据英伟达路线图,Feynman 架构将于 2028 年登场。

5. 首提 Agentic AI,后续是机器人 Physical AI。黄仁勋演讲提到 AI 发展的未来,现在我们处于生成式 AI(Generative AI)阶段,但根据黄仁勋的路线图,我们将迈向一个代理式 AI(Agentic AI)时代,随后是物理 AI(Physical AI)——机器人登场的时候。

6. 英伟达正与电信公司合作开发 AI 原生 6G 无线网络。英伟达表示正与 T-Mobile、MITRE、思科、ODC 和 Booz Allen Hamilton 合作开发 AI 原生 6G 无线网络的硬件、软件和架构。

7. 英伟达、谷歌与迪士尼合作研发的机器人 Blue 亮相,该机器人配有英伟达最新的 GR00T N1 机器人通用基础模型。

8. 美国四大公有云供应商今年已购买 360 万块 Blackwell AI 芯片。黄仁勋表示,美国四大公有云供应商(亚马逊、微软、Alphabet Inc. 旗下谷歌和甲骨文)去年购买了 130 万块英伟达老一代的 Hopper AI 芯片。他表示,2025 年迄今,这一阵营已购买 360 万块 Blackwell AI 芯片。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

黄仁勋 芯片 ai 英伟达 戴尔
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论