创业邦-原创 03-19
英伟达地表最强,黄教主被称作AI界“霉霉”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

来源丨创业邦(ID:ichuangyebang)

作者丨 Juny

编辑丨海腰

图源丨英伟达官方

好久没有一场大会让整个科技界都如此躁动。

今天早间,在位于硅谷 San Jose 的麦克内里会议中心,英伟达 2024 GTC 大会标识已被高高挂起,并在下方悬挂着一行醒目的大字:" 一场属于人工智能时代的盛会(The Conference for the era of AI)"。

时隔 5 年之后,英伟达的年度 GTC 大会再次回归线下。5 年前,以硬件和技术讨论著称的 GTC 在一众硅谷科技公司的年度大会中还略显边缘与小众,但随着过去一年生成式 AI 站上 C 位,硬核 GTC 和皮衣黄仁勋当下无疑已经成为了整个硅谷的焦点。

美西时间下午 1 点,黄仁勋穿着他标志性的黑皮衣正式登场,面对着座无虚席的万人会场,他说道:" 希望你们能意识到这并不是一场演唱会,而是一个开发者技术大会。" 但在接下来长达 2 个多小时的开幕演讲中,伴随着英伟达所丢出的一个接一个的炸裂的产品和各种彩蛋,站在舞台中央的黄仁勋却俨然成为了 AI 时代里那个最摇滚的明星。

" 我宣布,黄仁勋就是我们 AI 界的 Taylor Swift。" 一位人工智能粉丝会后如是说。

地表最强芯片亮相

过去几年,英伟达曾在 GTC 上推出了基于 Hopper 架构的多款重磅明星产品,目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练,行业内 " 一芯难求 " 的局面迟迟得不到缓解。而今年,按照英伟达每两年更新一次 GPU 架构的节奏,大家都对英伟达新一代计算平台翘首以盼。

站在舞台中央,黄仁勋说:" 我们已经来到了一个临界点,因此需要一种新的计算方式来加速整个行业的发展效率。那么英伟达能够做什么?当然,答案就是——更大的芯片。" 接着,英伟达新一代图形计算平台 Blackwell 正式登场,它被英伟达称为   "新工业革命的引擎"。

采用全新 Blackwell 架构的 B200 和 GB200 系列芯片正式到来。

Blackwell 以第一位入选美国国家科学院的黑人学者、数学家 David Harold Blackwell 的名字命名,它将允许客户能够在万亿参数大型语言模型上构建和运行实时生成人工智能。

Blackwell 平台,图源:英伟达官方 Keynote

Blackwell 平台引入了六项开创性技术来支持高达 10 万亿参数的 AI 模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说,它就是 " 当今世界上最强大的芯片 "。这六项技术分别为:

更大芯片:Blackwell 架构 GPU 拥有 2080 亿个晶体管,尺寸是 Hopper(800 亿晶体管)的两倍多。Blackwell B200 不是传统的单一 GPU,而是由两个紧密耦合的芯片组成,这两个芯片通过 10 TB/ 秒的芯片到芯片链路连接成了一个统一的 GPU 。

第二代 Transformer 引擎:配备了新的微张量缩放支持和先进的动态范围管理算法,通过创新的 4 位浮点 AI 推理功能使计算和模型大小加倍。

第五代 NVLink 网络技术:最新的 NVLink 迭代增强了数万亿参数 AI 模型的性能,为每个 GPU 提供了高达 1.8TB/s 的双向吞吐量,确保当今最复杂的大语言模型能在多达 576 个 GPU 之间实现无缝高速通信。

RAS 引擎:Blackwell 驱动的 GPU 集成了专用引擎和基于人工智能的预防性维护功能,可确保可靠性、可用性和可维护性,从而最大限度地延长系统运行时间并最大限度地降低运营成本。

安全人工智能:全新的机密计算功能可在不影响性能的情况下保护人工智能模型和客户数据,并支持新的本机接口加密协议,在传输过程中、静止状态和计算时都能保证安全。

解压缩引擎:通过支持最新格式加速数据库查询,增强数据分析和数据科学性能,彻底改变数据处理。

英伟达表示,此前训练一个 1.8 万亿参数模型需要用到 8000 个 Hopper GPU 和 15 兆瓦的功率。而如今,同样的训练量 2000 个 Blackwell GPU 就可以做到,功耗仅为 4 兆瓦。

左为 Blackwell,右为 Hopper 图源:英伟达

基于 Blackwell,此次英伟达还推出了其 AI 超级芯片 GB2000。GB2000 由两个 B200 Blackwell GPU 和一个基于 Arm 的 Grace CPU 组成,可以为大语言模型推理工作负载提供 30 倍的性能,而成本能耗要比其 " 前辈 " Hopper 低 25 倍。在具有 1750 亿个参数的 GPT-3 LLM 基准测试中,GB200 的性能是 H100 的 7 倍,训练速度是 H100 的 4 倍。

GB200 还将成为英伟达全新大型机架系统 GB200 NVL72 的基石。该系统拥有 72 个 Blackwell GPU 和 36 个 Grace GPU,拥有 1.4 exaflops 的 AI 性能和 30TB 的快速内存。英伟达表示,该系统可以部署 27 万亿参数的模型,而目前最大的模型 GPT-4 仅约有 1.7 万亿个参数,因此能够加快释放生成式 AI 的能力。此外,GB200 还将上线 Nvidia DGX Cloud,这是一个与领先的云服务提供商共同设计的 AI 平台,让企业开发人员能够专门访问构建和部署高级生成 AI 模型所需的基础设施和软件。

英伟达表示,目前亚马逊、谷歌、微软和甲骨文等都已经成为了 NVL72 机架的首批采购和服务提供商,其中亚马逊将构建一个包含 20000 个 GB200 芯片的服务器集群。思科、戴尔、惠普、联想和超微电脑等大量企业也都已经把提供基于 Blackwell 产品的各种服务提上了日程。英伟达表示,新芯片预计将于今年晚些时候上市,但目前还并没有公布 Blackwell 的相关售价信息。

大型机架系统 GB200 NVL72

软件服务硬件

Omniverse 牵手苹果 Vision   Pro

除了硬件之外,软件升级也成为近年来 GTC 必不可少的一个内容。此次,英伟达推出了一项全新的推理管理器服务   ( NIM ) ,该服务的目标是通过一种交付快速推理模型的新方法来加速和优化生成式 AI 大语言模型的部署,成为英伟达 " 软件服务硬件 " 战略的又一关键举措。

NIM 技术将优化的推理引擎、行业标准 API 和对人工智能模型的支持打包到容器中,以便于部署。该容器可以包含任何类型的模型,从开放模型到专有模型,都可以在有 Nvidia GPU 的任何地方运行。NIM 另一强大用例还在于,除了提供预构建模型,它还允许企业使用自己的专有数据,并将支持和帮助加速检索增强生成 ( RAG ) 部署。

NIM,图源:英伟达

此外,令人印象深刻的还有英伟达 Omniverse 与苹果 Vision Pro 的 " 强强联合 "。

NVIDIA Omniverse 是英伟达在 2021 年发布的一个开放平台,专为虚拟协作和实时逼真模拟而构建。它能够互联整个 3D 工作流程,将线性流程替换为实时同步创建,无论是企业还是个人创作者,都能够将创意和产品在虚拟世界中进行协作迭代。

在今天的 GTC 上,英伟达宣布,企业级数字孪生和沉浸式内容创建中心 Omniverse 将在 Apple Vision Pro 上首次亮相。通过英伟达 Omniverse 的云 API 和图形交付网络 ( GDN ) ,企业现在将可以轻松将 3D 应用的 OpenUSD(交互式通用场景描述)实时串流到 Vision Pro 混合头显中。

那么,这个过程究竟是什么样的呢?英伟达给观众做了一个实例演示。一名设计师佩戴着 Vision Pro,在 Omniverse 平台上开发的应用程序内进行汽车工业设计,当他切换油漆、内饰时 Vision Pro 的三维环境实时渲染并跟物理世界融为一体。

图源:英伟达

这种基于 Omniverse 的新工作流程将 Apple Vision Pro 突破性的高分辨率显示器与英伟达强大的 RTX 云渲染相结合,只需设备和互联网连接即可提供空间计算体验。通过利用云软件和硬件组件的框架,英伟达还能确保企业客户可以在 Vision Pro 设备上利用数字孪生,而不会损失显示或帧率质量。

这意味着设计人员可以更加值得信赖方式与进行混合现实交互,为空间计算开辟了更大的想象空间。英伟达表示,对于开发人员和独立软件供应商,他们也正在构建更多功能使他们能够使用 Vision Pro 与应用程序中的现有数据无缝交互。

下一个变革:机器人

在大会的最后部分,一众机器人的登场也再次引发了一次小高潮。很显然,英伟达当前另一个工作重点,就是要继续推动智能人形机器人更快地走入人们的日常生活。

站在一排机器人的中间,黄仁勋宣布了英伟达全新的 Project GROOT 人工智能基础模型的到来。该基础模型是一个经过大量数据训练的人工智能系统,能够用于生成句子、视频、图像等各种任务。英伟达表示,GR00T 项目将帮助人形机器人 " 通过观察人类行为来理解自然语言并模仿动作。快速学习协调性、灵活性和其他技能,以便更好地适应现实世界并与现实世界互动。"

作为 Isaac 机器人平台的一部分,英伟达此次还发布了 Isaac Manipulator 和 Isaac Perceptor。Isaac Manipulator 是一系列专为机械臂设计的基础模型,而 Issac Perceptor 则旨在为承担制造和履行角色的机器人提供多摄像头、3D 环绕的视觉功能。此外,英伟达还推出了一款名为 Thor 的芯片系统,将作为人形机器人的大脑。

英伟达表示,目前他们已经与机器人领域的一些知名企业合作,包括波士顿动力公司、1X Technologies、Agility Robotics、Apptronik 和 Figure AI 等。

从性能炸裂的全新超级芯片到软件、行业应用和机器人模型,用 "AI 春晚 " 来形容今年的 GTC 毫不夸张。

在接下来为期 4 天的 GTC 会议中,将有超过 16000 人、1000 多家企业线下参会,举办超过 900 场会议。包括航空航天、云服务、金融服务、医疗、制造、零售等各行业在内的 300 多家参展企业都将在 GTC 展示部署英伟达平台所带来的重大应用突破,其规模和影响力均达到了自 2009 年 GTC 开办以来的历史之最。

不仅如此,在本届 GTC 上,我们还能看到作为 AI" 军火商 " 的英伟达一呼百应的强大业内号召力。尽管在模型和产品上激战正酣,谷歌、OpenAI 、Meta、xAI 等巨头全都纷纷搁置争议共赴盛会,而提出 Transformer 架构的所有八位作者此次也被罕见集齐。

一场关于 AI 的狂欢盛会才刚刚拉开帷幕。

本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系 editor@cyzone.cn。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

英伟达 ai 人工智能 黄仁勋 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论