量子位 06-03
意外,老黄剧透下一代GPU芯片,新演讲又把摩尔定律按在地上摩擦
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

刚刚,中国台湾大学体育场,欢呼阵阵如同演唱会,但这次 " 摇滚巨星 ",其实是英伟达创始人黄仁勋,再次回到学校,带来 Computex 重磅演讲,以及英伟达的新一代 GPU。

是的,英伟达新架构 Blackwell 宣布不过 3 个月,老黄就把后三代路线图全公开了:

2025 年 Blackwell Ultra,2026 年新架构 Rubin,2027 年 Rubin Ultra。

好好好,像做 iPhone 一样造芯片。

到这一代 Blackwell 为止,英伟达已经把 AI 模型有效扩展到万亿参数。(还给 token 定了个译名:词元)。

1.8 万亿参数 GPT4 的训练能耗,8 年降低至原来的 1/350。推理能耗,8 年降低至原来的 1/45000。

看着这一波亮相和剧透,网友真相了:英伟达没有竞争对手,而是选择将摩尔定律放在地上摩擦……

老黄是在书写自己的定律。

所以应该叫老黄定律?还是英伟达定律?

ComputeX 前夜,老黄一开场就展开了一波隐形卖货,他自称不太准确的 "CEO 数学 ":

买得越多,省得越多…… The more you buy, the more you save.

经典语录依然引发现场欢呼大笑:虽然不太准确,但好像有些道理……

除此之外,还有一些新产品亮相,包括能够模拟气冲的天气预测模型 CorriDiff、数字人微服务、BlackWell 系统、Spectrum-X、机器人平台 Isaac ……

好了话不多说,这就来看看老黄这次到底搞了哪些事情

"AI Factory Is generating"

谈到当前新的产业革命,老黄表示:新的计算时代正在开始;而 AI Factory 正在诞生。

他在现场展示了 BlackWell 系统。

3 月份 GTC 大会上还遮遮掩掩地说是 GPT-MoE-1.8T 模型,这下彻底摊牌了:GPT-4 参数就是 1.8T。

跟 DGX Hopper 相比。

现场还看到了它的真身,大概有两米那么高吧…

而真正的 AI Factory 大概会长这样,大概有 32000GPU。

AI 加速每个应用程序

AI 对于企业的影响,老黄认为 AI 加速每一个应用程序。他首先谈到了 NIM 推理微服务,这是一个帮助开发者或者企业轻松构建 AI 应用,简化大模型部署程序。

不管是聊天机器人、还是生活 / 驾驶助手等,部署时间都能从几周缩短到几分钟。

运行 Meta Llama 3-8B 的 NIM 可以产生比不使用 NIM 多 3 倍的 tokens。

企业和开发者可以使用 NIM 运行生成文本、图像、视频、语音和数字人类的应用程序。

而背后源于丰富的技术合作生态——

近 200 家技术合作伙伴,包括 Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI 和 Synopsys 等,正在将 NIM 集成到他们的平台中。

此次在这个 NIM 中还有上新,也就是 ACE 生成式 AI 微服务,数字人 AI 技术套件。

除了原有自动语音识别、文本到语音的转换和翻译、Nemotron 语言模型、 Audio2Face 等套件,还增加了两个技术:

一个是可以基于音轨生成身体姿势 Audio2Gesture;

一个 Nemotron-3 4.5B,这是英伟达首款 SLM(小爱语言模型),专为低延迟端侧设备而生。

∂接下来,这一数字人微服务将部署在一亿台 RTX AI PC 上面。

当前英伟达在新的合作伙伴,比如华硕、MSI 的加入下,已经拥有超过 200 种 RTX AI PC 型号。

还推出了 RTX AI Toolkit,一个工具和 SDK 集合,帮助 Windows 开发者定制优化本地部署模型。

同 Mac 相比,部署了 RTX 的 Windows 的 Stable Diffusion 推理速度是 Mac 的 7 倍。

每一台带有 RTX 的 PC,都是一台 RTX AIPC。

用于机器人开发的技术平台 Isaac

这次一同亮相的,还有用于机器人开发的技术平台,NVIDIA Isaac

为啥搞这玩意儿呢,老黄给出的理由是这样的:

机器人时代已经到来。有朝一日,所有会移动的东西,都将实现自主化。

这个 Isaac 平台具体长啥样呢?

Isaac 平台提供一系列英伟达加速库、AI 基础模型和仿真技术,供机器人制造商集成到自己的技术栈中。

注意,平台是模块化的,允许公司单独或一起采用多种技术。

具体而言,其中包括:

NVIDIA Isaac ROS:一系列模块化的 ROS 2 包,为 ROS 社区开发者带来 NVIDIA 加速和 AI 模型

NVIDIA Isaac Perceptor:一个参考工作流程,提供基于 AI 的自主移动机器人的多摄像头 3D 环视能力

NVIDIA Isaac Manipulator:一个简化 AI 启用机械臂开发的参考工作流程

NVIDIA Isaac Sim:一款参考应用程序,用于在基于 NVIDIA Omniverse 平台的物理环境中模拟、测试和验证机器人,并生成合成数据

NVIDIA Isaac Lab:Isaac Sim 中的参考应用程序,针对 AI 机器人基础模型训练的强化、模仿和迁移学习进行了优化

据介绍,目前,包括比亚迪电子、西门子、泰瑞达机器人和 Intrinsic(Alphabet 的子公司)在内,全球超多名列前茅的机器人开发团队,都在采用 Isaac 平台。

这些团队用上 Isaac,一边提高制造工厂、仓库和配送中心的效率,同时确保人类同事的安全;一边也能充当重复劳动和超精确任务的执行者。

现场放出了很多 demo,很多工厂在英伟达 Omniverse 里建造了一个完全模拟现实的自助工厂,以及基于 Isaac 平台开发的 AI 机器人。

官网悄悄推出游戏 Agent 助手

除了现场老黄亲自发布的上述内容外,我们在英伟达官网还找到了一个彩蛋,一个巨久远的 call back。

Project G-Assist

时间回到 2017 年愚人节,英伟达官网开了个大玩笑:

宣称自家发布了一款支持 10080 款游戏的 USB 人工智能超算卡GeForce GTX G-Assist

重点在于它很 AI。

GeForce GTX G-Assist 像是个 AI 游戏助手,可以帮助玩家自动完成游戏操作,甚至代打击败 Boss。

今天,英伟达真的将这个愚人节玩笑变为现实——

英伟达官网上线 Project G-Assist,一套工具和模型的集合而成的 AI Agent 系统,供游戏和应用程序开发者使用。

通过前后剧情,Project G-Assist 利用大模型对游戏输出响应,能够检查游戏性能和系统设置,建议用户优化以充分利用可用硬件,或者适当升级角色。

玩家这边呢,还可以通过 Project G-Assist 找到最好的武器,也可以查询到最牛的攻略,然后就可以或制作武器材料,或一路杀怪通关。

总而言之,Project G-Assist 可以让人有个 Agent 外挂,但是不会让你完全挂机,

官网还贴心表示:

G-Assist 项目不会像我们在 2017 年愚人节预言视频中那样完全替代您玩游戏,但它可以帮助您从您最喜欢的游戏中获得更多收益。

游戏体验再上大分!

据介绍,Project G-Assist 支持各种模态的输入。

可以是来自玩家的文本提示,或声音指令;可以是屏幕上显示框架的上下文;可以是来自应用程序或系统本身的 API。

演示人员语音输入中

这些数据都通过连接了游戏知识数据库的大模型处理,然后使用 RAG(检索增强生成)生成和用户相关的查询结果——没错,Project G-Assist 允许玩家使用 PC 或云端 RTX AI 驱动的知识库。

Project G-Assist 开发工具将出现在即将推出的 RTX AI 开发套件中,具体会用在哪些游戏上,还需要游戏开发商来决定并提供支持。

为了让大家更好地使用 Project G-Assist,英伟达贴心地附上视频教学大礼包,需要可自取。

One More Thing

整场发布会,老黄还整了不少活儿。

比如 AI 老黄似乎已经成了发布会常客。

在介绍天气预测模型时,他坦白承认在视频中那么流利讲普通话的那位是 AI 生成的,因为自己中文不太好。

而本场重磅的 BlackWell 系统、AI Factory 的核心构成,也被他各种搬来搬去……

除了下一代 GPU 取名 Rubin,我们还看到 Vera CPU,他们共同出现在新的 Vera Rubin 加速器上。而这一名称来源,实际上是来自美国一位女天文学家 Vera Rubin,她是研究暗物质先驱。

以及,COMPUTEX 2024 不愧是 6 月开头就炸场的 AI 终端大戏。

除了黄院士外,英特尔、AMD、高通等老板都悉数到场,接下来几天会挨个发表演讲。

这些主题演讲,绝大部分都跟 AIPC 有关。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

英伟达 ai 芯片 摩尔定律 准确
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论