硅星人 6小时前
40 年来第一次:PC 被 NVIDIA 和微软重新发明了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

2026 年 6 月 1 日,黄仁勋(Jensen Huang)在 NVIDIA GTC Taipei 2026 主题演讲,同步连线全台 70 个分会场,并为 Computex 揭幕。在这场近 2 小时的演讲里,他抛出了一个足以改写整个消费电子格局的判断——"40 年来 PC 的第一次重新发明,由 NVIDIA 和 Microsoft 联手完成。"

这是本场大会真正的核心亮点:NVIDIA 要造 PC 了,而且不是配角,是主角。 黄仁勋的逻辑链很清晰:既然未来十年的统一计算模式是 Agent(模型 + Harness + 工具 + Runtime),那么 Agent 不仅要跑在云端,也必须原生跑在每个人的 PC 上——能 7×24 小时不间断、本地沙箱化、连接本地或云端模型、看得见你、听得懂你、替你干活。为此,PC 的芯片和操作系统都得重做。

黄仁勋亲口透露,NVIDIA 和 Microsoft 用了整整三年时间,从零重构 PC 的运作方式,就为了等这个 Agent 时刻。

他类比 40 年前 Windows 之所以让 PC 走进千家万户,是因为做对了几件事:BIOS 抽象、开放芯片组、运行时可加载驱动、多媒体 API 抽象层。今天 Microsoft 和 NVIDIA 要再做一次同样的事:新一代 PC = 旧操作系统 + 大语言模型 + Agent Runtime。

次日晚黄仁勋还将与 Satya Nadella 同台进一步披露细节。这意味着 Windows 不再只是"运行应用的操作系统",而是"运行 Agent 的操作系统",而 NVIDIA,是这套新 OS 底层硬件的联合定义者。

以下为实录

一、有用的 AI 已经到来

两年前的演讲谈到 AI 正从生成式 AI 向更多浪潮演进,而下一波是智能体 AI(agentic AI)。今天可以宣告:智能体 AI 已经到来,有用的 AI 已经到来。

以 GitHub 为例。软件编程是智能体 AI 最早的应用之一,也是最有价值的职业之一——全球约有 3000 万至 4000 万靠写代码为生的专业软件开发者,另有数亿学生与爱好者。在 GitHub 上,pull request 指下载并修改软件,commit 指将改动推送回去。代码提交量从 2023 年的 3 亿次、2024 年的 4 亿次增长到 2025 年的 5 亿次,而到 2026 年头几个月已接近翻三倍。

这意味着什么?3000 万软件开发者对应约 3 万亿美元的年薪酬,而这些薪酬撬动着其他行业的经济增长——全球约 100 万亿美元的各行各业都受其影响。如今这 3 万亿美元的薪酬正产出接近三倍的成果,相当于用 3 万亿美元的工资带来了 9 万亿美元的生产力,差距极其惊人。

软件工程师的数量其实在增加,而非减少。逻辑很简单:如果雇一名工程师能产出价值 9 万亿美元的有效工作,企业自然会想雇更多人;只有当产出持平时,雇用才会减少。正因产出惊人,需求才上升,这一点很快会反映到经济数据中。

从产业角度看,有用的 AI 到来意味着 token 需求高涨。token 如今是能带来收入的盈利单位,因此 AI 公司想生成更多 token、建更多 AI 工厂——这正是中国台湾算力需求飙升、相关企业业务繁忙的原因。

二、新的计算范式:智能体(agent)

计算范式已经改变。AI 现在是利润与 GDP 的生成器,其背后是一种全新的计算范式——不只是一个大语言模型,而是一个智能体。

在过去,软件是运行在操作系统之上的应用程序与代码。今天则是智能体:由一个或多个大语言模型构成,置于一个"载体框架"(harness)之中,由后者协调编排其工作。输入进入后,智能体需要理解、观察、推理、行动并使用工具——工具可以是电子表格、浏览器、数据处理引擎或数据库引擎。整个信息流转的编排由软件管理。智能体同样要处理短期记忆(工作记忆)与长期记忆,因此记忆管理系统至关重要。可以把大语言模型视为负责思考的部分,把载体视为像操作系统一样把一切连接起来的部分。

这一突破源于两件事的同时收敛:大语言模型已能胜任思考、推理、规划与工具使用;同时出现了能管理记忆、编排与工具调用的载体。两者结合后能力惊人。例如给定一段提示词即可生成可运行的代码;输入"生成一个 GIF:黑底上的 NVIDIA 绿色圆点散开、组成台北 101、显示 NVLink GTC Taipei 2026、变形为 NVIDIA 标志后再散开循环"即可得到成品;输入"我弄丢了遥控器的电池卡扣,它长这样,帮我做一个 CAD 文件",智能体会调用工具生成可直接 3D 打印的 CAD 文件。这里使用的是 Claude Code,Codex 同样表现出色。

新范式由此成形:过去是启动应用、点击与打字,如今是向 AI 说明意图,由 AI 生成代码或调用工具产出结果。这就是未来计算机的工作方式。

关于"智能体会让软件公司消失"的担忧,结论恰恰相反。智能体数量将不再受人口限制,因此会比以往更频繁地使用工具,对软件公司而言是绝佳时代——前提是软件须以智能体可用的方式呈现。NVIDIA 的核心资产正是其全部 CUDA 库(即 CUDA-X 库),如今可呈现给智能体使用,效率甚至高于人类。

(视频旁白)20 年前 NVIDIA 打造了 CUDA 这一加速计算的统一架构,重新发明了计算。上千个 CUDA-X 库帮助开发者在各科学与工程领域取得突破,它们本身就是智能体的工具:cuLitho 用于计算光刻,cuOpt 用于决策优化,cuDSS 用于直接稀疏求解,AI-Q 用于跨结构化与非结构化文档的深度研究,Aerial 用于 AI RAN,PhysicsNeMo 用于可微分物理,Parabricks 用于基因组学。

三、智能体的分布式计算与 Vera Rubin

智能体是终极的解耦(disaggregated)与分布式计算模型,处理它需要调动数据中心中大量不同的计算机。智能体由模型、载体、工具与技能、运行时(runtime)组成:模型是大脑,载体是身体,工具则像工人在工作坊中使用的器具。

各步骤运行在计算机的不同部分:大语言模型负责思考——处理上下文、观察环境、推理、制定并执行计划,每次思考都会激活一整个机架的 Grace Blackwell NVLink 72;每次使用工具会用到 CPU(工具可以是 C 编译器、Python、JavaScript 或加速计算)。今天的智能体还只是较简单的工具使用者,未来会变得极其老练,因此 CUDA-X 库将大受欢迎,而这些库现在都会附带"技能"说明,让 AI 读后即可学会使用。

在这一模型中,工具运行于 CPU、GPU 与大语言模型之上;安全载体运行于 CPU 与安全处理器 DPU(NVIDIA BlueField)之上;整体编排运行于 CPU。最难的部分之一是记忆:工作记忆(KV 缓存)涉及记什么、如何压缩与检索,以及结构化与非结构化数据的本体与关系。AI 的记忆系统将彻底革新存储系统。

正是这种解耦、分布式、异构的计算难题,催生了下一代产品 Vera Rubin。Vera Rubin 不是单一芯片,也不只是 GPU:它从 GPU(Vera Rubin NVL72)起步,由 Vera CPU 编排,配以革命性的存储系统,并通过 ConnectX-9、DOCA 软件栈与内置安全处理器,实现静态、传输与使用全过程的加密,遵循机密计算。作为公司历史上最雄心勃勃的工程,全部 4 万名工程师参与其中。

NVIDIA 已从 GPU 公司演进为系统公司,如今进一步走向基础设施尺度——发电、冷却、电网等工业伙伴都已成为生态的一部分,因为客户最终要建造的是 AI 工厂。

(视频旁白)全球正在进行人类历史上最大规模的基础设施建设——AI 工厂。其每一层(芯片、机架、网络、电力、冷却、电网)都必须端到端协同设计,因为算力即收入。NVIDIA DSX 是建造与运营 AI 工厂的参考设计蓝图:DSX Sim(Omniverse 蓝图)让伙伴在订购任何机架前先在数字世界中设计与验证整座工厂;DSX OS 负责配置、运营、监控与修复,把已装系统变为可信、多租户、有韧性的算力;DSX MaxLPS 让运营方在同样电力预算内安全部署更多 GPU,每年增加数十亿美元收入,并以 45℃ 热液冷却节省水电;动态电力分配回收闲置瓦数,机架内电力平滑抚平电流尖峰;DSX Flex 读取实时电网信号、在电网需要时回调电力。到本个十年结束前将有 100 吉瓦 AI 工厂上线。

四、AI 工厂生态与"算力即收入"

过去 NVIDIA 的计算层与软件栈是被集成进第三方平台的"计算生态",如今是"AI 工厂生态",处于更下游。每座 1 吉瓦级的 AI 工厂造价已从 200 亿至 300 亿美元升至 500 亿至 600 亿美元,并将达到每吉瓦 800 亿至 1000 亿美元。如此规模意味着必须一次建成、即刻可用,资金成本与复杂度都极高。

借助 Omniverse,这些巨型系统可在动土前就在数字世界中完整建造与模拟。NVIDIA 的产品线由此清晰:RTX 对应 GPU,DGX 对应系统,DSX 对应基础设施。凭借全栈能力,NVIDIA 能帮助小公司成长为世界级 AI 云:CoreWeave 已价值五六百亿乃至七百亿美元并高速增长,Nebius 同样如此。这些云的客户包括 Cursor(软件编程)、Black Forest Labs(图像生成)、World Labs(世界基础模型)、Revolut(金融服务 AI)与 Shopify;Nscale 服务英国电信与谷歌;此外还有 Thinking Machines、韩国 NAVER Cloud(服务韩国银行、现代等)、印度 Yotta、新加坡 Together AI 与 AI Singapore、印尼 Indosat,以及中国台湾 GMI 等。AI 将无处不在,每家公司都将被它驱动,每个地区都将建造它。

这些云都需要计算栈——NVIDIA 的硬件、软件、库以及与全球第三方开发者生态的连接,使任何人都能搭建 AI 云。但 AI 云已极其复杂,这正是 NVIDIA 成为 AI 基础设施公司的原因:算力即收入、即利润,缺少二者就是亏损。

衡量一座 AI 基础设施的关键指标有四个:

上线速度:NVIDIA 完全集成、亲自建造并验证整套基础设施,因此首个 token、首次推理与训练上线的时间都更快。

每瓦吞吐(每瓦 token 数):通过全栈集成、从头设计、整体模拟与极致协同设计,做到世界级。在 1 吉瓦的电力上限下,每瓦吞吐就是收入;仅因芯片便宜而选错架构并不划算。

可靠性:数据中心有海量活动部件与线缆,让所有计算机协调可靠运行极难,平均无故障时间(MTBF)至关重要,长期大规模运行的经验是关键。

系统寿命:软件持续演进(从 CNN 到 Transformer、专家混合,再到智能体系统),架构若不灵活、生态若不丰富,寿命就难以保证。NVIDIA 系统遍布全球、开发者皆从 CUDA 起步,因而资产寿命更长、总拥有成本(TCO)更低。

当前算力需求是核心约束,需要全行业共同努力,在全球建起 AI 工厂。

Vera Rubin 现已全面投产。其供应链规模是 Grace Blackwell 的两倍,单个机架的组装时间从两小时缩短到五分钟,产能与吞吐都大幅提升。已有数百万平方英尺厂房上线支撑 Grace Blackwell,并正为 Vera Rubin 爬坡。

(视频旁白)处理智能体 AI 是与生成答案截然不同的难题:智能体要观察、推理、规划、使用工具,管理海量上下文,并按需启动子智能体。NVIDIA Vera Rubin 是为智能体时代打造的多机架、Pod 级系统,现已全面投产。从首台 AI 超级计算机 DGX-1,到 Pascal、Ampere、首台机架级的 Grace Blackwell,再到 Vera Rubin。它始于台积电:七颗全新芯片经数百道工序、3 纳米工艺、CoWoS 先进封装制成,搭配来自美光、SK 海力士与三星的 HBM4 内存。Vera Rubin GPU 单板含六万亿晶体管、逾 18000 个元件;全新模块化计算托盘以 PCB 中板精简,ConnectX-9、SuperNIC 与 BlueField-4 DPU 均可免线缆维护;18 个计算托盘、9 个可热插拔 NVLink 交换托盘,高效液冷母线承载逾 5000 安培(相当于 20 辆电动汽车全力加速),共 130 万个元件构成第三代 MGX 机架。微软、戴尔与 CoreWeave 均已搭起 Vera Rubin NVL72 工程机架。Vera CPU 机架在单一液冷机架内集成 256 颗 CPU;富士康与广达打造的 Vera LPX 机架在 16 个托盘上集成 256 颗 Groq LPU,提供每秒 40 PB 的 SRAM 带宽用于超低延迟——NVL72 以最高吞吐生成 token,LPX 以最低延迟生成。Vera BlueField-4 STX 负责存储处理与芯片内安全;NVIDIA Spectrum-X 以太网光子学是全球首款采用 200 千兆共封装光学的以太网交换机。Vera Rubin 由五套相连的机架级系统构成,背后是中国台湾 150 家供应链伙伴、数百万平方英尺厂房与数百个站点,这就是极致协同设计。

五、Vera Rubin 系统揭幕

Vera Rubin 不只是为运行 AI 而造,而是为运行智能体而造。智能体架构是计算机科学最近一次伟大突破,历经多年才实现潜力、变得有用,运行它的计算机理应是全球最先进的。

现场展示的系统包括:Vera Rubin NVL72、LPX 机架、含 256 颗液冷 CPU 的 Vera CPU 机架、兼具存储与安全功能的 Vera BlueField 系统,以及 Mellanox 网络(全球首款 CPO,共封装光学)。

回顾历程:Hopper 为预训练而造;Grace Blackwell 时期,业界曾认为推理简单,但推理等于收入,且 MoE 模型在高响应速度、强交互与高吞吐下同时实现极难,因此 NVIDIA 创造了 NVL72。凭借极致协同设计,NVIDIA 今天的 token 成本是全球最低,且领先达数量级。Vera Rubin 则更进一步,面向"智能体系统中的推理"。

新系统取消了线缆、水管与风扇,改用中间 PCB 连接两侧,组装时间从两小时缩短到五分钟,可靠性与韧性大幅提升。其中包括最先进的 Vera CPU 托盘、含两颗 Vera CPU 与四个 ConnectX-9 的存储托盘、面向低延迟推理的 Groq LPX 机架(可通过 Groq LPU 进一步扩展),以及革命性的 NVLink 交换托盘与用于横向扩展的以太网交换机。凭借为 Grace Blackwell 引入的这两套系统,NVIDIA 已成为全球最大的网络公司。

六、Vera CPU:为智能体打造的 CPU

此前所有 CPU 都是为人而造:人以"秒"为单位使用,云上按核心数出租。但智能体以"纳秒"为单位运作,且极其没耐心——使用工具、访问数据库时都要求尽可能快的响应,任何等待都会拖慢后续步骤。因此 NVIDIA 为 AI 时代打造了 Vera CPU。

在 NVIDIA 系统中,Vera 有三种用途:在 Vera Rubin 机架内(已含两颗 CPU),一颗用于编排管理 GPU、管理 KV 缓存与机架内软件,另由 Grace BlueField 负责安全与隔离;Vera 计算单元负责载体、模型编排、工具调用与数据库访问;Vera BlueField 数据服务器则是全球最快的存储服务器。这些处于数据中心最昂贵环节的关键路径上,因为 token 正是在此生成,必须尽量多产且不被拖累。

由于 NVIDIA 已制造并售出数以百万计的 Grace Blackwell 与 Vera Rubin,公司已是全球最大的 CPU 制造商之一。Vera 是一颗从头打造的全新架构,有四个要点:

每时钟指令数(IPC)/单线程性能:必须世界级以保证低延迟。Vera 的 IPC 全球最高,每时钟周期可取指、译码并执行 10 条指令。

每核心带宽:数据进出 CPU 的带宽世界级。

整体带宽:智能体系统解耦且分布式,网络成为瓶颈,因此核间、CPU 与存储、CPU 与 GPU 之间都需极高带宽。Vera 以每秒 3.6 TB 的互联架构在光速级别连接所有核心,无跨芯片边界,各核协同而非逐核出租;它是首款采用 PCIe Gen 6 的 CPU,并采用 LPDDR5、带宽达每秒 1.2 TB,约为市面最高性能 CPU 的两到三倍。

能效:智能体数量将达数十亿(远超人口),CPU 必须在高性能的同时极其节能,以免占用本应用于 token 生成的电力。

与最高性能的 x86 相比,Vera 在真实单线程性能上遥遥领先。CPU 上 5%–10% 的提升已属难得,而这种量级的提速前所未有。

(视频旁白)智能体 AI 改变了 CPU 的角色:CPU 是指挥,GPU 是乐团。传统 CPU 为另一时代而建(最大化核心数、切片、虚拟化、按时出租),在智能体时代反而成为 GPU 利用率的瓶颈,直接影响 token 吞吐、延迟与体验。NVIDIA Vera 为智能体循环而生,将定制数据中心 CPU 核心与可扩展一致性互联架构结合,平衡性能、核心数与带宽。其核心是 NVIDIA Olympus 核心,面向分支密集的 Python 运行时、工具调用与沙箱代码执行:神经分支预测器每周期评估两条采纳分支,10 路宽译码引擎、大型乱序执行引擎与带图引擎的高级预取器协同工作。Vera 是首款使用 LPDDR5X、同时纠正多重错误而不损带宽的 CPU,峰值内存延迟比 x86 低 40%。第二代可扩展一致性互联架构将 88 个 Olympus 核心统一在单片网格上,内存与核心不拆分到不同小芯片,核间通信比传统 CPU 快 50%;内存一致的 NVLink 芯片到芯片把 GPU 直连 CPU,并可将 Vera 扩展到多路插槽。Vera 提供 x86 的 1.8 倍智能体沙箱性能。

七、Vera CPU 的性能与新市场

Vera 将成为 NVIDIA 新的主要增长引擎。Grace 与 Vera 也是 AI 领域最经充分验证的 CPU:几乎每个数据中心、云、企业都已完成对 Grace 的适配认证,软件与安全栈均已优化;如今各公司将转向验证 Vera。Grace Blackwell 过渡期最大的风险是从外部 x86 切换到 Grace,而 NVIDIA 以出色执行力完成,如今 Grace 已与 Grace Blackwell 几乎同义、无处不在。

性能方面:SQL(由 IBM 发明、全球通用的结构化数据库语言)极难加速,Vera 让其快三倍;面向工厂、证券交易所等场景的实时流处理(与纽约证券交易所合作、由其主席 Lynn Martin 支持)则快六倍。这些都得益于带宽、单线程执行与芯片内外的高带宽。

在 CPU 真实工作负载上谈"倍数提升"极为罕见。Vera 正在开辟一个前所未有的新市场:为智能体打造的 CPU。它不会取代旧市场,但因为智能体数量将远超人口、且极没耐心,这一市场必将更大。中国台湾的 ODM、电脑制造商与 OEM 已成为早期合作伙伴,而最早的采用者正是各类智能体公司。

八、企业级 AI 智能体工具包与 Nemotron

未来十年的应用与计算范式是:智能体与载体编排着大语言模型。每家公司都将运行智能体、成为智能体公司,并意识到智能体需要自己的操作系统,也都在追问如何安全运行与构建智能体。为此 NVIDIA 推出企业级 AI 智能体工具包(NVIDIA Agent Toolkit for Enterprise AI),其包含四要素:

模型:越聪明、越便宜、越快越好。

载体(harness):编排整套流程。

工具与技能:模型需调用工具,CUDA-X 库将成为绝佳工具。

运行时:把一切串联起来的操作系统。

工具包包含可修改的世界级开放模型,可运行任意智能体(如 Claude Code、Codex)。其中 NVIDIA OpenShell 是高度安全的载体,保护智能体、使其遵循安全策略并维护隐私、权限与身份;OpenShell 已开源并被红帽、Canonical、微软等广泛采用,针对无处不在的 NVIDIA AI 平台优化,可在任意云、本地乃至设备上运行。此外还有 OpenClaw、Hermes 等智能体载体。这四要素共同构成现代企业的操作系统。

一个典型用例是芯片设计:NVIDIA 与 Cadence 合作打造芯片设计超级智能体,由 Codex 或 Claude Code 编排,以 RTL、架构图、原理图或规格说明为输入,并基于 Nemotron 针对 NVIDIA 平台优化。

(视频旁白)Cadence 与 NVIDIA 合作打造芯片设计智能体。设计含数以万亿计晶体管、皮秒级同步的三维电路极难,物理样机过慢过贵,工程师须在数字世界中工作:架构规格译为 RTL,再于仿真中验证,一个 bug 即可让芯片延期数月。两家公司构建的设计验证智能体由 Codex 编排,Cadence Chip Stack 启动 RTL 验证循环,由 Nemotron 驱动、OpenShell 保护,并调用 RTL 生成、测试平台创建、回归测试与调试等专家子智能体;系统自我驱动,用 Cadence Xcelium 运行数百次仿真、用 JasperGold 做形式化验证,使验证周期快逾 40 倍,从数周缩短到数小时。

NVIDIA 拥有数千名芯片设计师,并将引入数十万个 Cadence 超级智能体协同工作,以加速研发。这套工具包(模型、载体、CUDA 加速的库与工具、运行时)的起点是优秀的开放模型——Nemotron。

今天发布的 Nemotron 3 Ultra 不仅开放模型,还开放训练所用的全部数据与训练脚本;得益于合作伙伴联盟共享数据,它在全球最大的一批长程推理、长程工具任务求解与工具使用数据集上训练而成。它是全球首个基于 SSM(状态空间模型)与专家混合(MoE)混合架构的模型,速度快五倍、运行成本(总 FLOPs 与总推理时间)比最具成本效益的开放模型还低 30%,且保持前沿级智能、完全开放。Nemotron 4 正在研发中。

凭借这套工具包,每家企业都能像 Cadence 那样构建自己的超级智能体。合作伙伴已包括 Cadence、CrowdStrike、ServiceNow、Palantir、SAP 等。与"智能体会颠覆这些市场"的预期相反,智能体将为合作伙伴创造前所未有的最大机遇。

至此三项要点清晰:其一,Vera Rubin 全面投产;其二,Vera CPU 为新一代智能体而造;其三,企业级 AI 工具包让每家企业与企业软件公司都能构建智能体。

九、重新发明 PC:RTX Spark 与全新 Windows 产品线

现代计算机产业起步于约 40 年前,NVIDIA 成立 33 年。Windows 95 让 PC 从企业走向消费者,其成功源于恰当的解耦与抽象——系统 BIOS、开放芯片组、可在运行时安装驱动的操作系统、带多媒体 API 的抽象层。

40 年后,微软与 NVIDIA 历时三年重新发明 PC。智能体计算范式将同时运行于 AI 云、企业内部与个人 PC。当 PC 拥有能理解你、与你对话、替你处理事务与做研究的自主智能体时,其形态将彻底改变。新的操作系统即"旧操作系统 + 大语言模型"——大语言模型相当于现代版 DirectX,具备输入输出、理解提示词与计算机视觉、生成视频与声音的能力,是 PC 的智能延伸;应用程序则被智能体运行时取代。

(视频旁白)一切始于一束火花。RTX Spark 把 33 年的积累浓缩进一颗芯片:含 6144 个 Tensor Core 的 Blackwell RTX GPU、一 PetaFLOP 的 AI 性能、与联发科合作的定制 20 核 Grace CPU、由 NVLink 融合、128 GB 统一内存、台积电 3 纳米工艺、700 亿晶体管,并与微软协作打造面向智能体的 Windows 平台。

RTX Spark 由 NVIDIA 与联发科合作打造,100% 的 NVIDIA 软件都能在其上运行——从数字生物学、地震资料处理、天体物理,到物理、生物、基因组学、AI 与计算机图形学,再加上 Windows 历来运行的每一个应用,并新增运行智能体的能力。

(视频旁白)一个在 RTX Spark 上本地运行的智能体(OpenShell 沙箱、Hermes 载体、连接云端 Claude Sonnet)可协助设计房屋:依据选定地块、概念草图、风格情绪板与需求描述,调用本地工具在 Rhino 中建模地形与建筑体量、提出经成本与舒适度优化的形态、生成室内布局并自动放置门窗与结构构件、自检并修正错误;批准后将模型连同上下文导出至 Blender,渲染后再用生成式 AI(Flux 2 模型)转为多视角、多光照的照片级效果。

合作伙伴反响热烈。Adobe 已重构 Photoshop 与 Premiere 的核心并将为 RTX Spark 发布,速度提升一倍,并通过 MCP 服务器实现对智能体友好的交互。这是 40 年来第一次伟大的 PC 重塑,全球 PC 产业几乎全员加入。

更进一步,微软与 NVIDIA 发布全新产品线——覆盖台式机、笔记本与工作站的三款革命性 Windows 机器,全部 100% 兼容 Windows、CUDA 与 NVIDIA AI Tensor Core。其中台式机(如微星机型)可让智能体 7×24 全天候运行、无按量计费,并连接家中笔记本、显示器、摄像头、家电与安防系统,成为随时间不断变聪明的个人 AI(从 Nemotron 3 Ultra 持续升级至更新版本)。面向开发者的 DGX Station 兼容 Windows、配备 768 GB 内存、20 PetaFLOPs 算力与每秒 8 TB 内存带宽,可在桌边运行万亿参数模型,部署时再迁入云端。

正如手机演变为智能手机,10 年后的 PC 将与今天截然不同:未来家庭中或将有一台运行所有智能体与助手的 AI 超级计算机,其角色更接近 R2-D2 或 C-3PO,而非传统 PC。NVIDIA 已为此制定路线图——每一代架构都将提供台式机、笔记本与工作站,且全球 100% 的 PC 产业均已加入。

十、物理 AI 与机器人:Cosmos、Alpamayo、Isaac GR00T

智能体 AI 本质上是数字机器人,会运行在各类计算机上:人形机器人、自动驾驶汽车、卫星,乃至农业、制造与重工业设备,甚至未来的基站(理解流量、与其他基站协同以降低能耗、提升频谱效率)。随时间推移,全球将有数百亿乃至上千亿个智能体系统在运转。

最大的难题是数据。语言模型的训练数据来自人类视角,而机器人数据须来自机器人视角;现实世界的视频多为第三人称,因此物理 AI 的数据问题最难。NVIDIA 沿此逐级推进:先用远程操作(人类示范,类比 RLHF),再用仿真(Omniverse,类比可验证奖励的强化学习 RLVR)为物理 AI 模型做引导,进而从第三人称数据学习并重投影到第一人称,最终得到能从任意视角理解物理世界的世界基础模型(World Foundation Model)。

今天发布的 Cosmos 3 是物理 AI 的前沿。在物理 AI 领域 NVIDIA 处于全球领先,Cosmos 3 可作为各类机器人工作的基础模型,能理解、推理、生成、仿真,并在闭环中充当策略本身,在全球排行榜上名列前茅。

(视频旁白)真实世界无限且不可预测,真实数据无法规模化,对物理 AI 而言"算力即数据"。Cosmos 是面向物理 AI 的开放前沿全能模型,基于全新的 Transformer 混合架构:像素、动作、声音与语言流入自回归 Transformer 进行推理与规划,并指挥扩散 Transformer 生成后续内容。它可作为 VLM 观察并描述世界、作为世界模型从图像/文本/视频生成物理精确的合成视频、作为仿真器为策略训练与评估闭环,并作为 NVIDIA OmniDreams(以动作为条件的世界模型)的基础逐帧预测未来;经后训练即成为感知—推理—规划—生成动作的世界动作模型。Cosmos 与 Nemotron 一样完全开放(开放模型、数据与训练方法),可被增强为专有模型。

AI 栈中模型最易理解,但完整栈还包含生成器、仿真器与运行时。汽车本质上是物理 AI(自动驾驶的智能体机器人),同样拥有复杂的栈。

今天发布的 Alpamayo 2 Super 是面向自动驾驶汽车的开放模型。签约 NVIDIA DRIVE Hyperion 的品牌约占全球汽车制造商的 80%,全球约 97% 的出行服务也已与 NVIDIA 对接;在 DRIVE Hyperion 运行时与 Halos 操作系统上部署后,可连接全球这些服务。它是全球首辆会推理的自动驾驶汽车——会持续"自言自语"地进行思考,完成路线规划、避让、让行、保持车距等操作。

这项技术同样适用于人形机器人。NVIDIA Isaac GR00T 是人形机器人栈,涵盖模型、数据生成、仿真与含操作系统的运行时。NVIDIA 的所有系统(云、PC、自动驾驶、人形机器人的智能体/机器人系统)采用完全相同的架构,并以极致协同设计垂直集成、再向所有人开放。机器人系统因电机、传感器众多而复杂脆弱,因此需要参考平台。

今天发布的 NVIDIA Isaac GR00T 参考人形机器人完全集成:每只手 25 个自由度(由 Sharpa 制造),全身 31 个自由度,6 英尺高、150 磅重,运行全新 Jetson Thor 与完整软件栈(数据生成、仿真、运行时),主要面向高校与研究者。

(视频旁白)通用人形机器人是 AI 的下一次飞跃,但搭建极难,各团队常从零拼凑仿真器、远程操作、数据管线与训练设施,耗时数月。NVIDIA Isaac GR00T 是开放开发平台:含开放模型、仿真与训练库、数据生成器,以及预配置好、数小时即可上手的机器人计算机。流程为:在 Isaac Lab 搭建仿真环境,用 Isaac Teleoperation 采集示范,用 Omniverse 与 Cosmos 把一次示范扩展为上千次合成数据,训练策略并在 Isaac Lab Arena 评估,再通过 Isaac ROS 部署到 Jetson Thor。各组件模块化、开放,可用 NVIDIA 的或自行替换。

十一、总结

过去六个月里,计算机产业被彻底改变:智能体得以实现,并与最新前沿模型收敛,使 AI 能够做有用的工作。这一计算范式将不断重复——智能体拥有模型,载体携带带技能的工具,运行于云、本地、PC 或机器人之上;范式相同,而载体、模型可按偏好选择并针对专有用途改进,甚至打造可供他人使用的超级智能体。

Vera Rubin 已全面投产:Grace Blackwell 为处理 AI(尤其推理)而生,Vera Rubin 则为运行智能体而生,是一整套解耦、分布式的智能体处理系统。NVIDIA 已成为基础设施公司,帮助客户尽快实现最大收入与利润。为智能体(而非为人)打造的 Vera CPU 具有独特需求,其订单已到,有望成为公司历史上最快、最成功的产品发布。

NVIDIA 与微软共同开启全新 PC 产品线,而相同的智能体计算范式未来还将运行于机器人、卫星、基站、工厂等各类设备,遍及云、本地与边缘。人们对个人电脑的认知很可能将因此改变。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

nvidia ai microsoft windows 黄仁勋
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论