40 年来第一次：PC 被 NVIDIA 和微软重新发明了

2026 年 6 月 1 日，黄仁勋（Jensen Huang）在 NVIDIA GTC Taipei 2026 主题演讲，同步连线全台 70 个分会场，并为 Computex 揭幕。在这场近 2 小时的演讲里，他抛出了一个足以改写整个消费电子格局的判断——"40 年来 PC 的第一次重新发明，由 NVIDIA 和 Microsoft 联手完成。"

这是本场大会真正的核心亮点：NVIDIA 要造 PC 了，而且不是配角，是主角。黄仁勋的逻辑链很清晰：既然未来十年的统一计算模式是 Agent（模型 + Harness + 工具 + Runtime），那么 Agent 不仅要跑在云端，也必须原生跑在每个人的 PC 上——能 7×24 小时不间断、本地沙箱化、连接本地或云端模型、看得见你、听得懂你、替你干活。为此，PC 的芯片和操作系统都得重做。

黄仁勋亲口透露，NVIDIA 和 Microsoft 用了整整三年时间，从零重构 PC 的运作方式，就为了等这个 Agent 时刻。

他类比 40 年前 Windows 之所以让 PC 走进千家万户，是因为做对了几件事：BIOS 抽象、开放芯片组、运行时可加载驱动、多媒体 API 抽象层。今天 Microsoft 和 NVIDIA 要再做一次同样的事：新一代 PC = 旧操作系统 + 大语言模型 + Agent Runtime。

次日晚黄仁勋还将与 Satya Nadella 同台进一步披露细节。这意味着 Windows 不再只是"运行应用的操作系统"，而是"运行 Agent 的操作系统"，而 NVIDIA，是这套新 OS 底层硬件的联合定义者。

以下为实录

一、有用的 AI 已经到来

两年前的演讲谈到 AI 正从生成式 AI 向更多浪潮演进，而下一波是智能体 AI（agentic AI）。今天可以宣告：智能体 AI 已经到来，有用的 AI 已经到来。

以 GitHub 为例。软件编程是智能体 AI 最早的应用之一，也是最有价值的职业之一——全球约有 3000 万至 4000 万靠写代码为生的专业软件开发者，另有数亿学生与爱好者。在 GitHub 上，pull request 指下载并修改软件，commit 指将改动推送回去。代码提交量从 2023 年的 3 亿次、2024 年的 4 亿次增长到 2025 年的 5 亿次，而到 2026 年头几个月已接近翻三倍。

这意味着什么？3000 万软件开发者对应约 3 万亿美元的年薪酬，而这些薪酬撬动着其他行业的经济增长——全球约 100 万亿美元的各行各业都受其影响。如今这 3 万亿美元的薪酬正产出接近三倍的成果，相当于用 3 万亿美元的工资带来了 9 万亿美元的生产力，差距极其惊人。

软件工程师的数量其实在增加，而非减少。逻辑很简单：如果雇一名工程师能产出价值 9 万亿美元的有效工作，企业自然会想雇更多人；只有当产出持平时，雇用才会减少。正因产出惊人，需求才上升，这一点很快会反映到经济数据中。

从产业角度看，有用的 AI 到来意味着 token 需求高涨。token 如今是能带来收入的盈利单位，因此 AI 公司想生成更多 token、建更多 AI 工厂——这正是中国台湾算力需求飙升、相关企业业务繁忙的原因。

二、新的计算范式：智能体（agent）

计算范式已经改变。AI 现在是利润与 GDP 的生成器，其背后是一种全新的计算范式——不只是一个大语言模型，而是一个智能体。

在过去，软件是运行在操作系统之上的应用程序与代码。今天则是智能体：由一个或多个大语言模型构成，置于一个"载体框架"（harness）之中，由后者协调编排其工作。输入进入后，智能体需要理解、观察、推理、行动并使用工具——工具可以是电子表格、浏览器、数据处理引擎或数据库引擎。整个信息流转的编排由软件管理。智能体同样要处理短期记忆（工作记忆）与长期记忆，因此记忆管理系统至关重要。可以把大语言模型视为负责思考的部分，把载体视为像操作系统一样把一切连接起来的部分。

这一突破源于两件事的同时收敛：大语言模型已能胜任思考、推理、规划与工具使用；同时出现了能管理记忆、编排与工具调用的载体。两者结合后能力惊人。例如给定一段提示词即可生成可运行的代码；输入"生成一个 GIF：黑底上的 NVIDIA 绿色圆点散开、组成台北 101、显示 NVLink GTC Taipei 2026、变形为 NVIDIA 标志后再散开循环"即可得到成品；输入"我弄丢了遥控器的电池卡扣，它长这样，帮我做一个 CAD 文件"，智能体会调用工具生成可直接 3D 打印的 CAD 文件。这里使用的是 Claude Code，Codex 同样表现出色。

新范式由此成形：过去是启动应用、点击与打字，如今是向 AI 说明意图，由 AI 生成代码或调用工具产出结果。这就是未来计算机的工作方式。

关于"智能体会让软件公司消失"的担忧，结论恰恰相反。智能体数量将不再受人口限制，因此会比以往更频繁地使用工具，对软件公司而言是绝佳时代——前提是软件须以智能体可用的方式呈现。NVIDIA 的核心资产正是其全部 CUDA 库（即 CUDA-X 库），如今可呈现给智能体使用，效率甚至高于人类。

（视频旁白）20 年前 NVIDIA 打造了 CUDA 这一加速计算的统一架构，重新发明了计算。上千个 CUDA-X 库帮助开发者在各科学与工程领域取得突破，它们本身就是智能体的工具：cuLitho 用于计算光刻，cuOpt 用于决策优化，cuDSS 用于直接稀疏求解，AI-Q 用于跨结构化与非结构化文档的深度研究，Aerial 用于 AI RAN，PhysicsNeMo 用于可微分物理，Parabricks 用于基因组学。

三、智能体的分布式计算与 Vera Rubin

智能体是终极的解耦（disaggregated）与分布式计算模型，处理它需要调动数据中心中大量不同的计算机。智能体由模型、载体、工具与技能、运行时（runtime）组成：模型是大脑，载体是身体，工具则像工人在工作坊中使用的器具。

各步骤运行在计算机的不同部分：大语言模型负责思考——处理上下文、观察环境、推理、制定并执行计划，每次思考都会激活一整个机架的 Grace Blackwell NVLink 72；每次使用工具会用到 CPU（工具可以是 C 编译器、Python、JavaScript 或加速计算）。今天的智能体还只是较简单的工具使用者，未来会变得极其老练，因此 CUDA-X 库将大受欢迎，而这些库现在都会附带"技能"说明，让 AI 读后即可学会使用。

在这一模型中，工具运行于 CPU、GPU 与大语言模型之上；安全载体运行于 CPU 与安全处理器 DPU（NVIDIA BlueField）之上；整体编排运行于 CPU。最难的部分之一是记忆：工作记忆（KV 缓存）涉及记什么、如何压缩与检索，以及结构化与非结构化数据的本体与关系。AI 的记忆系统将彻底革新存储系统。

正是这种解耦、分布式、异构的计算难题，催生了下一代产品 Vera Rubin。Vera Rubin 不是单一芯片，也不只是 GPU：它从 GPU（Vera Rubin NVL72）起步，由 Vera CPU 编排，配以革命性的存储系统，并通过 ConnectX-9、DOCA 软件栈与内置安全处理器，实现静态、传输与使用全过程的加密，遵循机密计算。作为公司历史上最雄心勃勃的工程，全部 4 万名工程师参与其中。

NVIDIA 已从 GPU 公司演进为系统公司，如今进一步走向基础设施尺度——发电、冷却、电网等工业伙伴都已成为生态的一部分，因为客户最终要建造的是 AI 工厂。

（视频旁白）全球正在进行人类历史上最大规模的基础设施建设——AI 工厂。其每一层（芯片、机架、网络、电力、冷却、电网）都必须端到端协同设计，因为算力即收入。NVIDIA DSX 是建造与运营 AI 工厂的参考设计蓝图：DSX Sim（Omniverse 蓝图）让伙伴在订购任何机架前先在数字世界中设计与验证整座工厂；DSX OS 负责配置、运营、监控与修复，把已装系统变为可信、多租户、有韧性的算力；DSX MaxLPS 让运营方在同样电力预算内安全部署更多 GPU，每年增加数十亿美元收入，并以 45℃ 热液冷却节省水电；动态电力分配回收闲置瓦数，机架内电力平滑抚平电流尖峰；DSX Flex 读取实时电网信号、在电网需要时回调电力。到本个十年结束前将有 100 吉瓦 AI 工厂上线。

四、AI 工厂生态与"算力即收入"

过去 NVIDIA 的计算层与软件栈是被集成进第三方平台的"计算生态"，如今是"AI 工厂生态"，处于更下游。每座 1 吉瓦级的 AI 工厂造价已从 200 亿至 300 亿美元升至 500 亿至 600 亿美元，并将达到每吉瓦 800 亿至 1000 亿美元。如此规模意味着必须一次建成、即刻可用，资金成本与复杂度都极高。

借助 Omniverse，这些巨型系统可在动土前就在数字世界中完整建造与模拟。NVIDIA 的产品线由此清晰：RTX 对应 GPU，DGX 对应系统，DSX 对应基础设施。凭借全栈能力，NVIDIA 能帮助小公司成长为世界级 AI 云：CoreWeave 已价值五六百亿乃至七百亿美元并高速增长，Nebius 同样如此。这些云的客户包括 Cursor（软件编程）、Black Forest Labs（图像生成）、World Labs（世界基础模型）、Revolut（金融服务 AI）与 Shopify；Nscale 服务英国电信与谷歌；此外还有 Thinking Machines、韩国 NAVER Cloud（服务韩国银行、现代等）、印度 Yotta、新加坡 Together AI 与 AI Singapore、印尼 Indosat，以及中国台湾 GMI 等。AI 将无处不在，每家公司都将被它驱动，每个地区都将建造它。

这些云都需要计算栈——NVIDIA 的硬件、软件、库以及与全球第三方开发者生态的连接，使任何人都能搭建 AI 云。但 AI 云已极其复杂，这正是 NVIDIA 成为 AI 基础设施公司的原因：算力即收入、即利润，缺少二者就是亏损。

衡量一座 AI 基础设施的关键指标有四个：

上线速度：NVIDIA 完全集成、亲自建造并验证整套基础设施，因此首个 token、首次推理与训练上线的时间都更快。

每瓦吞吐（每瓦 token 数）：通过全栈集成、从头设计、整体模拟与极致协同设计，做到世界级。在 1 吉瓦的电力上限下，每瓦吞吐就是收入；仅因芯片便宜而选错架构并不划算。

可靠性：数据中心有海量活动部件与线缆，让所有计算机协调可靠运行极难，平均无故障时间（MTBF）至关重要，长期大规模运行的经验是关键。

系统寿命：软件持续演进（从 CNN 到 Transformer、专家混合，再到智能体系统），架构若不灵活、生态若不丰富，寿命就难以保证。NVIDIA 系统遍布全球、开发者皆从 CUDA 起步，因而资产寿命更长、总拥有成本（TCO）更低。

当前算力需求是核心约束，需要全行业共同努力，在全球建起 AI 工厂。

Vera Rubin 现已全面投产。其供应链规模是 Grace Blackwell 的两倍，单个机架的组装时间从两小时缩短到五分钟，产能与吞吐都大幅提升。已有数百万平方英尺厂房上线支撑 Grace Blackwell，并正为 Vera Rubin 爬坡。

（视频旁白）处理智能体 AI 是与生成答案截然不同的难题：智能体要观察、推理、规划、使用工具，管理海量上下文，并按需启动子智能体。NVIDIA Vera Rubin 是为智能体时代打造的多机架、Pod 级系统，现已全面投产。从首台 AI 超级计算机 DGX-1，到 Pascal、Ampere、首台机架级的 Grace Blackwell，再到 Vera Rubin。它始于台积电：七颗全新芯片经数百道工序、3 纳米工艺、CoWoS 先进封装制成，搭配来自美光、SK 海力士与三星的 HBM4 内存。Vera Rubin GPU 单板含六万亿晶体管、逾 18000 个元件；全新模块化计算托盘以 PCB 中板精简，ConnectX-9、SuperNIC 与 BlueField-4 DPU 均可免线缆维护；18 个计算托盘、9 个可热插拔 NVLink 交换托盘，高效液冷母线承载逾 5000 安培（相当于 20 辆电动汽车全力加速），共 130 万个元件构成第三代 MGX 机架。微软、戴尔与 CoreWeave 均已搭起 Vera Rubin NVL72 工程机架。Vera CPU 机架在单一液冷机架内集成 256 颗 CPU；富士康与广达打造的 Vera LPX 机架在 16 个托盘上集成 256 颗 Groq LPU，提供每秒 40 PB 的 SRAM 带宽用于超低延迟——NVL72 以最高吞吐生成 token，LPX 以最低延迟生成。Vera BlueField-4 STX 负责存储处理与芯片内安全；NVIDIA Spectrum-X 以太网光子学是全球首款采用 200 千兆共封装光学的以太网交换机。Vera Rubin 由五套相连的机架级系统构成，背后是中国台湾 150 家供应链伙伴、数百万平方英尺厂房与数百个站点，这就是极致协同设计。

五、Vera Rubin 系统揭幕

Vera Rubin 不只是为运行 AI 而造，而是为运行智能体而造。智能体架构是计算机科学最近一次伟大突破，历经多年才实现潜力、变得有用，运行它的计算机理应是全球最先进的。

现场展示的系统包括：Vera Rubin NVL72、LPX 机架、含 256 颗液冷 CPU 的 Vera CPU 机架、兼具存储与安全功能的 Vera BlueField 系统，以及 Mellanox 网络（全球首款 CPO，共封装光学）。

回顾历程：Hopper 为预训练而造；Grace Blackwell 时期，业界曾认为推理简单，但推理等于收入，且 MoE 模型在高响应速度、强交互与高吞吐下同时实现极难，因此 NVIDIA 创造了 NVL72。凭借极致协同设计，NVIDIA 今天的 token 成本是全球最低，且领先达数量级。Vera Rubin 则更进一步，面向"智能体系统中的推理"。

新系统取消了线缆、水管与风扇，改用中间 PCB 连接两侧，组装时间从两小时缩短到五分钟，可靠性与韧性大幅提升。其中包括最先进的 Vera CPU 托盘、含两颗 Vera CPU 与四个 ConnectX-9 的存储托盘、面向低延迟推理的 Groq LPX 机架（可通过 Groq LPU 进一步扩展），以及革命性的 NVLink 交换托盘与用于横向扩展的以太网交换机。凭借为 Grace Blackwell 引入的这两套系统，NVIDIA 已成为全球最大的网络公司。

六、Vera CPU：为智能体打造的 CPU

此前所有 CPU 都是为人而造：人以"秒"为单位使用，云上按核心数出租。但智能体以"纳秒"为单位运作，且极其没耐心——使用工具、访问数据库时都要求尽可能快的响应，任何等待都会拖慢后续步骤。因此 NVIDIA 为 AI 时代打造了 Vera CPU。

在 NVIDIA 系统中，Vera 有三种用途：在 Vera Rubin 机架内（已含两颗 CPU），一颗用于编排管理 GPU、管理 KV 缓存与机架内软件，另由 Grace BlueField 负责安全与隔离；Vera 计算单元负责载体、模型编排、工具调用与数据库访问；Vera BlueField 数据服务器则是全球最快的存储服务器。这些处于数据中心最昂贵环节的关键路径上，因为 token 正是在此生成，必须尽量多产且不被拖累。

由于 NVIDIA 已制造并售出数以百万计的 Grace Blackwell 与 Vera Rubin，公司已是全球最大的 CPU 制造商之一。Vera 是一颗从头打造的全新架构，有四个要点：

每时钟指令数（IPC）/单线程性能：必须世界级以保证低延迟。Vera 的 IPC 全球最高，每时钟周期可取指、译码并执行 10 条指令。

每核心带宽：数据进出 CPU 的带宽世界级。

整体带宽：智能体系统解耦且分布式，网络成为瓶颈，因此核间、CPU 与存储、CPU 与 GPU 之间都需极高带宽。Vera 以每秒 3.6 TB 的互联架构在光速级别连接所有核心，无跨芯片边界，各核协同而非逐核出租；它是首款采用 PCIe Gen 6 的 CPU，并采用 LPDDR5、带宽达每秒 1.2 TB，约为市面最高性能 CPU 的两到三倍。

能效：智能体数量将达数十亿（远超人口），CPU 必须在高性能的同时极其节能，以免占用本应用于 token 生成的电力。

与最高性能的 x86 相比，Vera 在真实单线程性能上遥遥领先。CPU 上 5%–10% 的提升已属难得，而这种量级的提速前所未有。

（视频旁白）智能体 AI 改变了 CPU 的角色：CPU 是指挥，GPU 是乐团。传统 CPU 为另一时代而建（最大化核心数、切片、虚拟化、按时出租），在智能体时代反而成为 GPU 利用率的瓶颈，直接影响 token 吞吐、延迟与体验。NVIDIA Vera 为智能体循环而生，将定制数据中心 CPU 核心与可扩展一致性互联架构结合，平衡性能、核心数与带宽。其核心是 NVIDIA Olympus 核心，面向分支密集的 Python 运行时、工具调用与沙箱代码执行：神经分支预测器每周期评估两条采纳分支，10 路宽译码引擎、大型乱序执行引擎与带图引擎的高级预取器协同工作。Vera 是首款使用 LPDDR5X、同时纠正多重错误而不损带宽的 CPU，峰值内存延迟比 x86 低 40%。第二代可扩展一致性互联架构将 88 个 Olympus 核心统一在单片网格上，内存与核心不拆分到不同小芯片，核间通信比传统 CPU 快 50%；内存一致的 NVLink 芯片到芯片把 GPU 直连 CPU，并可将 Vera 扩展到多路插槽。Vera 提供 x86 的 1.8 倍智能体沙箱性能。

七、Vera CPU 的性能与新市场

Vera 将成为 NVIDIA 新的主要增长引擎。Grace 与 Vera 也是 AI 领域最经充分验证的 CPU：几乎每个数据中心、云、企业都已完成对 Grace 的适配认证，软件与安全栈均已优化；如今各公司将转向验证 Vera。Grace Blackwell 过渡期最大的风险是从外部 x86 切换到 Grace，而 NVIDIA 以出色执行力完成，如今 Grace 已与 Grace Blackwell 几乎同义、无处不在。

性能方面：SQL（由 IBM 发明、全球通用的结构化数据库语言）极难加速，Vera 让其快三倍；面向工厂、证券交易所等场景的实时流处理（与纽约证券交易所合作、由其主席 Lynn Martin 支持）则快六倍。这些都得益于带宽、单线程执行与芯片内外的高带宽。

在 CPU 真实工作负载上谈"倍数提升"极为罕见。Vera 正在开辟一个前所未有的新市场：为智能体打造的 CPU。它不会取代旧市场，但因为智能体数量将远超人口、且极没耐心，这一市场必将更大。中国台湾的 ODM、电脑制造商与 OEM 已成为早期合作伙伴，而最早的采用者正是各类智能体公司。

八、企业级 AI 智能体工具包与 Nemotron

未来十年的应用与计算范式是：智能体与载体编排着大语言模型。每家公司都将运行智能体、成为智能体公司，并意识到智能体需要自己的操作系统，也都在追问如何安全运行与构建智能体。为此 NVIDIA 推出企业级 AI 智能体工具包（NVIDIA Agent Toolkit for Enterprise AI），其包含四要素：

模型：越聪明、越便宜、越快越好。

载体（harness）：编排整套流程。

工具与技能：模型需调用工具，CUDA-X 库将成为绝佳工具。

运行时：把一切串联起来的操作系统。

工具包包含可修改的世界级开放模型，可运行任意智能体（如 Claude Code、Codex）。其中 NVIDIA OpenShell 是高度安全的载体，保护智能体、使其遵循安全策略并维护隐私、权限与身份；OpenShell 已开源并被红帽、Canonical、微软等广泛采用，针对无处不在的 NVIDIA AI 平台优化，可在任意云、本地乃至设备上运行。此外还有 OpenClaw、Hermes 等智能体载体。这四要素共同构成现代企业的操作系统。

一个典型用例是芯片设计：NVIDIA 与 Cadence 合作打造芯片设计超级智能体，由 Codex 或 Claude Code 编排，以 RTL、架构图、原理图或规格说明为输入，并基于 Nemotron 针对 NVIDIA 平台优化。

（视频旁白）Cadence 与 NVIDIA 合作打造芯片设计智能体。设计含数以万亿计晶体管、皮秒级同步的三维电路极难，物理样机过慢过贵，工程师须在数字世界中工作：架构规格译为 RTL，再于仿真中验证，一个 bug 即可让芯片延期数月。两家公司构建的设计验证智能体由 Codex 编排，Cadence Chip Stack 启动 RTL 验证循环，由 Nemotron 驱动、OpenShell 保护，并调用 RTL 生成、测试平台创建、回归测试与调试等专家子智能体；系统自我驱动，用 Cadence Xcelium 运行数百次仿真、用 JasperGold 做形式化验证，使验证周期快逾 40 倍，从数周缩短到数小时。

NVIDIA 拥有数千名芯片设计师，并将引入数十万个 Cadence 超级智能体协同工作，以加速研发。这套工具包（模型、载体、CUDA 加速的库与工具、运行时）的起点是优秀的开放模型——Nemotron。

今天发布的 Nemotron 3 Ultra 不仅开放模型，还开放训练所用的全部数据与训练脚本；得益于合作伙伴联盟共享数据，它在全球最大的一批长程推理、长程工具任务求解与工具使用数据集上训练而成。它是全球首个基于 SSM（状态空间模型）与专家混合（MoE）混合架构的模型，速度快五倍、运行成本（总 FLOPs 与总推理时间）比最具成本效益的开放模型还低 30%，且保持前沿级智能、完全开放。Nemotron 4 正在研发中。

凭借这套工具包，每家企业都能像 Cadence 那样构建自己的超级智能体。合作伙伴已包括 Cadence、CrowdStrike、ServiceNow、Palantir、SAP 等。与"智能体会颠覆这些市场"的预期相反，智能体将为合作伙伴创造前所未有的最大机遇。

至此三项要点清晰：其一，Vera Rubin 全面投产；其二，Vera CPU 为新一代智能体而造；其三，企业级 AI 工具包让每家企业与企业软件公司都能构建智能体。

九、重新发明 PC：RTX Spark 与全新 Windows 产品线

现代计算机产业起步于约 40 年前，NVIDIA 成立 33 年。Windows 95 让 PC 从企业走向消费者，其成功源于恰当的解耦与抽象——系统 BIOS、开放芯片组、可在运行时安装驱动的操作系统、带多媒体 API 的抽象层。

40 年后，微软与 NVIDIA 历时三年重新发明 PC。智能体计算范式将同时运行于 AI 云、企业内部与个人 PC。当 PC 拥有能理解你、与你对话、替你处理事务与做研究的自主智能体时，其形态将彻底改变。新的操作系统即"旧操作系统 + 大语言模型"——大语言模型相当于现代版 DirectX，具备输入输出、理解提示词与计算机视觉、生成视频与声音的能力，是 PC 的智能延伸；应用程序则被智能体运行时取代。

（视频旁白）一切始于一束火花。RTX Spark 把 33 年的积累浓缩进一颗芯片：含 6144 个 Tensor Core 的 Blackwell RTX GPU、一 PetaFLOP 的 AI 性能、与联发科合作的定制 20 核 Grace CPU、由 NVLink 融合、128 GB 统一内存、台积电 3 纳米工艺、700 亿晶体管，并与微软协作打造面向智能体的 Windows 平台。

RTX Spark 由 NVIDIA 与联发科合作打造，100% 的 NVIDIA 软件都能在其上运行——从数字生物学、地震资料处理、天体物理，到物理、生物、基因组学、AI 与计算机图形学，再加上 Windows 历来运行的每一个应用，并新增运行智能体的能力。

（视频旁白）一个在 RTX Spark 上本地运行的智能体（OpenShell 沙箱、Hermes 载体、连接云端 Claude Sonnet）可协助设计房屋：依据选定地块、概念草图、风格情绪板与需求描述，调用本地工具在 Rhino 中建模地形与建筑体量、提出经成本与舒适度优化的形态、生成室内布局并自动放置门窗与结构构件、自检并修正错误；批准后将模型连同上下文导出至 Blender，渲染后再用生成式 AI（Flux 2 模型）转为多视角、多光照的照片级效果。

合作伙伴反响热烈。Adobe 已重构 Photoshop 与 Premiere 的核心并将为 RTX Spark 发布，速度提升一倍，并通过 MCP 服务器实现对智能体友好的交互。这是 40 年来第一次伟大的 PC 重塑，全球 PC 产业几乎全员加入。

更进一步，微软与 NVIDIA 发布全新产品线——覆盖台式机、笔记本与工作站的三款革命性 Windows 机器，全部 100% 兼容 Windows、CUDA 与 NVIDIA AI Tensor Core。其中台式机（如微星机型）可让智能体 7×24 全天候运行、无按量计费，并连接家中笔记本、显示器、摄像头、家电与安防系统，成为随时间不断变聪明的个人 AI（从 Nemotron 3 Ultra 持续升级至更新版本）。面向开发者的 DGX Station 兼容 Windows、配备 768 GB 内存、20 PetaFLOPs 算力与每秒 8 TB 内存带宽，可在桌边运行万亿参数模型，部署时再迁入云端。

正如手机演变为智能手机，10 年后的 PC 将与今天截然不同：未来家庭中或将有一台运行所有智能体与助手的 AI 超级计算机，其角色更接近 R2-D2 或 C-3PO，而非传统 PC。NVIDIA 已为此制定路线图——每一代架构都将提供台式机、笔记本与工作站，且全球 100% 的 PC 产业均已加入。

十、物理 AI 与机器人：Cosmos、Alpamayo、Isaac GR00T

智能体 AI 本质上是数字机器人，会运行在各类计算机上：人形机器人、自动驾驶汽车、卫星，乃至农业、制造与重工业设备，甚至未来的基站（理解流量、与其他基站协同以降低能耗、提升频谱效率）。随时间推移，全球将有数百亿乃至上千亿个智能体系统在运转。

最大的难题是数据。语言模型的训练数据来自人类视角，而机器人数据须来自机器人视角；现实世界的视频多为第三人称，因此物理 AI 的数据问题最难。NVIDIA 沿此逐级推进：先用远程操作（人类示范，类比 RLHF），再用仿真（Omniverse，类比可验证奖励的强化学习 RLVR）为物理 AI 模型做引导，进而从第三人称数据学习并重投影到第一人称，最终得到能从任意视角理解物理世界的世界基础模型（World Foundation Model）。

今天发布的 Cosmos 3 是物理 AI 的前沿。在物理 AI 领域 NVIDIA 处于全球领先，Cosmos 3 可作为各类机器人工作的基础模型，能理解、推理、生成、仿真，并在闭环中充当策略本身，在全球排行榜上名列前茅。

（视频旁白）真实世界无限且不可预测，真实数据无法规模化，对物理 AI 而言"算力即数据"。Cosmos 是面向物理 AI 的开放前沿全能模型，基于全新的 Transformer 混合架构：像素、动作、声音与语言流入自回归 Transformer 进行推理与规划，并指挥扩散 Transformer 生成后续内容。它可作为 VLM 观察并描述世界、作为世界模型从图像/文本/视频生成物理精确的合成视频、作为仿真器为策略训练与评估闭环，并作为 NVIDIA OmniDreams（以动作为条件的世界模型）的基础逐帧预测未来；经后训练即成为感知—推理—规划—生成动作的世界动作模型。Cosmos 与 Nemotron 一样完全开放（开放模型、数据与训练方法），可被增强为专有模型。

AI 栈中模型最易理解，但完整栈还包含生成器、仿真器与运行时。汽车本质上是物理 AI（自动驾驶的智能体机器人），同样拥有复杂的栈。

今天发布的 Alpamayo 2 Super 是面向自动驾驶汽车的开放模型。签约 NVIDIA DRIVE Hyperion 的品牌约占全球汽车制造商的 80%，全球约 97% 的出行服务也已与 NVIDIA 对接；在 DRIVE Hyperion 运行时与 Halos 操作系统上部署后，可连接全球这些服务。它是全球首辆会推理的自动驾驶汽车——会持续"自言自语"地进行思考，完成路线规划、避让、让行、保持车距等操作。

这项技术同样适用于人形机器人。NVIDIA Isaac GR00T 是人形机器人栈，涵盖模型、数据生成、仿真与含操作系统的运行时。NVIDIA 的所有系统（云、PC、自动驾驶、人形机器人的智能体/机器人系统）采用完全相同的架构，并以极致协同设计垂直集成、再向所有人开放。机器人系统因电机、传感器众多而复杂脆弱，因此需要参考平台。

今天发布的 NVIDIA Isaac GR00T 参考人形机器人完全集成：每只手 25 个自由度（由 Sharpa 制造），全身 31 个自由度，6 英尺高、150 磅重，运行全新 Jetson Thor 与完整软件栈（数据生成、仿真、运行时），主要面向高校与研究者。

（视频旁白）通用人形机器人是 AI 的下一次飞跃，但搭建极难，各团队常从零拼凑仿真器、远程操作、数据管线与训练设施，耗时数月。NVIDIA Isaac GR00T 是开放开发平台：含开放模型、仿真与训练库、数据生成器，以及预配置好、数小时即可上手的机器人计算机。流程为：在 Isaac Lab 搭建仿真环境，用 Isaac Teleoperation 采集示范，用 Omniverse 与 Cosmos 把一次示范扩展为上千次合成数据，训练策略并在 Isaac Lab Arena 评估，再通过 Isaac ROS 部署到 Jetson Thor。各组件模块化、开放，可用 NVIDIA 的或自行替换。

十一、总结

过去六个月里，计算机产业被彻底改变：智能体得以实现，并与最新前沿模型收敛，使 AI 能够做有用的工作。这一计算范式将不断重复——智能体拥有模型，载体携带带技能的工具，运行于云、本地、PC 或机器人之上；范式相同，而载体、模型可按偏好选择并针对专有用途改进，甚至打造可供他人使用的超级智能体。

Vera Rubin 已全面投产：Grace Blackwell 为处理 AI（尤其推理）而生，Vera Rubin 则为运行智能体而生，是一整套解耦、分布式的智能体处理系统。NVIDIA 已成为基础设施公司，帮助客户尽快实现最大收入与利润。为智能体（而非为人）打造的 Vera CPU 具有独特需求，其订单已到，有望成为公司历史上最快、最成功的产品发布。

NVIDIA 与微软共同开启全新 PC 产品线，而相同的智能体计算范式未来还将运行于机器人、卫星、基站、工厂等各类设备，遍及云、本地与边缘。人们对个人电脑的认知很可能将因此改变。

宙世代

一起剪

相关标签