今天,英伟达的 NVIDIA GTC Taipei 2026,在早上 11 点,终于如约而至了了。
发布了很多的东西,但是有一个东西,是我觉得真正具有历史意义的,必须要单独拿出来的说的。
甚至,它让英伟达喊出了,个人电脑诞生 40 年以来,这次,要重新定义。
"A New Line,A New Beginning"
而这一切,都是因为一个全新的消费级芯片。
也就是传说中的,被各种爆料了很久的代号为 N1X 的芯片。
RTX Spark。

就是这么个小小的东西。
可以说,这是我在今年上半年最期待的一场 AI 大会,因为在这个时代,你几乎很难看到,几个巨头联手预热,只为这一场发布会。

PC 的新时代。
可能也只有英伟达,能攒起这样的局了。
那一串奇怪的数字,正是这次老黄演讲的地点,台北流行音乐中心。

在看完今天的发布会以后,我相信没有人会不再相信这句话了。
整个上半年的 AI 的进展,几乎都是 OpenClaw、Claude Code、Codex 等等等等。
背后,全部都是云端大模型。
但是 ToC 端的硬件层面,几乎毫无进展。
可试问,又有谁不想真正的把大模型和 Agent,部署在自己的本地端呢,低延迟、隐私保护、无需网络,不仅仅是进行推理,甚至可以微调,那种自由又安全的感觉,永远会让人迷恋。
我们需要新的硬件,也需要新的芯片,需要一些更有趣的想象。
而这一切的目光,几乎都聚焦在了这次的 NVIDIA GTC Taipei 2026 上。
终于,RTX Spark 如约而至。

如果比较关注英伟达或者过去打游戏比较多的朋友,可能对 RTX 和 Spark 这两个独立的单词都比较熟。
RTX 就是英伟达的消费级产品线,大家见的最多的,就是各种显卡,比如 RTX 5080。
Spark 其实同源于去年的一个面向开发者的 DGX Spark,只不过这次被正式升级成了一整套英伟达全新的业务线。
于是,RTX Spark 出炉了。
,时长 01:39
这视频看的我起鸡皮疙瘩了。
整体参数如下。

RTX Spark 的底层应该是跟 DGX Spark 相同的 GB10 芯片,因为我看这次的旗舰版的参数和之前差不多。
最高 1 PFLOP 的 FP4 AI 性能,20 个 CPU 核心、6144 个 GPU 核心和 128GB 的 LPDDR5X 统一内存。
能直接在本地轻轻松松跑 120B 的模型。
这次发布会上,老黄还秀了一把未来所谓搭载 RTX Spark 的合作品牌方做的电脑。

你可以在一台厚度为 14mm、未插电的笔记本电脑上渲染一个 90GB 的 3D 场景、编辑 12K 分辨率视频。
非常离谱。。。
而且,不仅有很薄但性能爆炸的全新笔记本,还有类似于 Mac Mini 那种功耗很低的小盒子。

所以最近联想、HP、ARM 大涨啥的,不是没有原因的。
能在个人消费级的电脑里,直接用统一内存的方式,以超高速 + 全面 CUDA 生态支持,来本地跑 AI 大模型,这应该是整个 PC 领域头一遭。
而且微软会跟英伟达一起,全面重构 Windows 系统,让搭载 RTX Spark 的电脑,原生支持本地 Agent 的运行。
Windows 生态,感觉有救了,英伟达来当救世主了。
真的,无愧于个人 PC 新时代这个比喻。
感觉上,明年全新的 Windows 系列的换机潮要来了。
我觉得要理解 RTX Spark 的历史意义,还是得说一个我觉得大家需要知道的东西:
就是到底啥是统一内存?它有啥用?
在过去,我们传统的电脑里,一般有两个大家所熟知的最核心的东西,一个叫 CPU,一个叫 GPU。
这个叫 CPU,我用 AI 画了一张。

GPU 大家肯定都很熟了,在电脑上,经常就是我们常说的显卡,比如我的这个 5080。

CPU 和 GPU 他两呢,各有各的内存,是分开的两块。
CPU 用的叫系统内存(RAM),GPU 用的叫显存(VRAM),两边要交换数据得通过一条通道来回搬。
而统一内存呢,大概就是把这两块合成一块,CPU 和 GPU 共用同一个内存池,谁都能直接访问。
苹果把这套玩意搞成了自己的主流,你现在买的 Mac,几乎都是统一内存了。

但是 Windows 生态,CPU 和 GPU 都是不同厂家做的做的,受限于过去的生态,过去也有人搞过,但是也都拉了,也从来没有人能把这么多上下游,联合起来大搞特搞。
这么大的阵仗,英伟达是第一个。
而这个统一内存,对于跑大模型来说,真的几乎就是决定生死的差别。
上面我们也说了,传统 PC 的内存架构是分裂的,CPU 有自己的系统内存(RAM),GPU 有自己的显存(VRAM),两者之间靠一条叫 PCIe 的东西连起来。

比如,CPU 有一块系统内存,我们按 64GB RAM 来算,GPU 又有一块自己的显存,比如 RTX5080 的 16GB VRAM。
你想在本地跑一个大模型,比如量化后的 70B 模型,可能要几十 G 内存,你的电脑内存看起来有 64GB,但 GPU 真正能高速使用的只有那 16GB 显存。
一旦模型太大,显存放不下,就要把一部分权重放在 CPU 的系统内存里,GPU 每次需要这部分权重,就得通过 PCIe 去系统内存里拿。
GPU 读自己的显存,带宽大概 1TB/s,非常快。
但是 PCIe 这条连接 CPU 内存和 GPU 的通道,像 PCIe 4.0 x16 单向带宽只有大概 32GB/s,差了三十倍,纯龟速。
所以,你的模型还是跑不动,或者跑的很慢。
统一内存解决的主要问题就是这个。
它可以把 CPU 和 GPU 的内存变成一个共享池,比如一台机器有 128GB 统一内存,那么 GPU 就可以直接使用这个大池子里的很大一部分。那这样你跑本地大模型的时候,就不再被一张显卡的 16GB、24GB、32GB 显存限制得那么死。
统一内存在消费级单机上,几乎是跑本地大模型唯一优雅的解法。
数据中心就是另一个世界了,那条路跟我们普通消费者就没啥关系了。
说到这,那我觉得,你肯定想问,那既然统一内存这么牛逼,我买 Mac 不就行了,Mac 也有 128G 的统一内存的版本,我买 RTX Spark 干啥?
这是个非常好的问题,有一个答案还是挺重要的,那就是英伟达真正的杀手锏。
CUDA。

CUDA 这个词,很多关注 AI 的朋友应该都听过,但它到底是什么,为什么这么重要,我觉得还是值得认真聊一下。
很多人以为 CUDA 就是英伟达的显卡驱动,或者只是什么 GPU 加速技术。
这么理解也不能说错,但它远不止于此。
CUDA 是一整套的生态,最牛逼的生态。

底层,它让你能把 GPU 当成通用计算器来编程,除了渲染画面,还能做数学计算。
中层,是一堆被打磨了将近二十年的数学库。cuBLAS 做线性代数,cuDNN 做深度学习的基础运算,TensorRT 做推理优化,NCCL 做多卡通信,FlashAttention 这类关键优化,CUDA 路线最成熟,很多新特性也会优先围绕 NVIDIA GPU 做适配。
还有老黄这次演讲里反复强调的 CUDA-X,为所有的 Agent,开放的 CUDA 库,能让 Agent 直接调用,这下更离谱了。。。

里面有一整套横跨科学计算、工程仿真、芯片设计、基因组学、通信网络、机器人和物理仿真等等的加速库。
比如 cuLitho 做计算光刻,cuOpt 做决策优化,cuDSS 做稀疏矩阵求解,AI-Q 做对结构和非结构化文档做深度研,Warp 做可微分物理,Parabricks 做基因组学等等等等。

用老黄的话说,数学,太美妙了。
CUDA,太牛逼了。
上层,就是 PyTorch、TensorFlow、JAX,几乎所有深度学习框架的 GPU 后端,默认且首先支持的就是 CUDA。
从 2006 年做到现在,CUDA 积累了海量的优化库、教程、代码、生态等等。你今天去看学术论文放出来的开源代码,绝大多数都是在 CUDA 上写和测的,你今天遇到任何深度学习的问题去搜解法,搜出来的答案也几乎都是默认假设你在用 CUDA。
整个 AI 工程界的母语,就是 CUDA。
这也是 Apple 一直以来的一个痛点。
它的统一内存确实牛逼,但它的 GPU 用的是 Metal,机器学习框架是 MLX。
社区里绝大部分开源模型、训练代码、微调工具,都是先在 CUDA 上做好的,然后才慢慢有人移植到 MLX,而且推理还好说,但是训练和微调在 Apple 上的生态到今天还是非常薄弱。
所以你现在应该能理解,RTX Spark 为什么让整个行业都在期待了。
因为在 RTX Spark 之前,想要 CUDA 和想要统一内存的能效,这两件事在 PC 上,是不可兼得的。
RTX Spark 第一次把这以前打架的东西捏到了一起。
这是以前任何一个单一平台都给不了的组合。
这才是 RTX Spark 真正的最牛逼的地方,也是最大的差异化。
运行人类至今创造过的一切,外加 Agent。
而基于 CUDA 生态,这次,像 Adobe 之类的,会针对 RTX Spark 进行全面优化。
比如 Adobe 直接重新为 RTX Spark 设计了 Photoshop 和 Premiere 的核心架构,拥有高达两倍的速度,而且,还原生支持 Agent 调用。

而且,这一次,英伟达和微软还要一起携手,来重塑 Windows 上的 Agent 生态,虽然这块是后面才会跟纳德拉具体直播去聊,但是也透了一点东西出来。
包括全新的 Windows 安全基元,能为 Agent 的原生构建与运行提供身份认证、隔离防护、策略管控和端到端安全能力。
还有英伟达自己的 Open Shell。

一套面向 Agent 的 Windows PC 平台就能看出来了。
底层是 RTX Spark 提供的硬件能力。
第二层是 Windows 的系统,微软会把 Windows 往 Agent 时代来改。
第三层就是是安全运行环境。
也就是 Windows security primitives + NVIDIA OpenShell。
可以说,未来任何一个想要在本地电脑上跑大模型的开发者或者创作者,从硬件上来说,RTX Spark 的机器,几乎就是最优解。
如果你还想打游戏,那相信我,你没有别的选择了。
仅此一家,只有 RTX Spark。

A New Line,A New Beginning。
这就是,个人电脑的新时代。
它,不止是为你设计的,还是为 Agent 所设计的。
不止兼容着过去,还带着过去。
走进了,下一个未来。


登录后才可以发布评论哦
打开小程序可以发布评论哦