雷科技 昨天
英伟达的CPU野心藏不住了:巴掌大能跑大模型,首秀就要掀桌子
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

前段时间市值刚破 4 万亿美元的英伟达,依然在四面出击。日前,黄仁勋到访中国,英伟达宣布恢复 H20 在中国市场的供货,且将推出一款全新且完全兼容的 NVIDIA RTX PRO GPU,黄仁勋称该产品 " 是为智能工厂和物流打造数字孪生 AI 的理想选择 "。

在牢牢占据 GPU 王座的同时,英伟达正在加速侵入 CPU 市场。在前段时间举办的台北电脑展上,英伟达正式发布了 GB10 超级芯片,作为他们进军 CPU 市场的先锋。此前雷科技也曾写过一篇文章,详细分析了 GB10 在 CPU 市场的定位,不过当时确实没有想到首款产品会这么快就发布。

根据最新消息,华硕将在 7 月 22 日举办一场发布会,正式发布搭载英伟达 GB10 的 Ascent GX10,华硕将其称为 " 掌上 AI 超算 "。单凭这个描述,我想大家就已经多少猜到 Ascent GX10 的产品定位了,一款超迷你的 AI 工作站。

图源:华硕

老实说,在此之前我确实没有想过一台工作站级别的 AI PC,可以做得只有巴掌大小,英伟达似乎正在以一种野蛮的方式,改写整个 AI PC 市场。

从华硕公布的数据来看,Ascent GX10 搭载了一颗 NVIDIA GB10,算力约为 1000 TOPS(FP4),并配备了 128 GB LPDDR5X 的统一内存,256-bit 位宽,总带宽为 273GB/s,标配 1TB 固态硬盘,官方最高可选配 4TB。

单从配置来看,最大的特点就是高达 128GB 的内存,不过 GB10 的内存是直接集成在芯片内部,并不支持单独升级。英伟达给到如此多的内存,其实就是为了确保 PC 的性能可以满足 AI 模型的推理需求,后续或许会增加别的内存规格供大家选择,比如 192GB 版本,以便适配更大参数规模的 AI 模型。

如果不考虑其他因素影响,这个规格的 PC 最高可以在 FP4 精度下运行参数规模达到 200B 的 AI 大模型(FP4 精度),如果是 FP8 精度则是 100B 参数规模。虽然与动辄六七百 B,甚至上千 B 的满血 DeepSeek 等 AI 模型无法比,但是已经足够部署一个甚至数个专业垂类 AI 模型。

所以,不难看出英伟达对这款产品的定位,并非为了运行超大规模的 AI 模型设计,而是作为企业的桌面 AI 解决方案来提供的。一些不方便放到云端的数据和 AI 模型,可以直接在 Ascent GX10 上运行,不需要担心数据在云端泄漏风险。

不过,这款 PC 的售价高达 2999 美元(约合人民币 21494 元),想要给每个人都配一台似乎不太现实?其实这种想法最开始就是错误的,AI PC 工作站与传统 PC 的使用方式其实并不相同,你可以将其看做一个部署在你身边的小型服务器,周围的 PC 可以通过无线或有线网络的方式桥接到 Ascent GX10 上,在调用 AI 功能时再将运算交给 Ascent GX10。

以这种方式部署的话,理论上一台 Ascent GX10 可以满足一个小组(10 人以内)的轻度 AI 需求,或者满足 4~5 人的常规 AI 需求,此时再将成本分摊一下的话,你会发现其实并不算贵(特别是对欧美企业来说)。

此外,对于 AI 研究、开发等方面的人员来说 Ascent GX10 就像是一个可以随身携带的 AI 开发套组,这玩意的性能可比一般的笔记本电脑强多了,不管是接入随身屏幕还是酒店屏幕,都可以随时进行 AI 开发和调试。

而且,据英伟达透露,采用 GB10 的 AI PC 工作站均支持双机直连(通过 ConnectX-7),可以通过这种方式将算力和统一内存直接翻倍且损失的性能在可接受范围内,而且在这种情况下将支持最高 405B 的 AI 模型运行,参数规模已经接近满血版 DeepSeek 的三分之二。

除了可以作为桌面 AI 工作站部署外,Ascent GX10 仅 3L 大小的机身也让其成为边缘计算设备的选择之一,可以被部署在一些关键的边缘网络节点中,充当 AI 推理的计算中枢。

图源:servethehome

虽然从 AI 性能上来看,一台以 GB10 为核心设计的 Ascent GX10 与一张 RTX 5070Ti 差不多,而后者售价仅为 749 美元。但是,RTX 5070Ti 过高的性能和过大的体积,加上配套的一系列硬件,使其并不能直接满足对设备体积有严格要求的使用场景,更何况其显存只有 16GB,支持的 AI 模型数量也远不及前者。

单就迷你 AI PC 工作站这个赛道来说,以 Ascent GX10 为代表的产品可以说是独一无二的,至于性能如何,我只能说在同等体积下,你可能找不到比他更强的 AI PC。

既然是英伟达十分看重的第一款 Arm 架构 CPU,自然不会只有华硕一家品牌跟进,从小雷查询到的信息来看,戴尔、 惠普、联想都有计划在 Q3 季度发布基于 GB10 打造的迷你 AI PC 工作站,而宏碁、技嘉、微星等品牌则会在 Q4 季度跟进,相关产品的测试机已经在台北电脑展上展出过。

不难发现,基本上 PC 市场里叫得上名号的一、二线国际 PC 品牌基本来齐了,作为当下的半导体龙头,英伟达的号召力可见一斑。不过,根据进一步的搜索,我们发现以上品牌的首批产品均归属于 NVIDIA DGX Spark 计划,如无意外应该是采用相同的主板设计,只不过在设计等方面存在区别。

图源:惠普

以华硕为例,他们就选择了极致小型化的路线,仅 3L 的大小甚至可以被单掌托起,是目前已公布的迷你 AI PC 工作站里最小的,其余几款都在 4L 以上。不过,即使外观有所不同,其硬件规格和接口配置也基本相同,所以小雷猜测他们的售价也会十分接近。

当然,如果在功能上真的一点区别都没有,那么这个市场也将缺乏竞争,所以一些品牌也努力做出了一些独有的卖点。比如惠普的 ZGX Nano AI Station 就主要面向媒体与教育市场,预计将提供更多的多媒体接口,而联想则是为企业及用户提供一系列的全栈解决方案,可以帮助客户快速完成 Lenovo ThinkStation PGX 及周边配套设备(联想的 GB10 迷你 AI PC)的部署。

图源:雷科技

对于正处在 AI 风口的企业来说,Ascent GX10 等迷你 AI PC 工作站可以提供一个便捷且强大,还具有一定性价比的开发平台,这也是其他类型 PC 工作站难以给到的。甚至从某种程度上来说,以 Ascent GX10 为代表的 PC 才是正式引爆 " 个人 AI 超算 " 概念的起始点。

在此之前,AI 超算型 PC 的体积、价格都不便宜,即使是用消费级显卡来组装 PC 也同样如此,而且消费级显卡还往往缺乏足够的开发生态支持,而 GB10 的出现则改变了这一点,

很多人或许觉得花两三万买一台迷你 PC 很贵,事实上这类产品对标的是此前售价在 3 万 -10 万元的传统 GPU 工作站,而非普通的个人电脑,对于企业来说两三万的生产工具投入成本并不算高,只要它足够好用即可。

那么 Ascent GX10 等产品好用吗?即使尚未正式开售,我们也能从英伟达官网及各品牌的描述里看到,Ascent GX10 等产品走的是正儿八经的 " 企业线 ",可以获得来自英伟达及品牌供应商的企业生态支持(即使并非全部),但也拥有消费级显卡所不具备的优势,使其更适合用于 AI 开发和部署。

图源:英伟达

不过对于规模较大或有更高性能要求的企业来说,GB10 的性能确实有点不够看,但是英伟达也早有准备,在戴尔的 Dell Pro Max 展示页面中,除了有搭载 GB10 的迷你款外,还有搭载 GB300 的桌面款。后者的配置则极为夸张,拥有 496GB LPDDR5 内存和 288GB HBM3e 显存,FP4 算力高达 20000 TOPS,可支持最高 10000B 参数的 AI 模型。

过去,类似算力的 AI 工作站都是机柜级别的(立式空调见过吧?机柜比那玩意还宽大,只是没那么高),现在却已经能被浓缩到一个桌面机箱级别的设备里,不得不让人感慨半导体技术之快。

在雷科技看来,迷你化的 AI 工作站必然会成为未来的趋势之一,就像普通计算机从原本占据整个房间的设备,变成能被随身携带。随着 AI 的需求增长,AI 工作站也必然会出现类似的变化:个人化、便捷化、一体化,如此才能更好地迎合 AI 普及的需求。

老实说,英伟达的这一招确实狠,对于英特尔和 AMD 来说,他们现在或许要重新考虑自己的 AI 战略了。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英伟达 ai 华硕 黄仁勋 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论