快科技 5 月 18 日消息,投资银行摩根士丹利在最新报告中指出,超大规模数据中心运营商使用英伟达当前的 Blackwell AI GPU 构建一座 1 吉瓦规模的数据中心,其建造成本将是使用谷歌 TPU 或亚马逊 Trainium 芯片构建同等规模数据中心的两倍。
尽管英伟达 Blackwell 芯片的数据中心建造成本翻倍,但摩根士丹利认为其计算效率远超定制芯片。
摩根士丹利在报告中将英伟达多款 GPU 与亚马逊及谷歌的定制 ASIC 芯片进行了每瓦 TFLOPS 性能对比。测算结果显示,英伟达芯片的每瓦性能比这些定制 ASIC 芯片高出 2 到 8 倍。
此前,英伟达 CEO 黄仁勋曾多次公开表示,英伟达芯片虽然价格高昂,但长期来看能为客户带来更高的回报。
在具体每瓦浮点运算性能得分中,英伟达计划推出的下一代 Vera Rubin(FP4)架构芯片得分高达 19.5,位居榜单第一。英伟达其他芯片 Vera Rubin(FP8)得分为 6.8,GB300(FP8)得分为 6.0,H100(FP8)得分为 3.1。
作为对比,谷歌的 TPUv7(FP8)得分仅为 4.3,亚马逊的 Trn3(FP8)得分仅为 2.5,两者的定制芯片性能基本介于英伟达 Blackwell 与上一代 Hopper 之间,部分指标甚至低于 Hopper。
不过评估 AI 芯片还有其他维度。人工智能基础设施提供商 Nebius 分析指出,另一大关键标准是每百万 Token 的生成成本与 GPU 每小时运行成本的比值。
根据 Nebius 测算,Groq AI 芯片每生成百万 Token 的成本为 5 到 10 美分(约合 0.34 至 0.68 元人民币),其生成速度达每秒 800 个 Token。
英伟达 Blackwell 芯片每生成百万 Token 的成本则为 25 美分(约合 1.70 元人民币),生成速度约为每秒 450 个 Token。



登录后才可以发布评论哦
打开小程序可以发布评论哦