《科创板日报》10 月 14 日讯 日前,一则有关 "2 美元 / 小时出租 H100:GPU 泡沫破灭前夜 " 的报道引发国内市场高度关注。相关文章指出:
英伟达 H100 GPU 在 2023 年 3 月上市之后,因需求激增供不应求,其租赁价格从最初的每小时 4.7 美元一度飙升至每小时 8 美元以上。但今年以来,H100 开始 " 供过于求 ",每小时租赁价格降至 2 美元左右。
价格下跌是由于多方面因素导致:1)有些长期预订 H100 的公司完成模型训练之后,转售闲置未使用的算力;2)许多公司不再从头训练新模型,转而微调开放模型,算力需求大幅降低;3)专注构建大规模基础模型的新创公司数量大幅减少;4)H100 的替代品出现,如 AMD 和英特尔 GPU,等等。
对这篇报道进行溯源后可以发现,海外主流媒体及主要科技媒体暂未进行相关报道,原报道标题为《$2 H100s: How the GPU Bubble Burst》(2 美元 H100:GPU 泡沫是如何破灭的),来自于一个名为 Latent Space 的网站,原文作者为 Eugene Cheah。
根据网站介绍,Latent Space 主要聚焦于 AI,形式集内容讯息、博客、社区为一体,由 swyx 及 Alessio Fanelli 共同主持,前者的社交平台账号并未给出具体身份自我介绍,后者则为早期风投公司 Decibel VC 的合伙人和 CTO。
原文作者 Eugene Cheah,则为初创公司 Featherless.Ai 的 CEO。
据 Cheah 在 "GPU 泡沫 " 一文原文末尾介绍,Featherless.Ai 目前托管着全球最大的开源 AI 模型," 每月 10 美元起,可立即访问,无限制请求,价格固定;可通过无服务器方式即时推理,无需昂贵的专用 GPU"。
▌ H100 租赁价格下跌 = GPU 泡沫破灭?
在 "GPU 泡沫 " 一文原文中有张配图,那是法国艺术家让 - 莱昂•热罗姆在 1882 年创作的油画《郁金香狂热》(Le Duel à la tulipe)。
这幅画描绘了有记录以来历史上第一次投机泡沫—— 17 世纪荷兰的 " 郁金香狂热 ",郁金香价格在 1634 年持续攀升,并于 1637 年 2 月崩盘,投机者手中只剩下最初投资额的 5%。
三百多年前的投机泡沫会否再次上演?这个问题牵动着每一位 AI 投资者的神经,或许也是这一次 "H100 租赁价格下跌 " 一文在 AI 圈引发高度关注的原因。
从算力租赁商 Vast.ai 网站报价可以看到,1x H100 的一小时租赁报价确实已经在 2~3 美元区间内。
Vast.ai 报价
但 H100 租赁价格下跌,真的能和 "GPU 泡沫破灭 " 画上等号吗?
一方面,从 Eugene Cheah 的文章来看,"H100 价格下跌 " 可能用 " 分化 " 来形容更为合适——持续下降的主要集中在小规模集群的租赁价格,相较之下,大规模算力集群的价格则可能维持在较高水平。
而这些大规模算力集群背后,多是诸如特斯拉、微软、OpenAI 一类的科技巨头。Omidia 数据显示,H100 发布之后的那个 2023 年第三季度,其出货量达到 65 万张,其中仅 Meta 和微软就分别拿下了 15 万张,占比接近一半。
另一方面,电子产品都有着更新迭代周期,GPU 芯片同样如此。之前英伟达下一代 GPU Blackwell 系列传出设计存在缺陷,可能延迟出货。但摩根士丹利上周发布报告称,Blackwell 的生产正在 " 按计划进行 ",且未来 12 个月左右的供应已经售罄,这意味著现在下订单的客户要到 2025 年底才能收到货," 这将继续推动对现有 Hopper 架构产品的强劲短期需求 "。
H100 租赁价格并非骤然暴跌,波动已有时日。从 A100 到 H100,从 H100 到 H200,再到未来的 Blackwell,新品出世势必带来前代产品的没落,更妄论 Blackwell 算力成本有望比 Hopper 进一步降低。
黄仁勋这位英伟达 " 掌舵人 " 也在日前现身说法。在接受 Altimeter Capital 采访时他强调,对英伟达的持续看涨与互联网泡沫顶峰时期围绕思科的狂热完全不同。英伟达正在 " 重塑计算 ",未来将是 " 高度机器学习 " 的时代。
" 摩尔定律已经基本宣告终结 ",他表示,为了提供必要的算力以跟上未来计算密集型软件的步伐,未来 4~5 年内,现有数据中心将需要价值约 1 万亿美元的 GPU 来实现升级。
必须承认的是,"AI 泡沫 " 论的警钟敲了又敲,"AI 投资回报难达预期 " 的质疑声音一浪高过一浪,一边是 OpenAI 抱怨算力上线不及时不够用、英伟达新品售罄,另一边是算力租赁价格不断下降、还有公司 " 甩卖 "GPU。
但局部、短期的算力过剩或短缺,似乎已难以代表 AI 的全盘局面,对于供需两方、多空两边来回博弈的 AI 领域来说,在硬件端之外,或许亟待更多新故事。
登录后才可以发布评论哦
打开小程序可以发布评论哦