快科技 2 月 3 日消息,DeepSeek 大模型的出色表现引发美国 AI 行业上下震动,不仅性能与 OpenAI O1 旗鼓相当,更关键的是训练成本低得多,也引发了美国政府的猜疑和调查,新加坡都被牵扯进来。
DeepSeek 官方没有详细披露大模型训练的硬件规模,只说用了数量有限的 2048 颗 H800 GPU,在两个月内训练了 6710 亿个参数的 V3 大模型,相当于 280 万个 GPU 小时。
相比之下,Meta 花了 16381 颗 H100 GPU、54 天实现,训练了 4050 亿个参数的 Llama 3 大模型,相当于 3080 万个 GPU 小时,硬件成本相差多达 11 倍。
半导体研究机构 SemiAccurate 提出,DeepSeek 应该囤积了大约 6 万颗 NVIDIA GPU,包括 1 万颗 A100、1 万颗 H100、1 万颗 H800、3 万颗 H20,总成本超过 140 亿元。
其中,A100、H100 始终都在美国限制对华出口只列,H800 作为特供版一度合规,之后也被限制,目前只有 H20 是完全合规的。
欧美普遍认为,DeepSeek 通过美国出口监管漏洞,获得了 NVIDIA 高端的 H100 GPU,而且数量不少,最多可能有 5 万颗。
根据 NVIDIA 的财报,2022 年底,美国刚刚限制 AI 芯片对华出口的时候,新加坡贡献的收入占比只有 9%,但是到了现在,这个比例已经高达 22%,显得很不正常。
因此,美国白宫、FBI 等机构正在调查,DeepSeek 是否通过位于新加坡的第三方公司,获得了管制出口的 NVIDIA AI GPU。
同时,美国有关人士呼吁对新加坡进出口采取更严格的监督、管控措施,避免受限产品转而进入中国。
不过,截至目前,美国政府尚未发现任何确凿证据。
NVIDIA 则回应称,已知严格遵守法律要求,与新加坡的大多数交易都是运往其他地方的货物,而不是中国。
NVIDIA 强调,与新加坡相关的收入并不意味着转移到中国,其公开文件显示的是客户账单地址而非发货地址。
登录后才可以发布评论哦
打开小程序可以发布评论哦