快科技 11 月 18 日消息,据媒体报道,NVIDIA 新一代旗舰 AI 芯片 Blackwell 被曝在高容量服务器机架中存在严重的过热问题,可能导致交付延迟。
有知情人士爆料称,Blackwell 芯片在装有 72 个处理器的服务器中使用时会产生过热问题,这些机器预计每个机架的功耗高达 120kw,过热会限制 GPU 性能并有损坏组件的风险。
对此,NVIDIA 发言人回应媒体称:" 我们正在与领先的云服务提供商合作,将其作为我们工程团队和流程中不可或缺的一部分。工程迭代是正常且符合预期的。将 GB200 这一迄今为止最先进的系统集成到各种数据中心环境中,需要与我们的客户共同设计。"
虽然面临技术问题,但 NVIDIA 的 AI 芯片需求依然强劲,全球近 90% 的市场仍由其控制,NVIDIA 表示:" 目前客户正在抢占 GB200 系统的市场先机 "。
值得注意的是,这并不是 Blackwell 芯片首次因设计缺陷而延迟交付,NVIDIA 于今年 3 月推出了 Blackwell 芯片系列,但在年中的时候,市场上开始流传 Blackwell 存在架构设计隐患的消息。
10 月晚些时候,NVIDIACEO 黄仁勋表示,在长期合作伙伴台积电的帮助下,NVIDIABlackwell AI 芯片的设计缺陷已经修复。
他当时预计,Blackwell 芯片将在第四季度发货,而如今据预计,改良后的 Blackwell GPU 最快要明年 1 月底才能出货。
登录后才可以发布评论哦
打开小程序可以发布评论哦