上个月有报道称,英伟达新款中国特供版计算卡的型号可能是 "B30",基于 Blackwell 架构芯片打造,估计定价在 6500 美元至 8000 美元之间,远低于远低于 H20 的 1 万美元至 1.2 万美元。其可能通过 ConnectX-8 SuperNIC 连接,利用 PCIe 6.0 交换机,满足 GPU 到 GPU 的通信需求,并非大家所认为的 NVLink 来实现 " 多 GPU 扩展 " 功能。
据 Wccftech报道,来自某间中国的互联网公司估算,新款中国特供版计算卡 B30 的性能约为 H20 的 75%,其已经在 6 月下旬下单了数十万块,订单总金额达到了 10 亿美元,预计 8 月开始交付。
传闻英伟达希望今年末之前能出货数百万块 B30 计算卡,速度变慢主要原因是使用 GDDR7 代替了过去的 HBM 模块,另外还有一些技术上的削弱。即便性能下降,中国市场的需求仍然是巨大的,大家都在寻找一种具有成本效益的推理解决方案,因为模型训练阶段已经用以前的 AI 芯片完成了,比如 H100 计算卡。B30 也能用于中小型机型,对于中国庞大的用户群体来说,新款产品可以为客户提供低成本计算的选择。
围绕 B30 构建的机架级解决方案性能不但更高,而且更高的成本效益可能会更具吸引力,预计 B30 的能效比起 H20 会高出 30%,采购成本低 40%。虽然暂时还不清楚 B30 的细节,但是很明显,英伟达瞄准了中国更广阔的人工智能市场,推出针对性的设计。
登录后才可以发布评论哦
打开小程序可以发布评论哦