快科技 12 月 20 日消息,前不久国产 GPU 初创企业摩尔线程上市,市值一度达到了 4000 多亿元,今天该公司又发布了新一代 GPU 架构,AI 及游戏性能大涨,其中游戏性能飙升了 15 倍。
即便是当前一代的显卡中,摩尔线程也在不断联合伙伴优化,硅基流动今天宣布在 S5000 显卡上实现了国产 GPU 推理性能的飞跃。
根据他们的实测数据,经过系统级工程优化与 FP8 精度加速,摩尔线程 MTT S5000 单卡 Prefill 吞吐达到 4000 tokens/s 以上,Decode 吞吐超过 1000 tokens/s。
这是什么概念,他们对比了 NVIDIA 的 H100 显卡,Prefill 阶段同场景下 H100 性能约为 6500 tokens/s,在 MTT S5000 上实现了 4000+ tokens/s 的实测吞吐,达成了 NVIDIA H100 逾 61% 的实测性能。
虽然也只是 Prefill 阶段的性能,但是 S5000 能有 H100 显卡 60% 以上的性能绝对是国产显卡中的一大进步。

MTT S5000 是摩尔线程基于平湖 GPU 架构推出的 AI 显卡,首次支持 FP8,性能可以达到 1024TFLOPS,而 H100 的 FP8 性能接近 4000TFLOPS。
关于硅基流动与摩尔线程是如何优化 S5000 显卡的,详情可以参考他们的官方稿件,这件事可以说明国产的显卡尽管参数上可能还落后不少,但通过工程优化还能不断提升性能表现,某些方面是有意想不到的变化的。
摩尔线程现在不足的地方除了硬件规模和工艺受限等因素,软件生态当然也无法跟 NVIDIA 相比,但这部分随着国内厂商的通力合作已经在起变化,未来几年在硬件规模及软件生态不断发展下,不论是 AI 还是游戏卡,拿出让 NVIDIA 感受到压力的产品也不是没可能。



登录后才可以发布评论哦
打开小程序可以发布评论哦