国产显卡性能飞跃摩尔线程S5000优化后AI速度已达NVIDIA H100的60%

快科技 12 月 20 日消息，前不久国产 GPU 初创企业摩尔线程上市，市值一度达到了 4000 多亿元，今天该公司又发布了新一代 GPU 架构，AI 及游戏性能大涨，其中游戏性能飙升了 15 倍。

即便是当前一代的显卡中，摩尔线程也在不断联合伙伴优化，硅基流动今天宣布在 S5000 显卡上实现了国产 GPU 推理性能的飞跃。

根据他们的实测数据，经过系统级工程优化与 FP8 精度加速，摩尔线程 MTT S5000 单卡 Prefill 吞吐达到 4000 tokens/s 以上，Decode 吞吐超过 1000 tokens/s。

这是什么概念，他们对比了 NVIDIA 的 H100 显卡，Prefill 阶段同场景下 H100 性能约为 6500 tokens/s，在 MTT S5000 上实现了 4000+ tokens/s 的实测吞吐，达成了 NVIDIA H100 逾 61% 的实测性能。

虽然也只是 Prefill 阶段的性能，但是 S5000 能有 H100 显卡 60% 以上的性能绝对是国产显卡中的一大进步。

MTT S5000 是摩尔线程基于平湖 GPU 架构推出的 AI 显卡，首次支持 FP8，性能可以达到 1024TFLOPS，而 H100 的 FP8 性能接近 4000TFLOPS。

关于硅基流动与摩尔线程是如何优化 S5000 显卡的，详情可以参考他们的官方稿件，这件事可以说明国产的显卡尽管参数上可能还落后不少，但通过工程优化还能不断提升性能表现，某些方面是有意想不到的变化的。

摩尔线程现在不足的地方除了硬件规模和工艺受限等因素，软件生态当然也无法跟 NVIDIA 相比，但这部分随着国内厂商的通力合作已经在起变化，未来几年在硬件规模及软件生态不断发展下，不论是 AI 还是游戏卡，拿出让 NVIDIA 感受到压力的产品也不是没可能。

宙世代