驱动之家 9小时前
国产显卡性能飞跃 摩尔线程S5000优化后AI速度已达NVIDIA H100的60%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 12 月 20 日消息,前不久国产 GPU 初创企业摩尔线程上市,市值一度达到了 4000 多亿元,今天该公司又发布了新一代 GPU 架构,AI 及游戏性能大涨,其中游戏性能飙升了 15 倍。

即便是当前一代的显卡中,摩尔线程也在不断联合伙伴优化,硅基流动今天宣布在 S5000 显卡上实现了国产 GPU 推理性能的飞跃。

根据他们的实测数据,经过系统级工程优化与 FP8 精度加速,摩尔线程 MTT S5000 单卡 Prefill 吞吐达到 4000 tokens/s 以上,Decode 吞吐超过 1000 tokens/s。

这是什么概念,他们对比了 NVIDIA 的 H100 显卡,Prefill 阶段同场景下 H100 性能约为 6500 tokens/s,在 MTT S5000 上实现了 4000+ tokens/s 的实测吞吐,达成了 NVIDIA H100 逾 61% 的实测性能。

虽然也只是 Prefill 阶段的性能,但是 S5000 能有 H100 显卡 60% 以上的性能绝对是国产显卡中的一大进步。

MTT S5000 是摩尔线程基于平湖 GPU 架构推出的 AI 显卡,首次支持 FP8,性能可以达到 1024TFLOPS,而 H100 的 FP8 性能接近 4000TFLOPS。

关于硅基流动与摩尔线程是如何优化 S5000 显卡的,详情可以参考他们的官方稿件,这件事可以说明国产的显卡尽管参数上可能还落后不少,但通过工程优化还能不断提升性能表现,某些方面是有意想不到的变化的。

摩尔线程现在不足的地方除了硬件规模和工艺受限等因素,软件生态当然也无法跟 NVIDIA 相比,但这部分随着国内厂商的通力合作已经在起变化,未来几年在硬件规模及软件生态不断发展下,不论是 AI 还是游戏卡,拿出让 NVIDIA 感受到压力的产品也不是没可能。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

摩尔 nvidia ai gpu
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论