快科技 8 月 3 日消息,国产 GPU 近年来不断取得突破,前不久砺算科技的 7G01 芯片性能达到了 RTX 4060 级别,更早之前摩尔线程也推出过高性能 GPU,不仅在游戏方面可圈可点,AI 也是一大重点。
在 AI 领域当前最强的 GPU 是 NVIDIA 推出的,硬件架构及 CUDA 生态构筑了几乎难以逾越的壁垒,那国产 GPU 在这方面到底差距多大?这事引发了很多争议,知乎用户 @菽陌松囿作为业内人员,有过实际测试,公布了一些数据值得参考。
根据他的说法,(摩尔线程的 GPU)kernel launch 做到 5us,nv 大概是几十 us(有点忘记了),gemm mfu 做到 98%,nv 大概 85%,FA mfu 做到 95%,nv 是 68%。
此外,他还提到了 N 卡的一些不足,比如通信 offload ace,nv 根本就没考虑,是 DeepSeek 帮他们做的 sm 隔离,15% 的 sm 是浪费的。
当然,摩尔线程的 GPU 也不是没有问题,比如支持 Link 但带宽受限于硬件还有些差距,但这不是障碍。
他强调这些数据是经过研发同事确认的,不会糊弄同仁,意味着这些数据结果相当靠谱,反正这番对比下来还是有些让人惊喜的,也颇为意外。
总体来说,他认为摩尔线程的 GPU 从硬件、kmd、umd 算子库全部都是重写的,反击了那些认为摩尔线程没有东西的人的说法。
他援引的数据详细信息可以参考摩尔线程官号公布的文章,里面有更全面的技术解析,只不过是没有 nv 数据对比的,菽陌松囿提供的数据对比可以观察下两者在 AI 上的表现,虽然这并不是说国产的 GPU 可以全面超越 N 卡,但也不是部分网友认为的只是使用了国外 IP 套壳的说法。
登录后才可以发布评论哦
打开小程序可以发布评论哦