中关村在线 02-27
影驰RTX 4070 SUPER星曜OC评测:挑战4070Ti的高颜值显卡
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

RTX 40 SUPER显卡的推出吸引了众多游戏玩家的关注,40 代的 SUPER 显卡性能获得大幅提升,游戏性能提升 15%,售价只加 100 元,给了游戏玩家更高性价比的选择,自然而然成了香饽饽。

影驰为游戏玩家打造的星曜系列显卡有非常好的口碑,不仅在性能上表现出众,白色的外观也提供了非常高的颜值,星曜显卡成了很多玩家的首选,现在影驰又为游戏玩家带来了 RTX4070 SUPER 星曜 OC,将游戏性能再次推升。今天我们就为大家带来影驰 RTX4070 SUPER 星曜 OC 显卡的评测。

1 影驰 RTX4070 SUPER 星曜 OC 显卡概览

惯例还是先看外观,影驰 RTX4070 SUPER 星曜 OC 显卡的包装盒和其他显卡相比可以说是巨无霸了,包装盒的侧面已经接近正方形,正面是影驰星曜娘搭配 RTX4070 SUPER 的字样,背面则标注了显卡的主要参数和特点,有非常高的辨识度。

包装内部除了显卡主体之外,还有一个显卡支架,一条 8pin 转 16pin 线材,以及一条 RGB 光效同步线材,方便玩家在不同的平台中使用。

RTX 4070SUPER 星曜 OC 显卡的主体是非常经典的星曜风格,白色的主体配色搭配晶莹剔透的风扇和侧面的挡板有很高的颜值,风扇和星曜的 logo 都有 RGB 光效加持,也非常适合时尚定位的游戏平台。

这款显卡的尺寸为 351mmx154mmx56mm(含挡板),比公版显卡更大,主要是其星卓 III 散热模组更加厚实,镀镍铜底 +5 根镀镍复合热管 + 大面积散热鳍片,可以更快地传导热量,3 把 102mm 风扇可以强力送风,进一步优化散热。

2 NVIDIA GeForce RTX 4070 SUPER 架构浅析

本次发布的 GeForce RTX 40 系显卡由全新的 NVIDIA Ada Lovelace 架构打造,采用 TSMC4N NVIDIA 定制工艺,旗舰核心 AD102 达到了的 760 亿个晶体管,而在 RTX30 系显卡中为 280 亿个。

与上一代 NVIDIA Ampere 相比,NVIDIA Ada Lovelace 在相同功率下,具有 2 倍以上的性能提升,最高可达到 90-TFLOPS 的着色器数据吞吐量。

本次发布的 RTX4070 SUPER 共有 7168 个 CUDA 核心,提供了 35.5-TFLOPS 算力;56 个第三代 AdaRT Core 拥有 82.1RT-TFLOPS;224 个第四代 TensorCore 可提供 568Tensor-TFLOPS(AITOPS)。

RTX 4070 SUPER 的 L2Cache 容量为 48MB,带宽为 504GB/s。NVIDIA 官方也特别表明了 L2Cache 的重要性,我们以两张图来简单说明 L2 缓存的作用。

在真正的 GPU 中,内核是所有计算发生的地方,而这就是 L1 数据缓存的作用所在。每个 SM 都有一个超低延迟的 L1 数据缓存,紧挨其处理内核,使 L1 成为 GPU 寻找信息的首选。然而由于 L1 缓存需要离内核非常近,不可能非常大。

如果在 L1 缓存中找不到内核计算所需的数据,GPU 将在 L2 数据缓存中寻找。这个显存系统位于 GPU 芯片上,并通过一个非常高速的横梁系统连接到所有的 GPC(图形处理集群),每个 GPC 包括多个 SM。如果在 L2 缓存中找到了信息,那么 GPU 就挑出这些数据并将其放入内核。

如果在 L2 缓存中找不到信息(被称为缓存缺失),那么 GPU 将通过显存接口在 VRAM 中寻找。这在整个 GPU 存储子系统中产生了很多额外的工作量,并降低了性能和功耗效率。

更多详细的参数,我们为大家总结出了一张表格,可以看到从各方面的规格来说,这张 RTX4070 SUPER 更接近于 RTX4070 Ti,但功耗相比 RTX4070 只提升了 20W。

3 测试平台简介

首先介绍一下测试平台,为了保障 RTX4070 SUPER 星曜 OC 的性能发挥,我们的平台也进行了全面更新。

最新的GPU-Z升级到了 2.57 版本,加入了 SUPER 显卡的信息,可以识别到显卡的芯片和基础规格。

RTX 4070SUPER 星曜 OC 拥有 7168 个 CUDA,Boost 频率为 2625MHz 比公版更高,此外还有 12GBGDDR6X 显存,位宽为 192bit,显存带宽 504GB/s,光栅单元和纹理单元为 80 和 224。

4 理论性能测试

本次测试 RTX4070 SUPER 星曜 OC 主要对比 RTX4070Ti 以及 RTX4070,看看他们之间的性能和体验差异。

下面先进行的是用来衡量显卡DX11理论性能的 3DMARKFS 套装:FS,FSE,FSU 三者分别对应显卡在 1080P、2K、4K 的理论性能,取显卡分数实际测试结果如下:

在 FS 测试中,影驰 RTX4070 SUPER 星曜 OC 相比 RTX4070,其中 FS 提升 18%;FSE 提升 19%;FUS 提升 25%,综合提升 21%。对比 RTX4070 Ti,综合成绩相差 3% 左右。

而在针对 DX12 环境下的 TimeSpy 和 TimeSpy Extreme 测试中,影驰 RTX4070 SUPER 星曜 OC 相较 RTX4070 的提升分别为:TS 提升 18%;TSE 提升 18%,综合约为 18%。对比 RTX4070 Ti,综合成绩相差 5% 左右。

PortRoyal 是3DMARK中专门针对光追性能的测试项,影驰 RTX4070 SUPER 星曜 OC 相较 RTX4070 的提升约为 17%。对比 RTX4070 Ti,相差 4% 左右。

下面我们再来看看 3DMARK 中新增的一些具体应用场景的测试。

SpeedWay 这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以 SW 的测试基本可以看做次世代 3A 游戏基准。

影驰 RTX4070 SUPER 星曜 OC 对比 RTX4070,从 1080p 分辨率到 4K 提升依次为:18%/17%/17%。

而对比 RTX4070 Ti 的成绩几乎持平,差距不超过 1%,甚至在 1080p 分辨率中反超。虽然差距不大,可以看做误差,但整体来看,这张 RTX4070 SUPER 基本有着媲美 RTX4070 Ti 的性能。

另外我们使用 3DMARK 刚刚更新的 DLSS3 进行了相关性能测试。影驰 RTX4070 SUPER 星曜 OC 在 2K 分辨率下 DLSS 开关相比 RTX4070 的提升为 15%/20%;4K 分辨率,提升约为 16%/22%。

从整体的理论测试成绩来看,传统的 FS/TS/PR 三项测试,影驰 RTX4070 SUPER 星曜 OC 相比 RTX4070 综合提升约为 19% 左右;相比 RTX4070 Ti 的差距在 3% 左右,而最新的 SW 综合测试也基本呈现相同的结果。本次理论测试仅选择显卡本身的分数,物理分数没有计算在内。

5 常规游戏性能测试

由于本次 RTX40 系加入了 DLSS3 新技术,所以后面会进行单独测试,这里依然选择主流的几款 3A 大作进行游戏性能对比。

在《极限竞速:地平线 5》中,影驰 RTX4070 SUPER 星曜 OC 相比 RTX4070 在各个分辨率下提升明显,在 1080P 和 2K 分辨率下甚至追平了 RTX4070Ti,这样的表现可以说非常优秀了。

在《刺客信条:幻景》中,影驰 RTX4070 SUPER 星曜 OC 相比 RTX4070 的提升分别为:1080p 提升 8%;2K 提升 9%;4K 提升 12%,综合提升 10%。

在《无主之地 3》中,影驰 RTX4070 SUPER 星曜 OC 相比 RTX4070 同样有明显的提升,整体看来帧数更接近 RTX4070Ti。

《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为 "RTX 最高 /DLSS 质量 "。性能方面,影驰 RTX4070 SUPER 星曜 OC 相比 RTX4070 提升在 20% 左右,整体上更接近 RTX4070Ti 的帧数,在 1080P 分辨率下帧数几乎追平了 RTX4070Ti。

在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在 "RTX 最高 /DLSS 质量 " 下进行。在《边境》中,影驰 RTX4070 SUPER 星曜 OC 相比 RTX4070 的提升同样是在 20% 左右,帧数提升非常明显。

《赛博朋克 2077》更新了 DLSS3.5,支持光线重建技术。如上图中的石桥,在光追关闭的情况下,石桥上的斑驳痕迹几乎不可见,而打开光线追踪后,虽然反射出了其表面状态,但表现细节却全都没有了。在开启了 DLSS3.5 后,表面纹理更细致,将画质整体提升了一个档次。

6 DLSS 3 性能测试

截止目前,超过 530 款游戏和应用已支持 RTX 技术。

其中《龙之信条 2》、《灰区战争》、《半条命 2》RTX 版、《地平线:西之绝境》、《层层恐惧》、《人中之龙 7 外传:无名之龙》、《人中之龙 8》、《纳克园:最后的乐园》、《PaxDei》、《星际矿工》和《王权与自由》均将支持 DLSS 3 技术,其中有些游戏将在今年发布,有些游戏则将在今年更新对 DLSS 3 的支持,为配备 GeForce RTX 40 系列显卡的游戏玩家带来前所未有的性能和更高的图像质量。

本次 DLSS3 的测试图表比较繁琐,并且增加了 1%Low FPS 和延迟的测试,1%Low FPS 则是将一段时间内的帧数从大到小排列,取最小的 1% 出来,再对这 1% 的数求平均值。

《星空》经历了首发后的低迷和差评,近期反响还不错,在 1.8.86 大版本更新后,加入了 DLSS3,这也让手持 N 卡的用户终于不用再开启 FSR 了,整体来看效果非常好。其中 1080p 分辨率下 DLSS3 相比 DLSS2 提升达到 64%;2K 分辨率提升 51%;4K 分辨率提升 39%。不难看出在越低的分辨率,也就是 CPU 瓶颈下,DLSS3 的帧生成加成越大。虽然目前《星空》饱受批评的频繁读图依然没有修改,但至少使用 N 卡的用户,画面流畅度能够大幅提升了。

《地平线 5》也是显卡测试的老朋友了,其出色的优化让很多入门级产品都能跑出较高的帧率。在影驰 RTX4070 SUPER 星曜 OC 也有较明显的体现。在 3 种分辨率中,开启 DLSS3 相比 DLSS2 的提升分别为 39%/27%/9%。

7 生产力工具测试

V-Ray

在生产力工具上,我们测试了最新版本的 V-Ray 渲染器,选择使用 GPU 渲染的 CUDA 测试和 RTX 测试,成绩如图。

Blender

Blender 是一款专业的三维渲染软件,目前推出了固定的benchmark跑分软件,省去了安装软件下载素材的麻烦。软件会自动渲染测试 monster/junkshop/classroom 共三个场景。

上图为影驰 RTX4070 SUPER 星曜 OC 显卡得分,分别为 3260/1536/1618 分,平均 2138 分。

D5 渲染器

D5 是一款国内实时光线追踪渲染器,支持多种建模软件直读,包括SketchUp、3DsMAX、Rhino、Revit、Archicad、Blender、C4D 等。目前也已经支持 DLSS3,下面我们分别看看帧数和功耗的情况。

选择软件自带的默认场景【简约客厅】

在实时帧数表现上,由于 D5 采用实时 GPU 渲染,所以压力全在显卡。可以看到在 4K 分辨率下,即便是影驰 RTX4070 SUPER 星曜 OC 也是 PPT 的状态,而开启 DLSS3 后,帧数提升可达到 470% 左右,非常暴力。

功耗方面,影驰 RTX4070 SUPER 星曜 OC 的 TDP 为 220W。关闭 DLSS 的情况下,实际平均使用功耗为 205W,而在开启 DLSS3 后,功耗仅有 173W。更低的功耗,更高的帧数,可以说 DLSS3 不仅对于游戏玩家有非常大的帮助,对于内容创作者来说,也是 1+1>2 的效果。

8 AIGC 测试

AI 时代不知何时已经离人们的生活越来越近,小到文本改写,大到各种生成式 AI。此前我们已经测试过 StableDiffusion 的 AI 绘图能力,不过目前 NVIDIA 推出了全新的 TensorRT 插件,可以充分调用 Tensor 算力,下面我们来测试一下影驰 RTX4070 SUPER 星曜 OC 在这方面的性能表现。

我们在本地部署 StableDiffusion 进行 AI 创作,在文生图的创作中,设置迭代 20 次,开启高分辨率修复,生成 1024x1024 的图只需 2 秒,可以说非常迅猛了。

生成式 AI 距离我们的生活越来越近,帮助最大的就是内容创作者,AI 天马行空的思路往往比人们更具拓展性,借助 AI 能够激发更多灵感来源。而对于普通用户来说,他也可以让没有绘画功底的人,独立创作出一幅不亚于艺术家的作品,让每个人都成为自己生活中的艺术家。

9 RTX 视频超分辨率(RTXVideo Super Resolution)测试

目前 RTX 视频超分辨率(RTXVideo SuperResolution)已经在部分浏览器中进行测试,首先玩家需要更新到 NVIDIA 最新驱动,在 NVIDIA 控制面板中的【调整视频图像设置】可以看到最新的 RTX 视频增强超分辨率。

RTX 视频超分辨率是 AI 图像处理的突破,它超越了传统的边缘检测和特征锐化技术,极大地提升直播视频内容的质量。

开启 RTX 视频超分辨率不仅需要最新版驱动,还需要使用 RTX40 或 30 系列 GPU,并且几乎适用于 GoogleChrome 和 MicrosoftEdge 浏览器中的所有视频内容(浏览器也需要更新到最新版本)。

开启后,目前已知的打开 YouTube 或者 B 站,都可以享受到 RTXVSR 效果的加成。

如果不确定,在全屏播放视频时,可以打开任务管理器,看到 GPU 负载增加,即为开启成功。

我们打开 YouTube 随意观看视频,在打开 RTXVSR 后,可以清晰明显的看到水下珊瑚的质量明显提高,边缘更为清晰,并且极大减少了失真现象。

在下面这幅图的对比中,可以明显看到开启 RTX 视频超分辨率后,胡须明显更顺滑,已经看不出马赛克。这对于一些网速不够快,只能看低分辨率视频的用户,或者视频片源本身不够清晰的情况,帮助非常大。

不过需要注意的是,RTX 视频超分辨率在低分辨率下效果会更明显,如果本身观看的视频为 1080p 或 2K 以上,则基本很难看出区别。

10 温度及功耗测试

功耗测试中,我们选择 FurMark 软件进行拷机测试,来看一下影驰 RTX4070 SUPER 星曜 OC 的散热表现。

在满载 20 分钟之后,影驰 RTX4070 SUPER 星曜 OC 显卡的温度稳定在 58 ℃,比公版 RTX4070 SUPER 低了 15 ℃,星卓 III 散热器功不可没。

游戏动态功耗测试

本次我们在拷机测试中最大板载功耗为 245W 左右,但在实际游戏测试中要低很多。

由于不同游戏负载不同,GPU 的实际功耗是动态变化的,类似于 FPS 随时间的变化,RTX40 系列很难触及功耗墙。在实际的游戏功耗测试中,我们选择《光明记忆:无限》自带 benchmark,光追最高、DLSS 质量、2K 分辨率,来拉满显卡的性能极限,检测我们实际应用场景的功耗。

可以看到影驰 RTX4070 SUPER 星曜 OC 平均功耗只有 210W,和 RTX3070 Ti 相比低了约 70W,对于游戏玩家来说也是一个好消息,不仅意味着整个平台更省电,而且对电源的压力也要小很多。

11 性能逼近 RTX4070 Ti

所有的测试项目完成,相信大家也都了解影驰 RTX4070 SUPER 星曜 OC 的整体性能了,这款显卡和 RTX4070 相比不同游戏和应用的性能提升了 15%-20%,和 RTX4070 Ti 的差距在 5% 左右,也就是说整体上更接近 RTX4070 Ti 的表现,这次 SUPER 的升级还是很有诚意的。

综合不同游戏的帧数表现,影驰 RTX4070 SUPER 星曜 OC 可以通吃主流 3A 大作的 4K 分辨率,对于追求更高帧数的竞技游戏来说,在 2K 分辨率下可以发挥出更好的表现,对于游戏玩家来说更值得入手。

更加值得关注的是,影驰 RTX4070 SUPER 星曜 OC 的功耗只有 250W,意味着整机只要搭配 600W 的电源就可以满足供电需求,同时显卡的温度控制得更加到位,也不会给机箱内的其他硬件带来散热压力,对于 CPU 和存储来说是一个好消息。

总的来说,影驰 RTX 4070 SUPER 星曜 OC 在各项测试中都有非常优秀的表现,在部分游戏中甚至可以和 RTX 4070 Ti 一决高下,在相同级别的 RTX 4070 SUPER 显卡中拥有更高的颜值,温度控制也相当好,非常适合追求高颜值以及 RGB 的用户选择。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

影驰 驰为 nvidia oc显卡 吞吐量
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论