太平洋电脑网 04-16
NVIDIA GeForce RTX 5060 Ti 16G显卡评测:超大显存!还有DLSS 4!3A大作翻倍提升!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

写在开头

RTX 50系显卡发布至今,已经有几款老大哥级别的产品陆续登场,虽然它们都有撼世之力,但动辄大几千元甚至上万的售价还是让不少玩家望而生畏,毕竟大部分用户的整体装机预算也就在大几千元,于是玩家们开始对RTX 5060系列开始抱有期待,看看"自古以来"的60级显卡能不能继续扛起甜品卡的声望。

今天要给大家带来的就是RTX 5060 Ti的首发评测,由于RTX 5060 Ti没有公版设计,因此本次上手的显卡是来自微星的GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB。RTX 5060 Ti可以说是RTX 50系中最受关注的一位了,上代RTX 4060 Ti既兼顾了性能又做到了低功耗与一定的性价比,不知道全新推出的RTX 5060 Ti能否再续荣光,下面就给大家带来测试!

规格介绍

开始前,照例讲讲新显卡的规格。GeForce RTX 50系显卡采用了此前NVIDIA在AI领域推出的Blackwell架构,以大卫·布莱克威尔命名,其是一名受人尊敬的数学家和统计学家,在博弈论和统计学领域留下了不可磨灭的贡献,NVIDIA用其名字命名这一架构反映了新平台的开创性和先进的计算能力。Blackwell可以说是NVIDIA近年来更新幅度最大的GPU架构了,相比起之前的架构来说,划时代的引入了神经网络着色器,力图为游戏开创先进、高效更有逼真的渲染方式,带给玩家全新的游戏体验。

相比前代Ada架构,Blackwell的升级聚焦于四大方向:分别是AI算力的爆发、光线追踪技术的革新、显存能效的提升以及划时代的神经网络渲染。

第五代Tensor核心

其中AI算力的爆发就不得不提到Blackwell架构上的第五代Tensor核心,新一代Tensor核心添加了对FP4浮点运算精度的支持。FP4是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率,降低该过程对显存的要求。与大多数模型默认使用的FP16相比,FP4使用的显存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提升高达2倍。

第四代RT核心

而光线追踪技术的革新则仰赖于第四代RT核心的加持,相较于第三代RT核心来说,Blackwell架构的第四代RT核心主要提升了检测光线、路径与三角形相交的效能,过往在检测时往往只能检测单个三角形,一旦场景复杂,检测能力不足就容易导致渲染出错等问题,而现在检测能够以簇集方式进行,检测效率更高。同时还有三角形簇集解压缩引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以减少渲染毛发所需的几何图形数量,并使用球体代替三角形以获得更准确的毛发形状拟合,能够让显卡发挥更好的性能但只消耗较小的显存占用。

综合来看,Blackwell架构的光线追踪多边形相交效率是上一代Ada架构的2倍,是Turing架构的8倍,同时还可以节省25%的显存使用率。

第四代RT核心的改进主要是为实现更好的光追效果。其中有两项新技术能够受益,第一项是RTX Mega Geometry技术。随着光线追踪游戏场景的几何复杂性不断增加,游戏画面中几何图形的计算量也呈现出快速增长的趋势。而RTX Mega Geometry技术能够加速构建边界体积层次结构(BVH),使得在实时渲染中可以处理多达100倍的三角形数量。

该技术的出现,也使得开发者能够在游戏场景中使用更复杂的几何图形,而不会影响游戏帧率。过去需要一个个算BVH,现在RTX Mega Geometry能够智能地在GPU上批量更新三角形簇,减少了CPU的负担,既保证了性能,也兼顾了图像质量。相信随着这些技术的不断发展和应用,未来的游戏将能够呈现出更加逼真和细腻的视觉效果,同时保持高效的性能表现。

另外一个能够受益的技术则是Curve Primitive,方便光追在曲面中的应用,例如一位男士的头发可能需要多达400万个三角形,再加上光线追踪技术,画面所需要的运算负载极大。NVIDIA则通过第四代RT核心中的Linear- Swept Spheres(线性扫描球体)技术有效减少了渲染头发所需的几何体数量,以球形代替多边形,更贴合头发的形状,从而将内存占用量大幅缩减至三分之一,并进一步提升了实际帧数,让头发的渲染效果更加自然流畅。

GDDR7显存

第三点改变则是显存效率的提升,Blackwell架构中还首次加入了对GDDR7显存的支持,此前GDDR6显存的信号编码为NRZ/PAM2,而RTX 40系上的GDDR6X则是PAM4编码。最新的GDDR7显存,信号编码改成了PAM3,NRZ/PAM2每周期提供1位的数据传输,PAM4每周期提供2位的数据传输,而PAM3每两个周期的数据传输为3位。说人话就是,新的编码机制可以使杂讯失真比减小,信号品质更清晰,同时还能带來更高的显存运行频率以及更低的电压,根据NVIDIA的介绍,使用GDDR7显存后,数据传输速率可达GDDR6时的2倍,并且功耗接近GDDR6的一半,经典加量还减价。

神经网络着色器

接着我们再细说一下这一代架构最大变化,NVIDIA这次将Blackwell架构的SM单元直接称为神经网络着色器。相比较于之前的可编程着色、CUDA统一着色、通用计算着色来说,其最大的变化就是引入了AI,AI将会彻底改变GPU的着色方式。

在Blackwell架构中,NVIDIA 进一步拓展了神经网络渲染的范畴,引入了诸多创新元素,包括神经网络纹理压缩(Neural Textures)、神经网络材质(Neural Materials)、神经网络体积(Neural Volumes)、神经网络辐射场(Neural Radiance Fields)以及神经网络辐射缓存(Neural Radiance Cache)等,这些元素共同构成了神经网络渲染中神经网络着色的重要呈现方式。

这里举个例子让大家能够更简单的理解神经网络渲染,过去复杂的物品或大量异材质的贴图往往会占用相当大的内存空间,如果叠加光追的话,计算量将会更大。然而,得益于神经网络渲染技术中的神经网络材质功能,这一问题得到了显著改善。开发者可以先在离线渲染出物品的光照数据,然后再用这些数据训练一个小的AI模型,游戏运行时只要实时调用这个AI模型当场推理就好了,这样就能还原出想要的光照效果了,再配合神经网络纹理压缩技术,就能显著降低实际生成的材质数据量,从而在占用更少显示内存的同时,实现了细节更丰富的材质表现,达到了实时生成如电影般细腻素材的效果。

目前神经网络渲染技术已经得到了微软的大力支持,未来也将会加入到DirectX中,玩家能够体验到更真实的游戏世界。

而在硬件层面,由于神经网络渲染的加入,Blackwell架构的SM单元相较于RTX 40系的Ada架构还是有不小变化的,Ada架构内的SM内,SM单元会拆分成一半的CUDA专门用于处理FP 32(单精度浮点数),另一半则依需求动态调整去处理FP32和INT32(32位整数)。而在Blackwell架构上,SM单元则改成了CUDA核心可以完全依需求动态处理FP32和INT32的形式。

另外一个改进是,过往的着色工作往往只有SM单元的Shader在处理,而Blackwell架构上引入了神经网络渲染以后,使得Blackwell架构上的第五代Tensor核心也能共同分担着色工作,大大提高了着色效率。

这样改进的好处是,Blackwell架构能够进一步针对神经网络渲染工作进行排序,即把传统的着色工作分配给Shader,而需要动用神经网络渲染的工作负载则可以给到Tensor核心上,两种核心同时运用,效率最高可以提升2倍之多。并且得益于Tensor核心也加入了可编程渲染管线,现在开发者或API也能更好的调用Tensor核心,未来游戏内我们能见到的AI技术势必越来越多。

先进的AI管理处理器

此外,AI的应用也越来越多,不仅游戏中应用AI技术,现在连可编程渲染的过程里也引入了AI,因此如何去分配显卡内部多样化工作就成了一个问题。如过往显卡在开启DLSS玩游戏时,其中应用到的语言模型和游戏引擎需要同时与GPU的不同核心交互,生成游戏帧,但是往往很难做到每一帧都有一致的生成时间,亦或者是游戏AI对话的响应不够及时,这些情况都会造成游戏体验不友好。

而Blackwell架构为了解决这一问题,引入了AI管理处理器(AMP)。它能够实时调度资源,确保在神经网络渲染、帧生成和 AI 驱动的游戏交互中实现智能化的任务分配。这种设计不仅带来了更高效的性能输出,还让显卡在游戏渲染和 AI 运算之间实现了绝佳的平衡,确保帧的间隔均匀,对话类型的AI能够及时响应,玩家的游戏体验一致性能够比较好的保障。

GeForce RTX 5060 Ti 16GB规格

说了这么多,接下来给大家介绍一下GeForce RTX 5060 Ti 16GB的硬件规格,作为RTX 50系的一员,核心采用了新的GB206芯片,核心代号为GB206-300-A1。在架构上拥有3个GPC,但每个GPC包含的TPC并不相同。GeForce RTX 5060 Ti 16GB上总共集成了18个TPC,36个SM单元,144个TMUs纹理单元,48个ROPs光栅化处理单元以及4608个CUDA核心。

在工艺制程方面,新的GB206芯片沿用了TSMC 4nm 4N NVIDIA Custom Process工艺。核心面积为181mm2,内部晶体管数量则有219亿,虽然在芯片面积以及晶体管数量上相比上代少了一些,不过得益于更先进的架构设计,GeForce RTX 5060 Ti 16GB的CUDA核心数比上代多出了5.8%。基础频率与Boost频率也有小幅上升,由原来的2310MHz与2535MHz提升至现在的2407MHz以及2572MHz,想必性能也有不小的长进。

除此之外,GeForce RTX 5060 Ti 16GB还配备了全新的GDDR7显存,显存等效频率可达28Gbps,同时16GB的大容量显存也能为玩家提供高分辨率下的极致帧率,同时还能兼顾大部分AIGC用户的应用需求,多重黑科技加持下,高分辨率出图也可更加高效。同时视频输出接口也进行了升级,能够兼顾高分辨率与高刷新率,后续开箱显卡时我们会详细介绍。

最后一点区别就是售价了,全新上市的GeForce RTX 5060 Ti 16GB MSRP版本官方建议零售价为3599元,对比上代的GeForce RTX 4060 Ti 16GB便宜了300元左右。更先进的架构设计与更激进的性能释放,还有更低廉的售价,绝对是主流玩家的甜品之选。

显卡外观赏析

在外包装设计上,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB显卡与其他微星系列略显不同,包装上更显优雅,并且整体包装盒也很小巧,看得出INSPIRE系列主打的是兼具功能性与视觉美感的紧凑型显卡。

包装盒的侧边还印上了16GB GDDR7的字样,更大的显存配置能够带来更多的创作可能。

包装的背面就比较常规了,主要是一些显卡的卖点介绍以及RTX 50系显卡的参数,旨在让玩家更全面的了解自己手上的这款利器。

终于见到主角——微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB,整体采用高端的黑金配色设计,方方正正的造型更是致敬蒙德里安的艺术风格,鲜明的色彩对比和独特的几何构图让整张显卡焕发出不同的质感,观感上也更加硬朗,尽显精湛工艺和优雅气质。

散热风扇部分,微星也进行了升级。微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB标配两把暴风7散热风扇,每把风扇直径105mm,厚度更是高达15mm,单从规格上就不难看出它的实力强劲。

除此之外,每把散热风扇还标配7片扇叶,采用环形连叶设计,扇叶表面还有龙爪纹理,能够带来更佳的气流效果与更低的噪音表现。

翻转视角看看显卡的背部,其背板采用全金属打造,同时延续了正面香槟金的配色。在不同的光线下,显卡背部会呈现不同的视觉效果,造就了低调的精致感。

在显卡背部的左侧则是镂空的散热窗口设计,这样做的目的是加速显卡内部的空气流动,达到提升散热的目的。并且镂空窗口附近还有MSI的LOGO标志,既是点缀,也是辨识度的一种。

再看显卡的顶部,分别是"GEFORCE RTX"以及"MSI"的标识,给单调的侧边增添了装饰效果。显卡横装时也能让人一眼看出这是来自微星的NVIDIA显卡。

MSI标识的旁边则是显卡的供电接口,不同于其他RTX 50系显卡,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB为单8Pin接口,熟悉的感觉又回来了,应对180W的TGP完全足够。

当然,参与供电的不止8Pin接口,显卡底部的PCIe金手指也会参与部分供电。并且这一代显卡的PCIe接口升级成为了5.0速率,这也是首次在RTX 50系显卡上应用,能够带来更高的传输速率,另外仔细看金手指的形状,它和上一代的显卡也有些微的变化。

视频输出接口方面,还是经典的3个DP加1个HDMI的配置,不过规格上有了升级,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB采用的是DP 2.1b与HDMI 2.1b规格。理论上,这一代显卡的视频输出接口可以轻松实现4K 480Hz和8K 240Hz超高分辨率与超高刷新率的需求。

最后再带大家看看这款显卡的三围,从这个角度看去,显卡的厚度为2.5槽左右,对比其他大哥来说,已经是RTX 50系中比较瘦的一员了。

重量方面,裸卡重量653g,不得不说已经很久没见到如此轻便的显卡了,绝对是ITX玩家的最爱。

显卡拆解赏析

看完了外观我们接下来看看这张显卡的内在。由于本身体积就小,因此微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB要拆出来也是很容易的事情。

首先看看显卡的PCB设计。有一说一,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB的PCB可以用小巧玲珑来形容。

PCB背面就比较简洁了,看过去一眼就可以看完全部的元件,上面的元件相当的少。不过与一般显卡不同,其背面还有显存芯片,后续我们会详细介绍。

PCB的中央则是本次测试的重点,GB206-300-A1核心,它就是微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB的大脑,由TSMC 4N工艺打造,拥有4608组CUDA核心,稍多于RTX 4060 Ti,通用的图形性能自然更强。

核心的四周是4颗GDDR7显存,由三星提供,单颗2GB,正面共8GB。

PCB的背部还有4颗GDDR7显存芯片,同样是单颗2GB,正反两面共组成了这款显卡的16GB超大显存配置。

显存型号为K4VAF325ZC-SC28,内部是512M×32的架构,数据频率可达28Gbps。

供电部分,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB采用5+2相供电设计,对于一张功耗只有180W的显卡来说,这样的供电规格是完全没有任何问题的。

并且每一相供电都使用了低噪稳定的HCI电感以及高效率的DrMOS,其中核心DrMOS型号为uP9646A,最大支持50A电流。

显存供电的DrMOS则分为上下桥设计,型号分别为PK616BA以及PKE96BB。

主控芯片则是uP9512R,这颗芯片大家应该都很熟悉了,在前代显卡里多用于RTX 4070 Ti甚至是RTX 4080上。

供电接口则是我们熟悉的8Pin接口,并且这款显卡还特别在接口附近配备了FUSE保险,可以提高显卡的安全性。

另外还有一个比较有意思的地方是8Pin供电接口的旁边还预留了12V-2×6的接口,不知道后期是否还会以这个模板推出更多不同型号的高阶显卡。

下面看看这款显卡的散热设计,整张显卡的散热系统还是相当有份量的,整个散热系统可分为三部分,分别是散热器主体、金属背板以及主动散热风扇。

率先映入眼帘的就是正中间这个大面积且非常厚实的镀镍铜底座。四周是微星为显存、电感等部件准备的高导热系数的导热垫。

整个显卡散热模组还是非常硕大的,微星针对其配备了广布式方形热管,这样设计的目的是,方形热导管布局更大,能够充分和均热板接触,从而提升整体冷却效能。

内部共有3根核心热管,为GPU核心及显存散热提供了高效保障。

散热鳍片则依然使用了微星一贯的波浪形,尾端鳍片则采用翼状设计,并设置有高低落差的间隔排列以减少气流的阻碍。

另外,微星给这款显卡的背板也进行了散热改进,首先是金属材质能够提升一定的导热能力,其次是在显存以及核心的背面都贴上了高导热系数的导热垫,能够将这些发热部件的热量快速导到背板上,从而快速散出显卡内部。

主动散热就是外观部分给大家介绍过的暴风7散热风扇了,搭配上面介绍的方形核心热管、镀镍铜底座以及独特的波浪形导流散热鳍片,共同为每位玩家提供了无与伦比的散热性能和极其安静的使用体验。

测试平台介绍

开始性能测试前介绍一下本次的测试平台, CPU使用的是目前毫无争议的游戏神U——AMD Ryzen R7-9800X3D,主板则是来自微星的MPG X870E CARBON WIFI 暗黑主板。内存为G.Skill的幻锋戟Z5 RGB DDR5,在这块主板上能轻松达成DDR5-8000 C38的成绩,并且我们这次选用的是24G×2的套条,确保这张显卡能够释放全部性能。

完整配置如下所示:

理论性能测试

开始测试前,照例还是要"认识"一下这张显卡。从GPU-Z的信息中可以看到微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB的基准频率为2407MHz,Boost频率为2572MHz,这个频率对比前代RTX 4060 Ti的话,可以说提升了不少。除此之外,这张显卡的TDP也比前代稍高一些,为180W。并且换装了更高级的GDDR7显存,能够带来448GB/s的显存带宽。

理论性能部分看3DMark,在Fire Strike系列测试中,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB表现非常亮眼,其中1080P分辨率下领先RTX 4060 Ti约31%,2K下可以领先RTX 4060 Ti约29%,就算是4K,二者的差距依旧有32%。而在以DX12为代表的Time Spy测试中,新显卡同样逆天,对比RTX 4060 Ti,领先幅度也有约20%,整体性能提升还是非常可观的。

除了Time Spy以及Fire Stirke提升明显外,光追项目也有史诗级的提升,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB得分10405,这个成绩遥遥领先于RTX 4060 Ti,换算成百分比为领先27%,提升幅度甚至可以用代际来形容。而在最新的Speed Way测试里,同样也有超27%的性能提升。

DLSS 4专项测试

看完了理论性能部分的测试,接着我们再来看看本次RTX 50系显卡最"顶"的升级,DLSS 3在RTX 40系显卡上引入了帧生成技术,能够依靠AI在两帧之间生成一帧AI帧,从而实现帧数的翻倍,用过的玩家都说好!不过由于每生成一个新的帧都需要光流加速器和 AI 模型参与,因此生成多帧的开销相当高昂,而过高的性能开销会带来瓶颈,导致帧率提升受限。

而这次DLSS 4全新升级,引入了多帧生成技术,它可以利用 AI 为每个渲染帧额外生成多达3帧!相比传统渲染的方式,能够最多实现8倍的性能提升。无论是对性能、显存的开销还是延迟都比之前要好了许多。

另外,由于多帧生成技术,输出的帧多了,要给每一帧都安排一个合理的间隔刷新才能让观感更好。因此NVIDIA还引入了专属的Flip Metering来代替CPU Pacing,它将帧节奏逻辑转移到显示引擎,让GPU能够更精确地管理显示时间,尽可能的将每一帧画面的生成时间保持一致,从而提高整体游戏视觉的流畅感。不过由于Flip Metering是硬件级的控制器,因此DLSS 4的多帧生成目前只有RTX 50系显卡支持。

同时DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。熟悉AI的应该对它很熟系了,它在AI生成领域已经应用多年了。基于Transformer架构的 DLSS 超分辨率和光线重建模型,相比之前DLSS使用的卷积神经网络(CNN)模型来说,具备2倍的参数量和4倍的计算量。在游戏场景中,能够提供更高的稳定性、更少的拖影、更高的细节和更强的抗锯齿能力,使画面更加清晰、流畅和逼真。

不过虽然DLSS 4的多帧生成功能是RTX 50系显卡的独占功能,但新的Transformer模型将会逐步下放至DLSS 3、DLSS 2等,将适用于所有GeForce RTX显卡。并且根据NVIDIA的说法,超过75款游戏和应用将在GeForce RTX 50系列开售时支持DLSS 4的全新DLSS多帧生成功能,包括《赛博朋克2077》《战神:诸神黄昏》《心灵杀手2》《霍格沃兹之遗》等,《黑神话:悟空》也将于今年晚些时候升级支持 DLSS4的多帧生成。随着时间的推移,支持DLSS 4的游戏和应用数量将不断增加。

简单介绍完,我们再看看DLSS 4的理论表现如何,还是经典的3DMark测试。不得不说微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB搭配上DLSS 4后,帧数就跟打了鸡血一样,开关前后的性能简直天壤之别!其中2K分辨率下,开关前后性能差距足足有4倍之多。4K分辨率时帧数差距直接就是7倍。最离谱的还要属8K, 微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB在DLSS 4加持下可以做到78 FPS,要知道在DLSS 3下,这款显卡几乎不可能实现8K,或许以后甜品卡也能畅享8K游戏也说不定。

接着我们看看DLSS 4在实际游戏中的表现,率先登场的就是有着"显卡杀手"之称的《赛博朋克2077》,它的设置页面是目前支持DLSS 4游戏中最为丰富一款,除了能够设置DLSS 4的多帧生成外,还可以切换DLSS 4的另一个特性——Transfomer Mode,据说能够让画质更清晰,同时还能改善此前的拖影问题,对玩家可以说是一大利好。

我们直接来一波对比,左侧为Transformer模型,右侧则是原本的CNN模型。从第一个场景来看,Transformer模型能够带来更多的细节。例如左侧图片中的栏杆倒影,这部分表现是比较清晰的,而CNN模型中则几乎不可见。

第二个场景也是能够一眼看出区别的,例如金属门的纹理细节以及砖墙的接缝处,明显是Transformer模型的优化要更好一些。

这个场景的区别主要在于地板细节刻画以及右侧铁栏杆部分,采用Transformer模型的情况下,地板细节更接近真实世界,并且铁栏杆的细节也能更好的还原。而CNN模型则会丢失比较多的细节,虽然不影响观感,但总有种"失真感"。

不过Transformer模型目前也并非万能,毕竟是由AI生成而来,因此在部分细节上还是有些错误的。例如下方的窗口部分,阳光照射下应该是斑驳的光影,比较正确显示的应该是CNN模型中的样式。整体来看,现在Transformer模型瑕不掩瑜,大幅改善的画面细节能够给玩家带来更精致的游戏展现。

见识完Transformer模型的魅力以后,我们再来看DLSS 4的性能表现,毕竟是"显卡杀手",对显卡的压力确实不一般,在最高画质+路径追踪的情况下,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB只能跑29 FPS,完全不可玩。开启DLSS 3以后,游戏帧数为100 FPS,体感已经非常流畅了。开启DLSS 4以后,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB能够做到183 FPS,对比原生分辨率,性能足足提升了6.3倍。1%Low就更离谱了,几乎快要追上DLSS 3下的平均帧了,整体游戏体验更佳。

DLSS 4带来的性能提升是有目共睹的,不过也有玩家担心DLSS 4的画质表现如何,这里我们也在游戏中截取了部分画面,第一个场景其实差距不大,肉眼很难分辨出区别。

第二与第三个场景还是能够看出部分细节的,例如第二幅图中的霓虹灯牌,DLSS开至性能档以后,能够看到灯牌与前面三张图有些许差异,不过你得靠细致的对比才能看出。实际游戏过程中很难发现,基本不影响观感。

总的来说,DLSS对画质的影响没有玩家想象中那么大,甚至于在纹理细节上能够不输或超越原生分辨率。如果你是敏感型玩家,那建议可以开至平衡档,在画面质量和帧率之间能够做到很好的平衡。如果你是追求超高帧率,那性能档也绝对可用,细节保留也不错,不对比基本看不出,同时帧率还能进一步提高。

第二款游戏则是NVIDIA在前段时间强力推荐的《半条命2》RTX版,这款游戏不仅支持了DLSS 4,同时也在游戏中加入了RTX神经网络辐射相关的技术,与初始版本的《半条命2》相比,画质可以说是史诗级的进步!

实测下来,只能说《半条命2》RTX版对硬件的开销极大,在原生1080P分辨率下,所有画质、光追均开至最高,不开启超分选项时,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB帧数为52 FPS。在开启DLSS 3质量档以后,游戏帧数瞬间来到了135 FPS,体验都变得丝滑了许多,而继续开启DLSS 4质量档,游戏帧数又在原来的基础上上涨了100 FPS,对比原生1080P的表现,性能提升高达4.6倍!1%Low的表现也差不多,领先幅度也是4倍以上。

DLSS 4带来的性能提升是有目共睹的,同时DLSS 4的画质也表现极佳,这里我们还是在游戏中截取了部分画面,基本上可以说DLSS对画质的影响没有玩家想象中那么大,甚至于在纹理细节上能够不输或超越原生分辨率。

另外,游戏设置中还可以切换DLSS 4的另一个特性——Transfomer Mode,这里我们也截图了相同的场景进行对比,从下图可以看出Transformer模型能够带来更多的细节。例如左侧图片中的墙壁,这部分表现是比较清晰的,细节也更多,而CNN模型中则几乎不可见。图片中主体的木屋纹理也是Transformer模型下会更清晰,线条更锐利。

我们测试的第三款DLSS 4游戏是《霍格沃兹之遗》,支持DLSS 4技术以后可以在设置看到帧生成部分多了一些选择,其中×2则是原本DLSS 3的帧生成,而×4则是RTX 50系独有的多帧生成功能,另外你也可以选择插2帧的方式,也就是所谓的×3选项。

实际测试过程中,我们发现《霍格沃兹之遗》这款游戏优化还是不错的,1080P分辨率画质光追均设置最高的情况下,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB在不开任何超分的情况下,平均帧为71 FPS。如果开启DLSS 3质量档,此时帧数已经能够做到119 FPS了,属于是高刷与画质的完美组合,体验相当丝滑。开启DLSS 4以后,帧数可以进一步提升至217 FPS,对比原生1080P的表现,性能提升了约3倍以上。同时实际游戏过程中,无论是1%Low还是延迟都不错,特别是延迟,相比原生分辨率还要低不少,跟手感更好。

第四款游戏我们测试的是《星球大战》,一样你能在设置中看到其帧生成功能已经支持×4的选项,也就是DLSS 4多帧生成功能。

实测DLSS 4在这类优化欠佳的游戏中确实大有用处,在1080P原生分辨率下,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB的平均帧仅有97 FPS,整体游玩体验还不错。而开启DLSS 4质量档以后,游戏平均帧直接暴增至267 FPS,游戏体验如德芙般丝滑,对比原生1080P的表现,足足有2.7倍左右的提升。即便是对比DLSS 3的154 FPS,那也是接近翻倍的性能提升。

接下来我们再测一下第一款国产3A大作、去年的热门单机游戏《黑神话:悟空》,去年发售时,这款游戏也是率先支持了DLSS 3帧生成功能,如今它还支持了RTX 50系显卡的DLSS 4多帧生成,游玩体验将会更加顺畅,开启方式也很简单,在游戏菜单设置中即可找到4X的选项。

我们在1080P下将画质调整至影视级,全景光追也拉到最高,此时微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB在不借助任何超分技术的条件下,游戏帧数仅有27 FPS。而有DLSS 3的帮助后,游戏帧数也回到了流畅的水准77 FPS;这时如果你有RTX 50系显卡,开启DLSS 4多帧生成以后,游戏帧数将再度飞跃,138 FPS的表现相当夸张,对比原生分辨率提升了5.1倍以上,直接由可玩变爽玩了。

最后一款游戏是我们的老熟人《漫威争锋》,这款游戏在RTX 50系显卡首发之时,它还没有完全适配DLSS 4,玩家想要体验多帧生成功能还需要依靠NVIDIA App的DLSS 4优设功能。不过现在《漫威争锋》也正式支持DLSS 4了,与上面的游戏一样,玩家在游戏设置中就能直接开启,并且提供了2x、3x以及4x选项,玩家可以随意选择是插一帧、插两帧还是插三帧。

实测微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB在1080P全高设置下,不开超分,帧数为111 FPS,甚至已经快满足高刷的游戏需求了。开启DLSS 3后帧数可以达到224 FPS,相比原生分辨率已经提升了一倍以上,如果再开启DLSS 4多帧生成,性能对比原生分辨率直接提升3倍以上,366 FPS的表现妥妥的电竞3A。同时延迟以及1%Low表现也非常出色,反应在游戏中会更加跟手,体感更佳。

当然,如果你想玩的游戏还不支持DLSS 4,那也不用担心,NVIDIA App还提供DLSS 4优设功能,说人话就是能够让游戏强开DLSS 4,像此前的《漫威争锋》,在未更新前,玩家可以直接在NVIDIA App中简单设置,就能将帧生成调至"4×",一键实现多帧生成。目前也有不少游戏支持DLSS 4优设功能,感兴趣的玩家可以前往体验。

DLSS 4多帧生成功能的问世,毫无疑问为玩家带来了前所未有的游戏体验升级。与上一代RTX 40系的DLSS 3帧生成功能相比,它再次实现了帧数的惊人飞跃。在相同的画质设置下,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB的表现远远超越了RTX 4060 Ti。实际测试中,在上述六款游戏里,开启DLSS 4的微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB,帧数几乎是RTX 4060 Ti的两倍!在部分极其吃硬件的游戏中,帧数甚至可以做到三倍左右,非常夸张!

另外,值得一提的是,与DLSS 4一起到来的还有全新的NVIDIA Reflex 2技术。延迟一直是电竞中绕不开的话题,玩家的每个动作都会经过复杂的计算,再在屏幕上渲染,这其中的每一步都会增加延迟。虽然延迟往往只有几十毫秒,但是你却能明显的感觉到游戏的不流畅、卡顿。

为了尽可能的降低延迟所带来的不良游戏体验,NVIDIA发布了NVIDIA Reflex技术,它可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。目前NVIDIA Reflex已集成到超过100款游戏中,可以将PC延迟降低50%。

而GeForce RTX 50系显卡再度升级,带来了NVIDIA Reflex 2技术。它结合了Reflex低延迟模式与Frame Warp技术。它可以把最新的鼠标输入指令同步给渲染帧,及时更新渲染的游戏帧并在渲染帧被发送到显示器之前获取最新的鼠标信息,通过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。

另外,Frame Warp的加入,能够进一步将延迟降低。当一个帧被GPU渲染时,CPU会根据最新鼠标或手柄输入计算工作流中下一帧的视角位置。Frame Warp从CPU采样新的视角位置,然后将GPU刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到显示器之前,在尽可能最新的时间进行扭转操作,确保屏幕上反映最新鼠标输入。

而当Frame Warp转移游戏像素时,图像中可能会产生缝隙撕裂、镜头位置的变化会让游戏场景中显示新的部分。NVIDIA则开发了一种优化了延迟的预测渲染算法,该算法使用来自先前帧的视角、颜色和深度数据,对这些撕裂空白的像素进行准确的图像修复。玩家可以通过更新的视角看到没有撕裂的渲染帧,并降低了改变游戏内视角位置而产生的延迟。说人话就是现在NVIDIA Reflex 2还可以根据上一帧的信息去脑补一些空白的像素,有种无中生有但你又看不出来的感觉。

首发支持NVIDIA Reflex 2技术的游戏是《THE FINALS》以及《无畏契约》,后续我们也会第一时间带给大家该技术的详细评测。

游戏性能测试

DLSS 4非常"逆天",能够带来极致的帧数表现,不过这也需要厂商对DLSS 4进行适配,考虑到目前不是所有的游戏都已经支持DLSS 4,因此下面我们要测试的是常规的游戏以及支持DLSS 3的游戏性能。

还是老样子,先跑3DMark的DLSS 3性能测试。微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB在2K分辨率下,对比RTX 4060 Ti,性能提升幅度大概在32%左右,4K分辨率下,开启DLSS 3以后性能领先也基本维持在29%,考虑到两张显卡的CUDA核心仅有5%左右的差距,只能说老黄确实是有点东西,单是凭借Blackwell架构就让性能再次起飞。

实际游戏表现又如何呢?这里我们选取了11款游戏进行测试,包含光追及光栅性能方面的测试,而游戏画质方面均全部选择最高画质,光追设定部分,如有则采用最高。

实测1080P分辨率下,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB应对绝大多数游戏都轻轻松松,甚至以目前这个帧数来看,它甚至可以2K流畅运行大部分3A。从实测数据来看,在部分优化好的游戏中,像《F1 22》、《光明记忆:无限》等,这款显卡能够轻松做到200+ FPS,甚至接近300 FPS;而在一些硬件压力极大的游戏,如全高设置的《黑神话:悟空》,这款显卡也能有86 FPS的表现,《赛博朋克2077》甚至还有百帧以上。总的来说,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB畅玩3A完全没问题,性能上整体比RTX 4060 Ti强约20-30%左右。

图像视频创作性能测试

看过了游戏,下面就是专业创作领域的内容了。先给大家伙看一下综合场景的性能表现,在PCMark10 Extended测试,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB在游戏、数位内容创作方面的表现更佳,基本上要比RTX 4060 Ti高10-20%左右,而生产力方面的成绩则比较低,推测是目前驱动还不完善所致。

办公软件测试中,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB表现也不错,两款显卡基本都是五五开的水平,办公对整体性能要求没有那么高,以这两张卡的实力都能轻松满足。

再看图像编辑与视频创作的表现,还是UL Procyon的测试,两款显卡在图像编辑上也是不相上下,性能差距仅有2%左右,不过在视频剪辑方面,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB的优势就比较大了,足足有23%之多。

在Adobe以及达芬奇的Benchmark测试里,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB相比RTX 4060 Ti也有提升,不过提升比较大的还是视频编辑部分,究其原因还是这一代RTX 50系显卡对编码器进行了升级,不仅编解码的效率更高,同时支持的格式也更丰富。例如在达芬奇和PR的测试中,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB领先RTX 4060 Ti约23-28%,总体来说就是内容创作的效率更高了。

3D渲染创作性能测试

图像视频创作方面,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB的优势非常明显,不知道3D渲染创作方面又如何呢?在Blender以及V-Ray两款软件中,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB的表现再度给大家带来了惊喜,其中前者基本上能领先RTX 4060 Ti达20%左右,而后者中,领先优势也非常巨大,对比40系显卡,领先幅度高达30%以上。

再看看另外一款渲染器,D5 Render是一款基于DXR和光线追踪技术构建的GPU渲染器。正因为其有光线追踪技术,其渲染的画面相当出色。这款软件在RTX 40系显卡测试时支持了DLSS 3帧生成,而现在随着RTX 50系显卡的发布,它也可以通过NVIDIA App的方式支持最新的DLSS 4多帧生成功能。

实测在开启DLSS 4以后,整个渲染预览的界面变得丝滑流畅,帧数基本都在200 FPS附近,1%Low也能稳定在89 FPS。而对比不开DLSS时,仅45 FPS的表现来看,性能几乎是提升了4倍以上。即便是面对DLSS 3,也一点不虚,性能优势也能够领先约30-40%以上。

工业领域我们用的是SPEC2020进行测试,它能够反应显卡的整体工业能力,在多项测试中微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB对比RTX 4060 Ti平均有15-20%的提升,部分项目领先幅度更高,例如3dsmax-07中,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB的表现比前代高了56%!

NVIDIA编解码测试

接下来的测试则是介绍RTX 50系显卡的编解码器,GeForce RTX 50系列显卡上换装了第9代NVENC编码器与第6代NVDEC解码器,在视频规格上支持AV1 UHQ(超高画质 AV1)与MV-HEVC(多视角HEVC)编解码。同时由于GeForce RTX 50系列显卡还升级支持DisplayPort 2.1 UHBR20输出,单一通道支持20Gbps带宽,因此用户可以体验到令人惊叹的HDR视觉效果、超高分辨率和更流畅的游戏体验。

这里我们直接使用NVIDIA提供的4K60片源与工程文件分别测试AV1、H.265以及H.264下的编码导出时间。实测同一段素材下,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB导出三段视频的时间分别是16秒、15秒以及14秒,效率比RTX 4060 Ti快了56%、73%以及79%。

同时,我们也对导出的不同格式的视频进行了画质对比,实测AV1编码的视频在画质上与H.265或H.264也没有明显差距,无论是在文字、人像还是建筑等画面里,三者的画质可以说是伯仲之间,如果不特地标注其格式,一般人很难用肉眼分辨出来。随着目前越来越多视频网站、剪辑软件和硬件厂商的推动,未来AV1势必会成为下一个最受欢迎的格式。

值得一提的是,GeForce RTX 50系显卡还能够支持4:2:2色度取样的视频编解码,这将节省CPU的负担,加快创作速度。上面的图表里也可以看到我们的测试成绩,实测导出时间会比上代显卡快不少,毕竟RTX 40系显卡不支持该功能,仅支持4:2:0色度采样,如果一定要4:2:2导出只能靠CPU软解。

4:2:2色度采样的视频文件采用的是YUV颜色格式,与存储红色、绿色和蓝色(RGB)值不同,颜色被存储为亮度Y、蓝差色度U和红差色度V。在这类视频中,视频的完整亮度将被保留,而原始色度信息只保留一半,因此相比4:4:4的视频,其视频帧数据量仅有不到三分之二,而相比4:2:0的视频又能提供两倍的颜色分辨率,因此创作者采用这种格式拍摄,能够在保留更多色彩信息的同时还能减少文件大小和带宽需求。

AI性能测试

接着我们来测试一下这款显卡的AI性能,AI目前已经成为了大家关注的重点,特别是在国产大模型爆火以后,各行各业都开始接入AI,似乎AI成了必选项。RTX 50系显卡也针对AI进行了改进,其中最值得说道的就是其加入了对FP4精度模型加速处理的支持,它相比此前RTX 40系上的FP8精度,能够实现更快的生成速度,同时显存占用也更低。

首先我们用UL Procyon的FLUX.1 AI Image Generation Demo For NVIDIA进行测试。在FP8精度模型测试时,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB能够做到29.678s生成一张图,而RTX 4060 Ti可能是由于显存的原因,无法完成测试;而切换到FP4精度模型后,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB的速度有了比较大的进步,生成图片的速度能够做到15.667s一张,效率直接翻倍。而RTX 4060 Ti依旧无法运行,这已经不是快慢的问题了,因此喜欢AI的玩家真的要认真考虑一下,更大显存的微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB才是决定AI的胜负手。

新显卡引入的FP4精度模型除了流畅之外, FP4精度模型生成的图片也非常能打,从下图就能看出来,其与FP8生成的图片几乎没有区别,无论是对关键词的理解还是图像的质量,都非常有保障。

看过了FP4以及FP8,我们再看看微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB在Stable Diffusion中FP16下的表现如何,还是用UL Procyon进行测试,在比较轻松的SD 1.5文生图测试里,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB的表现非常优秀,生成一张图的速度仅需66.543秒,效率比上代显卡快了14%。而即便是在压力比较大的SDXL中,优势也非常明显,生成一张图的速度为29.43秒,同样领先RTX 4060 Ti约31%。

AI文本生成测试我们也测了,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB在这部分的表现甚至要更加出众,我们用MLPerf Client v0.5大语言模型进行测试,它是基于meta的Llama 2 7B开源LLM打造,涵盖了四项AI任务,分别是内容生成、创意写作以及对两份不同长度文本进行总结摘要。实测新显卡在每一项中都表现出了绝对的统治力,各项测试均遥遥领先,性能提升幅度最高可以去到53%!

接着我们又用UL Procyon的AI Text Generation测试了更多的大语言模型,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB的优势依旧十分明显,在以Llama 3.1 7B LLM打造的Phi-3.5测试中,新一代显卡取得3167分的成绩,相比RTX 4060 Ti提升了20%,将参数扩大至13B的Llama 2的测试,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB也能对答如流,不过RTX 4060 Ti 8GB的显存就显得捉襟见肘了,回答速度极慢,几乎不可用,整体性能被RTX 50系甩在后面,差距有6倍以上。

功耗与温度表现

最后一项测试烤机,这也是许多玩家关注的重点。得益于微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB显卡出色的散热配置,整体表现非常出色。在室温20℃下,Furmark烧机10分钟后,整张显卡的温度并不高,核心仅有65.5度,显存温度更是低至60度,此时显卡的最大功率为180W,已经完全顶着TDP的上限了,风扇转速则是1761RPM,表现相当惊人。

横向对比RTX 4060 Ti时可以看到,虽然新显卡的TDP提升了,不过整体的烤机功耗并不算高,特别是微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB显卡拥有暴风7风扇、镀镍铜底座、波浪形导流鳍片、方形核心热管等硬核配置,整体的散热效果极其出色,部分温度甚至比150W的RTX 4060 Ti还要低,属于是非常惊喜了。

评测总结

评测也到了总结部分了,微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB算是给广大玩家交上了一份不错的答卷。在外观设计方面,这款显卡就已经让人眼前一亮。应用"蒙德里安"设计语言,将现代艺术线条与工业科技感融合,打造出了一种独特的网格美学,香槟金的配色更让显卡散发出高贵典雅的气息。不难看出微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB瞄准的就是追求小体积高性能的主流玩家及AI创意工作者。

散热方面更是微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB的一大亮点,其散热系统采用了全新设计的方形核心热管与独有的波浪形鳍片设计,配合高效的暴风7散热风扇以及镀镍铜底,确保了在满载环境下GPU温度依旧能够稳定在60℃左右。同时显卡的噪音控制也非常出色,这样的表现对ITX玩家绝对是一大利好。

性能方面同样带给不少玩家惊喜,实测微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB在绝大部分3A游戏中,性能相比上一代的RTX 4060 Ti提升明显,1080P下强约20-30%左右,部分游戏在仅DLSS 3的加持下就有200+ FPS的出色表现。而在DLSS 4技术的加持下,这款显卡则更显出众,与上代显卡的性能差距甚至可以用倍数去衡量,非常夸张。

同时得益于微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB配备了超大显存,因此它在AI领域与创作领域也是轻轻松松,不单止性能的提升带来了更优的创作体验,在深度学习和复杂图形渲染等场景中,大显存能够显著提升处理效率,减少数据传输的时间成本,简单来说,它不仅仅是甜品级游戏利器,更是高性价比的创作工具。

最后再聊聊选购建议,目前GeForce RTX 5060 Ti 16GB显卡售价3599元,相比前代同规格的RTX 4060 Ti便宜了300元,性能更强的同时,售价更低,绝对的"加量不加价"!所以如果你想在未来一段时间内为爱机升级或者搭配新的电脑,想要选择RTX 5060 Ti型号的显卡的话,那么微星GeForce RTX 5060 Ti INSPIRE 2X 硬派师16GB会是一个值得考虑的好选择!

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

nvidia ai 第四代 第五代 神经网络
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论