作者:啊鲁
前言:
从 GeForce RTX 5090 D~80 显卡发布后,不少玩家都高呼进化到第四代的大力水手 DLSS4 真是黑科技,做到了高帧率与高画质兼顾真是让人喜闻乐见。
但旗舰的定位注定不会是普罗大众玩家的首选,相比之下中高端的产品才是叫好又叫座的。而 NVIDIA 深知这一点,就在昨天推出了价格更为亲民的 GeForce RTX 50 系列显卡 GeForce RTX 5070 Ti。
Blackwell 架构亮点:
第 5 代 Tensor Core
与上代 Ada 的 Tensor 类似,Blackwell 的 Tensor 核心支持 FP16、BF16、TF32、INT8、INT4 以及 Hopper 架构的 FP8 Transformer Engine。RTX Blackwell 进一步新增对 FP4 精度格式的 Tensor 核心运算支持,能更好的满足现阶段 AI 应用加速和游戏中 AI 渲染的需求,使 AI 吞吐量翻倍,内存需求降低 50%。并搭载了全新的第二代 FP8 Transformer Engine,这点与数据中心级 Blackwell 功能上是一致的,老黄刀法开始收敛了,哈哈。
第 4 代 RT Core
Blackwell 架构中的第四代 RT 核心在光线 - 三角形相交测试方面的吞吐量是 Ada 架构的两倍。说人话就是,实现光线追踪效果更高效,能更好支持神经网络网络渲染技术。
AI 运算管理器
它能够实时调度资源,确保在神经网络渲染、帧生成和 AI 驱动的游戏交互中实现智能化的任务分配。这种设计不仅带来了更高效的性能输出,还让显卡在游戏渲染和 AI 运算之间实现了绝佳的平衡,确保帧的间隔均匀,对话类型的 AI 能够及时响应,玩家的游戏体验一致性能够比较好的保障。
针对神经网络着色重组优化 SM
Blackwell 使用了新的 RT Core 和 Tensor Core 设计,进一步增强了神经渲染能力,性能高达 125 TFLOPS。相比于上一代的 Ada 架构的 SM,Blackwell SM 在每个时钟周期内提供了翻倍的整数运算吞吐量,从而有助于提升神经着色至关重要的地址生成工作负载。
新显存 GDDR7
Blackwell 架构首次引入了对 GDDR7 显存的支持,标志着显存技术的又一次重大飞跃。以下是其核心改进:
编码技术的演进
GDDR6X(RTX 40 系列):升级为 PAM4 编码,每周期传输 2 位数据。
GDDR7:创新性地采用 PAM3 编码,每两周期传输 3 位数据。
性能与能效的双重提升
信号质量优化:PAM3 编码显著降低了信号失真,提升了信号清晰度。
频率与电压优化:GDDR7 能够在更高频率下运行,同时工作电压更低。
效率提升:相比 GDDR6,GDDR7 的数据传输速率提升至 2 倍,而功耗却大幅降低。
更高的显存频率和更低的电压意味着更强的性能和更低的能耗。
这一改进不仅提升了显存带宽,还优化了整体系统的能效表现,为高负载任务(如游戏、AI 计算等)提供了更强大的支持。简而言之,GDDR7 通过创新的 PAM3 编码技术,实现了 " 既要马儿跑得快,又要马儿吃得少 " 的目标,为 Blackwell 架构带来了显著的显存效率提升。
Blackwell 架构剖析:
GB202 芯片微架构图
GeForce RTX 5090 和 GeForce RTX 5090 D 采用 GB202 核心,拥有 922 亿个晶体管,采用 TSMC 4N 工艺,芯片面积达到 750mm ²,比 GeForce RTX 4090 的 AD102 大 20%,每平方毫米的晶体管密度高达 1.24 亿个!正所谓大力出奇迹,这里面的力指的就是科技,正所谓科技是第一生产力!
Blackwell 的 GPC 结构图
从上图能看到,每个 TPC 包含 2 个 SM,内置 128 个 CUDA Core,1 个第四代 RT Core,4 个第五代 Tensor Core,4 个纹理单元(Texture Units),1 个 512KB 寄存器文件,128KB L1 共享缓存,这些缓存可以根据图形类型以及运算负载需求进行重新分配。
Blackwell 的 SM 架构图
SM 单元作为 GPU 架构中重要构成,在 GPU 并行处理中起着关键作用,它通过其各种核心(CUDA,Tensor,RT),高效的 warp 调度,内存管理以及对 AI 等现代工作负载的支持实现大规模并行运算。
在 BlackWell 架构的 SM 单元中,INT32 整数运算的数量翻倍。与 Ada 架构的 SM 单元相比,实现 INT32 与 FP32 内核的完全统一。在时钟周期内,统一内核只能选择 FP32 或 INT32 内核运行。
什么是 DLSS 4?
DLSS 4 采用全新的 Transformer 模型架构,相较于传统相比卷积神经网络 CNN 模型,其参数量提升了 2 倍,同时计算性能提升了 4 倍。这一进步不仅增强了画质的稳定性,还能提供更多细节,极大地优化了游戏画面的呈现效果。
让引入了多帧生成技术,通过 AI 计算为每个渲染帧额外生成高达 3 帧!与传统渲染方式相比,它能够最多实现 8 倍的性能提升。并且每次渲染额外帧只需要 AI 模型执行一次,就能输出三帧画面,堪称插帧界的 PDD!DLSS 4 技术在游戏场景中,能够提供更高的稳定性、更少的拖影、更高的细节和更强的抗锯齿能力,使画面更加清晰、流畅和逼真。
Reflex2 低延迟:
该技术融合了 Reflex 低延迟模式和 Frame Warp 技术,能够将最新的鼠标输入指令实时同步到渲染帧中。通过及时更新游戏帧并在帧发送到显示器前获取最新的鼠标数据,系统能够刷新渲染帧,从而显著降低延迟。Reflex2 与原生渲染相比延迟减少了多达 75%,极大地提升了响应速度和游戏体验,目前该技术率先支持 RTX 50 系列显卡,NVIDIA 透露在未来将会对其他 RTX 系列显卡提供支持。
支持 DLSS4 的游戏多吗?
在后续的时间里,待 RTX 50 系列显卡全面铺开之后,支持 DLSS 4 的游戏将会多达 75 种,名单如目录如上图所示,据我所知目前《赛博朋克 2077》、《霍格沃茨之遗》、《星球杀手:亡命之徒》已经可以体验。
生产力的提升:
Blackwell 架构加入了对 4:2:2 10bit H.264/H265 色度采样视频进行编码和解码的支持,对众多视频创作者来说是喜闻乐见,毕竟这种编解码已经成为目前视频拍摄的主流,在保持画质优秀的前提下有着更小的视频体积与更低的网速要求。
随着 RTX 50 系列显卡的推出,新增了对 H.264 和 H.265 视频格式的 4:2:2 色度采样解码支持。这一升级使视频编辑者能够直接处理原生 4:2:2 色度采样的视频内容,无需再依赖代理视频的生成,从而显著提升了编辑效率和工作流程的流畅性。从上图能看到 RTX 5090 在编码完成时间上彻底吊打 CPU。
关于 GeForceRTX 5070 Ti 的规格:
GeForce RTX 5070 Ti 采用基于 Blackwell 架构的 GB203 芯片,与完整规格的 RTX 5080 相比,性能略有下降,但相较于 GeForce RTX 4070 Ti 系列有明显提升。它同样搭载了新架构的核心特性,包括 Gen 4 RT 核心、Gen 5 Tensor 核心、新一代媒体引擎、DLSS 4 以及更多 AI 功能支持。此外,媒体引擎部分配备了 2 个第 9 代 NVENC 编码器和 1 个第 6 代 NVDEC 解码器。
在硬件规格上,GeForce RTX 5070 Ti 所用的 GB203 芯片配备 8960 个 CUDA 核心、70 个 RT 核心、280 个 Tensor 核心、280 个纹理单元和 96 个光栅单元,分布在 70 个流处理器多单元里面。
GeForce RTX 5070 Ti 与上代的 GeForce RTX 4070 Ti 相比,显存位宽从 192Bit 升级到了 256Bit。得益于 GDDR7 显存,其显存带宽达到了 896GB/s,比 RTX 4080 的 716.8GB/s 增幅多达 25%。
测试平台简介:
测试平台配置:R7 9800X 3D+B650+DDR5 6800MHz 16G*2+ 额定 1000W 电源。为了方便参考,我加入 GeForce RTX 4070 Ti 作为性能对比。
目前 2.62 GPU-Z 基本识别出显卡的大部分规格参数,从图中能发现啊鲁手上这块七彩虹 iGame GeForce RTX 5070 Ti Vulcan OC 16GB 的 Boost 频率最高可以去到 2910MHz。PS:以下所有测试均在显卡开启一键超频状态下进行。
3D 理论测试:
3DMARK 基准测试方面,GeForce RTX 5070 Ti 与 GeForce RTX 4070 Ti 整体领先幅度在 17~51% 左右,绝大多数走在 30%+,这提升可以说相当夸张。
3DM DLSS4 测试,先看性能档,2x、3x、4x 的帧率均轻松达到 150~250,有点追求选择质量档的话也有 120~208 的出色表现,反观没有 DLSS 的加持,原生帧率只有 42,DLSS4 4x 与之相比,领先幅度高达 514%,这提升幅度属实恐怖!
DLSS4 游戏测试:
有鉴于 GeForce RTX 5070 Ti 的显存规格已经不输甚至超越了上代自己的老大哥 GeForce RTX 4080,因此本次游戏测试在 4K 分辨率最高画质下设定进行。而且 4K 分辨率显示器如今已经相当普遍,因此 GeForce RTX 5070 Ti 的定位能否 " 越级 " 挑战 4K,做人嘛,没点追求就跟咸鱼一样了。游戏测试马上走起。
《赛博朋克 2077:往日之影》在 4K 分辨率,光线追踪画质最高的设定下,原生帧率只有 16 的 PPT 卡顿级别。开启 DLSS2~4x 后游戏平均帧率跃然提升至 88~162,这个优秀表现让我大大增强了 GeForce RTX 5070 Ti 选择 4K 分辨率进行测试的信心,毕竟这帧率和性能表现还有必要用 2K 分辨率进行测试吗?
再来看这个新一代号称显卡杀手游戏《心灵杀手 2》,原生帧率确实惨不忍睹,在 DLSS4 加持下,游戏帧率飙升至 90~162,DLSS4 4x 相比原生帧率相比提升幅度高达 671%!
《星球杀手:亡命之徒》目前已经正式支持 DLSS4.0,原生与 DLSS4 4x 两者帧率差距高达 98。很难想象这是同一款显卡在不同画质设定下的差距,看来科技是第一生产力诚不欺我。
热门游戏测试:
热门游戏测试,如果说 GeForce RTX 4070 Ti 在部分游戏中未能达到 4K 最高画质 60 帧的流畅起跑线是个遗憾的话,GeForce RTX 5070 Ti 已经很好的完成它上一代对游戏平均帧率突破 60 帧的夙愿,70+~170+ 的平均帧率试问舍我其谁?
生产力、AI 性能测试:
在现在几乎人人自媒体的时代,哪怕你不是臭打游戏的,相信你也会为自己的电脑生产力而进行投入,GeForce RTX 5070 Ti 除了游戏表现出色,在视频编辑方面的生产力方面也是一把好手,啊鲁用 Procyon 对两代显卡进行 AdobePremiere Pro 视频剪辑测试,从上图能看到得益于新的 Blackwell 架构,GeForce RTX 5070 Ti 的视频剪辑性能相比 GeForce RTX 4070 Ti 提升了 21%。
VARYGPU 渲染测试方面,GeForce RTX 5070 Ti 领先 GeForce RTX 4070 Ti 约 45%,对于这么一款常用的 3D 渲染器,新一代显卡的生产力提升幅度还是很明显的!大大节省工作时间。
AI 方面也是目前生产力一大重点,利用 Procyon 进行 Text Generation 测试,看看两块新旧显卡的 AI 文字生成能力有多大差距,从上图能看到性能提升幅度在 20%~67%!,可见未来你想畅玩 AI 生产力,一块 GeForce RTX 50 系列显卡是必不可少。
功耗和温度:
在室温 30 ℃环境下,利用 Furmark 进行显卡烤机满载十分钟测试,显卡满载温度仅为 66 ℃,显卡功耗是 315W,风扇转速为 2356rpm。GPU 加速频率最高去到 2700MHz。
烤机时显卡正面的最高温度为 41.9 ℃。
显卡背面高温位置是 GPU 后面,温度是 58.2 ℃。
显卡鉴赏:
火神系列作为七彩虹旗舰显卡的明星产品,凭借霸气的外观以及优秀的做工用料,一直深受 DIY 玩家的喜爱。本次测试的主角正是七彩虹七彩虹 iGame GeForce RTX 5070 Ti Vulcan OC 16GB。
显卡外观设计采用智械装甲设计,看起来分外有金属质感,要知道这可是全金属压铸工艺打造,对于男生来说很难抵抗这种弄设计魅力。造型集成经典三角元素,让显卡看起来层次感十足,鲜明的轮廓是它给人的第一印象!
竖起来看是不是更觉得霸气侧漏?一股肌肉般的力量美感油然而生!
正面三枚风镰扇叶,数量为 9 翼,叶片环环相连,带来出色的聚风散热效果。
风扇内置双滚珠轴承,柔滑顺畅,耐用度更加出色,超长的使用寿命让用户省心省力。
显卡尾部 iGame 的高亮边条,让整块显卡看起来低调不失 B 格。
隐藏在风扇后面的是大面积导流型鳍片,其出色的散热表现最早应用于服务器领域,凭借更大间隙,让风流充分进入加速内部气流循环,大大提升散热效率。
针对玩家追求个性,七彩虹七彩虹 iGame GeForce RTX 5070 Ti Vulcan OC 16GB 配备了 LCD 智屏,通过机械旋转结构,能实现屏幕翻转和角度调节,最大限度提升屏幕多角度的显示形态。
如果你对智屏兴趣不大,那么 iGAME VULCAN 灯光组建应该能满足你光污染的需求,同样采用磁吸连接设计,方便用户随时更换。
显卡背面采用全金属背板,背板带有磨砂处理,配合不规则的造型凹陷,让显卡背面的颜值也尽显风骚。
I/O 接口方面 3*DP2.1b 接口与 1HDMI2.1b 接口可以说满足多屏扩展的需要,一键超频可以说是 iGame 显卡的杀手锏,给予玩家更优秀的性能体验。
iGame VULCAN
智屏还能通过附送的底座进行单独放置,通过软件设定能让玩家对电脑硬件情况进行实时监控,实用性与个性都拉满了。
iGame Center 灯效一览:
多种灯效让你爱不释手!
藏于显卡边缘的光刃对显卡颜值起到画龙点睛的作用!
智屏装上显卡后能通过 iGame Center 进行自定义图像显示,又或者通过智屏素材库里面的丰富类别进行设定,充分满足喜爱个性的你。如果你追求实用性,它还能显示 CPUGPU 多项监控数据轮播,让人不禁赞叹该设计实用与美学都满分。
总结:
不得不说这次上手七彩虹 iGame GeForce RTX 5070 Ti Vulcan OC 16GB 显卡让我惊喜连连,首先是新一代架构让其拥流畅酣战 4K 全高画质光追游戏的出色游戏性能,彻底打破多年以来 NVIDIA 70 后缀显卡只能征战 2K 分辨率的固有印象。
其背后功臣除了除了优秀的 Backwell 架构,16GB 更大更快的 GDDR7 显存以及 256bit 位宽也是功不可没,相比上代产品 GeForce RTX 4070 Ti 相比提升有着 30% 的幅度。而且优秀的游戏性能同时有着不高的功耗,做到了鱼与熊掌兼得。各位有着爽玩游戏 + 大幅提升生产力需求的用户来说,不妨多多考虑这款产品。
测试平台配件简介:
测试平台使用了 MPG A1000GS PCIE5 电源。该电源符合 80PLUS 金牌认证,采用全日系 105 ° C 电容,品质更出色。原生支持 PCIe 5.1 及 ATX 3.1 规格显卡。采用单路 12v 输出设计,能更好喂饱高功耗显卡,电源旁边带有微星龙标和 MPG 信仰标识。电源后面的是按钮用于开关风扇自动启停,兼顾静音和散热效能。
内存用的是金士顿 Renegade 叛逆者骇客神条 DDR5 7600MHz 16G*2,该产品系列有 6000~8400MHz 频率多档可选,满足不同需求的用户。该内存支持 XMP3.0 规范,CL38 低时序,银黑色铝制马甲看起来颜值颇高,而且能为内存颗粒带来不错的散热效果,片内 ECC 和板载 PMIC 提供更出色的稳定性,两个独立的 32 位通道能大幅提升多核处理器的数据效率。系统 M.2 固态硬盘用的是金士顿的 NV3 500GB PCIe4.0,读取速度高达 5000MB/s,写入速度也有 3000MB/s,有多种容量可选,最高容量高达 4TB。
登录后才可以发布评论哦
打开小程序可以发布评论哦