驱动之家 04-12
8GB显卡再战十年不是吹牛!NVIDIA RTX神经纹理压缩技术实测:显存占用爆降85%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 4 月 12 日消息,随着 3A 大作对画面精度的要求持续升级,高精度材质纹理包的体积水涨船高。曾经的主流 8GB 显存显卡,如今动辄遭遇爆显存、画面卡顿、强制降画质的窘境,也被不少玩家调侃为 " 残废卡 "。

而 NVIDIA 全新的 RTX 神经纹理压缩技术(简称 NTC),或许能彻底改变这一现状。

近日,Tom's   Hardware 对这项技术完成了多显卡、全平台的专项实测。NTC 是随 RTX50 系列显卡一同发布的 AI 驱动技术,依托显卡 Tensor 核心(NVIDIA 显卡内置的 AI 加速运算核心)完成纹理的压缩与解压,最高可将显存需求降低超 80%,实测最高降幅达 85%,同时画面画质还优于游戏行业沿用多年的传统压缩方案。这一结果,也让玩家对 "8GB 显卡再战十年 " 有了切实的期待。

从技术原理来看,NTC 是基于机器学习的纹理压缩与解压方案,也是 NVIDIA 神经着色渲染新范式的核心技术之一。它跳出了传统 BCn 块压缩格式(游戏行业通用的传统区块纹理压缩标准)4 × 4 像素的固定限制,在压缩阶段就将原始纹理转化为小型神经网络权重与潜在特征组合。

需要明确的是,NTC 是确定性解码技术,并非生成式 AI,不存在 AI 幻觉的风险。

为适配不同层级的硬件,NTC 在 DirectX12 接口下提供三种运行模式,另一主流接口 Vulkan 因无对应配套功能,仅支持其中两种(不支持 Inference on Feedback  )。

第一种是加载时推理模式(Inference on Load)。它会在游戏或地图加载阶段,全程在 GPU 内完成 NTC 纹理的解压,并同步转码为传统 BCn 格式。这种模式和原生 BCn 纹理的渲染性能完全一致,没有任何渲染阶段的性能开销,还能大幅缩小游戏的磁盘占用体积、降低 PCIe 总线传输压力,唯一的不足是无法降低运行时的显存占用。

第二种是采样时推理模式(Inference on Sample),这也是大众认知中神经纹理压缩的核心形态,更是显存压缩能力最强的模式。它会在纹理采样时,通过预训练的多层感知机(简称 MLP,一种轻量化小型神经网络),实时解码当前所需的像素数据,最终实现最高 85% 的显存占用降幅。

第三种是反馈时推理模式(Inference on Feedback),仅支持 DirectX12 接口。它会通过采样器反馈(DirectX12 专属图形功能,可精准识别渲染当前画面所需的纹理区块),仅解压渲染当前画面需要的纹理部分,是前两种模式的折中方案——显存降幅不如采样时推理模式,但性能开销更低,整体表现介于两者之间。

Tom's Hardware 用行业通用的 Intel Sponza 标准场景完成了量化测试,实测数据完全贴合官方标称的压缩能力,原始无损参考材质的纹理显存占用为 6830MB。加载时推理模式(Inference on Load)将纹理转码为 BCn 格式后,显存占用为 2041MB。

而采样时推理模式(Inference on Sample)下,纹理显存占用仅为 303MB。实现了 85% 以上的纹理显存占用。对比原始无损参考材质,显存降幅更是超过 95%。

同时实测显示,该模式下的画面效果,比转码后的 BCn 纹理更接近原始参考材质,几乎能做到完美复刻。而在 NVIDIA 官方的托斯卡纳别墅场景测试中,同画质下的纹理显存占用,可从传统 BCn 格式的 6.5GB 直接降至 NTC 格式的 970MB。

测试团队覆盖了从旗舰到入门级的多款 NVIDIA 显卡,以及笔记本移动平台,核心测试指标为帧时间(渲染单帧画面所需的时间,数值越低画面流畅度越高)。

RTX 5090 在 4K 分辨率下,采样时推理模式搭配 TAA(时间抗锯齿,主流的画面平滑技术,用于消除画面锯齿、提升画面纯净度),帧时间仅比零开销的加载时推理模式增加 0.09ms,性能损耗几乎可以忽略。

主流 RTX 5070 在适配的 1440P 分辨率下,该模式的帧时间开销在 0.50-0.70ms 之间。入门级 RTX 5060 在适配的 1080P 分辨率下,帧时间开销稳定在 0.60-0.70ms。即便是笔记本端的 RTX 4060 移动显卡(8GB 显存),1080P 下的帧时间开销也仅 0.70-0.85ms。

测试团队同时明确,测试场景仅包含基础前向渲染与抗锯齿流程,实际 3A 游戏有大量不受 NTC 影响的渲染通道,因此这项技术在实际游戏中的相对性能损耗,会比测试数据更低。

对于 8GB 显存显卡来说,只要游戏基础帧率充足,用小幅性能开销换取不降级的纹理画质,是实打实的净收益。

这项技术也有明确的使用门槛。采样时推理模式必须开启随机纹理过滤(简称 STF,用于优化纹理画质、减少画面瑕疵),关闭抗锯齿时会产生画面噪点。DLSS 能完全消除这类噪点,TAA 仅能完成大部分清理,无法彻底消除,因此该模式优先推荐搭配 DLSS 使用。

NTC 技术开发者、NVIDIA 资深工程师 AlexeyPanteleev 表示,采样时推理模式更适合高性能显卡,加载时推理模式可覆盖全平台硬件。游戏厂商可按单纹理选择是否启用 NTC,也能给玩家开放模式选择,让用户根据自身硬件情况决定。

值得一提的是,NTC 并非 NVIDIA 专属技术,它可兼容 AMD、Intel 显卡的 AI 加速单元,行业爆料称索尼 PS6 主机也有望采用同类技术。

目前尚无游戏正式支持该技术,但全行业布局已落地,规模化商用近在眼前。它不仅能让小显存老显卡重获新生,也为实时图形渲染开辟了全新的技术方向。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

nvidia ai 神经网络 tom
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论