最近半年的 PC DIY 市场只能用 " 惨淡 " 来形容,在闪存价格暴涨的影响下,不管是内存还是显卡都在涨价,很多朋友估计都和小雷一样暂缓或取消了升级电脑的计划。
电脑升级是别想了,那么玩家们缺的游戏性能这块谁来给补上呢?没关系,微软出手了——玩家们苦等的 DirectX 12 SER 终于完成技术验证,正式加入 DXR 1.2 规范的大家庭。
SER,全名 Shader Execution Reordering(着色器执行重排序),这项技术最初由英伟达研发,随后被微软相中并纳入 DirectX 12 的开放规范中,其主要作用是通过对光追模式下的 GPU 计算线程进行重新排列,归纳相似的工作负载,让 GPU 的并行计算能力得到充分释放。

图源:微软
对于玩家来说,光追功能真的是又爱又恨,爱的是开启后画质大升级,恨的是对显卡性能要求极高,无脑拉高就等着卡死吧。为了解决光追模式下的帧率问题,英伟达在 RTX 40 系上首次引入了 SER 技术,但是当时开发者必须通过 NVAPI 或虚幻 5 的 RTX 插件才能调用。
想要了解 SER 的用途,首先我们要了解传统显卡在光追功能上都面临哪些问题。在光追技术发布之前,游戏场景的光线都采用光栅化渲染来完成,它是一种循序渐进的渲染过程,这使得传统显卡发展出了 SIMD 架构(单指令多数据),让流处理器可以同时处理同一个渲染需求。
但是开启光追功能后,这个架构就遇到麻烦了,光追本质上是模拟物理形态下的光线漫反射状态,这些衍生出来的 " 二次光线 " 是随机的,这就导致传统显卡在计算光追路径时疲于应对大量但零碎的需求,导致严重的效率下降。
打个比喻,就像是一条原本只需要拧螺丝的生产线,某一天传送带上不仅有螺丝,还有螺母、钉子等各种零件,这就导致每个产线都只能处理一部分工作,然后才能继续自己的工作,也就是有相当一部分的性能是在 " 空转 "。
而 SER 就像是一个产线分拣员,他能够让 GPU 在计算时对光线任务进行即时的检查和调度。在光线开始模拟生成前,SER 会将这些任务先放到缓冲区,然后对其进行分类,将相似的光线生成任务打包成一个计算块,然后丢给对应的产线负责。
图源:Gemini
简单来说,就是在原料下产线前加了个分拣员,把零件归纳整理并交给对应的产线,让 GPU 又回到自己熟悉且高效的运行状态中。事实上,英伟达在 RTX 20 系列上更新光追功能后,很快就意识到光追的瓶颈在于调度问题,所以才花了几年时间折腾出个 SER。
然后,微软就把 SER" 招安 " 了,毕竟这么好的东西还是不要藏着捏着了,分享给大家不好吗?彼时的英伟达也因为盈利重心转向 AI 芯片,消费端的需求增长明显放缓且没有过多精力去运营,于是也同意了这个要求(传闻)。
所以,未来不光是英伟达能用 SER,AMD、英特尔等其他厂商的显卡都可以用上 SER,而且不需要开发者做针对性的调用,只需要支持 DX12 即可,这让大多数中小型厂商可以放心大胆地将光追加入自己的游戏中,而不用担心优化问题。
在微软此前给出的测试报告中,开启路径光追后,SER 技术普遍能够带来 20% — 40% 的帧率提升,而在部分针对性优化的 Demo 中甚至可以获得 90% 的帧率提升,这种纯免费且无 " 副作用 " 的性能提升,估计能让很多玩家拍手叫好。
看到这里,估计很多读者都要问了:既然这么爽,那么我们什么时候可以用上呢?
这个问题的答案,其实颇为微妙,首先从时间上来说,如果你使用的是 RTX 40 系以上的显卡,并且玩过《赛博朋克 2077》,那么你已经体验过 SER 的效果了。在《赛博朋克 2077》的路径光追模式下,SER 会自动启用,这也是英伟达的中高端显卡能够给到 60fps 以上帧数的主要依仗。
不过,DirectX 12 的 SER 并非适用于所有显卡,想要运行的前提是拥有对应的硬件调度器和驱动支持,对于 RTX 40 系以上的显卡玩家来说,这个就不用担心了,问题主要在 AMD 和英特尔的用户身上 。
其中,AMD 需要是 RX 9000 系列以上的显卡才能完美支持 SER,因为在 RDNA 4 中,AMD 首次引入了全新的 RT 单元架构。其本质与英伟达的 SER 硬件调度器是相同的,都是对线程排序的缓冲区,这使得 RDNA 4 架构原生支持 DXR 1.2,这也是为何 RX 9000 系对比 RX 7000 系在光追表现上有了质的飞跃。

图源:AMD
不过,RX 9000 系直到今天都只有两款中端显卡,本身的性能限制导致其无法满足高端玩家的需求,也不知道在闪存涨价的压力下,剩下的两款高端显卡能否在今年按时发布并销售。
至于英特尔这边,情况就好很多了,因为历史包袱小(满打满算也就 3 年多),所以从 Xe2 开始就原生支持 SER。其中,B580 作为一款发布于 2024 年的显卡,现在只要两千不到,在 2K 分辨率下性能基本稳超 RTX 4060 接近 RTX 4060Ti,而在原本弱势的光追模式下,凭借 SER 的更新(90% 性能提升),也是追上 4060 的水平。
可以说,SER 普及后,B580 就成为目前最香的 2K 游戏显卡之一,12GB 的显存让它不会像英伟达的两款甜点卡那样爆显存。而且,今年英特尔应该还会推出基于 Xe3 架构的新一代 B 系列显卡,其性能表现应该值得期待。

图源:英特尔
简而言之,SER 带来的性能提升是真的不少,但是对于还在用老显卡的玩家来说就有点 " 爱莫能助 " 了,小雷总结了一下,目前 RTX 4060Ti、B580 和 RX 9070 GRE 都是不错的选择,打算战未来的朋友们可以考虑升级显卡。
不过,即使你的显卡支持 SER,你的系统、驱动都升级到最新,最终也还要等游戏更新,这个问题主要在于已经很少有游戏开发者会手动优化 DirectX 代码,所以 DirectX 12 的 SER 想要普及,还是要等虚幻 5 等主流游戏引擎整合后才行。
而且还有个令人扎心的事实,那就是 SER 并非像 DLSS 那样通过替换 DLL 就能生效的技术,因为涉及渲染管线底层的任务调度逻辑。因此,对于已经发售的老游戏,除非开发商愿意投入人力物力去重写渲染后端并发布大型补丁,否则这些老游戏将永远与 SER 无缘。
事实上,SER 的意义还是在于让路径光追可以真正普及,而不再是少数游戏的 " 特权 ",让老显卡们也能享受到福利,只是光追普及过程中顺带的。进一步地说,在路径光追之上的 " 全景光追(实时生成所有光线)",也是必须依靠 SER 才有可能实现。
从目前来看,SER 主要针对近两年的显卡生效,虽然多少有点 " 富人越富 " 的感觉,但是技术的发展本就是一个 " 旗舰平权 " 的过程,一开始是旗舰先用上,然后过一两代就开始下放到中端、入门产品,最后再转入轻量化市场(如移动端),进而带动整个行业的下限提升。
说实话,在如今这个闪存价格暴涨导致的 " 硬件寒冬 " 里,SER 这类通过底层逻辑优化来挖掘硬件潜能的技术,或许正是未来打破性能瓶颈的关键。而且摩尔定律在最近两年也逐渐失效,硬件升级带来的性能提升也越来越少,说个大家都不太关注的事情,那就是 RTX 50 系对比 40 系,理论性能提升大多在 20% 以下。
那么 50 系与 40 系的帧数差距为何这么大?原因就是 DLSS 等软件带来的优化,比如 DLSS 4 所带来的多帧生成,最高能把帧数翻 8 倍。所以,未来这种 " 软件定义硬件 " 的情况肯定会比以前更多,对于玩家来说也是一件好事,毕竟软件升级那是 " 真免费 ",白嫖来的提升,哪怕只有 1% 都是香的。



登录后才可以发布评论哦
打开小程序可以发布评论哦