游戏硬件实验室:DLSS NIS FSR三大超级采样PK 谁的游戏优化最佳?
发布日期:2025-01-04 16:58 点击次数:116
原理科普:DLSS与空间缩放有何不同 在我们开始用游戏实测对比之前,为了让大家能大致理解几种游戏画面/性能优化技术之间的区别,这里我们简单介绍一下它们的原理。 NIS,即NVIDIA IMAGE SCALING,它本质上也是一种空间图像缩放技术,跟FSR的基本原理相同。它的基础原理并不复杂:根据输入画面中每个采样像素点的坐标,在输出分辨率的对应坐标中填入该采样的像素值,最终得到这一帧输出的画面。 以上就是空间缩放技术的基本工作流程,叫做“单点采样”。由于采样以及填充的像素值精度不高,输出的画面会出现颜色过渡生硬,物体边缘呈现很不清晰的马赛克。 为进一步提高输出画面的清晰度,单点采样又衍生出多线采样,用采样坐标点周围四个像素值进行加权平均值来填充到输出分辨率的坐标中,加权平均值通过双线性插值的方式计算,得到精确度更高的输出值。同时由于像素坐标是一个浮点坐标,通过浮点计算得来,用一个或许不那么恰当的比喻形容——多线采样也相当于一种提高浮点精度的方式。 多线采样原理示意图 目前无论是显卡驱动还是游戏中的SDK,采用跟空间缩放有关的优化技术都是基于上述原理,所不同的是后续的一些动作。 比如NIS的在进行空间缩放操作之后还加入了Sharpening Algorithm环节来锐化输出的帧画面,尽可能将因缩放而模糊的画面恢复清晰度,同时锐化的程度可以由用户手动调节,以适应不同喜好需求。FSR也有类似的算法,只是不单独开放这一项调节,有时可能锐化过渡,有时不足。 NIS控制界面,原生分辨率为4K,不同级别的优化档位供选择 与FSR不同的是,NIS并不是由游戏厂商在游戏中集成SDK来实现其功能,而是根植于驱动层面。NVIDIA在今日更新的496.70开始支持这项功能,需要通过GFE来调用。就像Shadow play界面一样,可以在游戏画面中用快捷键调出控制面板设置NIS。 由于NIS完全是基于驱动层面的后期处理,意味着无论是玩什么游戏,只要是NVIDIA GeForce 900及以后的显卡产品都支持该功能,因而适用面要比FSR大许多。 如上图所示,渲染分辨率的百分比即相当于FSR的性能、质量等不同优化档位,而锐化可让你手动调整对画质损失的补偿。不过锐化只是一种简单的算法,并不能让缩放渲染后的画面还原到跟原生画质一模一样。 DLSS还是永远的神 天上没有掉下的馅饼,如果仅仅靠降低渲染分辨率的空间缩放就能使画质和帧率兼得,那芯片巨头还要呕心沥血地研发新GPU干嘛。要想让优化后的画质无限趋近于原生,就必须做更多的工作,加入更复杂的算法,这就是NVIDIA花大力气开发DLSS的原因所在。 基础原理还是那个原理:在一定像素范围内,采样的数量越多,输出到大分辨率对应坐标的像素值就越精确。但像素值精确只是机械的理论精确,不代表画面准确,结果是物体边缘马赛克没了,却变的朦胧,如果继续扩大采样范围还会变得更模糊,乃至画面失真。所以光靠这条路是走不通的。 如何加大采样数量又能限制采样范围呢,DLSS在空间采样的基础上增加了一个时间维度——如上图所示,用1080P渲染输出到1440的屏幕上,DLSS会同时采样当前帧和之前几帧的画面,采样的帧画面范围会凭借帧生成时间和像素值的比对由AI判断,确保该帧适合被纳入采样范围,其中要用到张量计算。 假如输出一帧1440p画面要对三帧1080p做采样,代表一共输入了6M以上的像素数据计算最终得到了一个3.5M的1440p画面。而相对简陋的空间缩放技术要得到同样一张画面仅依靠2M左右一帧1080P像素数据。输出质量孰优孰劣,不言自明。 完成这些工作所需的张量计算本质上是大量半精度浮点计算,所以DLSS需要具有强大半精度浮点算力的Tensor核心支持,从而成为RTX系列显卡的专属福利。想要更好的就得付出额外的代价,这是亘古不变的规律。事实上NVIDIA两年前就已经开发出了NIS,当时由于更强大的DLSS即将问世,FSR又尚在娘胎之中,就没有将这项技术开放给用户。
下一篇:MOLI万站,正式上线