您现在的位置是:首页 > 科技 >正文

互联网实时动态3DMark获得全面的射线追踪功能测试

发布时间:2021-05-24 08:54:35来源:

导读分享一篇有关互联网,手机,快科技方面文章给大家,相信很多小伙伴们还是对互联网,手机科技这方面还是不太了解,那么小编也在网上收集到了

分享一篇有关互联网,手机,快科技方面文章给大家,相信很多小伙伴们还是对互联网,手机科技这方面还是不太了解,那么小编也在网上收集到了一些关于手机,互联网,科技这方面的相关知识来分享给大家,希望大家看了会喜欢。

在最好的显卡需要不只是在性能和价格上进行竞争,而且对功能。既然RX 6900 XT,RX 6800 XT和RX 6800正在加入Nvidia,以通过硬件支持光线追踪,我们真的很想知道它们在性能方面的比较。谁将在我们的GPU基准测试体系中获得最高荣誉,如果在启用光线跟踪的情况下进行测试,情况将如何改变?

多年来,游戏中的射线追踪一直备受关注。我记得在2008年《雷神之锤4敌人领土》(Quake 4 Enemy Territory)拥有原型射线追踪模块时。它看上去很酷,但是性能却很差。在16核CPU上以16 fps 720p播放?但是至少这是什么!

快闪十年了,英伟达的RTX硬件承诺了出色的质量和性能。除了RTX卡以外,游戏仍然使用混合渲染方法,其中大多数渲染是使用传统方法完成的,光线跟踪仅在事实发生之后才应用,以实现一些特定的效果,例如反射或阴影。

使用当今支持光线跟踪计算的现代GPU,在游戏上进行全路径跟踪需要做什么?Quake II RTX和Minecraft RTX已经做到了这一点,但是它们是较老的且不太复杂的游戏,具有路径跟踪功能。现在,UL为3DMark添加了一项功能测试,该测试对皇家港口基准进行了资产的全光线跟踪渲染。(请注意,您将需要Advanced或Pro版本来访问DirectX光线跟踪功能测试,如其所称。)

我们喜欢能够在各种GPU上比较“纯”光线跟踪性能的想法。3DMark DXR功能测试现在为我们提供了另一种方法,尽管它没有报告每秒射线/三角形相交的数量(这是我们真正想要看到的),但它确实提供了与光线跟踪硬件直接相关。我们将当前的RTX GPU进行了汇总,以供参考。更重要的是要看到AMD即将面世的Big Navi,RX 6900 XT,RX 6800 XT和RX 6800都将在下个月左右推出。

我们通过DXR功能测试运行了所有RTX卡,但RTX 2070和2080除外(它们应该落在新的Super变体之间的中间位置)。的的GeForce 3090 RTX是在4X的性能RTX 2060时,RTX 2080钛的两倍以上的速度是2060位,和的GeForce 3070 RTX是略快于2080钛。RTX 3090也比GeForce RTX 3080快19%,这比我们测试过的大多数游戏都要大。基本上,这里的事情更多地受到GPU的限制,因此理论性能最终接近现实。

多近?我们使用RT内核的数量,GPU时钟和RT内核的生成来计算一些数字。Nvidia表示,第二代30系列RT内核比第一代20系列RT内核快约70%。例如,这意味着3070应该比2080 Ti FE快约7%,而2080 Ti应该比RTX 2060快150%。

30系列GPU的扩展几乎完全符合预期。3070确实比2080 Ti快了7%,3080比3070快了48%(预期为47%),而3090比3080快了19%(相比预期为19.5%)。

但是,在20系列零件上的结果最终变化更大。2060超级版比2060快14%(预期为11%)。但是,2070 Super仅比2060(理论上的41%)快35%,2080 Super快65%(理论上73%),而2080 Ti快127%(上理论上150%)。尽管如此,这几乎足够接近受人尊敬的行为和良好的起点。

我们也想在某些非RTX GPU上运行DXR功能测试,但它基本上是在嘲笑我们并嘲笑我们的硬件。“您微不足道的GTX 1660 Super和GTX 1080 Ti无法处理光线追踪的真相!” 实际上,它告诉我们我们的硬件不支持运行测试所需的DXR Tier 1.1功能集。对于GTX上的DXR,通过驱动程序和着色器hack来说是如此:光线跟踪硬件加速是必需的。

更大的问题:AMD的RX 6800,RX 6800 XT和RX 6900 XT相对于RTX 3070,RTX 3080和RTX 3090的价格如何?根据理论估算,6900 XT可能会降落在3070和3080之间的中间位置,而6800 XT会比3070快一点,而RX 6800则位于2080 Ti和2080 Super之间。但是理论上的性能估算可能与实际情况不符,我们绝对有兴趣在本月晚些时候看到情况如何。

关于3DMark DXR功能测试,还有很多要讨论的内容。例如,它的运行方式与我们预期的不太一样。默认设置以1440p的像素每像素12个随机样本进行渲染,并且像大多数路径跟踪算法一样,这些样本的输入被组合起来以给出最终的像素颜色结果。然后再次采样,结果质量得到提高。通常,将重复此过程,直到达到所需的质量水平。

问题在于3DMark DXR Feature Test实时进行所有采样和累加。样本计数指定累积速率,并在物体运动时直接影响图像质量。但是,一旦相机停止移动,您最终将获得每个场景相似的最大质量结果(经过相同的总时间)。

使用2采样设置时,相机开始移动时,与默认的12采样设置相比,物体看起来有点颗粒感,而默认设置为12采样设置。但是,一旦相机暂停几秒钟,屏幕上的结果就会开始迅速收敛。查看这些图像质量比较。

同一场景的上述画廊展览图片右后摄像机暂停,直到只是之前它再次开始转动。因此,前三个“开始”图像是“最差”质量,而三个“结束”图像是“最佳”质量。请注意,屏幕抓图来自使用ShadowPlay进行的视频捕获,因此您应该忽略一些压缩伪像。这是为了使每种设置的捕获相同帧变得更加容易。(这些结果来自RTX 2080 Ti。)

视频压缩伪影会掩盖您在场景运动时会看到的许多其他噪声,尤其是在2采样设置上。但是,即使在稳定图像的时间很短的情况下,也要检查图像看起来有多相似。三个“最终”结果基本相同,唯一的区别是随机采样的播放方式。但是,到目前为止,最大的因素是性能。

使用RTX 2080 Ti,默认12个样本的平均性能为30.2 fps。每个像素下降到两个样本,性能将跃升至165 fps,而将采样数增加到每个像素20个样本,则性能将仅下降至18.1 fps。换句话说,每帧每像素的采样数几乎直接影响性能。

我想看到的是一种在各种样本计数之上运行的深度学习衍生降噪算法。当然,默认情况下2样本图像质量非常嘈杂,但是Quake II RTX也是如此。请看以下示例:

“嘈杂”图像的运行速度提高了15%至25%,但是如果您实际上是想制作一款可玩的游戏,它的作用会更大。然后的目标是做足够的样本以获得可以转换为更好看效果的图像。想想DLSS,但除了上调幅度外,它还可以消除噪声并以一致的方式在各个像素之间进行插值。

获得接近完美的路径跟踪结果所需的每个像素的随机样本数通常为数百。对于实时游戏应用而言,这不会很快发生。但是,Quake II RTX允许您调整用于照片模式的样本数量,范围从100到8000。

最多需要一分钟的时间来渲染1080p的单个帧,而100个样本可以很快完成。同时,图像质量在基线100个样本以上不会有太大变化,但是如果您要渲染比Quake II更复杂的游戏可能会更重要。

选择更多的样本,更低的性能和更高的图像质量;或更少的样本,更好的性能和更低的图像质量。在游戏中,要想在质量和性能之间找到一个良好的平衡,就需要利用更高质量的光线跟踪渲染技术。在照片模式之外,Quake II RTX每个像素仅使用几个样本,并且可以轻松达到RTX显卡上的可玩性能。

当然,还有几个问题。首先,为了进行去噪,它是否需要Nvidia的Tensor内核,还是可以通过FP16在常规GPU着色器上完成(使其与AMD GPU兼容)?它将对性能产生多大影响?

更重要的是,完全光线追踪的游戏或图形是否重要的​​问题。当前的光线追踪游戏通常使用混合渲染方法,光栅化处理大多数底层图形,并且光线追踪效果仅用于反射,阴影或全局照明之类的事物。但是,如果混合渲染可以在以更快的速度运行时获得相同的视觉效果,那不是最佳的整体效果吗?

一个问题是,混合渲染需要用于传统栅格化的所有代码以及用于光线跟踪的代码,这意味着游戏开发人员可能需要做更多的工作。再说一次,由于虚幻引擎和Unity中内置了对光线跟踪的支持,这比您可能遇到的问题要少。无论如何,我们不太可能在不久的将来放弃栅格化。

标签:3DMark获得全面的射线追踪功能测试

上一篇
下一篇