从NVIDIA的第一款RTX 30系列显卡发布至今已经过去3个多月了,各种性能测试我们也是做了一大堆。相信大家对RTX 3090至RTX 3060 Ti在内的4款NVIDIA GeForce RTX 30系列显卡(还有RTX 3080以及RTX 3070)已经有一个比较全面的了解了吧。
由于增加了许多的“黑科技”,这代的NVIDIA GeForce RTX 30系列显卡无论是在本身游戏性能还是光追的表现方面都比NVIDIA GeForce RTX 20系列显卡强悍了许多。
不过强归强,到底强多少,还得有实际的数据才行,而作为一名游戏玩家,我们最希望知道的还是——这块RTX 30系显卡在我要玩的游戏中表现如何?
虽然在原本的显卡测试中,我们已经包含了10来款热门游戏的表现。但是,这怎么能够呢?毕竟每个玩家喜欢的游戏都不尽相同,只是10来款游戏肯定不够全面。既然这样,那就直接上50款吧!
因此,为了让大家对于整个NVIDIA GeForce RTX 30系列显卡有一个更加直观的认识,我们决定做成一个系列的评测选题,在这一系列选题中,我们将使用不同的显卡分别对10款热门光追游戏及40款近两年的顶级3A大作,进行实际的游戏性能测试,方便大家能够根据自己喜欢的游戏,找出适合自己的、对应的显卡。
本篇为该系列选题的第一期,我们将为大家带来RTX 30系列的核弹显卡——RTX 3090的性能评测,看看作为NVIDIA目前最顶级的显卡,在这50款游戏中,会有怎样的性能发挥。
1 2 3 4 5 6 7 8 下一页RTX 30系列显卡的新特性:
在RTX 30系列显卡中,最强的显卡无疑就是RTX 3090显卡了。这款NVIDIA Ampere的核弹产品相比20系又有哪些新特性?让我们一起来看一下!
8K分辨率的支持:
RTX 3090宣传图
首先需要提一句的是,HDMI 2.1接口已经添加了对8K@60Hz的支持,也就是说只要是显卡有这个接口,都能输出8K分辨率。
但是能输出不代表能够畅玩游戏,为了让玩家在8K分辨率上更加流畅的体验3A大作,NVIDIA配套推出了DLSS 2.1版本,相比DLSS 2.0版本,2.1的改进就是增加了一个“超高性能模式”,它使用了9倍采样,以达到更低的渲染分辨率,加上RTX 3090强悍的24GB显存,让“畅玩3A大作”变成了现实。
新一代Shader、RT Core以及Tensor Core:
全新的Shader、RT Core以及Tensor Core
在全新的着色器中,NVIDIA Ampere架构每个时钟周期可以进行2次着色器计算,使得NVIDIA Ampere架构达到了30 Shader-TFOPS,是Turing架构11 Shader-TFOPS的2.7倍。
在第二代RT Core中,NVIDIA Ampere架构翻倍了光追中的光线以及三角形计算吞吐量,使其可以达到58的RT-TFOPS,是Turing架构34RT-TFOPS的1.7倍。
在第三代Tensor Core中,NVIDIA Ampere架构的Tensor核心可以自动识别消除不太重要的神经网络中的权重。因此,新的Tensor核心达到了238 Tensor-TFLOPS,是Turing架构89 Tensor-TFLOPS的2.7倍。
ANNOUNCING RTX IO技术:
传统工作模式中不同读写速度所需要的工作核心数量(每个蓝框代表一个核心)
基于AO API工作模式时 不同读写速度与所需核心数量(每个蓝框代表一个核心)
正常的游戏工作流程是CPU复制硬盘中的文件并解压缩游戏图像,然后再交给显卡进行渲染。
但是由于PCIE 4.0的推出,使得PC的传输速率由传统机械硬盘的100MB/s直接提升到了7GB/s。这时再将硬盘中的文件交给CPU,然后经过一系列的运算处理再经过显卡渲染,这样的工作流程显然过于繁琐,且由于CPU的限制无法发挥PCIE 4.0高速通道的性能。
而NVIDIA Ampere架构的另一项功能——新IO API则是可以直接从固态硬盘快速加载数据,然后传输到GPU显存,用GPU来进行无损解压缩。以此,游戏中即使遇到宏观的巨大世界和场景,也可以被更加快速的加载出来,更好的发挥了PCIE 4.0的优势。
GDDR6X显存技术:
PAM4信令功能的GDDR6X显存
全新NVIDIA Ampere架构部分显卡采用了与美光合作的GDDR6X显存,这是首个具有PAM4信令功能的显存,它采用了以250mV为步进的4个级别电压分别对2位数据进行编码。
特点是能够在相同的时间内,达到传统GDDR6两倍的数据传输速度(等效显存频率翻倍)。
所以,采用了GDDR6X显存的显卡,在相同物理显存频率的情况下(就是GPU-Z显示的显存频率),等效显存频率是GDDR6的2倍。
GDDR6X的等效显存速率计算公式为:物理频率(MHz)*8=等效频率(MHz),等效频率*2=等效速率(Gbps)即1188MHz*8*2=19Gbps。
而GDDR6的等效速率计算公式为:物理频率(MHz)*4=等效频率(MHz),等效频率*2=等效速率(Gbps)即1750MHz*4*2=14Gbps。
在物理频率相同的情况下,他们俩的等效显存速率分别是16倍和8倍的区别。
NVIDIA Broadcast技术:
NVIDIA Broadcast直播程序界面
NVIDIA的Broadcast技术是一种直播技术,它是作用于直播行业里边的,包括但不仅限于虚拟背景(计算主播背景来进行替换)、人像跟踪(可将主播的背景去掉,仅保留主播本身,适用于在游戏中展示)和噪声消除(清楚麦克风的环境噪音以及回声)。
由于Broadcast技术是使用的NVIDIA显卡中的Tensor核心来进行计算处理的,所以在直播时对CPU和对显卡标准场景的负载会大幅度下降。
目前包括斗鱼直播伴侣、哔哩哔哩直播姬、甚至是OBS Studio、OBS Studio等直播推流软件都已经添加对该技术的支持,所以该技术主要应用于使用电脑来进行直播的主播们。
NVIDIA Reflex技术:
如果NVIDIA Broadcast技术仅对直播行业有用,那么NVIDIA Reflex技术就是为游戏玩家而生的福利了。
这项技术的作用旨在尽可能的降低用户操作鼠标、键盘时的延迟。
传统的用户对鼠标进行操作然后得到反馈的工作流程是:用户操控鼠标——鼠标产生信号传递给CPU——CPU进行操作处理——CPU运算好的资料传给显卡——显卡进行渲染——显卡传递给显示器。
NVIDIA Reflex的工作简化流程
NVIDIA Reflex主要就是优化了CPU到GPU之间的工作流程,它允许CPU可以将运算好的资料提前丢给显卡做渲染。省去了用户操作鼠标后给CPU,然后CPU走排队流程,等待整个处理序列完事后一起丢给显卡的时间,(相当于是走了一个插队流程)。
这样的好处可以大大降低CPU到显卡之间的延迟,以便让显卡更快速的进行渲染后将图像丢给显示器,这项技术尤其是在FPS类游戏中的表现会更加明显。
上一页 1 2 3 4 5 6 7 8 下一页光线追踪和DLSS技术:
传统的光栅化处理示意图
光栅化的过程简单地描述就是光栅引擎根据顶点渲染生成的三角形以人眼所接收到的二维画面来创建需要渲染的图像,接着将纹理数据按坐标铺入该图像中的三角形,得到完整的画面数据,再由ROPs将完整的画面数据填充到屏幕所看到的像素。
光线追踪处理示意图
而光线追踪就是通过模拟光的物理行为来提供逼真的光照。光线追踪通过跟踪光从观看者的眼睛穿过虚拟3D场景时将采取的路径来计算像素的颜色。当它穿越场景时,光可以从一个物体反射到另一个物体(引起反射),被物体阻挡(引起阴影),或者穿过透明或半透明物体(引起折射)。所有这些相互作用被组合以产生然后在屏幕上显示的像素的最终颜色。
其实这项技术在之前就已经有了,不过那是设计领域,不同于游戏,设计领域是允许长时间进行渲染从而展现给用户一副图像或是一部视频的。而游戏是实时变化的,所以这次应用到游戏领域中的光线追踪技术又叫“实时光线追踪”。
和传统的“工程师预先填充式”的光栅化处理不同,光线追踪有了“实时演算”的特性,所以它在光影的表现方面会更加的真实——这不仅是玩家们的用户体验得到了加强,游戏设计师们运用该技术也可以更快的完成一幅场景的构建(包括玻璃门、镜子,光影的安排),省去更多的时间可以让设计师们有更多的时间去打磨游戏的场景,剧情,以便提升整体游戏的质量。
DLSS技术:
DLSS及DLSS 2.0效果对比
DLSS又叫“深度学习超级采样抗锯齿”。它的特点则是就是直接进行较低分辨率的渲染,然后再对周围的像素点进行填充,使得画面的表现更加完整。
由于渲染分辨率的降低,使得显卡的渲染速度变得更加高效,以此来提升游戏的流畅度。
不过DLSS是有学习功能的,所以在像素填充时它会去学习更高分辨率下的渲染结果,以达到更好的最终表现,而这就是依赖于NVIDIA的Tensor核心进行计算了。
上图中我们仅列了DLSS和DLSS 2.0的表现,因为2.1只是增加了一个超级性能模式(即以更低的分辨率来进行渲染)。
《控制》中关闭DLSS(左)和开启DLSS(右)对比图
《控制》中关闭DLSS(左)和开启DLSS(右)对比细节图
通过将上边的对比图进行放大,我们可以发现墙上表格的细节在开启DLSS(右)后表现的更加完整。这是得益于DLSS在之前学习中记录了高分辨率下的细节,然后在填充时进行了补全。
所以整体而言,DLSS带来的游戏表现不仅仅是流畅度提升,画质反而会有可能得到增强。
上一页 1 2 3 4 5 6 7 8 下一页测试显卡技嘉RTX 3090魔鹰介绍:
本次测试使用的显卡是来自技嘉的GeForce RTX 3090 GAMING OC 24G(下简称技嘉RTX 3090魔鹰),该显卡的定位是高于猎鹰的存在,属于超频版,其核心Boost频率达到了1755MHz(公版RTX 3090频率为1700MHz)。
该卡采用了3风扇设计,最左边的为8cm直径,中间和右边的风扇则是9cm直径。
三个风扇均采用了刀刃式扇叶,在每个扇叶的边缘都设有一个凸起的三角立体造型,再搭配叶面上的导流槽可以为风扇增加更多的进风量。
背面使用了覆盖式的金属背板,不过在显卡的右侧部分仍然留有吹透式设计的出风口,可以让冷风直接通过右边的风扇吹透显卡。如果显卡温度较低的话,此处的风不仅能够起到辅助显卡散热的作用,还能够优化机箱内部的风道设计。
显卡采用了双BIOS的设计,默认为OC(高频率)模式,用户可通过拨动BIOS开关来进入静音模式,在静音模式下显卡的核心Boost频率则是1725MHz,届时显卡的发热控制会更加出色,风扇旋转时的噪音也会进一步减少。
即使在OC模式下,显卡在GPU负载较低时风扇仍会停转,以达到0噪音的目的。
在外接辅助供电方面,该卡为双8Pin设计。
该显卡的供电应为16+3相设计。核心供电为16相,由2颗uPI uP9512R PWM芯片控制,显存供电为3相,由1颗uPI uP9511R PWM控制。
该显卡采用了镁光的D8BGX显存颗粒,GPU(正反面)左右各4颗,顶部3颗底部1颗共计12*2(正反面)构成了384bit的位宽以及24GB GDDR6X的显存容量。
上一页 1 2 3 4 5 6 7 8 下一页测试平台其它硬件介绍:
为了保证显卡的性能发挥不会因为其它硬件产生瓶颈,这次我们使用了Intel Core i9-10900K处理器以及32GB*2内存的硬件配置。
本次测试涉及10款带光追的游戏以及40款近两年的3A级大作,在测试时如果有预设画质则我们选择预设画质的最高档,如果没有预设则我们选择手动将全部选项设置为最高。
整体测试硬件平台
本次测试使用的主板为技嘉的Z490 AORUS MASTER,又叫超级雕,是定位属于次旗舰的主板,该主板支持PCI-E 4.0通道(需搭载11代酷睿处理器),其CPU辅助供电为双8Pin,是一款及超频、游戏性能为一体的高端ATX架构主板。
测试使用的内存为芝奇的F4-3600C16D-32GTRG,2条DDR4-3600MHz 16GB容量的内存共计组成了双通道32GB的容量。该内存套装时序为16-16-16-36,电压为1.35V。其超高的容量可以更好的发挥出技嘉RTX 3090魔鹰这块目前30系列顶级显卡的性能。
由于测试项目比较多,所以我们使用了西数的WD_BLACK D10 8TB移动硬盘来作为数据存储盘,该硬盘转速为7200RPM,可提供高达250MB/s的读取速度,作为移动硬盘来说,非常的方便。
由于测试使用的Intel 10核心20线程的顶级处理器i9-10900K,该处理器发热量比较大,所以我们选择了安耐美的冰凌360一体式水冷散热器,该水冷采用了3个风压可达6.28i毫米水柱的磁悬浮轴承散热风扇。并使用了一颗支持TDP500W的450L/H强力EF1水泵,在全部360一体式水冷中可以算是顶尖水平了。
上一页 1 2 3 4 5 6 7 8 下一页4K分辨率下游戏性能测试:
4K分辨率下支持光追的10款游戏性能表现
注:上图中,《使命召唤16》不支持DLSS功能,所以仅开启“光追”特效。
4K分辨率下40款3A大作游戏性能表现
测试小结:
在10款支持光追的游戏中,我们分别测试了开启光追及DLSS和关闭光追及DLSS的成绩。
可以发现如果同时开启光追及质量档的DLSS,只有《使命召唤17》以及《德军总部:新血脉》可以达到90帧以上的平均帧。
在40款3A大作中,则只有《全面战争:三国》未能达到60帧平均帧的流畅表现。
上一页 1 2 3 4 5 6 7 8 下一页2K分辨率下游戏性能测试:
2K分辨率下支持光追的10款游戏性能表现
注:上图中,《使命召唤16》不支持DLSS功能,黄色条形图表示游戏在该分辨率下不支持DLSS功能,所以在测试该项游戏性能时,仅开启“光追”特效。
2K分辨率下40款3A大作游戏性能表现
测试小结:
在10款支持光追的游戏中,只有《赛博朋克2077》以及《看门狗:军团》和《地铁:离去》在开启光追及DLSS后无法达到平均帧90帧以上畅爽游戏的表现。但均超过了60帧以上平均帧的流畅表现。
而在40款3A大作中,除了《刺客信条:英灵殿》之外,其它游戏均达到了90帧以上平均帧的畅爽表现。
上一页 1 2 3 4 5 6 7 8 下一页1080P分辨率下游戏性能测试:
1080P分辨率下支持光追的10款游戏性能表现
注:上图中,《使命召唤16》不支持DLSS功能,黄色条形图表示游戏在该分辨率下不支持DLSS功能,所以在测试该项游戏性能时,仅开启“光追”特效。
1080P分辨率下40款3A大作游戏性能表现
测试小结:
在10款支持光追的游戏中,只有《地铁:离去》这款游戏在开启光追(该游戏1080P分辨率不支持DLSS)后无法达到平均帧90帧以上畅爽游戏的表现。其它游戏均超过了90帧以上平均帧的畅爽表现。
而在40款3A大作中,所有游戏均达到了平均帧90帧以上的畅爽表现。
上一页 1 2 3 4 5 6 7 8版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
本文地址:/ITzixun/6674.html