横扫CG圈的权威测评：英伟达RTX 40显卡超全软件测试对比

您所在的位置：网站首页 › 3090和4090参数对比 › 横扫CG圈的权威测评：英伟达RTX 40显卡超全软件测试对比

横扫CG圈的权威测评：英伟达RTX 40显卡超全软件测试对比

2023-07-11 20:54| 来源: 网络整理| 查看: 265

GeForce RTX 40系列GPU共有三款。而且，Nvidia表示RTX 40系列GPU的性能比前代产品有了显著提升，许多测试表明游戏的情况确实如此，但数字内容创作究竟怎么样呢？

针对以上内容和问题，国外有一位作者Jason Lewis对三款GeForce RTX 40系列GPU进行了比对测试，同样也与较旧的Nvidia GPU（包括 RTX 30系列和RTX 20系列的GPU）进行了比较。

关于作者咱们简单介绍一下，Jason Lewis目前是腾讯TIMI Studio Group旗下Team Kaiju的首席环境艺术家，也是CG Channel.com网站的评论员。

https://www.artstation.com/jay-lew

针对这次的测试，他采用了最科学、最真实的方法进行比对。

共分为六个部分：

1.技术重点：GPU架构和API

2.规格

3.测试程序

4.基准测试结果

5.其它考虑因素

6.结果

所以显卡到底怎么选？快点认真听讲咯~（内容很长，建议收藏！)

测试里包含哪些GPU？

从2022年底以来，Nvidia一直在推出基于Ada Lovelace架构的GeForce RTX 40系列GPU。

在本次评测中，将关注GeForce RTX 40系列的三款显卡：GeForce RTX 4090、4080和4070 Ti。（基准测试完成时，中端GeForce RTX 4070和GeForce RTX 4060系列尚未发布。）

此外，作者将针对GeForce RTX 30系列的两款显卡（GeForce RTX 3090和GeForce RTX 3070）以及GeForce RTX 20系列的一款显卡（GeForce RTX 2080）对其进行测试。

还将测试Nvidia的专业性更强三款显卡：Ampere一代RTX A6000以及 Turing 一代Titan RTX和Quadro RTX 8000。

这使得测试中的GPU的完整阵容如下：

技术重点：GPU架构和API

在开始测试之前，先了解一些基础知识点。

与Nvidia的上一代Ampere和Turing GPU一样，当前的Ada Lovelace GPU架构具有三种类型的处理器核心：CUDA核心，专为光栅化和通用GPU计算而设计；张量核心，专为机器学习操作而设计；以及在加速光线追踪的RT核心。

为了更好的支持RT核心，软件必须通过图形API访问。就本次评测中介绍的应用程序而言，要么是DXR（DirectX光线追踪），要么是Nvidia自己的OptiX。

在许多渲染器中，OptiX渲染后端作为基于Nvidia CUDA API的旧后端的替代方案。CUDA后端可与更广泛的Nvidia GPU和软件应用程序配合使用，所以，OptiX的性能通常会提高很多。

规格

这里，要展开讲述一下三款GeForce RTX 40系列GPU。

首先是GeForce RTX 4090。RTX 4090是Ampere一代RTX 3090和3090 Ti的直接替代品，是目前Nvidia最快的消费类GPU，其顶级AD102 GPU拥有16384个CUDA核心、512个第四代Tensor核心和128个第三代RT核心，时钟速度为2.23 GHz，加速速度为2.52 GHz。将其与384位总线上的24 GB 21 GB/s GDDR6X内存相结合，可为用户提供82.6TFlops的单精度 (FP32) 计算能力、1.29 TFlops的双精度 (FP64) 计算能力以及1008GB/秒。

作者测试的RTX 4090是一款Founders Edition卡，其外形尺寸与RTX 3090 Founders Edition几乎相同。和它的前身一样，它是一块又大又有分量的卡，占据了三个完整的插槽，重量为2.2 千克，重到作者直接买了一个GPU支架来支撑卡的后端。

在标准时间速度下，RTX 4090的TDP为450W（Nvidia有表示过，如果超出出厂默认值，它甚至可以消耗600W），并且至少需要850W电源。它使用新的16针12VHPWR电源连接器，Nvidia还提供了16针至4 x 8针PCIe适配器。

在RTX 4090 发布时，一些用户反映了电缆熔化的问题，但科技网站后来的研究表明，产生该问题的最大原因是“用户使用错误”。为此，作者也两三次检查了自己的测试卡的连接器位置是否正确，最终也没出现任何情况。

第二张显卡为 GeForce RTX 4080。RTX 4080配备了AD103 GPU，拥有9,728个CUDA核心、304个第四代Tensor核心和76个第三代RT核心。与4090 一样，它使用 GDDR6X内存，但其显存从24GB减少到 16GB，并且具有更小的256位总线。

RTX4080的运行速度也稍慢一点，基本时钟速度为2.21GHz，加速时钟速度为 2.51GHz。最终将获得48.7TFlops的单精度计算能力、0.76 TFlops的双精度计算能力以及717GB/s的数据传输率。

测试中的RTX 4080也是一款Founders Edition卡。它的尺寸几乎与RTX 4090 Founders Edition相同，但重量为2.1千克，稍微轻一点。在出厂速度下，它的TDP为320W，并且至少需要750W电源。4080使用与RTX 4090相同的16针12VHPWR连接器，不同之处在于附带的适配器是16针至3 x 8针PCIe型号。

这么整体看下来，它注定会成为比RTX 4090更主流的卡，并取代上一代RTX 3080和3080 Ti。

最后要讲的是 GeForce RTX 4070 Ti。这是一款相对比较有意思的显卡，因为它的前身是RTX 4080 SKU，但由于用户的投诉，Nvidia对其进行了重新命名并略微降低了价格。

RTX 4070 Ti配备AD104 GPU，拥有7,680个CUDA 核心、240个第四代Tensor核心和60个第三代RT核心。它还使用 GDDR6X显存，并在192位总线上将显存进一步缩小至 12GB。 4070 Ti的时钟速度实际上高于RTX 4080和4090：测试中的华硕卡的基本时钟速度为2.31 GHz，升压时钟速度为2.73 GHz，高于Nvidia的参考升压时钟速度2.61兆赫。它提供40.1 TFlops单精度计算能力、0.63 TFlops双精度计算能力，数据传输率为504 GB/s。

因为4070 Ti没有Founders Edition型号。所以，作者测试了华硕TUF Gaming版卡。与RTX 4090和RTX 4080 一样，华硕RTX 4070 Ti也采用三插槽设计，冷却布置与两款Founders Edition卡有很大不同，三个轴流风扇从同一方向抽风。

而且电路板布局也存在一定的差异，但是华硕RTX 4070 TI的尺寸与RTX 4090 和RTX 4080依旧大致相同，但明显在重量上更轻大约在1.4 千克。除此之外，它的TDP为285W，华硕起码建议至少使用750W电源。

整体的比对图如下▼

测试程序

测试所使用得电脑配置：

CPU：AMD Threadripper 3990X主板：MSI Creator TRX40

RAM：64 GB 3,600 MHz Corsair Dominator DDR4

存储：2TB Samsung 970 EVO Plus NVMe SD / 1 TB WD Black NVMe SSD / 4 TB HGST 7,200 rpm HD

电源：1300W

操作系统：适用于工作的Windows 11专业版

为了进行测试，作者使用了以下应用程序：

视口性能

3ds Max 2023、Blender 3.3.1、Chaos Vantage 1.8.2、D5 Render 2.3.4、Fusion 360、Maya 2023、Modo 16.0v2、Omniverse Create 2022.3.1、SolidWorks 2022、Substance 3D Painter 8.2.0、Unigine社区 2.16.0.1、Unity 2022.1、虚幻引擎 5.1.0、5.0.3和4.27.2

渲染

Arnold for Maya 5.1.0、Blender 3.3、KeyShot 11.2.0、LuxCoreRender 2.6、Maverick Studio 2022.5、OctaneRender 2022.1 Standalone、Redshift 3.5.12 for 3ds Max、SolidWorks Visualize 2022、V-Ray GPU 6 for 3ds

其它基准测试

Axiom 3.0.1 for Houdini 19.5、Cinema 4D v2023.1（Pyro解算器）、Metashape 1.7.4、Premiere Pro 2022

综合基准测试

3DMark Speed Way 1.0和Port Royal 1.2、CryEngine Neon Noir Ray Tracing Benchmark、OctaneBench 2020.1.5、Redshift Benchmark v3.5、Unity Enemies Demo、V-Ray Benchmark v5.02.01

所有基准测试都是通过为GeForce RTX GPU安装的Nvidia Studio驱动程序以及为RTX A6000和Quadro RTX 8000安装的企业驱动程序完成的。

在视口和编辑基准中，帧速率分数代表操作所示3D资源时获得的数字，是五个测试的平均值。在所有渲染基准测试中， CPU均被禁用，因此仅使用GPU进行计算。

基准测试结果

视口性能

视口基准测试包括行业内多款软件，如3D软件（3ds Max、Blender和Maya）、贴图绘制软件Substance 3D Painter，CAD设计SolidWorks和Fusion 360以及实时3D渲染D5、Chaos Vantage、Omniverse、Unity和虚幻引擎等。

具体数值对比可参考下图▼

通过数据对比，不难发现， GeForce RTX 4090在几乎所有测试中都处于比较领先的位置。

首先是CAD软件SolidWorks和Fusion 360。在Solidworks基准测试中，上一代RTX A6000和两代Quadro RTX 8000都击败了所有测试中的GeForce GPU，这表明Solidworks更喜欢Nvidia的专业驱动程序。即使是图灵架构Titan RTX的性能也非常接近GeForce RTX 4090。

Fusion 360的情况类似，RTX A6000和Quadro RTX 8000与GeForce RTX 4090相匹配，并超越了所有其它GPU，但是在这里，Titan RTX远远落后。

另一个比较好的对比是虚幻引擎5.1。作者使用了几个虚幻场景进行基准测试。在两个要求最高的场景（城市场景和远古之谷项目）中， GeForce RTX 4080 GPU具有最高的帧速率。

深入研究后，作者发现在运行两个最复杂的场景时，虚幻编辑器中的GPU使用率非常低，GeForce RTX 40系列GPU约为30-40%；30系列和20系列略高。CPU和内存使用率以及磁盘 I/O 远未达到最大值，因此系统其它地方不存在瓶颈。作者怀疑这种低GPU使用率可能是虚幻引擎5中的新功能（特别是Nanite和World Partition）减少GPU压力的结果。

渲染

接下来，还有一组GPU渲染基准测试，使用各种更常见的GPU渲染器，以4K或更高分辨率渲染单帧。

具体数值对比可参考下图▼

在渲染基准测试中，GeForce RTX 40系列GPU与上一代显卡相比，性能有了相当显着的提升，但也有一些值得注意的个例。

第一个是开源LuxCoreRender，GeForce RTX 3090和Titan RTX超过了 GeForce RTX 40系列GPU。很大的原因是因为LuxCoreRender没有像商业应用程序那样频繁更新，并且尚未针对新的GPU硬件进行优化。

第二个也是更重要的例子是V-Ray GPU的坦克场景（如上图）。这样做的目的是为了强调GPU显存，显存一旦超过上限，数据必须在它和系统内存之间传输，从而导致速度显着减慢。

根据数据整理， 24 GB GeForce RTX 4090排名靠前，而且大多数较旧的显卡都超越了GeForce RTX 4080和RTX 4070 Ti，最大的原因是它们具有更大的显存。更大的显存可以渲染更复杂的场景。

最后，再看Anrod的场景。尽管GeForce RTX 40系列GPU的性能优于大多数较旧的显卡，但华硕ProArt笔记本电脑系统中的移动RTX 3070以相当大的优势超越了对比测试中的这些显卡。考虑到它在所有测试的GPU中具有最小的显存，作者怀疑这是由于与台式机系统的Zen 2架构相比，笔记本电脑中的CPU采用了更新的Zen 3架构，但CPU对GPU渲染测试仍存在着较大的影响。

其它基准测试

下一个测试GPU在更专业任务中的使用情况。Premiere Pro使用GPU进行视频编码；摄影测量应用Metashape使用GPU进行图像处理和3D模型生成；Houdini插件Axiom和Cinema 4D的Pyro解算器都使用GPU进行流体模拟。

具体数值对比可参考下图▼

在Premiere Pro中，所有新GPU的反馈都还不错，其中RTX 4090占据榜首。更有趣的结果是，RTX 4070 Ti击败了RTX 4080，老款RTX 2080 Ti和 Quadro RTX 8000差距并不大。

Metashape结果遵循类似的模式，RTX 4090和RTX 4070 Ti占据榜首，但显卡之间的相对差异要小得多，因为Metashape不会 GPU造成特别大的负担，平均GPU使用率约为20%。

接下来，通过Cinema 4D的新Pyro解算器来看。与GPU渲染一样，流体模拟也属于图形内存密集型的，在这里，性能几乎完全取决于可用的GPU显存量。在测试过程中，作者注意到所有GPU的性能都很好。凭借48GB显存，RTX A6000和Quadro RTX 8000大幅击败所有较新的GeForce RTX 40系列卡。

在Axiom精心优化的内部基准测试中，结果更加可预测，RTX 4090 RTX 4080占据榜首，其次是上一代RTX 3090。

综合基准

最后，虽然不能准确预测GPU在生产中的性能，但可以衡量其相对于其它GPU的性能，并且可以将分数与在线提供的其它显卡的分数进行比较。

具体数值对比可参考下图▼

正如预期的那样，RTX 40系列GPU以中等至显著的优势位居榜首。

其它考虑因素

为了测试GeForce RTX 40系列的功耗，作者使用P3 Kill A Watt表在墙壁插座上测量了整个测试系统的功耗。

对于本组测试，作者测量了功率和电流消耗。电流（安培数）经常会被人忽视，但它其实是单个电路上可以运行多少台机器的关键决定因素。

大多数美国配电箱为15A电路，许多断路器的额定负载为最大负载的80%，因此带有标准断路器的15A电路连续使用不应超过12A。在测试中，当作者安装更耗电的GPU时，测试系统消耗的电流接近6A。

具体数值对比可参考下图▼

虽然GeForce RTX 40系列GPU消耗相当多的电量，但在许多测试中它们实际上比旧的Ampere和Turing显卡要高效。

超频

GeForce RTX 4090的标准时钟速度为2.23至2.52 GHz（但实际上，作者的测试卡在负载下似乎以恒定的2.52GHz运行），在此速度下，其TDP额定为450W。但是Nvidia提供的16针至4 x 8针适配器电缆只需插入四个8针PCIe连接器中的三个即可以原始速度运行RTX 4090。插入第四个，就可以将GPU推至TDP为600W。

为了测试性能的提升程度，作者进行了几个基准测试。

对RTX 4090进行超频可提高大多数测试中的性能，GPU渲染、模拟和综合基准测试显示性能提高了10-20%。对视口帧速率的影响较小。

尽管运行温度几乎没有增加，但性能提升是否值得使用额外的功率是可以由用户决定的。

驱动程序

最后，关于Studio驱动程序的说明，作者用它对GeForce RTX GPU进行了基准测试。Nvidia现在为GeForce卡提供Studio或Game Ready驱动程序选择。在作者的测试中，发现它们在性能或显示质量方面其实没有明显的差异。

所以作者的理解是， Studio驱动程序是为了DCC应用程序的稳定性而设计的，虽然作者在Game Ready驱动程序上运行DCC软件时没有遇到任何实际问题，但还是推荐使用更稳定的Studio驱动。

结果

从这些测试结果可以明显看出，GeForce RTX 40系列GPU的性能就比前代产品有了显着提升。如果执行大量内存密集型工作，则最好购买具有更多显存的上一代显卡：例如， GeForce RTX 3090而不是GeForce RTX 4080。

咱们先整体来看看测试的三款新卡的结果，首先是 GeForce RTX 4090。除了RTX 6000 Ada Generation（此处未进行测试）之外，GeForce RTX 4090是现在可以购买的最快的GPU，无论是用于游戏还是内容创建。与上一代RTX 3090相比，除了性能大幅提升之外，它的功耗更低，运行温度更低，并且有超频空间。

显卡毕竟挺贵的，可以结合具体情况考虑。而且要知道的是虽然RTX 4090的价格比其前身RTX 3090高出100 美元，但在某些情况下它的性能几乎是其两倍。

接下来，再来看看 GeForce RTX 4080。它是一款功能强大的 GPU，可以轻松超越所有上一代 GeForce RTX 30系列GPU，但需要超过16 GB显存的测试除外。

GeForce RTX 4080虽说比RTX 4090便宜不少，但在实际项目中，16GB的显存可能有些不太够用，如果没有特别大的制作需求，依旧是个不错的选择。

最后，说下 GeForce RTX 4070 Ti。当作者开始测试时，并没有想到它会表现得如此强大，还有点出乎意料。在许多基准测试中，它紧随RTX 4080的后面，在某些特定情况下，它甚至还超越了上一代RTX 3090。

4070 Ti比RTX 4080或RTX 4090便宜很多，因此很容易向预算有限的艺术家推荐。它的主要限制是12 GB显存，如果预算有限，还需要大显存的话，可以试试二手的RTX 3090。

最终结论

虽然测试中的所有三款GeForce RTX 40系列显卡都还不错，但作者自己的选择是 RTX 4090。它对于内容创建（尤其是建模和渲染）而言是一款出色的GPU，其24 GB显存可以满足绝大部分项目制作。只需确保用户有足够大的电源来供电，虽然850W是最低要求，但作者还是建议使用1000W，以便为超频和更快的CPU留出空间。

作者得第二个选择是RTX 4070 Ti。虽然它的功能比RTX 4090弱很多，但它比RTX 4080性价比更高。虽然 RTX 4070 Ti的12 GB GPU显存可能会对某些工作流程造成一些限制，但随着软件开发人员的优化，可能后续这也不是啥大问题。

总的来说呢，有条件就买RTX 4090，其次就是RTX 4070 Ti，性价比非常高，最后是RTX 4080。

如果想在Nvidia网站上了解有关GeForce RTX 40系列GPU的更多信息，可以查看下方链接。

https://www.nvidia.com/en-us/geforce/graphics-cards/40-series/

以上测评来自作者Jason Lewis

参考文章地址：

https://www.cgchannel.com/2023/06/group-test-nvidia-geforce-rtx-40-series-gpus/#drivers

一 END 一

为什么要先星标？

因为可以第一时间看到我更新呀！

阅读推荐

引入全新教学，5天学1个新技能！这可能是最适合原画小白的学习方式了

再不用为拉片苦恼了：这个AI工具，竟然可以精准剪辑到每个字！

火星的摄像课老师，去给海淀区消防救援支队做讲座啦！

Blender 3.6重磅发布：设计师最关注的五大新功能盘点

别低估平面设计师了！一套优秀的品牌设计全案，能让一家公司起死回生、业绩翻倍~

用于Max和C4D的Corona 10发布：自然光更逼真，渲染速度提高22倍不止！

最近的00后设计师，都在用什么搞副业？

Midjourney扩图功能测评：1小时直接出高清大片！

关注+星标，紧跟CG行业新动态

点击“阅读原文”预约专业老师

1对1了解火星课程详情

你懂返回搜狐，查看更多

【本文地址】

横扫CG圈的权威测评：英伟达RTX 40显卡超全软件测试对比

横扫CG圈的权威测评：英伟达RTX 40显卡超全软件测试对比

今日新闻

推荐新闻