NVIDIA Quadro RTX 5000 评测

您所在的位置：网站首页 › rtx5000魔改90w › NVIDIA Quadro RTX 5000 评测

NVIDIA Quadro RTX 5000 评测

2024-07-15 02:51| 来源: 网络整理| 查看: 265

早在 5000 月的 SIGGRAPH 上，NVIDIA 就宣布了全新的图形架构 Turing，以及全新的 Quadro RTX GPU。在当时宣布的几款新 GPU 中，今天我们将特别关注 NVIDIA Quadro RTX 5000 GPU。号称是第一款还使用深度学习和高级着色的光线追踪 GPU。 RTX XNUMX 专为下一代工作负载而设计，具有实时渲染逼真的场景的潜力，这对视频编辑以及汽车和建筑设计师来说是一个福音。

新一轮 GPU 浪潮背后的驱动力是 NVIDIA 新图灵架构。该公司因其在 GPU 方面的领导地位而备受推崇，并在此基础上推出了全新的核心 GPU 架构。体系结构的主题有点太深了，无法进入这里，但总结一下：图灵使用了多项硬件改进来取得令人印象深刻的新成果。对于光线追踪，该架构利用称为 RT 内核的处理器，可将光和声音在 3D 环境中传播的计算速度提高至每秒 10 Giga Rays。流式多处理器提高了光栅性能并添加了增强的图形管道和新的可编程着色技术。 Turing 配备了新的 Tensor Core，每秒可提供 500 万亿次张量运算。 Turing 允许用户利用更多的 CUDA 内核来支持高达每秒 16 万亿次并行浮点运算和 16 万亿次整数运算。

NVIDIA Quadro RTX 5000 专为需要快速有效地处理复杂项目的创意专业人士而设计。 GPU 拥有 3,072 个 CUDA 核心、384 个 Tensor 核心、48 个 RT 核心和 16GB GDDR6 显存。如此庞大的硬件数量能够渲染复杂的模型和具有物理上准确的阴影、反射和折射的场景。 RTX 5000 支持 NVIDIA NVLink，让用户可以通过多种 GPU 配置扩展内存和性能。假设他们的工作站有空间，用户可以连接两个 Quadro RTX 5000 GPU，以获得高达 50GB/s 的带宽和 32GB 的 GDDR6 显存。 GPU 还配备了 VirtualLink，可连接到下一代高分辨率 VR 头戴式显示器。

NVIDIA Quadro RTX 5000 规格建筑英伟达图灵 GPU内存 16GB GDDR6 存储器接口 256 bit 内存带宽高达 448 GB/秒 ECC Premium Partner NVIDIA CUDA核心 3,072 NVIDIA 张量核心 384 NVIDIA RT 核心 48 单精度性能 11.2 TFLOPS 张量性能 89.2 TFLOPS 英伟达 NVLink 连接 2 个 Quadro RTX 5000 GPU NVIDIA NVLink 带宽 50GB/秒（双向）系统介面 PCI Express 3.0 x 16 能量消耗总板功率：265W 显卡总功率：230W 热解决方案活跃外形 4.4” 高 x 10.5” 长，双槽，全高显示连接器 4xDP 1.4、1x USB-C 最大同时显示 4x 4096×2160 @ 120 赫兹 4x 5120×2880 @ 60 赫兹 2x 7680×4320 @ 60赫兹编码/解码引擎 1X 编码，2X 解码 VR就绪 Premium Partner 图形 API DirectX 12.0的着色器型号5.1 OpenGL 4.5 Vulkan 1.0 计算 API CUDA 直接计算 OpenCL 性能

为了测试新架构在 NVIDIA Quadro RTX 5000 GPU 中的性能，我们将其安装在运行 Windows 920 的 Lenovo ThinkSystem P10 工作站中。为了全面了解每张卡的性能，我们利用了多项行业基准测试和 GPU 加速可以充分利用被测卡的软件。我们不仅将其与共享 Turning 架构的 NVIDIA Quadro RTX 4000 进行比较，还将与之前的 Pascal Quadro 系列进行比较，包括请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。是，请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。，并请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。. 对于所选择的 GPU，这更少，更好，更多。

为了更好地了解这些 GPU 如何从不同的架构扩展，我们提供了下表，总结了 RTX 系列的现状。 RTX 5000 位于中间插槽，比入门级 RTX 4000 高出一个台阶，在两个更强大的 RTX 6000 和 RTX 8000 兄弟姐妹下方。

NVIDIA Quadro GPU RTX 4000 RTX 5000 RTX 6000 RTX 8000 GPU内存 8GB GDDR6 16GB GDDR6 24GB GDDR6 48GB GDDR6 存储器接口 256 bit 256 bit 384 bit 384 bit 内存带宽高达 416GB/秒高达 448GB/秒高达 672GB/秒高达 672GB/秒 NVIDIA CUDA核心 2,304 3,072 4,608 4,608 NVIDIA 张量核心 288 384 576 576 NVIDIA RT 核心 36 48 72 72 单精度性能 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS 16.3 TFLOPS 张量性能 57.0 TFLOPS 89.2 TFLOPS 130.5 TFLOPS 130.5 TFLOPS

我们的第一个基准测试是 LuxMark 跨平台 OpenCL 基准测试工具。 LuxMark 基于 LuxCore API，并作为 LuxCoreRender 套件的促销组件提供。它使用一个新的基于微内核的 OpenCL 路径跟踪器作为其基准测试的渲染器，提供了一种独特的方式来对给定工作站中安装的 GPU 施加压力。

勒克斯马克图形处理器成果请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 15,303 请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 13,170 请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 21,297 RTX 4000 28,338 RTX 5000 29,404

虽然 Pascal GPU 在 LuxMark 上取得了不错的成绩，但在观察 Turning GPU 时，性能有了明显的提升。 RTX 5000 以 29,404 分的成绩位居榜首，这不足为奇。

接下来是 Arion，这是一个 CUDA 基准测试工具，由 RandomControl 开发，允许工作站在渲染应用程序中对 CPU 或 GPU 施加压力。 ArionBench 是一款基于 Arion 2 技术的软件工具，它通过模拟 3D 场景中的光流任务使 CPU/GPU 承受重压。

阿里昂图形处理器成果请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 1,865 请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 2,738 请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 3,731 RTX 4000 4,484 RTX 5000 6,193

从 Pascal 到 Turing，RTX 5000 的得分又一次大幅跃升，远远领先于其他显卡，明显快于 P6000。

我们的下一个基准测试利用 SolidWorks 2019 和四个 3D 模型，包括奥迪 R8、建筑挖掘机、喷气发动机和拉力赛车。 Solidworks 是行业领先的 GPU 加速 3D CAD 建模应用程序，可在基于 Windows 的系统上运行。 SolidWorks 由 Dassault Systèmes 开发，全球有超过 165,000 万名工程师和超过 2019 家公司在使用它。出于基准测试目的，我们利用了 SolidWorks 4.5 中新的“性能管道”功能。该架构提供了响应速度更快的实时显示，尤其是对于大型模型。它利用现代 OpenGL (XNUMX) 和硬件加速渲染在您平移、缩放或旋转大型模型时保持高水平的细节和帧速率。

在渲染每个模型后，我们的脚本将每个模型旋转五次并测量完成此任务所需的时间。然后将其除以渲染的帧数，并计算每部分的平均帧数 (FPS) 分数。

SolidWorks的 SolidWorks R8 平均 FPS 请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 198.0232 请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 214.9254 请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 217.9745 RTX 4000 211.1824 RTX 5000 208.8849 Solidworks 挖掘机平均 FPS 请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 186.4832 请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 211.9595 请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 230.9774 RTX 4000 259.6056 RTX 5000 294.2529 Solidworks 喷气发动机平均 FPS 请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 163.0573 请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 198.5351 请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 210.411 RTX 4000 220.6897 RTX 5000 283.2206 Solidworks 拉力赛车平均 FPS 请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 205.6225 请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 219.0114 请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 218.4922 RTX 4000 214.4253 RTX 5000 217.256

有趣的是，与 Pascal 相比，Solidworks R8 和 Rally Car 中的 Turing GPU 的性能略有下降，尽管这些文件可能无法充分利用较新的 GPU。 RTX 5000 确实在 Digger 和 Jet Engine 方面提供了卓越的性能，大大优于其他显卡。在我们的 Solidworks 中，我们使用了 beta 显示模式，这可能是 Audi R8 和 RallyCar 装配体上出现异常缩放的原因。

接下来是环境系统研究所 (Esri) 基准。 Esri 是地理信息系统 (GIS) 软件的供应商。 Esri 的性能团队设计了他们的 PerfTool 插件脚本来自动启动 ArcGIS Pro。此应用程序使用“ZoomToBookmarks”功能来浏览各种预定义的书签，并创建一个日志文件，其中包含预测用户体验所需的所有关键数据点。该脚本自动循环书签三次以说明缓存（内存和磁盘缓存）。换句话说，该基准模拟了人们可能通过 Esri 的 ArcGIS Pro 2.3 软件看到的大量图形使用。

测试由三个主要数据集组成。两个是宾夕法尼亚州费城和魁北克省蒙特利尔的 3-D 城市景观。这些城市视图包含覆盖在地形模型和覆盖航拍图像上的带纹理的 3-D 多面体建筑物。第三个数据集是俄勒冈州波特兰地区的二维地图视图。此数据包含有关道路、土地利用地块、公园和学校、河流、湖泊和山体阴影地形的详细信息。

查看蒙特利尔模型的绘图时间，NVIDIA Quadro RTX 5000 的平均绘图时间为 00:01:31.067，而平均和最小 FPS 分别显示为 527.636 和 190.775。

ESRI ArcGIS Pro 2.3 蒙特利尔抽奖时间一般 Quadro P4000 00:01:31.084 Quadro P5000 00：01：31：082 Quadro P6000 00:01:31.081 四核RTX 4000 00:01:31.284 四核RTX 5000 00:01:31.067 平均 FPS 一般 Quadro P4000 432.327 Quadro P5000 489.889 Quadro P6000 521.551 四核RTX 4000 502.395 四核RTX 5000 527.636 最低帧率一般 Quadro P4000 164.546 Quadro P5000 194.218 Quadro P6000 190.336 四核RTX 4000 180.699 四核RTX 5000 190.775

接下来是我们的费城模型，其中 RTX 5000 的平均绘图时间为 00:01:01.111，而平均和最小 FPS 分别显示为 531.315 和 224.341。

ESRI ArcGIS Pro 2.3 费城抽奖时间一般 Quadro P4000 00:02:53.928 Quadro P5000 00:01:01.109 Quadro P6000 00:01:01.245 四核RTX 4000 00:01:00.231 四核RTX 5000 00:01:01.111 平均 FPS 一般 Quadro P4000 304.340 Quadro P5000 451.826 Quadro P6000 469.879 四核RTX 4000 434.170 四核RTX 5000 531.315 最低帧率一般 Quadro P4000 160.152 Quadro P5000 212.910 Quadro P6000 207.879 四核RTX 4000 196.825 四核RTX 5000 224.341

我们的最后一个模型是波特兰。此处，RTX 5000 的平均绘制时间为 00:00:32.541。平均 FPS 显示为 2,783.547，而最低 FPS 显示为 1,007.309。

ESRI ArcGIS Pro 2.3 波特兰抽奖时间一般 Quadro P4000 00:00:32.426 Quadro P5000 00:00:32.310 Quadro P6000 00:00:32.552 四核RTX 4000 00:00:32.646 四核RTX 5000 00:00:32.541 平均 FPS 一般 Quadro P4000 2,051.053 Quadro P5000 2,057.395 Quadro P6000 2,343.948 四核RTX 4000 2,821.928 四核RTX 5000 2,783.547 最低帧率一般 Quadro P4000 1,179.974 Quadro P5000 1,189.524 Quadro P6000 1,282.045 四核RTX 4000 1,083.260 四核RTX 5000 1,007.309

结论

NVIDIA Quadro RTX 5000 是该公司基于其图灵架构的较新 GPU 之一。 Turing 将成为 GPU 架构的全新体现，因为 NVIDIA 正在着眼于未来的发展，同时寻求改变现状。 RTX 5000 面向拥有需要高效快速工作的复杂项目的创意专业人士，其引擎盖下的硬件令人印象深刻，包括 3,072 个 CUDA 内核、384 个 Tensor 内核、48 个 RT 内核和 16GB GDDR6 内存。对于需要更高 GPU 性能的用户，RTX 可以通过 NVIDIA NVLink 使用第二个 GPU 进行扩展。

对于所有应该带来卓越性能的组件，我们对其进行了一系列新旧测试，只是为了看看它能做什么。不出所料，NVIDIA Quadro RTX 5000 在我们的大多数测试中表现最佳。在 LuxMark 和 Arion 中，RTX 5000 的得分是 P5000 的两倍多。 RTX 5000 在 Solidworks Digger 和 Jet Engine 基准测试中表现出色。应该记住，RTX 5000 尽管功能强大，但并不是 Turing GPU 中的顶级产品。

如果创意专业人士正在寻求在大多数领域实现更大的性能飞跃，那么 NVIDIA Quadro RTX 5000 将符合这一要求。我们上面的性能结果突出了 RTX 5000 的亮点以及基于 Pascal 的 GPU 表现足够好的几个地方。总体而言，NVIDIA 凭借 RTX 系列出色地完成了工作，继续突破桌面创意的可用范围。就其本身而言，RTX 5000 很好地填补了中端产品，提供了性能和价格的良好平衡。

亚马逊的 NVIDIA RTX 5000

讨论这篇评论

【本文地址】

NVIDIA Quadro RTX 5000 评测

NVIDIA Quadro RTX 5000 评测

今日新闻

推荐新闻