NVIDIA RTX A6000 显卡全面评测，都有哪些特殊的性能？

您所在的位置：网站首页 › potplayer倍帧没用 › NVIDIA RTX A6000 显卡全面评测，都有哪些特殊的性能？

NVIDIA RTX A6000 显卡全面评测，都有哪些特殊的性能？

2023-04-14 12:10| 来源: 网络整理| 查看: 265

NVIDIA RTX™ A6000作为首款推出的NVIDIA Ampere架构超高端旗舰产品，无论是GA102核心的满血性能，还是第二代光线追踪硬件加速、第三代的Tensor Core加持、AV1的硬件解码等，都是新产品更新中非常亮眼的特性。

https://xg.zhihu.com/plugin/0987392b9cf24c011a03f74ef5df08a9?BIZ=ECOMMERCE

NVIDIA RTX A6000

基于 NVIDIA Ampere 架构的 GA102 GPU 采用三星 8nm NVIDIA 定制工艺制造，包含 283 亿个晶体管，完整的 GA102 GPU 包含 10752 个 CUDA 核心、84 个第二代 RT Core和 336 个第三代 Tensor Core，NVIDIA Ampere架构通过突破性的技术得以提供更强大的性能，包括：

全新CUDA Core：FP32是图形工作负载的首选精度，全新Ampere架构最高可提供2倍于上一代的FP32吞吐量，能够显著提高图形和计算能力。第二代RT Core：最高可提供2倍于上一代的吞吐量，以及并行光线追踪、着色和计算功能。第三代Tensor Core：最高可提供5倍于上一代的吞吐量，并支持全新TF32和BF16数据格式，结合稀疏运算特性提供10倍加速性能。48GB GPU内存：单个GPU可提供的最大内存，通过NVLink连接两个GPU可以扩展到96GB。虚拟化：通过添加NVIDIA虚拟工作站等NVIDIA虚拟GPU软件，为远程用户提供针对图形工作负载和强大虚拟工作站实例的大规模支持，赋力高端设计、AI和计算工作负载的更大规模工作流程。PCIe Gen 4：提供2倍于上一代的带宽，加速Lenovo ThinkStation P620等PCIe Gen 4服务器和工作站中数据密集型工作负载（如数据科学、混合渲染和视频流）的GPU数据传输。

以下是关于RTX A6000的评测，主要基于与上一代同级别的NVIDIA Quadro RTX™ 6000作对比，供参考：

显卡规格对比

1. CUDA-Z

CUDA-Z和CPU-Z、GPU-Z相类似，是对NVIDIA GPU处理器的一些基本信息的采集。

CUDA计算能力对比

从CUDA-Z的测试数据看，RTX A6000的单精度浮点运算最高性能达到了40T，这是RTX 6000的2.3倍的性能。所以涉及到单精度计算能力的应用，都会有翻倍的性能提升。双精度两张显卡依然都不高，需要双精度计算能力的，还是要选择支持双精度计算能力高的显卡。

2. SPECviewperf 2020

SPECviewperf 2020主要是用来评测显卡专业图形性能的软件，其中包括了我们常见的3ds Max、Maya、Catia、UG NX、Solidworks、Creo软件性能测试，以及医疗和能量仿真性能测试。通过模拟对软件场景的交互操作的速度来评分，最终得出显卡的图形性能的相对性能。

测试截图

图形处理性能对比

以上数据是RTX A6000和RTX 6000性能的对比情况。在各个软件性能上都有不同程度的提升，性能基本上是1.1~1.2倍的提升，在Creo中提升的性能较少，在Energy仿真中会用到大量计算，所以性能提升较多达到了1.5倍的性能提升。

3. 离线渲染测试结果

渲染在媒体娱乐、设计制造以及建筑行业得到广泛的应用，目前很多渲染器均支持GPU渲染，渲染的速度就取决于显卡的计算速度。

Blender CUDA Benchmark(s)

离线渲染时间对比（CUDA）

Blender使用CUDA做渲染，RTX A6000相较于RTX 6000可以取得1.3-2.7倍的性能提升。

Blender OptiX Benchmark(s)

离线渲染时间对比（OptiX）

Blender可以支持CUDA和Optix光追渲染，使用光追的新技术渲染的速度明显比使用传统的CUDA速度更快。比如，在场景Victor中使用RTX A6000 CUDA渲染需要408秒的时间，而使用Optix光追渲染仅需要130秒，速度提高了3倍。相同设置下RTX A6000对比RTX 6000则有了1.5~2倍的性能提升。

V-Ray Benchmark