GeForce RTX 3080 Ti天梯榜首发评测:“Ti”给力的游戏显卡新旗舰

您所在的位置:网站首页 2080super浮点运算 GeForce RTX 3080 Ti天梯榜首发评测:“Ti”给力的游戏显卡新旗舰

GeForce RTX 3080 Ti天梯榜首发评测:“Ti”给力的游戏显卡新旗舰

2023-12-11 17:39| 来源: 网络整理| 查看: 265

拼 命 加 载 中 ...

NVIDIA基于Ampere架构的新一代GPU已经布局了许多款产品,在桌面端从顶级的GeForce RTX 3090已经布局到主流级别的GeForce RTX 3060,在移动端更是已经布局到GeForce RTX 3050这样的入门级型号。于是类似上一代Turing架构产品的发布节奏一样,NVIDIA现在带来了第二轮的旗舰GPU升级,不过并不是SUPER系列,而是Ti系列,其中首先上市的就是被称为“GeForce RTX系列的最新旗舰游戏GPU”的GeForce RTX 3080 Ti。

我们也为大家准备了视频评测:《RTX 3080 Ti公版显卡首发评测:直追RTX 3090,真旗舰游戏卡》

RTX 3090砍去一组TPC

这一代的NVIDIA Ampere架构仍然采用将特定组数的CUDA单元、RT核心、Tensor核心封装为一个SM单元,然后将一定组数的SM单元封装为一个GPC这样的层级结构,最后将几组GPC单元和内部缓存等其他硬件部分组成我们看到的GPU核心。

这次的RTX 3080 Ti核心图等于是在之前RTX 3090的基础上再砍掉一组TPC,它跟RTX 3090一样有7组GPC,不过两组GPC的SM单元仅启用了10组,所以RTX 3080 Ti一共具有80组SM单元。

由于Ampere架构每SM单元的Tensor核心数量为4个、CUDA核心64个,每个SM单元中配有一个RT核心,所以RTX 3080 Ti一共有320个Tensor核心和80个RT核心和10240个CUDA核心,相比RTX 3090只是非常小的削弱。

频率方面,RTX 3080 Ti相比于RTX 3090也有小小的削弱,这张公版RTX 3080 Ti的Boost频率为1665MHz,相比公版RTX 3090的1695MHz的Boost频率低了30MHz。

与RTX 3090的决定性不同在于显存设计

当然,这些都只是非常微小的削弱,从这些看起来RTX 3080 Ti与RTX 3090可以说非常接近,而RTX 3080 Ti与RTX 3090决定性的不同则是在于显存方面。

与RTX 3090配备有24GB大容量的GDDR6X显存不同,RTX 3080 Ti在显存方面直接砍半,这也注定RTX 3080 Ti是一张更偏向游戏设计的游戏GPU,而不是像RTX 3090这样能兼具极致游戏和严苛生产力创作的全能选手。至于为什么显存大砍,当然是为了降低成本,继而带来售价的降低,让RTX 3080 Ti也能成为像RTX 3080这样具有很高性价比的发烧级游戏GPU。

显存方面的另一个小的变化是RTX 3090的显存数据速率是19.5Gbps,而RTX 3080 Ti是19Gbps,与RTX 3080一样,不过他们都是GDDR6X,理论上供电足够的话,将显存小超到19.5Gbps也是能稳定运行的。

RTX 3080 Ti与RTX 3080和RTX 3090的规格对比如下:

NVIDIA Ampere架构简介

RTX 30系GPU上的SM单元相比RTX 20系的,最大变化是加倍了针对传统计算的FP32单元、引入第二代RT Core以及第三代Tensor Core。

大家都知道在Turing架构中,NVIDIA整数型(INT32)和单精度浮点型(FP32)两种不同的数据类型交给两种不同的ALU进行计算。不过现代游戏应用中最为常见的还是FP32,因此为了提高计算效率NVIDIA在NVIDIA Ampere 架构上引入了可同时支持INT32或FP32两种数据类型的新ALU。也就是说,现在有两条不同的数据路径,一条能够同时处理整数或者单精度浮点,另一条则单纯处理处理单精度浮点计算。

负责进行实时光线追踪运算的专用硬件单元RT Core在NVIDIA Ampere 架构上也更新到了第二代,最主要是增加了动态模糊的加速运算支持。NVIDIA在其中新加入的插值算法可以在保证动态模糊精确性的同时提高了实时光线追踪效率,官方表示最高可达8倍于上代的速度。另外在基础的BVH计算上,第二代RT Core也可以比第一代快2倍。

Tensor Core这个负责运行AI计算的硬件单元在NVIDIA Ampere 架构上也升级到了第三代。其实之前发布的A100计算卡上已经用上了新的第三代Tensor Core,它能够提供比第二代Tensor Core高出4倍的效能,不过游戏卡上面的Tensor Core进行了一定的精简,其FP16 FMA计算的吞吐量只有GA100核心中的Tensor Core的一半。

而第三代Tensor Core带来的更强劲AI运算有些什么用呢? 答案就是DLSS。随着RTX 30系GPU一同发布的,还有DLSS的更新版 - DLSS2.1,在很多游戏设置里面就是DLSS选项中的“超级性能”模式,它可以通过渲染1440P的画面输出4320P的8K游戏画面,并且与原始8K分辨率的画面几乎肉眼难以区分,这利用的就是Tensor Core带来的更强劲AI运算功能。

另外RTX 30系GPU也用上了NVIDIA与美光联合研发的GDDR6X显存。与GDDR6相比,GDDR6X最大的变化是信号传输机制以及增加带宽,从GDDR6的NRZ调制换用PAM4。

再之后就是HDMI 2.1这个备受期待的新输出端口了。在HDMI 2.1之下,显卡可以用单线材做到8K60Hz或者4K120Hz的输出。对于想用大尺寸电视打游戏的玩家来说是一个不错的福音。

最后还有就是NVIDIA新推出的RTX IO了。这项技术是NVIDIA借助微软此前推出的DirectStorage API来实现的,将会作为插件的形式与后者整合,可以让GPU绕开CPU直接读取SSD数据,从而降低CPU的占用率。不过由于RTX IO需要依靠Windows的DirectStorage API,并且还需要游戏开发商做针对性的优化,这需要一定的过程,我们只能期待尽快可以看到这项技术的具体应用。

RTX 3080 Ti公版显卡产品解析RTX 3080 Ti公版显卡外观

RTX 3080 Ti公版卡的外观与之前的RTX 3080公版卡几乎是一模一样,除了型号标识之外,仅仅是CNC工艺切割的外边框似乎被抛光过,更具有光泽一些。正面只可以看到一个导风风扇,然后其他部分几乎都是裸露的散热鳍片,不过由于做的相当精致,看着毫无违和感,背面有依然质感上乘的金属背板,背面也还有一个风扇,正面风扇吹风,背面风扇抽风,构成了独特散热设计。

NVIDIA为这个创新性的散热设计取了个名字叫双轴流推挽式风扇散热设计。通过这种方式能更好的将废热定向的引导到机箱风扇的风道,避免了机箱风道的凌乱,也让机箱内部整个系统的散热效率相比排风式的轴流式风扇散热要好一些。

供电接口仍然是全新的12 Pin供电接口,这个接口比标准的PCIe供电接口小,但能够承载更大的电流,也就是能够获取更大瓦数的外部供电。但是由于PC电源方面还未及时跟上新方案,所以公版卡也附送有一条转接线,用于将标准PCIe供电接口转换成新的12 Pin供电接口。

接口方面有3个DP接口和1个HDMI接口,这个HDMI接口是2.1标准的,可以支持8K 60FPS乃至10K 30FPS的视频输出,与采用HDMI 2.1接口的显示器或者电视连接使用的话,只需要一根线材就可以实现8K 60FPS的视频输出,而不像之前需要两根DP线或者4根HDMI线。

GPU的PCIE接口支持PCIE 4.0,可以提供更高的带宽。这个对于之后的RTX IO的应用和普及比较重要,可以尽量减少系统的带宽瓶颈,当然就目前来说,最大的优点就是支持Resizable BAR,RTX 3080 Ti是出厂就支持Resizable BAR的,并不需要更新GPU BIOS。

RTX 3080 Ti公版显卡拆解

RTX 3080 Ti公版卡仍然采用了真空腔均热板设计,可以非常高效的将GPU核心的热量传导到热管然后分散到散热鳍片上,具有4根8mm直径的热管,这些热管上面均覆盖有镀层,可以防止日久使用之后表面发生氧化,镀层是黑色的也与整体的色调设计搭配,让显卡更好看。

PCB仍然是采用了上图这样异型的PCB板,电子元器件的排布非常密集,可见这种设计已经是充分微型化下的结果,尽管核心规模相比于RTX 3080来说其实更接近RTX 3090,但是并没有采用RTX 3090那样的越肩式PCB,当然,这个其实拆解之前看体型就能看出来。

RTX 3080 Ti公版卡的PCB等于是在RTX 3080公版卡PCB的基础上补全了2颗显存颗粒的空焊位,这些显存颗粒仍然是美光的GDDR6X显存,型号为D8BWW,单颗1GB容量,位宽32bit,12颗一共组成12GB的容量、384bit位宽。

另外就是供电布局方面有所调整,但是仍然是一共18相供电。MosFET均是来自美国芯源系统的MP86957,一共采用了3颗美国芯源系统的PWM控制器,分别是一颗MP2884B和两颗MP2888B。

性能测试测试平台

测试平台如上,内存是2条8GB的Tt ToughRAM DDR4-3600内存组成的16GB双通道配置,并且在BIOS中打开XMP让内存运行在3600MHz的频率,同时在BIOS中打开Resizable BAR的支持,其他均采用默认设置。

基准性能测试

我们以3DMark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme以及Port Royal六个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三个项目分别测试的是GPU在DX11游戏中的1080p分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy Extreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数,Port Royal是测试的GPU实时光线追踪的性能指数,具体成绩见下表,表中所列成绩均为3DmarkGPU单项的得分。

就基准性能测试来看,RTX 3080 Ti约有RTX 3090的97%的性能,与RTX 3080相比,提升有11%,而与上一代的旗舰RTX 2080 Ti相比,提升足足有40%以上,特别是以它们更为实际的4K分辨率下的游戏模拟比如Fire Strike Ultra和Time Spy Extreme项目来说,RTX 3080 Ti相比RTX 2080 Ti提升更是达到45%,可以认为足有RTX 2080 Ti这张上代旗舰1.5倍的性能。

与A卡阵营相比的话,由于内核的差异,它们的区别比较复杂,在DX 12 API和光线追踪方面Ampere架构的N卡是完全吊打A卡的,即使是RX 6900 XT在这两个方面也都不如RTX 3080 Ti。不过对于DX 11 API来说,A卡在理论测试下的表现还不错,RTX 3080 Ti在这方面介于RX 6800 XT和RX 6800之间。

4K分辨率游戏实测:仅比RTX 3090低3%的游戏表现传统光栅化游戏测试

传统光栅化游戏画面测试这部分均将游戏画质设置为预设里面的最高画质设置(《地铁:离去》选择Ultra画质,《战争机器5》统一打开异步计算、关闭可变速率阴影),默认不是全屏的手动改为全屏,默认开启了垂直同步的手动关闭垂直同步,除此之外其他选项均为默认设置,均采用游戏自带的Benchmark输出结果。

通过10款游戏的实测来看,RTX 3080 Ti平均表现就是RTX 3090的97%的性能,平均领先RTX 3080则达到12%,领先上一代的旗舰RTX 2080 Ti达到38%。

与A卡相比,则主要是在《刺客信条:英灵殿》这款游戏上A卡较为占优,其次《战争机器5》和《孤岛惊魂5》A卡表现也较为不错,如果除开这几个游戏之外,RTX 3080 Ti甚至能全面领先A卡旗舰RX 6900 XT,不过尽管这几个游戏RTX 3080 Ti略输RX 6900 XT,总体平均下来RTX 3080 Ti仍然以微弱的1%幅度领先RX 6900 XT,领先RX 6800 XT的幅度为8%,而领先RX 6800的幅度就很大了,达到30%。

而就绝对的游戏帧数表现来说,可以看到所测试的这些单机大作中,除了《全面战争:三国》之外,其他游戏均可以在4K预设最高画质下以至少60帧稳定运行。比如硬件杀手级的最新单机大作《看门狗:军团》可以达到60帧、《刺客信条:英灵殿》可以达到62帧,这样的表现也足以感受到RTX 3080 Ti的强大性能。

实时光追游戏测试

光追方面,由于A卡不支持DLSS,为了控制画面效果完全一样所以N卡也跑了不开启DLSS的成绩,而对于玩家来说DLSS这项福利技术多数是会开启的,所以为了表现GPU的实际游戏体验,也测试了N卡开启DLSS的成绩(《尘埃5》不支持DLSS)。这些游戏中,光线追踪效果均设为“高”,支持DLSS 2.0的均选择为“性能”模式。

如果游戏开光追的话, 没有任何意外的,成了N卡的全面胜利,即使在N卡不开启DLSS技术的情况下,RTX 3080 Ti仍然以37%的巨大幅度领先RX 6900 XT,领先RX 6900更是达到44%,而领先RX 6800则是达到夸张的79%。

至于开启DLSS之后的情况,就根本不用详细对比,N卡在开启DLSS之后的成绩都是远远抛离A卡的。当然,AMD在昨天的台北电脑展上也正式推出了FidelityFX Super Resolution(FSR),是和DLSS类似的分辨率提升技术,从宣传来看效果也非常不错,笔者非常期待尽快在游戏中看到它的应用。

而RTX 3080 Ti与自家的Ampere架构显卡相比,由于基于同一架构,在开启光追的情形下也与光栅化的游戏情况差不多,RTX 3080 Ti约有RTX 3090的96%的性能,平均领先RTX 3080则达到11%。但是由于RTX 2080 Ti是上一代的Turing架构,这里区别就相比于光栅化的游戏下拉大了,由于RT核心进化到第二代,RTX 3080 Ti的光追游戏性能相比RTX 2080 Ti进步巨大,达到了50%,远高于传统光栅化下的游戏性能提升。

温度测试:满载最高仅有69.6摄氏度

我们的GPU散热测试均在裸机状态(如果安装在机箱内,GPU温度会高出5℃左右)下进行测试,测试环境温度约为26.4℃。待机温度是开机以后记录10分钟,满载温度则是完成3DMark Time Spy压力测试后记录下,数据通过GPU-Z的Log to File功能记录,以下为温度测试曲线。

温度测试说实话有点出乎我的意料,前面也看到了RTX 3080 Ti的GPU核心可以说是与RTX 3090相差无几的,而搭配的散热器却并不是RTX 3090那样的大块头,而是保持了和RTX 3080 Ti一样的鳍片规模,但是RTX 3080 Ti的温度测试结果却非常优秀,满载最高仅有69.6摄氏度,这个温度比RTX 3080都还要低,原因应该是RTX 3080 Ti的频率更低或者风扇自动调速的方案不同所至。

功耗测试:满载功耗平均354W

通过我们专用的显卡功耗测试仪器,可以分别精确地测量显卡PCI-E、外接电源接口瓦特数,显卡最大功耗在3DMark Fire Strike压力测试中获得,待机功耗则是在进入系统后记录1分钟取平均值。

功耗测试的结果是RTX 3080 Ti的待机功耗平均为21W ,满载功耗平均为354W,满载功耗峰值则到过372W,所以考虑到装机平台的其他硬件的功耗的话,建议850W的电源起步,特别是如果搭配Intel Core i7-11900K这样的处理器,有条件的话推荐1000W以上的电源是最好的。

超频性能测试

将功耗上限和温度上限解锁到最高之后,经过多番手动超频尝试,RTX 3080 Ti最终在核心频率+150MHz,GDDR6X显存数据速率+2Gbps下完成超频。这个状态下,这张RTX 3080 Ti公版卡能顺利通过3DMark的FireStrike项目测试并且分数最高, 此时这张RTX 3080 Ti公版卡的Boost频率为1815MHz,显存等效频率为21Gbps。这张RTX 3080 Ti公版卡在超频状态下运行3DMark FireStrike项目的GPU得分与默频状态下GPU得分的对比如下表所示。

还是那句话,时至今日现在的GPU超频空间并不会很多,从我们较为极限的手动超频来看,RTX 3080 Ti经过调校后还可以压榨出6.5%的性能,不过这也是在提高了功耗上限的情况下得到的,而且就能耗比来看的话超频状态是不如默认状态的,所以再考虑到稳定性等方面,建议玩家还是默频运行。

总结:“Ti”给力的游戏显卡新旗舰

尽管RTX 3080 Ti之上还有RTX 3090,但是笔者还是认为RTX 3080 Ti才是接替RTX 2080 Ti的新一代旗舰游戏GPU,毕竟从设计来看,它是更纯粹的面向游戏而设计。而具有24GB海量显存容量的RTX 3090还是更像是上一代TITAN RTX的继任者,尽管其游戏能力也是巅峰级别,但是创作应用场景下才能更加完全发挥这类大显存GPU的全部实力,如果你只是游戏玩家的话,与RTX 3090性能差不多的RTX 3080 Ti明显性价比高了太多太多,是更适合游戏的旗舰GPU。这也是为什么官方称其为“GeForce RTX系列的最新旗舰游戏GPU”的原因。

其实从RTX 3080 Ti的命名来看,它也名副其实的是上一代RTX 2080 Ti的继任者,并且从测试来看,在这类顶级GPU的主战场——4K光追游戏场景中——RTX 3080 Ti相比上一代RTX 2080 Ti足足提升了50%,而价格却相比于RTX 2080 Ti从9999元还下降到8999元,不由得让人感叹代际的提升实在是太大。

而现在再看与A卡阵容的比较的话,之前AMD这边的旗舰RX 6900 XT虽然整体性能不如RTX 3090,但是RX 6900 XT在定价上做文章,也算是相较于RTX 3090有一定的竞争力。但是现在RTX 3080 Ti以8999元的价格发布,并且整体游戏性能领先RX 6900 XT,在开启光线追踪的情况下更是碾压RX 6900 XT,这就让AMD这边很被动了,如果AMD没有能回应的新产品发布的话,或许接下来只能进行降价销售的选择了。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3