RTX 4080 正式发布,有哪些亮点?是否值得入手?

您所在的位置:网站首页 4k144带宽 RTX 4080 正式发布,有哪些亮点?是否值得入手?

RTX 4080 正式发布,有哪些亮点?是否值得入手?

2022-11-23 06:33| 来源: 网络整理| 查看: 265

NVIDIA在上月发布了RTX 4090,是很强大,但这样的强大并不是每一个都需要,我在之前RTX 4090评测就将其定位与使用4K高刷的3A游戏游戏玩家,她的性能对于网游和电竞游戏用户,或者还在使用2K高刷/4K60的显示器用户性能是有些过剩,这个时候我们本次评测的定位更低的RTX 4080就应该刚刚好合适这些用户。

注:本文主笔为Cloud,编辑是我;本文非NVIDIA约稿,但依然遵守NVIDIA相关发布内容的限制性约束,我们采用NVIDIA官方许可的测试方法,测试用例和测试工具,脚本测试,所有软件和工具均得到了正版授权或相关方正式授权。

RTX 4080架构简析

在具体测试开始之前,我十分简略的分享下下RTX 4080的构架的注意点。

RTX 4080不同于RTX 3080,并不是采用的和90相同的102核心,而是采用的是AD103核心,完整的AD103核心是有7个GPC,规模同GA102十分接近。不过最后个GPC并不是完整的12组SM,而是8个,这应该是首见。

其实30系也有GA103,规模是5个GPC/60组SM/256位显存带宽,这个规模要小于RTX 3080的68组SM,但主要使用在高性能游戏本的移动版RTX 3080 Ti上,因此存在感比较低。

完整的GA103是12 x 6 +8一共80组SM,RTX 4080屏蔽了4组SM(也就是说后面如果有完整的4080 Ti或者SUPER,大概还有5%的提升空间),其流处理器/ROP/TMU/RT Core数量都是完整的AD103/RTX 3090 Ti的90%,不过其核心频率要比RTX 3090 Ti高34%,等效理论性能基本是RTX 3090 Ti的120%。

美光单颗2GB 24GHz的GDDR6X芯片编号为D8BZF,但RTX 4080实际只跑了22.5GHz,如果后面有RTX 4090 Ti除了补全核心规模,提升GDDR6X频率也应该是重要提升点。

RTX 4080即使有美光24Gbps的GDDR6X加持,但其显存位宽只有256位,相比RTX 3090 Ti/4090低了1/3,但其整体带宽依然只有RTX 3090 Ti/4090的71%。为了弥补显存带宽上的劣势,RTX 4080也带有64MB的L2缓存。对于RTX 4080而言,其主要问题是30%显存带宽劣势会在多大程度影响性能,64MB L2又能有多少挽救,究竟AD103相比GA102晶体管多了60%,其中大头也就是多出来的这64MB L2缓存,这L2实现代价还是很高的。

RTX 4080 GA103采用的是台积电定制的4nm工艺,核心面积仅为379mm2,回到80系一般400mm2左右的甜点面积水平。RTX 4080核心面积/晶体管数量规模基本都是RTX 4090的60%,频率也差不多,等效理论性能也差不多是60%,RTX 4080在实际游戏和应用中能够达成RTX 4090怎么样的对应水平也是我们关注的问题。

其他GPC和SM部分,还有RT Core和Tensor Core部分的改进,我在之前RTX 4090评测就有解读,就不再复述。

RTX 4080火神赏析

本次测试的RTX 4080依然是火神,这和上次测试的RTX 4090火神不能说是采用一样的设计语言,而应该说是一模一样,使用的完全相同散热方案,这样还是让我有些喜出望外。除开夸张的散热规模,现在火神在工业设计方面也承担着除FE之外40系颜值担当角色,这是毫无疑问的。

正面金属银色装饰边框裹挟着10.5cm的大尺寸轴流风扇。

背板设计也完全和RTX 4090火神一致。

核心背面是3组MLCC+2组SP-CAP。

前端风扇背后的散热缺口,就是对于内存和风冷散热器不太友好。

RTX 4080火神也依然采用12VHPWR接口,旁边是USB通信和灯光同步接口,下部的金属触点可以外挂屏幕和ARGB模块。

12VHPWR接口安全性问题其实我在4090首发评测就提过,现在我再具体化一点,建议不要使用显卡附带的转接线,尽量使用电源的直出线,并且要保证完全插入。如果需要使用转接线,也不要在插口处大角度弯折,弯折会导致公母头接触面变小而导致烧毁。

和RTX 4090火神一样的可定制显示内容的小屏,除了可以安装在侧面金属触点,也可以单独放置在USB支架上。

标准的3DP 1.4+1 HDMI 2.1,还有BIOS切换按钮。我还是再吐槽下NV祖传的DP 1.4,不能去学学AMD RNDA3的DP2.1么?

在显卡的前端我们依然可以看见上下两排9根8mm的热管,在散热方面相比4090火神是没任何缩减。如果要COST DOWN热管规模,还需要修改模具,增加SKU,反而成本更高,所以还不如不减。

由于我懒,就没对看起来几乎一模一样的RTX 4080火神进行拆解,但这里借用官方FE的图进行简略分析:RTX 4080 FE的布局基本和4090 FE一样,但供电规模大幅缩减,核心供电从4090的20相直接砍半直接缩成10相,供电空件很多极其丑陋。

但我在之前的GPU首发评测就说过:N卡和A卡公版的竞争,看上去越丐的就肯定是胜利者。N卡和A卡公版的竞争本质就是架构效率的竞争,在工艺水平相近的情况下,架构效率的领先者可以用更小的规模实现更好的性能,这样核心面积小,功耗和发热低,就不需要堆供电和散热,看上去自然就会丐;而架构效率落后者为了赶上领先者的性能,就需要更大的核心规模,有更高功耗,需要更强的供电和散热,看上去自然就更豪华。架构效率的领先者可以用相同成本实现更高性能,或者用更低成本实现相同性能,在定价上就更有主动权,打价格战也更有空间。所以对于公版而言,丐其实是好事。

不过公版丐也并不能阻止AIC堆料,七彩虹RTX 4080火神依然提供22+4的供电,相比FE要多一倍都不止,这样单相分担的电流也就越低,热量和稳定性也就越好。

测试平台和说明

本次测试平台依然使用12900K OC 5.1GHz,驱动使用4080首发的526.72,开启Resize bar。

本次测试主板是七彩虹CVN Z790D5 GAMING FROZEN主板,其采用19+1相 50A的供电,并有4组PCIe 4.0 M.2扩展。

IOCOVER铜+铝混合结构的mosfet散热也给人感觉十分实在。CVN79的装饰条也十分的COLORFUL。

本次测试内存是七彩虹CVN DDR5 6200C32 16GBx2,其采用海力士mdie颗粒,并且有出厂CL32的超低延迟,为了统一测试平台,本次测试超频到6400进行测试(其实我这边尝试可以超频到6800CL36-42-42-78过TM5)。

本次测试的RTX 4080火神有2个BIOS,Boost频率分别为2505和2640 MHz,默认频率的标准TGP为320W,可以拉高到350W,而高频的BIOS默认TGP为380W,可以拉到460W,这基本就是RTX 4090的TGP级别。

3DMARK性能测试/功耗和温度

3DMARK是比较纯粹的DirectX测试,并无额外的厂商优化,,并且可以剔除处理器和其他硬件对于性能影响,我们分别测试Firestrike Ultra/Timespy Extreme/Port Royal/Speed Way项目的图形分,这四个项目分别考察4K分辨率下DX11/DX12和DXR的性能。

RTX 4080在代表DX11性能的Firestrike Ultra和DX12性能的Timespy Extreme相比RTX 3090 Ti分别提升了29.7%和30.7%,相对RTX 4090也有69.9%/72.9%的性能,这样的实际性能是好于60%的理论性能比例的。

RTX 4080在PORT ROYAL DXR测试,相比RTX 3090 Ti性能提升了23.7%,相比RTX 4090依然有30%的差距。

SPEED WAY是3DMARK在40系列发布后新增的DXR测试项目,相比RTX 3090 Ti性能提升幅度同样为23.7%,而有76.3% RTX 4090的性能。

https://www.zhihu.com/video/1575943541431177216

除了用3DMARK跑分,我们也用3DMARK Port Royal压力测试分析RTX 4090的频率稳定性/功耗和温度。11月底25度设定空调房测试)。

RTX 4080在默认的2505和高频的2640MHz在频率运行Port Royal压力测试稳定频率为2775/2850MHz,相比RTX 4090还要高一点。

RTX 4080两个BIOS功耗基本都在300W左右,差别不大,其中GPU核心大概250W,16GB GDDR6X大概80W,这样看公版的320W/350W就够用了。另外RTX 4080待机功耗大概在15W,而RTX 4090接近20W,平时作为亮机卡其实也不用心疼电费。

RTX 4080火神的核心温度在60度左右,相比RTX 4090火神大概低5-6度,显存温度最高70,为600W设计的散热器来压300W的RTX 4080其实有点欺负人。

游戏性能测试

游戏性能测试大部分还是延用之前RTX 4090首发测试项目和设置,但加入新发售的使命召唤现代战争2。

守望先锋2https://www.zhihu.com/video/1575943600650874880

守望先锋2虽然发售仅一个月,但现在已经如我所愿,已经有凉了的迹象,我们使用4K 100%渲染分辨率超高画面设置进行测试,测试Replay是固定法鸡视角。

RTX 4080在守望先锋中相比RTX 3090 Ti提升16.2%,提升幅度较小,但也可以满足4K144的性能需求。

使命召唤现代战争2https://www.zhihu.com/video/1575943646628487169

使命召唤现代战争2是IW组年票游戏,这一点不再支持光线追踪,但提供了对DLSS的支持,并且游戏自带了Benchmark,我们使用4K全特效进行测试。

RTX 4080在DLSS质量和性能模式基本可以满足4K 120/144的性能需求,而在原生分辨率则不能保证全特效60FPS以上的完全流畅。另外,使命召唤现代战争2也是对于处理器性能比较不敏感,主要是GPU瓶颈。

地平线零之曙光https://www.zhihu.com/video/1575943762811047936

地平线零之曙光是SONY旗下游击队工作室开发的沙盒动作游戏,其采用的Decima引擎,这个引擎也被较为广泛的使用在杀戮地带/死亡搁浅等其他SONY第一方游戏上。地平线零之曙光在后续更新也增加了对DLSS 2.0的支持,我们使用游戏内置的Benchmark进行测试,使用的最高画质设定。

在原生分辨率RTX 4080领先RTX 3090 Ti 20%,落后RTX 4090 25%,但在开启DLSS后,RTX 4090遇见严重的CPU瓶颈,并没能同RTX 4080拉开差距。

荒野大镖客救赎2https://www.zhihu.com/video/1575943811422699520

荒野大镖客救赎2采用R星自研的Rage引擎,无论是是西伊丽莎白壮美的薰衣草花海+雪山,还是人流如织灯火阑珊的圣丹尼斯都美的让人感动,完全动态的实时时间和天气变化让整个游戏世界及其生动华美,R星的开发团队通过引擎精雕细磨再现一个浓缩的19世纪末美国。我们手动将画面设置全最高(高级设置默认),使用Vulkan API,分别测试4K原生分辨率/4K DLSS质量/性能模式下的性能。

RTX 4080在开启DLSS性能模式,基本可以满足4K120的性能需求。另外我们将RTX 4080的显存频率从默认的22.5GHz超频到24GHz,核心频率不动,性能也有3.5%的提升,这在一定程度说明256 bit的显存位宽即使是在加持高频的GDDR6X的情况下,也还是存在一定的瓶颈的。

古墓丽影暗影https://www.zhihu.com/video/1575943857916850176

古墓丽影暗影虽然是20世代首发的RTX游戏,主要是用光线追踪来进行阴影和AO处理,但其图像引擎也经过多次升级,能够支持 DLSS 2.0,并且于最近增加了对intel XeSS的支持。测试我们使用手动MAX的画质,分辨率测试4K TAA/DLSS质量和DLSS性能模式的性能。

RTX 4080在DLSS性能模式可以满足4K144的需求,当然对于这种单机ACT追求画质的话DLSS质量模式135FPS的平均性能也可以接受。古墓是好游戏,但要玩的应该早通关了,不过后来EPIC后来又送过两次,没玩过的同学如果太无聊也可以补补。

之前5.1GHz的12900K对于RTX 4090已经构成瓶颈,但对于RTX 4080则没有问题,这就是典型的由量变到质变。

极限竞速 地平线5

地平线5刚刚在前几天10周年的时候大更新,增加了对光线追踪和DLSS/DLAA/FSR的支持。

地平线5光线追踪主要是用于车身反射,但实际观感同之前的Cubemap差别也不大,不过其对性能影响也较小,即使是极致设置相比完全关闭大概只影响10%的性能。地平线5光线追踪质量在极致设置下,在车房模式和漫游/比赛模式可以提供玩家车辆光线追踪,而在超高设置下漫游/比赛模式只有半分辨率,而在照片模式下则可以提供玩家和AI车辆的全光线追踪。中和高设置仅有车房鉴赏模式有光线追踪,这也应该是Xbox Series X的设置。

我们在测试开启DLSS性能模式后,发现12900K带RTX 4090存在十分严重的瓶颈,有90%收到CPU性能限制,更换13900K,依然有76%是受到CPU性能限制,因此地平线5我们改为13900K进行测试。当然,超采样和AA的设置越高,GPU负载越高那CPU的瓶颈也就越小。

https://www.zhihu.com/video/1575943914825072640

地平线5我们使用游戏自带的Benchmark测试4K分辨率手动全最高特效下的性能,由于地平线5支持DLSS/DLAA/TAA/MSAA几乎所有的超采样和抗锯齿技术,我们也重点分析了不同设置的差别。

整体而言性能是DLSS性能>DLSS质量>TAA=DLAA=2X MSAA>4X MSAA。

DLSS性能在动态游戏时有比较难得察觉的画质损失,DLSS质量画质就基本我无损,TAA抗锯齿性能和2X MSAA相当,抗锯齿效果比2X MSAA还稍好,但稍微影响纹理质量,并且运动模糊会影响TAA效果,MSAA 4X性能最低但效果也最好。综合考虑画质和性能,我还是更推荐DLSS质量模式,特别是RTX 4090在DLSS质量模式下基本还是可以稳定144FPS水平,而RTX 4080在DLSS性能模式基本可以稳定120FPS。

地铁离去增强版

地铁离去我我最近10年玩过的最好剧情导向FPS游戏,而地铁离去增强版在原版游戏基础之上进一步提升了游戏的视觉效果,在原版只有阳光能自然照亮环境,这限制了技术在游戏中许多位置的实用性。而在增强版来自太阳、月亮、天空、人造光线和所有其他光源的光可以照亮内部、外部、角色、敌人以及武器,极大改善了游戏的外观。黑暗的内部环境沐浴在光线中,物体材质在光线的照射下闪烁着微妙的光芒,光线的颜色在整个场景中真实地呈现在玩家眼前。当然为了实现这一点,每一束光栅化光线要么从游戏中删除,要么升级为新的经改进的光线追踪版本,因此地铁离去增强版是第一个必须需要支持光线追踪GPU才能运行的3A游戏。

地铁你去是本次测试RTX 4080相对RTX 3090 Ti性能提升幅度最大的游戏,无论是平均帧还是最低帧,在开启DLSS后可以满足4K60的性能需求。地铁离去也是本次测试功耗最高游戏,可以跑到340W以上。

赛博朋克2077

赛博朋克2077是第一个全面使用光线追踪进行光照/阴影/反射处理的3A游戏,我们使用最近NVIDIA提供的内测版进行测试,设置光线追踪极致,DLSS性能模式,使用游戏自带的Benchmark进行测试,分别测试4K原生分辨率/4K DLSS质量/性能模式下的性能。

RTX 4080在开启DLSS 性能模式后,可以稳定在60FPS以上,而RTX 4090在DLSS质量模式也有可玩的性能,这个就是本质差距。另外新版驱动DLSS 3的性能相比4090首发驱动大幅提升,RTX 4090从124FPS提升到了151FPS,而RTX 4080现在也有接近120FPS的性能。

截止GeForce RTX 4080发布时,已有10款支持DLSS 3游戏发布,具体游戏有《瘟疫传说:安魂曲》、《光明记忆:无限》、《毁灭全人类2:重新探测》、《暗影火炬城》、《逆水寒》、《生死轮回》、《漫威蜘蛛侠:重制版》、《微软模拟飞行》、《超级人类》。而WRC Generations, 《极品飞车:不羁》和 《战锤40K:暗潮》三款支持DLSS 3的游戏也将在RTX 4080推出后不久发布,圣诞节前玩家就可畅玩这些DLSS 3游戏。

游戏测试小结

非光线追踪游戏RTX 4080相比RTX 3090 Ti平均提升了20%,而光线追踪游戏性能提升了30%。RTX 4080相对有RTX 4090平均73%的性能,这个比例不同游戏之间比较稳定。再换个角度,RTX 4080用RTX 4090 60%的规模实现了70%以上的性能,这在一定程度说明了RTX 4090规模放大的边际效应很明显,继续扩大规模的性能收益也很低。

DirectStorage性能测试

在RTX 3080发布会上,NVIDIA画了个RTX IO的饼:传统的游戏加载需要将SSD数据通过总线到CPU到内存,再回到CPU进行解压,然后经过总线,最后再经过GPU到显存。而RTXIO则是通过DirectStorage,将SSD数据直接送入GPU解压进入显存,这样可以大大提升性能并降低CPU占用率。

但RTX IO由于微软系统层面的拖拉并一直没有落地,直到WIN11 22H2才正式提供支持,我在这里使用DirectStorage SDK进行简单测试。

我们使用GpuDecompressionBenchmark进行理论性能测试,我们准备了1.5GB的BMP图片,用7ZIP封装成无压缩的WIM格式进行测试,这样的文件格式比较接近于游戏未压缩材质的数据情况。为了减少SSD瓶颈,我使用了海力士P41 2TB进行测试。

未压缩数据加载速度问7GB/S,刚好是P41的顺序读取极限。在经过GDEFLATE压缩后,GPU解压读取速度有13GB左右,RTX 4080和4090的性能差别不大。

我们再使用BulkLoadDemo测试游戏加载速度,13900K使用传统方式加载速度10次平均在8.34GB/S,CPU占用几乎100%。而RTX 4090 10次平均在11.92GB/S,显存占用高达18GB,RTX 4080加载速度10次平均在11.3GB/S,感觉RTXIO性能同GPU性能关系不太大,但RTX 4080爆了显存还是有点影响。

虽然目前还没任何PC游戏提供了对DirectStorage的支持,但好在目前系统和驱动都是Ready状态,而游戏开发商对于DirectStorage其实在Xbox Series平台已经有了一些经验,后续在PC上铺开也许会比较快,希望如此。

生产力性能测试Blender渲染性能测试

Blender是一个免费的渲染软件,其支持4种渲染路径,无是纯CPU渲染,HIP是AMD Radeon显卡专用,NVIDIA显卡则可以用CUDA和OptiX两种。OptiX是NVIDIA在GPU上实现最佳光线追踪计算的应用框架,它可以通过可编程的方式对相交、光线生成、着色和降噪等操作进行高效处理。

达芬奇18编码和遮罩测试

早几年达芬奇主要是作为调色软件存在,但最近的版本将剪辑、调色、视觉特效、动态图形、音频后期和发布进行了全流程整合,成为了一个全功能的视频软件,并且其Studio的付费版相比Adobe PR更为友好,我已经有2位做视频自媒体的朋友已经从PR迁移到达芬奇。我们这次测试是将一段126秒Prores422HQ 4K/8K视频分别用HEVC/AV1编码转换成MP4封装,80Mbps固定码流,统计完成时间。(由于8K测试文件容量高达46GB,这个测试完全发挥性能需要64GB内存,因此我改用海盗船复仇者16GB 6200 x 4内存进行)

由于达芬奇编码完全是由GPU的编码器完成,和流处理器无关,因此流处理器规模也不会影响编码性能,所以RTX 4080同RTX 4090的编码性能完全一样,就说后续RTX 40中端产品出来,编码器的编码性能也应该大差不大。

虽然达芬奇现在是全流程视频处理软件。但我们也要知道达芬奇最为看家本领还是调色。我们选择一段彩色影片,将其人物选择保留彩色但背景环境改成黑白,整个处理过程需要用GPU对人物同背景进行进行区别处理。

我们使用采集卡录制处理过程再分析视频精确获得完成时间,RTX 4080比RTX 3090 Ti快20%,而RTX 4090要快60%,这样的性能差距同游戏性能差不多,性能同流处理器规模强相关。前几年我这边规划设计师电脑产品配置的时候,调色配置基本都是RTX 2080 / RTX 2080 Ti甚至多路RTX 2080 Ti了。

SPECviewperf 2020性能测试

Specviewperf 2020是可以测试3ds Max、CATIA、Maya、Solidworks等专业软件的标准测试程序,虽然其负载相比实际环境要轻,但还是可以反应不同GPU的相对性能作为参考。

RTX 4080在Specviewperf 2020测试中,相比RTX 3090 Ti平均有25.7%的性能提升(集合平均),特别是在Maya/SolidWorks/CREO这些应用环境,RTX 4080的性能十分接近于RTX 4090,对于专业用户可以依据自己的软件情况进行选择。

测试结语

RTX 3090 Ti双11期间实际成交价大概在8500左右,而RTX 4080的MSRP为9499,大概要贵上10%以上,但RTX 4080相对RTX 3090 Ti有大概20-30%的性能优势,并且300W的实际功耗要比RTX 3090 Ti低上1/3,因此RTX 4080相比RTX 3090 Ti还有有更大的购买价值。

RTX 4080与RTX 4090相比,用其60%的规模实现了后者70%的性能,在架构效率上更高。性价比方面,RTX 4080用73%的价格实现了RTX 4090 73%的性能,性价比基本一致。至于RTX 4080/4090怎么选我觉得还是要从需求除非,如果你是以电竞/网游这些硬件要求不太高游戏玩家,或者使用的是4K60或者2K144规格的显示器,那RTX 4080就可以很好的满足你的性能需求,过于强大的RTX 4090就有点浪费。

虽然RTX 4080相比RTX 3090 Ti有更好的性价比,但说实话我觉得9499的价格还是偏贵,这么多年来换代升级一般是新一代用一半价格就可以实现上一代相同性能(比如RTX 3070 VS 2080 Ti),或者在相同价格就可以实现170%性能(RTX 4090 VS 3090 Ti也基本符合)。并且一般产品定位越高性价比越差,而RTX 4080用RTX 4090 73%的MSRP实现73%的性能还是不正常,即使考虑台积电大幅上涨的先进工艺代工费用,美国爆炸的CPI和发布时差不多7.3美元/人民币汇率,9499的价格虽然可以理解,但还是偏高的。

如果你是刚需用户现在就需要买一偏万元级的显卡,RTX 4080还是目前最好的选择,特别是我们本次测试的七彩虹iGame RTX 4080火神,其完全延续了4090火神的设计,可以说是除开Founder Edition之外的颜值巅峰,我是十分之喜欢,再者用来设计压制600W的火神散热方案用来压300W出头的4080,完全可以说是轻松任意。



【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3