NVIDIA GeForce RTX 4070 Ti首发评测:干翻昔日王者,性价比拉满! |
您所在的位置:网站首页 › 3070配什么cpu性价比最高 › NVIDIA GeForce RTX 4070 Ti首发评测:干翻昔日王者,性价比拉满! |
NVIDIA GeForce RTX 4070 Ti首发评测:干翻昔日王者,性价比拉满!
2023-01-05 14:26:24
17点赞
25收藏
81评论
就在昨晚CES2023特别演讲上,NVIDIA正式对外公布了NVIDIA GeForce RTX 4070 Ti,这可能是GeForce RTX历届中最快一次推出Ti系列性能产品。 在这个时间点上,2K高刷电竞显示器和支持光线追踪的游戏也进入了井喷时期。特别是仅四年的发展,支持RTX ON的游戏数量超过250个,平均下来以每年60个以上速度增长,而且只会越来越快。 这一次,显然是要解决在在最高光线追踪画质下流畅运行高分辨率游戏的问题了,RTX 4070 Ti的实际表现如何?现在就让我们以七彩虹战斧GeForce RTX 4070 Ti为例,奉上NVIDIA GeForce RTX 4070 Ti首发评测。 在过往的GeForce RTX更新中,核心型号通常以双数交替进行,比如RTX 20系列的TU102、TU104,RTX 30系列的GA102、GA104。Ada Lovelace架构的命名规则打破了这个传统,AD102交给了GeForce RTX 4090,AD103交给GeForce RTX 4080 16GB,GeForce RTX 4070 Ti则拥有了AD104。 如果按照前两代的命名逻辑,AD104应该紧跟AD102之后,并通过细分版本对不同定位的显卡进行区分。也因为如此,GeForce RTX 4070 Ti在最初被赋予GeForce RTX 4080 12GB变得有理有据,导致了与GeForce RTX 4080 16GB命名冲突,在营销上具有迷惑性。 回归正题。AD104-400-A1是GeForce RTX 4070 Ti的型号,作为AD104的首款消费产品,也同样保留了AD102和AD103上的所有主要功能,包括台积电4N定制工艺,第三代RT Core,第四代Tensor Core以及大量围绕新核心构建的新技术。 按照传统,Ada Lovelace架构GPU中包含了若干个GPC(Graphics Processing Clusters,图形处理集群),GPC下包含若干个TPC(Texture Processing Clusters,纹理处理簇),再往下就是SM、CUDA、RT Core、Tensor Core等等。每个GPC之间包含的TPC数量相等,当GPU进行定位区分的时候再进行GPC、TPC的物理屏蔽实现。 相比AD103核心的不规则分配,AD104更好理解。完整的AD104包含5个GPC,每个GPC包含6组TPC,每组TPC包含2个流式多处理器(Streaming Multiprocessors,SM)。 SM是可以看成诸多核心的集合体,从Maxwell架构开始引入了处理块(Sub-Core)概念。每个SM包含4个处理块,每个处理块包含1个64KB寄存器堆,1个L0指令缓存,1个Warp调度器,1个调度单元,4个加载/存储单元,1个特殊功能单元(Special Function Unit,SFU)用于执行超越函数指令(比如正弦、余弦、倒数、平方根等)和图形差值算法指令。每个SM下的128个CUDA Core随处理快分成4组,每组CUDA由16个专门用于FP32的CUDA Core,16个可以在FP32和INT32之间切换的CUDA Core组成。 此外,每个SM下均包含4个第四代Tensor Core,1个第三代RT Core,成为后续游戏实时光线追踪和DLSS 3性能提升的重要前提。 重点来了,GeForce RTX 4070 Ti上的AD104-400-A1仅在用于内容创作NVENC和NVDNC上有略微删减,其余元素与完整AD104看齐。也因为如此,GeForce RTX 4070 Ti拥有完整的5个GPC、30组TPC、60组SM,以及6个32-bit内存控制器组成的192-bit内存接口。整个芯片包含358亿个晶体管,7680个CUDA Core,60个第三代RT Core,240个Tensor Core,240个纹理单元和80个ROPs。同时还包含7,680KB一级缓存,15,360KB寄存器堆,以及49,152KB二级缓存,并搭配192-bit 12GB GDDR6X。 值得注意,GeForce RTX 4070 Ti的二级缓存是GeForce RTX 3070 Ti的12倍有余,是RTX 3080的8倍有余,成为光线追踪性能发挥的重要基础。 由于策略变化突然,GeForce RTX 4070 Ti暂时没有Founders Edition公版,但不妨碍头部AIC厂商在第一时间推出标准版和OC超频显卡,七彩虹战斧GeForce RTX 4070 Ti豪华版就是很好的例子。特别是七彩虹能赶在疫情影响到物流之前,将显卡交到我们手中,可见其反应迅速。 七彩虹战斧GeForce RTX 4070 Ti豪华版遵循公版加强的原则,基础频率为2310MHz,Boost频率可以达到2610MHz,TDP 285W,供电相数为10+2,输出接口包括3个DisplayPort 1.4a和1个HDMI 2.1接口。 战斧系列最大的特点之一就是对散热模组的进一步加强,使用了三槽设计的超大散热模组,并覆盖经典钻石状元素以及红黑撞色装甲,散热面板简约且有力。 三槽设计带来的好处是侧面的散热空间增加不少,配合装甲背后的镂空设计,做到更快的释放热量,同时也很好的控制了散热模组的长度,方便其更好的装到机箱内。 给散热模组提供主动散热的是3个98mm直径风扇,热管则使用了6*Φ6设计,并使用了“回流焊”工艺确保热管与鳍片间紧密相连。你会发现虽然战斧系列虽然在装饰外壳上差别不大,但内部热管直径、数量,以及是否使用真空冰片冷凝液技术,都会有一定差别,也从侧面证明了GeForce RTX 4070 Ti的满负荷散热要求要明显低于RTX 4080和RTX 4090。 因此给战斧GeForce RTX 4070 Ti豪华版供电配套的是一条双8pin转16pin的电源转换线,当然如果你是ATX 3.0电源或者手头有3个以上的8pin转16pin的转换线也可以使用,在实际状态下不会影响到显卡发挥。 这里值得说明TGP功耗反应的是GPU运行功耗上限,也就是功耗墙。实际上GPU Boost表现是由功耗、散热情况、负载等多重因素决定,即使GPU Boost到最大频率也未必接近TGP值。事实上无论是GeForce RTX 4090还是GeForce RTX 4080运行4K分辨率画面时能耗也低于TGP值,2K和1080P分辨率更是如此。 因此在测试过程中我们也对战斧GeForce RTX 4070 Ti豪华版1080p、2K分辨率最高画质的功耗检测进行比较,得到的参考如下,可见战斧GeForce RTX 4070 Ti豪华版的散热模组起到了不错的作用。 于此同时,显卡在压力测试状态中红外线检测外部表现如下,整个过程GPU核心最高温度68℃,在室温20℃的情况下,战斧GeForce RTX 4070 Ti豪华版保持足够清凉的温度,反倒是主板发热量更为抢眼。 现在让我们把目光放GeForce RTX 4070 Ti的性能提升上。如果对RTX 40系列略有了解的同学,会发现新一代GPU性能提升除了归功于新制程、更大的缓存设计之外,还将最重要的RT Core和Tensor Core分别升级到了第三代和第四代。 其中第三代RT Core在第二代RT Core的基础上,再次将射线/三角形求交测试吞吐量。意味着射线/三角形求交测试模块由原来的2个再次增加到4个,相对Turing架构的1个射线/三角形求交测试模块翻了4倍,并额外增加了下图左下角的透明度微图引擎(Opacity Micro-Map,OMM)和右下角的位移式微型网面引擎(Displaced Micro-Mesh,DMM)。 同时第三代RT Core还引入了着色器执行重排序(Shader Execution Reordering,SER)技术,通过与游戏设计团队配合,更有效的分配次级射线的排序权重,从而获得更高效的线程排序执行,避免光追运算陷入无意义的次级射线运算深渊。 第四代Tensor Core在效率提升的同时,更进一步与DLSS 3、光流加速器强绑定,避免了CPU性能跟不上GPU所导致帧率的损失,同时还原生支持Reflex技术避免AI生成的帧率影响系统响应速度。 在测试之前,照例先搬出我们的测试平台,这里为了确保GeForce RTX 4070 Ti性能完全释放,这里使用了英特尔Core i9-13900K,七彩虹Colorful CNV DDR5-6000 16GB x2,ROG MAXIMUS Z790 HERO,Thermaltake TPI RGB PLUS 1250W作为基准,同时也引入GeForce RTX 3090、GeForce RTX 3070 Ti、GeForce RTX 4080等GPU作为对比,方便大家参考。 在基础性能测试中,惯例引入检测DirectX 11和DirectX 12的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal和VRMark Blue Room进行检测。 可以看到常规测试中GeForce RTX 4070 Ti相对GeForce RTX 3090提升有12%左右提升,相对RTX 3070 Ti提升平均提升幅度更是超过50%。 这里我们也搬出了几个喜闻乐见的3A游戏进行对比,这里主要使用4K分辨率光追最高画质,以及《地铁:离乡》的1080p最高画质作为参考。能够看到GeForce RTX 4070 Ti相对GeForce RTX 3090提升在10%左右,相对GeForce RTX 3070 Ti提升将近100%,甚至在《古墓丽影:暗影》中获得了160%以上的提升。 但4K分辨率显然不是我们所关注的领域,现在让我们把精力放到更为主流的2K最高分辨率和DLSS 3游戏画质中。 2K分辨率轻松突破100FPS如前面所言,GeForce RTX 4070 Ti所采用的第四代Tensor Core性能提升幅度巨大,包括的FP16、BF16、TF32、INT8、INT4性能相对前一代提升两倍以上,并支持商业Hopper GPU架构中出现的FP8 Transformer Engine。 而Tensor Core所支撑的DLSS本质上是一种卷积自编码器,在DLSS 2.X时代,通过AI模型训练分析当前与过去的帧,最终通过深度学习算法将将单帧的低分辨率提升成高分辨率。但到了DLSS 3,这个过程发生了翻天覆地的改变,DLSS 3不再是一项单一的技术,而变成一整套确保游戏高效运行的解决方案。 DLSS 3引入了一套光流加速器(Optical Flow Acceleration,OFA)与DLSS相结合的办法,构建出了一个更为立体的分析方式,将卷积自编码器的输入源扩展到几个部分,分别是:之前帧与当下帧,由光流加速器生成的光流场、游戏运动矢量和深度等数据。这时候DLSS 3甚至承担起渲染过程中7/8的工作,让CPU和GPU进完成其中1/8的渲染即可,从而节省出大量的计算资源专注到更有用的地方。 这意味着游戏一旦支持DLSS 3,那么效率将是成倍的提升。但也需要注意,DLSS 3运行的前提是GeForce RTX 40的第四代Tensor Core,第三代以及第三代以前Tensor Core仅能支持到DLSS 2.X,即实现DLSS 3的部分功能,帧率提升虽然也很明显,但幅度没有DLSS 3来得更为夸张。 这里我们引入3DMark DLSS 2 2K、3DMark DLSS 3 4K、3DMark DLSS 3 8K进行对比,可以看到GeForce RTX 4070 Ti相对RTX 3090提升了50%到70%,特别是RTX 4070 Ti在8K分辨率触及60FPS的水准,相对GeForce RTX 3070 Ti提升了将近600%。 最后让我们进入2K分辨率游戏测试环节,在RTX 4070 Ti与RTX 3070 Ti的较量中,能够看到DLSS 3一旦开启,平均性能在50%到80%的提升,部分场景更是直接从不能玩到了流畅运行的级别,比如《传送门》RTX版提升了200%。 再来对比RTX 3090,在DLSS开启后,RTX 4070 Ti相对RTX 3090平均提升也超过了30%,这同样也意味着RTX 4070 Ti在2K游戏中的实际表现同样也优于RTX 4090 Ti。 另外前面提到,AI生成帧率过多,会造成鼠标键盘所产生的关键操作被排列到渲染队列后方,造成过长的系统响应延迟。因此DLSS 3本身就融入了对NVIDIA Reflex的支持,并且Reflex技术本身还会扩展支持到GeForce GTX 900系列以后的GPU。 GTC发布会在推出GeForce RTX 40系列GPU的同时,还围绕NVIDIA Studio内容创意做出了不少大幅度的改进,RTX Remix所支持的MOD游戏魔改工具就是其中之一。如果你有听说过前阵子刚刚发布且免费下载的《传送门RTX》,在全景光线追踪特效全开的情况下秒变显卡杀手,请毋庸置疑,这就是NVIDIA游戏创意团队在《我的世界RTX》和《雷神之锤2 RTX》之后又一个火力全开的作品。 早年MOD游戏需要反编译、破解、素材逐一替换、解决奇异Bug等复杂操作,就连《雷神之锤2 RTX》也耗费了NVIDIA工程师、美工、QA组成专门的游戏研发团队用数个月时间完成。 而相比前两作,《传送门RTX》的光线追踪重置就轻松很多了。因为RTX Remix来自于NVIDIA Studio的元宇宙平台NVIDIA Omniverse进行开发,通过NVIDIA Studio整合AI纹理工具、光线追踪、DLSS 3以及Omniverse平台协作,快速绕过了游戏反编译、提取素材的过程,让创作者全身心投入到游戏场景的翻新与二次开发中。 NVIDIA Studio强大的软硬件平台正是打开内容创作的钥匙,对于大多数消费者、内容创作爱好者、UP主而言,GeForce RTX系列就是高性价比的理想选择。GeForce RTX 4070 Ti无疑非常符合内容创作的各项需求,特别是性能提升后的12GB GDDR6X的效率也让GeForce RTX 4070 Ti更进一步。 这里我们先使用Blender 3.4.0作为测试基准,在Monster、Junkshop、Classroom三个场景中,可以看到GeForce RTX 4070 Ti相对GeForce RTX 3090性能提升20%以上,仅在Junkshop场景持平。而相对RTX 3070 Ti更是提升80%到107%不等。 在V-Ray 5 Benchmark中会分别考验CUDA和光线追踪性能,GeForce RTX 4070 Ti相对GeForce RTX 3080 Ti提升了40%左右。 Octane Render RTX则是测试GPU的光线追踪性能表现的另一个参考,Octane Render在近些年逐渐受到内容创作者热捧,利用GPU替代CPU加速大幅缩减了渲染过程,让创作者专注于内容的探索。在测试的四个场景中,主要考验GPU每秒产生的样本率,GeForce RTX 4070 Ti相对GeForce RTX 3090提升7%,相对RTX 3070 Ti提升了60%。 另外难能可贵的是,依照NVIDIA对GeForce RTX 40系列12GB显存以上的GPU采用双AV1编码器的策略,GeForce RTX 4070 Ti同样具备NVIDIA双AV1编码器。AV1编码是由英特尔、微软、亚马逊、谷歌、网飞等网络巨头组成的开放多媒体联盟AOMedia所推出的免费编码格式,在国内已经获得了哔哩哔哩、爱奇艺支持。 AV1的特点是能在相同文件体积下拥有更高清的画质,或者相同清晰度的画质下拥有更小的体积,因此它现阶段可以进行1080p串流视频的带宽,实现1440p甚至更好的画质,比如同样的带宽占用下,在哔哩哔哩可以轻松播放2K或者4K的视频,而播放4K的带宽也将可以用来播放更高分辨率的内容。用更简单的话来说,在不升级家里带宽的前提下,利用AV1编解码器就能获得更高分辨率的视频串流。 在好莱坞拥有统治地位的DaVinci Resolve 18是率先支持AV1编解码专业软件之一,因此也提供了对GeForce RTX 4070 Ti的编解码支持。基本上,我们在电影院线看到的大成本特效制作、剪辑、调色有很多都来自于DaVinci Resolve。 由于动则4K、8K视频后期调色将会耗费大量的系统计算资源和时间,利用AV1加速编码自然成为必选项,这里我们分别对一段4K ProRes和8K ProRes视频进行编码输出,可以看到无论是4K ProRes到4K H.265的输出,GeForce RTX 4070 Ti相对GeForce RTX 3070 Ti提升了一倍以上。而8K ProRes到8K H.265的输出,也节省了将近1/3的时间。 顺带我们也利用ON1 Resize AI 2022对低分辨率图片无损提升至高分辨率图片进行测试,可以看到GeForce RTX 4070 Ti相对GeForce RTX 4030 Ti效率提升将近40%。 SPECviewperf 2020则是通过建模对象或渲染体的旋转和缩放检视,来检测在各种专业设计领域(包含能源勘探、医学、建筑设计、机械设计、汽车设计、飞机设计等各种领域)的图形性能,这里包含了我们从大学专业软件课开始就接触的3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks等主流软件。GeForce RTX 4070 Ti在部分场景中与GeForce RTX 3090 Ti持平,部分场景则提升了20%的性能,相对GeForce RTX 3070 Ti更是提升40%到100%。 最后少不了常用的Adobe Photoshop、Lightroom测试,这里我们引入Procyon Photoshop Editing作为比较,GeForce RTX 4070 Ti比RTX 3090提升8%,相比RTX 3070 Ti提升12%。 NVIDIA GeForce RTX 4070 Ti给了我们不曾想象过的情况,在不到300W实际功耗的情况下,2K分辨率开启光追最高画质的实际游戏表现已经超过GeForce RTX 3090 Ti,把2K最高画质的3A大作全线提升至100FPS以上。并以6499元定价和更低的功耗,完成了对曾经旗舰显卡的超越。 与此同时,GeForce RTX 4070 Ti也表现出了全能型显卡的气场,提供AV1双编码器支持,AI性能加速表现优秀,处理3D渲染、图像编辑、视频输出同样一把好手,在基础性能上也已经超越了上一代旗舰显卡。 唯独可惜GeForce RTX 4070 Ti并没有推出Founders Edition版本帮助玩家充值一波原厂卡信仰。但眼前的七彩虹战斧GeForce RTX 4070 Ti就已经在散热、性能和细节设计上给予了很好的表现。如果大半年前你还在垂延RTX 3090 Ti的性能,那么现在不要犹豫,只需要一半的价格,就能够实现自己游戏和创作的梦想了。 ![]() |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |