【折腾测试】Steam Deck折腾测试(硬件和技术解析篇)

您所在的位置:网站首页 6900k超频 【折腾测试】Steam Deck折腾测试(硬件和技术解析篇)

【折腾测试】Steam Deck折腾测试(硬件和技术解析篇)

2023-03-17 23:01| 来源: 网络整理| 查看: 265

在上一篇专栏中我给那台64G版的Steam Deck更换了512G的固态硬盘并安装了Win11,那么在这一篇专栏中,我就来对这台机器搭载的硬件和一些技术做简单解析。

由于我个人不是很擅长玩游戏,对游戏机方面也玩的不多,基本上是按照自己的想法来写关于这台机器的东西,因此这几篇专栏很多东西可能并不是大家很感兴趣的,很多都是无关的东西,废话的占比非常非常之多,觉得没什么意思的话,就去看其他人的评测就可以了。

个人能力非常有限,且技术方面不专业,并不会做专业的评测,专栏中可能会出现很多错误的地方,希望大佬们指正。

BIOS部分

BIOS的英文全称翻译过来是基本输入输出系统,主要功能是为计算机提供最底层,最直接的硬件设置和控制,一台机器的BIOS是否好用,我个人认为是非常重要的。

这台机器采用的是Insyde H2O BIOS,也就是系微的UEFI BIOS,这种BIOS被现在很多新平台的笔记本采用,关于这台机器怎么进入BIOS,以及我不喜欢这种BIOS的原因,已经在上一篇专栏中说明了,这篇专栏中我们就来对其进行一些简单的解析。

这台机器BIOS的设置界面和我的蓝天NH55类似,是图形化的BIOS,不过里面可以设置的东西还是比较少,不知道能不能解锁出高级选项。

这里我们可以查看各种固件的版本,其中有PSP的启动装载和安全系统的版本,这个PSP当然不是指游戏机的那个PSP啦,这里的PSP指的是AMD平台的一个模块,用于从硬件底层负责系统安全,有传闻说这个模块是基于ARM Cortex-A5微架构做的独立安全模块,但由于有权限直接访问整个系统,因此这玩意是闭源的。

ABL和内存自检有关,这个平台的CPU微码是8900201,刚开始我还以为这玩意的CPU微码和移动端同架构Zen2相同,结果MCExtractor读不出这玩意的微码,应该和移动端Zen2的不同,看来8900201的微码应该是这颗定制APU专属的。

SMU则是系统管理单元,它负责控制CPU的功率,电流,电压,温度和功耗限制等,AMD老主板想要支持新一代处理器除了需要有CPU微码以外,还需要有SMU固件的支持才行,我使用Ryzen SMU Checker 1.2.0.9也是没有成功读出来,应该是这个工具只支持桌面端平台SMU固件的读取,不支持这颗定制芯片。

至于DXIO和MP2固件我也不清楚是做什么的,就麻烦知道的大佬指出了。

下方的VBIOS固件和GOP驱动版本,则是这个核显的视频BIOS和图形输出协议的版本,关于GOP这玩意的话,我们在折腾有些老显卡支持UEFI,100系和200系主板上八九代酷睿需要使用核显的情况下,就可能接触过更新这个固件。

往下拉还有EC的固件版本,EC的英文全称是Embed Controller,内部本身也有一定容量的Flash来存储EC的代码,它在系统中的地位并不比南北桥低,它负责控制绝大多数重要信号的时序,以及系统待机和休眠状态。

在笔记本和这类移动设备中,无论是开机还是关机状态,EC一直都是工作着的,除非完全断开电源和电池的连接,例如在关机状态下,它会一直保持运行,并在等待用户的开机信息,而在开机后,EC则会负责像电源指示灯,风扇转速等其他设备的控制。

PD的固件则是负责PD协议充电的固件,说实话这个机器我个人感觉充电还是比较慢,像我之前玩过有些支持65W甚至100W快充的轻薄本,充电就比较快,但这个机器由于支持的功率并不高,个人主观感觉充电就比较慢了。

我们可以使用Insyde BIOS的工具H2OUVE备份原版BIOS和在系统下修改BIOS设置,这里提醒在折腾BIOS之前,一定要备份原版的BIOS,不然设置错或者改错了,导致机器变砖而无法救砖就欲哭无泪了,这里我放一下提取出来的BIOS,需要自取。

Steam Deck原版BIOS:https://pan.baidu.com/s/1ZYAKtTtuvDkBClDjOnkpYw?pwd=SDFW  提取码:SDFW

这个BIOS是16M的大小,我们也可以自己找办法解锁这个BIOS的高级选项,以及修改相应设置,前面我发的专栏也提到过解锁方法和其中用到的工具,这个BIOS的解锁方法貌似和常见的有些不一样,例如常见的Setup Menu Insyde Full Show,还有BIOS LOCK的方法来解锁出高级选项好像不行,无论是在UEFITool中,还是在提取出来的DriverSampleDxe_SetupUtility中都找不到。

但通过提取出来的信息,感觉这玩意应该是可以超频的,比如我之前看了有修改内存频率的选项。

像CPU这边也有Core Performance Boost和C-state设置,SMT超线程设置,参考这些东西,理论上在H2OUVE里是可以改设置的,不过在不懂的情况下不建议乱设置,设置错误可能会导致机器变砖,必须拆机重刷BIOS才能恢复,也可能有损坏机器硬件的风险。

不过使用H2OUVE打开提取出来的BIOS文件,而不是直接读取实时运行的BIOS的话,是可以将这些设置另存为出文本来进行修改的,这个文本看着就直观多了,就不像之前提取出来的sct转文本的信息那样,让人感觉一头雾水。

关于这个文本的设置怎么改,我在之前的专栏就说过了,关键在于导入回去以后,该怎么将修改后的BIOS刷回去,英特尔平台倒是有FPTW64这种支持强刷的工具,但AMD平台好像就没有这种工具,我的蓝天NH55AF是拿编程器刷的,像Insyde自家的H2OFFT的话,我还不清楚能不能强刷修改过未经签名的BIOS,这里就麻烦大佬们提出建议了。

CPU-Z这里显示主板厂商是Valve,模具是Jupiter,我这台机器BIOS版本是F7A0107,现在还不知道怎么更新BIOS,有可能是在SteamOS那边更新吧?

虽说CPU-Z这里显示这个机器可能支持PCIe4.0,但检测结果是一方面,实际上是另一方面,我那个蓝天NH55AF也是写的可以支持PCIe4.0,但实际上还是只能支持PCIe3.0,之前买硬盘我也问过有个卖家,他说这个机器的M.2只支持PCIe3.0。

关于BIOS部分就先说那么多吧,如果大佬有什么比较好的玩法欢迎指出。

机器配置部分

这台机器虽然是一台游戏机,可就如我前面所说的一样,这台机器并不像那些一般的主机有强大的定制API优化,它跑的还是欠缺优化的PC游戏,因此性能方面自然是非常重要的。

先放一张娱乐大师的图,来先随便对这台机器的配置有一个简单的了解,其中我会对这些硬件和技术方面做一些解析。

CPU部分

这台机器采用了一颗AMD的定制APU,这颗CPU的型号为AMD Custom APU 0405,相信这个型号的处理器,你肯定没有在一般的电脑中见过吧?

这就意味着它并不是公版的芯片,前面我检测BIOS里的微码,也发现这玩意使用的微码与一般的Zen2不一样,就说明这颗芯片是定制的。

这颗CPU采用了AMD Zen2的架构,台积电7nm工艺,TDP设计为4到15W,规格为四核心八线程,基础频率为2.4GHz,单核最大睿频3.5GHz,理论上拥有448GFLOPs的FP32算力。

听起来感觉这玩意的性能,和现在主流CPU相比不算是很强啊?好像就是个低压U啊?性能可能还不如一些性能释放优秀的笔记本低压U。

实际上也确实如此,AMD的Zen2架构是2019年的东西了,距离现在也有三四年了,Zen2的IPC性能也就大致介于英特尔Skylake到IceLake之间,还是比不上Tiger Lake的,虽然英特尔十代和十一代酷睿桌面端都不怎么样,但移动端我个人觉得并不是,例如Ice Lake相比Skylake就是新架构,处理器IPC性能有了一些提升,很多方面也有改进,核显也有巨大进步,像Tiger Lake配备了大三缓的H45处理器,是可以与Zen3扳手腕的。

玩过这几代Ryzen的都知道,缓存大小对性能的影响同样是非常大的,例如移动端Zen2仅配备了8M三级缓存的话,在有些应用中就可能会不如同代桌面端拥有大三缓的处理器的,像台式机那边的Zen2配备了32M甚至64M的三级缓存还好说,后面AMD也推出过像5800X3D,采用3D V-Cache技术将三级缓存提升到96M,甚至还有像7950X3D这种将三缓堆到128M的怪物,在有些应用中依然能提升性能。

但这玩意做为一颗以核显为重点的APU,三级缓存仅有4M,而且这玩意的核心数只有四核,频率也不算是很高,因此预计在有些比较吃CPU的新游戏中,CPU可能会成为瓶颈。

一级缓存和二级缓存部分的话,则和一般的Zen2相同,每个核心分配64K的L1缓存,其中用于指令和数据的大小均为32K,L2缓存每个核心分配512K,因此这颗CPU的一级缓存为256KB,二级缓存为2MB,共享4M的三级缓存。

虽然低情商来说这颗CPU的性能确实不算很强,不过往高情商来说的话,Zen2相比以前的旧架构来说可以是进步巨大了。

如果要问AMD历史上最失败的CPU是哪一代?其中推土机虽然不一定能排到第一,但一定是名列前茅的,推土机架构在当年我们看来是非常弱鸡,尽管它拥有八核心,主频看上去也不低,可实际应用中却不如友商四核心不带超线程的i5,单核性能甚至还不如高主频的i3,i3默秒全的梗,就起源于此。

造成这种情况的原因很可能是AMD错误预估了未来计算机软硬件的发展趋势,例如AMD认为未来的软件会更加注重多线程优化,硬件方面可以将浮点计算交给GPU,CPU只要更加注重整数计算的性能就可以了,性能不够的话,可以靠频率来凑,后面打桩机架构的FX9590就是典型的例子,这肯定是导致绝大多数人,尤其是那些软硬件的开发人员,并不会为其任性而买单,可以说这玩意叫推土机果然是没有问题,当年它确实是差点把AMD的CPU市场给推平了。

当年推土机架构的思路也很清奇,例如模块化设计,推土机是将2个核心及相关单元封装成1个模块,虽说每个核心都有完整的整数运算单元,但却是一个模块对应1个浮点运算单元与L2缓存。

换句话来说这玩意就是让2个CPU核心共用1个浮点运算单元与L2缓存,这就让人看到设计不合理的地方了,就连现在的CPU,还依然是每个核心对应一个浮点单元,与对应容量的L2缓存呢,例如Zen2的每个核心就对应512K的L2缓存,因此这玩意由于每个核心并没有单独的浮点运算模块,缓存方面也存在问题,就只能算是残血的核心,这就导致推土机单核性能较弱,像那几代CPU很多人会称它是八核四线程,就是这个原因。

虽说未来计算机软件可能确实会往多线程方面优化,比如说DX12和Vulkan这种底层API,就是往提升多线程的效率方向发展,可当时的很多软件并没有现在优化这么好,更多还是依赖于单核性能,而且大多数应用还是更依赖CPU来做浮点运算,而这玩意却是单核性能较弱,把非常重要的浮点运算单元给砍了,结果是什么可想而知。

而且推土机的整数单元部分的规模,相比K10还反而缩水了,例如K10的整数部拥有三个ALU和AGU,到推土机还反而缩水到两个了,这就导致推土机可能还不如自家上一代产品呢,因此很多年前的垃圾佬们宁愿玩那些旧架构开核,也不玩什么推土机。

不过当年AMD为了提升竞争力,这些东西卖的相比友商来说也比较便宜,而且在收购了ATI以后也有了GPU技术,它也愿意去给客户做定制,这个失败架构的改进版还是被Xbox One和PS4采用,毕竟游戏机有自己的API,可以优化这方面的问题,个人感觉要不是当年AMD攀上了索尼和微软两个大客户,以及苏妈厉害的领导能力,后面我们可能就见不到Ryzen了,参考曾经的3DFX的Rampage。

失败乃成功之母,AMD在推土机那一代确实是玩脱了,提到推土机,绝大多数人只会喊AMD NO,AMD要倒闭了之类的,可推土机失败以后AMD再次卧薪尝胆,终于在2017年带着Ryzen卷土重来,让广大消费者用上了平民化的高性能六核心甚至八核心CPU,虽说这个核心数在现在看来不算是很多,但2017年那会英特尔推出的i7 7700k还是破四核呢,你想要六核和八核就得买旗舰平台的6800K和6900K,而X99的板U在当时却不是一般人能玩得起的,AMD的崛起也让英特尔在八代将8700K提升至六核,九代9900K提升至八核,让人喊起了AMD YES。

锐龙的成功则证明了AMD在推土机时代就想到的模块化设计是没有问题的,在锐龙这一代被传承了下去,变成了CCX和CCD,重点在于当年推土机赌错了,所做的那几种猜想没有一个是赌对了的,把不该砍的东西砍掉了,而锐龙就避开了这个曾经踩过的坑,比如Zen架构中一个CCX模块中有四个核心,每个核心拥有自己独立的L1和L2缓存,一个CCX模块共享对应的三级缓存,每个核心都是满血的核心,CPU核心与超线程都可以自由的关闭和开启。

这种模块化设计给了Ryzen很大的自由度,比如说可以轻松堆砌核心,就比如说Zen2这一代从入门级四核的R3 3100到16核的R9 3950X,再到64核的性能怪兽3990X,正是因为这种模块化设计才能做到,就可以轻松完成产品从低端到高端的全面部署。

虽说Zen架构的推出,总算是让AMD从泥坑里爬出来了,不过初代Ryzen与友商的产品相比,在很多游戏与专业软件中确实差了些意思,Zen和Zen+采用的格罗方德14nm和12nm工艺,在高频性能方面并不是很好,内存兼容性有很多问题。

而且这两代的浮点性能相比Zen2来说是有很大差距的,比如说AVX2指令集,Zen和Zen+虽然表面上看起来已经得到了支持,但只是能运行那些针对AVX2优化的程序,并不代表效率就一定高,因为它们的浮点单元依然还是128bit,这也就意味着它们只能使用128bit的运算器去运算256bit的AVX2指令,就导致了效率的低下。

而Zen2采用了台积电7nm工艺,能耗比提升了不少,也补齐了AVX2这块困扰了AMD很多年的短板,而且还改进了缓存方面的性能以及缓存的大小,使得Zen2这一代即便拿来玩游戏和做针对AVX2指令集优化的生产力,不再像过去存在非常大的性能瓶颈了,这使得索尼和微软再次找上了AMD,为他们的下一代游戏机定制采用Zen2架构的芯片。

G胖这边也是同样,Steam Deck的CPU同样采用了Zen2的架构,虽然看上去性能不是很强,但考虑到SD是一个掌机,掌机对续航和功耗方面是非常敏感的,如果这个机器整个SOC只能给15W的话,那么上更大规模更高主频的CPU也没什么意义。

而且核心数和三级缓存的增加,也会带来功耗和发热的问题,参考英特尔曾经七代到八代酷睿的笔记本低压U,例如i5 8250U虽然相比上一代i5 7200U增加了两个核心,主频也有提升,但架构依然还是旧架构,工艺还依然是14nm,显然是需要更高的功耗才能喂饱的,关于温度墙和功耗墙对性能产生影响的问题,以前我也说过,比如有些8250U的机器如果厂商给的功耗很少,只有15W的话,那它的性能可能并不会有理论上那么强,高负载下降频会非常明显,尤其是核显与CPU都有很多占用的情况下,造成了核心多主频低,像TDP配置仅有7.5W的8250U,实际体验甚至可能还不如25W的7200U。

像AMD这边增加了三级缓存的3D版处理器也是如此,例如5800X3D相比普通的5800X发热和功耗就要大不少,台式机这边有很好的供电和散热解决方案的话倒还好说,但笔记本和移动端就不太适合了,我记得之前在贴吧看到过有个将5800X3D装在蓝天NH55VR上用,结果后面说发热太大,风冷感觉压不住就放弃了。

那么关于这颗CPU的解析就到这里了,性能测试的话我也会放在后面,究竟是骡子是马,牵出来溜溜就知道嘛。

GPU部分

这颗APU虽然在CPU部分没有太大亮点,但GPU部分就有点意思了,它搭载了RDNA2架构的核显,与同代Zen2搭载的Vega核显有很大差别,在开始解析这颗GPU之前,我们也先来聊聊关于这几年A卡的那些事吧。

自从2006年AMD收购了ATI,英特尔那边开始了钟摆计划,英伟达也同样开始发力后,AMD的日子就不是很好过了,新产品的失败,加上之前是高价收购的ATI,就导致AMD并没有太多资金去投入新架构的研发。

就比如说A卡在ATI时期的时候,至少每一代都有比较大的变化,比如说ATI以前的R100芯片就首次支持了硬件T&L和DX7,R200芯片支持了SM1.0和DX8,R300就不多解释了,它不光首次支持了SM2.0与DX9.0,更是创造了当年的传奇神卡Radeon 9700 PRO和平民之神9550的神话。

虽说从R400开始,ATI逐渐开始走下坡路,R400虽然没有支持DX9.0c,但它至少在规模上是可以跟上对手的,R520和R580也支持了DX9.0c与改进了SIMD,虽说这几款芯片的表现有点差强人意,但远未到令ATI的竞争力严重受损,且让公司到不堪重负的地步。

直到ATI被AMD收购以后,A卡就没有再次重复当年9700PRO大幅领先竞争对手的情况了,从那时候开始,A卡大多数还是在旧架构上修修补补为主,就比如说从2005年ATI与微软合作开发的Xbox 360 GPU,就用上了TeraScale架构,从后面推出的TeraScale2和TeraScale3,再到后面的GCN架构,是不是感觉后面A卡的架构看上去比较单一呢?

而英伟达这边从2006年开始,虽然也推出过不少旧架构的改进版,比如说像Tesla,Tesla2.0,Fermi,Fermi2.0,Kepler,Kepler2.0,Maxwell,Maxwell2.0,可自从Pascal开始,老黄这边每一代的架构就变化比较大了,不再简单的在旧架构上修修补补,比如说Volta架构首次引入了用于深度学习的Tensor Core,Turing首次支持了硬件级光线追踪,支持了微软DX12U的标准,后面的Ampere和Ada Lovelace架构,同样也带来了非常大的性能提升,而且每一代各种相应技术也在变化,比如说老黄自家的CUDA,NVENC,Tensor Core每一代都会带来新的功能,核心规模也越来越恐怖,比如目前最新的Ada架构的AD102核心,就有763亿的晶体管。

不过考虑到当时AMD是勒紧裤腰带过日子,为了生存卖掉了好多家当,例如把自家晶圆厂卖掉成立了格罗方德,把移动GPU技术卖给了高通,甚至把自家办公的大楼都卖了,也没有办法,说实话感觉AMD能在之前的逆境中活下来,并能卷土重来也非常不错了。

这里来说说A卡的GCN架构,这个架构从2011年的HD7970,到2019年的Radeon VII,甚至2021年核心代号Cezanne和Lucienne的APU,也就是5700G和5700U采用的核显,依然还是GCN的架构,个人感觉是非常厉害了,这个架构凭借自己的传奇书写了十年的A卡历史啊,可谓解释了什么叫十年磨一剑,生产工艺从28nm到7nm,架构从GCN1.0到GCN5.1,DirectX从DX11.1逐渐支持到DX12.1,竞争对手那边从开普勒一直熬到了图灵,可谓是极为先进了。

我记得最早HD7970是对位GTX680,7990对位690,在RDNA架构还没出来之前就是R7对位2080,Vega64对位2070,Vega56对位2060,那会Vega两到三千就能买到,而且三星显存的56,还能刷64的BIOS,后面体质好的海力士貌似也可以,有些甚至还能刷专业卡的BIOS,并可以得到专业驱动的优化与使用部分专业卡的功能,比如说3D显示模式,全局10bit输出,甚至显存ECC,也还是有很多可玩性的,这也能看出AMD在设计Vega的时候是希望它做为一个全能型的架构,下到核显上到高性能游戏卡,甚至做为专业卡与计算卡,比如说Instinct MI25和MI50,就是Vega64与R7相同Vega10和Vega20核心的改进版,当年有段时间R7的价格也降到了三千多,好像是希仕的卡比较多,可惜当时我个人没入手一张,主要是当时有64了,就没太多动力买VII。

像Vega这一代虽然还是GCN架构的升级版,但它相比旧架构还是有一些改进的,比如说支持了DX12.1,补充了旧架构中不支持的保守光栅化与光栅顺序视图,而且保守光栅化支持到了Tier3,第三级别保守光栅化的好处最明显的就是遮挡剔除,可以不再渲染视野范围内看不到的物体,减少硬件资源浪费并提高游戏性能。

Vega还有一个进步是内存寻址,在DX12的进程虚拟寻址和资源虚拟寻址方面,都从原来旧架构的40bit,提升至了44bit。

但是从N卡的帕斯卡架构开始,我们就能感受到A卡GCN架构的行将就木,这也就意味着AMD必须要研发出一个能与老黄抗衡的新架构,不能继续在旧架构上修修补补了,否则在接下来的显卡大战中,将会很快败下阵来。

在2019年7月,AMD终于换掉了桌面端显卡的GCN架构,推出了基于RDNA架构的RX5000系显卡,虽然这一代并不支持光追,也不支持DX12U的新技术,但架构上还是有非常明显的进步的,例如RDNA是一个重新设计的新架构,并不是之前GCN架构的升级版,例如它对计算单元进行了重新设计,每个计算单元的标量解码,矢量解码和发射单元,调度器的数量都翻了一倍,矢量单元的结构也有变化,例如从四组SIMD16和四组SIMD4,变成了两组SIMD32和两组SIMD8,各种改进使得SIMD的算术逻辑单元的利用率更高,并改进了缓存效率,强调了多级缓存的一致性。

而且AMD这次再次使用小核心的战术,再次让我们看到了下一代完整大核心的希望,就比如说与Vega那一代同样是对位对手的中高端显卡,Vega是拿完整核心去打对手中等规模的核心,北极星则是拿中等核心,去对位对手甜品甚至低端的核心了,而RDNA1则是拿同样是中等规模的核心去与对手对决。

性能方面对比自家上一代的话,RX5700与Vega64风冷版相当,5700XT则超越了Vega64水冷版,在低分辨率下甚至还与R7差距不是很大,这也让很多人看到A卡再次崛起的希望。

到2020年老黄又推出了安培架构,相比上一代有了很大的性能进步,比如说做为RTX30系中定位中等的3070,是可以与上一代旗舰2080Ti旗鼓相当的,这就让人感到AMD恐怕不行了,毕竟RDNA1最多只能打对手TU106和TU104这种定位甜品到中等核心的样子,RDNA2旗舰能打得过对手的GA104吗?

结果AMD却在RDNA2交出了让很多人满意的答卷,它不仅补齐了之前一直缺席的光线追踪,也补齐了DX12U的短板,虽然AMD这一代光追确实不太行,但光栅方面RX6900XT可以摸到3080Ti甚至3090的话,个人感觉也是非常不错了,你想A卡好久都没有推出能与N卡旗舰扳手腕的产品了,就比如以前RX580只能打GTX1060,Vega64只能打GTX1080,与1080Ti还是有很大差距,真的是让人失望啊,当年我买的就是这两张A卡。

RDNA2这一代的进步,让大多数人都震惊了,这也让微软和索尼决定让AMD为它们的游戏机定制RDNA2架构的GPU,Zen2+RDNA2的组合,也是这一代主机的标配了,虽然现在看来是有些落后,并不是最新的架构,但相比旧架构来说进步确实是非常明显了。

这里我个人还想说说AMD收购ATI的原因,当时AMD就是希望可以将GPU和CPU融合为一体,做出名为Fusion APU的产品,甚至有让APU取代独立CPU和GPU的想法,结果当然是不可能的了,至少现阶段是这样,你想老黄当年发明了GPU,正是希望将复杂的3D处理,甚至更多的其他运算转移到上面,让CPU和GPU各司其职,做自己擅长的任务,而AMD这样做的话,岂不是又回去了?你看现在GPU越来越复杂,像老黄的Hopper架构的GH100核心来到了800亿的晶体管,即便用上了台积电4nm的工艺,核心尺寸还依然有814mm²呢。

虽然这种巨大规模的计算卡和我们消费者没什么关系,但也说明了一般的CPU由于空间有限,就不能像主机的定制APU做一个大核心,因此它集成的GPU规模一般很有限,加上它需要占用电脑上宝贵的内存资源作为显存,而且对内存的频率,双通道是有要求的,在不满足这些要求的情况下,内存带宽将受到很大的制约,这将严重影响核显的性能,还有诸多原因导致APU在桌面端一直以来都不温不火,性价比方面的话,也没有到非买不可的想法。

个人认为APU最大的受益者还是游戏机,并不是普通电脑,比如Xbox和PS的定制APU,是直接拿大容量高位宽的GDDR显存做为内存的,而且它们搭载的系统并不像Windows那样需要占用大量内存,就不像一般的低配电脑内存资源非常宝贵,而且高性能核显还会占用CPU的内部空间与总线,可能使其PCIe通道,缓存方面受到影响,比如说有些APU仅支持8条PCIe通道,三级缓存会比较小,像台式机解决图形问题最好的办法,依然还是装一张显卡,并不是非常值得上APU,除非是显卡非常贵的时候。

不过APU的出现,还是使得AMD可以在游戏机定制芯片方面叱诧风云,可以在高性能核显市场分得更多一杯羹,也同样惊动了英特尔提升自家核显的性能,就比如说五代的i7 5775C就集成了48EU的Iris Pro 6200核显,并搭载有专门的eRAM做为这个核显的显存,在Skylake这一代虽然HD530核显比较弱鸡,但这只是GT2系列的产品,像Skylake GT4e的Iris Pro P580就搭载了72EU,规模是GT2系列24EU的三倍,不过这种核显比较冷门,只有像E3 1578L V5和1585 V5才搭载这种核显,到后面Ice Lake和Tiger Lake这两代移动端CPU搭载的核显,也是飞速进步,其中Xe 96EU的核显,甚至可以与AMD这边的Vega8扳手腕了。

像之前Vega核显我没什么兴趣的原因,主要是我用过完整核心的Vega64,AMD在核显那边也用Vega挤了很久的牙膏,因此就不太看得上了,前两年将Vega64卖掉以后,我转战笔记本后很久没用A卡了,现在680M核显的机器目前我也买不起,660M说实话不太看得上,如今在SD用上了新架构的RDNA2核显,就来看看它的规格怎么样吧,说实话我还是比较期待的。

回归原题,SD的这颗APU搭载了一颗RDNA2 8CU的核显,这个规模有桌面端RDNA2完整核心6900XT的十分之一,也有入门级6500XT独显的二分之一,在核显里则定位中规中矩,比如说660M核显是6CU,680M核显是12CU。

这颗GPU的名字是AMD Custom GPU 0405,同样是型号为0405的定制版,并不是公版的芯片,核心代号为Van Gogh,应该是致敬荷兰后印象派画家梵高,采用了台积电7nm的工艺,核心尺寸为163mm²,拥有24亿个晶体管,基础频率为1000MHz,最大频率1600MHz,与CPU共享15W的功耗墙。

显存方面使用板载的LPDDR5内存做为显存,显存频率1375MHz,等效频率5500MHz,可以带来峰值88GB/s的内存带宽,显存大小则由BIOS的设置决定,这台机器的BIOS默认为这个核显分配了1G的专用显存,在有些游戏中如果出现兼容性问题,例如提示显存不够的话,我们也可以在BIOS中设置更大的显存大小。

它的光栅单元为16个,RDNA2架构的一个计算单元对应4个纹理单元和64个流处理器,因此它拥有512个流处理器和32个纹理单元。

另外RDNA2首次支持了硬件光线追踪,其中每个计算单元配备1个光线追踪核心,这个核显是8个计算单元,所以负责光线追踪的RT Core为8个。

缓存方面它的L0和L1缓存,则和所有的RDNA2架构的GPU一样,其中WGP(全称Work Group Processor,工作组处理器)配备了32KB的L0缓存,GPU的图形阵列部分,配备了128KB的L1缓存,这里可能表达的不太准确,麻烦大佬们指出。

L2缓存的话为1M,虽然相比660M和680的2M少了一点,但它拥有8M的三级缓存,也就是AMD称之为Infinity Cache的技术,这个是一般核显没有的。

关于这项技术的话,这个我们简单理解成GPU的三级缓存就可以了,我们考过计算机二级的话,应该做过有道题,解决处理器与主存之间速度不匹配的方法是什么?

答案就是在主存储器和CPU之间增加高速缓冲存储器,关于这个东西在实际应用的话,AMD也是在这方面试水成功后大力推进的,比如基于3D V-Cache技术的缓存加大版CPU,还有RDNA2开始增加L3缓存的GPU,毕竟GPU本质上也是处理器,只是专门处理图形方面的任务罢了。

就比如说RDNA2这一代桌面端显卡,我们就可以看出这代A卡对显存带宽的需求比较小,例如6900XT的显存带宽只有512GB/s,要知道上代5700XT的显存带宽就有448GB/s了,而6900XT的核心规模也是5700XT的两倍了,晶体管数量更是从103亿增长到了268亿,既然核心规模与性能提升这么大,这么点显存带宽当然是不够使用的,这就要归功于RDNA2新引入的Infinity Cache了,英伟达那边的话,在Ada架构同样也遇到了显存带宽的瓶颈,也同样也是增加缓存来解决问题的,不过RTX40系增加的是L2缓存,不像A卡这边是增加L3缓存,但是增加缓存确实可以减少GPU所需的显存带宽,这些案例就告诉我们了那道题的答案。

而SteamDeck这颗定制APU配备了8M的三级缓存,我认为是非常不错的,虽然它搭配的内存频率只有5500MHz,是比不过那些搭载6400MHz内存频率的机器的,但目前由于CPU支持的最大内存频率有限,显存带宽将会是一个很严重的瓶颈,通过增加缓存来解决这个问题,或许是更好的解决方案,而一般核显的话由于受限于空间的问题,因此就不太好加缓存了。

图形API的话,DirectX它支持D3D12 feature level 12_2,也就是DX12 Ultimate,虽然GPU-Z显示只支持DX12.1,但它是可以支持DX12.2的,在DirectX诊断工具和Xbox Game Bar设置中的游戏功能里,均显示可以支持DX12旗舰版。

这样的话它应该可以支持目前最新的Shader Model 6.7,虽然现在稳定版的Win11还只支持SM6.6,但SM6.7在去年8月就已经出了,目前应该要预览版的Windows才能用上,我记得只要能完整支持DX12U的显卡,一般都可以支持SM6.7的。

这里要注意如果你安装的是Win10,虽然也可以支持DX12U,不过是以枚举的形式调用的,而且太老版本的系统还不行,必须要Win10 2004以上的版本才能支持,Win11才是在功能上的完整支持,Win10下可能最大只支持SM6.5,DirectX版本依然显示只支持DX12.1,至于会不会对性能产生影响的话,个人就不太清楚了。

驱动程序模型的话,它虽然可以支持WDDM3.1,但并不支持Windows的硬件加速GPU计划。

OpenGL它可以支持OpenGL4.6,Vulkan可以支持1.3,由于这个机器在设计的时候是搭载SteamOS系统,主要是靠DXVK跑Vulkan为主,这里来简单介绍一下Vulkan吧。

Vulkan和OpenGL都是由Khronos Group开发的,其中Vulkan是做为OpenGL的继任者出现的底层API,它的目的是在效率方面超过OpenGL,提供更低的运行开销,更直接的GPU控制,并降低CPU的负担。

在开发者方面,OpenGL使用的着色器语言是GLSL,GLSL常用于3D实时渲染的高级特效编写的着色器,使用C语言作为基础高阶着色语言,这还是迫使OpenGL的驱动必须为了GLSL运行自己的编译器,将运行的程序转译成目标平台的可执行代码。

而Vulkan提供了SPIR-V,也就是轻量化标准中间件的二进制中间层格式,相比GLSL来说更简单,更常规,它可以减轻硬件方面的负担,着色器可以被预编译,并允许开发者使用GLSL以外的语言来编写着色器,例如基于OpenGL ES的GLSL变体ESSL,DirectX的HLSL,OpenCL-C等多种API。

至于DirectX关于那些DX12U新技术的话,这个对于我们普通人来说太硬核了,这篇专栏里我就不再多介绍了,当你去了解这些东西之后,你就知道DX12这玩意对开发者水平是要求非常高的,只有水平高的开发人员,才能用DX12做出效率高的游戏,很多技术并不是几句话就能随便解释清楚的,想要解释清楚必须查阅大量的资料以论文的形式写出来,而且要有C++和HLSL的编程技术才能搞懂。

就比如说关于光线追踪吧,这只是DXR光线追踪资料的其中一小部分内容,我们做为外行可以说是根本看不懂。

这些资料来源于微软在Github上发布的关于DirectX功能的工程规范,如果感兴趣的话就自己去看吧。

https://github.com/microsoft/DirectX-Specs

我只能大致理解像光线追踪那里,RAYTRACING_TIER在D3D12中是一个枚举类型,用于指示GPU所支持的光线追踪级别,比如不支持光追的常量值为0,支持DXR1.0的话,常量值为10,支持DXR1.1的话,常量值为11。

其中RAYTRACING_TIER_NOT_SUPPORTED表示设备不支持光线跟踪,尝试创建任何光线跟踪相关对象都将失败,如果在命令列表中使用光线跟踪相关API,将会导致未定义的行为,这种情况适用于不支持DXR的GPU。

RAYTRACING_TIER_1_0表示设备支持DXR1.0规范中描述的全部光线跟踪功能,但在较高层中添加的新功能就不支持,这种情况适用于支持DXR1.0的GPU,比如说N卡的GTX10系,GTX16系和Volta架构,它们虽然没有硬件光线追踪单元,但还是可以支持DXR1.0的,比如说就可以使用SHADER和CUDA来跑光追,不过效率方面感觉就只有Volta靠谱一些了,毕竟Volta有非常强大的算力,规模方面也比较庞大,例如GV100核心有211亿的晶体管,就要比图灵TU102最大186亿的晶体管多了很多,更是帕斯卡GP102(118亿)的大约1.8倍,像以前的TITAN V,我记得有评测说可以在战地5里打开光追。

RAYTRACING_TIER_1_1则表示设备支持DXR1.1,相比DXR1.0增加了更多功能,具体是什么就自己翻译吧,这些做为术语感觉我翻译不了,也完全搞不懂,总之这些符合DXR1.1规范的GPU,另外我记得有传闻说GPU必须要有硬件光线追踪单元,才可以支持DXR1.1,比如说NV的图灵,AMD的RDNA2以上的架构,还有英特尔Gen12.7架构的ARC独显可以支持。

说实话个人感觉目前光线追踪看来还是有些鸡肋,虽然它确实是好技术,但对硬件的要求比较高,需要大量的GPU算力才能完成,像有些光追效果比较复杂的游戏,在打开光追后就会导致游戏帧数出现巨大的下降,说实话在连最基本的流畅度都达不到的情况下,画质和流畅度我更愿意选择后者,换句话说就是现在市面上主流的GPU的性能还不够格,并不是所有人都买得起光追高端卡和旗舰卡的,这就导致光追虽然很早就出现了,但直到现在还是没有普及。

虽说RDNA2的核显也可以支持光追,但这个规模也只是图一乐罢了,感觉用处应该也就截个图吧,就连RDNA2和RDNA3的高端卡,目前跑光追都不太有什么优势,在那个游戏的光追对N卡有优化,且支持DLSS的情况下,就很难打过对手了,而且低端卡想要在高分辨率下玩光追,就是个笑话,再加上各种原因就导致光追目前只能做为光栅化的搭档,还不能做为替代品。

这样就需要提升GPU性能,以及改善RT Core的效率,或者使用另辟蹊径的方式,例如在其他方面,减少游戏对显卡资源的占用,像英伟达推出的DLSS,微软在DX12U中引入了这些提升性能的技术,便是弥补开启光追后所带来的性能损失,个人也期待未来光追可以逐渐成熟吧,让我们可以玩上画面更加精美的游戏。

话说银河破裂者这个游戏,这个游戏支持VRS和光追,它允许玩家制作MOD,内部文件是直接以Zip打包的,我们可以查看里面的资源并制作模组,其中也包含很多源代码,像光线追踪的代码就有AMD的Copyright,应该是A卡优化的。

我就说为啥我拿N卡开启光追玩这游戏,有时候会有点蜜汁卡顿的感觉呢,这锅得让AMD来背(滑稽)

开个玩笑,后面的话我也想在这个掌机上跑一下这个游戏,毕竟这个游戏是应该算是A卡优化的游戏,我个人也比较喜欢。

废话说了那么多,我们做为臭打游戏最关心的并不是那些硬核的东西,当然还是性能了是吧?

不过在性能方面的话,这颗GPU理论性能并不算是很强,虽然它用上了RDNA2的新架构,但是频率却比一般的RDNA2低了很多。

就比如说几年前我们刚刚听说索尼PS5定制的那颗APU的频率,可以跑到2233MHz,大多数人都以为这是超冒烟了呢,结果RDNA2确实可以跑到这么高的频率,就连核显也是同样。

拿680M核显来举例的话,6800U搭载的核显可以跑到2200MHz,6900HX搭载的核显可以跑到2400MHz,就连更低一级的660M核显,6600U搭载的核显也能跑到1900MHz,显然是要比这颗定制APU的最大1600MHz的频率高不少。

而核心频率越高,也就意味着GPU理论上的算力,像素填充率和纹理填充率更强。

SD这颗GPU在1600MHz的情况下,理论上可以带来25.6GPixel/s的峰值像素填充率,51.2GTexel/s的峰值纹理填充率。

峰值算力方面的话,它的FP16算力为3.277TFLOPS,FP32的算力为1.638TFLOPS,FP64的算力为102.4GFLOPS(RDNA2架构的FP16比例为FP32的2:1,FP64为1:16)

虽说理论性能并不一定代表实际的游戏性能,但同代GPU的话还是有一定可比性的,说实话这个理论性能还是远不如680M核显的。

比如像6800U搭载频率为2200MHz的680M核显,它的峰值像素填充率可以达到70.4GPixel/s,峰值纹理填充率可以达到105.6GTexel/s,FP32算力可以达到3.379TFLOPS,感觉光从参数上看的话,680M是不是比SD的这颗GPU强很多啊?

造成这种情况的原因,除了680M核显的12CU本身就要比SD的8CU要多以外,光栅单元680M也翻了一倍,从16个增加到32个,纹理单元也从32个增加到48个,最主要的还是核心频率方面的原因,SD的GPU的核心频率还是比680M低不少,甚至还不如660M,就导致它的理论性能看上去并不算是很强。

不过我们也不用太过焦虑,频率方面也并不是越高越好,首先带来的是功耗问题,还是拿这两代主机举例,比如说PS5是采用小核心走高频率的道路,而Xbox是采用大核心走低频率的道路,像PS5的GPU由于规模小一些,只有36CU,因此就可以给更高的频率,将算力达到10.29TFLOPS,但是Xbox Series X的GPU由于规模比较大,有52CU(有传闻说这其实是一颗56CU的芯片,是因良品率考虑,屏蔽掉了4组CU),因此它的频率只有1825MHz,将算力提升至12.15TFLOPS,它的最大功耗也来到了200W,虽然比起PS5的180W要高一些,但算力方面提升了不少,毕竟规模上比PS5大了很多。

像这些主机倒是不用太担心功耗问题,因为它们都是插电使用的,而SD做为一款需要经常脱离电源使用电池的掌机,因此对功耗是非常敏感的,要让GPU跑那么高的频率,显然是需要更多功耗的,这就导致电池不一定能吃得消,还会给机器带来发热和续航方面的影响,而且在功耗墙的限制下,也同样会严重影响性能,若6800U的机器整个CPU的功耗只给15W的话,680M的核显显然也跑不到这么高频率的,CPU方面也可能会造成核心多主频低的问题。

而且还有个问题是显存带宽的问题,你GPU性能再强,可显存跟不上的话也没有用啊,这也就意味着680M如果搭配了低频内存,它的核心频率与性能提升就并不一定是线性的,甚至它即便用上了LPDDR5 6400Mhz的内存,也不一定能完全发挥出所有的水平。

而SD这颗GPU从客观方面来说的话,我个人感觉是比较平衡的,因为它做为一台掌机使用的芯片,首先要考虑的是功耗问题,它并没有把频率定那么高,搭载的内存频率虽然低一些,但GPU在L3缓存做为有弥补,而且Zen2并不适合上高频内存,这个后面我会细说,因此综合评定这颗APU的设计,对于这台掌机来说还是比较合理的。

说了那么多都不试一下,怎么知道这颗GPU性能到底如何呢?不要着急,下一篇专栏我会带来这颗APU在Windows系统下的性能测试。

不过这里还是先带来一个坏消息,就是这个核显在Win系统下可能不支持OpenCL与DXVA视频硬件加速,GPU-Z检测这两个东西都是不支持的,主界面中OpenCL那里也没有显示支持,这也就意味着这个核显你要拿它编码视频,或者用PR这类支持OpenCL加速的软件,可能会不支持GPU加速,就只能让CPU来跑,具体会不会有影响,后面我也会做个简单测试。

Resizable BAR也同样不支持,我记得这个在AMD那边被称为SAM,也需要在BIOS中开启相关功能,不知道是不是要RDNA2独显才可以支持这个。

而且这颗定制APU的驱动在Windows系统下还是有一些问题,例如并没有AMD的驱动控制面板,前面GPU-Z里显示这是Beta版的驱动,在DirectX诊断工具里,也显示这版驱动未经数字签名,之前我试了一下应该还是需要使用专属驱动,不能使用AMD公版的最新驱动,这可能也还是会有一些麻烦。

毕竟A卡的驱动更新是非常重要的,做为一个曾经用了半年的RX580,两年多的Vega64,当时A卡让我喜欢的就是它性价比和可玩性还行,但让我怕的就是那糟糕的驱动,有时候电脑上存着两个甚至三个版本的驱动,也是家常便饭了。

感觉这玩意要用专属驱动的话也正常,像有些定制版的A卡,就确实要用专属驱动,例如AMD给苹果定制的显卡,在Windows下就需要用Apple Boot Camp的驱动,不能使用公版的驱动。

内存篇

关于这台机器搭载的内存已经有很明显的参数了,它搭载的是16G LPDDR5 5500MHz的内存,单个内存颗粒的位宽为32bit,四颗内存构成了128bit的位宽,我这台机器的内存来自镁光,在上一篇拆机换硬盘的时候也提到过。

有人可能会觉得这个5500的频率会不会小了些?毕竟有些Win掌机都搭配6400频率的内存了,而核显对于内存频率的要求是比较高的,这样会不会影响性能?

我个人认为不需要太焦虑,毕竟这颗APU搭载了8M的三级缓存,可以在一定程度上降低核显对显存带宽的需求。

而且AMD的CPU这边,并不是内存频率越高越好的,尤其是Zen2架构,虽说高频内存确实可以对Ryzen的游戏表现有明显的提升,但实际上我们在玩过台式机这边Zen2的话,就知道Zen2有一个最佳频率,台式机这边的Zen2最适合的内存频率,一般就是3600到3733,像有些体质比较好的,一般也就3800到顶了,更高的内存频率虽然也可以支持,但反而会出现开倒车的情况,这是什么情况呢?为什么Zen2既然可以支持更高频率的内存,但却存在最佳频率上限这个说法呢?

首先我们知道台式机这边的Zen2是由两个CCD和一个CLOD组成的,其中一个CCD包含两组CCX,一个CCX中包含四个CPU核心,CLOD中则包含UMC内存控制器,它们之间是使用Infinity Fabric,简称为IF总线进行连接,我们知道内存是要与CPU核心沟通并交换数据的,因此内存就需要先经过CPU里面的UMC,再经过IF总线,最后再到CCX中的核心,因此内存控制器则很大程度上决定了CPU内存频率的上限。

说到这个其实也能解释以前为什么我上手蓝天NH55AF的时候,发现3700X的内存写入性能比较低,原因正是3700X是3950X规格砍半的产物,它只有一组CCD,因此内存写入只有读取的一半很正常,要两组CCD的CPU,例如3900X和3950X,就不会有这种情况,后面给那个笔记本搞个3950X玩玩吧。

虽说Zen2内存控制器体质不错,可以支持比较高的内存频率,但这只是到CLOD的第一步,接着就需要通过IF总线到CCD那边,而这个IF总线是存在时钟频率的,这一代IF总线的频率被称为FCLK,而这一代FCLK的体质上限一般在1866左右,等效3733的内存频率,而如果内存频率超过了FCLK的体质,就会导致内存以1:2模式分频运行,例如你上了4800MHz的内存,而FCLK达不到2400MHz频率的话,就会以二分之一的比例降频到1200MHz运行,这也就意味着虽然内存频率上去了,但FCLK这边体质跟不上,让它降频去运行的话,反而会影响性能,因此Zen2在内存方面最好还是不要分频,还是以1:1的模式最好,像我那颗3700X因为体质比较差,又是装笔记本里面用,就懒得超频使用了,后面都是默频3200的内存使用。

而移动端使用的LPDDR5内存,这种内存的频率一般比较高,而且要分频才能稳定运行,时序和延迟可能比较高,成绩上相比台式机那些低时序的内存来说,可能就不太好看,之前我测试英特尔那边搭载LPDDR4x的机器,还有骁龙845的手机装上Win11的ARM版都是如此,尤其是延迟方面的表现,就比较拉跨了。

虽然AMD的移动端可能不一定存在这种情况,但是这个机器之前我随便跑了一下AIDA64内存与缓存测试,其表现却还是让我失望了的,估计可能是和这个有关,关于内存性能测试的话,我会在下一篇专栏中放出。

网卡篇

这台机器搭载无线网卡型号为瑞昱的8822CE,支持蓝牙5.1,其中LMP10代表蓝牙5.1的版本,但WiFi方面只支持802.11ac,也就是WiFi5的协议,而不支持802.11ax,也就是WiFi6,是有些可惜。

例如WiFi5最大传输速率为3.5Gbps,而WiFi6最高速率可以达到9.6Gbps。WiFi5只涉及5Ghz频段,这也就意味着在160MHz的频宽下,它的最大单流带宽只能达到867Mbps每秒,想要让WiFi跑满千兆,则必须要WiFi6,除了要路由器支持以外,还要机器网卡支持,但这个机器的网卡我个人感觉还是差了一些,在高性能的网络使用方面可能会出现瓶颈。

屏幕篇

关于这块屏幕的话,它的型号是ANX7530 U,目前我在网上还没有找到这块屏幕的相关资料,虽然系统里显示它支持1280x800的横向分辨率,不过从刚开始装系统是竖屏的情况来看,它应该是一块原生是竖屏的屏幕,像以前国产Win掌机所搭载的低分屏,大多数也是这种情况,让我们来测试一下这块屏幕究竟如何吧。

像一般的工具检测结果不一定准确,这个不专业的色域检测工具,也无法检测出色域,因此就需要上校色仪了。

我这边用的是红蜘蛛SpyderX Elite校色仪,并搭载自带软件SpyderXElite测试的,后面玩SteamOS的话我想再试试DisplayCAL,记得那个软件是有支持Arch Linux版的。

在对屏幕进行测试和校色之前,同样是在关机状态下先将屏幕清洁干净,开机后将亮度调到最高,预热半小时以上,在开始校色前,将亮度调整到自己感到舒适的程度。

个人经验不足,并没有受过专业培训,平常也不怎么折腾这个,可能会出现各种因素导致测试结果出现误差或者完全不准确,这些结果仅供参考。

其中色域方面的话,这块屏幕的sRGB覆盖率为71%,NTSC色域为50%,AdobeRGB和P3的色域均为52%,说实话这块屏就是一块低色域的屏,上手的时候我主观感觉这玩意的色域应该不怎么样,实测也确实如此。

不过这也就是个打游戏的设备,又不拿它修图或者剪视频,如果你对色域方面要求不高的话也没什么,但你对这方面有要求的话就另说了,我个人更喜欢高色域的屏。

亮度方面的话,这块屏的亮度还行,峰值亮度有639尼特。

屏幕均匀性这里也不知道测的准不准,毕竟这个机器的屏幕小,校色仪的镜头就不好对准。

关于这块屏的色准方面的话,使用Spyder的48组颜色来测试的话,它的最小DeltaE为0.29,平均值为1.27,最大值为7.68,虽然这个成绩看上去也不算是色准非常好的屏,但我觉得算是可以了,没有想象的那么差。

校色完成后,我们再使用DisplayCAL加载这个配置文件,再测试一下色准,校色后它的最小DeltaE为0.2,平均值为0.83,最大值为6.72,也算是有了一些进步。

个人认为这块屏的优点是亮度非常高,峰值亮度远超官方宣传的400尼特了,这也就意味着在外面的阳光下玩,将亮度调高也可以看得清,在色域方面虽然不太行,但色准方面还是可以的,做为一个打游戏的设备来说也够用了。

那么关于这台机器的一些硬件解析就到这里了,下一篇专栏我会在Windows系统下对这台机器进行一些性能测试。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3