“如何测试显卡瓶颈“如何测试显卡算力…

2020年注定是不平凡的一年，越来越多的人用视频记录下自己的生活，这也让原本就非常火爆的短视频的数量呈爆炸式的增长。视频剪辑不再成为一个小众需求，而是逐渐大众化了，每个人都想通过视频这张形式留下我们自己的回忆，我也不例外。但工欲善其事，必先利其器。为了提高视频的产出的效率，我必须尽可能的缩减与视频创作无关的时间成本，这里面最大的成本其实就是后期导出。

用CPU渲染视频的时代已经过去了，我知道现在的显卡在视频剪辑中可以提供非常大的助力，这个时候一张好显卡的重要性就体现出来了。为了搞明白主流市场上到底哪张显卡更适合视频生产力的创作，我选择了NVIDIA家的主力显卡RTX 3080、RTX 3070以及AMD的RX 6800 XT、RX 6800共计四张显卡进行横向对比测试，看看单纯的从视频内容创作而言到底哪张显卡是最合适的、最值得购买的。

在本次的测试之前，可以先简单看一下N/A两家最新一代显卡架构针对视频渲染软件的优化。

Ampere架构下的RTX Studio

NVIDIA这次RTX 30系列GPU在生产力方面做出了非常多的优化，相比RTX 20系列显卡进步明显，这部分我已经讲解过多次，这里不再赘述。如果你想仔细了解这一步的内容，可以点击这个链接查看。

NVENC加入到PRemiere Pro工作流

在Premiere Pro的视频制作工作流当中，主要分为了原始素材导入、剪辑与添加效果，以及最后的成片导出三个主要阶段，对于硬件来说，在第一阶段的素材导入时，目前主要是利用CPU来进行解码（decode）工作的，而到了第二阶段的视频剪辑过程，处理这些操作的仍然主要是CPU，但如今的视频制作不仅仅是对素材进行简单的修剪、拼接，还会有各种转场、字幕、调色、颗粒化等等进阶效果，如果这些全靠CPU来回放预览，处理起来会非常卡顿和缓慢，所以在过去有不少视频工作者，会对原始素材进行生成代理文件，以降低对CPU资源的占用。

为此Adobe与NVIDIA一起合作，在PR中加入了支持利用GPU来处理回放、效果、多轨道预览等操作，以提升处理效率。这便是Mercury Playback Engine，它可以利用GPU来显著加速视频剪辑阶段的工作效率。

在目前最新版本的Premiere Pro里面，NVIDIA GPU已经支持非常多的效果加速，包括大家常用的变形稳定器、模糊、裁剪，以及Lumetri调色等等，这些在过去都是需要CPU，耗费大量时间去做分析和运算，但现在有了GPU的帮助，可以更快完成这些效果的合成速度，让剪辑工作变得更顺畅。

最后当大家把素材剪好、加完效果后，就要到第三阶段的导出视频了，而这次Preimere Pro的大升级，便是针对这一部分引入了额外的硬件加速，因为过去这个环节，其实也是更多采用CPU来进行编码（encode），由此可见现阶段CPU性能提升已经不足以满足视频处理的需要了。而GPU则将很多工作一点一点的接了过来，在整个工作流中扮演着越来越重要的角色。

RDNA 2架构的生产力提升

从AMD官方给出的PPT来看，在视频渲染软件达芬奇、PR中，RDNA 2架构也是进步明显，在PR的一个项目中甚至性能甚至可以达到老GCN架构的3倍。此外，PR在今年的新版本也加入了A卡乃至APU的AFM硬件加速支持，因此RDNA 2架构现在的生产力性能也是得到了一个明显的进步。

创意应用测试

测试平台与说明

至于整个测试平台，我们搭建了一套AMD Ryzen 7 5800X平台，搭配的X570主板提供了PCI-E 4.0插槽，5800X可以说是目前在游戏性能以及创造性能上都兼具的性价比CPU，使用这颗CPU进行显卡的生产力测试不会产生瓶颈。

视频剪辑测试

Adobe Premiere Pro

作为视频后期工作中最流行的软件，Premiere Pro很早就支持了CUDA运算的水银加速，帮助加快视频剪辑操作，而且Adobe还利用上RTX GPU的AI运算能力，来解决一些重复繁琐的工作，比如AutoReframe，这大大提高了如今流行的竖屏视频制作效率，另外从2020版本开始，在视频最后的导出阶段，现在还支持利用NVENC来加速编码，相比传统的软件编码，大大缩短了导出时间。此外，AMD显卡也在这次更新中得到了基于OpenCL的AFM硬件加速支持，两家显卡终于可以在PR上进行同步PK了。

NVIDIA显卡开启渲染CUDA加速

AMD显卡开启渲染OpenCL加速

NVIDIA显卡开启NVEDC编码硬件加速

AMD显卡开启AFM编码硬件加速

在Premiere Pro中我们可以看到四张显卡的表现，总体上看RTX 3080与RTX 3070都比RX 6800 XT以及RX 6800要好。并且在PR这个软件中，同一系列的显卡差距并不大，可以说导出时间是几乎一致的。如果你的主力视频制作是软件是PR的话，其实买一个低端产品就足够了，这是因为同一系列的显卡中的编码单元是一样的，并不会因为SM/CU单元数量有所区别。

与此同时我还做了只用CPU渲染的情况作为对比测试，可以看到四张显卡的渲染时间都远远小于Ryzen 7 5800X，CPU渲染视频的效率现在被显卡拉的太远了，推荐大家一定要下载最新版本的PR并且开启硬件加速，从而提高自己的导出速度。

BMD DaVinci Resolve

在视频调色和剪辑工作中有着重要地位的DaVinci Resolve，向来都是个硬件优化良好的软件，可以在显卡的帮助下，进行高分辨率视频的剪辑工作，这款软件现在在也受到越来越受到欢迎。同时相比PR来说，这款软件对内存、显存的需求也更高。

而除了性能方面的加速，还在功能方面有利用到硬件的特性，DaVinci Resolve通过NVIDIA RTX系列GPU特有的Tensor Core，来做一些AI功能的加速运算，比如稳定器的补帧、Super Scale、自动适配调色等，不少高级剪辑工作中会用到的操作，提高视频后期用户的工作效率。

NVIDIA显卡开启CUDA硬件加速

AMD显卡开启OpenCL硬件加速

DaVinci Resolve相对来说更能体现显卡间的性能差别，但在5个DEMO测试中，A卡的渲染时间都是较长的，其中第三个和第五个DEMO中落后的尤为明显，我曾经怀疑是我自己测试出错，但经过多次的重启以及驱动检查，结果都是如此。这已经不是第一次出现这种问题了，之前的测试中就出现过这种情况。打开任务管理器果然还是老毛病。

在达芬奇渲染的时候，A卡负责硬件加速的Compute 1单元的占用率呈锯齿形，经过实际观察，每过一秒钟这个单元的占用率就会下降一下，再升上来，如此反复直至渲染完成，这个应该说是一个很奇怪的事情，很明显这个问题让A卡没能完全发挥出实力，最后的结果就是导出时间非常的长。

这种情况的发生跟目前A卡暂时未推出相应的Studio驱动不无关系，游戏的驱动跟生产力驱动本来就是针对性软件不同，一个侧重实际游戏，一个侧重生产力软件，如果一起用的话就可能会出现上面的问题。这方面NVIDIA确实做的不错，意识到了混用两个驱动可能会给生产力软件带来不便，因此特意推出了RTX Studio驱动以及GeForce Game Ready两个方向的驱动供玩家选择。

此外，使用达芬奇软件的时候A卡还有一个小问题，不知道为什么同样的素材，N卡从导入素材到可以编辑并导出的等待时间比A卡短了不少，理论上素材都放在同样的硬盘里，响应时间两者应该几乎没有差别才对。但事实上A卡在导入素材之后要耐心等待一段时间才能完成编辑并导出的操作，此时画面为黑屏状态，这个状态有时可能为15秒，有时则有可能一分钟，我不能确定这到底是什么原因，只能暂时猜测是A卡游戏驱动优化对生产力软件不完善以及OpenCL没有针对性优化产生的。

而N卡这边的综合表现就要好不少，这里面RTX 3080显卡的优势尤为突出，因为达芬奇对显存的占用量是庞大的，传统的8GB GDDR6显存已经不堪重负了，RTX 3070渲染速度相比自家大哥落后的重要原因就是显存容量不够。A卡这边虽然显存容量更大，可惜由于BUG问题，现阶段没办法充分利用自己的大显存优势。所以如果你是一个以达芬奇作为主力软件的内容创造者，这四张主流显卡之中最好的选择还是RTX 3080，在各个测试的情况下都很稳定。

3D渲染类

Blender

有时候我们在视频制作之余，也会去渲染一些模型，因此我这里顺手测试了一下3D渲染软件这四张显卡的情况。在众多3D动画制作软件中，Blender一直对GPU有着非常好的支持，其作为一个开源软件，它在近年也是获得越来越多个人和工作室用户的青睐，这得益于其自身灵活快速的软件发展，目前最新版Blender在其Cycles渲染器中，已经可以完好低依靠OptiX API，来调用到RTX GPU的硬件加速能力，包括支持光线追踪和AI降噪功能，并且在这次RTX 30系GPU，Blender Cycles也是最先支持了第二代RT core的动态模糊加速。

金毛狮吼

AMD自从拥有了RA单元之后，基于开源的OpenCL，也可以进行光线追踪渲染了，因此两者的渲染时间长短就成了目前光追单元渲染实力的体现。

在Blender这个项目测试中，N卡优势是非常明显的，在两个光追DEMO中领先幅度非常大。从结果来看，A卡目前的光追渲染时间与N卡相比还是有较大差距的。RTX 3070就可以跨级别打败RX 6800 XT，这一方面跟两者的硬件架构光追单元的设计有一定的关系，另一方面N卡采用的OptiX API是经过专属优化的，AMD采用的OpenCL是一个大众化的开放型API，在针对性的光追优化上不够完美，最终在渲染时间上遥遥落后于OptiX API。

总结：N卡视频生产力更有优势，RTX 3070视频创作性价比最高

通过上方生产力主流软件的对比测试，我们可以很明显的看到在视频生产力方面，N卡的实际效果优势明显。通过专门优化的RTX Studio驱动，让显卡在生产力软件中尽可能的减少不必要的麻烦，同时在硬件加速上CUDA的效果相比A卡的OpenCL来说也要更好。反观A卡这边虽然相比之前的老GCN架构显卡有所进步，但是由于开源OpenCL的优化效果不尽如人意，针对性优化也不强，在使用达芬奇时，会出现占用率吃不满以及加载时间过长的问题，亟待修复。

而3D渲染软件中，N卡依旧优势明显，在越来越注重光影真实度的今天，光线追踪渲染将成为常态。这里N卡凭借着独家的OpitX API占据了非常大的优势，A卡这边的光追渲染还要依赖于OpenCL，效率就低了很多。

总结一下，如果你是一个视频创作需求较大的视频博主，并且使用PR居多，你可以优先选择RTX 30系列显卡，一张RTX 3070就足以满足大多数人的需求了，这也是这四张显卡中视频创作性价比最高的。如果你喜欢使用达芬奇渲染视频，那你可能需要显存容量更大，实力更强的RTX 3080了，这款软件下的RTX 3070距离RTX 3080还是有着明显的差距的。而A卡这边如果硬要推荐一款，建议是RX 6800 XT。毕竟RX 6800 XT与RX 6800价格相近，游戏性能又有明显的差距，买一张RX 6800 XT回来用PR做视频效果也是不错的。但如果你是一个达芬奇或者3D渲染用户，那还是老老实实的用RTX 3080吧。

责任编辑: 鲁达

“如何测试显卡瓶颈,如何测试显卡算力,如何测试显卡稳定性,如何测试显卡的性能,如何测试显卡是否正常”边界阅读