2020年注定是不平凡的一年,越来越多的人用视频记录下自己的生活,这也让原本就非常火爆的短视频的数量呈爆炸式的增长。视频剪辑不再成为一个小众需求,而是逐渐大众化了,每个人都想通过视频这张形式留下我们自己的回忆,我也不例外。但工欲善其事,必先利其器。为了提高视频的产出的效率,我必须尽可能的缩减与视频创作无关的时间成本,这里面最大的成本其实就是后期导出。
用CPU渲染视频的时代已经过去了,我知道现在的显卡在视频剪辑中可以提供非常大的助力,这个时候一张好显卡的重要性就体现出来了。为了搞明白主流市场上到底哪张显卡更适合视频生产力的创作,我选择了NVIDIA家的主力显卡RTX 3080、RTX 3070以及AMD的RX 6800 XT、RX 6800共计四张显卡进行横向对比测试,看看单纯的从视频内容创作而言到底哪张显卡是最合适的、最值得购买的。
在本次的测试之前,可以先简单看一下N/A两家最新一代显卡架构针对视频渲染软件的优化。
Ampere架构下的RTX Studio
NVIDIA这次RTX 30系列GPU在生产力方面做出了非常多的优化,相比RTX 20系列显卡进步明显,这部分我已经讲解过多次,这里不再赘述。如果你想仔细了解这一步的内容,可以点击这个链接查看。
NVENC加入到PRemiere Pro工作流
在Premiere Pro的视频制作工作流当中,主要分为了原始素材导入、剪辑与添加效果,以及最后的成片导出三个主要阶段,对于硬件来说,在第一阶段的素材导入时,目前主要是利用CPU来进行解码(decode)工作的,而到了第二阶段的视频剪辑过程,处理这些操作的仍然主要是CPU,但如今的视频制作不仅仅是对素材进行简单的修剪、拼接,还会有各种转场、字幕、调色、颗粒化等等进阶效果,如果这些全靠CPU来回放预览,处理起来会非常卡顿和缓慢,所以在过去有不少视频工作者,会对原始素材进行生成代理文件,以降低对CPU资源的占用。
为此Adobe与NVIDIA一起合作,在PR中加入了支持利用GPU来处理回放、效果、多轨道预览等操作,以提升处理效率。这便是Mercury Playback Engine,它可以利用GPU来显著加速视频剪辑阶段的工作效率。
在目前最新版本的Premiere Pro里面,NVIDIA GPU已经支持非常多的效果加速,包括大家常用的变形稳定器、模糊、裁剪,以及Lumetri调色等等,这些在过去都是需要CPU,耗费大量时间去做分析和运算,但现在有了GPU的帮助,可以更快完成这些效果的合成速度,让剪辑工作变得更顺畅。
最后当大家把素材剪好、加完效果后,就要到第三阶段的导出视频了,而这次Preimere Pro的大升级,便是针对这一部分引入了额外的硬件加速,因为过去这个环节,其实也是更多采用CPU来进行编码(encode),由此可见现阶段CPU性能提升已经不足以满足视频处理的需要了。而GPU则将很多工作一点一点的接了过来,在整个工作流中扮演着越来越重要的角色。
RDNA 2架构的生产力提升
从AMD官方给出的PPT来看,在视频渲染软件达芬奇、PR中,RDNA 2架构也是进步明显,在PR的一个项目中甚至性能甚至可以达到老GCN架构的3倍。此外,PR在今年的新版本也加入了A卡乃至APU的AFM硬件加速支持,因此RDNA 2架构现在的生产力性能也是得到了一个明显的进步。
创意应用测试
测试平台与说明
至于整个测试平台,我们搭建了一套AMD Ryzen 7 5800X平台,搭配的X570主板提供了PCI-E 4.0插槽,5800X可以说是目前在游戏性能以及创造性能上都兼具的性价比CPU,使用这颗CPU进行显卡的生产力测试不会产生瓶颈。
视频剪辑测试
Adobe Premiere Pro
作为视频后期工作中最流行的软件,Premiere Pro很早就支持了CUDA运算的水银加速,帮助加快视频剪辑操作,而且Adobe还利用上RTX GPU的AI运算能力,来解决一些重复繁琐的工作,比如AutoReframe,这大大提高了如今流行的竖屏视频制作效率,另外从2020版本开始,在视频最后的导出阶段,现在还支持利用NVENC来加速编码,相比传统的软件编码,大大缩短了导出时间。此外,AMD显卡也在这次更新中得到了基于OpenCL的AFM硬件加速支持,两家显卡终于可以在PR上进行同步PK了。
NVIDIA显卡开启渲染CUDA加速
AMD显卡开启渲染OpenCL加速
NVIDIA显卡开启NVEDC编码硬件加速
AMD显卡开启AFM编码硬件加速
在Premiere Pro中我们可以看到四张显卡的表现,总体上看RTX 3080与RTX 3070都比RX 6800 XT以及RX 6800要好。并且在PR这个软件中,同一系列的显卡差距并不大,可以说导出时间是几乎一致的。如果你的主力视频制作是软件是PR的话,其实买一个低端产品就足够了,这是因为同一系列的显卡中的编码单元是一样的,并不会因为SM/CU单元数量有所区别。
与此同时我还做了只用CPU渲染的情况作为对比测试,可以看到四张显卡的渲染时间都远远小于Ryzen 7 5800X,CPU渲染视频的效率现在被显卡拉的太远了,推荐大家一定要下载最新版本的PR并且开启硬件加速,从而提高自己的导出速度。
BMD DaVinci Resolve
在视频调色和剪辑工作中有着重要地位的DaVinci Resolve,向来都是个硬件优化良好的软件,可以在显卡的帮助下,进行高分辨率视频的剪辑工作,这款软件现在在也受到越来越受到欢迎。同时相比PR来说,这款软件对内存、显存的需求也更高。
而除了性能方面的加速,还在功能方面有利用到硬件的特性,DaVinci Resolve通过NVIDIA RTX系列GPU特有的Tensor Core,来做一些AI功能的加速运算,比如稳定器的补帧、Super Scale、自动适配调色等,不少高级剪辑工作中会用到的操作,提高视频后期用户的工作效率。
NVIDIA显卡开启CUDA硬件加速
AMD显卡开启OpenCL硬件加速
DaVinci Resolve相对来说更能体现显卡间的性能差别,但在5个DEMO测试中,A卡的渲染时间都是较长的,其中第三个和第五个DEMO中落后的尤为明显,我曾经怀疑是我自己测试出错,但经过多次的重启以及驱动检查,结果都是如此。这已经不是第一次出现这种问题了,之前的测试中就出现过这种情况。打开任务管理器果然还是老毛病。
在达芬奇渲染的时候,A卡负责硬件加速的Compute 1单元的占用率呈锯齿形,经过实际观察,每过一秒钟这个单元的占用率就会下降一下,再升上来,如此反复直至渲染完成,这个应该说是一个很奇怪的事情,很明显这个问题让A卡没能完全发挥出实力,最后的结果就是导出时间非常的长。
这种情况的发生跟目前A卡暂时未推出相应的Studio驱动不无关系,游戏的驱动跟生产力驱动本来就是针对性软件不同,一个侧重实际游戏,一个侧重生产力软件,如果一起用的话就可能会出现上面的问题。这方面NVIDIA确实做的不错,意识到了混用两个驱动可能会给生产力软件带来不便,因此特意推出了RTX Studio驱动以及GeForce Game Ready两个方向的驱动供玩家选择。
此外,使用达芬奇软件的时候A卡还有一个小问题,不知道为什么同样的素材,N卡从导入素材到可以编辑并导出的等待时间比A卡短了不少,理论上素材都放在同样的硬盘里,响应时间两者应该几乎没有差别才对。但事实上A卡在导入素材之后要耐心等待一段时间才能完成编辑并导出的操作,此时画面为黑屏状态,这个状态有时可能为15秒,有时则有可能一分钟,我不能确定这到底是什么原因,只能暂时猜测是A卡游戏驱动优化对生产力软件不完善以及OpenCL没有针对性优化产生的。
而N卡这边的综合表现就要好不少,这里面RTX 3080显卡的优势尤为突出,因为达芬奇对显存的占用量是庞大的,传统的8GB GDDR6显存已经不堪重负了,RTX 3070渲染速度相比自家大哥落后的重要原因就是显存容量不够。A卡这边虽然显存容量更大,可惜由于BUG问题,现阶段没办法充分利用自己的大显存优势。所以如果你是一个以达芬奇作为主力软件的内容创造者,这四张主流显卡之中最好的选择还是RTX 3080,在各个测试的情况下都很稳定。
3D渲染类
Blender
有时候我们在视频制作之余,也会去渲染一些模型,因此我这里顺手测试了一下3D渲染软件这四张显卡的情况。在众多3D动画制作软件中,Blender一直对GPU有着非常好的支持,其作为一个开源软件,它在近年也是获得越来越多个人和工作室用户的青睐,这得益于其自身灵活快速的软件发展,目前最新版Blender在其Cycles渲染器中,已经可以完好低依靠OptiX API,来调用到RTX GPU的硬件加速能力,包括支持光线追踪和AI降噪功能,并且在这次RTX 30系GPU,Blender Cycles也是最先支持了第二代RT core的动态模糊加速。
金毛狮吼
AMD自从拥有了RA单元之后,基于开源的OpenCL,也可以进行光线追踪渲染了,因此两者的渲染时间长短就成了目前光追单元渲染实力的体现。
在Blender这个项目测试中,N卡优势是非常明显的,在两个光追DEMO中领先幅度非常大。从结果来看,A卡目前的光追渲染时间与N卡相比还是有较大差距的。RTX 3070就可以跨级别打败RX 6800 XT,这一方面跟两者的硬件架构光追单元的设计有一定的关系,另一方面N卡采用的OptiX API是经过专属优化的,AMD采用的OpenCL是一个大众化的开放型API,在针对性的光追优化上不够完美,最终在渲染时间上遥遥落后于OptiX API。
总结:N卡视频生产力更有优势,RTX 3070视频创作性价比最高
通过上方生产力主流软件的对比测试,我们可以很明显的看到在视频生产力方面,N卡的实际效果优势明显。通过专门优化的RTX Studio驱动,让显卡在生产力软件中尽可能的减少不必要的麻烦,同时在硬件加速上CUDA的效果相比A卡的OpenCL来说也要更好。反观A卡这边虽然相比之前的老GCN架构显卡有所进步,但是由于开源OpenCL的优化效果不尽如人意,针对性优化也不强,在使用达芬奇时,会出现占用率吃不满以及加载时间过长的问题,亟待修复。
而3D渲染软件中,N卡依旧优势明显,在越来越注重光影真实度的今天,光线追踪渲染将成为常态。这里N卡凭借着独家的OpitX API占据了非常大的优势,A卡这边的光追渲染还要依赖于OpenCL,效率就低了很多。
总结一下,如果你是一个视频创作需求较大的视频博主,并且使用PR居多,你可以优先选择RTX 30系列显卡,一张RTX 3070就足以满足大多数人的需求了,这也是这四张显卡中视频创作性价比最高的。如果你喜欢使用达芬奇渲染视频,那你可能需要显存容量更大,实力更强的RTX 3080了,这款软件下的RTX 3070距离RTX 3080还是有着明显的差距的。而A卡这边如果硬要推荐一款,建议是RX 6800 XT。毕竟RX 6800 XT与RX 6800价格相近,游戏性能又有明显的差距,买一张RX 6800 XT回来用PR做视频效果也是不错的。但如果你是一个达芬奇或者3D渲染用户,那还是老老实实的用RTX 3080吧。