8月5日Intel正式发布了新一代Skylake平台,处理器全面进入14nm时代,配套的100系列芯片组也是鸟枪换炮,提供了多达20条PCI-E 3.0通道,与CPU的连接通道也升级为DMI 3.0,这是否意味着今后显卡的接驳不必受限于CPU内置的PCI-E控制器,多显卡系统将全面开放呢?
随着显卡性能的不断攀升,为加快CPU与显卡之间的交互协作,其连接通道从最初的PCI、AGP到如今的PCI-E,通道带宽大幅提升,最新的PCI-E 3.0 x1单向带宽已经高达1GB/s,如今Intel Skylake平台更是将PCH升级至PCI-E 3.0,通道数达20条之多,满足x16通道的显卡也有富余。一方面通道的富余,另一方面则是多卡的带宽分享,下面就结合PCI-E 3.0 x1/x4/x8/x16四种带宽研究通道数量对显卡性能的影响。
Intel Z170芯片组采用了DMI 3.0总线和20条PCI-E 3.0通道
注:PCI-E 3.0采用了128b/130b数据传输解码机制,实际数据传输效率为98.46%,相比PCI-E 2.0的8b/10b机制提升25%。
带着这一疑问,我们筹划的PCI-E通道数量对显卡性能影响的选题,分别测量PCI-E 3.0 x1、x4、x8、x16这些通道模式下显卡性能的差异,其中PCI-E 3.0 x1、x4为PCH提供,PCI-E 3.0 x8、x16为CPU内置PCI-E控制器提供。
为了让测试更具备代表性,测试依据目前市售显卡的性能高中低端定位,分别选取了GeForce GTX 980 Ti、Radeon R9 390X、GeForce GTX 960,测试主板为Inel Z170,搭配Core i7-6700K。三款显卡规格如下:
点击图片查看详细参数
GeForce GTX 980 Ti:28nm GM200 GPU、2816 CUDA、核心频率1190MHz、Boost频率1291MHz;显存频率7096MHz、显存位宽384bit、显存带宽340.6GB/s。
Radeon R9 390X:28nm Hawaii GPU、2816流处理器、核心频率1100MHz;显存频率6100MHz、显存位宽512bit、显存带宽390.4GB/s。
GeForce GTX 960:28nm GM206 GPU、1024 CUDA、核心频率1253MHz、Boost频率1317MHz;显存频率7012MHz、显存位宽128bit、显存带宽112.2GB/s。
为了避免测试方法造成的误差对测试精度的影响,三个GPU测试项目3DMark、《古墓丽影9》、《孤岛危机3》前两项采用benchmark模式,而《孤岛危机3》采用游戏开始帧率。
GTX 980 Ti显卡规格向发烧卡皇GTX TITAN X看齐,虽然CUDA单元有一定缩减,但是更高的核心频率使得其与GTX TITAN X差距并不大,倒是几近折半的价格让GM200 GPU真正走向了民用市场。
3DMark基准性能差异
首先进行的3DMark基准性能测试,PCI-E 3.0 x1、x4、x8、x16的成绩依次递增,可以看出PCI-E 3.0 x1、x4与PCI-E 3.0 x8、x16形成了两个梯队,由于带宽的限制性能损失大约在2.5%左右,值得注意的是3DMark成绩仅仅为平台的综合性能,单纯GPU的性能差距实际要大于2.5%。
《孤岛危机3》游戏性能差异
接下来的《孤岛危机3》,测试分别在2560x1600、1920x1080最高分辨率下进行,无论是哪组分辨率,PCI-E 3.0 x1、PCI-E 3.0 x4相对PCI-E 3.0 x8、PCI-E 3.0 x16都拉开了不小的差距,特别是PCI-E 3.0 x1与x16差距分别为16%和31%,严重制约了显卡性能的发挥,结果是显卡性能直接下调了一个等级。
《古墓丽影9》游戏性能差异
《古墓丽影9》显卡性能发挥受带宽影响稍弱一些,此时PCI-E 3.0 x4已经达到了可用的标准,不过PCI-E 3.0 x1的表现还是非常糟糕,与PCI-E 3.0 x16性能差距分别为5.7%和12%。
Radeon R9 390X采用了GCN 1.3架构,虽然没有用上HBM显存,但凭借512bit显存位宽也拥有不错的显存带宽,再配合2816个流处理器,应对非4K分辨率游戏也没什么压力。
3DMark基准性能差异
3DMark基准性能测试项,PCI-E 3.0 x1、x4、x8、x16的性能虽然依次递增,但是差距并不大,最大差异仅为1.8%。
《孤岛危机3》游戏性能差异
《孤岛危机3》的强烈反差还是出现在PCI-E 3.0 x1,另外PCI-E 3.0 x4的1080p画质也有明显的下降,如果是1080p或更低画质的游戏体验显然PCI-E 3.0 x4并不适宜。
《古墓丽影9》游戏性能差异
《古墓丽影9》游戏测试中,Radeon R9 390X在PCI-E 3.0 x1、x4、x8、x16模式下,性能差距非常微弱,特别是2560x1600分辨率下,性能差距几乎可以忽略。
曾经的甜点GTX X60显卡,如今随着整合GPU市场的不断壮大,已经沦为中低端产品,9系列显卡目前仅有一款GTX 950位居臣下。
3DMark基准性能差异
按照趋势性能越低的显卡对于PCI-E通道的带宽依赖越低,3DMark基准测试就是一个很好的论证,PCI-E 3.0 x1、x4、x8、x16下的性能虽然呈现微弱的递增趋势,但这种差距甚至可能比测试误差还小。
《孤岛危机3》游戏性能差异
《孤岛危机3》的通道依赖性也没有GTX 980 Ti、Radeon R9 390X明显,无论是2560x1600还是1920x1080分辨率下,帧率下降尽在1-2fps之间,最大性能差距也在10%范围内。
《古墓丽影9》游戏性能差异
《古墓丽影9》游戏的表现,基本和《孤岛危机3》相似,2560x1600分辨率下性能下降幅度不到1fps,而1920x1080分辨率也最大只有5.6%。
这么多年的等待,本以为Intel在主流消费级平台推出DMI 3.0和20条PCI-E 3.0通道,是在向主流平台开放三卡系统,但事与愿违,测试成绩并不理想,我想这也是为什么Intel X99有其存在的价值。
主流或者高端显卡随着性能的提升对于PCI-E通道的依赖逐渐提升,PCI-E 3.0 x4虽然在高分辨率下性能下滑并不明显,但是在诸如《孤岛危机3》这样的大作下下滑幅度直接让显卡性能降级,难堪大用。另外在PCI-E 3.0 x4、PCI-E 3.0 x1通道测试下,桌面或者游戏画面会出现显示数据信息不足,这直接导致画面花屏,体验非常糟糕。
显卡在PCI-E 3.0 x1模式下出现的游戏花屏
再来说下糟糕的PCI-E 3.0 x1通道,无论是3DMark基准测试,还是游戏性能都相对PCI-E 3.0 x8、x16明显下滑,最重要的是测试中的3款显卡在此种通道下都出现了不同程度的花屏,严重影响了产品的使用体验。
至于PCI-E 3.0 x8的性能发挥则要好很多,基本和全速PCI-E 3.0 x16平分秋色,无论是在基准测试中还是游戏测试,也无论是1920x1080分辨率还是2560x1600分辨率,成绩基本和全速通道相当。这也从侧面论证了诸如Z170这样双卡平台,显卡性能发挥不会受到影响。
● 最后的话
文章到这里不少读者可能会有疑问:既然PCI-E 3.0 x4无法满足高端显卡的带宽需求,为什么主板厂商不把PCI-E 3.0 x4插槽设计成PCI-E 3.0 x8甚至是PCI-E 3.0 x16呢?毕竟Z170 PCH芯片下面可管辖着20条PCI-E 3.0通道。实际却是20条PCI-E 3.0通道有一部分用于USB 3.0、LAN和SATA,剩下完全独立的通道只有6条,除非主板厂商剥夺这些接口服务于显卡,听起来似乎影响也不是很大,但是主板也是要区分定位的,既然Intel都不支持Z170支持组建3路以上的系统,如果主板厂商贸然设计,那么会破坏了本已规划好的产品定位,还会吃力不讨好。
技嘉Z170X-Gaming G1主板支持最高四路显卡
如果想要使用三卡或者是三卡以上的系统,那么X99是首选。当然对于一些顶级的Z170主板诸如华硕MAXIMUS VIII EXTREME、技嘉Z170X-Gaming G1、微星Z170A XPOWER GAMING TITANIUM EDITION、华擎Z170 OC Formula,通过第三方PLX PEX8747 PCI-E 3.0切换芯片,可以支持最高四路显卡SLI或CrossFire,当然这些产品的价格也是不菲,其性价比还不如X99来得纯粹。