从RYZEN挤多牙膏说起
在10月5日首发的Coffee Lake一共有4个型号,分别是8700K、8700、8600K、8400、8350K和8100,分别替代前辈7700K、7700、7600K、7400、7350K和7100。这次更新,可以说是intel是在nahelam之后,CPU规格/性能提升最大的一次:I3从2C4T变成4C4T,I5从4C4T变成6C6T,而i7则是从4C8T直接变成了6C12T。这些处理器虽然大多的Baseclock有所降低,但boost频率却进一步拉高。因此这代处理器的理论规格相比上代kabylake-S基本有50-100%的提升。
最近几年英特尔每年的产品性能提升基本只有不到3%水平,被一些人戏称为牙膏厂。而英特尔在Coffee Lake上的不再挤牙膏,有很多人将其归功于AMD Ryzen系列的给力,甚至有人说AMD这次给英特尔压力太大,都把牙膏挤的过多了。(上面这个GIF虽然粗糙,但还是可以反应出不少人的想法)
判断牙膏是否挤多需要更多的数据支撑,需要分析英特尔的Tick-Tock策略和核心面积变化的规律。芯片是由整个晶圆切割而成,在相同工艺的情况下,单个晶圆的成本相对固定,单个芯片的核心面积越小,那单个晶圆可以切割的处理器数量就越多,这样处理器的平均成本就更低。这张图可以反应出intel 4+2处理器的核心面积变化,一般而言在tock变换架构时候芯片规模会变大,而在Tick变更工艺线宽时候芯片面积就会缩小。当然也有例外情况,Broadwell到Skylake虽然是tock变换架构,但芯片面积还是缩小了,这是因为5775C的集显规模过大。虽然有这个小波折,整体而言,4+2的级别处理器核心面积规模整体趋势是稳中有降,作为Tock的Coffee Lake核心面积从kaby Lake的126mm2增长到149.5mm2,这也属于正常范畴。
新一代的Coffee lake在intel的Tick-Tock里属于Tock,就是架构更新,而不更新工艺。当然,这个仅仅是传统的Tick-Tock策略说法的延续,但严格的说这样的策略已经不能完全套用现在的实际情况。14nm的首发Boardwell,也就是5775C那代产品,仅仅是存在产品,并无实际意义。而从Boardwell-Skylake-Kabylake再到Coffee Lake连续四代产品都采用14nm工艺,看来Tick-Tock策略似乎已经不能延续了,要破产了,但实际是这样么?
从工艺线宽而言,这4代是14nm是没什么变化,但看工艺我们不能仅仅只看线宽,其实从首代的14nm到现在的14nm从性能上还是有很大的差别。首代的Boardwell和后续的Skylake是14nm FF,而后续的Kabylake,虽然延续了Skylake的架构,工艺线宽依然停留在14nm,但其采用的14nm FF+工艺相比原始的14nm FF性能大幅提升。这个性能提升从6700K默认4.2GHz,风冷超频的基本盘4.5GHz提升到7700K默认4.5GHz超频4.8GHz还是很明显。因此Kabylake严格的说,不仅仅是单纯的优化 ,而是工艺有了很大的进步,应该算是Tick。
Coffee Lake架构变化了,毫无疑问是Tock,但仅仅是Tock么?Coffee Lake的制程又升级了,从Kabylake的14 FF+升级到了14 FF++。并且这个++很强,强得都脱离了工艺发展的基线。从上面intel官方PPT看,14FF++性能不仅大幅优于14FF+,甚至都要远好于10nm的初代性能,即使是icelake的10FF+相比也毫不逊色,还略胜一筹。8700K在核心增加一半的情况,依然可以维持4.3GHz的默认频率,而超频甚至可以上5.0GHz,这相比7700K又有了一定的提升。性能要比目前14 FF++更好的10 FF++就是2020年以后的事情了,
英特尔在上月北京举行的英特尔精尖制造日公开的数据14FF++相比14FF+性能提升24%,而14FF+相比第一代14FF提升幅度只有12%。14FF++在性能等级上完全是新的一个级别的工艺, 因此说其是Tick并不为过。因此Coffee Lake-S无论是在架构上,还是工艺上,还是规模上,都不再是挤牙膏,而是有很大的进步。
挤牙膏的艺术
当然芯片成本不仅是核心面积,还是需要考虑其他很多要素。这张图反馈的是英特尔12年以来的芯片成本变化曲线,新线宽工艺在初期由于晶圆产线的成本均摊和良品率问题,成本就会大幅上升(如22nm首发的Ivy Bridge和14nm首发的Broadwell),而新架构(如Tock的haswell和skylake)往往伴随更多的研发投入和更大的芯片规模,使得成本也有一定幅度增长,但这个涨幅是小于工艺切换。但这个成本会随着良品率提升和制程优化,还有晶圆产线成本/研发费用均摊下降,处理器产品的成本也会逐渐走低,并且无论是tick还是tock,都会触及一条无形的成本底线。Kabylake既没有切换制程线宽,也没有变化架构,仅仅是优化,因此成本一直维持在很低水准。而这次Coffee Lake成本曲线估计应该比较类似skylake,由于芯片核心数的增加,这样规模增长幅度会稍大,使得成本再稍高一点,但这增长幅度还是远低于工艺线宽切换的变化。
反观AMD,采用14nm工艺的RYZEN 7核心面积为195mm2,这个面积要比Coffee Lake大上1/3,并且这还是在没有集显的情况下。其实RYZEN 7的情况还不算太糟糕,更大的问题在于中低价位的4/6核心的RYZEN 3/5在核心面积上同8核心的RYZEN 7相同,仅仅是对部分核心和缓存进行了屏蔽,这样虽然可以解决不良率问题,但却使得晶圆成本大幅增加。因此现在的英特尔以小搏大的确没有什么压力。
CANNON LAKE 10NM晶圆
而后续的Canon Lake和Ice Lake则会采用英特尔首代10nm FF工艺,首代10nm FF工艺虽然在性能上并没提升,但在密度上大大提高了:英特尔10纳米制程的最小栅极间距从70纳米缩小至54纳米,且最小金属间距从52纳米缩小至36纳米。尺寸的缩小使得逻辑晶体管密度可达到每平方毫米1.008亿个晶体管,是之前英特尔14纳米制程的2.7倍。更高的密度对于英特尔而言有两个意义,第一是更小的核心面积,虽然新工艺产线投资巨大,新工艺的单个晶圆成本会上涨,但从长远看切割更多的die会使得成本更低,另外一方面密度的提升,也使得在合理的成本区间可以实现更大的芯片规模,现在坊间有传言,下一代的Ice Lake-S旗舰会有8C16T的规模,考虑英特尔10nm FF这样幅度的密度提升,这也不足为奇了。
以前的Tick-Tock是工艺和架构以隔年为周期交替迭代,但随着晶圆厂升级动辄几十亿甚至上百亿美元基础投资,两年一换并不经济,因此英特尔更多深挖每代线宽工艺的潜能,从14FF/14FF+/14FF++,再到10FF/10FF+/10FF++,都是相同路径,将每代线宽工艺性能牙膏挤到极限,并且又确实可以看到巨大的提升,这就是英特尔挤牙膏的艺术。
因此继续沿用14nm工艺的Coffee Lake依然是英特尔按部就班的挤牙膏,并继续将14nm余量压榨干净,这样的进步仅仅是计划之中,而和AMD RYZEN并无太大干系。
不那么Tock的Tock
前面多次提及Coffee Lake是Tock,那这次Tock究竟有什么变化?我们先说结论:Coffee Lake相比Kaby Lake核心增加了50%,从4C8T增加到了6C12T,同步末端缓存也扩大了一半,从8MB扩大到了12MB。Coffee Lake的IPC有提升,但这仅仅是受益于缓存容量和带宽的提升。
我们先从核心图自上而下来说明:上面是6核心的coffee Lake Die照片,左上部分是内存控制器,左边是System Agent,中间的六个是6个 物理核心+L3缓存,右边青色的部分是UHD 630集显。4C和6C的集显为24 EU,而低端的Pentium则为一半规模,12EU。
再将这个图抽象化一些,L3的RING BUS环形总线连接6个核心,还有集显和System Agent。System Agent内的有双通道内存控制器和PCIE控制器。这和Skylake/Kabylake的结构也没明显区别,仅仅是扩大了2个核心的路径。
单个核心内部结构和Skylake/Kabylake并无明显区别,前端、执行引擎和缓存的结构和资源数都一样。(图片来源wikichip)
再来看看Coffee Lake从4核心增加到6核心对于内部效能有何种影响。我们使用Sisoftware Sandra的多核心效率测试同频4GHz的7700K、8700K和7800X,这个测试包括三个部分:
第一个部分是组合内部核间带宽,是通过传输不同容量的Chain Size x Block Size来测试平均传输带宽,带宽越高越好。8700K在1MB以下数据相比7700K都有优势。相比7800X,8700K在64KB以下区块和7800X持平,但在64KB以上数据,8700K的资源冲突就大于7800X,同频性能就开始落后。
第二个部分是测试相同容量的数据块从一个核心分发到其他核心的最快速度,这个数据会从L2到L3,经过内部互联的Ring Bus进行传输,这个测试结果是越高越好。8700K核间通信带宽从7700K的33.8GB/s提升到了45.6GB/s。从前两个测试看在同频情况下,Skylake-X的网状Mesh互联带宽还是要优于Coffee Lake的环状Ring Bus,究竟通路线路更多。但我们这里测试的是同频,实际情况8700K运行频率更高,实际核间通讯效率还是可以和7800X基本持平甚至更好。就其原因8700K和7700K RING BUS每个核心每个周期都是可以进行32B读写操作,但8700K核心更多,使得RING BUS从32Bx4变成了32Bx6,环总线随内核数增加了,虽然每个内核理论通信带宽仍能维持不变。
第三个部分是核间延迟,这个延迟是核心之间传输最小量数据耗费的最短时间,单位以纳秒计算。具体是测试数据一致性的响应耗时,这个结果是数值越低越好。这部分测试结果,8700K相比7700K的核间通讯延迟略有加大,从43提升到44ns。具体原因是这个环形总线要多途经2个核心,路程变长了,延迟稍微变大也在预料之中。不过这个延迟还是远低于mesh结构的Skylake-X 7x ns的水平。
虽然说Coffee Lake是Tock,但从架构上而言相比Skylake/Kabylake并无明显变化,仅仅是暴力的将规模扩大了一半。这样看来Coffee Lake的这个Tock也 并不算很彻底的Tock。反而是14nm FF++的工艺进步给人留下更为深刻的印象,Coffee Lake的规模得以扩大,其实也应该更加受益于工艺的进步,这么说Coffee Lake其实更像是Tick而不是Tock。
半路出道的Z370
Coffee Lake是平台,而 不单单是CPU。Coffee lake首发的配套主板是Z370,但Z370并不是8代处理器配套芯片组的完全体。有这样的传言,Coffee Lake本来计划是和完整体在明年Q1一起出,但结果Coffee Lake进展过于顺利,大幅提前,为了应对竞争提前发布Coffee Lake,intel将Z270的PCH直接搬了过来,这就是Z370。
也是由于这样,Z370延续Z270的PCH,使得其和PCH相关功能和规格并无提升。
既然Z370并不是完整体,那完整体是什么呢?完整体是Z390。Z370的ME版本还是11,而完整体Z390的ME升级到12。而较低规格的H370/B360/Q350/H310由于还是依照原计划明年Q1推出,也是采用最新的ME12。由于Z370采用的还是老版的ME11,这使得其不能支持后续的IceLake,而其他型号的300系列主板就没有这个问题。Z390相比Z370其他特性方面差别不大,主要是将USB 3.1 Gen1升级成2,带宽从5Gb/s升级到10Gb/s,其他PCIe Lanes数量,M.2、SATA和USB支援情况都没什么差别。仅仅是增加了对SDXC高速存储卡接口的支持,对大多用户都没什么影响。
新的PCH还有一点很重要的变化是集成了WIFI+蓝牙的主芯片,就说Z390/H370/B360/Q350/H310并不再需要额外的WIFI主芯片,而只需要外引射频模块和天线就可以实现802.11AC的WIFI功能。这样可以大大降低主板扩展WiFi的成本,当然这个功能主要是针对移动平台开发,而desktop附带仅仅是额外的福利。不过即使如此,大多数主板从成本考虑,还是不会增加WIFI功能。
由于Z370继续沿用之前Z270的PCH,因此在外部接口和磁盘接口规格和性能并没什么变化。同之前Z270并没什么变化,因此磁盘和接口性能就没有必要重复测试。
平台实物解读
我们本次的测试平台主板采用的是STRIX Z370F GAMING,其延续之前STRIX Z270F GAMING的定位,STRIX是ROG玩家国度的轻量化系列。她不像EXTREME那样旗舰,也不像APEX那样追求极致OC,更不像FORMULA那样为分体式水冷和MOD而生。但她也有ROG Style的基因,更多的游戏和电竞风格,合适那些追求个性而非追求极限的轻量级玩家群体。
STRIX Z370F GAMING基本延续了之前STRIX Z270F GAMING的设计思路,其最大的改变是PCH上增加了大面积的散热片,同时可以覆盖M.2。
供电部分延续了之前STRIX Z270F GAMING的规格,8+2相。这个供电规模虽然不如Hero或者APEX这样高端这样奢华,但相比其他总低价位的Z370还是更为丰满。
LGA1151 V2?其实我也不知道应该叫什么,看上去和LGA1151并没什么差别。之前的SkyLake/Kabylake也能够放上去。
4根DIMM内存插槽,可以支持到4000MHz的频率,相比上一代的3866MHz又有一定的提升,后面部分会具体测试。
以往主板内存布线是十分考验水平的,需要通过各种蛇行走线使得内存信号延迟一致化。而在Z370华硕在PCB工艺上PCB导孔技术,这种技术可以跨层布置走线,这种技术不仅可以简化走线设计,还可以进一步缩短信号延迟差,进一步提升内存的超频性能。
主板后部的接口有3组USB 3.0,2组USB 2.0,1组USB Type-C。显示输出接口方面DisplayPort、HDMI和DVI一应俱全。后部左边存在缺口,因为STRIX Z370F GAMING和STRIX Z370E GAMING是公用设计,STRIX Z370E GAMING这个位置增加了WIFI天线的接口。
存储方面有6组SATA 6Gbps,还有2组NVME的M.2,其中下面一组是直连PCH,可以支持 Optane Memory。
PCIE配置方面为PCIE 16x+1x+1x+8x+1x+4x。16x和8x支持SLI和CrossFire,由于需要承载大重量的显卡,这两个插槽有金属外框加强。并且这两个槽位中间有2个PCI位的间隔,这样的设计使得即使插上2张双槽位大散热器的显卡,中间依然有空间来散热。第一个PCIE上面的M.2支持2280长度的NGFF。
PCH上的巨大散热片是铝制材质,表面采用金属拉丝工艺处理。其上还有个镀镍的败家之眼的LOGO,这进一步提升了整个主板的逼格。
取下三个螺丝,可以看见硕大的散热片下面有导热垫可以直接贴合SSD的主控和NAND芯片。此外的PCH还有个单独的散热片,这样的非共用散热片的设计是考虑支援类似浦科特M8SE这样自带马甲的SSD,在不安装上部散热片的情况下PCH依然有散热片覆盖。这个M.2可以支持到22110长度的NGFF设备。这个散热片对于M.2的散热效果如何,我会在稍后具体测试。
SupremeFX金属屏蔽罩下面是S1220A CODEC,集成声卡。我个人一直用外置DAC,板载我一直都不怎么感冒。但声卡附带的声波雷达功能很好玩,后面再具体介绍。
AURA是STRIX的标配功能,除了支持板载的内存和显卡同步,还额外提供了2组4pin的AURA接口,可以用来外接机箱、灯带,水冷、风扇这些外围AURA设备。两组AURA接口分列在主板的顶部和底部,这样的分开布置走线更为方便,如果AURA设备数量比较多,还是可以通过并联方式进行扩展。
再来看看处理器的外观:Coffee Lake (右)和Kaby lake(左)在金属外壳封装上并无差别,基板也一致。(两个处理器都为工程样板)
右侧的Coffee lake相比左边的kabylake在针脚部分数量和布局并无差别,但coffee lake触点中间的电容电阻更多。
虽然都是LGA1151,看上去排列也基本一致,但KabyLake(左)和Coffee Lake(右)的针脚定义还是有很大差别。之前保留无功能针脚有46个,而现在仅有25个,地线和火线分别增加了14和18个,因此是不能混插的。混插传说中是可能会烧毁CPU的(反正肯定不能用,我就没去作死尝试),但英特尔没有对此作防呆,所以上市后相信还是会有人去作死。
我们还对Coffee Lake进行了开盖,内部不出意料依然还是高科技硅脂。既然高贵的i9和更为高贵的Xeon Platinum都是高科技硅脂,那主流的Coffee Lake我也不曾有幻想是钎焊。高科技硅脂必然大幅影响散热表现。用户如果相信自己人品和稍微有点动手能力,可以使用开盖器,更换液金或者如GEILD这样导热系数更高的硅脂,温度应该可以有10度以上的改善。这个操作其实对动手能力要求不高,更为需要的是人品和不差钱,相信自己的CPU不会坏,开盖可能是会影响RMA和以后二手的卖价。
同时我们也使用游标卡尺验证了 8700K的die size是在150mm2左右。
测试平台和说明
我们本次测试的具体测试平台具体如下:
性能测试我们在Windows 10电源管理里将性能设置模式改为高性能,这样可以避免频率在轻载时候跌倒Base clock之下。如果使用默认的平衡设置会有两个问题:一是在性能测试过程中由低频加速到高频会有个加速过程,这将影响测试成绩,特别是对于耗时较短的测试项目,也许加速到4.3GHz的时候测试差不多都结束了。二是对于游戏测试,其对于处理器的占用率并不高,系统会在这个情况判断游戏不需要处理器性能,擅自降低处理器频率,甚至会降到2GHz频率以下,但实际上游戏性能还是对频率很敏感。
Coffee Lake的超频测试
之前Skylake-X改变了缓存策略,扩大L2,缩小L3,而在Coffee Lake又回到传统策略,每个核心256K L2 Cache,而L3则是共享的12MB。
在超频之前我们必须正确的认识8700K的频率,对于频率现在有两种看法,第一种是:想8700K Base clock才3.7GHz,这是不是太低了,7700K都有4.2GHz啊。而第二张看法是8700K boost可以到4.7GHz,距离5GHz不远啊,大胜利。
其实这两种看法都是不准确的:3.7GHz的base clock基本碰见过热保护才会降到,而这个 4.7GHz的睿频频率仅仅是在打开个程序单个核心可以达到的瞬时响应频率。这两个频率实际都不是CPU运行的典型频率。因此我们在这里我们首先需要强调不是Base clock,也不是boost clock,而是更有意义的全核心满载稳定频率,这个频率才是最有意义的频率。8700K和8700的全核满载频率都是4.3GHz,这个频率相比7700K的4.4GHz低了0.1GHz,但又远高于7800x的4.0GHz。
14nm FF++虽然使得boost clock的提升,但全核频率仅为4.3GHz,这使得超频的空间很大,让超频有更多可玩性。需要说明的是,我这里说的超频测试是在一般风冷或者一体式水冷状态下,可以长期安定使用的超频。不是那种超高电压温度要爆炸的超频,也不是那种稳定性着急,勉强跑完R15或者3Dmark,但玩玩游戏就蓝屏的,那种过把瘾就死的频率。
之前7800X的超频的基本盘是1.2V 4.5GHz,虽然有人超到4.8GHz,但需要更高电压,这不是一般风冷或者一体式水冷可以压制住的。因此实用超频也就4.5GHz截然而止。那i7 8700K的情况呢?
我们使用ROG STRIX Z370F GAMING作为平台经过多次尝试,对于i7 8700K的甜点频率在1.4V 4.8GHz,这个频率在日常应用和游戏没有问题。再高5GHz频率就需要更高电压,虽然5GHz依然可以跑benchmark和游戏,但如果长时间高负载,如跑AIDA 64稳定性测试和Keyshot渲染,会由于温度过高触发保护,强制降频到3.7GHz。
另外我们还可以设置AVX Offset,由于处理器在跑AVX指令集时运作方式是SIMD单指令流多数据流,比较类似GPU的并行运算方式,负载极大,对于处理器的稳定性有更高要求,可能会出现CPU跑整数浮点这些日常应用时候稳如POI,但运行模拟器或者压片这些需要使用AVX指令集的时候稳定性出现问题。我们就可以设置AVX Offset的倍频。如我们处理器日常应用和游戏跑5GHz,如果我们将AVX Offset设定在2,那在跑AVX负载的情况下,外频就会低上两个倍频,跑4.8GHz。
超频不仅仅是拉拉频率提提电压那么简单,还需要手工设置一些细节设置,如CPU负载保持,CPU电流上限和CPU供电相数控制,这样才能真正解除处理器上的禁锢。
超频除了超核心频率,还有uncore的频率,默认的uncore频率是大概比主频低0.3GHz,不过我们也可以在BIOS里手动设置uncore的频率,实际我们测试8700K的uncore和核心同步也没问题,如可以上到5GHz,而之前7700K uncore一般就4.5GHz水平。不过超uncore性能收益较小,我们后面的超频设置在没特别说明的情况下默认都是没有单独超uncore的。(而7800X uncore默认才2.7GHz,超频uncore的收益就比较明显)
我们具体进行负载测试时使用的AIDA64是稳定性测试,同时给CPU、FPU和Cache加负载,这个设定负载稳定性要求虽然低于Prime 95,但如果可以通过就说明可以保证日常应用的稳定。测试使用的散热器是海盗船H115i,具体是280mm冷排规格,风扇策略是默认,这基本可以代表一体式水冷的最高水平。具体测试平台是裸机测试,其实风道散热良好的机箱配合机箱风扇测试温度和裸机测试并不会有太大差别。
在开启节电的情况下,8700K的整机待机功耗(包括GTX1080TI),仅为44W,甚至要低于7700K,更远低于7800X的80W,温度情况也类似。默认设置满载功耗,8700K为167W,温度为72,由于CPU核心规模扩大一半,功耗高上30W,温度高3度已经十分理想,而7800X的功耗已经接近200W。
8700K在1.4V4.8GHz的情况下,8700K的整机功耗会上升到220W,温度也会到达100度。温度和功耗都是明显高于7700K的。8700K由于工艺特点,其更吃电压,更高的电压可以达成更高的频率,当然前提是你有足够好的散热。在4.8GHz烤机情况下,供电的散热片温度会高达72度以上,这还是ROG STRIX Z370-F GAMING供电相数较高和散热片规模较大的情况下,如果是较低规格的Z370主板采用更小规模的供电和更小体积的散热片,在超频情况下的供电稳定性就很难保证,对于超频玩家选择一款较高规格的主板还是很有必要的。但这说明处理器是有能力稳定在4.8GHz,只不过顶级的一体式水冷依然不能满足散热需求,开盖或者分体式水冷还是有希望可以搞定4.8GHz,甚至5GHz的8700K也是有希望的。
当然小超怡情,大超灰飞烟灭,玩家如果难得研究,不想在BIIOS里一个参数一个参数的去研究,也可以在BIOS里开启XMP,然后选择同步核心频率,那处理器就被设定在4.7GHz,并且其他参数也都设定在一个比较保险的数值,这样就可以安心使用了。
内存性能测试
内存性能是我们考察Coffee Lake+Z370平台的重要一环。Skylake-S内存是2133起步,而Kabylake则提高到了2400MHz,而最新的Coffee lake更是以2666MHz起步。当然这个仅仅是intel的官方spec,实际第三方主板厂商可以实现的内存频率更高。上一代的Z270可实现的内存频率需要分情况考虑,以华硕主板为例,Hero以下级别的Z270一般能够上到3600/3866MHz(如Z270-P、Z270-A、STRIX Z270F GAMING),而高规格,更多为超频优化的M9A/M9F/M9C/M9E和ITX的STRIX Z270I GAMING就可以上到4266MHz。这主要和主板走线设计、PCB层数和BIOS优化有关系。而内存可以上多少频率,就是判断主板档次级别的一个不错标准。
ROG Z370这一代内存支援情况相比Z270又上了一个台阶,STRIX Z370F GAMING QVL可以支持的频率从3866提高到了4000MHz,跨进4000的门槛,虽然这不能和主打极限超频的APEX 4500MHz媲美,但也是有长足的提升的。
我们测试的内存是Gskill Trident Z RGB 3866 8GBx2,时序为18-19-19-39,虽然XMP频率仅为3866MHz,但由于采用特挑三星Bdie颗粒,一般都可以上到4133或者4266甚至更高频率。Coffee Lake使用AIDA 64内存带宽/延迟测试表现和Kaby Lake表现基本一致,并无太大差别。理论带宽相比同频的四通道的X299/X399依然有很大的差距,但这个差距仅仅存在这个跑分之中,实际应用或者其他Benchmark基本不会有什么差别,因此不用纠结。
理论性能测试
Super PI是个经典的CPU测试程序,我们使用其对PI进行3200万位的测算,其仅仅是考量处理器的单线程浮点性能。8700K在运行单线程的Super PI boost频率在4.4-4.6GHz范围浮动,相对7700K频率并无明显劣势。8700K在super pi 32M相比7700K快接近7%,看来coffee lake相比kabylake浮点性能也有明显提升。另外需要说明的是Super PI对于内存延迟很敏感,这次测试统一定在DDR4 3200 CL18,如果缩紧内存时序,PI的成绩还是会有明显提升,这个成绩仅合适同内存参数设定比较。
Fritz Chess Benchmark是基于国际象棋软件Fritz 的独立电脑棋力测试程序,其偏向于整数和分支预测性能的测试。Fritz Chess Benchmark最多可以支持16个线程,在之前的1950X测试,由于处理器为16C32T,我们并未加入这个项目,但在Coffee Lake评测又重新引入。8700K相比7700K多线程快45%,单线程快7%,前者得益于核心数的增加,而后者则是架构改进的红利。8700K相比同为6核心的7800X单线程和多线程基本都快了20%,而单纯频率8700K仅快了7.5%。
XTU的全称是Intel Extreme Tuning Utility,其是英特尔官方的性能和稳定性测试工具,仅能支持英特尔处理器。XTU本质还是跑AVX。由于跑AVX负载极大,8700K基本都在跑4.3GHz的稳定全核频率,因此在XTU上8700K相比8700基本没有什么提升。
7ZIP是个GPL开源的压缩软件,其内核效率远高于WinRAR之类商业软件,并且对于多核心支持很好。我们使用自带benchmark进行测试。7ZIP由于对多线程支持很好,8700K相比7700K性能提升幅度和渲染测试十分类似,提升了50%以上,更为难得的是单线程也有接近10%的提升。
内容创作性能测试
Cinebench R15这个是基于Cinema 4D设计渲染软件的独立Benchmark,原本应用领域较窄,但由于其Benchmark使用简单,群众基础好,大家喜闻乐见,反而声名大噪,现在Cinebench R15基本已经是测试CPU性能的基准测试软件。Cinebench R15 8700K相比7700K多线程大概提升46%,这主要是得益于核心数扩展的优势,相比同为6核心7800x也提升了11%,这主要收益是来自频率优势。当然这里的核心数和频率优势仅仅是优势的主要来源,其实还是有架构效率的优势。单核心同频比较更为明显,4.8GHz 8700K单线程性能相比同频7700K也提升了2%,这个提升是得益于架构更新的提升。
Blender是AMD在RYZEN发布会上演示的御用软件,我们使用RYZEN LOGO进行测试,150%的默认渲染分辨率。测试成绩是渲染时间,结果越低越好。Blender的情况和Cinbench R15类似,相比7700K领先51%,相比7800X也领先14%。默认频率还是略微慢于RYZEN 7 1800X,但在超频后也反超了。
POV-RAY也是个渲染软件,但特性上比较偏向光线追踪,我们使用其自带的Benchmark进行单线程和多线程测试。在POV-RAY 8700K多线程相比7700K快45%,比7800X快8%,这也是核心数和频率的优势,同频4.8GHz的8700K和7700K单线程性能基本一致。
Keyshot 6是一个通用的渲染软件, 基于LuxRender物理方程渲染引擎开发。根据物理方程模拟光线流,可以产生照片级别的逼真图像。在行业内应用广泛,我们使用子定义场景进行渲染测试,渲染完成时间越短越好。Keyshot整体渲染时间很长,基本在40分钟以上,因此对于系统的稳定性有很高要求,特别是超频情况就更是如此,我们测试其他品牌主板配合8700K测试,由于供电稳定性问题,并不能稳定在高频,甚至会掉频到3.7GHz的Base clock。而配合STRIX Z370F GAMAING 其频率表现就很稳定。 具体测试和前面2个渲染项目也比较类似,相对7700K和7800X有63%和23%的优势。
视频编码性能我们使用x265 benchmark进行测试(测试下载:),x265是采用GPL开源的编码器对于HEVC进行编码,编码完成时间的测试结果是越短越好。其对于多线程利用充分,并会利用AVX2等指令集,因此其对于处理器的AVX/AVX2指令集表现也是一次考验。8700K的x265 benchmark表现大幅提升,相对7700K和7800X有36%和12%的优势。X265编码相比渲染前后相关性稍强,因此在核心性能放大比例也较小。7800X虽然支持AVX-512,但我们测试的编码软件尚未支持,这方面的优势也无法发挥。另外和前一部分的 XTU测试原因一样,8700K在x265 benchmark跑AVX2基本只能跑在4.3GHz的频率,相比8700没有频率优势,二者的测试成绩十分接近。
在内容创作测试项目中,8700和8700K由于全核频率都是4.3GHz,两者多线程测试都很接近,而单线程8700K Boost频率稍高,优势稍大一点。对于职业的内容创作行业人士,工作用机自然不会超频,默认性能i7 8700多线程性能基本和8700K一致,性能也大幅优于7800X,性价比十分出色,如果之后再配合较低成本的B360/H370芯片组主板,整天持有成本还可以得到进一步的优化。
3Dmark/游戏性能测试
我们这里测试的是处理器性能,而不是集显性能,Coffee Lake的集显依然是HD630,并无太大变化,集显部分我们略过。首先是大家喜闻乐见的3Dmark,3Dmark我们测试了DX11 Firestrike/DX12 Timespy测试的物理测试部分。Firestrike物理测试是调用的Bullet Open Source Physics library进行最多32线程的柔性形体模拟,对于GPU负载很低,瓶颈在于CPU,而基于DX12的Timespy的物理测试,则是使,通过预设置的规则和参数是模拟生成羽化水晶,相对FSE的物理测试负载更高。这两个测试几乎没有GPU负载,是完全考验CPU性能。
最新版的Timespy相比FSE对于多线程支持更好,8700K相对7700K的提升幅度更大。8600K十分接近7700K水平,尽管 其只是i5。RYZEN 7经过多次BIOS版本更新,随着AGESA版本更新,其能够支持更高的内存频率,核心缓存一致性的耗时得以优化,使得其3DMark性能相比首发时候有明显提升。
文明6我们使用游戏内图像设置成1080P 最高画质 进行测试,使用游戏自带的AI性能测试,它模拟多个国家进行AI操作的所需的单回合时间。虽然文明6的AI系统针对多线程优化,但其依然更为看重单线程性能,并且对于频率极其敏感,8700K优势明显,其默认频率速度和超频速度甚至都要快于10核心的i9 7900X的默认和超频性能。
Grand Thief Auto V我们使用游戏内图像设置成1080P 最高画质 4XMSAA进行测试,使用游戏自带benchmark进行测试,记录最后个场景的平均FPS进行比较。古墓丽影崛起我们使用1080P手动最高画质+SMAA设置,使用游戏自带Benchmark进行测试。
GTA5和古墓丽影的测试情况比较类似,还是证明频率为王,只要有个4.x GHz 4C8T,游戏性能瓶颈就基本不在CPU,而在GPU。因此对于游戏玩家而言需要的是高频,而不是更多核心的HEDT。但如果电源管理设置在均衡模式,CPU频率会降到Base clock之下,过低的频率对游戏性能还是会有很大影响,游戏玩家Windows电源管理一定要在性能模式。
ROG STRIX Z370F GAMING的特色功能
前面产品介绍部分所及ROG STRIX Z370F GAMING和ROG STRIX Z270F GAMING外观上的最大差别就是增加了M.2 SSD+PCH的整体散热器,我在这里对不使用散热器和使用散热器的效能进行对比。我们具体测试方法是使用IOMeter建立个任务,以32QD队列深度100%随机读PM961 256GB,以一分钟为间隔记录温度和速度。温度记录除了读取传感器温度以外,我们还使用Testo 869热成像记录主控表明的温度。
在不使用散热器的情况下,满载10分钟,主控传感器温度为64度,而热成像读数为81.3度。需要说明的是主控表面有标签,实际温度应该更高。传感器读数和主控表面温度有接近20度的温差。
在盖上散热片后,散热片表面温度为30度。SSD满载10分钟后,散热片温度为36度,很明显散热片硕大的体积将热量很好的传导了出来。性能方面,两个测试条件4K 32QD的读取速度都在800-805MBps区间,十分稳定,并没有掉速情况发生,具体数据我就不再给出。
在加上散热片后,PM961满载传感器温度为48度,相比没有的情况低16度。ROG STRIX Z370F GAMING整体式散热片对于高性能的NVME SSD降温效果还是很明显的,建议用户首先安装在PCH下方带有散热片的M.2位。
ROG除了提供更强大的硬件以外,在软件方面也给玩家带来更多的附加价值。在这里我要再次强调声波雷达,这个虽然并不是新功能,但随着“吃鸡”的火爆,我觉得需要再次拿出来说下。
声波雷达3这个软件可以通过OSD的方式显示游戏里声音的来源方向,将传统的听音辨位,变成看音知位。并可以单独过滤高频,中频和低频声音,以合适不同的游戏环境。
以吃鸡为例,箭头可以标出交火的枪声和靠近的脚步声。在房里收刮装备的时候,发现箭头有变,就需要提前做好准备来Camp。
而在最后的缩圈阶段,敌人的方位判断就直接决定谁最后能够吃鸡。上面另外两个敌人交火,我就可以通过声波雷达的箭头知道敌人方向,从而最后渔翁得利。这样的声音方向指示相比最为顶级的游戏耳机都更为明晰。当然这个功能主要是对solo有用,对于duo和team模式,其会收到队友的干扰。这样的指示其实在一定程度可以让玩家获得不公平的游戏优势。我写到这里我后悔了,不应该把这种东西告诉大家,谁用声波雷达我就鄙视谁,你们都不准偷偷用哟。
性能和需求的矛盾
i9+ROG X299依然是追求4K或者2K 144Hz土豪用户的最佳选择
Coffee Lake可以说是自首代i7之后,处理器性能提升幅度最大的一次更新。这样大幅度的提升对于用户而有极大的吸引力。相比Skylake-X的7800X,8700K的性能可以说在绝大多数方面领先,无论是多线程还是单线程,甚至有不少性能都可以接近甚至超过7820X。更为重要的是其平台持有成本更低。虽然处理器价格差不多,但X299主板售价一般都在2000以上,而Z370主板售价一般都在千元左右甚至更低。原有HEDT平台多PCI Lanes的优势,在28 lanes的7800X和7820X也不明显,依然不能实现双16X的SLI。在一般应用环境,8700K全面压制7800X毫无悬念,而8C16T的7820X仅仅是在对于并发需求大的内容创作领域存在优势,但在更为看重单线程 性能的日常应用和游戏,7820X也是逊色于8700K的。SKYLAKE-X另外一点优势在于支持AVX-512指令集,这主要应用于SMID的计算上,目前应用领域都是在科学领域,如GROMACS、NAND、C-RAY,并且基本没有Windows环境下应用,和一般消费者也没什么干系。因此现在8700K在事实上已经逼死了7800X,也让7820X十分难受。7800X在7月发布,到10月事实上就没有了购买价值,可以说是英特尔历史上最为短命的CPU。而对于10核心7900X甚至更高型号的i9,8700K虽然在单线程有优势,但多线程的性能还是无法触及,这样的多线程优势使得其对多线程性能敏感的内容创作类行业客户有很大的吸引力。对于游戏用户而言,I9更大的优势在于48个PCIE lanes,更多的LANES会使得1080TI/TITAN XP SLI在4K极限负载情况下性能更为稳定,同时可以全速接驳更多的PCIE设备。I9和ROG的X299依然是想玩转4K土豪的最佳选择。
8700K相对7700K虽然核数增加一半,但其由于受到TDP的限制,频率是有所下降的。再者,由于14nm FF++的工艺红利,实际超频上限是提升的,这样的一降一升,使得超频的可玩空间更大,因此一块高规格的Z370还是必要的,就如我们本次评测的ROG STRIX Z370F GAMING。如果是想更多的折腾,尝试更高的超频频率,解决超频碰见的更多问题,那你需要的是MAXIMUS X HERO,她会有更多Debug工具,如Qcode,如果你想要自己组装分体式水冷,那就应该选择有供电水冷和水泵传感器的FORMULA ,如果你想挑战极限频率,那更强供电、更多传感器,电压读数触点和内存走线优化的APEX才是你的终极选择。而本次我们测试的ROG STRIX Z370F GAMING定位是想要小超获得性能提升的轻度玩家和想要丰富灯光效果张扬个性的玩家。
对于英特尔在桌面级领域最大的问题,不是性能无法提升,也不是来自RYZEN的竞争压力,而是用户缺乏足够性能需求。缺乏性能级的需求核心问题是在Wintel平台缺乏强需求的杀手级应用。
绝大部分用户都在使用5年前,甚至更老的平台,这样的平台已经可以满足日常非游戏类的大部分需求,非游戏用户从需求上没有动力更新自己的主机。而对于游戏用户,在15年时候 ,流行的英雄联盟GT730就可玩,在16年时候流行守望先锋用户需求被抬到GTX960,而在2017年,虽然有吃鸡这样的现象级游戏将用户需求拉到GTX1060以上。但游戏驱动的需求,核心是对GPU市场的促进,而CPU仅仅是平台更换的副产品。就如笔者自己作为AAA游戏发烧友,依然还在使用5年多前的X79平台,而显卡已经更新到GTX1070,就是十分典型的。GPU需求相对CPU可以更多收益于新概念技术发展的推动,如4K,HDR,GSYNC,这些技术都可以成倍的拉伸用户的性能需求,使得他们使得有理由说服自己付出更多的金钱。
更多的用户,特别是普通用户被从桌面拉到移动端,他们更为愿意面对手机平板,而不是电脑显示器,玩的游戏更多是王者荣耀而不是LOL。王者荣耀仅仅依靠单款游戏的外观道具付费,腾讯游戏的月流水就可以高达30亿,这样的业绩完全使得传统AAA级游戏开发商相形见绌。现在王者荣耀已经不仅是游戏,而甚至是社交工具,如果你不玩王者荣耀,甚至你在微信群里会变得和大多人没有共同语言。
移动端硬件发展就有足够的需求拉动,如现在顶级的骁龙835运行王者荣耀高帧率模式依然不能稳定60FPS,因此玩家对于手机的运算性能有更高的需求;iPhone 8新加入的FACEID、AR模式和人像摄影模式会对摄像头、传感器、ISP、处理器NPU人工智能机器学习引发新的创新功能需求,进一步的拉动硬件功能和性能的发展。现在年轻人手机更换频率一般在一到两年,甚至更短。这样的快速迭代升级对于英特尔的X86生态是望尘莫及的。
VR现在依然缺乏足够质量的内容支持 不足以成为强需求
虽然移动设备背后依然需要更多的高性能服务器云端算力来支撑,英特尔也可以从中获得很大收益;IOT物联网也是英特尔现在发力的重点;即使是在4G通讯领域,Apple iPhone 8/X也都主要使用英特尔旗下的英飞凌基带,拿下重要一城。但我们最关心的还是英特尔的X86生态。用户向移动平台转移核心问题是在X86平台下缺乏创新的杀手级应用,来触发用户需求。这样的需求是新概念的需要,如就如前两年红火的VR,更高频率,更多核心的处理器可以使得Frametime更稳定,但这个仅仅是小众需求,仅仅是在一些体验店和一些模拟类型游戏玩家群体有足够响应,VR整体热潮在今年也已偃旗息鼓。
最后总结,我综述下现在阶段对于Coffee Lake的购买建议:
对于8700K,其相对7700K多线程提升巨大,虽然游戏性能提升不大,但考虑到其价格上涨不多,依然是最强的单GPU游戏CPU。同时其超频极具可玩性,8700K也是超频玩家的首选。
8700的全核稳定频率和8700K一样都为4.3GHz,boost频率稍低,8700和8700K的频率差距远小于7700和7700K,使得两者的性能十分接近,其和8700K主要差距在于不能超频。8700在看重多线程应用的渲染/视频领域性能价格比十分出色,很合适行业客户。
6C6T的8600K无论是单线程性能和多线程性能都稍好于7700K,同时售价也有一定优势,同时也具备超频能力,还是很合适对于预算有点敏感的游戏用户。
8400的多线程性能和7700K持平,但由于主频限制单线程性能相比还是有些差距,不过考虑到其价格和上世代的i5 7500差不多,其CPU单独性价比已经十分优秀。不过问题在于现在配套的主板仅有Z370,但8400不能充分利用Z370超频、更高内存频率和更多PCIE通道的优势,而中低价位的B360/H310要明年才能推出,这样使得8400整体持有成本过高,现在阶段购买8400并不算太划算,待到明年B360/H110推出后其才会爆发。于8400情况类似的还有i3 8100,4C4T的i3 8100在规格上和性能相比7500十分接近,但同样缺乏低价价位的配套芯片组主板,使得其平台现在缺乏性价比。
这次Coffee Lake的提升幅度巨大可以更多的吸引用户升级,因此预计可以对PC市场有一拨推动,我们建议对于还在使用DDR3平台的用户可以毫不犹豫的投入Coffee Lake的怀抱,而已经是100/200系列平台的用户,可以依据自己的爱来选择。
新一代Coffee Lake简单的说:现在i3有之前i5的性能,现在i5有以前i7的性能,而现在i7可以达到以前HEDT的性能。Coffee Lake这样的规格性能提升可以说是多年未见的,对于用户而言是莫大的好处。但性能提升对于英特尔而言也会有新的问题: 处理器的性能在大幅提升,但用户需求按照前面的分析并没有同步增长,这样会使得以前有i5需要更多考虑买i3,以前有i7需求的部分也会转向购买 i5。虽然这代同级别的处理器价格在首发时候有一定的上调,但这样还是会使得用户的客单价下降。客单价下降对于英特尔和其整个x86生态都不是好事。因此对于英特尔和x86生态最为亟待需要解决的问题,还是前面提及的用户功能需求的发掘。