您的位置 首页 > 数码极客

【gtx780m】多种删减方案 剖析NVIDIA阉割芯片战略

1如何用四个芯片支撑整个显卡市场?

自从NVIDIA (WHO)在2012年初公布了28纳米制造工艺的新开普勒体系结构后,到今天2014年9月为止,这款麦克斯韦很快将继承开普勒体系结构。

开普勒架构作为一款让桌面显卡首次进入高功耗比时代的里程碑架构,已经有接近3年的寿命了,开普勒不仅仅用它惊人的工作效率给玩家带来了极强的游戏性能,而本身开普勒架构更大的意义在于它一改了原本40纳米工艺显卡的高发热量形象。首次让玩家享受到高性能,低功耗,追求最佳游戏体验。这都是NVIDIA过去无法为玩家带来的,它也充分印证了NVIDIA在图形处理器架构上面不断前进的脚步。

说到了开普勒的芯片的产品部分,必须要提的就那几个大家基本都知道的芯片型号,其中必然包括GK110,GK104,GK106,GK107这四个熟悉的不能再熟悉的名字了。因为这四个产品是任何一个游戏玩家和专业工作者最为常用的产品,也是因为它们支撑了整个开普勒市场。无论从移动产品还是桌面产品,从低端到高端,GK107支撑了大部分移动产品和低端桌面产品,而GK106在早期主要支撑中低端产品,GK104早期支撑了高端产品,而后期又可以转型成为移动产品和中端桌面产品,GK110虽然上市非常晚,但却完整的支撑了旗舰产品的性能。毫不客气的说,这四个芯片就是开普勒架构的代表。

如果从芯片角度说,我们可以说四个芯片就可以支撑一个市场,但如果从显卡角度说,这话明显就说不通了,大家不妨想一想,NVIDIA或许可以靠着4个芯片就可以支撑一个GPU市场。但显卡的市场可不是区区4个显卡就可以支撑的起来的。要知道从低端到高端,产品线可以说是丰富又复杂,从低端入门,甜品中端到高端发烧旗舰,如此之多的产品谁也无法分配4个芯片到这么多种类的显卡上面,此时就有了芯片重复利用这一说法。也就有了芯片“删减”之战略,俗话讲就是“阉割”二字,当然为了让文章更加专业一些,笔者这里一定要用“删减”二字。

由此我们就可以清楚从商家和制造商的产品定位和市场角度着手进行分析,所谓删减芯片规格的最终目的很明显是以商业性为目的的市场分配而已,目的就是分配不同规格的某个型号芯片到多个产品来丰富产线。所以这就意味着一个芯片可能会被删减多次,通常是1-2次删减。

而删减芯片规格的目的也并非是为了节约成本或者坑害消费者。这一点很多玩家和DIY爱好者误解的非常深。实际上为了丰富产品线,拉开多个产品之间性能差距。合理的删减芯片规模就是最佳方案,同时也是非常节约成本的方案。也正是因为如此的删减和阉割,很多产品的性价比才会有所提高。玩家才能买到那些称心如意的产品,要知道通常情况下完整芯片的显卡售价都不便宜。

既然说到产品线和分配问题,笔者就带领读者一同来回顾一下NVIDIA GeForce 600系列以及700系列全部产品。就拿大部分游戏玩家使用的最多的产品而言GeForce GTX660/GTX650Ti/GTX650Ti boost分别采用GK106芯片,而GeForce GTX660Ti/GTX670/GTX680/GTX690/GTX760/GTX770则采用GK104芯片,GeForce GTX780/GTXTITAN/GTX780Ti/GTXTITAN BLACK则采用GK110芯片。

我们不妨列个表明细一下:

GK106:GTX660/GTX650Ti/GTX650Ti boost

GK104:GeForce GTX660Ti/GTX670/GTX680/GTX690/GTX760/GTX770

GK110:GeForce GTX780/GTXTITAN/GTX780Ti/GTXTITAN BLACK

根据上面列表所述,我们大致是可以评估一下NVIDIA的商业策略,而甜品级中低端产品主要是GK106负责,高性能中高端产品主要是GK104负责,发烧级旗舰产品主要是GK110负责。

说到删减规格部分,通常NVIDIA删减芯片规格主要可以归类为两种“删减前端性能”和“删减后端性能”,所谓前端部分主要是显卡流处理器数量以及纹理单元TMUs数量,主要影响显卡处理能力和工作效率主要部分,直接影响显卡能生成多少FPS以及生成FPS的周期和所花时间。通常情况下后端部分代表显卡的显存位宽以及光栅单元ROPs数量,主要影响部分高端光线运算以及抗锯齿柔滑平滑处理等,是主要强化高分辨率游戏并提高细节质量的辅助部分。 (这里特别说明显存容量严格意义上讲并非显卡主要属性,也并非芯片内部规格。显存颗粒焊接于PCB,所以不属于核心部分。)

所以根据以上不同的删减方式,我们不难看出部分显卡的显存位宽从256bit降低到192bit,而ROPs也随着从24个降低到16个,而另外一部分产品则是删减了一组或者几组SMX的流处理器。所以不同显卡采用了不同的删减方式,如何删减取舍是NVIDIA需要衡量的重要部分。一个合理删减的显卡通常可以在节约成本降低价格的同时尽量减少性能的损失,而删减不太合理的产品可能会性能过高,而成本也没有明显降低。要么就是性能被缩减的过分了导致价格虚高不合理。

可见合理的删减一个芯片是多么的重要,不同的删减方式直接就可以影响一个显卡的性能!所以有句话讲“芯片架构做的好,更要切的好”。

接下来笔者便带领读者们一起观摩并分析一下,NVIDIA是如何删减这些芯片的。

2两种不同的删减方案-GK104取舍艺术

说到GK104这款开普勒中可说有顶梁柱地位的芯片,游戏玩家和DIY爱好者们不约而同的想到了诸如GeForce GTX680 GeForce GTX770 以及GTX690,甚至是某些移动产品GTX680M以及GTX780M, GTX880M等,这些产品都是完整GK104性能的代表,同时兼备功耗比和超频能力结合与一身的GK104芯片不仅体积小,成本低,良品率高。既可以高频率支撑桌面市场,又可以降低频率进入移动市场,真可以说可进可退,攻守兼备,大丈夫能伸能屈,各种能够表示高自由度和高灵活性,类似的词汇你都可以用来形容它,完全不觉得过分。

然而很多人也忽视了GK104最大的优点,那就是它具备不同等级的删减版本直接让NVIDIA的中端市场变得充实了,可以说是GK104撑起了NVIDIA的中端产品线,甚至更夸张的说,它也是NVIDIA利润主要来源之一。这都归功于GK104自由度高的优势,可以进行多种不同程度的删减,从而一个核心同时应用于多个产品,而本身成本低,良品率又占据优势的GK104轻松可以支撑大半个市场,而即使在今天GK110作为旗舰产品逐渐代替GK104高端产品中的位置,GK104仍旧具备难以撼动的地位。或许它会一直持续到NVIDIA发布GM204后才会真正被彻底代替。

而要说到NVIDIA对于个GK104这个芯片删减规模中最为经典的两个例子,绝对是GeForce GTX760与GTX660Ti这两个不同删减方案的代表作品。

GeForce GTX660Ti-偏向于后端部分删减的方案

说到GTX660Ti,相信很多游戏玩家和显卡发烧友都非常熟悉,因为GTX660Ti几乎是开普勒架构中争议最大的产品之一,一度流传的GTX660Ti仅有192bit对应1500MB显存的说法直到今天仍旧存在。而这里要分析是作为一个GK104删减后的经典案例,GTX660Ti是如何删减规模的呢?

GK104早期的两款中高端产品

这里我们拿出一个规格对比图片可以一目了然的看到,GTX660Ti对比GTX670最大的变化在于显存位宽缩减到了192bit,这样导致同样6000MHz显存频率下,GTX660Ti的显存带宽则远低于GTX670,而这样一点肯定会被很多不太懂显卡的消费者看到,因为更多的不懂显卡的人喜欢以显存位宽判断性能。

而另外一点住的注意的就是:GTX660Ti的流处理器数量和GTX670完全一样,均为1344个,可见它们的SMX数量是完全相同的,才会有相同的流处理器数量,同时也意味着有相同的纹理单元数量。而且两款产品的频率也没有任何区别。可见同等频率下,GTX660Ti拥有大约等同于GTX670的核心处理能力,同时对于高特效和抗锯齿等后期处理部分GTX660Ti则较为虚弱,而面对高分辨率和高特效的游戏,GTX660Ti显然会和GTX670拉开较大差距。这便是删减后端部分最明显的影响。这也就是为什么GTX660Ti在某些低特效压力较小的单机游戏里面反而表现出仅次于GTX670的成绩。主要原因还是因为显存带宽以及光栅单元数量不足造成的。其中因为显存位宽的减少到192bit,光栅单元也从32个降低到了24个。

这或许才是GTX660Ti高分辨率成绩较差的主要原因,显然这和网络上流传的GTX660Ti只能利用1500MB显存的说法不同。影响成绩的关键还是后端部分。

GeForce GTX760-偏向于前端部分删减的方案

GK104后期的两款中高端产品

通过规格列表可以看到,GeForce GTX760同样也是一款GK104的删减后的产品,而却与GTX660Ti呈现了完全不同的特点。显然GTX760的前端规格部分收到了重创,流处理器从1344个进一步删减到了1152个,而纹理单元也降低到仅有96个规模了。唯一完好的是保留了几乎完整的后端部分,与完整的GK104相同的显存位宽和光栅单元数量。

或许是因为这个原因,GTX760的高分辨率和低分辨率表现几乎是差不多的,并没有明显降低,而GTX760因为默认频率更高,配备了GPU boo加速机制,也轻松得到了比GTX660Ti更高的性能。这就是同样一个芯片不同的删减方案带来的不同影响。而GTX760很聪明的靠着自己的高频率弥补了流处理器数量的损失。而后端规格完整让它不畏惧高特效高分辨率。

经过了对GK104两种不同方案的剖析,我们可以清楚的了解到,不同的删减方案将会带来不同的结果,就如同GTX660Ti和GTX760同时作为GTX670删减后的方案,但它们却得到了不同的结果。虽然GTX760也付出了一些频率代价,但显然NVIDIA认为有GPU boo情况下这些频率代价是可以弥补的。这恐怕就是“取舍的艺术吧”?

3GK106-轻重两刀带来不同结局

说到GK106这款这款芯片显然很多消费者也并不陌生,作为一款主流级的产品定位,GK106几乎支撑了整个GeForce 600系列的所有中低端产品。也是大部分玩家都经常用的产品范围。

GK106本身芯片体积较小,仅配备了192bit以及24个ROPs。这样的规模非常像是GK104删减之后的规格。从后端部分来看和GTX660Ti非常相似。同时GK106芯片的流处理器仅有960个,这样数量的流处理器远要比GK104少太多了。

GK106看上去很像GK104切了一刀的样子

而可以代表GK106的显卡当然是GeForce GTX660/GTX650Ti/GTX650Ti boost这三款产品了,显然GK106在桌面产品中的数量远不如GK104,而且细心的显卡爱好者已经不难发现,自从NVIDIA进入GeForce 700系列以后,GK106已经很少在桌面产品中出现了,而NVIDIA似乎直接采用了GK104代替所有的GK106。从此GK106便逐渐悄悄隐退。

而GTX660便是搭载了完整GK106芯片的显卡代表,GTX650Ti/GTX650Ti boost这两款产品分别可以代表GK106删减规格中作为经典的范例。让我们通过一个图片就可以较为直观的对比。

GK106两种删减方案规格对比

重重一刀,前后都砍-GeForce GTX650Ti

说到GTX650Ti,对于低端产品较为熟悉的玩家很多都用过这张卡,由于该卡仅有128bit显存位宽,定位比较低,更多的人不会质疑它的性能,更不会期待它能带动什么大型游戏。

但它仍旧可以作为一个GK106删减的最佳代表之一,作为完整版GK106删减出来的版本,GTX650Ti的性能非常之低,远要比完整GK106的GTX660低了太多了。是如何原因造成如此大的性能降低呢?

这里我们拿出一个规格对比图片可以一目了然的看到,GTX650Ti真可以说是重重一刀毫无翻身机会了,不仅前端部分的流处理器和纹理单元大幅缩减,而后端部分的显存位宽和光栅单元直接让它从一个中端级别显卡缩减成了名副其实的低端卡。

这也就是为什么性能如此大落差的原因了,毕竟删减了这么多地方。性能当然损失很大了。而GTX650Ti不仅仅是128bit和5400MHz导致它的显存带宽无法承受高分辨率。而本身16个光栅单元也导致它无法适应抗锯齿需求。而即使它看起来有不少流处理器和纹理单元,但仍旧改变不了它是个低端卡的事实。

轻轻一刀,砍前不砍后-GeForce GTX650Ti boost

说到GTX650Ti boost这张卡,至今都是NVIDIA GeForce 600系列里面广受好评的产品之一,原因就是它出奇低的价格和优秀的超频能力结合一体。而且它几乎是保留了几乎完整的后端部分,这让它高分辨率表现自然和GTX660差距缩小。这款产品自从NVIDIA发布出来对位HD7850之后,一直都非常受到欢迎,其原因自然是因为这张卡的规格删减非常有机巧。

观看规格表我们不妨可以看到,GeForce GTX650Ti具备完整GK106的显存位宽和光栅单元,而其中流处理器和纹理单元进行了小规模删减,规模持平于GTX650Ti。但两张卡的性能确实截然不同,差距甚大,GTX650Ti的性能损失巨大,而GTX650Ti boost只有略微小的损失。仍旧可以作为一个中端产品偏低的位置支撑市场,而GTX650Ti显然性能不足以承受高压力单机游戏。

通过了GK106两次轻重不同的删减,大家不妨看出了一个细节,那就是删减规模这一刀砍得轻与重,关键是看前端和后端的完整度。通常砍了前端而不砍后端的显卡往往性能保留完整,在高分辨率受到影响也较小。而删减了显存位宽和光栅单元的显卡基本都会直接性能大跌。而且那些删减了前端规模的显卡也都有一个小细节,就是提高了核心频率来弥补流处理器的不足。或许这就是删减规模的技巧所在。

4惊天一刀不致命-重伤GK110仍可战

GK110作为开普勒在2013年发布的新主力产品,也作为性能最高的代表作品,直接撑起了高端旗舰产品的市场。作为一款发烧级旗舰产品定位,GK110搭载的产品均是高价格旗舰产品。尽管上市时期较为晚,而GK110搭载了三款产品 GeForce GTX 780以及GTX780Ti,还有著名的GeForce GTXTITAN系列。其中GTXTITAN BLACK的规格同GTX780Ti完全相同,暂时可以视为一个产品。

GK110本身芯片体积巨大,不仅芯片体积做到了561 mm²。而且配备了完整的15组SMX一共包含240个TMUs以及2880个流处理器。这样的规格看起来很像是两个GK104的规模,或许也是正是因此如此一个高频率的完整GK110性能应该是较为接近两个GK104芯片的性能,这样的推理结果直接印证了GTX690和GTX780Ti较小的性能差距。

GK110应该是目前最大的一个芯片

作为旗舰产品的芯片,可以代表GK110的显卡当然是GeForce GTX780/GTXTitan/GTX780Ti这三款产品了,尽管旗舰产品在市场中的地位面向少数高端群体,这就意味着它们的市场占据比例必须会非常小,而为数不多的GK110仍旧可以靠着三个产品支撑旗舰市场。抛开GTX Titan不属于GeForce 700系这个特例,GK110仍旧也有一款GTX780作为删减版本出现。而GTX Titan也是完整GK110的另外一个小幅度删减版本。

让我们通过一个图片就可以较为直观的对比GK110三张卡的规格。

所有GK110显卡规格横向对比

聪明的选择-砍前不砍后,还要拉高频率

如果用一句话来形容GK110的删减方案,那么就是“聪明的选择”这句话,或许是GK110作为NVIDIA最后一款开普勒芯片发布,而NVIDIA经过了多次删减GK104和GK106规模已经得到了不少经验了,所以非常清楚哪些地方影响小,又能拉开性能差距并节约成本。因此,GK110很聪明的全部采用了删减前端部分的方式。这里通过图片可以看出,所有GK110显卡的显存位宽以及ROPs均为恒定的384bit/48个。而只有流处理器和纹理单元进行了不同程度的删减。而GTXTITAN虽然看起来规模仅次于GTX780Ti似乎没有较大幅度删减,但很不幸的是,GTXTITAN的工作频率较低,默认频率只给了很低的数值,这显然是它成绩低的主要原因。毕竟它只有876MHz的加速频率基础值。

而GTX780的情况就不同了,GTX780的芯片删减幅度可以说非常之大,真的可以用“惊天一刀”来形容,但虽然收到了“惊天一刀”的超高伤害,而GTX780反而性能损失看起来并没有很大,反而价格降低了很多,这一点其实不难理解,因为GTX780GHZ版本的频率很高,当拉高一定频率的时候,配合GPU boost 2.0就可以明显提高显卡工作频率。这样的情况下兴许就可以弥补一些流处理器的损失。虽然在同等频率下必然是流处理器多的一方是胜者,但删减了规模的一方却可以很容易降低成本和价位,合理的定位于更低的市场位置。所以GTX780并没有因为受到惊天一刀而遭受重创,反而提高了核心频率以后还能维持很高性能。

通过了GK110的两次删减,我们也不难发现一个细节,就是NVIDIA这一次聪明狡猾的直接删减了流处理器数量,甚至完全没有考虑碰显存位宽和光栅单元,一方面是因为高端旗舰显卡必须具备足够强大的规格承担高压力单机游戏。另外一方面就是NVIDIA已经掌握了性能损失较少的删减技巧了。

5会做芯片是技术 会切芯片是艺术

经过了笔者总结了GK104 GK106 GK110三款芯片不同程度的删减方案,同时也拿出了NVIDIA几乎所有的经典案例汇总。读者们多少通过这样的简单的分析领悟了很多关于芯片规格的重要知识,而芯片中每一个指标都是非常重要的,不管是前端部分还是后端部分,一旦显卡规格进行删减,那么势必会造成巨大性能损失,而如何删减才能让损失减少,或者哪种删减可以更容易弥补性能损失。这才是芯片制造商要考虑的重要问题。

而通过了以上一些真实案例的分析总结,我们不难发现“删减后端往往要比删减前端更为致命”,于是很多DIY爱好者也发现了这一点,他们一看到删减了显存位宽的显卡就认为是非常“坑爹”的体现。事实上这种说法也不一定绝对正确,因为删减前端的损失并不比后端小,只是因为显卡提高了核心频率以后多少弥补了一些流处理器数量上的损失。而通过高频弥补的这种战术,必须建立在芯片具备一定体质和良品的基础上,同时还要确保显卡的PCB和其他元件以及制造工艺上面一同配合才行。

换而言之,NVIDIA今天删减前端损失较少的删减方法并非可以随意效仿的,因为早前没人预想到新一代显卡的工作频率可以超频的如此之高,更没有人想到NVIDIA还首次加入了动态GPU boost这种特殊工作机制,毕竟这种机制在GPU上可是第一次采用。而NVIDIA这样的“原创”战术也确实让人不得不佩服。

芯片做得好是不够的 还要学会如何“切”出艺术

经过了NVIDIA“切”芯片真是案例回顾以及删减规模的简单分析以后,纵观整个NVIDIA 开普勒架构产品线,大部分的产品都是通过这样的方式进行合理分配的,同样一个芯片经过了多种不同的删减处理,完全可以形成新的产品,单独适应另外一个产品线。而NVIDIA和AMD其实都是用了这样的方式才满足了市场需求。对比AMD来说,NVIDIA删减手段更加自由和艺术化,不仅要砍的狠,还不能致命。惊天一刀砍下去,还能拉高频率把性能补回来很多。这确实是需要“经验”。

经过了GTX660Ti与GTX760这两种GK104不同的删减方案,最终影响了它们两个不同的命运,GTX660Ti由于删减了后端部分性能损失惨重,而高分辨率游戏受到限制。而GTX760虽然流处理器比GTX670还要少,但由于保留了完整的显存带宽和光栅单元,配合GPU boo有效的弥补了性能损失。反而成为了一个成功例子。而这样的例子也被NVIDIA后续产品做了参考。这就是两种不同角度的删减带来不同结局。

而对于GK106的两种轻重不同删减方式,我们更是知道了前端与和后端同时删减的情况下对显卡的性能损失更大,通常可以直接让一个中端显卡变成低端卡。这些性能损失都是建立在流处理器,纹理单元,光栅单元,显存带宽这几个主要指标上面,而GTX650Ti boost是第二个成功的例子,原因是它很聪明的和GTX760一样紧紧删减了流处理器和纹理单元,还维持不变的核心频率。导致几乎没有折损太多性能。这就是芯片删减过程中把握轻重度数的重要性。

而GK110的删减则是一个充满经验和技巧的方案,多次删减出经验的NVIDIA对此显得熟能生巧,一下就找到了完美的比例,虽然GTX780身重致命伤,流处理器一下删减了500多个,仅有2304个流处理器的GTX780GHZ仍旧可以靠着高频率反超那些频率追不上它的对手。这就是所谓的“惊天一刀却不致命”。

新的芯片更要考虑如何去“切”

经过了笔者全篇文章对NVIDIA删减规模之艺术进行的剖析,读者应该对芯片规格删减技巧多少明白一些门道,相信很多读者已经了解到删减芯片规模对于显卡性能有着重大的影响,GTX760和GTX660Ti告诉我们两种不同的删减方式将会造成不同的结果,而GTX650Ti与GTX650Ti boost告诉我们删减程度的轻重对一个显卡性能影响是致命的,而GTX780告诉我们合理的删减规模不仅可以缩减成本,还可以减少性能损失。这几位显卡用它们亲身经历告诉我们:合理的删减芯片规模是多么的重要,学会“切”芯片也是一门艺术。

无论AMD还是NVIDIA都会每代设计几颗核心,然后通过对每款核心进行规格屏蔽获得不同型号,这样做的好处是提升良率、提升型号数量、降低研发周期等。那么NVIDIA在这方面具体是怎么做的呢?看看本文编辑为您做的简单解析。

林光楠

关于作者: admin

无忧经验小编鲁达,内容侵删请Email至wohenlihai#qq.com(#改为@)

热门推荐