泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

游戏体验最重要!NV显示技术效果实测

    基于效能和计算能力方面的考虑,NVIDIA与AMD不约而同的改变了架构,NVIDIA虽然还是采用SIMT架构,但也借鉴了AMD“较老”的SIMD架构之作法,降低控制逻辑单元和指令发射器的比例,用较少的逻辑单元去控制更多的CUDA核心。于是一组SM当中容纳了192个核心的壮举就变成了现实!

GTX680架构解析:GPU版开普勒三大定律

    通过上面这个示意图就看的很清楚了,CUDA核心的缩小主要归功于28nm工艺的使用,而如此之多的CUDA核心,与之搭配的控制逻辑单元面积反而缩小了,NVIDIA强化运算单元削减控制单元的意图就很明显了。

    开普勒中NVIDIA将一大部分指令派发和控制的操作交给了软件(驱动)来处理。而且GPU的架构并没有本质上的改变,只是结构和规模以及控制方式发生了变化,只要驱动支持到位,与游戏开发商保持紧密的合作,效率损失必然会降到最低——事实上NVIDIA著名的The Way策略就是干这一行的!

GTX680架构解析:GPU版开普勒三大定律

The Way(游戏之道)计划可以保证NVIDA的GPU架构与游戏完美兼容

开普勒核心:SMX与SM的改动细节

    全新的Kepler相比上代的Fermi架构改变了什么,看架构图就很清楚了:

Fermi GF100/GF110核心架构图

1

GeForce GTX 660(GK106)核心架构

    GeForce GTX 660的核心非常奇特,拥有5组SMX单元,“两个半”GPC。莫非是受到Tegra3五核心的启发?

    NVIDIA把GK104的SM(不可分割的流处理器集群)称为SMX,原因就是暴增的CUDA核心数量。但实际上其结构与上代的SM没有本质区别,不同的只是各部分单元的数量和比例而已。具体的区别逐个列出来进行对比:

GTX680架构解析:GPU版开普勒三大定律

    通过以上数据对比不难看出,GK104暴力增加CUDA核心数量的同时,SFU和TMU这两个与图形或计算息息相关处理单元也同比增加,但是指令分配单元和线程调度器还有载入/存储单元的占比都减半了。这也就是前文中提到过的削减逻辑控制单元的策略,此时如何保证把指令和线程填满一个CUDA核心,将是一个难题。

0人已赞

关注我们

泡泡网

手机扫码关注