泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

DX11性价比之王!GTX460双雄权威评测

第二章 GF104核心架构全解析

第二章/第一节 GF104核心SM架构的改进

DX11性价比之王!GTX460

    相信细心的读者已经看出来了,GF104相比GF100,最主要改变就是GPC(图形处理器集群)从4个减至2个,显存控制器从6个64bit(共384bit)减至4个64bit(共256bit),而最最重要的改变就是——

● 每组SM当中的CUDA核心数量从32个增至48个

    按照常理来说,对于SM(流处理器簇)这一级的模块,已经没必要再重新设计或者进行调整了,直接保留GF100的设计,然后根据需要复制出一定的规模,新的核心就诞生了。但是在规格直接减半之后,虽然晶体管数和核心面积都会减半(参照Cypress与Juniper),但性能也会损失近50%,NVIDIA认为这并不是非常好的的方案。

    那该怎么办呢?我们知道,对GPU性能影响最大的模块就是流处理器(CUDA核心),如果能在GPU内部尽可能多的塞入CUDA核心的话,性能方面就会有很大的提升。但是CUDA核心也会消耗不少的晶体管,如果晶体管数太过庞大的话,GPU制造成本、良品率、功耗、发热也会受到较大影响。

DX11性价比之王!GTX460

    那有没有两全其美的方法呢?大家可以注意看GF100芯片透视图,其中间位置有1/3的面积,这些是GF100一体式的二级缓存。NVIDIA为了提升GPU并行计算的效率,像CPU那样不惜成本的设计了大容量L2。L2对于性能的贡献主要集中在密集型计算任务当中,而对于普通的图形渲染来说,贡献就非常小了。那么如果将这些L2的容量进一步压缩,把节约出来的晶体管都变成CUDA核心的话,那么图形渲染性能将会得到显著提升。

DX11性价比之王!GTX460

GF104的SM要比GF100“胖”一些,CUDA核心横向扩张

    于是,拥有较小L2、较多CUDA核心的GF104就诞生了,新核心每组SM中包含CUDA核心的数量从32个增至48个,增加了50%,流处理器总数达到了384个。NVIDIA在晶体管数一定的情况下,通过优化核心与缓存的配比,制造出了一颗实力超乎预期的核心。

● 每组SM当中的纹理单元数量从4个增至8个

    当然,NVIDIA也没有单纯增加CUDA核心的数量,针对GF100核心的不足之处也做了较大的改进——纹理单元数量加倍!

DX11性价比之王!GTX460

纹理单元数量加倍

    GF100核心的每组SM当中拥有32个CUDA核心,还包括了4个纹理单元,这样GF100总共就拥有64个纹理单元(GTX480屏蔽了一组是60个),远少于Cypress的80个纹理单元。较少的纹理单元使得GTX400系列在大量使用了纹理贴图的游戏中表现不佳,最有代表性的游戏就是《孤岛危机》。

    GF104核心只有8组SM,如果还是保持GF100的设计不变,那么纹理单元将只有32个,还没有HD5770多(40个)。所以NVIDIA对纹理单元部分也做了改良,每组SM中的数量直接加倍,最终GF104拥有64个纹理单元,与GF100相等!

    CUDA核心数量增加了50%,而纹理单元增加了100%,改进意图显而易见。

0人已赞
第1页:Fermi家族再添新丁!NV发布全新重磅产品第2页:图形架构设计思路:小修小补与重新设计第3页:高端产品设计思路:小核心与大核心之战第4页:中端产品设计思路:一刀两半与优化设计第5页:改进流处理器架构:CUDA增50%纹理增100%第6页:优化流处理器效率:特殊功能和指令分配第7页:删除无用功能单元:显存ECC和双精度第8页:经典G92核心再世!GTX460保留实力第9页:特色功能之战:GTX460支持音频源码输出第10页:特色功能之战:3D Vision雄霸天下第11页:特色功能之战:双卡三屏对抗Eyefinity第12页:特色功能之战:AMD无法染指的物理加速第13页:特色功能之战:CUDA遥遥领先于Stream第14页:NVIDIA公版GTX460 1GB显卡实物拆解第15页:NVIDIA公版GTX460 768MB显卡实物拆解第16页:首批GTX460显卡:索泰1GB和768MB第17页:首批GTX460显卡:七彩虹非公版1GB第18页:首批GTX460显卡:影驰非公版1GB第19页:首批GTX460显卡:翔升非公版1GB第20页:首批GTX460显卡:映众微星旌宇768MB公版第21页:测试平台:Core i7 875 + P55第22页:DX9C理论:《3DMark06》第23页:DX9C游戏:《使命召唤6:现代战争2》第24页:DX9C游戏:《星际争霸2:自由之翼》第25页:DX9C游戏:《极品飞车13:变速》第26页:DX9C游戏:《蝙蝠侠:阿卡姆疯人院》第27页:DX10理论:《3DMark Vantage》第28页:DX10游戏:《孤岛危机:弹头》第29页:DX10游戏:《冲突世界:苏联进攻》第30页:DX10.1游戏:《孤岛惊魂2》第31页:DX10.1游戏:《鹰击长空》第32页:DX11理论:《Heaven Benchmark 2.0》第33页:DX11游戏:《BattleForge》第34页:DX11游戏:《尘埃2》第35页:DX11游戏:《潜行者》第36页:DX11游戏:《异型大战铁血战士》第37页:DX11游戏:《战地:叛逆联队2》第38页:DX11游戏:《地铁2033》第39页:DX11演示:《石巨人》第40页:附加测试:GTX460待机功耗低于HD5770第41页:附加测试:GTX460最高仅66度第42页:附加测试:CUDA性能之蛋白质折叠第43页:附加测试:CUDA性能之视频转码第44页:附加测试:GTX460高频版大战HD5850第45页:成绩汇总:GTX460 1GB比768MB强多少第46页:成绩汇总:GTX460比GTX465强多少第47页:成绩汇总:GTX460 1GB PK HD5830第48页:成绩汇总:GTX460 768MB PK HD5830第49页:全文总结:千元显卡市场重新洗牌

关注我们

泡泡网

手机扫码关注