泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

DX11性价比之王!GTX460双雄权威评测

    泡泡网显卡频道7月12日  在笔者的印象中,首款DX11显卡HD5870/5850好像就是刚发布没多久的新产品,可是将以前的首发评测文章翻出来之后才发现,原来这已经是九个月以前的事情了。之所以会产生这样的错觉,是因为AMD的HD5000系列显卡自发布以来就基本上没降价,而且一直在市场上保持的一定的热度,这真是一件不可思议的事情。

    HD5800系列在DX11时代唱了大半年的独角戏之后,NVIDIA终于正式发布了GF100核心的GTX480/470显卡,全新的架构、超强的曲面细分性能给大家留下的深刻的印象,但较高的功耗与发热也成为挥之不去的阴霾,实际游戏性能也没有带来惊喜,让很多NFan们扼腕叹息。

DX11性价比之王!GTX460双雄权威评测

    GTX480/470以及后来发布的GTX465未能给HD5800系列造成多大的压力,这是HD5000系列价格坚挺的主要原因。竞争力不足导致NVIDIA在DX10时代积累的优势正在被对手追上,中低端产品线的青黄不接也让NVIDIA损失了很多市场份额。

NVIDIA GTX465

    NVIDIA迫切的需要一款重量级DX11新品出来压阵,这款显卡必须在千元价位拥有超强的性能、合理的价格、在保留NVIDIA一贯优势技术的基础上、进一步增强功能、并控制功耗和发热。这样才能稳定AIC的军心,证明NVIDIA在GPU领域的设计与研发实力。

    这就是今天我们要评测的一款产品——GeForce GTX 460,基于NVIDIA最新的GF104核心,首发产品分为1GB 256bit和768MB 192bit两个版本,官方定价是1499和1299元。他们将会彻底打破HD5000系列的防线,成为2010年度最具性价比的DX11显卡。

第一章 NVIDIA与ATI截然不同的GPU设计理念

    如果您以为NVIDIA与ATI这两大图形显示巨头只是在单纯的拼技术与实力,那就大错特错了。技术方面是可以相互借鉴与学习的,而真正有趣的就是双方在战术和谋略方面的博弈,每一代产品之间的较量都可以用惊天地、泣鬼神来形容。

    远的不说,从DX10时代谈起,看看双方是如何规划每一代产品的。

第一章/第一节 图形架构设计思路:小修小补与重新设计

ATI图形架构设计思路:单纯扩充流处理器规模,架构保持不变

    从DX10到DX10.1再到DX11,转眼间显卡已经发展到了第四代,但有经验的读者应该可以发现,ATI的新产品只是在R600核心的基础上添加新的ShaderModel指令集并扩充流处理器规模而已,对于GPU图形架构的改进十分有限甚至原封未动。

Cypress核心架构图:相当于并排放置了两颗RV770

    R600核心奠定了ATI最近四代GPU架构的基础,我们知道R600是一颗非常失败的核心,RV670也好不了太多,但它的架构却在RV770和Cypress核心上面大放异彩。

    从HD2000到HD3000,核心架构原封未动,只是为SIMD赋予了DX10.1(ShaderModel 4.1)指令集的支持,新工艺解决了功耗发热过大的问题,但AA效能依然十分低下;

    从HD3000到HD4000,SIMD规模增加了2.5倍,同时放弃了令人诟病的Shader AA和环形总线(显存控制器),回归了传统的ROP AA和交叉总线,抗锯齿效能恢复正常之后的HD4000性能表现非常优异;

    从HD4000到HD5000,SIMD规模再次倍增,赋予DX11(ShaderModel 5.0)指令集的支持,并额外附加一些先进技术和功能,大获成功!

    ATI保持R600的架构不变,只是单纯的扩充流处理器的规模,并紧跟微软脚步第一时间对新API提供支持。这样的做法有很大的优势,那就是可以在很短的时间内完成新一代产品的研发,并迅速推向市场。

    新产品由于运算单元数量的倍增,在老游戏中的性能也很不错,在部分新游戏中的表现也算不错,但在应用了大量新技术的DX11游戏中就差强人意了。

NVIDIA图形架构设计思路:新的API需要新的架构,为DX11重新设计

    其实,此前NVIDIA方面也是如此,G92/GT200相对于G80也只是强化了并行计算架构,虽然对流处理器的排列组合做了一些微调,但整体架构没有本质变化。到了DX11时代,NVIDIA认为旧的架构已经不适合新技术和新游戏的需要,有必要对GPU架构进行大幅度的改进、甚至是重新设计。

为GT200架构添加DX11和Tessellation支持是很容易的

    实际上G80和GT200的架构也是非常优秀的,ATI即便有DX10.1的辅助,同时代产品都没能占得任何便宜。ATI沿用R600的架构推出了DX11产品,按理说NVIDIA为GT200添加DX11支持也不是什么难事,性能也不会差,那为什么NVIDIA不这样做呢?

    因为NVIDIA发现了GPU新的瓶颈:从NV30到GT200核心,GPU的渲染能力提升了150倍,但几何性能的增长居然连3倍都不到!这个问题此前未能得到重视,因为游戏中的几何图形转换大多交给CPU来计算,而到了DX11时代,新增的Tessellation技术对GPU几何图形处理能力提出了新的要求,此时如果继续沿用上代架构显然会制约DX11性能,成为新的瓶颈!

GTX480的几何性能达到GTX285的8倍之多!

    于是GF100架构应运而生了,NVIDIA没有像对手那样以新瓶装旧酒的方式加入DX11支持,而是将整个GPU架构推倒重来,完全针对DX11的特性而优化设计。GF100核心被划分为模块化设计,整颗核心拥有4个Raster Engine(光栅化引擎)和16个PolyMorph Engine(多形体引擎),从而保证了新一代的架构拥有十几倍于上代产品的几何性能和曲面细分能力,确保新一代产品拥有最强的DX11性能。

    不过NVIDIA这样的做法也有些超前,几何性能和曲面细分性能确实是对手的十几倍,但如此巨大的优势并不能如愿以偿的带入实际DX11游戏当中,因为目前的DX11游戏还没有大量使用这些尖端图形技术。除了Benchmark和Demo之外,NVIDIA还需要新一代游戏的支持才能获得更多游戏玩家的认可。

第一章/第二节 高端产品设计思路:小核心与大核心之战

    自GPU诞生以来,ATI和NVIDIA双方都是使出浑身解数,先竭尽所能的制造出一颗最强的GPU,然后再去精简规格和功能,衍生出一些中低端产品。而最强GPU的性能往往受制于半导体制造工艺、功耗和散热设备,如果没有这些客观条件的限制,天知道他们会把GPU做成什么样子。

DX11性价比之王!GTX460

图例:如果用1000nm工艺制造Core i7,其核心面积将会有一本书这么大

ATI高端产品设计思路:小核心打主力,双核心称王

    R600的失败有着多方面的原因,ATI始终认为架构方面是没有问题的,问题出在制造工艺方面,核心漏电流太高导致功耗发热十分恐怖,良品率太低导致产量有限,只能阉割了再卖。可是台积电拥有的已经是当今非常先进的GPU制造技术,所以问题不在于台积电,只可能出在自身——不应该把GPU设计的如此之大,超出了半导体制造工艺所能承受的范围。

AMD的产品线设计思路

    于是在R600之后,ATI痛定思痛,决定放弃沿用了数十年之久的大核心策略,首先制造一颗在制造工艺允许范围内、晶体管规模适中、成本在主流中高端玩家可以接受的轻量级核心。这款产品将会是市场上的主流,经过精心的优化设计之后,良率和功耗发热都必须控制得相当出色。

    对于旗舰级产品也不放弃,使用两颗核心通过CrossFire技术互联起来,性能提升可达1.8倍,这样的产品可以满足厂商的虚荣心以及发烧游戏玩家狂热的追求。

    于是在接下来的三代产品中,ATI的小核心策略一步一步的走向成熟,NVIDIA所承受的压力一代比一代大。RV670由于自身AA效能低下的问题无所作为,RV770则打了一场漂亮的翻身仗,Cypress的HD5970至今依然是王者。

NVIDIA高端产品设计思路:小核心还是巨无霸?

    其实NVIDIA很早就尝过了小核心策略的甜头,DX9C末代产品G71就是很好的例子,GF7900系列凭借很高的性价比和较低的功耗发热,备受游戏玩家推崇,而ATI当时的X1900系列虽然拥有更强的实力,但市场表现一般,性能之王依然被双G71核心的7950GX2夺走。

    可是,DX10时代的G80核心取得了更大的成功,NVIDIA居然使用落后的90nm工艺制造出了一颗如此庞大的核心,真是让人难以置信。R600的核心规模与G80相当,使用了更先进的80nm工艺都未能战胜G80。

    R600之后ATI开始转型,NVIDIA也意识到了巨无霸核心的不足,开始有针对性的对GPU进行优化,这就诞生了规模较小的G92核心,这颗核心一连沿用了三代,单核心、双核心、衍生品不计其数,是近年来最经典的作品。

DX11性价比之王!GTX460

GTX260与HD4870卖同样的价钱,大核心显然要吃亏一些

    G71和G92这两颗小核心的成功并没有让NVIDIA产生放弃大核心的念头,下一代GT200依然是一颗巨无霸,性能表现非常出色,但成本居高不下。随着RV770核心的HD4870发布之后,给GTX260造成了前所未有的压力;双RV770核心的HD4870X2,更是迫使NVIDIA不得不拿两颗GT200b也制造出一款双核心显卡来与之抗衡,两颗巨无霸的成本和难度可想而知,虽然主动权依然掌握在NVIDIA手中,但大核心策略首次显露出疲态。

    到了DX11时代,NVIDIA依然走大核心路线,GF100核心晶体管数高达30亿,达上代GT200的两倍以上,使用尚未完全成熟的40nm工艺,制造难度可想而知。GF100优秀的架构与先进的技术特性是毋庸置疑的,但不可避免的遇到了良率和漏电问题的困扰,导致功耗发热较大,旗舰产品居然都不是完整规格。

    NVIDIA当然也有自己的打算,坚持大核心策略的另一目的,就是要进军HPC市场,为客户设计运算能力最强的产品,按照客户的要求定制产品(如显存ECC、双精度浮点运算)。想要用一颗核心去兼顾HPC与游戏两个截然不同的市场,确实非常困难。

第一章/第三节 中端产品设计思路:一刀两半与优化设计

    有了高端产品撑腰之后,中低端产品的设计思路就非常简单了,架构已经定型,无需再做什么修改,基本上就是把规格砍为1/2、1/4这样一级级减下去,一系列产品都诞生了……

从Cypress(HD5870)到Juniper(HD5770):所有规格全部减半

    以往的历代产品,NVIDIA和ATI几乎都是这样做的。现在,ATI也还是这样做的,HD5870与HD5770的关系就是如此:

GTX460

Cypress与Juniper架构对比

    通过架构图来看,Juniper核心无论SIMD阵列还是ROP输出部分都只有Cypress的一半,也就是说流处理器、纹理单元、光栅单元、一二级缓存、显存控制器全部减半。Cypress很像是由两颗Juniper组合而成的核心。

从GF100(GTX480)到GF104(GTX460):尽最大努力加强规格

    按理说,NVIDIA也应该会把GF100核心的主要规格全部减半,从而制造出一颗拥有256SP 256Bit的主流核心。事实上之前国内外的媒体都是这样猜测的,因为GF100模块化四核心的设计,很容易将其“拆分为”规模大小不一的中低端核心:

DX11性价比之王!GTX460

    如上图所示,GF100为四核心设计,将它变为1/2、1/4就能轻而易举的获得中端和低端GPU,但NVIDIA却没有这样做,最终GF104核心的规模出乎所有人的预料!

    乍一看,GF104就是GF100被一刀切成两半的规模,但请大家仔细看看到底有何不同?这里提醒大家一下:完整的GF100核心拥有512个CUDA核心,完整的GF104核心拥有384个CUDA核心,显然GF104核心并非是GF100一半的规格,NVIDIA在微观架构方面做了不小的改动,下一章笔者就为大家详细分析NVIDIA为什么要这样做。

第二章 GF104核心架构全解析

第二章/第一节 GF104核心SM架构的改进

DX11性价比之王!GTX460

    相信细心的读者已经看出来了,GF104相比GF100,最主要改变就是GPC(图形处理器集群)从4个减至2个,显存控制器从6个64bit(共384bit)减至4个64bit(共256bit),而最最重要的改变就是——

● 每组SM当中的CUDA核心数量从32个增至48个

    按照常理来说,对于SM(流处理器簇)这一级的模块,已经没必要再重新设计或者进行调整了,直接保留GF100的设计,然后根据需要复制出一定的规模,新的核心就诞生了。但是在规格直接减半之后,虽然晶体管数和核心面积都会减半(参照Cypress与Juniper),但性能也会损失近50%,NVIDIA认为这并不是非常好的的方案。

    那该怎么办呢?我们知道,对GPU性能影响最大的模块就是流处理器(CUDA核心),如果能在GPU内部尽可能多的塞入CUDA核心的话,性能方面就会有很大的提升。但是CUDA核心也会消耗不少的晶体管,如果晶体管数太过庞大的话,GPU制造成本、良品率、功耗、发热也会受到较大影响。

DX11性价比之王!GTX460

    那有没有两全其美的方法呢?大家可以注意看GF100芯片透视图,其中间位置有1/3的面积,这些是GF100一体式的二级缓存。NVIDIA为了提升GPU并行计算的效率,像CPU那样不惜成本的设计了大容量L2。L2对于性能的贡献主要集中在密集型计算任务当中,而对于普通的图形渲染来说,贡献就非常小了。那么如果将这些L2的容量进一步压缩,把节约出来的晶体管都变成CUDA核心的话,那么图形渲染性能将会得到显著提升。

DX11性价比之王!GTX460

GF104的SM要比GF100“胖”一些,CUDA核心横向扩张

    于是,拥有较小L2、较多CUDA核心的GF104就诞生了,新核心每组SM中包含CUDA核心的数量从32个增至48个,增加了50%,流处理器总数达到了384个。NVIDIA在晶体管数一定的情况下,通过优化核心与缓存的配比,制造出了一颗实力超乎预期的核心。

● 每组SM当中的纹理单元数量从4个增至8个

    当然,NVIDIA也没有单纯增加CUDA核心的数量,针对GF100核心的不足之处也做了较大的改进——纹理单元数量加倍!

DX11性价比之王!GTX460

纹理单元数量加倍

    GF100核心的每组SM当中拥有32个CUDA核心,还包括了4个纹理单元,这样GF100总共就拥有64个纹理单元(GTX480屏蔽了一组是60个),远少于Cypress的80个纹理单元。较少的纹理单元使得GTX400系列在大量使用了纹理贴图的游戏中表现不佳,最有代表性的游戏就是《孤岛危机》。

    GF104核心只有8组SM,如果还是保持GF100的设计不变,那么纹理单元将只有32个,还没有HD5770多(40个)。所以NVIDIA对纹理单元部分也做了改良,每组SM中的数量直接加倍,最终GF104拥有64个纹理单元,与GF100相等!

    CUDA核心数量增加了50%,而纹理单元增加了100%,改进意图显而易见。

第二章/第二节 GF104流处理器效率的改进

每组SM中特殊功能单元数量从4个增至8个:

    GF100每个SM内部还拥有额外的四个SFU(Special Function Units,特殊功能单元),可用于执行抽象的指令,例如正弦、余弦、倒数和平方根,图形插值指令也在SFU上执行。

    GF104每个SM内部CUDA核心数量增加50%之后,NVIDIA并没有让SFU数量也增加50%,而是像纹理单元那样,直接翻倍,从4个增至8个。

DX11性价比之王!GTX460

SFU和Dispatch Unit数量加倍

    每个SFU在一个时钟周期内针对每个线程均可执行一条指令,一个Warp(32个线程)的执行时间可超过八个时钟周期。SFU流水线从分派单元中分离出来,让分派单元能够在SFU处于占用状态时分发给其他执行单元。复杂的程序着色器在特殊功能专用硬件上的运行优势尤为明显。

每组SM中指令分配单元从2个增至4个:

    CUDA核心数量增加50%之后,并行线程调度器的负担显然将会更重,如果指令不能分配到每一个CUDA核心,那将会造成资源闲置,使得运算能力不如预期。NVIDIA意识到了这一点,于是直接将指令分配单元的数量加倍,由2个变为4个。

图为GF100核心的Warp调度器和指令分配模式

    现在,GF104的SM可对48个为一组的并行线程(又叫做Warp)进行调度。每个SM拥有两个Warp调度器以及四个指令分派单元,这样每个Warp周期可以并发执行两条指令,每个SM一次可以执行四条指令。

第二章/第三节 GF104专为游戏玩家设计:删除显存ECC、去掉双精度运算

    GF100核心当中有很多功能都是普通用户根本用不到的,比如显存ECC、双精度浮点运算和CUDA C++指令,这些技术和功能是NVIDIA为专业用户而定制的。

● GF104删除显存ECC功能

    GF100核心是第一颗在显存中提供了基于纠错码(ECC)数据保护功能的GPU。GPU计算用户使用ECC来在高性能计算环境中增强数据完整性。ECC是诸如医疗成像以及大型集群计算等领域中一个迫切需要的特性。

    显存ECC可以减少数据运算出错的几率,而对于图形渲染来说,算错几个像素可能无伤大雅。所以GTX480系列都没有用到显存ECC功能,目前还只有Tesla系列支持显存ECC,备受超级计算数据中心的亲睐。

    定位较低的GTX460就更不需要显存ECC功能了,所以在GF104核心设计之初就直接被删除。

● GF104精简双精度浮点运算能力

    GF100相对于以往的GPU,大幅度改进了双精度浮点运算能力,其效率达到了单精度浮点运算的1/2,而ATI全系列显卡是1/5,NV上代显卡是1/8。目前尚不清楚GF104核心到底是完全删除了双精度运算单元、还是降低了双精度运算效率。无论是哪种方式,对于普通用户来说都没有任何影响,因为所有的3D图形渲染和民用CUDA软件都不会用到双精度运算。

    NVIDIA称,没有计划使用GF104核心来制造Tesla GPU计算产品,事实上此前的Tesla都使用的是高端GPU。GF104是专门针对普通用户和游戏玩家而设计的,并没有“一心二用”的去兼顾HPC市场。

● GF104核心的二级缓存容量为512KB,与Cypress相等

    GF100的二级缓存容量为768KB,GF104减少至512KB。如果平均下来GF100的每颗CUDA核心可以分到1.5KB的缓存,而GF104的每颗CUDA核心可以分到1.33KB的缓存,新核心的缓存配比略有减少。

DX11性价比之王!GTX460

二级缓存和显存控制器是关联的

    不过即便如此,GF104核心512KB的L2容量也与ATI优异的Cypress相等。此外二级缓存容量还是与显存控制器有一定的关联关系。其中GTX460 1GB 256Bit的版本,L2可以使用全部的512KB,而768MB 192bit的版本只能使用到384KB L2。

GF100的缓存架构让各流水线之间可以高效地通信,减少了显存读写操作

    缓存容量的减少,或多或少的会影响GPU的性能,3D图形渲染也会有损失。但GF104继承了GF100共享式的二级缓存设计,缓存利用率非常高,即便缓存容量遭到了缩水,也要比ATI独享式二级缓存(L2绑定显存控制器)的效率高。其原理大家可以参照CPU领域奔腾双核与速龙2系列的性能表现即可。

第二章/第四节 GTX460并未使用完整版GF104核心,实力有所保留

    前文通过冗长的篇幅详细描述了GF104核心的诞生过程,大家就会理解NVIDIA的良苦用心了:居然对一颗次高端的GPU核心进行了重新设计,虽然沿用了GF100优秀的架构,但在微观架构上进行了诸多改良,其最终目的就是以最小的代价,获得最高的游戏性能,为挑剔的游戏玩家提供最具性价比的选择。

● DX11中高端显卡规格表:

DX11性价比之王!GTX460

    这张规格表当中囊括了显卡所有的关键参数,看起来可能比较费劲,这里就为大家重点强调几个部分:

1. GTX460虽然流处理器数量少于GTX465,但默认频率较高,最终浮点运算能力要比GTX465高30%;

2. GTX460的纹理单元数量与GTX470相等,比GTX465多12个;

3. 由于核心SM规模的减少,GTX460的多形体引擎(内含曲面细分单元)数量减少至7组,但依然远高于HD5000全系列,因为A卡只有1个;

4. GTX460的TDP(设计功耗)要低于HD5830,1GB和768MB版本的功耗只有160/150瓦,NVIDIA终于彻底解决了恼人的功耗发热问题;

5. GTX460分为1GB和768MB两个版本,他们的区别不仅仅是显存容量差了256MB,显存位宽也少了64bit,造成显存带宽减少1/4,光栅单元减少1/4,二级缓存容量减少1/4,因为这些都与显存控制器是相关联的。

● GTX460 GF104核心图:

    NVIDIA此次并没有公布GF104核心的芯片裸照,核心面积大小还是个迷。核心上面也安装了金属盖,暂时无法看清其庐山真面目,官方提供的就只有这三张艺术照:

GTX460

GTX460    GTX460

    GF104核心最特别之处,就是GPU封装基板居然是长方形的,而此前几乎所有的CPU和GPU都是正方形或者接近正方形的。当然,其核心晶片部分,也是长方形的,看其架构图就能略知一二:

● 两款GTX460架构图:

    值得一提的是,GTX460所用的显示核心并非GF104完整版,它被屏蔽了一组SM,这样就少了48个流处理器、8个纹理单元和1个多形体引擎(内含曲面细分单元)。如下图所示,被屏蔽的这一组SM有可能出现在任意八个位置之一。

DX11性价比之王!GTX460

    另外GTX460 768MB版本还被屏蔽了一组显存控制器,这个显存控制器也可能出现在图中任意四个位置之一。屏蔽显存控制器的直接效果就是显存位宽从256bit减至192bit、显存容量从1GB降至768MB,连带效果就是光栅单元从32减至24个、二级缓存从512KB减至384KB。

● GF104是G92再世?

    NVIDIA的这种做法与当年的G92核心如出一辙,最先发布的8800GT(112SP 256Bit)并非完整版,此后才发布8800GTS(128SP 256Bit),还有进一步屏蔽流处理器和显存控制器的8800GS(96SP 192bit)。次年改名为9800GTX,双核心版本9800GX2成为新王者。至于9800GTX+还有GTS250等都是后话……

    那么现在GF104的命运就可以想象了,其拥有384SP的完整版实力自然更加强大,GTX465/470/480等名号都已经被占用了,那么它很有可能被命名为GTX475,稍微提高频率之后,实力超越GTX470和HD5870不无可能。

    双GF104核心可以组成NVIDIA的新旗舰,比如GTX495,也很有希望击败HD5970成为新的王者!

    当然,以上都是笔者一时兴起胡乱猜测,并不代表NVIDIA以及PCPOP的观点,后面可以留给读者更多的想象空间……

第三章 显卡特色附属功能的较量

    在本文开篇第一章,笔者就曾提到过:“技术方面是可以相互借鉴与学习的”,在接下来的篇幅中,就为大家详细介绍双方在显卡附属功能方面的你追我赶。

第三章/第一节 GF104核心支持次世代音频源码输出

    首先我们回顾一下,自X1000系列之后,AMD将其显卡命名为HD2000/3000/4000/5000系列,这个HD代表了两层含义:GPU内置声卡为HDMI提供音频输出、GPU内置UVD引擎支持高清视频硬件解码。其中HD2900XT首次内置声卡,为HDMI提供音频输出;紧接着HD2600/2400开始内置UVD引擎,实现H.264和VC-1高清视频完全硬解码。

高清视频硬解码之争

    从8600/8500开始,NVIDIA率先支持高清视频硬解码,但仅限于H.264编码,对于VC-1依然是半硬半软式,虽然也能流畅播放高清视频,但比对手少一项功能终归不是滋味。

DX11性价比之王!GTX460

NVIDIA一步步实现VC-1完全解码

    于是,从G98核心开始,NVIDIA将高清解码引擎升级到VP3版本,为VC-1编码提供了完全硬解支持,AMD的UVD引擎再也没有值得骄傲的资本了。

    NVIDIA随后还提供了高清视频双流解码技术,同时硬解两部HDTV,支持蓝光画中画功能。次年,AMD在HD4000系列GPU中升级至UVD2引擎,同样支持双流解码和超高码率视频硬解码。在互相攀比与学习的过程中,双方在高清解码方面的实力不相上下。

    此外,NVIDIA可以通过CUDA计算技术动用流处理器资源进行高清视频解码加速,兼容性和画质比专用的视频引擎更胜一筹。而AMD在GPU通用计算方面比较落后,不支持该技术。因此综合来看,在高清解码的应用方面,还是NVIDIA更强一些。

HDMI音频输出之争

    但是NVIDIA还有个软肋,HDMI音频输出还是需要“飞线”。当时的NVIDIA也意识到HDMI必将成为消费级市场的主流接口,虽然对HDMI也提供了支持,但其中的音频信号必须从板载声卡导入,安装和设置都非常麻烦。NVIDIA的这种实现方法被称为“飞线式”HDMI音频输出。

DX11性价比之王!GTX460

通过SPDIF为显卡导入音频信号

    AMD针对GPU内置声卡与HDMI一线式输出技术进行了大肆渲染,搞得NVIDIA比较难堪。于是从GT220和GT210核心开始,NVIDIA终于内置了音频模块,为HDMI提供7.1声道数字音频输出,终于摆脱了“飞线”的困扰。

    但是,经验老道的AMD又有了新的玩法,在HD5000时代对内置的音频模块进行大幅升级,如今HD5000全线显卡都能够通过HDMI接口向AV功放输出7.1声道音频,除了传统的AC-3、AAC外,首次支持次世代的Dolby TrueHD和DTS Master Audio源码输出!

    这是历史上第一次通过显卡为功放输出未经压缩的源码音频流,此前必须使用价值不菲的中高端声卡才能实现。虽然玩高清与HiFi的毕竟是少数人,国内玩家更是少之又少,但AMD的这一做法得到了高清玩家的高度赞赏,好评如潮!

DX11性价比之王!GTX460

    免费附送的功能总比没有强吧,相信很多用户都是这种心态,尤其是在媒体的大肆渲染之下。以NVIDIA的设计实力,不是做不出来,而是想不想做的问题。于是在全新设计的GF104核心中,NVIDIA加强了HDMI Audio,支持Bitstreaming Dolby True HD和DTS-HD Master。如此一来,HD5000系列的一大技术优势将不复存在。

    事实上,在GF104之前,还有一款显卡也能支持次世代音频源码输出技术,那就是Intel内置在Clarkdale核心(Core i5 6XX和i3 5XX)里面的GMA HD集成显卡,这款显卡及其高清技术都是免费附送的。真正需要用到该功能的玩家未必会使用AMD、Intel或NVIDIA的显卡,所以笔者认为HDMI Audio之战纯粹是王者的意气之争,就是为了堵上竞争对手的嘴。

第三章/第二节 3D立体时代来临,3D Vision抢得先机

    早在一年半以前,NVIDIA就正式发布了3D Vision立体显示技术,并且联合显示器厂商推出了120Hz的3D显示器,为广大游戏玩家带来了真正切实可用的3D立体解决方案。到了今年,多部重量级3D电影巨作的上映,让更多的用户一睹立体显示的震撼效果,直接推动了3D立体的需求,2010成为了3D立体元年。

预热ComputeX:黄仁勋揭秘NV展会主题

    确实,3D游戏发展至今,画面很难会有质的提升,但3D Vision技术的引入可以给人眼前一亮的感觉,可以说又是一场视觉革命:

预热ComputeX:黄仁勋揭秘NV展会主题

    NVIDIA经过多年的发展,产品和技术方面已经非常成熟了,目前几乎所有的PC游戏都能近乎完美的支持3D Vision技术,配以3D眼镜和120Hz显示器的话,就能得以完美呈现。此前之所以未能得到普及,是因为用户了解还不够多,另外3D显示设备量价都不如人意,而现在时机成熟了。

DX11性价比之王!GTX460

    如今,所有的PC游戏都能支持3D Vision技术,所有的2D普通电影都可以通过PowerDVD搭配CUDA技术实时虚拟成3D影片,片源也不再是问题。加之今年3D显示器如雨后春笋般出现在市场上,价格已经贴近主流,普通用户组建一套3D PC不再是痴人说梦。

预热ComputeX:黄仁勋揭秘NV展会主题

三屏3D构建梦幻游戏平台

    据黄仁勋先生称,2010年南非世界杯的3D转播全部使用NVIDIA解决方案,由NVIDIA GPU驱动,可见3D Vision技术已经获得了业界的一致认可,引领整个行业快速进入3D立体时代!

3D性能测试

NVIDIA的3D立体设置与显卡驱动设置浑然一体,非常容易上手

3D性能测试

AMD必须借助IZ3D第三方驱动解决方案

    在上月的台北电脑展上,AMD也正式公布了基于Radeon显卡的3D立体解决方案,该技术与NVIDIA类似,也需要120Hz显示器和液晶分时眼镜的支持,而使用的驱动引擎为IZ3D的第三方解决方案。

    在实现的立体效果方面,双方并没有太大的差别,但本质区别就是:NVIDIA的驱动研发团队经过多年的积累,对于3D游戏的支持度和立体优化远胜第三方解决方案,无论开启3D立体后的性能表现还是对于游戏的支持数量都有着明显优势,针对新游戏也能第一时间提供优化支持,这些都远非第三方解决方案可比。

    现在AMD借助IZ3D的力量也迈入了3D立体的殿堂,但实际上IZ3D驱动也能完美兼容N卡。所以在3D立体方面,AMD无论解决方案、游戏效果、游戏兼容性和支持力度,都无法同3D Vision相提并论!

第三章/第三节 不支持单卡多屏怎么办?SLI三屏3D

    AMD HD5000系列最诱人的技术恐怕就是Eyefinity了,实现三屏环幕的效果确实相当震撼,为游戏玩家提供了非常宽阔的视野。当然这里说的三屏并不是简单的连接三个显示器,而是将三个显示器虚拟成为一个大的分辨率,然后实现超宽分辨率的游戏,这才是玩家最需要的技术。

    AMD的GPU在设计之初就考虑到了多屏输出的需要,Cypress核心最多可以提供6个TMDS数字输出通道,Juniper核心最多也能提供5个TMDS。不过实现5屏或者6屏输出只能通过DisplayPort接口实现,使用传统的Dual-Link DVI输出的话,最多只能支持三屏,目前市售HD5000系列都是三屏输出的配置。

6个TMDS通道最多提供6路DP输出,或者3路DVI输出

    遗憾的是,NVIDIA新一代的GF100和GF104核心都不支持单GPU多头(三屏以上)输出技术,可能是实现该技术需要对GPU输出模块进行较大的改动,因而来不及加入该功能。但AMD Eyefinity技术目前被炒得火热,该技术不但实用而且非常适合发烧游戏玩家,如果N卡不支持的话会丧失一个非常大的卖点。

    为了弥补显示输出方面的不足,NVIDIA灵机一动,双显卡不是可以提供四头输出吗,此前只能单纯组建多头输出,而不能实现超大分辨率。如果使用双显卡,结合SLI技术、并把多头输出合并为大分辨率的话,那就能实现媲美Eyefinity的效果。最终,NVIDIA在不更改硬件的情况下,通过改写SLI驱动,使得双卡能够实现与ATI完全相同的三屏环绕输出。

NVIDIA的三屏需要双卡SLI支持

    NVIDIA这种解决方案的缺点就是需要两张显卡才能实现,但优点就是显卡并没有限定非得用刚刚发布的GTX400系列,上一代的显卡也可以,只要组成SLI即可。还有个好处就是SLI系统性能比较强劲,足以带动大分辨率玩BT游戏。

    Eyefinity的优势就是单显卡也能支持三屏输出,只需要2D输出的用户可以通过较低的成本组建。但对于3D游戏玩家来说,即便HD5870单卡也未必能够胜任三屏幕玩主流游戏的苛刻要求,此时玩家可能需要购买两块显卡,那么A卡和N卡在功能上就没有优劣之分了,都能提供很完美的三屏效果。

DX11性价比之王!GTX460

    驱动和软件方面是NVIDIA一贯的优势,NVIDIA的SLI环绕配置界面比AMD的Eyefinity更加智能方便,而且不需要DP显示器的支持。AMD的Eyfinity驱动配置起来稍嫌麻烦,还必须要求一个显示器支持DP接口,否则将不能实现三屏输出,限制确实比较多。

DX11性价比之王!GTX460

    新驱动还支持边框矫正技术,操作同样简单方便易上手,让多显示器输出的效果更加接近于真实世界中的窗格。使用边框修正之后,游戏的显示分辨率将会更加开阔。该技术AMD的Eyefinity现在也能支持,这一方面双方做的都不错。

DX11性价比之王!GTX460

NVIDIA可以实现2D三屏与更高级的3D三屏

    当然,最具有特色的就是,三屏环幕结合3D Vision技术,实现3D立体3屏环绕技术,足以产生令人震惊的显示效果。目前AMD的三屏3D技术还停留在实验室和展示阶段,因为3D显示器必须要求使用Dual-Link DVI接口或者HDMI 1.4接口传输双倍的数据流,普通的A卡还不能支持。

第三章/第四节 AMD至今无法染指的领域——GPU物理加速

    PhysX是NVIDIA的一大法宝,在NVIDIA DX11显卡面世之前,旧的N卡正是凭借该技术与A卡相抗衡。通过笔者此前的网友调查来看,虽然PhysX的关注度没有DX11那么高,但还是拥有很多忠实的用户,一些玩家为了同时追求DX11与PhysX,费尽心机通过破解杂交的方式来让N卡和A卡协同工作。

《地铁2033》:同时支持DX11和PhysX

    如今GTX480/470正式发布,同时支持DX11和PhysX,玩家没必要再瞎折腾了。而且刚刚发布的《地铁2033》这款游戏对DX11和PhysX都提供了支持,看来不光是玩家,开发商对于PhysX也比较热衷,毕竟这是目前唯一一款支持GPU加速的物理引擎,而另一款物理引擎Havok在被Intel收购之后一直处于雪藏状态,只支持CPU加速,不支持GPU加速,物理效果都是轻量级的,远不如PhysX那么夸张惊人。

    此前想要实现物理效果必须购买专用的物理加速卡,而NVIDIA收购了Ageia公司之后,将PhysX技术以完全免费的形式附送给了GeForce显卡,让N卡用户多了一个非常炫的功能。

    NVIDIA在游戏界有着举足轻重的影响力,和众多游戏开发商保持着密切的合作关系,大名鼎鼎的“The Way”计划就保证了N卡在几乎所有游戏大作中都有着良好的性能发挥。PhysX物理引擎被NVIDIA收入囊中之后,原本屈指可数的物理游戏逐渐开花结果,以《镜之边缘》、《蝙蝠侠》、《黑暗虚空》为代表的一些重量级大作开始使用PhysX物理引擎,影响力非同小可。

国产FPS网游MKZ中爆炸、破坏、玻璃和布料使用了PhysX技术

    而且,中国本土游戏开发商也开始使用PhysX引擎来增强画面,比如《MKZ铁甲突袭》和《剑网3》都内置了PhysX支持,可见PhysX技术显然要比其它同类物理技术更易用一些。

国产网游《剑网3》中,使用PhysX实现了逼真的衣物和布料效果

    虽然物理加速技术还没有一个统一的标准,但PhysX无论从游戏数量还是画面效果方面,都更胜一筹。随着使用PhysX引擎的游戏越来越多,少有的PhysX显然将会成为事实上的标准。

    新发布的GTX480/470/460系列显卡在PhysX加速方面的性能有了长足的进步,但NVIDIA上一代显卡如果单独拿来做物理加速卡的话,性能也很足够,特效也不会损失,因为PhysX考验的是CUDA并行计算效能,与DX API支持度无关。然如果N卡用户想要升级到GTX480/470的话,旧显卡没必要淘汰。

    AMD目前的处境比较尴尬,此前过多的依赖于Havok引擎,希望新版的Havok FX引擎能够早日面世,为A卡提供支持。但是Intel收购之后希望主要使用CPU加速物理效果,导致AMD一筹莫展,之前一些AIB厂商宣称A卡能够支持Havok GPU加速纯粹是无稽之谈。此后AMD寻求第三方合作伙伴的支持,积极加入开源物理加速项目,但目前还没有什么实质性的进展,至今没有任何一款游戏能够支持AMD的GPU加速物理。

第三章/第五节 特色功能之战:CUDA遥遥领先于Stream

    提起GPU通用计算,自然会让人想到NVIDIA的CUDA、ATI的Stream以及开放式的OpenCL标准,再加上微软推出的DirectCompute,四种技术标准令人眼花缭乱,他们之间的竞争与从属关系也比较模糊。

    首先我们来明确一下概念:

1. OpenCL类似于OpenGL,是由整个业界共同制定的开放式标准,能够对硬件底层直接进行操作,相对来说比较灵活,也很强大,但开发难度较高;

2. DirectCompute类似于DirectX,是由微软主导的通用计算API,与Windows集成并偏向于消费领域,在易用性和兼容性方面做得更出色一些;

3. CUDA和Stream更像是图形架构或并行计算架构,NVIDIA和ATI对自己的GPU架构自然最了解,因此会提供相应的驱动、开发包甚至是现成的应用程序,通过半开放的形式授权给程序员使用。

    其中ATI最先提出GPGPU的概念,Folding@Home和AVIVO是当年的代表作,但在被AMD收购后GPGPU理念搁浅;此后NVIDIA后来者居上,首次将CUDA平台推向市场,在这方面投入了很大的精力,四处寻求合作伙伴的支持,并希望CUDA能够成为通用计算的标准开发平台。

NVIDIA CUDA架构示意图

    在NVIDIA大力推广CUDA之初,由于OpenCL和DirectCompute标准尚未定型,NVIDIA不得不自己开发一套SDK来为程序员服务,这套基于C语言的开发平台为半开放式标准(类似与Java的授权形式),只能用于NVIDIA自家GPU。AMD始终认为CUDA是封闭式标准,不会有多少前途,AMD自家的Stream平台虽然是完全开放的,但由于资源有限,对程序员帮助不大,因此未能得到大量使用。

ATI Stream示意图

    DX11时代我们迎来了微软的DirectCompute 11和OpenCL这两大GPU计算API,其定位就相当于3D图形领域的DirectX和OpenGL。就如同GPU能同时支持DirectX与OpenGL那样,NVIDIA和AMD对DirectCompute和OpenCL都提供了无差别支持。

    我们希望新API的出现能够打破目前GPU计算领域混乱的格局,并带来更多实用的应用和软件,但从目前的发展方向来看,进展还是相当缓慢。当前主流的一些GPU计算类软件,主要还是集中在视频转码和编辑方面,都是以NVIDIA和AMD的CUDA/Stream技术为主。

CUDA对决Stream!谁才是视频转码之王

    就拿视频转码来说,ATI驱动集成的AVIVO转码器功能太过简单,转换后视频的画质很差,而且主要依靠CPU转码,跟GPU的关系不大。而NVIDIA的Badaboom完全依靠GPU转码,GTX480的性能都能完全释放出来,MediaCoder更是能够充分发挥出CPU和GPU的效能,成为目前转码速度最快的软件;MediaShow能同时支持A卡和N卡,主要依靠CPU转码,对GPU的要求很低,双方性能差距并不明显。

    而在视频编辑和应用方面,目前视频倍线软件和2D转3D的软件能够同时支持CUDA和Stream技术,但一般都是等支持CUDA大半年之后,才加入对Stream的支持。此外还有一些加密解密、视频修复软件只支持CUDA不支持Stream,很显然AMD对于GPU计算方面投入的精力还不够多,支持Stream的软件无论数量还是质量都跟CUDA相差一大截。

第四章 GeForce GTX 460显卡实物解析

    介绍完GF104核心架构和技术特点之后,下面我们就来看看基于GF104核心的首款显卡——GeForce GTX 460,此次同一个型号有两个不同的版本,首先我们看看1GB的版本:

第四章/第一节 NVIDIA公版GTX460 1GB显卡实物拆解

    NVIDIA公版卡的造型再次改变,公版散热器不同于以往任何一款产品,黑色的外壳略微有些内凹,中间镶嵌一个7CM的风扇。

NVIDIAGTX460 1024MB显卡

NVIDIAGTX460 1024MB显卡

    散热器并非GTX480/470/465那样的涡轮风扇+侧吹风道式散热结构,因为涡轮风扇功率比较高、噪音比较大,虽然可以将GPU发出的全部热量排出机箱之外,但散热效率较低、噪音较大。

NVIDIAGTX460 1024MB显卡

    由于GF104核心发热较小,没必要非得使用侧吹风道式结构将所有热量排出机箱外,使用散热效率更高的直吹式结构更有利于控制风扇转速和噪音。取下散热器之后我们可以发现,散热片部分为太阳花式结构,通过两条热管辅助将热量快速传导至散热片边缘,然后大口径风扇将热量带走,其中一半热风可以被排出机箱外,另一半将残留至机箱内。直吹式结构还有个好处就是风扇可以辅助显存、供电和PCB散热。

NVIDIAGTX460 1024MB显卡

    公版PCB的做工用料中规中矩,核心三相加显存一相,需要两个6Pin PCIE辅助供电接口。据NVIDIA称其实GTX460只要一个6Pin辅助供电就够了,之所以设计两个,是为了超频玩家而准备的,GTX460的超频能力非常强,但超频后功耗也会同比提升。

NVIDIAGTX460 1024MB显卡

GF104-325核心拥有336个流处理器,默认核心/CUDA频率是675/1350MHz

    GF104核心比较奇特之处就是GPU为长方形,而此前NVIDIA和ATI所有GPU都是正方形的。特殊的设计使得显卡散热器四个定位孔也呈长方形分布,几乎所有的第三方散热器都无法兼容GTX460显卡。好在NVIDIA公版散热器散热能力和噪音表现都非常好,没有必要更换散热器,就连AIC的一些非公版显卡,都直接使用了这个公版散热器。

NVIDIAGTX460 1024MB显卡

    显存为常见的三星GDDR5颗粒,0.5ns的规格理论频率为4000MHz,GTX460的默认显存频率是3600MHz,一般情况下可以超至4000MHz,但想要冲击更高频率就难了。目前NVIDIA的GDDR5显存控制器还是没有AMD做得好,冲击高频率难度较大。

NVIDIAGTX460 1024MB显卡

    输出接口部分,GTX460与GTX480\\GTX470\\GTX465完全相同,都是两个Dual-Link DVI搭配一个Mini HDMI接口。由于PCI挡板空间实在没有位置,所以才勉为其难的设计了一个小HDMI。

    现在GTX460已经可以支持通过HDMI输出未经压缩的次世代音轨,在功能上与HD5000系列没有区别。据称公版卡的HDMI接口还是1.3a标准,如果AIC厂商愿意的话可以设计成支持3D立体的1.4标准,但需要支付一定的认证费用,因此成本会有所增加。

第四章/第二节 NVIDIA公版GTX460 768MB显卡实物拆解

    GTX460 768MB与1GB的版本几乎完全相同:PCB设计、散热器、供电、默认频率等等。唯一的不同就是少了两颗显存:

NVIDIA(NVIDIA)GTX460 768MB显卡

DX11性价比之王!GTX460

    在不拆显卡散热器的情况下,区分GTX460 1GB与768MB的方法就是看显卡背面PCB上的元件,在八颗显存的对应位置,如果有元件空焊的情况,那么就肯定是768MB的版本。取下散热器就能看出端倪:

NVIDIA(NVIDIA)GTX460 768MB显卡

NVIDIA(NVIDIA)GTX460 768MB显卡

NVIDIA公版GTX460 1GB(上)对比768MB(下)

    很明显,GTX460 768MB版本比1GB版本少了两颗显存,当然两者的差别不仅仅是显存容量少了256MB、显存位宽少了64bit这么简单,其光栅单元数量和二级缓存容量都有所减少,因此性能损失会比较多。

NVIDIA(NVIDIA)GTX460 768MB显卡

两款不同的GTX460 768MB对比

    而且,笔者还发现不同厂商的GTX460 768MB,其显存空焊位并不相同。这两个空焊位并不是厂商想空哪就空哪,而是由核心代号决定的。GTX460 1GB的核心代号是GF104-325,代表4个64bit显存控制器都是完好的,而GTX460 768MB的核心代号是GF104-300,代表显存控制器有屏蔽,具体屏蔽的是哪一个,看后缀:

DX11性价比之王!GTX460

    后缀KA代表屏蔽右下角的一个64bit显存控制器,这两颗显存就必须空着,焊上也没用。KB代表屏蔽右上角的一个64bit显存控制器,同理还会有KC、KD的型号。每个显存控制器在GPU背面所连接显存的针脚是固定的,所以屏蔽之后就必须在相应的位置空焊。

    其他方面,GTX460 1GB版本和GTX460 768MB版本没有任何区别。

第四章/第三节 首批GTX460显卡:索泰1GB和768MB

索泰GTX460 1GB

索泰GTX460 1GB显卡

索泰GTX460 1GB显卡

索泰GTX460 1GB显卡

索泰GTX460 768MB

索泰GTX460 768MB显卡

索泰GTX460 768MB显卡

索泰GTX460 768MB显卡

    索泰的两款GTX460都是标准的NVIDIA公版设计,1GB版和768MB版长得一摸一样。只在显卡背面的条码处写了是1GB还是768MB的版本,当然也可以通过看空焊位的方式来判断。

第四章/第四节 首批GTX460显卡:七彩虹非公版1GB

七彩虹iGame GTX460 1GB:供电大幅加强

    七彩虹率先送测了自行研发的非公版设计GTX460 1GB版本,为iGame系列产品最新成员。其散热器采用了公版设计,因为这个公版散热器的效能和噪音表现确实非常出色,但其PCB和供电设计完全不同:

七彩虹igame GTX460(768M)显卡

    尽管从外观上看,iGame GTX460 1024M和公版产品并没有任何区别,不过这款产品的确是一款货真价实的非公版产品。那么下面我们就来看看这款产品究竟有什么特别之处。

七彩虹igame GTX460(768M)显卡    七彩虹igame GTX460(768M)显卡

七彩虹igame GTX460(768M)显卡

    取下散热器就可以看到:

七彩虹igame GTX460(1024M)显卡

七彩虹igame GTX460(1024M)显卡

    实际上这款产品与公版产品的最大不同就在于供电部分。此款产品的供电部分采用了6相核心供电,相比公版增加了一倍之多。在用料部分采用了电磁屏蔽性能更高的0.56μH超薄铁氧电感。

    供电MOS管则采用了日系厂商瑞萨LFPAK产品,LFPAK封装MOS管具有体积更小、效率高、性能更强等优点,其次LFPAK的散热效率非常高(近于零的超低热阻),还能从封装的顶部分散热量,为加装散热片辅助散热奠定了基础。

七彩虹igame GTX460(1024M)显卡

    另外小编发现这款产品的PCB背面还疑似预留出了3颗去耦电容的位置,由此小编猜测七彩虹iGAME可能还将推出基于此PCB的更高端后续产品。

七彩虹公版GTX460 768MB

七彩虹igame GTX460(768M)显卡

七彩虹igame GTX460(768M)显卡    七彩虹igame GTX460(768M)显卡

    此外,七彩虹还有一款完全按照公版设计的GTX460 768MB显卡,这里就不多做介绍了,其特点主要在附件部分,附送了非常实用的iGame工具包,包括瑞士军刀、防静电手套和束线带,适合DIY玩家使用。

第四章/第五节 首批GTX460显卡:影驰非公版1GB

    影驰也第一时间推出了非公版设计的GTX460 1GB显卡,不仅PCB经过了重新设计,连散热器都是非常有个性的第二代可拆卸式风扇:

DX11性价比之王!GTX460

DX11性价比之王!GTX460

DX11性价比之王!GTX460

    影驰GTX460 1GB版所使用的散热器个性鲜明,与之前GTX470所用的散热器风格比较相似,上一个版本最大的特色是风扇可以折叠起来,方便玩家清理灰尘,而新版本的风扇完全可以免螺丝手工拆下来。

DX11性价比之王!GTX460

    散热器整体结构与公版类似,但影驰的散热片为平行风槽式,而公版为太阳花型,各有各的特色。平行风槽式可以形成一定的风道,有利于排出热风。

DX11性价比之王!GTX460

DX11性价比之王!GTX460

DX11性价比之王!GTX460

    供电部分的加强是影驰非公版设计的一大亮点,毕竟公版3+1相的设计有点寒酸,设计成4+1之后,非常有利于提高核心频率。

DX11性价比之王!GTX460    DX11性价比之王!GTX460

    核心与显存和公版一样,影驰这款非公版产品在散热与超频方面的表现值得期待,影驰显卡专用的魔盘软件还支持加压超频,相信可以完全释放出GF104核心的潜能。

第四章/第六节 首批GTX460显卡:翔升非公版1GB

    翔升作为本土AIC,也第一时间推出了非公版GT460 1GB显卡:

DX11性价比之王!GTX460

DX11性价比之王!GTX460

DX11性价比之王!GTX460

DX11性价比之王!GTX460

    翔升这款GTX460 1GB版本的散热器和PCB都是自主研发的。其散热器造型虽然没有影驰那么有个性,但散热器结构基本相同,相信散热能力和噪音方面的表现也不会差。

DX11性价比之王!GTX460

DX11性价比之王!GTX460

DX11性价比之王!GTX460

    供电方面,也从公版的3+1相加强至4+1相,非公版设计都不约而同的照顾到了GF104的核心供电,方便玩家们超频使用。翔升的供电接口为一个8Pin,它的供电能力就相当于两个6Pin,更节约空间,但如果玩家的电源没有8Pin口的话,还是需要使用两个6Pin转接成1个8Pin来使用。

DX11性价比之王!GTX460    DX11性价比之王!GTX460

核心显存与公版相同

DX11性价比之王!GTX460

    显卡输出接口部分比较特别,翔升把Mini HDMI接口居然换成了标准的大HDMI口。我们之前介绍过公版卡之所以设计小口是因为空间不足的关系,翔升设计的如此紧密,优势是可以让用户无需转接就能使用普通HDMI线缆,但这个HDMI空间过于狭小,有些线缆的接头比较臃肿的话可能插不进去,这是一个很常见的BUG,购买HDMI线缆时需要注意。

第四章/第七节 首批GTX460显卡:映众微星旌宇768MB公版

    首批GTX460显卡中,很多AIC厂商都选择了为1GB版本开发非公版PCB,清一色都是散热与供电加强版,目的就是为了默认高频与超频。而对于768MB版本,则大多保持公版设计,这样就能快速上市开卖。

DX11性价比之王!GTX460

DX11性价比之王!GTX460

首批送达泡泡网的GTX460显卡

    下面我们就来看看几款AIC的GTX460 768MB显卡,均为标准的公版设计,就不多做介绍了:

映众GTX460 768MB

DX11性价比之王!GTX460

DX11性价比之王!GTX460    DX11性价比之王!GTX460

● 微星GTX460 768MB

DX11性价比之王!GTX460

DX11性价比之王!GTX460    DX11性价比之王!GTX460

● 旌宇GTX460 768MB

DX11性价比之王!GTX460双雄权威评测

DX11性价比之王!GTX460双雄权威评测    DX11性价比之王!GTX460双雄权威评测

第五章 显卡性能全方位测试

第五章/第一节 测试平台与测试方法说明

测试模式与测试方法:

    此次发布的两款显卡定位中高端的游戏玩家,性能十分强劲,测试时所有游戏中尽可能开启全部特效,包括内置的抗锯齿(AA)和各向异性过滤(AF)。游戏最高提供8xAA就开8x进行测试,只有4x就开4x,没有的话就不强制开启。虽然有些游戏提供了更高精度的16xCSAA,但由于A卡不支持这种抗锯齿模式,没有可对比性,所以不做测试。

    分辨率只测目前最主流的全高清1920x1200,更高的2560x1600由于30寸显示器太昂贵,非普通玩家所能承受,因此不做测试。目前也有很多显示器是1080p(1920x1080),游戏在这种分辨率下的性能表现与1920x1200差不多,FPS稍高一点点,使用这种显示器的朋友依然可以参考我们的测试成绩。

测试平台配置:

PCPOP.COM评测室

硬件系统配置

处理器

Intel Core i7 875

(2.93GHz L3=8MB 四核八线程)

 

MSI P55-GD65

   

GTX465 1GB (608/1215/3200MHz)

GTX460 1GB (675/1350/3600MHz)

GTX460 768MB (675/1350/3600MHz)

HD5830 1GB (800/4000MHz)

HD5770 1GB (850/4800MHz)

GTX260 896MB (576/1242/2000MHz)

 

CORSAIR 2GB x2 DDR3-1600(9-9-9-24-1T)

   

日立1TB

  

安耐美金魔族87+

软件系统配置

  操作系统

Windows 7 RTM 7600.16385 64Bit

  DirectX

11.0

  显示驱动

NVIDIA Forceware 258.80 WHQL

ATI Catalyst 10.6 WHQL

    对于次高端的显卡,这次测试并没有使用最优异的平台,而是选择了中高端主流的Core i7 + P55平台,性能并不输给三通道X58平台,价格便宜不少而且功耗发热很低,搭配千元价位的显卡非常合适。

DX11性价比之王!GTX460

    显卡方面,NVIDIA此次对于GTX460 1GB/768MB的定价很低,只卖1499/1299元,ATI同价位的显卡只有HD5770,定位相近的显卡有HD5830,这两款显卡将会是GTX460的主要对手。N卡方面,上月发布的GTX465将会加入对比,上代中高端主流GTX260+也会参与DX9C和DX10游戏项目的对比,因为GTX460的定位就是取代GTX260+。

    所有参测显卡都使用NVIDIA和AMD双方的公版规格和公版频率,这样测得的性能和功耗发热数据最有参考价值。

第五章/第二节 DX9C理论:《3DMark06》

比Crysis还BT!3DMark Vantage初测试

    软件介绍:3DMark06作为DX9C权威的理论测试工具,包括了两个SM2.0测试和两个SM3.0测试场景,基本上达到了DX9C的画面最高境界。虽然当今显卡已全面进入了DX11时代,但考虑到至今仍有不少新游戏依然采用DX9C引擎,加入3DMark06的测试结果对于很多主流游戏都有参考价值的。

    画面设置:如今3DMark06已经难不倒高端显卡了,高端显卡在3DMark06中难分高下,所以我们只能最大程度的提高它对系统的要求,比如说提高分辨率开启抗锯齿等。所以我们选定了在1920x1200主流分辨率开启4AA16AF以及最高的8AA16AF模式下,测试其总成绩。

GTX460

    GTX465与两款GTX460之间的性能差距非常小,都领先HD5830不少,这一结果令人非常欣慰。因为GTX460 768MB只要1299元,而HD5830最便宜的都要1799元,比GTX460 1GB都要贵。

    接下来在热门DX9C游戏中,我们看看性能表现是否与3DMark06一致?

第五章/第三节 DX9C游戏:《使命召唤6:现代战争2》

    游戏介绍:作为《使命召唤》系列的第六部作品,在《现代战争2》中,将《使命召唤4:现代战争》剧情延续,俄罗斯又再次陷入政治上的纷扰不安。伏拉米尔.马卡洛夫这位和伊姆兰.扎哈恐怖组织有关连的粗暴领袖,策划了一连串即将危及世界安全的阴谋。

    相关评测经典再度回归!全特效爽玩[现代战争2]

    画面设置:《现代战争2》游戏中的画质进阶设定显得比较简单,在这里我们能看到常见的阴影开关、各种画面细节、材质填充模式等。COD6虽然引擎比较老,但经过常年累月的优化,爆炸、烟雾、火焰效果都不输给DX10游戏,要求也并不低。游戏内置AA最高4x,所以并没有测试8xAA时的性能。

    测试方法:游戏没有提供Benchmark,测试时笔者选用了一段固定的场景,期间会有爆炸、大楼倒塌、灰尘弥漫等复杂的场景,通过Fraps记录整个过程的平均FPS和最低FPS。

1920x1200分辨率,抗锯齿4x

DX11性价比之王!GTX460

    看平均帧数的话,几款显卡的差别并不大,都运行的相当流畅,不过最小帧数才是决定游戏能否持续流畅运行的关键。因此此次测试我们不仅加入了最小帧,而且还将测试过程中的FPS波动曲线绘制出来,供大家参考:

DX11性价比之王!GTX460

    可以看出,在测试前半分钟,由于出现了复杂的爆炸场景和大量的烟雾效果,A卡的FPS损失比较严重,HD5830都下降至25帧以下。而几款N卡都能保证30帧以上的流畅速度。

    而在后半分钟,场景比较稳定时,即便是最弱的HD5770发挥也很不错。这说明ATI的GPU架构执行效能方面还是因场景而异,性能表现并不稳定。

第五章/第四节 DX9C游戏:《星际争霸2:自由之翼》

    相关评测破解如此简单!教你单机爽玩《星际2》

    游戏介绍:万众期待的暴雪神作《星际争霸》,在10年之后终于迎来的3D版本,目前暴雪已经正式开放了《星际争霸2:自由之翼》的Beta测试。虽然该游戏并不支持时下流行的DX10、10.1甚至DX11,但暴雪凭借成熟的DX9C技术,也将画面做的非常完美,大量HDR及SSAO特效的应用导致要求也比较高。

    画面设置:所有特效全开最高,分辨率使用常见的1920x1200。值得一提的是,星际2 Beta版目前还不支持抗锯齿,如果驱动强开的话也没有任何效果。因此测试时只使用内置的优异画质模式。

    测试方法:使用星际大脚破解星际2支持单机运行,和电脑对战之后保存一局replay,然后播放录像中一段激烈的战斗场面,通过Fraps记录平均FPS和最小FPS。

1920x1200分辨率,Extreme画质,没有抗锯齿

DX11性价比之王!GTX460

    GTX260+果然是宝刀未老,在几款经典DX9C游戏中的表现很不错,都超越了HD5830。GTX460 768MB的性能也十分接近与HD5830,GTX460 1GB版本则有一定的优势。

DX11性价比之王!GTX460

    作为一款RTS游戏,会经常出现场景切换的动作,因此FPS波动也比较剧烈,虽然这些显卡性能方面有不小的差异,但流畅运行《星际2》都没有什么问题。

第五章/第五节 DX9C游戏:《优品飞车13:变速》

    游戏介绍:作为优品飞车系列游戏的最新作品,《优品飞车:变速》早在发布之前就倍受媒体关注,而这其中不仅仅是IT、游戏媒体,专业的汽车媒体也对这款游戏给出了不少的报道。世界优异汽车厂商也纷纷对这款游戏的开发给了很大的赞助,游戏中随处可见汽车厂商的广告。据统计,《优品飞车:变速》这款游戏一共包含了72辆世界优异跑车,所涉及厂商也多达数十个,可见各大汽车厂商对这款游戏的关注。

    画面设置:优品飞车13依然沿用了前几代的游戏引擎,还是DX9C并未进入DX10时代,但EA对画面进行了精心优化,并信誓旦旦的称优品13绝对是目前画面最强的赛车游戏。此外优品13还采用了PhysX物理引擎,但只使用CPU进行演算,因此A卡不会有性能损失。由于游戏要求并不高,因此测试时所有特效全开最高并开启8倍抗锯齿。

    测试方法:由于《优品飞车:变速》并没有提供BenchMark程序,同时AI非常智能,这样就会导致游戏每次在同样的赛道上同样的开车,都可能走出不同的路线或者其他效果,这给我们评测带来了很大的麻烦。最后,我们只能找一段路况较好的车道,并在游戏开始前就统计帧数,直到一次撞墙结束后,再计算其平均帧数。

1920x1200分辨率,抗锯齿8x

DX11性价比之王!GTX460

    在这款偏重于像素着色的老牌DX9C游戏中,拥有很多流处理器的A卡表现十分不错,但依然被GTX460无情的击败了,原因出在哪呢?

DX11性价比之王!GTX460

    原来HD5830和HD5770还是发布不太稳定,在视角或场景有切换动作时,FPS下降较多,导致成绩落后一些。

第五章/第六节 DX9C游戏:《蝙蝠侠:阿卡姆疯人院》

    相关评测黑暗使者![蝙蝠侠:阿卡姆疯人院]试玩

    游戏介绍:《蝙蝠侠:阿卡姆疯人院》是根据Grant Morrison同名漫画改编,堪称蝙蝠侠历代最黑暗的一作。疯人院里关的都是蝙蝠侠亲手逮捕的罪犯。疯人院的一段历史被揭开:原来其创办者阿卡姆最后也沦为自己医院里的精神病。这座哥特式的阴森建筑仿佛带着数代的诅咒,成为蝙蝠侠和病人们无法摆脱的宿命。病人们满足于自己的疯狂,并不想逃离疯人院;蝙蝠侠承认自己厌恶那里是因为去那里“就像回家一样”。

    画面设置:《蝙蝠侠:阿卡姆疯人院》使用的是大名鼎鼎的虚幻3引擎,PC版在画面方面进一步提升,不仅解决了HDR+AA问题,还加入了新的光影特效,而且还完美支持NVIDIA的PhysX引擎及3D幻镜技术。以高效率著称的虚幻3引擎本身对显卡要求不高,但大量PhysX效果的引入使得只有高端N卡才能跑动。

    测试方法:游戏自带Benchmark,抛开PhysX不谈的话游戏的要求并不高,因此笔者直接开启最高的8xMSAA进行测试。

1920x1200分辨率,抗锯齿8x

DX11性价比之王!GTX460

DX11性价比之王!GTX460

    蝙蝠侠游戏内置了对N卡抗锯齿的支持,效率比较高。而A卡必须在驱动控制面板强制开启,因此性能损失非常大,即便不开PhysX,两款A卡的性能也很差。

1920x1200分辨率,抗锯齿8x,PhysX High

DX11性价比之王!GTX460

DX11性价比之王!GTX460

    开启PhysX之后,不支持GPU加速的A卡瓶颈卡在CPU方面,始终都只有10几帧,完全无法流畅运行。三款N卡的性能基本取决于浮点运算能力,与显存的关系并不大。

第五章/第七节 DX10理论:《3DMark Vantage》

比Crysis还BT!3DMark Vantage初测试

    游戏介绍:3DMark Vantage所使用的全新引擎在DX10特效方面和《孤岛危机》不相上下,但3DMark不是游戏,它不用考虑场景运行流畅度的问题,因此Vantage在特效的使用方面比Crysis更加大胆,“滥用”各种消耗资源的特效导致Vantage对显卡的要求空前高涨,号称“显卡危机”的Crysis也不得不甘拜下风。

    画面设置:3DMark Vantage中直接内置了四种模式,分别为Extreme(旗舰级)、High(高端级)、Performance(性能级)和Entry(入门级),只有在这四种模式下才能跑出总分,如果自定义模式就只能得到子项目分数了。我们为这次的优异卡对决选择了最高的Extreme模式,它其实就是最高画质1920x1200分辨率再加上4AA16AF模式。

    测试方法:N卡支持PhysX,在CPU测试子项中成绩会翻几倍,最终总成绩会提高一些,但并不会影响GPU测试子项的成绩,因此在测试中保持默认驱动设置,PhysX是开启的。

GTX460

    GTX465、GTX460 768MB与HD5830的性能居然如此接近,看来在DX10游戏当中,几款显卡将会斗得难解难分。一款1299元的显卡性能直逼1799元的显卡,中高端显卡市场显然将面临重新洗牌的局面。

第五章/第八节 DX10游戏:《孤岛危机:弹头》

    游戏介绍:Crysis(孤岛危机)无疑是DX11出现之前对电脑配置要求最高的PC游戏大作。Crysis的游戏画面达到了当前PC系统所能承受的极限,超越了次世代平台和之前所有的PC游戏。Crysis还有个资料片Warhead,使用了相同的引擎,只是多了一个关卡,因此我们还是使用原版做测试。

    画面设置:Crysis只有在最高的VeryHigh模式下才是DX10效果,但此前所有高端显卡都只能在低分辨率下才敢开启DX10模式,如今的DX11显卡终于有能力单卡特效全开流畅运行。我们直上1920x1200高分辨率,开启4AA和8xAA两种模式进行测试。

    测试方法:Crysis内置了CPU和GPU两个测试程序,我们使用GPU测试程序,这个程序会自动切换地图内的全岛风景,得到稳定的平均FPS值。

1920x1200分辨率,抗锯齿4x

GTX460

1920x1200分辨率,抗锯齿8x

GTX460

    N卡在开4x和8x时的平均FPS差别不大,只是最小FPS低了一点点。A卡略有损失,但也就是1帧左右。此消彼长之后,4x模式下A卡略占优势,8x模式下N卡占优。但几款显卡跑起来还是非常吃力,显卡危机果然名不虚传!

    由于Crysis自带的Benchmark并没有按时间轴进行测试,获得的实时FPS波动曲线没有可比性,因此这款游戏并没有提供FPS曲线供大家参考。

第五章/第九节 DX10游戏:《冲突世界:苏联进攻》

    游戏介绍:《冲突世界》将带领玩家返回著名的冷战时期,玩家每一个决定均影响游戏中人物和情节。可于游戏中感受不一样的团队精神,与队友于阴森恐怖的战场上一同作战。《苏联进攻》是其最新的资料片,收录全新角色、扮演苏联军队、10套新影片和全新多人联机地图等等。

    画面设置:《冲突世界》是首批DX10游戏之一,采用了自行研发的MassTech引擎,支持多种当前的主流显示特效,如容积云,景深效果,软阴影等,光照系统也表现出色,尤其是半透明的容积云特效营造出了十分逼真的户外场景,物理加速结合体积光照渲染出了最逼真的爆炸效果。

    测试方法:内置Benchmark是一段非常华丽的过场动画作为测试程序,最终得出最大、最小和平均FPS,测试结果非常精确。WIC最高支持4AA,因此我们只测试1920 4AA16AF模式。

1920x1200分辨率,抗锯齿4x,各项异性过滤16x

GTX460

    GTX460 768MB的性能都非常出色,这让自家的GTX465和竞争对手的HD5830情何以堪?

GTX460

    通过实时FPS波动曲线可以看出,两款A卡在前期非常激烈的战斗和爆炸场景,FPS下降非常严重,这就直接导致了它们的整体性能不如N卡。而在后半部分比较稳定的场景,HD5830的性能甚至比GTX460 1GB还要略胜一筹。

第五章/第十节 DX10.1游戏:《孤岛惊魂2》

    游戏介绍:自《孤岛惊魂》系列的版权被UBI购买之后,该公司蒙特利尔分部就已经开始着手开发新作,本作不但开发工作从Crytek转交给UBI,而且游戏的故事背景也与前作毫无关系,游戏的图形和物理引擎由UBI方面完全重新制作。

    画面设置:借助于蒙特利尔工作室开发的全新引擎,游戏中将表现出即时的天气与空气效果,所有物体也都因为全新的物理引擎,而显得更加真实。你甚至可以在游戏中看到一处火焰逐渐蔓延,从而将整个草场烧光!而且首次对DX10.1提供支持,虽然我们很难看到。

    测试方法:游戏自带Benchmark工具。

分辨率1920x1200,抗锯齿4x

GTX460

GTX460

分辨率1920x1200,抗锯齿8x

GTX460

GTX460

    FarCry2中几款显卡的性能表现与Crysis截然不同,两款A卡大幅落后于三款N卡,甚至还不如上代的GTX260+。

第五章/第十一节 DX10.1游戏:《鹰击长空》

    游戏介绍:《鹰击长空》由Ubisoft旗下的Bucharest Studio工作室所研发制作而成,以汤姆克兰西最擅长的近现代国际冲突为背景,加上现代化的军事武器,和五角大厦不愿证实的开发中的先进武器,交织出最激烈的高科技攻防战。而《鹰击长空》也脱离前面几项作品的框架,将战争从地面拉拔到空中,享受广大无界限的战斗空间。

    画面设置:《鹰击长空》直接内置了对DX10和DX10.1的支持,它会自动检测显卡最高能支持的级别。通过此前的测试来看DX10.1并不会让画质变得更高,但的确能够让游戏跑得更快。我们使用1920分辨率,4AA和8AA两种模式进行测试。

    测试方法:游戏自带Benchmark,AN双方都开启DX10.1模式。

分辨率1920x1200,抗锯齿4x

GTX460

GTX460

分辨率1920x1200,抗锯齿8x

GTX460

GTX460

    A卡再次落后于N卡,不过落后幅度没有FarCry2那么夸张,几款显卡的FPS波动曲线都比较稳定,证明已经发挥出了全部实力。

第五章/第十二节 DX11理论测试:《Heaven Benchmark 2.0》

DX9/10/11三大战役!A/N旗舰性能对决

    游戏介绍:Unigine Engine率先发布了首款DX11测试/演示程序——Heaven Benchmark,其中大量运用了DX11新增的技术和指令,看来在新版3DMark面世之前,Heaven将会是DX11性能测试的非常好的选择。

    画面设置:2.0版本进一步强化了Tessellation技术的应用,细分精度更高,画面更上一层楼,测试时所有特效全开最高,包括Extreme级别的Tessellation。

    测试方法:自带Benchmark,由于该Benchmark测试条件非常严酷,开启8xAA后几款显卡都性能暴跌没有可观赏性,因此只测试4AA16AF模式下的性能。

分辨率1920x1200,抗锯齿4x,各项异性过滤16x

GTX460

GTX460

    Heaven 2.0的测试过程比较漫长,总共有多达26个场景(视角),因此实时FPS波动曲线比较密集。最终性能差异也很明显,Tessellation性能偏弱的HD5830没能讨得任何好处。

第五章/第十三节 DX11游戏:《BattleForge》

    相关评测HD5870不再寂寞!首款DX11游戏大测试

    游戏介绍:《BattleForge》是EA旗下德国Phenomic游戏制作室研发的全新即时战略网络游戏。在《BattleForge》中,玩家依靠收集、交易卡牌来建立庞大的军队。通过在线赢取、交易和购买卡牌来组成你强大的阵容,混合搭配不同属性的卡牌来和朋友进行在线战斗,或是在大规模的在线战役中取得胜利。

    画面设置:从技术角度来讲,这款游戏也非常值得关注,其画面堪称网游顶尖之作,率先提供了对DX10.1技术和屏幕空间环境光遮蔽(SSAO)特效的支持,还针对多核心处理器进行了优化。现在又第一时间对DX11加入了支持,加入了HDAO和DirectCompute,测试时自然所有特效全开最高。

    测试方法:《BattleForge》虽然是款网游,但游戏自带了Benchmark,这给评测带来了很多便利。Benchmark可以测出最大/最小/平均FPS三个数值,笔者连跑三遍Benchmark得到最稳定的成绩,保留了最有参考价值和的平均FPS和最小FPS供大家参考。

分辨率1920x1200,抗锯齿4x,各项异性过滤16x

DX11性价比之王!GTX460

DX11性价比之王!GTX460

分辨率1920x1200,抗锯齿8x,各项异性过滤16x

DX11性价比之王!GTX460

DX11性价比之王!GTX460

    《BattleForge》本身是一款DX10.1游戏,在HD5870发布当天停机维护一小时后正式加入了DX11模式。虽然这款RTS网游并没有在国内开服运营,中国玩家对其知之甚少,但能够如此神速的对DX11提供支持,而且新增的DX11模式对游戏性能影响非常显著,可以说是检验DX11显卡实力的必测游戏。

    遗憾的是,作为专为HD5000系列而生的首款DX11游戏,A卡的表现并不出色,平均FPS输给GTX460也就罢了,最关键的是最小FPS差距太大,在激烈的战斗场面出现卡机意味着什么相信大家都明白。

第五章/第十四节 DX11游戏:《科林麦克雷:尘埃2》

    相关评测:DX11代表作!20款主流显卡决战[DiRT2]

    游戏介绍:《科林麦克雷》系列游戏是为纪念去世的英国拉力赛车手科林·麦克雷(Colin McRae)而制作的,因此在游戏过程中不难见到许多麦克雷过往的身影。与一年一款的优品系列赛车游戏不同,DiRT2距离前作已经两年之久,目前《科林麦克雷:尘埃2》主机版早已上市,几乎登陆所有的主机和掌机平台、好评如潮,而PC版由于支持DX11的缘故,所以被延期数月。

    画面设置:DIRT2堪称DX11游戏代表作,DX11的五大关键特性在这款游戏中都有体现,但却没有得到大范围的应用,都是点到为止。比如Tessellation主要体现在水洼和旗帜上,而赛车过程中也就那么几处采用了该技术,因此这款DX11的要求并不高,特效全开的话中端显卡都能跑动。

    测试方法:游戏自带Benchmark程序,会自动跑完一个固定的赛道,非常接近于真正玩游戏的模式,最后得出平均FPS和最小FPS。

1920x1200分辨率,抗锯齿4x

GTX460

GTX460

1920x1200分辨率,抗锯齿8x

GTX460

GTX460

    《尘埃2》作为AMD官方赞助并力挺的DX11游戏大作,居然和《BattleForge》一样没有任何机会,完败!好在《尘埃2》是目前要求最低的DX11游戏,即便是HD5770在1920x1200 8xAA模式下都能有30帧以上的成绩,足够流畅运行了。

第五章/第十五节 DX11游戏:《潜行者:普里皮亚季的召唤》

    相关评测感受DX11的魅力![STALKER]资料片试玩

    游戏介绍:《潜行者》系列游戏现在已经出到第三部了,其中第二部《晴空》是原作《阴影》的前传,而第三部《普里皮亚季的呼唤》则是原作《阴影》的后传,讲述了在变异区中心被发现后,乌克兰政府决定举行代号“航道”的大规模军事行动,目的则是控制变异区的科技,玩家的冒险也就此展开。

    画面设置:此前《潜行者:晴空》已经率先支持DX10.1,主要优化了抗锯齿算法、阴影渲染和效率,新版的资料片则首次加入支持DX11,通过Tessellation技术大幅加强了模型细节、纹理和光影,而且通过DirectCompute 11技术改进了算法,提升游戏性能。测试时将包括透明抗锯齿在内的所有特效全开最高,考验高端显卡在最高画质下的性能表现。

    测试方法:使用官方Benchmark包进行测试,游戏没有提供更高的AA级别,因此只测试4AA模式。

分辨率1920x1200,不开抗锯齿

DX11性价比之王!GTX460

分辨率1920x1200,抗锯齿4x

DX11性价比之王!GTX460

    不开抗锯齿的话,GTX465、GTX460和HD5830的性能差别不是很大。可打开抗锯齿之后,GTX460 1GB的性能损失比较小,其它几款显卡都下降很厉害。

第五章/第十六节 DX11游戏:《异型大战铁血战士》

    相关评测:年度DX11大作!异形大战铁血战士测试

    游戏介绍:《Aliens vs. Predator》同时登陆PC、X360和PS3,其中PC版因为支持DX11里的细分曲面(Tessellation)、高清环境光遮蔽(HDAO)、计算着色器后期处理、真实阴影等技术而备受关注,是AMD大力推行的游戏之一,但是这样的主题难免让本作有很多不和谐的地方,暴力血腥场面必然不会少!发行商世嘉在2009年11月就曾明志,表示不会为了通过审查而放弃电子娱乐产品发行商的责任,因为游戏要维持“异形大战铁血战士”这一中心主题,无论画面、玩法还是故事线都不能偏离。

    画面设置:AVP原始版本并不支持AA,但升级至1.1版本之后,MSAA选项出现在了DX11增强特效当中,当然还支持Tessellation、HDAO、DirectCompute等招牌。该游戏要求不算太高,所以笔者直接将特效调至最高进行测试。

    测试方法:游戏自带Benchmark

1920x1200分辨率,不开抗锯齿

GTX460

GTX460

1920x1200分辨率,抗锯齿4x

GTX460

GTX460

    这又是一款AMD力推的DX11游戏大作,我们可以看到在不开抗锯齿的模式下,HD5830的表现非常出色,以微小的优势力压三款N卡。

    但打开抗锯齿之后,局面发生了逆转,HD5830的性能还不如GTX460 768MB,新一代GTX400系列N卡在抗锯齿效能方面果然有了质的提高,抗锯齿效能比HD5000系列还要强大,而且还能支持精度更高的32xCSAA技术。

第五章/第十七节 DX11游戏:《战地:叛逆联队2》

    游戏介绍:《战地:叛逆连队2》(Battlefield: Bad Company 2),是EA DICE开发的一款第一人称射击游戏。开发商EA已经于本月2日正式同步发售了Xbox 360、PS3、PC版。该游戏是EA DICE开发的第9款“战地”系列作品,也是《战地:叛逆连队》的直接续作,在继承前作特性的基础上,强化了多人联机载具对战和团队合作元素的设定。游戏使用加强版的寒霜引擎,加入了建筑物框架破坏和物体分块破坏的支持。

    画面设置:《叛逆联队2》虽然是款DX11游戏,霜寒引擎也是备受期待的DX11引擎,曾被ATI用来做Tessellation的技术展示。不过最新版本的对DX11的支持非常有限,仅仅是采用新指令集渲染HBAO特效而已,游戏会自动侦测显卡的DX级别来选择渲染模式。

    测试方法:游戏不带Benchmark,笔者选取了单人任务模式下的一段无需手动干涉的过场动画进行测试,其中包括大量激烈的轰炸爆破激战场面,完全可以反映真实的游戏性能。

1920x1200分辨率,抗锯齿4x,各项异性过滤16x

DX11性价比之王!GTX460

DX11性价比之王!GTX460

1920x1200分辨率,抗锯齿4x,各项异性过滤16x

DX11性价比之王!GTX460

DX11性价比之王!GTX460

    4xAA和8xAA,N卡的性能几乎没有下降,A卡有一定程度的下降。从FPS波动曲线来看,遇到战斗激烈的场景时,A卡性能下降幅度更加夸张一些,这也就是最终N卡性能占优的主要原因。

    看来还是N卡的发挥更稳定一些,能够为玩家带来更流畅的游戏感受,而不仅仅是跑出来的成绩好看。

第五章/第十八节 DX11游戏:《地铁2033》

    相关文章:DX11《地铁2033》画质、显卡性能对比

    游戏介绍:《地铁2033》(Metro 2033)是俄罗斯工作室4A Games开发的一款新作,也是DX11游戏的新成员。该游戏的核心引擎是号称自主全新研发的4A Engine,支持当今几乎所有画质技术,比如高分辨率纹理、GPU PhysX物理加速、硬件曲面细分、形态学抗锯齿(MLAA)、并行计算景深、屏幕环境光遮蔽(SSAO)、次表面散射、视差贴图、物体动态模糊等等。

    画面设置:《地铁2033》虽然支持PhysX,但对CPU软件加速支持的也很好,因此使用A卡玩游戏时并不会因PhysX效果而拖累性能。该游戏由于加入了太多的尖端技术导致要求非常BT。

    测试方法:游戏不带Benchmark,笔者选取了单人任务模式下的一段片头动画进行测试,这段画面虽然不是战斗场景并不激烈,但已经让高端显卡不堪重负了。

★ 1920x1200分辨率,不开抗锯齿,各项异性过滤16x

GTX460

GTX460

★ 1920x1200分辨率,抗锯齿4x,各项异性过滤16x

GTX460

GTX460

    当今最强的GTX480和HD5970在特效全开的情况下运行地铁2033都比较勉强,那么次一级的GTX460和HD5830自然是无法流畅运行的。所以这里的测试成绩只能反映其性能水平,对于实际玩游戏却没有代表价值。

第五章/第十九节 DX11演示Demo:《石巨人》

DX9/10/11三大战役!A/N旗舰性能对决

    游戏介绍:游戏引擎开发商BitSquid与游戏开发商Fatshark近日联合公布了一个展示DX11强大技术的DEMO。这个名为《StoneGiant》(石巨人)的DEMO,可以让玩家来测试自己PC显卡的DX11性能。BitSquid Tech即将提供PC平台的引擎,并且大概在今年第三季度将提供PS3和Xbox 360等其他平台的引擎。

    画面设置:StoneGiant是一款技术演示Demo,画面做的非常精美,进入之后可以选择开启关闭Tessellation以及DOF(DX11级别景深)进行测试,这两项技术都十分消耗资源,尤其是同时打开时。其中Tessellation技术对画质的改善最为明显,而DOF如果不细看则不容易察觉,因此测试时默认开启Tessellation、分别打开和关闭DOF进行两次测试。

    测试方法:游戏自带Benchmark。

★ 1920x1200分辨率,不开景深

GTX460

GTX460

★ 1920x1200分辨率,开启景深

GTX460

GTX460

    看得出来,A卡的“压力”确实很大,DX11特效使用的越多,其表现就越差,这就是架构问题,因为HD5000依然沿用了第一代DX10显卡HD2000的架构,已经满足不了纯DX11游戏的需要了。而GTX465和GTX460则使用了专为DX11设计的全新架构,面对严酷的DX11渲染依然能够得心应手。

第六章 附加测试项目与成绩汇总

    光看冗长的游戏性能测试可能还不够,很多玩家更关心的是新显卡的功耗、发热、噪音,甚至还有通用计算性能。对于这款NVIDIA最新的显卡,笔者也很想知道它在这些方面的表现到底如何,我们一起来看看吧:

第六章/第一节 附加测试:显卡功耗

    我们的功耗测试方法是直接统计整套平台的总功耗,既简单、又直观。测试仪器为微型电力监测仪,它通过实时监控输入电源的电压和电流计算出当前的功率,这样得到的数值就是包括CPU、主板、内存、硬盘、显卡、电源以及线路损耗在内的主机总功率(不包括显示器)。

G80禁锢的右半部分

    待机为windows7桌面下获得的最小值;满载是以1920 8AA模式运行Furmark时的最大值,Furmark能够让显卡稳定的以100%满负载模式运行,测得的功耗值比一般的游戏要高一些。

DX11性价比之王!GTX460

    测试结果令人相当满意,两款GTX460的待机功耗非常低,甚至比HD5770还要低,看来NVIDIA的节能设计已经达到了炉火纯青的地步,完美的解决了待机功耗过大的问题。要知道多数游戏玩家并不是时时刻刻都在玩游戏,显卡在待机时如果消耗太多电力的话,是得不偿失的。

    不过在满载模式下,GTX460要比HD5830高22W-28W,这个结果完全可以接受,因为其性能也要比HD5830强不少。GTX460要比自家上代的GTX260和性能相近的GTX465低50-60W,玩家们再也不用担心会浪费电了。

DX11性价比之王!GTX460

    根据NVIDIA官方公布的数据,GTX460的待机功耗略低于HD5830,TDP也要小于HD5830,但实际测出来的结果是满载功耗要高于HD5830,而且不仅是在Furmark拷机测试中,绝大多数游戏中GTX460的功耗也是要高于HD5830的。

第六章/第二节 附加测试:显卡发热

    GTX460的功耗相当不错,那么发热和噪音方面如何呢?我们借助一些监控工具来看看。测试环境为开放式平台,中央空调保证室温稳定在25度左右:

DX11性价比之王!GTX460

GTX460拷机测试截图:最高仅66度

DX11性价比之王!GTX460

蓝宝石HD5830拷机测试截图:最高68度

DX11性价比之王!GTX460

公版GTX465拷机测试截图:最高达90度!

    蓝宝石HD5830的散热器风扇口径较大,散热器体积也比较大,温度控制也非常出色。而公版的GTX465由于核心本身发热恐怖,加之公版散热器效能一般,最终温度达90度,非常恐怖。

DX11性价比之王!GTX460

    通过GPU-Z截图来看,待机时GTX460核心/流处理器/显存频率只有50.6/101/67.5MHz,低得难以想象,电压也降至0.875V,难怪待机功耗和温度都如此之低。

    而在满载时,频率和电压均恢复正常,此时公版风扇的转速也只有46%,噪音非常小,不贴近风扇几乎听不到。

DX11性价比之王!GTX460

    根据NVIDIA官方公布的数据,GTX460公版散热器的噪音表现要低于蓝宝石HD5830,笔者的实际感受也确实如此,蓝宝HD5830由于风扇口径较大,满载时噪音略高些,但也算比较安静的。

第六章/第三节 CUDA性能测试:蛋白质折叠分布式计算

    Folding @home是一个由斯坦福大学主持,全球主要硬件厂商共同参与的大规模公益性分布式运算项目。其主要是研究了解蛋白质折叠、误折以及相关的疾病,主要研究的疾病包括:癌症、阿兹海默症、亨廷顿病、帕金森氏症等。我想,这是一个比单纯跑各种Benchmark来得更有价值的事情。

    在GTX480发布没多久之后,斯坦福官网上就已经提供了支持GTX400系列显卡的GPU3客户端,但目前官网上的客户端都不能支持HD5000显卡,看来AMD已经不太重视这类公益性的GPU通用计算应用了。

    所以,本项测试只能在N卡内部进行对比:

DX11性价比之王!GTX460

开启Folding @ Home GPU3客户端后,GTX460可以99%满负载运行

DX11性价比之王!GTX460

    经过实际测试来看,GTX460的PPD(日贡献分值)可达上代中端热门产品GTX260+的将近两倍,而其功耗却要比GTX260+低50瓦以上!

    看来GTX460将会是一款完美的蛋白质跑分利器,如果能将GTX460设计成单槽散热(GTX260+都可以单槽,功耗发热更低的GTX460必然可以),在一块主板上插7片的话,那么个人超级计算机的运算能力将会有一个质的提升!

第六章/第四节 CUDA性能测试:Badaboom视频转码

    N卡和A卡在游戏性能和相关功能方面可能是各有所长、互有胜负,谁都没有绝对的领先优势。但在GPU通用计算方面,差距可就不是一点半点了,CUDA应用软件不但在数量上占据压倒性优势,而在质量与性能方面也比Stream强大许多。

    所以,在进行了大量的游戏性能测试之后,笔者开始针对CUDA通用计算进行专项测试。这里选用了CUDA的成名代表作——Badaboom视频转码软件。

    相关评测关公战秦琼!4套CPU/GPU决战视频转码

    测试方法:使用Badaboom将一段1080p TS格式预告片转成720p MP4格式的文件,码率及相关设置采用了Badaboom内置的方案不做更改。再将一端DVD花絮转换成iPhone支持的格式,更换不同显卡检验性能差距。

DX11性价比之王!GTX460

    在视频转码过程中我们发现,Badaboom能够充分利用GTX460的流处理器资源,视频引擎负载和GPU负载都达到90%以上,转码速度远快于四核甚至六核纯CPU运算。

DX11性价比之王!GTX460

DX11性价比之王!GTX460

    与游戏中GTX460 1GB力压GTX465的情况不同,在蛋白质和视频转码这类CUDA应用中,GTX465的表现反而更好一些,而GTX460 768MB的性能并不比1GB弱多少。看来民用级CUDA应用对显存的要求不高,价格低廉的GTX460 768MB更值得选用。

第六章/第五节 超频性能测试:GTX460大战HD5850

    默认频率下的GTX460就能够大幅领先于HD5830,性能十分接近于HD5850,那么超频后的GTX460实力显然会更强。

DX11性价比之王!GTX460

默认频率高达850/1700/4000MHz的GTX460

    在我们收到的送测样品当中,七彩虹非公版GTX460 1GB的默认频率高达850/1700/4000MHz,通过实测发现这个频率的GTX460性能已经完全超越了HD5850,一款1499元的中端显卡轻松干掉了2299元的高端显卡……

七彩虹igame GTX460(1024M)显卡

    而且,七彩虹这款GTX460在不加电压的情况下,还有继续超频的潜力,核心并没有超太多,而显存达到了4400MHz,性能又有所提升:

七彩虹igame GTX460(1024M)显卡

    可以看到,经过超频之后,GTX460在绝大多数游戏中的性能都超越了AMD高端主力HD5850,性能相比公版提升幅度可达20%-30%之多。根据我们的测试来看,不光是非公版产品好超,其实公版GTX460也都能稳超800MHz以上,至少提升20%。

第六章/第六节 成绩汇总与PK:GTX460 1GB比GTX460 768MB强多少

DX11性价比之王!GTX460

    如果GTX460 768MB只是显存容量比GTX460 1GB少了256MB的话,那么两款显卡的性能差距就不会有这么多了,因为大多数游戏在1920分辨率下耗费不了太多显存。但由于GTX460 768MB的显存带宽、光栅单元和二级缓存都有所损失,最终性能落后了大概10%。

    考虑到GTX460 768MB的售价要比GTX460 1GB便宜200元,显然GTX460 768MB的性价比要更高一些。

第六章/第七节 成绩汇总与PK:GTX460 1GB比GTX465 1GB强多少

DX11性价比之王!GTX460

    通过前面的理论分析可以知道,GTX460凭借较高的默认频率,浮点运算能力要高于GTX460,显存带宽也更大一些。因此GTX460 1GB性能超越GTX465不足为奇。但由于GTX465基于GF100核心,拥有更多的光栅引擎和多形体引擎,因此GTX460在DX11游戏中领先GTX465的幅度就没有那么多了。

    GTX460 1GB卖1499元,GTX465 1GB卖1899元,前者的功耗发热比后者低那么多,看来GTX465如果没有明显的价格优势的话,很难卖出去了。

第六章/第八节 成绩汇总与PK:GTX460 1GB PK HD5830 1GB

DX11性价比之王!GTX460

    除了《孤岛危机》4AA、《异型大战铁血战士》noAA这两种模式下,GTX460 1GB小负HD5830外,其他所有游戏中都是全胜,而且领先优势还都非常明显。

    A卡,不降价不行了……

第六章/第九节 成绩汇总与PK:GTX460 1GB PK HD5830 1GB

DX11性价比之王!GTX460双雄权威评测

    GTX460 768MB与HD5830之间的对决就有点意思了,互有胜负,都是赢也赢不了太多、输也就输那么一点。整体来看,即便抛开纯演示和Benchmark之后还是GTX460 768MB更占优势一些。

    看来,A卡不仅要降价,而且必须大跳水才成……

性能总结:

    GTX460 1GB以压倒性的优势完胜HD5830,GTX460 768MB的表现也可圈可点,整体性能领先于HD5830。AMD看似密不透风的DX11显卡产品线终于被NVIDIA击溃,这两款GTX460打倒了HD5830之后,还排挤了HD5770的生存空间,使得AMD两款炙手可热的明星产品风光不再。

    而且GTX460的实力并不仅限于此,该产品默认频率较低,NVIDIA给AIC合作伙伴和用户们留下了十分可观的超频空间,AIC们已经迫不及待的拿出了非公版超频版产品,其性能足以挑战AMD更高端的HD5850。如此一来,AMD遭受打击的产品将不止是HD5830这一款,2000多元的HD5850和1000元左右的HD5770都处境尴尬。

DX11性价比之王!GTX460双雄权威评测

    GTX460的确是NVIDIA为游戏玩家设计的一款接近完美产品,其性能足以在全高清分辨率下流畅运行当今几乎所有的主流游戏,包括大多数DX11游戏;专为DX11优化设计的强大曲面细分和几何性能,也足以应付日后即将发布的DX11游戏;优秀的功耗控制也不会让游戏玩家在空闲时浪费太多的电能,较低发热和噪音可以轻松度过炎炎夏日;最重要的是厚道的价格让玩家们可以无需等待就能出手享用。

技术分析:

    此前GTX480/470的性能其实都相当不错,但是较高的功耗和发热给人们留下了不好的印象。其主要问题是GF100核心太过庞大,40nm工艺不够成熟导致功耗和良品率都不甚理想。如今中等规模的GF104核心横空出世,GTX460的优异表现证明了NVIDIA新一代Fermi架构的成功。

DX11性价比之王!GTX460

    当然,别忘了GTX460所使用的GF104核心并非是完整规格,GF104一旦开启全部384个CUDA核心之后,恐怕AMD单芯旗舰HD5870也将在劫难逃。

    但NVIDIA也不能得意忘形了,毕竟GF104(19.5亿)与Cypress(21.5亿)的晶体管数是相当的,它们本应该是同一级别的产品,只不过此前AMD没有对手敢卖高价,而NVIDIA定价更厚道一些终结了AMD的暴利时代。可以想象接下来要发生的肯定会是一场惨烈的成本战和价格战。

市场展望:

    AMD方面似乎已经意识到了GTX460的强大实力,就在昨天某AIB品牌宣布将HD5830直降300元,达到了1499元的历史新低,坚挺的HD5000终于扛不住了。但通过我们今天的性能测试来看,HD5830完全不是GTX460 1GB的对手,即便降至1499元还是性价比不高,看来AMD必须在市场上有进一步的行动,才能阻挡NVIDIA新品的猛烈攻势。

    我们不止一次的强调过,有竞争才会有高速的发展,才能给消费者带来更强、更实惠的产品。此次NVIDIA发布的两款GTX460售价如此厚道,性能如此强劲,不仅让NFan们扬眉吐气,而且迫使A卡降价,让AFan们可以花更少的钱买到更好的显卡。

    当然GTX460的发布也给NVIDIA产品线造成了深远的影响,好消息是NVIDIA终于在千元价位拿出了像样的产品,迅速填补的GTX260+退市后的空白;而坏消息就是GTX460性能实在太强,几乎没有给GTX465留下什么生存空间,手头积压了不少GTX465存货的AIC们该怎么办?■<

0人已赞

关注我们

泡泡网

手机扫码关注