PCIe 2.0接口有没有用?RV670再战G92
在新一代DX10高端显卡的较量中,NVIDIA和AMD的产品策略惊人的相似:GPU核心规格保持不变,只把显存位宽降至256Bit,而且都不约而同地采用了新工艺、加入了高清硬件解码引擎、都能够支持新一代总线接口——PCI-Express 2.0。
G92和RV670的性能表现也没有出乎大家的预料,先前320SP的R600只能和96SP的8800GTS 640MB打成平手,那么320SP的RV670自然不是112SP的8800GT的对手。不过RV670拥有强大的UVD通用视频解码器、完美的HDMI输出解决方案、PowerPlay节能技术、以及更低的成本,低价格和多功能弥补了性能上的不足,HD3850在千元价位大受欢迎。
不过随着8800GS的发布,HD3850遭遇了强劲的敌手,这两款1200元价位的显卡在不同的游戏中斗了个难解难分,谁都没有明显的优势。详细的性能测试可以查阅“千元价位争夺战!NV新秀8800GS大测试”一文。
之前我们所有的测试都是在PCI-E 1.1平台上进行的,实际上RV670和G92核心都是能够支持PCI-E 2.0的,也就是说他们的实力可能尚未被完全释放出来,那么当显卡在PCI-E 2.0平台上运行时,性能会否得到提升呢?此时RV670和G92的表现又将如何呢?
首先来了解一下PCI-E 2.0的特性:此次PCI-E总线由1.1升级到2.0版本,就属于规格加强版,接口看上去没有任何变化,只是数据传输协议增强,带宽翻倍。PCI-E 2.0与USB2.0、SATA-II非常相似,支持PCI-E 2.0的主板能够完美兼容PCI-E 1.1的设备,PCI-E 2.0的设备也能够在PCI-E 1.1主板上正常使用,但只有主板和设备同时支持PCI-E 2.0时,才能够开启2.0模式,享受双倍带宽带来的性能提升。
● PCI-E 2.0规格的主要新特性如下:
带宽翻倍:每通道数据传输率由原来的单向250MB/s双向500MB/s(PCI-E上下行可以同时传输数据)提高至单向500MB/s双向1GB/s,显卡所用的PCI-E X16 2.0接口带宽就是单向8GB/s双向16GB/s。
功率翻两倍:PCI-E 2.0接口可以直接输出最大225W的电力,是现有PCI-E的75W三倍,可以更好的满足高端显卡需求。
新增“输入输出虚拟化”技术:可以让多台虚拟机共享网卡等PCI-E扩展卡设备。
支持外部PCI-E 2.0扩展卡设备:扩展卡可以通过标准化的线缆接入计算机,而且带宽速度几乎不会损耗,适合高端服务器通过外部接口接入多块各种功能的扩展卡。对于显卡来说,实现外置多路显卡以及图形服务器将会更加容易。
支持代号为“Geneseo”的长期规划。该技术与Intel、IBM等业界巨头合作开发,可让图形处理单元、加密处理单元等协处理器更好地与中央处理器机密相连。对于显卡来说,GPU和CPU整合计划将会拥有更低的延迟、更高的通讯效率。
可以看到,PCI-E 2.0除了接口带宽翻倍之外,还给未来GPU的发展提供了更加广阔的平台,不过目前对于普通用户来说,PCI-E 2.0的意义还不是很大。
● 支持PCI-E 2.0的核心/显卡都有哪些?
G92核心支持PCI-E 2.0,基于G92的显卡有:8800GT、8800GTS 512MB、8800GS;
RV670核心支持PCI-E 2.0,基于RV670的显卡有:HD3870、HD3850;
G98核心支持PCI-E 2.0,目前只有新版8400GS这一款。
NVIDIA和AMD未来的显示核心都将支持PCI-E 2.0,比如G94、RV635、RV620等等,此外即将发布的双RV670显卡HD3870 X2、双G92显卡9800GX2都支持PCI-E 2.0。
● 支持PCI-E 2.0的芯片组/主板都有哪些?
Intel方面,只有X38这一款芯片组支持;
AMD方面,有790FX、790X、770三款芯片组;
NVIDIA方面,780i SLI、750i SLI
即将发布的芯片组全部支持PCI-E 2.0,如AMD 780G、Intel X48/P45、NVIDIA 790i SLI、780a SLI、750a SLI等等。
● 为什么当前PCI-E 2.0显卡还是需要外接供电:
可能很多朋友都有这样的疑问,既然PCI-E 2.0接口能够直接提供225W的功率,那么像8800GT、HD3870这些显卡都应该无需外接供电就能正常工作。可事实情况并非如此,即便把8800GT/HD3870插在支持PCI-E 2.0的主板上,也还是需要外接供电,这是为什么呢?
实际上,显卡是否需要外接供电,除了PCI-E金手指能否提供足额的电力之外,主要取决于显卡的供电模块线路设计。由于目前PCI-E 2.0主板尚未普及,8800/3800系列显卡为了保证最大的兼容性,还是沿用了以前的供电设计,主要依赖6Pin外接供电。
举个简单的例子,ATI公版HD2600XT GDDR4无需外接供电,因为PCI-E 1.1提供的75W已经绰绰有余了,但市面上有不少非公版HD2600PRO显卡必须外接4Pin或者6Pin供电接口才能点亮,这就是供电模块设计不同的原因!相信PCI-E 2.0主板完成普及之后,未来的显卡就会重新设计取电方式,中高端显卡也会陆续放弃6Pin接口,让用户使用起来更方便!
既然PCI-E 2.0大功率的特性目前还无法享用,那么PCI-E 2.0的唯一优势就是带宽翻倍了,更高的带宽意味着消除显卡数据传输的瓶颈,这样就能够提高显卡性能。现在的问题是,从PCI-E 1.1升级到2.0,性能可以提升多少?下面就通过实际测试来证明:
● 测试平台:最强QX9770搭配最新780i SLI
硬件系统配置 | |
Intel Core 2 Extreme QX9770 四核心, 3.2GHz(400×8), L2=6MBx2 | |
主 板 | Asus P5N-T Deluxe Chipset:NVIDIA 780i SLI |
显 卡 | HD3850 512MB (670/1660MHz) HD3850 256MB (670/1660MHz) |
内 存 | CORSAIR Dominator TWIN2X2048-10000C5DF DDR2-800(5-5-5-15) |
硬 盘 | 希捷7200.10 |
电 源 | 海韵 M12 600W |
软件系统配置 | |
操作系统 | Windows vista Unimate 64Bit SP1 |
DirectX | 10.0 (6.00.6000.16386) |
显示驱动 | NVIDIA Forceware 169.28 Beta ATI Catalyst 7.12 WHQL |
为了尽可能的发挥出显卡的全部实力,本次测试动用了目前为止最强的CPU——Intel最新45nm工艺的QX9770,3.2GHz、四核心、12MB二级缓存。

配套主板自然必须支持PCI-E 2.0,笔者并没有选择Intel自家的X38芯片组,这是因为X38只支持PCI-E 2.0,无法降级到PCI-E 1.1规格使用,这就无法对比2.0和1.1的性能差距。如果更换为P35主板测试的话,X38和P35芯片组的差异会造成测试结果不准确。
NVIDIA刚刚发布的780i SLI芯片组是我们的非常好的选择,因为这款芯片组同时支持PCI-E 2.0和1.1,就拿华硕P5N-T Deluxe主板来说,两条蓝色的插槽支持PCI-E 2.0 X16,而中间黑色的插槽只支持普通的PCI-E 1.1 X16。这样测试起来就方便多了,只要将显卡分别插入蓝色和黑色插槽,不用更换主板就能测得2.0和1.1模式下的性能表现!

● 待测显卡

8800GS 384MB和HD3850 512MB棋逢对手
那么在PCI-E 2.0模式下的性能表现如何呢

公版8800GT 512MB和非公版8800GT 256MB
两者频率相同,可以对比256MB的性能损失
非公版HD3850 512MB和公版HD3850 256MB
两者频率相同,可以对比256MB的性能损失
此次测试选择了五款具有代表意义的显卡,除了可以验证他们在PCI-E 1.1和2.0模式下的性能差异之外,还能够对比512MB和256MB显存对性能的影响,可谓是一箭双雕。 一切准备就绪,下面开始进入测试环节。
NVIDIA新发布的780i SLI芯片组其实是680i SLI的升级版,它通过附加一颗名叫nForce 200 SLI的芯片来支持两条蓝色的PCI-E 2.0 X16接口,而中间黑色的插槽则是由南桥提供,仅支持PCI-E 1.1 X16:
现在我们就通过实际测试来验证黑色和蓝色插槽的规格,把8800GT显卡插入不同颜色的插槽,然后启动系统装好驱动后,通过GPU-Z读取实际参数:


不出所料,GPU-Z正确识别出了蓝色和黑色插槽的区别,是否工作在PCI-E 2.0模式下一目了然!接下来看看HD3850插在780i SLI主板上会不会有兼容性问题:


看来笔者多虑了,780i SLI也能够让HD3850正常开启PCI-E 2.0模式。接下来首先跑一下3DMark06试试看,PCI-E 2.0和1.1模式有无区别:

PCI-E 2.0模式,HD3850 256MB跑了5573分

PCI-E 1.1模式,HD3850 256MB跑了5229分
344分的差距不是小数目,看来PCI-E 2.0模式和1.1模式的确有性能差异,接下来就通过详细的性能测试将全部结果展现在大家面前。
● 3DMark03理论性能测试

3DMark03是款很老的测试软件了,但我们依然保留了这个测试项目,因为它能够代表一些使用老图形引擎的游戏性能(比如许多网络游戏)。

看来在老游戏中PCI-E 2.0不会让性能提升多少。而且512MB和256MB的性能差距非常小,8800GT和HD3850皆是如此。
● 3DMark05理论性能测试

3DMark05是款纯DX9测试,偏重于像素渲染,GPU负载远高于3DMark03。

PCI-E 2.0还是颗粒无收,512MB大显存的作用也不是很明显。
● 3DMark06理论性能测试

3DMark06作为目前权威的综合测试工具,包括了两个SM2.0测试和两个SM3.0测试场景,基本上达到了DX9C的画面最高境界,其测试结果对于很多主流游戏都有参考价值。

终于在3DMark06种情况发生了转折,512MB显存的优势有所体现,8800GT 256MB性能损失惨重,比8800GS 384MB还要差,由此推算3DMark06打开AA后的显存占用应该在256MB和384MB之间。
PCI-E 2.0接口的优势首次在HD3850 512MB身上体现了出来,由于256MB显存不够用必须依赖系统内存,2.0充足的带宽能够让GPU更快的读取系统内存,从而一定程度上缓解性能损失。
通过3DMark03/05/06的测试结果来看,PCI-E 2.0在DX9测试中无所作为,而在DX9C测试中表现出了一丁点优势,那么在DX10测试中将会如何呢?请接着往下看……
● DX10 RTS游戏——《英雄连》
《英雄连》这款二战类RTS游戏备受好评,新资料片的推出也再次掀起游戏热潮,支持DX10游戏的光影、纹理品质得到提升,战争场面更加精彩。

英雄连极其消耗显存,512MB都不一定够用,所以8800GT 256MB和8800GS 384MB性能损失非常惨重,而8800GT 512MB和HD3850 512MB的发挥基本正常。
N卡因为显存容量不足发挥失常,但HD3850 256MB的表现可圈可点,它不仅在性能上超越了8800GT 256MB和8800GS 384MB,而且还依靠PCI-E 2.0的带宽优势提升了性能。

打开AA后显存消耗加剧,8800GT 256MB根本无法跑了,而HD3850 256MB的表现令人惊喜,在PCI-E 2.0的帮助下性能有了明显提升,缩短了与512MB的性能差距,看来A卡的显存共享技术的确非常成功。
可惜的是,N卡无法从PCI-E 2.0的海量带宽中获益,性能设置还出现了下降的情况。
● DX10 RTS游戏测试——《冲突世界》
很多人都以为这是一款FPS游戏,因为它的画面效果和模型细节实在是太细腻了,事实上它是一款RTS游戏,一款场景比《英雄连》还有宏大、细节和特效更加丰富的即时战略游戏。

冲突世界是款“The Way”游戏,N卡的执行效率远高于A卡,但由于该游戏也是非常消耗显存,导致8800GT 256MB根本跑不动。HD3850 256MB也损失不小,但PCI-E 2.0在此并没有帮上忙。
几款显卡打开AA完全跑不动,测试FPS没有意义。
● 最BT的DX10游戏:孤岛危机
Crysis(孤岛危机)无疑是近2007年关注度最高的PC游戏大作。Crysis的游戏画面达到了当前PC系统所能承受的极限,超越了次世代平台和之前所有的PC游戏。

Crysis实在是太BT了,几款显卡都不敢打开VeryHigh模式测试,这里只开到High,跑起来已经很勉强了。8800GT 256MB和8800GS 384MB再次败给了HD3850 256MB,通过512MB——256MB的性能损失幅度来看,8800GT非常严重,而HD3850则要好很多。
● 华丽的DX10 FPS游戏——《狂野西部》
《狂野西部》(Call of Juarez)是最早泄露出来的DX10游戏,但由于存在一些BUG,因此正式版的发布日期稍晚了一些。游戏中使用了大量消耗资源的全新DX10特效,因此对于显卡的要求仅次于Crysis!

与Crysis类似,由于显存容量的问题,N卡里面只有8800GT 512MB发挥正常,而HD3850 256MB的发挥令人非常满意,它依靠PCI-E 2.0的带宽优势追回了失分,显示出了强大的虚拟显存利用率!
● 首款DX10游戏大作——《失落星球:极限状态》
《失落星球》无论DX10还是DX9版本,画面都非常出色,但除了绚丽的画面之外,游戏本身也是可圈可点。

失落星球这款“The Way”游戏是N卡强项,HD3850根本没有还手之力。

不过,如果开了AA就是另一番情景了,8800GT 512MB依然高高在上,其他几块显卡都不堪重负,8800GT 256MB惨不忍睹,虽然已经无法流畅运行游戏了,但HD3850的发挥还是不错的。
● XBOX360代表作PC版——《战争机器》
作为微软XBOX360的代表作和百万销量级巨作,《战争机器》移植PC让广大玩家欢喜不已,这款基于虚幻3引擎的游戏在移植PC后不仅加入了DX10特效,而且完美解决了AA问题,画面表现力更上一层楼,但对于显卡的要求也是今非昔比!

打开DX10和AA效果后,8800GT 256MB再次发挥失常,8800GS 384MB也未能胜过HD3850 256MB。PCI-E 2.0还是有一定的优势。
● 性能测试总结:
单纯对比8800GT 512MB和HD3850 512MB的话,结果没有任何悬念,8800GT 512MB完胜!按理说8800GT 256MB也应该比HD3850 256MB强才对,可事实并非如此,在几款主流的DX10游戏大作中,8800GT 256MB和8800GS基本都败给了HD3850 256MB,看来N卡的显存控制器可能出现了一些问题,只要显存使用超标(溢出到内存),性能就会严重下降!
而HD3850 256MB的发挥可圈可点,相对于HD3850 512MB的性能损失相对要小很多,而且很多时候都能够借助PCI-E 2.0高带宽的优势,通过虚拟显存追回失分。
总的来说,在此次测试的5款显卡中,只有HD3850 256MB能够从PCI-E 2.0接口中获益;HD3850 512MB因为本地显存已经基本够用,因此提升幅度非常小基本可以忽略;而8800系列则由于显存共享方式存在问题因此基本无法从PCI-E 2.0中获益。
● PCI-E 2.0可以让HD3850 256MB性能提升多少?

统计六款主流DX10游戏的测试结果来看,PCI-E 2.0相比1.1性能提高了10%以上,具体幅度因游戏而异,简单来说显存使用率越高,提升就越显著。
上图为AMD官方公布的PCI-E 2.0和1.1的性能对比图,看来提升幅度与我们的测试结果完全一致!
● 1000-2000元价位选购建议:
本次测试结果对于大家选购显卡也具有一定的参考意义,通过几款显卡在DX10游戏中的性能表现来看,总结如下:
8800GT 512MB性能强,但价格也很高,推荐对性能有较高要求的朋友们选择,8800GT 512MB的官方定价为1999元,但有不少厂商通过附赠礼品的方式变相降价,大家可以多多关注我们的行情报道。
8800GT 256MB的性能令人非常失望,256MB显存根本无法满足DX10游戏的需要,在很多最新的DX9C游戏中也发挥失常。在NVIDIA通过BIOS或者驱动修正BUG之前,不推荐大家选择这款1600元左右、看似很超值的显卡。
8800GS 384MB则是8800GT 256MB很好的替代者,而且价格仅为1199-1299元,性价比很高。由于显存容量介于512MB和384MB之间,因此性能表现要比8800GT 256MB好很多,综合性能与HD3850 512MB不相上下甚至略占优势。但值得注意的是,在一些特吃显存的游戏中,8800GS 384MB也会出现性能损失较大的情况,玩家需要自己优化游戏设置,尽量关闭一些消耗显存的特效。
HD3850 512MB和256MB的综合性能发挥都很正常,256MB性能有一定的损失但相对来说没有8800GT那么严重,由于目前非公版的HD3850都标配了512MB显存,而且售价和公版256MB相同,因此笔者还是建议大家选购512MB版本。至于8800GS和HD3850 512MB之间该选谁?这是个仁者见仁智者见智的问题。
至于主板方面,廉价PCI-E 2.0主板目前只有790X这一种选择,在AMD平台699元的售价的确很超值,黑盒5000+搭配790X再加一块HD3850的3A平台是不错的选择;Intel平台就不用高攀X38主板了,也不用在意PCI-E 2.0。
想当年显卡接口从AGP 8X升级到PCI-E X16也是带宽翻倍,但对于显卡的性能提升极为有限。但有了PCI-E X16高带宽的支持,TubroCache和HyperMemory这种显存共享技术应运而生,SLI和CrossFire这种双GPU互联技术成为了可能。
如今从PCI-E 1.1升级到2.0带宽再次翻番,但目前的GPU还是无法有效利用它,大带宽的优势还是只能体现在两个方面,一是虚拟显存共享技术、另一个就是多GPU互联:
当年从AGP 8X升级到PCI-E X16之后,单显卡性能没什么提升,NVIDIA SLI双显卡技术出现之后才真正利用了PCI-E充足的带宽,NF4 SLI芯片组将一条PCI-E X16拆分为两条PCI-E X8给两块显卡使用,性能提高了1.8倍!
随后芯片组支持的PCI-E通道越来越多,双X16成为了高端标配,但双X16的SLI/CrossFire系统性能并没有比双X8强多少,因为双卡互联的数据传输主要走桥接器,接口带宽还不是瓶颈。但是当双核心显卡和Quad SLI技术出现之后,PCI-E X16接口终于开始不堪重负,导致双核心显卡性能受到了一定的限制,Quad SLI 4 GPU互联效率低下。
此时,PCI-E 2.0的出现为GPU的发展扫平了的障碍,PCI-E 2.0 X8的带宽就相当于PCI-E 1.1 X16,对于单颗GPU来说8GB/s的速度足够了,如果芯片组能够提供四条PCI-E X8 2.0接口的话,四卡互联就不存在接口瓶颈问题了。

AMD全新790FX芯片组提供了38个PCI-E 2.0通道,支持2/3/4卡互联

Radeon HD3870 X2 Quad CrossFire需要790FX的双PCI-E 2.0 X16接口支持

GeForce 9800GX2 Quad SLI需要780i/790i SLI的双PCI-E 2.0 X16支持
现在,AMD和NVIDIA双方的双核心显卡和四GPU平台相继曝光,HD3870 X2是由两颗RV670核心组成,9800GX2是由两颗G92核心组成,两颗核心共用一条PCI-E X16接口,而且需要传输比单GPU更多的数据,因此必须是PCI-E 2.0规格才能提供充足的带宽,才能保证性能得到最大限度的发挥!
此外,AMD还有四卡交火方案,每块显卡独占PCI-E 2.0 X8接口——带宽相当于PCI-E 1.1 X16,因此性能基本不会有损失。现在大家就可以看到,无论双核心显卡还是多GPU SLI/CrossFire方案,都是建立在PCI-E 2.0海量带宽基础上,使得未来的多GPU效能更高,让3D性能突破技术上的瓶颈!<
关注我们


