泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

显卡史上最大骗局!PCIE接口何用之有

    本文编译自Tomshardware.com,并不代表本站观点,点击查看原文链接

    早在2004年,我们就通过多方面的测试发现,当时比较超前的PCI-E X16接口其实并不比AGP 8X强,在很多情况下甚至出现了性能下降的情况。造成这一现象的主要原因是首款PCI-E芯片组915P并不成熟,而且显卡也无法有效利用充足的接口带宽。

{imageTitle}    {imageTitle}
 
 原生高带宽的6600GT PCI-E竟然不如AGP桥接版?是的,当时就是这样!
 
    如今PCI-E接口的显卡已经彻底取代了AGP,虽然ATI和NVIDIA还在照顾老用户推出一些桥接的AGP版本,但大多都属于PCI-E吃剩的残羹冷炙——即将停产的7900GS/7950GT AGP、X1950XT AGP,等到PCI-E用户将视线转移到DX10的时候,他们才想起来老用户也需要一些高性能的新显卡!

{imageTitle}

 PCI-E取代AGP不需要任何理由
 
    现在继续讨论显卡是原生还是桥接已经没有了价值,PCI-E X16能比AGP 8X强多少也毫无意义——因为限制AGP显卡性能发挥的是老迈的CPU,而并非AGP 8X接口本身!PCI-E已经完成了一统江湖的大业,PCI-E 2.0规范也开始崭露头脚,但有一个问题我们始终没有得到答案——那就是显卡究竟需要多大接口带宽?
 
{imageTitle}
 
 当今显卡能否有效利用PCI-E X16的带宽?
 
    从AGP升级到PCI-E就是为了解决显卡接口的传输瓶颈,换句话说就是给未来几年内显卡的发展开辟了广阔的道路,时至今日PCI-E显卡已经发展了3年,那么当今主流显卡能否有效利用PCI-E总线带宽呢?本文将有针对性的对此进行测试。

    与AGP/PCI总线相比,PCI-E不单是传输带宽高这么简单,PCI-E还具备双向传输和数据分路传输两种传输模式。同时,PCI-E还有多种不同速度的接口模式,这包括了X1、X2、X4、X8、X16以及更高速但不常见的X32:

模式双向传输模式单项传输模式
PCI Express x1500MB/s250MB/s
PCI Express x2

1GB/s

500MB/s
PCI Express x42GB/s1GB/s
PCI Express x84GB/s2GB/s
PCI Express x168GB/s4GB/s
PCI Express x3216GB/s8GB/s

    PCI-E X1模式的传输速率便可以达到250MB/s,接近原有PCI接口133MB/s的两倍,大大提升了系统总线的数据传输能力,而且还能支持上下行同时传输互不干扰,峰值可达500MB/s。而其它模式,如X8、X16的传输速率便是X1的8倍和16倍,目前显卡常用的X16接口已能实现双向共8GB/s的带宽。

PCI-E绝非显卡专用 多款超强设备搜罗
 
    目前主板上最常见的就是PCIE X16和X1接口,部分主板提供了X4接口,X8听起来很耳熟,这是因为很多支持双卡互联的主板就是使用了两条PCIE X8接口来实现,不过外观上依然是PCIE X16的物理插槽。
 
{imageTitle}
 
 华硕P5WDG2 WS PRO拥有4条PCI-E X16插槽
 
{imageTitle}
 
 PCI-E灵活的分段式信号定义(点击看大图)

    PCI-E除了带宽方面的优势之外,几近完美的上下兼容性也是一大亮点。举个简单的例子,PCI-E X1设备肯定能插在PCI-E X16插槽中使用,而PCI-E X16也可以工作在PCI-E X1插槽中(前提是插槽开口),只不过带宽受到了极大的限制。

{imageTitle}
 
 开口的PCI-E X4插槽可以用PCI-E X16显卡

    正因为PCI-E总线这种弹性的设计,我们就可以通过简单的屏蔽措施,在普通主板上实现PCI-E X16/X8/X4/X2/ X1的规格,方法就是用绝缘胶带隔绝显卡的PCI-E接口金手指。

    想要让显卡工作在PCI-E X16和X8模式(SLI/CrosFire主板支持)下并不难,X4也有部分主板可以支持,那么如何让显卡工作在X2和X1这种模式呢?

{imageTitle}
 
 使用CPU-Z监测PCI-E带宽,这是普通的X16模式

    下面我们统一使用屏蔽的手段,让显卡在同一块主板上工作在X16/X8/X4/X2/X1这五种模式:

{imageTitle}
 
{imageTitle}
 
 按照PCI-E的针脚定义,屏蔽一半数据金手指就是X8模式
 
{imageTitle}
 
{imageTitle}
 
 同理,屏蔽掉3/4就是X4模式了
 
{imageTitle}
 
{imageTitle}
 
 X2的情况稍微复杂点,因为正反面针脚定义不对称
 
{imageTitle}
 
{imageTitle}
 
 这就是X1模式,和普通的X1插槽一一对应
 
    需要注意的是,仅有物理屏蔽还是不行的,很多模式下都可能点不亮系统,这是因为主板BIOS中并没有对非标准模式提供定义,我们特意从厂商那边索取了工程版BIOS才得以正常使用非标准模式。
 
    现在就大功告成了,接下来将屏蔽了金手指的显卡插入PCI-E X16插槽,其总线带宽就被自动限制在了X8/X4/X1模式下,我们通过对比显卡在各个模式下的性能差别,来检验显卡到底需要多少的接口带宽。
测试系统配置:
 

测试平台

Socket 775

Intel Core 2 Extreme X6800 (Conroe 65 nm, 2.93 GHz, 4 MB L2 Cache)

主板

MSI 975X Platinum PowerUp Edition
Chipset: Intel 975X, BIOS: 2007-01-24

硬件配置

内存

2x 1024 MB DDR2-800 (CL 4.0-4-4-12)
Corsair CM2X1024-6400C3 XMS6403v1.1

显卡1

HIS X1900XTX IceQ3
GPU: ATI Radeon X1900XTX (650 MHz)
RAM: 512 MB GDDR3 (1,550 MHz)

显卡2

Zotec GeForce 8800 GTS
GPU: GeForce 8800 GTS (500 MHz)
RAM: 320 MB GDDR3 (1,200 MHz)

硬盘

400 GB, 7,200 RPM, 16 MB cache, SATA/300
Western Digital WD4000KD

光驱

Gigabyte GO-D1600C (16x)

软件配置

显卡驱动1

ATI Catalyst Suite 7.2

显卡驱动2

Nvidia ForceWare 97.92

平台驱动

Chipset Installation Utility 8.1.1.1010

DirectX

Version: 9.0c (4.09.0000.0904)

操作系统

Windows XP Professional, Build 2600 SP2

 
{imageTitle}    {imageTitle}
 
 A卡选用了HIS的X1900XTX,性能也就比X1950XTX差一点
 
{imageTitle}    {imageTitle}
 
 N卡选用了柏能的8800GTS 320MB,当前的抢手货
 
{imageTitle}    {imageTitle}
 
 测试平台相同,微星975X Platinum PowerUp Edition
 
测试项目和设置:
 

测试软件和设置

3D游戏

Call Of Duty 2

Version: 1.3 Retail
Video Mode: 1600x1200
Anti Aliasing: 4x
Texture Filter: Anisotropic
Timedemo demo2

Quake 4

Version: 1.2 (Dual-Core Patch)
Video Mode: 1600x1200
Video Quality: Ultra (ATI)/High(Nvidia)
Anti Aliasing: 4x
Multi CPU: Yes
THG Timedemo waste.map
timedemo demo8.demo 1 (1 = load textures)

应用程序

SPECviewperf 9

Version: 9.03
All Tests

3D Mark06

Version: 1.1
Video Mode: 1600x1200
Anti Aliasing: 4x
Anisotropic Filter: 8x

 
    下面正式开始测试。
    SPECviewperf是由专业组织SPEC提供的一个由C语言编写的OpenGL可执行程序,主要用于显卡的专业3D性能测试,由于直观、广泛适用和客观权威等特点,这个测试程序成为了公认的工作站领域图形性能标准测试工具。
 
    此次我们通过最新的SPECviewperf 9.03版本测试两款高端显卡在各种3D图形软件中的性能,其中包括著名的3Ds Max、CATIA、EnSight、Maya、SolidWorks等应用人群非常广泛、更实用的测试项目,可以更有效地衡量专业显卡在OpenGL下的CAD/DCC应用性能。
 
{imageTitle}
 
    3dsmax是基于OpenGL驱动的3ds max 3.1,包括三个拥有150万个顶点的模型,并在不同层次的灯光和场景下进行测试。可以看到X4性能损失还是很大的,X8相对小一些,差距在1-2帧。
 
{imageTitle}
 
    Catia基于Dassault的CATIA软件,包括2个超过2百万个顶点的场景。结果和3Ds Max差不多,X8和X16的差距只有1帧,而X4和X1的表现就惨不忍睹了。
 
{imageTitle}
 
    Ensight项目对应CEI的工程和科学视觉预览软件EnSight。此时的结果比较有意思,对于8800GTS 320M来说X8和X16基本没有区别,而X1900XTX对接口带宽稍微敏感一些,差距在1.5帧。
 
{imageTitle}
 
    此项测试就是Discreet Logic的高级渲染软件Lightscape radiosity。X8和X16完全没有区别。
 
{imageTitle}
 
    著名的Maya就不必多做介绍了,此时8800GTS 320MB需要更多的带宽,X16优势很明显;而X1900XTX只有1帧的差距。
 
{imageTitle}
 
    Solidworks是工程制图常用的大型绘图软件,对显示接口带宽要求比较高,A卡更加显著一些。
 
{imageTitle}
 
    UGS测试内容为拥有410万个顶点的机车模型,比CATIA的要求更为苛刻,X8模式下性能损失就很大了。
    前面的专业测试项目可能很多朋友并不感兴趣,接下来就进行游戏测试,三款测试项目都是大家耳熟能详的:
 
{imageTitle}
 
    首先是3DMark06,结果有些出人意料,X1900XTX在X8和X16之间的差别几乎可以忽略不计了,X4模式下的性能损失居然仅有100分,X1模式下也能跑出3576分的好成绩!
 
    而8800GTS 320MB的差别要大很多,X8模式就损失了将近200分,X4可以看出明显差距了,X1的性能损失非常大。
 
{imageTitle}
 
{imageTitle}
 
    使命召唤2中,A卡发挥稳定结果和3DMark06差不多,而8800GTS 320MB可能因为显存容量不足需要通过PCI-E调用内存的原因,在X8/X4模式下性能损失比较大。而在Quake4这款OpenGL游戏,反映出来的结果和3DMark06完全一致。
 
全文总结:
 
    在专业图形测试中,虽然个别项目PCI-E X8和X16的性能差距看上去比较大,实际上真正的FPS数值也只有1-2帧而已。而在游戏测试中,X8和X16之间的差距在实际使用中我们很难察觉出来。
 
    由此我们可以得出这样的结论,即便是AGP 8X接口(2.1GB/s),对于当前的主流显卡来说也是足够用的,部分厂商的整合芯片组(比如C61S)配备PCI-E X8升级接口也可以理解,毕竟连X1900XTX这种高端显卡都无法有效利用X16接口的全部带宽,中端显卡在X8模式下的性能损失肯定更小!
 
    总的来看,强大的G80确实需要更高的接口带宽,但是PCI-E X16对它来说已经足够了,虽然我们无法测试它在X32模式下的表现,但可以想象更高的带宽并不会带来额外的性能提升,现在过渡到PCI-E 2.0还为时过早!
 
    那么PCI-E究竟带给我们什么好处呢?广大用户并没有从PCI-E充足的带宽中直接受益,只是“被迫”使用先进的技术。也许只有最高端的SLI/Quad SLI/CrossFire(双槽PCI-E)和最低端的HyperMemory/TurboCache(透过高速PCI-E接口调用内存)技术才利用到了PCI-E的某些特性!
1人已赞