28nm领军之作!AMD旗舰HD7970性能测试-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 评测 / 正文

28nm领军之作!AMD旗舰HD7970性能测试

2012年03月19日 00:48作者：孙磊编辑：孙磊文章出处：泡泡网原创

泡泡网显卡频道3月19日 AMD自HD5870开启了DX11显卡时代以来，每次都要领先于对于推出新一代的旗舰产品。今年1月6日，AMD旗下备受期待的新一代卡皇HD7970如期而至，再度成高端玩家的“神兵利器”！

新一代南方群岛，首批型号包括Radeon HD 7970和Radeon HD 7950两款产品，产品全面进化到28nm，采用了全新的GCN（Graphics Core Next）架构。

在实际游戏性能部分，Radeon HD 7970对比Radeon HD 6970平均可提升约70%，而由于4D架构革新版——GCN的加持，曲面细分性能也比较强悍，对比Radeon HD 6970将近翻了一倍。

同时，待机功耗（Idle）部分方面AMD似乎学到了格力的真传——掌握核“芯”科技，新的ZeroCore Power技术可使待机功耗小于3W。此外，在核心规格方面，Radeon HD 7970已经确认支持PCI-Express 3.0和Direct X 11.1。

相对于PCI-E 2.0，PCI-E 3.0提升一倍，PCI-E x16可以实现高达32GB/s的传输带宽，目前Intel X79以及明年即将发布的Ivy Bridge也将实现对其的支持。Radeon HD 7970成为全球首款支持PCI-Express 3.0显卡，同时也率先支持DirectX 11.1，相对于现有的DirectX 11更进一步。

接下来要介绍的Tahiti核心很多方面都会与GF100进行对比，看看AMD所谓的GCN（次世代图形核心）到底有多么先进。

Tahiti的核心架构图

这是AMD官方公布的Tahiti核心架构图，第一眼看上去，我们就会发现他与以往所有的AMD GPU架构有了明显区别，无论图形引擎部分还是流处理器部分都有了天翻地覆的变化，如果没有右侧熟悉的UVD、CrossFire、Eyefinity等功能模块，很难相信这是一颗AMD的GPU。

先看看最上面的图形引擎部分

Tahiti的图形引擎部分

Cayman的图形引擎部分

这一部分Tahiti几乎没有什么变化，依然是双图形引擎的设计，几何着色指令分配器、顶点着色指令分配器、曲面细分单元、光栅器、分层消影器都是双份的设计。

毫不起眼但意义重大的改进：双ACE

除此之外，还有一个毫不起眼但是意义重大的改进，那就是在图形引擎上方加入了两个ACE（Asynchronous Compute Engine，异步计算引擎），这两个引擎直接与指令处理器、几何引擎及全局数据缓存相连，作用是管理GPU的任务队列，将线程分门别类的分发给流处理器。

ACE将会充当指令处理器的角色用于运算操作，而ACE的主要作用就是接受任务并将其下遣分配给流处理器（主要是分配的过程）。全新架构强化了多任务的并行处理设计，资源分配、上下文切换以及任务优先级决策等等。ACE的直接作用就是新架构拥有了一定程度的乱序执行能力，虽然严格意义上新架构依然是顺序执行架构，一个完整线程中的指令执行顺序不能被打乱，但是ACE可以做到对不同的任务进行优化和排序，划分任务执行的优先级别，进而优化资源。从本质上来说，这与很多CPU（比如Atom、ARM A8等等）处理多任务的方式并没有什么不同。

而且ACE的加入大幅提升了Tahiti的几何性能，并且使得通用计算时的指令分配更加有序和并行化，缓存使用率和命中率更高。

有针对性的强化曲面细分单元

单从数量上来看，Tahiti明显不如GF100的4个光栅化引擎（光栅器+分层消影器）以及8个多形体引擎（几何/顶点分配器及曲面细分单元等）。不过AMD有针对性的强化了曲面细分单元，通过提高顶点的复用率、增强片外缓存命中率、以及更大参数高速缓存的配合下，HD7970在所有级别的曲面细分环境下都可以达到4倍于HD6970的性能：

此前我们介绍过，HD6970的曲面细分性能是HD6870的两倍、HD5870的三倍。通过AMD的理论数据来看，Tahiti的曲面细分性能应该达到甚至超越了GF100/110。

看得出来，AMD的Tahiti在图形引擎方面依然沿用Cayman的设计，从Cypress到Barts再到Cayman，AMD稳扎稳打的对图形引擎进行优化与改进，AMD认为现有的双图形引擎设计足以满足流处理器的需要，因此只对备受诟病的曲面细分模块进行了改良，如此有针对性的设计算是亡羊补牢、为时不晚。

看了上页图形引擎部分的介绍，很多人可能会失望——基本没动嘛，还说什么次世代图形核心？别着急，好戏在后头。我们知道AMD历代GPU的瓶颈除了曲面细分以外，其实最重要的是5D/4D VLIW架构的效率问题。现在Tahiti的GCN架构就是要解决这个问题，它的流处理器结构已经面目全非了。

Tahiti彻底抛弃VLIW架构

通过Tahiti的整体架构图我们看到，传统的SIMD流处理器阵列消失了，取而代之的是GCN阵列，Tahiti总计拥有2048个流处理器，这样每个GCN阵列里面拥有64个流处理器。现在来看看GCN阵列的微观结构。

GCN与GF100的SM何其相似

Tahiti的GCN阵列微观结构

GCN阵列里有4组SIMD单元，每组SIMD单元里面包括16个流处理器、或者说是标量运算器。GCN架构已经完全抛弃了此前5D/4D流处理器VLIW超长指令架构的限制，不存在5D/4D指令打包-派发-解包的问题，所有流处理器以16个为一组SIMD阵列完成指令调度。简单来说，以往是指令集并行，而现在是线程级并行。

GF100的SM（流处理器簇）微观结构

可以这么理解，一个GCN阵列与GF100当中的一组SM相当，GF100的一组SM当中有4组共计32个流处理器，而Tahiti的一组GCN当中有4组共计64个流处理器。

缓存部分

每个SIMD-16单元都拥有64KB向量寄存器

每组GCN阵列拥有64KB的本地数据共享缓存，还有16KB的一级缓存

每组GCN阵列有一个标量运算单元，用于执行整数指令、媒体指令和浮点原子操作，这个标量运算单元拥有自己的4KB寄存器

而GF100的缓存设计得更加灵活，每组SM里面拥有总计64KB的共享缓存+一级缓存，这64KB缓存可以根据实际运算量来动态调整，如果把16KB分配给一级缓存的话，那剩下的48KB就是共享缓存，反之亦然。

一般来说，进行图形渲染时需要共享缓存比较多，而并行计算时则会用到更多的一级缓存。GF100这种灵活的缓存分配机制更适合做并行计算，而GCN架构更大的共享缓存会有更好的图形渲染性能，并行计算则会稍逊一筹。

更多的线程调度

从缓存部分的设计来看，虽然GCN拥有更大的缓存容量，但在并行计算领域经营多年的NVIDIA显然要棋高一手。

从线程级别来看，GCN与SM是不可分割的最小单元，GCN一次可以执行64个线程，而SM是48个（其实就是流处理器的数量）。

从多线程执行上来看，GCN可以同时执行4个硬件线程，而SM是双线程调度器的设计（参见架构图）。

如此来看，GCN架构的多线程性能会更好一些。

小结：AMD GCN借鉴NVIDIA SM架构

在流处理器部分，终于不用费劲的把AMD和NVIDIA GPU架构分开介绍了，因为GCN与SM已经没有本质区别。剩下的只是缓存容量、流处理器簇的数量、线程调度机制的问题，双方根据实际应用自然会有不同的判断，自家的前后两代产品也会对这些数量和排列组合进行微调。

AMD向NVIDIA的架构靠拢，GCN架构改动之大，前所未有！

在流处理器部分，我们看到Tahiti与GF100如此相似，那么接下来看到缓存设计时，您可能会要惊呼了……看图说话：

Tahiti的缓存结构

Tahiti与GF100缓存的相同之处

先说最直观的，Tahiti有一个容量为768KB二级缓存，这个容量与GF100的L2完全相同，都可以进行读写操作。

上页说过，Tahiti的每组GCN阵列拥有16KB的一级缓存，GF100的SM里面也有16KB的一级缓存；每组GCN拥有64KB的本地数据共享缓存，GF100的每组SM拥有48KB。

Tahiti总共拥有32个GCN阵列，所以一级缓存共有512KB，而GF100拥有16个SM阵列，一级缓存共有256KB。但别忘了GF100的L1可以是48KB，这样总共就是768KB了。

Tahiti与GF100缓存的不同之处

虽然Tahiti的缓存层级设定与GF100非常相似，但区别也是有的：

Tahiti的每组GCN需要将16KB一级缓存当作纹理缓存使用，而GF100的每组SM当中设有专用的12KB纹理缓存；

一般来说非图形渲染不需要用到纹理缓存，而图形渲染时又不会用到一级缓存，所以Tahiti将一级缓存与纹理缓存合并的设计更优；但NVIDIA专门设计纹理缓存也不是没有道理，当GPU既渲染图形又要做计算时，分离式设计的效率会更高，比如PhysX游戏……A卡不支持所以AMD不会考虑这种情况。

Tahiti整个GPU拥有一个32KB的全局数据共享缓存，这个是沿用了Cayman的设计，但容量减半了，而GF100没有这种缓存。全局数据共享缓存主要用于不同GCN阵列间线程的数据交换，这块缓存只对编译器可见，所以使用率较低，容量减半相信也是处于这个原因。

最核心的流处理器和缓存部分介绍完毕，剩下的功能模块就简单了：

AMD头一次使用384bit显存控制器

我们先来回顾一下显存控制器的发展史：

NVIDIA：G80(384bit)-G92(256bit)-GT200(512bit)-GF100(384bit)

AMD：R600(512bit)-RV670(256bit)-RV770(256bit)-Cypress(256bit)-Cayman(256bit)

NVIDIA使用过两次384bit显存控制器，而AMD自R600 512bit兵败之后一直坚守256bit的设计，这次Tahiti是头一次使用384bit这种折衷的位宽。

AMD作为GDDR5显存标准的制定者之一，对于显存特性吃得比较透，因此同样的显存颗粒，A卡的显存频率一直都远高于N卡。此次AMD在位宽上追平NVIDIA，再加上更高的频率，显存带宽达到了264GB/s，基本上不会有什么瓶颈了。

光栅单元数量不变

Tahiti配备了32个ROPs，数量与Cayman，每个周期能完成32个色彩处理和128个Z/Stencil 处理，不过得益于有更高的显存带宽，在实际游戏中的性能要比理论值一样的Cayman快50%，比如抗锯齿方面。

● 率先支持DX11.1 API

AMD一直都是激进派，凭借与微软的深度合作，自DX10以后AMD总是能够第一时间发布支持最新API的显卡，DX10.1/DX11还有现在的DX11都是如此。关于DX11.1的改进细节，下文有专门章节陈述。

● PCI-E 3.0总线解析

PCI-E 3.0规范将数据传输率提升到8GHz|8GT/s(最初也预想过10GHz)，并保持了对PCI-E 2.x/1.x的向下兼容，继续支持2.5GHz、5GHz信号机制。基于此，PCI-E 3.0架构单信道(x1)单向带宽即可接近1GB/s，十六信道(x16)双向带宽更是可达32GB/s。

PCI-E 3.0同时还特别增加了128b/130b解码机制，可以确保几乎100％的传输效率，相比此前版本的8b/10b机制提升了25％，从而促成了传输带宽的翻番，延续了PCI-E规范的一贯传统。

新规范在信号和软件层的其他增强之处还有数据复用指示、原子操作、动态电源调整机制、延迟容许报告、宽松传输排序、基地址寄存器(BAR)大小调整、I/O页面错误等等，从而全方位提升平台效率、软件模型弹性、架构伸缩性。

至于PCI-E 3.0总线的意义，现在看来有些超前。目前只有Intel的X79+i7-3960X平台才会提供PCI-E3.0支持。根据经验和测试，PCI-E 3.0翻倍的带宽并不会给显卡带来性能提升，其主要意义还是进一步对于多卡的支持。试想，如果PCI-E 3.0 X4都可以满足HD7970的需求的话，那么现有的Z68（搭配IvyBridge处理器）就不会限制多路交火的性能表现，而X79插8块（如果主板有这么多插槽的话）HD7970做并行计算也不会因为接口带宽而产生性能瓶颈。

DDM Audio 技术解析

HD5000系列的标准接口配置是双Dual-Link DVI、DisplayPort、HDMI，其中两个DL-DVI占据了4个显示通道，DP和HDMI各一个，这样就把Eyefinity的6个通道都用完了。

而HD7970的标准接口配置则是一个Dual-Link DVI、一个HDMI、两个Mini-DP。外观上是把一个Dual-Link DVI和DP替换成了两个Mini-DP，实际上是将原来的DL-DVI做成了一路mDP输出。样做的好处就是，一片显卡可以直接接驳任何类型的数字显示设备而不需要转接，另外让三路独立Audio输出成为可能。这就是传说中的DDM audio技术。

上一代显卡只能同时输出一路音频

独立数字多点音频(Discrete Digital Multi-Point Audio)，简称DDM Audio。以前的GPU只支持单独一条音频流，因此在同时使用三台集成音箱显示器的时候，只会有一个发声。

新一代显卡Radeon HD 7900则是第一款支持多频音频流同步独立输出的GPU，可以同时输出三路独立的数字音频。

每个音箱上都会有声音，而且可以完全不同，远程视频会议一卡搞定！

当然了，DDM Audio技术支持音频和视频的绑定和同步切换，所有音频和视频都是完全无缝同步的。一部正在播放的视频从一个显示端切换到另一个显示端，音频信号智能迁移而无需手动更改。

EYEFINITY“2.0”解析

Eyefinity历史回顾：

－ 2009年9月，Eyefinity惊艳登场，震惊业内。

－ 2010年2月：催化剂10.2加入了交火系统对Eyefinity的支持。

－ 2010年3月：催化剂10.3支持边框补偿、显示器单独色彩调整、多屏分组、改进多屏配置切换。

－ 2010年4月：六屏版Radeon HD 5870 Eyefinity 6发布。

－ 2010年7月：催化剂10.7，交火系统支持垂直模式的Eyefinity，同时增强HydraVision。

－ 2011年4月：催化剂11.4，配置界面改版。

－ 2011年5月：催化剂11.5，HydraVision继续增强。

很显然，Eyefinity的进步是与催化剂驱动息息相关的，未来也是。

Eyefinity 2.0新特性：催化剂11.10就已经支持的有新的多屏布局配置、弹性的边框补偿、16K×16K超高清分辨率。

催化剂11.12和明年催化剂12.1/12.2将会陆续支持的则有：Eyefinity+HD3D多屏立体技术、自定义分辨率(等待太久了!)、预设管理改进、桌面和任务栏重新定位。

最后一项，之前三屏系统上桌面图标会停留在第一屏，任务栏则横跨三个屏幕，看起来很费劲，今后则会全部集中在中央屏幕上，就像单屏那样。

HD3D技术解析

必须承认，NVIDIA是一家很有远见的公司，一年多前就研发成功的3D Vision立体显示技术，现在已经成为整个IT业界的发展趋势。但AMD的3D立体显示技术从HD6000开始也获得了长足的进步，而在HD7000上已经越来越成熟。

首先在硬件方面，只要能够支持120Hz刷新率的输出，就可以在PC上实现3D显示技术。而想要在平板电视和投影仪上实现3D输出、120Hz刷新率、1080p全高清的3D立体游戏，左右眼各有60Hz，都能达到60FPS的流畅帧率，就需要高带宽的HDMI 1.4a标准的支持，上一代显卡中HD6870/6850率先做到了，而HD7000更是不在话下。

DisplayPort 1.2 HBR2、HDMI 1.4a都有超高带宽，单个接口即可满足4K×4K分辨率输出，显示设备方面的支持不是问题，市面上主流的3D电视、投影仪，还有120Hz LCD或者双面板LCD都能支持ATI显卡，尤其是三星和LG都有多款型号早已上市。

支持AMD HD3D立体技术的游戏正在越来越多，现已超过600款，而且可以选择第三方的iZ3D、DDD或者原生的HD3D等不同方案，其中原生的有：《尘埃3》、《战地3》、《杀出重围3：人类革命》、《两个世界2》。

目前AMD的3D显示技术，无论效果、兼容性还是软件支持度方面，都丝毫不差于3D Vision。无论是对于3D游戏的立体化，还是2D视频的3D化，都得到了主流媒体播放器的支持，而且AMD的新一代UVD3引擎还能支持3D蓝光硬解码，可以说已经相当成熟了。

一如其在DX10.1上的率先支持一样，HD 7970的发布也让AMD再一次在DX规格支持上获得领先。DX11.1，相比目前广泛应用的DX11规范，它的升级能带来什么样的技术改变，需要什么样的软件平台，什么时候才有支持DX11.1的游戏或者应用呢?

GCN架构图中明确指示说支持“下一代图形API”，也就是DX11.1了

●　DX11.1升级了什么?

　　从小数点后的步进来看，DX11.1只是一次版本上的小步快跑而非大步飞跃，所以不会有什么激动人心的功能变化，但是这不代表DX11.1没有亮点，相反DX11.1的看点还是挺多的。

　　1.加入3D立体支持

　　DX11发布后的这两年，DX图形技术没啥变化，但是伴随3D电影兴起的3D游戏也火了起来，体验过3D游戏之后大多数人都会觉得很震撼(也有人觉得很晕)，栩栩如生的感觉不再是“科幻”。DX11.1很重要的一点改进就是增加了D3D 3D API，可以让开发者通过D3D实现3D渲染。

微软提供通用3D立体显示支持可谓DX11.1众多新功能中最耀眼的一个了

　　之所以这么说是因为目前实现3D立体显示的技术要么是部分绕过D3D API而使用四倍缓冲器(Quad Buffer)实现3D游戏或应用，要么就是利用驱动/中间件实现的。在DX11.1中，3D渲染可以通过新增的D3D API实现，而且微软的D3D 3D API并非排他性的，依然支持其他驱动/中间件方案。换句话就是DX11.1之后，开发者多了一个实现3D的选择。

　　2.支持TBDR渲染

　　TBDR(Tile Based Deferred Render，延迟渲染贴图)也是DX11.1中新增的一个操作指令。它原本是Power VR公司使用的3D渲染技术，主要用在智能手机以及平板、游戏机等设备上。与传统z缓冲的渲染过程相比，TBDR不需要渲染不可见像素，这样极大地减少了数量运算量，非常适合移动设备使用。

　　这项技术对桌面图形计算来说并没有太大意义，只是DX11.1并不只会用在桌面显卡上，还承载着微软扩张移动领域疆土的希望，TBDR依然是DX11.1中的重要功能，低功耗设备的福音。

　　3.TIR目标独立光栅化

　　TIR(Target Independent Rasterization，目标独立光栅化)的功能要求有所不同，因为前面的两项技术只需升级DX11.1运行时程序即可，而TIR却需要更改硬件设计，因此只有新一代显卡才能支持，无法在原有显卡上直接升级。

　　Rasterization光栅化是图像处理的后期过程，DX11.1支持目标独立光栅化，可以将原本CPU负责的工作完全转移到GPU上，进而提高D2D的抗锯齿性能。

　　4.支持双精度浮点运算

　　双精度浮点运算(Double-precision shader functionality)或者叫FP64不仅在GPU计算上意义非凡，在图形渲染中也大有用武之地。虽然DX11中其实已经包含了FP64双精度支持，但是功能有限，DX11.1中才真正实用化。

　　5.图形与视频之间的操作性更灵活

　　DX11.1强化了图形、视频等各种资源之间的操作灵活性，比如计算渲染器(Compute Shader)可以通过Media Foundation处理视频(video)，并将以前的D3DDX9、D3DX10视频处理全部统一到D3DX11中去，可以简化编程，提高效率。

　　以上列举的只是DX11.1规范功能升级的一部分，在微软的MSDN页面上有详细的DX11.1功能介绍，不过里面的内容主要针对开发者/程序员，普通读者读起来肯定头大，我们也不需要搞这么复杂。

　　简单来说，DX11.1相对DX11只是一次优化升级，但是从DX10到DX10.1性能有提升的经验来看，DX11.1可能也有小小的惊喜，即便画质上没有提高，性能也会因效率的提高而受益多多。

● 测试模式与测试方法：

此次发布的显卡定位高端游戏玩家，性能十分强劲，测试时所有游戏中开启全部特效，包4X抗锯齿（AA）和16X各向异性过滤（AF）。虽然很多游戏提供了更高精度的AA，但由于实用价值不高，且没有可对比性，所以不做测试。

为了做到全面客观，有对比和参考，分辨率测目前最主流的1920x1080，和更高阶的2560x1600。目前也有部分显示器是（1920x1200），游戏在这种分辨率下的性能表现与1920x1080差不多，FPS稍低一点点，使用这种显示器的朋友依然可以参考我们的测试成绩。

● 测试平台配置：

HD7970

此次测试平台选择了Intel最高端的六核心处理器，搭配最新的X79芯片组，与Radeon HD7970系列强强联手，定位旗舰卡皇之战。

AMD此次发布的新品HD7970，我们自然会拿它与自家上代产品HD6970和HD6990进行对比。至于N卡方面，则选择了单芯最强的GTX580进行对比，同时奉上HD7970超频和交火的成绩，总计六款显卡项目测试。

除了OC项目外，其他参测显卡都使用NVIDIA和AMD双方的公版规格和公版频率，这样测得的性能和功耗发热数据最有参考价值。

软件介绍：做为目前最为权威的性能测试软件，3DMark Vantage在3D基准性能测试，可以全面准确的得出显卡的真实性能，所以在历次测试中都少不了它的加盟。3DMark Vantage所使用的全新引擎在DX10特效方面和《孤岛危机》不相上下，但3DMark不是游戏，它不用考虑场景运行流畅度的问题，因此Vantage在特效的使用方面比Crysis更加大胆，“滥用”各种消耗资源的特效导致Vantage对显卡的要求空前高涨。

旗舰显卡不是主角！来自次神460的救赎

画面设置：3DMark Vantage中直接内置了四种模式，分别为Extreme（旗舰级）、High（高端级）、Performance（性能级）和Entry（入门级），只有在这四种模式下才能跑出总分，如果自定义模式就只能得到子项目分数了。我们此次测试选择了Extreme（旗舰级）进行测试。

● 3DMark Vantage Extreme模式成绩：

DX10的标杆，兼顾DX9的性能，时至今日，Vantage作为老游戏的代言人，依然无法被替代。HD7970默认频率在本项目测试中超出GTX28.87%，而超频后更是超越了HD6990!

&nb

Crysis（孤岛危机）无疑是DX11出现之前对电脑配置要求最高的PC游戏大作。作为DX10游戏的标杆，Crysis的画面达到了当前PC系统所能承受的极限，超越了次世代平台和之前所有的PC游戏。Crysis还有个资料片Warhead，使用了相同的引擎。

旗舰显卡不是主角！来自次神460的救赎

画面设置：Crysis只有在最高的VeryHigh模式下才是DX10效果，但此前所有高端显卡都只能在低分辨率下才敢开启DX10模式，如今的DX11显卡终于有能力单卡特效全开流畅运行。为了让不同用户都能找到参考的成绩，我们测试了1920X1080和1680X1050两种分辨率+NOAA和4AA两种模式。

测试方法：Crysis内置了CPU和GPU两个测试程序，我们使用GPU测试程序，这个程序会自动切换地图内的全岛风景，我们跑两遍得到稳定的平均FPS值。

● 1920X1080分辨率性能测试

● 2560X1600分辨率性能测试

作为DX10的一朵奇葩，当年有显卡危机诨号的Crysis现在依然是显卡资源占用大户，尤其是开启2560分辨率以后资源要求惊人，HD7970也仅仅跑出32帧的平均速率，而上一代的HD6970和GTX580则难以流畅运行！

赛车游戏中，轰鸣的发动机声、风驰电掣的急速快感，足以让无数玩家肾上腺素飙升。也许正是如此，才使得《科林麦克雷:尘埃3》在众多游戏中备受玩家青睐。

　　《尘埃3》采用与《F1 2010》同样的Ego引擎，拥有更加拟真的天气系统及画面效果。游戏将包含冰雪场景、动态天气、YouTube上传、经典的赛车、分屏对战、party模式、开放世界、更多真实世界中的赞助商和车手等特点。

相比首款DX11游戏的《尘埃2》，《尘埃3》在诸多DX11游戏特效的力助下，游戏画质表现更加出色。无论是日出还是日落，下雨还是干燥，看上去都非常逼真。背景的烟花和观众让游戏代入感非常强。车身会随着比赛的进行染上泥土或者雪，一辆崭新的赛车或许会在比赛完成之后，变成一辆被泥土覆盖的“垃圾车”。

　　图像方面，《尘埃3》是该系列至今为止最漂亮的一款。《尘埃3》中的驾驶感相当不错，6种调整选项也足以应付各种地形。而且，在芬兰、密歇根、挪威、洛杉矶、肯尼亚和摩纳哥驾驶赛车狂飙真的是一种享受。赛车会对相当细微的操作做出回应，在雪地或泥地中，这一点尤其重要。而当你的对手把雪花和泥浆弹到你的挡风玻璃上时，你只能依靠自己的直觉和细微的操作不至于翻车。而游戏中，雪花、雨滴和夜晚驾驶不仅仅是外在的装饰而已，和现实生活一样，你需要各种赛车配件来应对这些情况。

● 1920X1080分辨率性能测试

● 2560X1600分辨率性能测试

依然是HD7970的showtime，OC灭到HD6990，而HD6970和GTX580只有在后面吃灰的份了……

　　由EA DICE工作室开发的《战地3》采用了最新的“寒霜2”引擎，完美支持DirectX 11，并且拥有强大的物理效果，最大的亮点还是光照系统，其渲染的场景已近乎乱真的地步，视觉效果堪称绝赞。游戏还支持即时昼夜系统，为玩家营造一个亲临现场的真实环境。

索泰2GB显卡测试

寒霜2引擎最大的特点便是支持大规模的破坏效果。由于考虑到游戏的画面表现以及开发成本，DICE放弃了以只支持DX9的WINDOWS XP操作系统。另外由于该引擎基于DX11研发，向下兼容DX10，因而游戏只能运行于WINDOWS VISTA以上的的操作系统。

在《战地3》中，“寒霜引擎2”内置的破坏系统已经被提升至3.0版本，对于本作中的一些高层建筑来说，新版的破坏系统将发挥出电影《2012》那般的灾难效果，突如其来的建筑倒塌将震撼每一位玩家的眼球。

　　《战地3》采用了ANT引擎制作人物的动作效果。在此之前，ANT引擎已在EA Sports旗下的《FIFA》等游戏中得到应用，不过在FPS游戏中使用尚属首次。相较于Havok等物理引擎，用ANT引擎可以花费较少的精力制作出逼真的效果。举例来说，战士在下蹲时会先低头俯身、放低枪口，而不是像以前的游戏那样头、身、枪如木偶般同时发生位移。此外，ANT引擎也可以让电脑AI的行动更加合理。但这款大作目前并不能良好的兼容120Hz3D以及红蓝3D模式。

● 1920X1080分辨率性能测试

● 2560X1600分辨率性能测试

寒霜2引擎年度大作战地三，是为数不多的画面可以挑战Crysis的游戏大作，而对核心和显存的要求已经超越了Crysis！

第五章/第八节 DX11游戏性能测试：《AVP》

AVP原始版本并不支持AA，但升级至1.1版本之后，MSAA选项出现在了DX11增强特效当中，当然还支持Tessellation、HDAO、DirectCompute等DX11招牌特效，游戏画面相当出色。

游戏介绍：《Aliens vs. Predator》同时登陆PC、X360和PS3，其中PC版因为支持DX11里的细分曲面(Tessellation)、高清环境光遮蔽(HDAO)、计算着色器后期处理、真实阴影等技术而备受关注，是AMD大力推行的游戏之一，但是这样的主题难免让本作有很多不和谐的地方，暴力血腥场面必然不会少！发行商世嘉在2009年11月就曾明志，表示不会为了通过审查而放弃电子娱乐产品发行商的责任，因为游戏要维持“异形大战铁血战士”这一中心主题，无论画面、玩法还是故事线都不能偏离原著。

测试方法：游戏带Benchmark，其中测试画面颇代表意义，很好的体现了Tessellation异形身体以及HDAO等高级特效，希望这些特效能让系统发挥所有潜力。

● 1920X1080分辨率性能测试

● 2560X1600分辨率性能测试

抛开游戏娱乐性不谈，这款应用了不少DX11特效的作品画面还是可圈可点的，当然也是非常吃显卡资源。开启全部特效以后HD6970力不从心，其他显卡顺利过关。

HD7970

HD7970作为AMD定位旗舰的显卡，默认频率高达925/5500MHz。但28nm的工艺极限并不在此。和此前显卡测试不同，前面所有的效能测试中我们均特意加入了1125/6300MHz的成绩，原因有三：

1、Radeon HD7970 超频之后，性能表现非常稳定，在所有测试项目中均无花屏死机或者驱动停止响应的情况发生。

2、Radeon HD7970 超频1125/6300MHz，并不需要更改核心和显存电压，而功耗增加也非常少，基本可以忽略。

3、Radeon HD7970 超频至1125/6300MHz，相对于默认频率功耗增加非常小，基本可以忽略。

AMD曾经背负效率低下骂名的SIMD架构，在HD6000终于笑到了最后。凭借超大规模的流处理器、以及改进的双超线程分配处理器，HD6000的效率比起HD5000有了明显的提升。如果继续优化扩充的老路，28nm工艺、43亿个晶体管的HD7000性能飙升也是可以预期的。

反观NVIDIA架构想要扩充流处理器的话，需要耗费更多的晶体管，由此导致NVIDIA的GPU核心面积要比AMD同级别产品大不少，而大核心除了成本较高之外，还得面对良品率较低、功耗较大的负面影响。既然如此，为何AMD还要进行大规模的架构革新？

随着技术的发展，图形和计算的概念已经不再像以往分的那么清楚了，进入DX11时代时候，全新API新特性赋予GPU更多的任务和使命。“通用计算”这一专业术语越来越多的现于新闻、见诸报端。AMD作为全球领先的GPU制造厂商，为高性能计算做出了巨大的贡献，而这次AMD下定决定进行大规模的架构革新很大程度上也是为了这方面做出的考虑。

AMD能够在架构革新的同时，进一步降低功耗与发热，还能提升性能、增强功能实在难能可贵，而各方面都非常优秀的HD7970无疑让下一代NVIDIA旗舰的压力增加不少！而2012显卡市场注定不会寂寞！■

0人已赞

28nm领军之作!AMD旗舰HD7970性能测试

关注我们