AMD绝地逢生!八款HD4800显卡解析测试
随着AMD HD4800系列的正式发布,AFan们终于扬眉吐气了一回,被压抑了许久的怨气终于在这一刻迸发,从HD4850评测文章超高的人气足以见得民心所向!HD4850是追求性价比的产物,而后来上市的HD4870,则代表着RV770核心的真正实力,有了全新GDDR5显存助阵,HD4870的对手已经不再是NVIDIA上代的9800GTX(+)了,而是直接将矛头对准最新的GTX260。
● 800个流处理器!R600架构终于开花结果
从DX10时代开始,AMD就因R600核心架构问题和延期上市付出了惨重代价,导致HD2000系列高中低端全线产品处于被动局面,直到HD3000系列上市才稍微有些起色。但实际上RV670的架构相对于R600没有本质改进,只不过是通过先进的工艺降低了制造成本,提高了产品性价比,对于高端玩家来说,HD3800低下的执行效能和拙劣的AA性能显然是无法交待的。

而新一代的RV770核心则是卧薪尝胆之作,它将R600的超标量流处理器架构发挥到了极致——ATI只花费了43%额外的晶体管就将流处理器规模扩充了2.5倍!不仅如此,RV770的纹理单元、光栅单元、显存控制器都作了不小的改进,在上代显卡中所发现的问题都被及时修正。通过之前HD4850的评测就可以发现,G92核心最强者9800GTX已不是它的对手,NVIDIA引以为傲的抗锯齿效能在RV770面前简直不堪一击,很多专为N卡优化的TheWay游戏也被一一攻克……而在HD4870的测试中,NVIDIA引以为傲的GT200系列产品GTX260也败在了HD4870的脚下。
● 避其锋芒以柔克刚!HD4800欲称霸1000-2000元价位
无论AFan还是NFan,都应该为HD4850/4870的上市而拍手叫好,因为在HD4850面市之前,同级别的9800GTX还要卖2000块以上,HD4850发布当天就迫使NVIDIA将其瞬间降价1000块;而HD4870的出现,则让刚刚摆上柜台的GTX260自降1000元,这种举措在历史上都是极为罕见的,这也从另一个方面证明NVIDIA也同样肯定了对手的实力。
实际上,从HD3800系列开始,AMD的产品设计思路就发生了改变,将中端显卡作为研发的重中之重,然后通过双GPU打造高端产品。上一次的HD3800仅仅是探路之作,现在的HD4800在吸取了经验教训后,将性能价格比和性能功耗比放在了第一位,努力将晶体管数控制在了10亿之内,这样无论芯片成本还是显卡制造成本都要低很多,HD4850就是严格控制成本的产物,上市价格仅为1399元,为消费者提供了千元价位最高性价比的产品!
而NVIDIA则一如既往地通过暴力堆积晶体管的方式,打造出至高性能的旗舰显卡,然后再通过阉割的方式降低产品定位。完整规格的GTX280性能自然十分强大,但价格也是高高在上,阉割版的GTX260价格还不错,可是性能损失也不少。相反的,HD4870在本来就已经十分强大的HD4850上再次提升频率,并全球首次采用GDDR5显存颗粒,即便是这样,HD4870的价格并没有虚高,即使价格还不错的GTX260,在性价比方面仍然不敌HD4870。
有些朋友可能会比较疑惑,为什么RV770能有有如此令人惊喜的表现呢,它的设计到底相对于上一代产品RV670来说有什么改进呢?说到这个问题,我们就不的不说到RV770的整体核心架构以及一些细节方面的改进!
RV770核心架构仍然源自于R600,但青出于蓝而胜于蓝,流处理器、纹理单元、光栅单元、核心面积的利用率等所有方面都有了大幅度的改进和加强,并且数量几乎都翻倍。我们一起来看看:
● RV770核心架构图:
基本上,RV770和RV670的整体结构是相同的,RV670身上所有的模块都得到了沿用,但很多模块都经过了重新设计或者优化设计:
1。SIMD阵列扩充为10组,每组SIMD绑定专属缓存及纹理单元;
2。纹理单元数量扩充为10组,寄存器容量增加;
3。继续提升几何着色的效率,适应未来DX10游戏的需要;
4。改进可编程镶嵌单元,使之更适合于动画游戏实时渲染;
5。改进显存控制器,率先支持GDDR5,并加入显存读写缓冲区,增强数据读写命中率。
● RV770核心规格全面翻倍:
翻倍的规格是最容易理解的,但数字部分往往比较抽象,下面就详细介绍各个模块的具体含义。
RV770核心最显著的特点就是将流处理器提升到了空前的800个,达到了RV670的2.5倍!实际上除了流处理器之外,纹理单元、光栅单元都得到了大幅增强。
● 流处理器翻2.5倍:
RV670是4组SIMD,每组16个Shader,每个Shader 5个流处理器
RV770是10组SIMD,每组16个Shader,每个Shader 5个流处理器
在SIMD和Shader规模扩大的同时,Ultra-Threaded Dispatch Processor(超线程分配处理器)也变得更加复杂。由于每组SIMD所包括的Shader数量增多,阵列内的Arbiter(仲裁器)和Sequencer(定序器)数量同比增加至20个,因此扩充规模后的RV770单个Shader执行效率并不会下降。
● 纹理单元翻2.5倍:
RV770的纹理单元数量相比R600/RV670翻了2.5倍,从4组增加至10组,这样RV770总共就是40个纹理单元,Shader和TMU的比例达到了4:1。
每组纹理单元内部包含了4个纹理寻址单元(黄色,共40个),16个32位浮点纹理采样单元(橘黄色,共160个),和4个纹理过滤单元(深红色,共40个)。
● 光栅单元数量不变,规格翻倍:
RV770还是保持4组后处理单元,也就是通常所说的16个。但这次AMD重新设计了光栅单元的内部结构,以改善R600/RV670那低下的AA效能。
R600/RV670每组后处理器单元内部包括了8个Z/模版采样,而RV770将采样数量提高至16个,多重采样(MSAA)速度直接翻倍,AMD声称RV770可以提供几乎免费的2xMSAA效能,并且4x/8xMSAA效能相比上代提升非常显著。
RV770的AA算法最终还是交给Shader部分来处理,好在RV770的流处理器高达800个,多数情况下都处在性能过剩状态。2倍的Z/模版采样率再加上2.5倍的Shader规模,RV770的抗锯齿性能将会有一个质的飞跃,详细大家请参阅游戏测试部分。
RV770核心不仅仅是把核心各个模块的数量翻倍这么简单,实际上在微架构方面还做了不小的优化,这方面相信很多朋友还不容易理解,下面就做一个简单的说明。
● 压缩晶体管密度,每平方毫米晶体管性能提升40%
在GPU最关键的流处理器部分,RV770与RV670的结构是完全相同的,RV670拥有4组SIMD(每组SIMD包括16个Shader,每个Shader有5个流处理器),RV770是10组SIMD,可以说在流处理器部分只是单纯的扩充了规模。不过,这次ATI通过另外一种“投机取巧”的方式提高了RV770核心的“效能”——压缩晶体管,或者说是提高硅片的利用率。

同为55nm工艺,RV670和RV770的SIMD阵列所占体积不同
通过上图就可以看出,从RV670到RV770,每组SIMD阵列所占用的芯片面积缩小了40%,如此一来每平方毫米晶体管所能提供的性能就提高40%。在架构和结构不变的情况下,能获得如此巨大的性能提升,看来ATI对于55nm工艺的运用已经达到了炉火纯青的地步!

RV770核心各部分模块示意图
现在我们就可以理解,同为55nm工艺,为什么7.54亿晶体管的G92核心面积高达276平方毫米,而9.56亿晶体管的RV770核心面积只有260平方毫米!因为RV770的晶体管密度更大,G92b作为NVIDIA首颗55nm的GPU,看来晶体管密度还不够高,没有充分利用硅片面积。
减少芯片面积的优势是不言而喻的,意味着一块晶元上能切割出更多的GPU核心,这样制造成本就会下降。当然与成本息息相关的还有芯片良品率的问题,RV770的晶体管密度如此之高,可能会影响良率,而且发热过于集中的问题会比较棘手。
● 纹理单元全新的缓存设计
前面已经提到RV770相比RV670纹理单元的数量翻了2.5倍,在数量增加的同时,一二级缓存的容量和带宽都随之改进,以确保存取效率。
- 顶点着色拥有独立专署缓存
- 每一组SIMD阵列拥有单独的一级缓存(L1 TC)
- RV770核心相比RV670,L1 TC容量翻倍,总L1容量达RV670的五倍!
- 在显存控制器和显存颗粒之前拥有二级缓存
- L1纹理缓存存取速度高达480GB/s
- L1和L2缓存之前的带宽高达384GB/s
● 抗锯齿效能翻倍:
在之前HD4850的评测中我们已经发现,其AA效能大幅超越HD3870,和9800GTX/+相比也能够反败为胜,而且AA等级越高优势就越明显!
可以看出,全新的ROP单元大大加强了RV770核心的多重采样效能,如果不开AA那么RV770就没什么优势,一旦打开2x/4x/8xAA,那么它惊人的实力就会被完全释放出来。
由于目前玩家们对游戏画质的要求很高,抗锯齿基本上成为了每个游戏的默认特效,再加上目前高端显卡的实力够强,在打开AA的情况下都有不错的FPS,因此4xAA应该是基本配置,更何况微软已经将4xMSAA列为DX10.1的默认标准,所以高端显卡的性能应该以打开4xMSAA为准!
看完了前面我们的核心介绍,相信大家对RV770的核心架构已经有一个比较全面的认识和了解。但是这些改进到底能带来多大的效能提升?相对于竞争对手的GTX260与9800GTX来说,HD4870与HD4850又到底能不能打败对手?之前,我们在HD4870的首发评测文章中,已经给出了这些问题的答案。






可见,RV770核心架构的改进,确实带来了等比例的性能提升,性能方面均领先了NVIDIA的同级别产品。这也是近段时间,AMD的显卡在市场上普遍受到关注的原因。甚至从最新的市场调查来看,AMD已经开始威胁到NVIDIA显卡市场占有率第一的位置。
当然,好的产品不仅仅消费者喜欢,显卡厂商也同样喜欢。HD4850上市以后,不少品牌推出各种形势的非公版产品,而有一些虽然还是公版方案,但是散热器、用料也有加强。前一段时间,笔者做了一篇《十项指标比拼!六大非公版HD4850横评》这篇文章,引起了广泛的关注与反响。
可以说,在HD4800系列产品的合作厂商中,台湾厂商迪兰恒进算是这次AMD非常好的的合作伙伴。在国外笔者不知道,但是在国内,迪兰恒进绝对是第一个正式将HD4850推向市场的品牌,其速度比AMD全球最大的AIB合作伙伴蓝宝石要快的多。
不仅如此,迪兰恒进在HD4800显卡上市还不到3个月的时间,就已经推出了8款相关的RV770核心显卡。HD4850与HD4870各四款,实际上还有一款HD4870X2,不过由于定位太高,在本文就不做讨论了。
虽然是8款显卡,但是其中有两款产品都仅仅是显存容量方面有区别而已,所以真正意义上应该是5个版本。下面,我们分别来对这几款显卡详细的剖析一下,看看迪兰恒进这几款Radeon HD4800做工、用料到底怎么样。
在AMD发布Radeon HD4850的同时,迪兰恒进就推出了一款标准版的HD4850显卡。完全采用AMD官方的公版解决方案,包括产品的散热器、电容等的选料等,都完全一样。大家都知道,公版产品实际上可以看作是稳定、原厂的象征,迪兰这款HD4850也不例外。
事实上,公版HD4850采用的这个单槽散热器价格是不菲的,甚至比市面上绝大多数HD4850所采用的散热器都要贵。但是,单槽散热器很严重的一个问题就是风量小,并且设计比较紧凑,如果想要良好的散热效果的话,必须要将风扇转速调到很高才可以,不过噪音又无法忍受。迪兰恒进这款显卡通过在BIOS里锁定了风扇的转速,效果好了一些。
显卡核心就不用多说了,目前所有的HD4850核心都完全一样——拥有800个流处理器的RV770核心,支持DX10.1应用程序接口。公版的HD4850采用的是奇梦达的1.0ns GDDR3显存颗粒,8颗显存共组成512M/256Bit的规格,默认频率为625/1986MHz。

看一款显卡的好坏,首先要看PCB的层数以及走线,第二就要看供电部分的用料了。良好的用料虽然不能给显卡带来明显的性能提升,但是超频能力会更强,且显卡的寿命要比质量差的显卡高很多。
公版HD4850采用的是2+1相供电设计,核心两相供电,每相供电两个贴片电感+4个Mosfet,采用万裕ULR系列固态电容与富士通固态电容的组合;显存部分采用一相供电,同样是这两种电容的组合。
同时,公版的Mosfet采用的是德国英飞凌型号为BSC042N03LS G的Mosfet,采用TDSON-8封装,从各方面参数来说都属上等。显卡的散热器可以直接覆盖到电感以及Mosfet,散热也不错;另外,公版供电部分还有12V EXT input chock,整套系统的稳定性很有保障。
输出接口部分没什么可说的,就是普通的双DVI接口+S-Video输出接口,不过可以通过ATI专用的转接头转成HDMI,同步输出音频与视频。
迪兰恒进这次新推出了一个系列,叫做HD4850北极星系列。显卡的主要方向是打造比公版更加豪华的产品,这次迪兰恒进推出了两款HD4850北极星显卡,一款显存容量为512M,另一款显存容量为1GB。虽然两款显卡只有容量上的差别,但是所采用的板型并不一样,所以我们这里单独进行介绍。
●HD4850北极星512M
这就是HD4850北极星的整体外观,显卡PCB仍然是基于AMD公版设计,但是在用料上有一些加强,我们稍后会说到这一点。
散热器是迪兰恒进北极星很大的量点,这款散热器出自韩国散热器大厂ZeroTherm之手,散热器看起来非常漂亮。根据我们之前的测试,这款散热器能将HD4850的待机温度控制在43度左右,而AMD公版散热器待机温度高达70多度。散热器的材质也非常不错,一根纯铜热导管,与核心接触的底面也是纯铜设计。
显卡供电部分,相对于公版HD4850来说电容更换成了日本三洋的Sepc系列固态聚合物电容,性能和卖相都非常好。并且整块显卡上没有一个线圈电感,全部都换成了性能更好的贴片式电感(公版卡上有两个开放式电感)。
另外,Mosfet方面,迪兰恒进采用的是on semiconductor推出的NTMFS4835N,这种Mosfet的额定VDSS为30V,RDS(on)为3.5mΩ,最高导通电流(ID)高达104A,属于参数非常高的一种了。同时,显卡供电部分的所有Mosfet都加装了散热片,连显存供电部分的两个小Mosfet都没有放过,可见工程师非常认真。
整体来说,迪兰恒进这款HD4850北极星不管从做工还是用料方面来说,都是很不错的一款产品了。下一页我们再来看看1GB版本的HD4850北极星。
因为显存方面的原因,这款1GB显存无法采用之前的公版PCB,而只能另起炉灶开发新的PCB。所以,迪兰这款HD4870北极星1GB是一款完完全全的非公版产品。
很明显,非公版的HD4850从外观、布局上就看出来了与公版的不同之处,包括供电部分、显卡背部的显存等。
显存方面,实际上还采用的是奇梦达1.0ns的GDDR3显存,不过前后一共16颗,组成了1GB的容量。
实际上,这款显卡的供电部分相对于公版HD4850来说有些缩水,首先电感换成了立方体式的,效能要比公版的贴片式差很多,并且每相供电只有一个电感,而公版是两个,Moseft也不如公版。不过值得一提的是,这款显卡全部采用的是日本化工的固态电容,在品质和性能上都应该要比公版采用的国产万裕电容好一些。
输出接口仍然是那样,没什么可说的!
除了前面介绍的之外,迪兰恒进还自行研发推出了一款型号叫做星钻版的HD4850显卡,这也是一款纯粹的非公版产品。
显卡整体外观,看起来和公版的HD4850还是有比较大的区别,主要体现在供电模块和输出接口部分。
显卡采用韩国螺旋贴片技术的“螺旋飞翼”散热器,我们从散热器外形不难看出“螺旋飞翼”这样名字的含义。其不仅散热效果出众,同时运行时所产生的噪音也十分的低。

显存仍然是奇梦达1.0ns GDDR3,该卡默认频率为635/1986MHz
很显然了,这款产品相对于公版HD4850来说,也有点缩水,实际成本应该和前面介绍的HD4850北极星1GB差不多,仍然是立体电感、日本化工固态电容。不过该款显卡的零售价格非常不错,仅为1099元。
当然,这款显卡最大的特色在输出接口方面,显卡采用DVI+DisplayPort+HDMI的全接口输出,同时还随显卡附送DVI to VGA转接头,完美兼容当今所有的显示设备。
迪兰恒进的HD4870也是首批上市的公版HD4870显卡,和第一款上市的HD4850一样,这个也是完完全全的公版产品。不过迪兰恒进HD4870标准版有两款,一款是512M显存的产品,另一款是1GB显存的版本。
与追求低成本的HD4850不同,HD4870则是一款真正意义上的高端显卡,ATI昔日高端显卡上那些豪华的散热器、供电模快、完美的做工再次呈现在大家面前。
HD4870散热器的整体结构和HD2900XT类似,不过散热片并非纯铜,只有底座是纯铜打造,看来RV770核心虽然晶体管增加不少,但发热量和R600相比还是要低一些。另外,这散热器内部还有两根粗壮的纯铜热导管,可以及时的将核心所散发的热量导入到散热鳍片上。
显卡核心采用的同样是RV770核心,与HD4850在核心上没有根本的区别,主要是显存,HD4870采用的是最新的GDDR5显存颗粒,默认频率就高达750/3600MHz。两款标准版HD4870的主要区别就是显存容量。
供电部分是HD4870的一大看点,采用的是数字供电的方式,核心供电部分主控芯片是VT1165A,电感采用的是三胞胎设计的VT1195,单颗VT1195能够提供40A电流,三相就是120A,这要比GTX260的三颗VT1165提供的90A还要大!实际上HD4870的峰值电流还不到100A,这样的冗余设计显然是留给玩家超频之用。另外大家可以看到HD4870的PCB其实有一相被空焊,也就是说最大可支持四相供电,最高可提供160A的电流,看来ATI认为四相太奢侈了,所以被缩水掉了。
显存供电为两颗VT235WF,并没有电源主控芯片,因为这颗VT235WF的集成度更高,它将主控芯片、驱动IC电路和MOS管全部整合在了一起,因此看上去VT235WF比VT1195SF的芯片面积要更大一些。两相式供电为显存提供了最大60A电流,可满足超高频率下稳定运行。
输出接口仍然采用的是双DVI+S-Video的全接口设计,附送DVI to HDMI转接头、DVI to VGA转接头等附件。
可以看出,豪华的供电再加上产量有限的GDDR5显存,HD4870的成本并不低,以目前的售价来看的确是相当厚道了。
同时,迪兰恒进还发布了两款型号为火钻版的HD4870,仍然是显存容量上的区别。不过相对于标准版,火钻版在散热、频率以及供电方面有所加强。
火钻版给我们的第一感觉就是更换了公版的散热器,但是实际上远不止这些,我们一一道来。
迪兰恒进HD4870火钻采用了一款体型巨大的一体式热管散热器,中央大尺寸的散热风扇配合4根高效热导管能够快速散发核心超频后所发出的热量,以满足显卡长时间连续工作的要求。而对于喜欢超频的用户来说,豪华的散热器设计能对超频带来不小的帮助。
同时,为了防止PCB变形,迪兰恒进还特地给火钻版HD4870加上了金属加固条,很人性化的一项设计。
上图分别是512M版本和1GB版本的显存颗粒,512M版本仍然采用奇梦达的GDDR5显存,而1GB版本采用的是海力士的GDDR5显存颗粒,两款火钻版HD4870的频率均为800MHz/3800MHz。
实际上除了散热器之外,显卡的供电部分也相对公版的HD4870有所加强。细心的朋友可以看出,公版HD4870采用的是三颗VT1195三胞胎式电感搭配3颗Mosfet,而火钻版HD4870采用的是4胞胎连体式电感,同时加了一颗Mosfet,也就是核心从三相供电变成了4相供电。显存供电部分没有变化。正是由于多了一相供电,才使得显卡能够在跟高的频率下运行。
输出接口方面,迪兰恒进的火钻版和公版保持一致,没有什么太大的区别。
通过前面几页的介绍,我们已经对迪兰恒进这8款HD4800系列显卡有了一个比较全面的认识。可以看出,除了标准版显卡以外,产品的频率都较公版有一些提升。那么,频率的提升到底能带来多大的性能提升呢,这还的通过实际的测试才能了解。
由于时间与版面的关系,本次我们并没有对每一个游戏进行测试,只是测试了当今最新、最权威的3DMark Vantage这一个项目。由于都是高端显卡,所以本次测试我们全部在High模式(1680×1050 2AA8AF)下进行,先来看一下我们所使用的测试平台:
● 测试平台配置
PCPOP.COM评测室 | |
硬件系统配置 | |
Intel QX9770 四核心, 3.2GHz, L2=12MB | |
主 板 | ASUS RAMPAGE Formula, chipset:X48 |
显 卡 | 所有迪兰恒进HD4800系列显卡 |
内 存 | CORSAIR Dominator TWIN2X2048-10000C5DF DDR2-800(4-4-4-12) 4x1G |
硬 盘 | 西部数据 WD3200AAKS 32 |
电 源 | 海盗船 TX 1000W |
软件系统配置 | |
Windows vista Unimate 32Bit SP1 | |
DirectX | 10.1 |
显示驱动 | ATI Catalyst 8.8WHQL |
为了不影响显卡的性能发挥,本次测试平台我们采用了优异的QX9770四核心CPU,搭配华硕X48主板,内存配备为4GB DDR2 800;驱动程序采用的是最新的催化剂8.8WHQL,测试环境为Windows Vista SP1。下面我们来看测试的具体数值:

上图的统计表就是本次所有参测显卡的具体数值,可以看出不管是HD4850还是HD4870,频率提升之后都相对公版(标准版)有一定的性能提升。为了让成绩更加直观,笔者还专门做了一个表格,以探究频率提升后相对于公版显卡的具体提升数值。由于本次参测的512M标准版显卡和公版频率一样,所以公版的成绩就直接参考了标准版显卡的成绩。看下表:

可以看出,由于频率提升幅度不大,所以在具体的性能表现方面提升幅度也不大,但是通过我们前面几页的介绍,相信大家对迪兰恒进这几款产品的做工、用料都有比较详尽的了解,单纯的对性能提升进行评价没有太大的意义。

总体来看,作为在亚太地区的一个重要合作伙伴,迪兰恒进一下子就推出了8款Radeon HD4800系列显卡,并且每一款显卡都有着自己的特色,这在整个业内都算是非常罕见的。不管是产品的做工也好,还是产品的性能也罢,还是从产品的价格方面来说,这几款产品都算是目前市场上比较超值的产品。作为AIB厂商,迪兰恒进很负责任的扛起了推广HD4800系列显卡的大旗。
从AMD方面来看,HD4800系列显卡可以算得上是AMD的救世主。自从进入DX10时代以来,AMD节节被NVIDIA压迫,虽然在HD3000时有所起色,但是在主流市场上,HD3650仍然不敌竞争对手的8600GT(从市场的出货量来说),这次HD4800系列产品的上市为AMD赚足了眼球,销量也是节节攀升。从我们之前做过的一次投票来看,支持AMD的网友超过了90%,看来2008、2009年这两年都将是AMD的春天。<
关注我们


