为王位而生 GeForce8800全面解析测试

2006年11月09日 03:00     出处: pcpop    作者:泡泡网评测室   分享

第四章 G80核心大革命,全新流明引擎解析

    众所周知,NVIDIA以往几代GPU的核心架构都是以CineFX X.0来命名的,而G80采用了焕然一新的“流明引擎”,在介绍新的引擎之前,我们首先来回顾下经典的CineFX引擎发展史,从中也能够更深刻的理解NVIDIA的GPU架构设计思路:

● 第四章 第一节 四年四代CineFX引擎回顾

  • 要速度更要画质——CineFX 1.0引擎实现电影级渲染:

    NVIDIA从GeForce FX系列开始(进入DX9时代)将其GPU架构命名为“CineFX引擎”,它其实就是顶点渲染单元与像素渲染单元及相关辅助技术的复合体,堪称是GPU芯片的心脏!

 
 GeForce FX 5800 Ultra

    NV30(GeForce FX 5800)采用了CineFX 1.0引擎,它能够支持DirectX 9 API当中的Pixel Shader 2.0+和Vertex Shader 2.0+。其最大的亮点就是能提供强大的可编程能力,可实现128位色渲染,允许开发者实现电影级渲染的惊人视觉效果,这也就是Cine命名的由来。但不幸的是,CineFX 1.0的威力并没有被FX5800真正发挥,反而由于渲染运算的负担过重,使其速度表现颇为一般,加之FX5800自身存在功耗过高、散热系统噪音太大、显存位宽不足等缺陷,最终FX5800成为一款失败的产品。

    尽管如此,CineFX 1.0引擎仍具有历史性的意义,它首次将注意力从速度转移到渲染精度和视觉效果上,只追求速度的传统做法被彻底终结。CineFX 1.0的这套设计思想在它的后继版本中得到忠实贯彻。

  • 渲染能力大幅增强——CineFX 2.0改进版登场:

    GeForce FX5800由于产品硬伤太多,很快就退出了市场,NVIDIA拿出代号为NV35的GeForce FX5900接替它的地位,CineFX引擎也同时升级到2.0版。

    相比第一代技术,CineFX 2.0重点改进了浮点像素渲染单元(Pixel Shader)的运算能力——NVIDIA甚至宣称,NV35在像素渲染方面可达到NV30两倍的效能。此项改进虽然谈不上革命性,但有效提高了GeForce FX5900的竞争力,NVIDIA成功从困境中脱身而出。

    除了改进像素和顶点单元的效率之外,CineFX还引入了两项新的技术:Intellisample HTC技术合理的利用了256Bit显存带宽,大幅提升了5900系列全屏抗锯齿的效能以及各项异性过滤的图像质量,并且增加了更多的高级纹理、色彩以及Z轴无损压缩算法以提升图象质量;另外Ultra Shadow技术让阴影着色的资源消耗更低,借助新的算法大幅提升了成像速度。

  • 将SM3.0/HDR发扬光大——CineFX 3.0引擎带来无与伦比的光影效果:

    2004年4月,NVIDIA发布代号为NV40的GeForce 6800 Ultra,这被认为是划时代的产品,它的CineFX 3.0引擎让NVIDIA迅速走出了FX系列的阴影。不同于CineFX 2.0,CineFX 3.0带来了大量的改进,其中最富革命意义的就是可完全支持微软DirectX 9.0中的Shader Model 3.0,它包含大家熟悉的VertexShader 3.0和PixelShader 3.0,且带来了128bit浮点精度HDR技术,大幅提升高动态范围3D场景的画面质量。游戏的渲染精度及视觉效果都被提升到前所未有的高水平。

{imageTitle}
 
 GeForce 6800 Ultra

    在《分裂细胞》、《FarCry》、《兄弟连》等新一代游戏中,Shader Model 3.0的诸多特效获得充分展现,而采用CineFX 3.0引擎的GeForce 6800 Ultra在这些应用中也大放异彩。此外,CineFX 3.0还可支持OpenGL 1.5 API及微软的HLSL、OpenGL Shader Language以及NVIDIA自己的CG图形语言,具有相当高的灵活性及扩展性。CineFX引擎加入的SLI双卡互联技术将图形性能提升到了未来才能达到的水平,令发烧玩家惊喜不已!

  • 性能大幅改进——CineFX 4.0引擎带来最强GPU图形渲染效率:

    CineFX 3.0引擎已经能够完全支持DirectX 9.0C的所有先进技术,时至今日该引擎并不落伍。为了进一步提升性能,GeForce 7800不仅大幅增加了像素渲染管线数和顶点单元,而且在架构方面重点改进了GPU管线的渲染能力,这就是CineFX 4.0引擎。

{imageTitle}
 
 GeForce 7800GTX

    与CineFX 3.0相比,CineFX 4.0引擎重新设计了顶点着色器,缩短了设置时间和执行几何处理的时间,顶点纹理拾取(VTF:Vertex Texture Fetch)性能有一定的提升,纹理缓存的吞吐能力大幅提升,因此CineFX 4.0引擎能够加速完成位移映射;而在像素渲染部分,CineFX 4.0引擎的每条管线都拥有两个算术处理单元(ALU),而CineFX 3.0只有一个,这样在只增加很少晶体管的情况下,CineFX 4.0引擎的像素着色器的浮点运算能力提高了一倍,其他数学运算能力也大幅提升,吞吐量显著提高!

    看起来CineFX 4.0比3.0改进的方面并不多,但却非常实用,新的引擎使得GPU执行效率大幅提高,简单举个例子:12管线的7600GT性能就与16管线的6800U差不多,而同为8管线的7300GT明显强于6600GT(规格频率相近的情况下)。所以采用CineFX 4.0引擎的GeForce 7家族系列在市场上非常强势!与竞争对手的产品或者是自家上代产品相比,G7X核心达到相近的性能所需的晶体管更少、而相约晶体管的产品性能大幅领先,这样7系列显卡的性能/价格比、性能/功耗比都到了前所未有的高度,这就是CineFX 4.0的精髓所在!

    但是CineFX 4.0引擎也并非完美,最为众人所熟知的就是没能实现FP16 HDR+AA技术让人倍感遗憾;另外传统管线式的架构已经基本走到了尽头,继续提高管线数并不合理,因此高端产品在性能上略显不足!这些缺憾只能留给全新的流明引擎来完成……

提示:试试“← →”可以实现快速翻页
推荐文章
行车视线精品文章推荐