泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

引爆游戏视觉革命!NV助力游戏业发展

    泡泡网显卡频道2月3日 1995年8月,微软发布了Windows95操作系统,凭借崭新的图形交互式界面设计,很快席卷了全球个人电脑市场。在PC领域,微软的成功是空前的,直接代动了相关硬件产品的需求,也使得全球的硬件软件厂商都不得不向其靠拢。由于微软的Windows95采用图形交互式界面,对于显示芯片有了更高的要求,这也使个人电脑市场的大幕正式揭开了!

121

    当年NVIDIA在经过细致的市场分析之后,将研发的方向定位于市场前景广阔的PC图形芯片市场,并且决定加入对DirectX的支持。这无疑是个非常明智的选择,在当时由于3DFX的GLIDE的成功,各家显示芯片公司纷纷效仿,也想推出自己的3D API,例如,3dfx有GLIDE、PowerVR的PowerSGL、ATI的3DCIF,无疑使得微软Direct 3D的推广十分缓慢,NVIDIA此时选择旗帜鲜明的站到了Direct 3D的一边,从现在的眼光来看NVIDIA当时的做法非常具有前瞻性。

121

    在Direct7时代,当时多边形转换和光照处理是由CPU负责的,大量复杂的数学运算对CPU造成了极大的负担,而NVIDIA所推出的GeForce 256可以支持硬件T&L,也成为了第一个GPU图形核心。一些以前必须由CPU来完成的图形运算工作现在可以由GeForce256 GPU芯片独立完成,大多数情况下具有完整的传输和光照相引擎的GPU运算速度比CPU快2-4倍,同时也有效地减轻了CPU的浮点运算负担,减少了对CPU的依赖性。

    转眼又到了DX11时代,NVIDIA给我们带来其首款DX11产品GTX480的时候,全新的架构设计与近乎完美的执行效率让我们再次深刻的感受到NVIDIA在技术上的强大。NVIDIA的工程师为了让DX11显卡能够真正体现出DX11的优势,并没有像当时AMD那样仅仅是对上一代产品的架构进行升级,而是采用了全新的架构设计。

    与当时简单扩充规模加入DX11支持的RV870不同,GF100采用了全新的图形架构,是近五年来GPU架构改进最大的一次,NVIDIA针对客户和用户的需求,大幅加强了对GPU并行计算和DX11图形计算的优化支持,用当时NVIDIA的话说这是迄今为止最完美的GPU。

    之所以进行这么大的改进是因为NVIDIA发现了GPU新的瓶颈:从NV30到GT200核心,GPU的渲染能力提升了150倍,但几何性能的增长居然连3倍都不到!这个问题此前未能得到重视,因为游戏中的几何图形转换大多交给CPU来计算,而到了DX11时代,新增的Tessellation技术对GPU几何图形处理能力提出了新的要求,此时如果继续沿用上代架构显然会制约DX11性能,成为新的瓶颈!

    于是GF100架构应运而生了,NVIDIA没有像对手那样以新瓶装旧酒的方式加入DX11支持,而是将整个GPU架构推倒重来,完全针对Tessellation技术而优化设计,确保拥有最强的DX11性能。

    七个月之后,NVIDIA发布了GF100核心的改进版本——GF110,直接对应的零售产品就是GTX580。大家已经知道,GTX580从某种角度上来说是GTX480的改进版本,首先是弥补了GTX480在流处理器数量上的遗憾,从GTX480的480个流处理器提升到了512个流处理器,这样在显卡的3D性能上就有进一步的提升。

Fermi再无遗憾:新卡皇GTX580权威评测

    GTX480是通过在GF100核心上屏蔽了一组SM流处理器簇将原本的512个流处理器降到480个的。而在这个架构中,一个SM并不只是有32个流处理器,还包含16/48KB的动态分配缓存、4个纹理单元和一个多形体引擎。所以,GTX580相对于GTX480从硬件规格上来看并不仅仅是提升了32个流处理器,准确的说是提升了一个SM。

    看过我们之前的GTX480架构解析的朋友应该知道,GTX480是通过在GF100核心上屏蔽了一组SM(流处理器簇)将原本的512个流处理器降到480个的。而在这个架构中,一个SM并不只是有32个流处理器,还包含16/48KB的动态分配缓存、4个纹理单元和一个多形体引擎。所以,GTX580相对于GTX480从硬件规格上来看并不仅仅是提升了32个流处理器,准确的说是提升了一个SM。

● 16/48KB动态分配缓存

    GF100/GF110核心的缓存设计非常有意思,采用的是L1和共享缓存动态分配总容量为64KB缓存的设计,这部分缓存可配置为16KB的一级缓存+48KB共享缓存,或者是48KB一级缓存+16KB共享缓存。这种划分方式完全是动态执行的,一个时钟周期之后可自动根据任务需要即时切换而不需要程序主动干预。

    一级缓存与共享缓存是互补的,共享缓存能够为明确界定存取数据的算法提升存取速度,而一级缓存则能够为一些不规则的算法提升存储器存取速度。在这些不规则算法中,事先并不知道数据地址。

● 4个纹理单元

    顾名思义,纹理单元就是专门用于渲染3D物体表面纹理的模块,在图形纹理越来越复杂的今天,纹理单元的重要性不言而喻。GTX580因为相对于GTX480增加了一组SM,所以纹理单元数量也得到了相应的增加。

    在GF100/110架构中,每一组SM中包含4个纹理单元,完整版的核心中一共有16个SM,所以GTX580一共拥有64个纹理单元,而GTX480由于屏蔽了一组SM,所以只有60个纹理单元。

    值得一提的是,GF100/110架构中的纹理单元直接集成到了SM内部,且每组SM中拥有独立的纹理缓存(4个纹理单元共享这部分独立的纹理缓存),这样的设计打破了之前纹理单元一直被设计在SM外围的传统,有效的提升了纹理效率。虽然从纹理单元的数量方面来说看起来比GT200架构还少,但实际效率却高很多。

    从本身的架构上来说,GF110和GF100其实并没有本质的区别,内部的架构、功能模块、晶体管规模等等都完全一样,但NVIDIA这一次为什么不说GTX580是完整版的GF100核心,而是被命名为GF110核心呢?

● 工艺改进

    “工艺改进”这几个字听起来并没有什么杀伤力,首先它不能像架构升级那样带来全新的功能和非常明显的运行效率的提升,也不能像升级核心规模那样带来明显的性能提升,工艺改进确实是一个对于普通消费者不痛不痒的改进。

Fermi再无遗憾:新卡皇GTX580权威评测

    但对于NVIDIA以及任何芯片设计公司来说,改进工艺都是他们非常重视的一件事情,也同样是芯片生产厂商(这里特指台积电)非常重视的事情。改进工艺可以让生产效率得以提高、可以让良品率更有保障、甚至可以让芯片的性能更加出色。

    GTX580所采用的GF110就是一款采用改进的40nm工艺制程的芯片,改进后的工艺给我们带来了更低的功耗、更低的温度以及更好的执行效率。

Fermi再无遗憾:新卡皇GTX580权威评测

    上图是NVIDIA公布的GTX580官方PDF中的一页内容,NVIDIA将GF110模拟成了480个流处理器,且频率也和GTX480保持一样,大家可以将上图中的GTX580当作GF110版本的GTX480来看待。经过NVIDIA官方的测试,即使流处理器数量、频率都和GTX480一样,改进工艺后的GF110都可以带来非常明显的性能提升,个别游戏性能提升幅度超过10%。

Fermi再无遗憾:新卡皇GTX580权威评测

    而上面这张柱状图体现的是真正拥有512个流处理器以及更高频率的GTX580相对于GTX480的性能提升,可以看到在改进工艺的基础上再提升频率和流处理器数量之后,GTX580的威力非常强大,不少游戏性能提升幅度高达30%,大多数游戏性能提升幅度都达到20%。除此之外,工艺的改进还可能修复一些芯片可能存在的缺陷,从工艺更新这一点来看,GF110算是一款“全新”的产品。

    2010年7月12日NVIDIA发布了一款专为游戏所打造的显卡核心——GF104。在GF104发布之前,大家都以为NVIDIA会把GF100核心的主要规格全部减半,从而制造出一颗拥有256SP 256Bit的主流核心。事实上之前国内外的媒体都是这样猜测的,因为GF100模块化四核心的设计,很容易将其“拆分为”规模大小不一的中低端核心:

DX11性价比之王!GTX460

   但NVIDIA却没有这样做,最终GF104核心的规模出乎所有人的预料!之前NVIDIA为了提升GPU并行计算的效率,像CPU那样不惜成本的设计了大容量L2。L2对于性能的贡献主要集中在密集型计算任务当中,而对于普通的图形渲染来说,贡献就非常小了。那么如果将这些L2的容量进一步压缩,把节约出来的晶体管都变成CUDA核心的话,那么图形渲染性能将会得到显著提升。

121

    NVIDIA对一颗次高端的GPU核心进行了重新设计,虽然沿用了GF100优秀的架构,但在微观架构上进行了诸多改良,其最终目的就是以最小的代价,获得最高的游戏性能,为挑剔的游戏玩家提供最具性价比的选择。

    虽然GF104大红大紫,NVIDIA却是如鲠在喉。因为GTX460 1GB、768MB以及后来的SE三个版本,他们显存容量、位宽或是SM单元都有所消减,是工艺的限制让NVIDIA不得不屏蔽部分模块来保证良品率。

    和GF110的情况相同在经历了七月之痒,NVIDIA终于完成了未尽之事,推出了GF104核心的完整版——GF114,GF114相对于GF104来说工艺更加完善,细节的优化让新核心、Shader以及显存频率方面都得到了大幅度的提高。从规格上看,GTX560Ti就是GTX460的完整版本,流处理器提升到了384个、显存控制器也得以补全。

1

七彩虹iGame 九段560Ti显卡

七彩虹所推出的拥有超高默认频率的iGame九段560Ti

    但是这七个月英伟达自然不是坐等台积电工艺成熟,GF114的改进也绝对不仅仅是开核SM这么简单。相对于GTX460,新产品还有别的优化。相对于GTX460来说,GTX560Ti在核心、Shader以及显存频率方面都得到了大幅度的提高。

1

    记得在GTX460发布的时候,有无数玩家对这款产品的频率都非常不满。一是核心频率和Shader频率较低(675/1350),二是显存频率也和AMD的同级别产品差距太大。对高端显卡比较了解的朋友应该知道,AMD凡是采用GDDR5显存的产品,默认显存频率都超过了4000MHz,而NVIDIA此前最高端的GTX480显存频率都只有3696MHz。

1

NVIDIA公布的GTX560Ti官方PDF

    这张柱状图体现的是拥有384个流处理器以及更高频率的GTX560Ti相对于GTX460的性能提升,可以看到在改进工艺的基础上再提升频率和流处理器数量之后,GTX560Ti的威力非常强大,很多数游戏性能提升幅度约30%,个别甚至达到40%之多!

    PhysX是NVIDIA的一大法宝,在NVIDIA DX11显卡面世之前,旧的N卡正是凭借该技术与A卡相抗衡。通过笔者此前的网友调查来看,虽然PhysX的关注度没有DX11那么高,但还是拥有很多忠实的用户,一些玩家为了同时追求DX11与PhysX,费尽心机通过破解杂交的方式来让N卡和A卡协同工作。

《地铁2033》:同时支持DX11和PhysX

    此前想要实现物理效果必须购买专用的物理加速卡,而NVIDIA收购了Ageia公司之后,将PhysX技术以完全免费的形式附送给了GeForce显卡,让N卡用户多了一个非常炫的功能。

    NVIDIA在游戏界有着举足轻重的影响力,和众多游戏开发商保持着密切的合作关系,大名鼎鼎的“The Way”计划就保证了N卡在几乎所有游戏大作中都有着良好的性能发挥。PhysX物理引擎被NVIDIA收入囊中之后,原本屈指可数的物理游戏逐渐开花结果,以《镜之边缘》、《蝙蝠侠》、《黑暗虚空》为代表的一些重量级大作开始使用PhysX物理引擎,影响力非同小可。

国产FPS网游MKZ中爆炸、破坏、玻璃和布料使用了PhysX技术

    而且,中国本土游戏开发商也开始使用PhysX引擎来增强画面,比如《MKZ铁甲突袭》和《剑网3》都内置了PhysX支持,可见PhysX技术显然要比其它同类物理技术更易用一些。

国产网游《剑网3》中,使用PhysX实现了逼真的衣物和布料效果

    虽然物理加速技术还没有一个统一的标准,但PhysX无论从游戏数量还是画面效果方面,都更胜一筹。随着使用PhysX引擎的游戏越来越多,少有的PhysX显然将会成为事实上的标准。

    早在多年以前,NVIDIA就正式发布了3D Vision立体显示技术,并且联合显示器厂商推出了120Hz的3D显示器,为广大游戏玩家带来了真正切实可用的3D立体解决方案。到了今年,多部重量级3D电影巨作的上映,让更多的用户一睹立体显示的震撼效果,直接推动了3D立体的需求,2010成为了3D立体元年。

预热ComputeX:黄仁勋揭秘NV展会主题

    确实,3D游戏发展至今,画面很难会有质的提升,但3D Vision技术的引入可以给人眼前一亮的感觉,可以说又是一场视觉革命:

预热ComputeX:黄仁勋揭秘NV展会主题

    NVIDIA经过多年的发展,产品和技术方面已经非常成熟了,目前几乎所有的PC游戏都能近乎完美的支持3D Vision技术,配以3D眼镜和120Hz显示器的话,就能得以完美呈现。此前之所以未能得到普及,是因为用户了解还不够多,另外3D显示设备量价都不如人意,而现在时机成熟了。

    如今,所有的PC游戏都能支持3D Vision技术,所有的2D普通电影都可以通过PowerDVD搭配CUDA技术实时虚拟成3D影片,片源也不再是问题。加之今年3D显示器如雨后春笋般出现在市场上,价格已经贴近主流,普通用户组建一套3D PC不再是痴人说梦。

    为了能够在游戏中发挥最大的效能,NVIDIA不仅仅在自身的硬件以及软件上下功夫,还早在FX5000系列时代就开展了游戏之道(The way It''s Meant to be Played)计划。NVIDIA的工作人员在相关游戏的开发初期就深入到游戏开发商那里,协助开发人员对游戏的执行代码进行优化消除BUG并推出新版的驱动程序,以便提升兼容性和执行效率,使最终玩家能够得到非常好的的游戏体验。

非常好的游戏体验!带你深入了解游戏之道

    NVIDIA游戏之道被称作是目前在全球最大的游戏开发商支持计划。通过这一项目,NVIDIA在每一个新的硬件平台出现时,就会把这些硬件的平台交给游戏开发商,帮助游戏开发商在未来的平台上去优化新的游戏,此外,NVIDIA还帮助游戏开发商在不同的开发阶段进行测试,并优化游戏的过程,优化所有能够充分地利用未来硬件平台的计算能力和潜在的功能,最终给用户提供最好的体验。

DX10终极杀人武器!Crysis全方位测试

   据悉,在过去几年中,随着NVIDIA游戏之道在全球各个国家的不断实施,越来越多的新游戏和新应用在这个平台上应运而生,并且借助这个平台实现了更好的视觉效果,给玩家提供更好的游戏体验。目前,NVIDIA游戏之道已与全球200多家游戏厂商、400多款游戏有着合作。

11

    在中国,NVIDIA在上海和深圳成立了两个研发中心,研发中心的一个重要目的,就是不断地开发硬件平台,并把这些硬件平台交给国内的软件开发商,帮助其推出图形和视觉效果更丰富的游戏。为支持“游戏之道”,NVIDIA目前在全球有一个上百人规模的技术支持团队,工作就是去帮助游戏开发商更好的完善游戏开发。

    NVIDIA目前拥有超过100位的软件/驱动技术开发工程师,已经与NVIDIA的硬件开发团队相当,这在业界都是远远领先的水平。他们主要负责先进的图形技术研发,包括多核心并联的性能优化,CUDA并行运算开发,3DVision立体显示技术的开发,PhysX物理加速的开发和推广,完善超过100种效果的着色器库建立。通过这些努力工作的软件开发人员,我们始终能在NVIDIA的显卡上发现新功能。

非常好的游戏体验!带你深入了解游戏之道

    近几年来NVIDIA的产品已经从最开始的单纯图形加速卡,发展成为具备CUDA并行运算能力的通用加速卡,再到可以实现PhysX物理加速技术的物理游戏卡,再到支持3DVision立体幻境技术的3D游戏显卡,NVIDIA始终通过增加自身功能让用户体验到最新最棒的视觉体验,这在整个显卡发展史上都堪称前无古人的壮举。

    总的来说,NVIDIA对游戏以及相关产业的发展起了积极的推动作用。同时NVIDIA也为广大玩家不断提供性能更高附加功能更加全面的产品,为高品质游戏体验奠定了坚实基础。■<

0人已赞

关注我们

泡泡网

手机扫码关注