泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

革命性DX11架构!GTX480/470权威评测

第五章/第二节 Fermi计算架构:完全按照客户需求设计

    在竞争对手还在游戏性能方面苦苦追赶之时,高瞻远瞩的NVIDIA已经在朝着更高的目标迈进了。3D和游戏当然是一个重要方面,是GPU的老本行,而并行计算则是GPU的未来,两者不但不冲突而且是相辅相成的,NVIDIA的目的是游戏和计算两手抓、两手都要硬。

    在前文中笔者提到过,GF100是近年来GPU架构变化最大的一次,它不仅仅体现在图形架构方面,其实他在并行计算架构方面的改进更彻底,现在要讲的才是Fermi架构的精华部分。

    G80是统一图形及并行计算的雏形,而GT200是对G80在性能及功能性方面的扩展。而对于Fermi,NVIDIA利用了从之前两款处理器以及为它们所编写的应用程序所获得的经验,并采用了一种全新的方法而设计和创建了世界上第一款计算GPU。在为Fermi的研发开展准备工作时,NVIDIA听取了自推出G80和GT200以来大量从事GPU计算的用户的反馈,并将以下关键领域作为改进的重点:

1. 提高双精度浮点运算的性能——高性能计算与科学计算很少用到单精度。

2. ECC支持——ECC使得GPU计算用户在数据中心中可放心地部署大量的GPU,并确保数据敏感型应用程序如医学影像及财务期权定价等不出现内存错误。

3. 真正的缓存层次——有些并行算法无法使用GPU的共用存储器,用户需要一个真正的缓存架构以提供帮助。

4. 更大的共用存储空间——许多CUDA程序员需要超过16KB的共用存储器来实现应用程序的加速。

5. 更快速的情境转换——用户需要在应用程序之间实现更快速的情境转换,以及图形与计算应用之间更快的互操作。

6. 更快速的原子操作——用户需要为他们的并行算法实现更快速的“读-修改-写”原子操作。

    针对以上的这些需求,Fermi工作小组设计了一款处理器,总计算能力得到了很大的提升,通过架构上的创新还大大增加了可编程性以及计算效率。Fermi在架构上的亮点体现在:

第三代流处理器簇(SM)

每个SM有32个CUDA核,是GT200的4倍
双精度浮点运算的峰值性能是GT200的8倍
双Warp调度器同时调度和分配来自两个不同warp的指令
64KB的RAM,可配置为共享缓存+L1缓存

第二代并行线程执行ISA

统一寻址空间,提供完全的C++支持
针对OpenCL和DirectCompute做优化处理
完全的IEEE 754-2008 32-bit/64-bit精度支持
完全的32-bit整数路径,64-bit扩展
内存存取指令支持向64-bit寻址的转换
通过Predication提升性能

改进的内存子系统

并行DataCacheTM 层次,拥有可配置的L1和统一的L2缓存
第一款提供ECC内存支持的GPU
显著提升原子内存操作性能

NVIDIA TM引擎

应用程序情境切换性能10倍于上代产品
同时执行多个核心程序
线程块乱序执行
双重叠式内存传输引擎

0人已赞
第1页:千呼万唤始出来 GTX480/470终于降临第2页:DX10.0大革命:画面很完美、但速度很慢第3页:DX10.1小修补:片面追求画面行不通第4页:DX11时代来临:为高效率游戏而生第5页:DX11特性解读:Shader Model 5.0第6页:DX11特性解读:多线程处理第7页:DX11特性解读:两种新的纹理压缩格式第8页:Tessellation:ATI原创技术但孤掌难鸣第9页:Tessellation:细分曲面的原理第10页:Tessellation:DX11中的改进第11页:Tessellation的妙用:虚假贴图终结者第12页:Tessellation的妙用:随风飘扬的旗帜第13页:Tessellation的妙用:波澜壮阔的水面第14页:Tessellation的妙用:不可思议的长发第15页:DirectCompute与Stream/CUDA/OpenCL第16页:DirectCompute 10/11版本间的区别第17页:DirectCompute11的妙用:顺序无关透明第18页:DirectCompute11的妙用:电影级景深第19页:DirectCompute11的妙用:高清晰环境光第20页:GF100图形架构:绝非新品装旧酒第21页:GF100图形架构:芯片图与架构图第22页:GF100图形架构:居然是四核心GPU第23页:GF100图形架构:强大的多形体引擎第24页:GF100图形架构:第三代流处理器第25页:GF100图形架构:纹理单元不升反降?第26页:GF100图形架构:一级缓存与二级缓存第27页:GF100图形架构:光栅单元与高倍抗锯齿第28页:Fermi计算架构:GPU并行计算历史第29页:Fermi计算架构:完全按照客户需求设计第30页:Fermi计算架构:恐怖的双精度性能第31页:Fermi计算架构:首次支持C++编程第32页:Fermi计算架构:首次支持显存ECC第33页:Fermi计算架构:NVIDIA Nexus开发平台第34页:附加功能增强:PhysX物理加速第35页:增强附加功能:3D立体3屏技术第36页:增强附加功能:光线追踪第37页:GTX400实物对比:造型一点都不夸张第38页:GTX480实物:官方艺术照赏析第39页:GTX470实物:官方艺术照赏析第40页:GTX480实物:外观和散热器实拍图第41页:GTX480实物:全裸拆解与显存解析第42页:GTX480实物:供电模块全解析第43页:GTX470实物:外观与散热器赏析第44页:GTX470实物:全裸拆解与供电解析第45页:首批上市显卡:七彩虹GTX470第46页:Demo解析:8800/GTX200 Demo回顾第47页:Demo解析:Supersonic Sled寓教于乐第48页:Demo解析:Supersonic Sled物理效果第49页:Demo解析:RagingRapidsRide第50页:Demo解析:Island11震撼的水面第51页:Demo解析:Hair不可思议的长发第52页:Demo解析:Design Garage实时光线追踪第53页:测试平台:Core i7 975 + X58豪华配置第54页:DX10理论测试:《3DMark Vantage》第55页:DX11理论测试:《Heaven Benchmark》第56页:DX11游戏:《BattleForge》第57页:DX11游戏:《STALKER:COP》第58页:DX11游戏:《尘埃2》第59页:DX11游戏:《异形大战铁血战士》第60页:DX11游戏:《战地:叛逆联队2》第61页:DX11游戏:《地铁2033》第62页:DX10.1游戏:《孤岛惊魂2》第63页:DX10.1游戏:《鹰击长空》第64页:DX10游戏:《孤岛危机:弹头》第65页:DX9C游戏:《使命召唤:现代战争2》第66页:PhysX游戏:《蝙蝠侠》第67页:微软DX11 SDK:SUBD11第68页:微软DX11 SDK:PN Triangles第69页:NVIDIA Demo:Island11第70页:NVIDIA Demo:Hair第71页:视频转码测试:Badaboom第72页:科学计算测试:Folding Home第73页:温度测试:风扇温控90度开始加速第74页:功耗测试:先准备600W电源吧第75页:测试成绩汇总:GTX480比GTX470强多少第76页:测试成绩汇总:GTX480 PK HD5870第77页:测试成绩汇总:GTX470 PK HD5850第78页:GTX480双卡SLI效率测试第79页:全文总结与展望:DX11争霸赛才刚开始第80页:首批上市GTX480/470显卡及有奖互动

本文产品

NVIDIA GeForce GTX 480

更多产品信息>>
品牌:NVIDIA接口类型:PCI Express X16 2.0核心品牌:NVIDIA核心代号:GF100NVIDIA芯片:GeForce GTX 480核心频率:700MHz
×