今日导读
 PCPOP首页 > 显卡 > 评测 > 正文

革命性DX11架构!GTX480/470权威评测

2010年03月27日 07:00 出处:泡泡网 【原创】 作者:孙敏杰 编辑:孙敏杰
在本页阅读全文(共80页)

Fermi计算架构:恐怖的双精度性能

第五章/第三节 Fermi计算架构:恐怖的双精度性能

    Fermi是NVIDIA新一代图形架构的开发代号,包括GeForce、Quadro、Tesla在内的三种产品都将基于Fermi架构设计;GF100是该架构第一颗GPU的核心代号;GTX400系列则是NVIDIA第一代DX11显卡,GTX480和GTX470是该系列基于GF100核心的高端显卡产品。基于Fermi架构的计算处理器则被称为Tesla C2050/C2070。

    第一款基于Fermi架构的GPU就是GF100,不管是民用级的GeForce还是专业级的Tesla,其GPU核心及架构是完全相同的。此前已经详细介绍了它的图形架构,此处着重介绍并行计算方面的内容。

    首先我们来看看Fermi的计算架构与图形架构有何不同呢?原来对于图形架构最重要的光栅化引擎与多形体引擎都不见了,GF100的四块GPC也不再区分,剩下的只有SM、CUDA核心还有缓存。

    Fermi的16个SM分布在通用L2缓存的周围。每个SM都是一个垂直的矩形条,包含一块橘色区域(调度和分配)、一块绿色区域(执行单元)和一块淡蓝色区域(寄存器和L1缓存)。

    Fermi的流处理器簇已经是第三代了,其改进其实之前在图形架构部分也介绍过,因为这些对于图形渲染或多或少还是有点用的,当然对于科学计算来说简直是革命性的:

    首先CUDA内核中的FPU采用了最新的IEEE 754-2008浮点标准,为单精度和双精度算法都提供了FMA指令,FMA在做乘法和加法运算的时候只在最后作一次舍入,不会在执行加法的时候就出现精度损失,FMA的精度比把操作分开执行时更高。

    其次,NVIDIA上代的GT200和对手最新的RV870在执行整数型加、乘指令时仅支持24bit精度,因此整数算法需要多指令的模拟序列。而对于Fermi,全新设计的整数ALU支持32位精度,面向所有符合标准编程语言要求的指令。同时,还对该整数ALU进行了优化,使其有效地支持64位及扩展的精度操作。它支持各种指令,包括Boolean(布尔)、shift(位移)、move(数据传输或赋值)、compare(比较)、convert(转换)、bit-field extract(位平面提取)、bit-reverse insert(位反转插入)和population count(计数)。

    最最重要的一点,Fermi的双精度运算能力达到了单精度的一半,而上代GT200的双精度能力只有单精度的1/8,对手的RV870是1/5,显而易见此次双精度运算能力的提升是革命性的。

    此外,Fermi架构中的双Warp调度器是完全独立的,无需对指令流内的相依性进行检测,在这种双指令发射模型下,Fermi的硬件性能非常接近与理论峰值

本文导航
第01页:千呼万唤始出来 GTX480/470终于降临
第02页:DX10.0大革命:画面很完美、但速度很慢
第03页:DX10.1小修补:片面追求画面行不通
第04页:DX11时代来临:为高效率游戏而生
第05页:DX11特性解读:Shader Model 5.0
第06页:DX11特性解读:多线程处理
第07页:DX11特性解读:两种新的纹理压缩格式
第08页:Tessellation:ATI原创技术但孤掌难鸣
第09页:Tessellation:细分曲面的原理
第10页:Tessellation:DX11中的改进
第11页:Tessellation的妙用:虚假贴图终结者
第12页:Tessellation的妙用:随风飘扬的旗帜
第13页:Tessellation的妙用:波澜壮阔的水面
第14页:Tessellation的妙用:不可思议的长发
第15页:DirectCompute与Stream/CUDA/OpenCL
第16页:DirectCompute 10/11版本间的区别
第17页:DirectCompute11的妙用:顺序无关透明
第18页:DirectCompute11的妙用:电影级景深
第19页:DirectCompute11的妙用:高清晰环境光
第20页:GF100图形架构:绝非新品装旧酒
第21页:GF100图形架构:芯片图与架构图
第22页:GF100图形架构:居然是四核心GPU
第23页:GF100图形架构:强大的多形体引擎
第24页:GF100图形架构:第三代流处理器
第25页:GF100图形架构:纹理单元不升反降?
第26页:GF100图形架构:一级缓存与二级缓存
第27页:GF100图形架构:光栅单元与高倍抗锯齿
第28页:Fermi计算架构:GPU并行计算历史
第29页:Fermi计算架构:完全按照客户需求设计
第30页:Fermi计算架构:恐怖的双精度性能
第31页:Fermi计算架构:首次支持C++编程
第32页:Fermi计算架构:首次支持显存ECC
第33页:Fermi计算架构:NVIDIA Nexus开发平台
第34页:附加功能增强:PhysX物理加速
第35页:增强附加功能:3D立体3屏技术
第36页:增强附加功能:光线追踪
第37页:GTX400实物对比:造型一点都不夸张
第38页:GTX480实物:官方艺术照赏析
第39页:GTX470实物:官方艺术照赏析
第40页:GTX480实物:外观和散热器实拍图
第41页:GTX480实物:全裸拆解与显存解析
第42页:GTX480实物:供电模块全解析
第43页:GTX470实物:外观与散热器赏析
第44页:GTX470实物:全裸拆解与供电解析
第45页:首批上市显卡:七彩虹GTX470
第46页:Demo解析:8800/GTX200 Demo回顾
第47页:Demo解析:Supersonic Sled寓教于乐
第48页:Demo解析:Supersonic Sled物理效果
第49页:Demo解析:RagingRapidsRide
第50页:Demo解析:Island11震撼的水面
第51页:Demo解析:Hair不可思议的长发
第52页:Demo解析:Design Garage实时光线追踪
第53页:测试平台:Core i7 975 + X58豪华配置
第54页:DX10理论测试:《3DMark Vantage》
第55页:DX11理论测试:《Heaven Benchmark》
第56页:DX11游戏:《BattleForge》
第57页:DX11游戏:《STALKER:COP》
第58页:DX11游戏:《尘埃2》
第59页:DX11游戏:《异形大战铁血战士》
第60页:DX11游戏:《战地:叛逆联队2》
第61页:DX11游戏:《地铁2033》
第62页:DX10.1游戏:《孤岛惊魂2》
第63页:DX10.1游戏:《鹰击长空》
第64页:DX10游戏:《孤岛危机:弹头》
第65页:DX9C游戏:《使命召唤:现代战争2》
第66页:PhysX游戏:《蝙蝠侠》
第67页:微软DX11 SDK:SUBD11
第68页:微软DX11 SDK:PN Triangles
第69页:NVIDIA Demo:Island11
第70页:NVIDIA Demo:Hair
第71页:视频转码测试:Badaboom
第72页:科学计算测试:Folding Home
第73页:温度测试:风扇温控90度开始加速
第74页:功耗测试:先准备600W电源吧
第75页:测试成绩汇总:GTX480比GTX470强多少
第76页:测试成绩汇总:GTX480 PK HD5870
第77页:测试成绩汇总:GTX470 PK HD5850
第78页:GTX480双卡SLI效率测试
第79页:全文总结与展望:DX11争霸赛才刚开始
第80页:首批上市GTX480/470显卡及有奖互动
第81页:NVIDIA GeForce GTX 480 报价
 
延伸阅读:You Think I Do  GF100  GTX480  GTX470  
快速转帖:
  • 人人网
  • 淘宝网
  • 搜狐微博
  • 网易微博
  • 腾讯微博

本文共有 条评论,点击查看更多的评论

    
欢迎转载泡泡网原创文章,请注明:转载自泡泡网 [ http://www.pcpop.com/ ]
关于我们 | 网络营销 | 泡泡网快讯 | 产品服务 | 网站地图 | 招聘信息 | 联系我们 | 合作网站 | 法律声明 | 渠道合作
电信与信息服务业务经营许可证:京ICP证070141号 | 北京市公安局海淀分局网监中心备案编号:1101081229