泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

游戏外的精彩!GPU通用计算软件大放送

    泡泡网显卡频道11月22日 GPU强大的浮点运算能力是CPU无法企及的,CUDA并行计算技术的大规模应用打破了传统显卡的定义,让NVIDIA踌躇满志,染指CPU领域利益之心昭然若揭。面对磨刀霍霍的NVIDIA,CPU掌门人Intel当然不甘让NVIDIA从自己锅里舀羹,终于按捺不住准备祭出尚未成熟的Larrabee抵挡,并想要将GPU整合进CPU,基辛格更是首当其冲语出惊人:显卡几年之内即将灭亡!

    第一枪一响,黄仁勋早有准备立马开炮还击,所有通用计算的宣传齐齐粉墨登场,剑指Intel,寒气逼人,GPU VS. CPU的挑战终于拉开了序幕。这时,AMD在角落一边看神仙打架,一边心里盘算,一边干自己的活。

    两大联盟,不同的领域,一样的霸主地位,口水一样绵绵不绝溅的远:显卡业真的要灭亡?Larrabee只是个笑话?唾沫从硅谷喷到北京,末了还能射穿鲁缟。

    这边互喷的欢,许多消费者却是一头雾水,他们认为显卡就是用来玩游戏的3D加速卡,能否快速流畅运行游戏就是显卡性能的唯一标尺。岂不知近年来CUDA和Stream的飞速发展催生了OpenCL和DirectCompute通用计算标准,也迫使Intel进入熟悉而又陌生的GPU领域。

    本文就为大家带来一些非常实用的GPU加速软件,有的支持NVIDIA CUDA、有的支持AMD Stream,有的两者都支持。无论N卡还是A卡用户都能享受到GPU通用计算带来的新功能或者是极速快感,让大家在游戏之余也能充分利用GPU强大的性能。

ArcSoft TotalMedia Theatre 3(TMT3)

软件介绍:

    ArcSoft TotalMedia Thertre这款高清视频播放器的名气虽然没有PowerDVD和WinDVD那么大,但其功能却丝毫不差,它能够同时支持ATI AVIVO、NVIDIA PureVIDEo和Intel ClearVIDEo三大硬解码技术,更重要的是它支持直接从硬盘播放下载到的HDDVD或BD,这无疑非常适合国内用户使用。 

    除此之外,TotalMedia Thertre还有自己的独门绝技,那就是使用GPU的并行计算能力来实时倍线视频,将标清视频插值扩充至高清分辨率,大幅提升画面细节与品质。

倍线的意义:

    除了视频解码和编码,还有一种非常消耗处理器资源的应用,那就是视频倍线——使用特殊的插值算法以及画面补偿技术,让低分辨率视频扩充至高分辨率,从而让视频与显示器分辨率相匹配,做到点对点完美呈现。有些人喜欢将480p或者720p压制成1080p,这样做虽然会使文件体积膨胀,但画质确实能够获得一定程度的提升。

    当然最好的办法并不是重新压制视频,而是实时倍线播放,基本上双核CPU是没有希望的,只有高端四核CPU才能做到实时倍线软解视频。现在,GPU也能实时倍线硬解视频了,硬解画质得到进一步增强。

GPU实时倍线效果:


标清倍线高清前后效果对比


倍线后更能体现出擎天柱的脸部细节,这也是电影版擎天柱的特色之一


山姆在课堂上兜售他太太太爷的遗物,人物和黑板背景都让人惊讶

    ArcSoft TotalMedia Thertre 3这款软件本身并不支持倍线功能,必须安装带有SimHD插件的版本才能支持。

● CyberLink MediaShow Espresso(魅力四射Espresso)

软件介绍:

    Cyberlink(讯连科技)旗下大名鼎鼎PowerDVD相信大家都非常熟悉,作为一家专注视频与多媒体的软件开发商,Cyberlink不久前推出了一款专业的快速视频转换软件——MediaShow Espresso,需要注意的是MediaShow(魅力四射)是一款视频编辑软件,而MediaShow Espresso才是视频转换软件。

    MediaShow Espresso是第一款同时支持CUDA与Stream加速的视频转换软件,除此之外它还对Intel Core i7处理器的超线程及SSE4指令集做了优化,因此无论纯CPU转码还是GPU加速,其速度比传统软件都要快。

    界面简洁明了,功能和操作方法一目了然,这就是MediaShow Espresso的最大特色,它与Badaboom的类似,主要针对手持设备或娱乐设备转换视频。其兼容性与Badaboom不相上下,但视频输出格式更多,没有局限于MP4这一种,但在自定义分辨率和码率方面,没有Badaboom那么灵活。


每一种设备提供的分辨率有限、码率不可调

    这种内置输出模式的设定,对于高级用户来说可能不够灵活,但对于初级用户来说还是很方便的,用户无需关心视频的画质及分辨率,软件内置的模式肯定是最优的方案。


软件能自动识别显卡是否支持CUDA或Stream,默认为开启

MediaShow Espresso支持的视频种类:

  • 输入视频格式:AVI、MPEG、MPEG-2、MOV、WMV、MP4、DVR-MS、TS、MPG、ASF、M2T、M2TS、MTS、DV-AVI、VOB、VRO、MOD、DAT、TOD、TiVo、WTV
  • 输出视频格式:MPEG2、MPEG4、MPEG4 AVC、WMV
  • 兼容输出设备:iPhone、iPod Touch、iPod Nano、iPod Classic、PSP、PS3、XBox、Zune
  • 输出视频分辨率:针对特殊设备设定,分辨率有限,无法自定义
  • 输出视频码率:针对手持设备优化,无法自定义码率

MediaShow Espresso的特点和优点:

  • 界面友好,操作方便
  • 专门针对手持设备和娱乐设备设计,输出兼容性很好
  • 同时支持CUDA和Stream,并对i7优化
  • 支持批量转换

MediaShow Espresso的缺点:

  • 网络流行的RMVB不支持,和不少M2TS、AVI等也存在兼容性问题
  • 不支持压字幕到视频里面
  • 分辨率和码率都无法自定义

MediaCoder(影音转码快车)

软件介绍:

    MediaCoder是一个完全免费的通用音频/视频批量转码工具,它将众多来自开源社区的优秀音频视频编解码器和工具整合为一个通用的解决方案,可以将音频、视频文件在各种格式之间进行转换。MediaCoder具备一个可扩展的架构和丰富的功能,可满足各种场合下的转码需求。目前,MediaCoder的用户已经遍布全世界170多个国家。

    通俗一点的说:玩高清的朋友一定用过终极解码或者完美解码吧,终极解码就是整合了一大堆播放器和解码器的视频播放软件,而MediaCoder就是整合了一大堆编码器和插件的视频转码软件。功能大而全、灵活性高、开源、免费是这类软件的共性,如果要为MediaCoder起个中文名称的话,笔者认为“终极码”或者“完美码”都不错^_^。


CUDA编码器还可以进行画面处理器,减轻CPU负担进一步提速

    MediaCoder的版本更新非常频繁,其开发团队在马不停蹄的加入各种新的功能并优化转码效率,自引入CUDA编码器以来就针对用户的需求以及发现的BUG不断修正,目前已经趋于完善。

MediaCoder功能简介:

  • 实现各种音频视频格式间的相互转换
  • 丰富的可调整的编码参数
  • 丰富的视频处理滤镜,包括反交错、裁剪、分辨率调整、亮度色彩调整等
  • 丰富的音频处理滤镜,包括声道映射、重采样、音量调整等

MediaCoder主要特点:

  • 完全免费,版本更新极为频繁
  • 几乎支持所有类型的视频,包括网络流行的RMVB、DIVX等,可以转换为任何类型的视频
  • 为多核、多线程优化,支持SSE4.1、X64等最新处理器指令集 
  • 视频/音频参数完全自定义,可调整范围宽大
  • CUDA加速可以支持将所有类型的视频转换为H.264/X264编码,包括M2TS、TS、MP4、MKV、MOV等众多封装格式
  • 支持将字幕压入视频
  • 有影音设备专用版本,完整版也内置了转码参数及优化方案

MediaCoder的缺点:

  • 界面比较复杂专业,上手比较难
  • 功能太多,存在一些BUG

AVIVO Video Converter(AVIVO视频解码器)

 软件介绍:
 
    GPU视频编码实际上是由ATI最先实现的,在X1000时代,ATI在催化剂驱动中集成了一款名为Avivo VIDEo Converter的小工具软件,该工具能够将常见视频转换为手持设备(iPod、PSP等)支持的格式,速度比单纯CPU编码快好几倍。

    虽然Avivo的速度非常快,但据测试表明该软件似乎跟GPU的处理能力没关系,X1300/X1600/X1800/X1900的编码速度几乎相同,而且ATI的新显卡(HD2000/3000/4000)并不支持Avivo编码器。随后Avivo被破解,使得它能够应用在所有DX9/DX10显卡(包括N卡)上面,于是很多人怀疑Avivo只是一个打着GPU的幌子、通过牺牲画质换取速度的CPU编码工具!

  

    时过境迁,当Avivo编码器快被众人所遗忘之时,ATI在2008年最后一款催化剂驱动8.12当中重新启用尘封已久的Avivo编码器。虽然名称没变,但ATI称这个小工具基于Stream流处理技术重新编写,仅支持HD4000系列显卡,速度更快,而且同样坚持完全免费的策略。这对于A卡用户来说,的确是个不小的惊喜。


DVD转iPod格式速度对比


AIT转换CPU占用率


NVIDIA转换CPU占用率

    根据国外媒体的测试结果,可以明显看出ATI在速度上拥有更强大的实力,然而却也使用了更多的CPU占用率作为代价,作为集CPU于GPU于一家的AMD来说,并不在意GPU应用时CPU占用率的高低,不需要去刻意的控制CPU占用率,这或许也是它速度更快的一大原因。 

    对于ATI Avivo视频转换器所存在的问题,ATI官方也毫不避讳,称这款才刚刚面世的小工具确实还不够完善,存在一些BUG,这将会在未来的催化剂驱动中得到修正。ATI称:Avivo视频转换器仅使用GPU完成视频编码中的一部分工作,具体的说,GPU目前仅负责视频编码过程中对运算能力最敏感,最适于GPU应用的“运动估算”部分。由于在视频编码中交给GPU的负载是固定的,因此该过程中的GPU占用率可能因型号的不同而出现高低不等的现象。

ATI Avivo Video Converte的优缺点

  • 优点:免费、片源兼容性好、转码速度超快
  • 缺点:功能太简单、只能转出低码率低分辨率影片、视频画质较差、CPU占用率很高、软件BUG不少。
  • A卡用户必装:虽然这款小工具本身是可有可无的,但它内置了ATI Stream的驱动程序,其它一些通用计算软件可能需要xcoder才能正常运行,因此建议A卡用户安装。

Badaboom

软件介绍

    虽然GPU视频编码的鼻祖是四年前ATI的AVIVO Video Converter,但这款软件过多的依赖于CPU,并不能完全发挥出GPU强大的运算能力。因此真正使用GPU进行转码的软件,Badaboom是严格意义上的第一款,Badaboom再次唤醒了人们对GPGPU的认识,AMD也因Badaboom的崛起而重新启动了AVIVO VIDEo Convert这个小工具,来使用HD4000显卡进行视频转码,遗憾的是,跟4年前相比该工具没有多大改进。


Badaboom的高级设置界面


Badaboom完全使用GPU解码和编码

    Badaboom可以说是CUDA的代表作,该软件版本更新很频繁,经过一年多时间的发展,兼容性不断加强、转换效率越来越高,虽然还存在一些问题,但作为CUDA应用的鼻祖,也是一款好用且速度快的视频转码软件。

    通过我们之前的评测来看,Badaboom能够充分利用GTX285的所有流处理器资源,转码效率比最强CPU Core i7还要快,但由于Badaboom架空了CPU,因此性能不如能够同时利用CPU和GPU资源的MediaCoder。虽然还是有不少缺点,但Badaboom依旧是一款非常优秀的软件,尤其适合中低端用户使用。

Badaboom支持的视频种类:

  • 输入视频编码:MPEG、MPEG2、VC-1、H.264/AVC、AVCHD、HDV、RAW、WMV、VC-1、DivX、Xvid、FRAPS
  • 输入音频编码:AC-3、MP2、PCM、AAC
  • 输入视频格式:M2V、MPG、VOB、AVI、TRP、TS、M2T、M2TS、MPEG、MTS、MOV、MP4、MKV、WMV
  • 输出视频编码:H.264(MP4),支持Baseline Profile、Main Profile,最高支持4.1版本,支持CABAC、动态比特率、反交错
  • 输出视频分辨率:最高1080p,最低320p,常见分辨率均支持
  • 输出视频码率:500Mbps~2500Mbps
  • 输出音频编码:AAC-LC(2 Channel)

Badaboom的特点和优点:

  • 界面简洁,极易上手
  • 专门针对手持设备和娱乐设备设计,输出兼容性很好
  • 对GPU利用率很高,转码速度快

Badaboom的缺点:

  • 界面支持中文,却不支持中文文件名和目录
  • 网络流行的RMVB不支持,很多AVI和WMV也不支持
  • 不支持压字幕到视频里面
  • 不支持批量转换

暴风转码

软件介绍

    MediaCoder太复杂、MediaShow太简单、Badaboom不太适合国人使用,难道就没有一款适合初学者使用了转码软件吗?现在,有国内知名视频服务平台暴风影音推出的一款名为“暴风转码”的软件,也加入了对NVIDIA的CUDA技术的支持。

    这款最新推出的“暴风转码”,在安装有NVIDIA显卡(包括GeForce 8系列、GeForce 9系列、GeForce 200系列)的电脑上,CUDA将会让暴风转码的视频转换速率提高3-4倍以上。那么和前面两款软件有什么不同的地方?其自身的市场竞争力在哪里?下面,我们就来简单了解一下:

  • 特点一:通吃500多种视频格式

    暴风转码最大的特点就是和暴风影音一样,通吃一切视频格式,作为暴风家族的新军,这款产品俨然继承了前辈的这一优良血统。目前已经支持多大500多种视频格式转换,包括常用的AVI、MKV、MP4、RMVB等。


可以批量转换

    从这方面来看,Badaboom的局限性就表现出来,这款产品软件虽然快速,但是限制太多,尤其对国内视频源最为广泛的RMVB缺乏支持,也不支持外挂字幕,因此不能说是进入实用阶段。相比之下,暴风转码更适合国内的市场环境。

  • 特点二:支持多达300种掌上设备

    在这方面,暴风转码同样像暴发影音一样,继承了这种“通吃”精神,目前,暴风转码支持除了电脑之外几乎所有的掌上设备,包括:手机、PSP、MP4等。

    在这款产品的设备设置界面,可以很清楚的看到其所支持的各种设备列表,诺基亚、三星、iPhone、PSP、魅族等5大类,109个系列、共计300多种移动设备。

    另外,对于使用“山寨”产品的用户,就算您的设备在列表里面没有找到,那么,您可以根据自己的设备来自行设置相关参数,例如:输出格式、编码率、分辨率等,暴风转码同样可以轻松搞定。

  • 特点三:“傻瓜”式设计 简单、实用更平民化

    这款软件的用户使用界面非常的简洁、实用,没有太多繁琐、负责的设置项目,对于那些普通用户来说,简单、直观、容易上手。用户在转换视频的过程中,可以随时的预览视频,不会出现在转换完毕之后发现竟然不是自己想要的尴尬。

    当转换完成之后,如果您的设备已经连接电脑,那么软件会将转换后的视频自动传输到相关的设备上。

完美解码(内置CoreAVC CUDA解码器)

解码器和播放器介绍

    通常我们所说的高清视频硬解码,指的是NVIDIA的PureVideo和ATI的AVIVO(UVD)技术,他们是整合在GPU当中一个很小的模块,通过调用DXVA接口对解码高清视频。严格上来讲这不算是GPU通用计算,而是专用计算,因为GPU的流处理器并没有参与计算。

    虽然PureVideo和UVD已经很完美了,相信绝大多数用户都知道改怎么使用高清硬解码,但这里笔者还是想给大家推荐一款基于CUDA通用计算技术的解码器——CoreAVC,他有一些传统硬解码所不具备的优势。

    CoreAVC是非常流行的H.264解码器之一,几乎所有集多种解码器于一身的播放器都带有CoreAVC解码器。今年2月份,CoreAVC率先发布了1.9.0版本的解码器,首次支持CUDA解码H.264视频,不过由于当时存在一些播放色块的问题,很快CoreAVC就推出了1.9.5版本的解码器,从此H.264高清视频解码正式迈入CUDA时代。

    目前完美解码已经整合了最新的CoreAVC解码器,安装完美解码最新版本之后,首先打开“完美解码设置中心”程序,找到H.264视频解码器,将解码器设置为CoreAVC(如上图),这样就调用了CoreAVC 1.9.5版本的解码器。

    应用之后,点击H.264视频解码器右边的配置,和前面介绍的终极解码一样,勾选Prefer CUDA accelerATIon和Use Tray Icon,开启CUDA硬件解码和系统托盘提示。

    如果没有问题的话,此时应该已经可以使用完美解码进行CUDA视频解码了。

CoreAVC CUDA解码器的优势:

  • CoreAVC解码器对于分离器和渲染器的兼容性好,PureVideo和UVD因为DXVA的关系兼容性差,容易出现莫名其妙的问题;
  • CUDA解码能获得视频数据流,因此解码后还可以对视频添加各种后处理特效来增强画质;而PureVideo和UVD解码后只能将视频直接输出到屏幕,只能按照预置的模式进行简单的后处理;
  • CoreAVC解码器可以使用效果优秀的VMR渲染模式,而PureVideo和UVD在解码H.264时只能使用EVR渲染,效果一般;
  • 使用CUDA解码H.264,PureVideo解码MPEG2和VC-1,可以在完美解码中以一种通用模式解码绝大多数高清视频,而不用针对各种视频更改解码器或者渲染模式,使用起来方便不少。

MediaShow 5(魅力四射5)

  • 主要功能媒体分类管理、视频照片编辑、处理、转换等等
  • 支持显卡新增的人脸识别功能支持CUDA,未来将支持Stream,视频转码功能同时支持CUDA和Stream
  • 推荐指数★★★★★
  • 相关评测:暂无
  • 下载页面:官方网站

    前文中介绍过的MediaShow Espresso只是一个视频转换软件,而MediaShow则是一个非常强大的多媒体管理软件,它不但能够对视频进行编辑和转码,还能分类存放、优化、管理、搜索……以及很多意想不到的实用功能。

    MediaShow 5在视频编辑和转码过程中,同样对Core i7、CUDA和Stream提供了优化支持。不过新增的人脸识别功能目前还只能支持CUDA加速,不久之后将会提供对Stream的支持,看来A卡用户还得等会。

    魅力四射5创新研发的脸部辨识功能,让您在进行数以千计的人物相片分类上更快、更有效率。当启用脸部辨识功能进行分析后,魅力四射能够以群组方式显示分类的相片内容并让您进行人名群组的建立,并针对辨识完成的相片进行实时比对和群组分类建议。如此一来,不论是与亲密伴侣、家人、朋友的聚会、出游或重要相片都能够依您喜好,使用人物群组方式来快速分类与管理。

    魅力四射5现已完全支持NVIDIA CUDA非常好的化技术,让您在使用脸部辨识功能进行相片分类时更快、更有效率。透过支持GPU硬件非常好的化的技术,在脸部辨识分析及智慧分类的效能上表现更显著,分析1000张包含人脸的相片内容仅需8分钟时间即可完成。而完成辨识与人名标签分类的相片,还能够直接上传到Facebook网站,让您的相片管理、分类与分享变得更快速、更实时、更无远弗届!

    当您完成相片的脸部辨识与分类后,日后只要使用魅力四射5的相片人物搜寻功能,输入关键的人名后,您就能够在短时间找到查询人物的所有相关照片。此外,在相片管理模式中,只要点选已辨识完成的人物群组,同样能够能够快速找到与该人物相关的所有照片内容。

vReveal

软件介绍:

    早在去年的NVISION 08上MotionDSP公司透露即将推出一款叫做“vReveal”的视频修复软件。软件主要用来去掉视频中的颗粒、色块等视频瑕疵,还能有效增强晃动视频的稳定性。

    据称,vReveal采用了《犯罪现场调查》级别的超分辨率技术(super-resolution),该技术的原型是执法和情报部门所采用的法庭专用应用程序。该技术的算法原理其实也很简单,就是通过分析连续多个视频帧来重建单一帧画面的细节,直至完整对整个视频的修复和增强。

    但是,这种技术如果使用传统的CPU来进行运算的话,那么当今最优异的CPU也难以满足其庞大的计算量要求,据称即使Core i7-920的处理速度也不到10FPS,Core 2 Quad Q6600更是仅仅6FPS。

    还好,这款软件可以完美支持NVIDIA CUDA技术,利用GPU的并行计算优势来修复视频,得益于CUDA技术,利用GeForce 9800 GT能够提高到17FPS,GeForce GTX 280更是可达25FPS。

vReveal的主要特性:

  • 具备“一键修复”特性,可快速、轻松地增强视频质量
  • 采用超分辨率视频增强技术,此项技术源自执法和情报机构所使用的软件,这一犯罪现场调查(CSI)风格的软件由MotionDSP开发
  • 凭借支持CUDA的NVIDIA图形处理器,增强视频质量的速度最多可提高五倍
  • 从增强的视频中捕捉到具备照片冲印质量的静态图片
  • 对歪斜视频进行旋转
  • 对每个影像进行剪裁,留住最精彩的时刻
  • 对您PC中的所有视频进行自动查找,并通过单一图库进行管理
  • 将增强的视频放到“YouTube”,轻松与人分享

原始视频与处理后的效果对比:

    简单的总结一下,vReveal就是一款可以让模糊的视频变的更加清晰,让晃动的视频变得更加稳定,让小尺寸的视频变成大尺寸的视频,让颜色不好的视频变成非常漂亮的视频,它就是一款这样的工具。

PowerDirector 8(威力导演)

软件介绍:

    CyberLink PowerDirector(威力导演)的威名相信很多人都有所耳闻,这款台湾产的软件简单易用特别适合国人使用,而且功能十分强大,很多方面都要强过日本产的TMPGEnc。PowerDirector从7.0开始已经能够借助GPU进行加速,但也主要局限在滤镜特效操作方面:如高斯模糊、镜像模糊、万花筒、光射线、颜色替换、钢笔墨水、色彩边缘、水彩画、抽象派、火焰燃烧等等。8.0版进一步增强了后处理技术支持,功能和效能都更加强大。

   根据CyberLink官方的测试,A卡和N卡在编码过程中的效率差不多,性能比纯CPU计算能提高270%之多,极大的提升了工作效率。

    而在视频的特效处理速度方面,GPU加速的支持也让性能翻了数倍,威力导演7透过支持HD高清视频及特定特效如:Gaussian Blur、Radial Blur、Light Ray、Pen Ink、Abstractionism、Kaleidoscope、Color Edge、Replace Color、Color Painting、Glow等等,不仅强化视频的编码能力,更让您拥有非常好的使用体验!

    另外:在进行大规模的复杂运算时,GPU通用计算可以让CPU的占用率大幅度降低,当您的CPU处于高效能利用状态时,就能单次同步处理更多的剪辑功能任务。

    看了前面一些软件介绍,也许你会认为CUDA和Stream技术仿佛只能在视频领域应用。这是因为普通用户平常最消耗资源的应用就是视频编辑和转码类,而科学计算类软件一般人接触不到、也不会公开发行。现阶段越来越多的朋友开始接触高清视频或者自拍视频,因此CUDA和Stream在民用化过程中将重心集中在了视频这块。

Folding@home(蛋白质折叠分布式计算)

    其实业界第一款GPU通用计算软件就是用户科学计算,它就是由斯坦福大学主导的Folding @ Home分布式计算,最早支持ATI显卡,而NVIDIA后来者居上,目前N卡所贡献的运算能力已经超越了所有CPU之和,A卡也不弱!

    Folding@home是一个研究蛋白质折叠、误折、聚合及由此引起的相关疾病的分布式计算工程。最开始F@H仅支持CPU,后来加入了对PS3游戏机的支持,但同样是使用内置的CELL处理器做运算。F@H因ATI的加入为GPU计算翻开了新的一页,如今F@H第二代GPU客户端已经能够支持ATI和NVIDIA的全系列DX10 GPU。

    如果您有兴趣让您的电脑在空闲时为科学计算贡献一份力量的话,那就到斯坦福大学官方网站下载最新的客户端。只要您不玩游戏(意味着GPU空闲),那就可以在后台开启F@H客户端进行科学运算,这并不会影响您的办公与上网操作(CPU和内存使用率都很小)。

    Folding@home是一个研究蛋白质折叠、误折、聚合及由此引起的相关疾病的分布式计算工程。最开始F@H仅支持CPU,后来加入了对PS3游戏机的支持,但同样是使用内置的CELL处理器做运算。F@H因ATI的加入为GPU计算翻开了新的一页,如今F@H第二代GPU客户端已经能够支持ATI和NVIDIA的全系列DX10 GPU。

知识延伸:什么是Folding@home?什么是蛋白质折叠?

    蛋白质是一个生物体系的动力和纳米机器。在蛋白质实现它的生物功能之前,它们会把自己装配起来,或者说是折叠;虽然蛋白质折叠是对所有的生物体系来说最重要的和最基本的过程,但这个过程对人类而言仍然是个未解之谜。此外,当蛋白质没有正确的折叠(折叠错误)会导致严重的后果,包括许 多知名的疾病,比方阿兹海默症(Alzheimer''''s),疯牛病(Mad Cow, BSE),可传播性海绵状脑病(CJD),肌萎缩性脊髓侧索硬化症(ALS),帕金森氏症(Parkinson''''s), 和其他多种癌症及其相关的综合病症。

    Folding@home是一个分布式计算的项目——从世界各地来的人下载运行这个客户端程序,彼此组合在一起构成了世界上最大的超级计算机之一。每一台参与的计算机都使蛋白质折叠项目更接近成功一步。Folding@home把分布式运算和革新的计算方法有机的结合在一起,使人类能解决比以前碰到的困难无数倍的问题。

    前面介绍的都是一些知名的、非常使用的软件,并不是意味着GPU通用计算软件只有屈指可数的这么几款,实际上目前GPU加速软件已经多得不胜枚举了,几乎可以说是无处不在的。

GPU加速显示、播放、3D类软件:

  • Adobe Reader PDF显示、3D构图(OpenGL)
  • Adobe PhotoShop CS4系列(OpenGL)
  • Adobe Flash 10.1视频解码(DXVA)

    其中Flash 10.1才发布没多久,新版本主要针对在线视频播放进行了优化,使得低配置电脑也能流畅播放高清视频,详情参阅“Flash 10.1网络视频GPU硬件加速实测!”一文。

其它视频编辑、转码类软件

    因为这些软件不太常用、或者可以用前文介绍过的相关软件做替代,因此就不多做介绍了,有兴趣的朋友可以自己搜索相关资料。

目前CUDA软件远多于Stream:

    不难看出,CUDA软件无论数量还是质量都远超Stream,即便是同时支持CUDA和Stream的软件,对于Stream的支持也都要晚上几个月,N卡用户有更多的选择,而A卡用户有得用就不错了,看来AMD还得加倍努力才行。

    AMD也坦诚,虽然GPU通用计算的概念最早由ATI提出并率先应用,但NVIDIA已经后来者居上,在很多方面都比ATI做得好。事实上AMD近年来所做出的努力也是显而易见的,对于GPU功能的开发也是紧追不舍。

    不过AMD一点也不着急,AMD高层透露,未来将会是OpenCL和DirectCompute的天下,使用这两种通用计算API的软件对于GPU将会是无差别支持。不管NVIDIA、AMD还是未来Intel的GPU都一样,CUDA与Stream之争也不会是比较谁支持的软件多些,而是比实际性能,就像对比游戏性能一样。

高性能计算离不开GPU的支持

    不管CUDA和Stream孰强孰弱,OpenCL和DirectCompute标准谁能笑到最后,GPU的地位显然在迅速攀升。超级计算机想要在性能上取得突破,使用GPU+CPU的异构架构是唯一选择,未来高性能计算已经离不开GPU的支持了。


NVIDIA和ATI从3D游戏战场打到了并行计算领域

    对于普通用户来说,显卡已经不再是一块单纯的3D游戏加速卡,以视频应用为代表的高性能计算软件率先步入GPU通用计算的大门,未来将会有更多计算软件使用GPU强大的运算能力来加速,CPU和GPU的地位将变得同等重要。

● 总结:

    2006年,当ATI率先提出GPU通用计算时,很多人都以为这是天方夜谭,也不知道何年何月才能得偿所愿。如今,只花了两年时间,GPU就已经在科学研究和超级计算领域取得突破性进展,在民用市场也开始遍地开花。现在,玩家们因一两款特别喜爱的游戏而升级显卡;将来,或许很多不玩游戏的人,也会冲着一两款支持GPU加速的软件去购买中高端显卡。

    您或许感慨NVIDIA在并行计算方面十年磨一剑的艰辛;或许为ATI因AMD收购而错过近两年的发展而惋惜。然后对于这样一个全新的领域,无论对于领先者还是追赶者玩家们都应该给予同样的掌声。■

关注我们