今日导读
 PCPOP首页 > 显卡 > 新闻 > 正文

显卡构建1U服务器 看TESLA近来的发展

2008年07月29日 00:08 出处:泡泡网 【原创】 作者:肖冠丁 编辑:肖冠丁

TESLA是什么产品?有什么用途?


    NVIDIA TESLA产品问世已经一年多了,由于主要是面向行业用户进行科学计算的产品,DIY玩家可能对TESLA并不太清楚。2008年6月,NVIDIA在德国发布了TESLA的第二代产品,TESLA 10系列方案,包括新的1U服务器和TESLA C1060处理器。借这个机会,我们简单介绍一下TESLA的构成、应用和近年来的发展。

    NVIDIA的CUDA经过一段时间的宣传,玩家应该比较熟悉了,简单来说就是C语言编写的一种API,通过CUDA可以利用GPU来进行一些软件的加速运算,使GPU不仅仅在图形领域发挥作用。而TESLA正是以CUDA为基础开发的、面向行业科学计算的产品。

显卡构建1U服务器 看TESLA近来的发展
塔式TESLA产品

    TESLA处理器以GPU为核心,外观来看跟显卡非常相似,只是没有显示输出接口,我们可以理解为没有视频输出接口的显卡。而这种“显卡”的主要作用就是,多块并联,通过CUDA来进行行业科学运算。和传统服务器/工作站相比,塔式TESLA主机也有CPU等常规硬件,只是内部有多块“显卡”组多路SLI,如图所示。

    了解了基本的硬件构成,对于熟悉CUDA的玩家来说,TESLA产品就非常好理解了,简单来说就是“显卡服务器”。通过多路显卡的强大并行处理能力去使一些以往主要依靠CPU计算的领域大大提速,甚至使部分传统依靠CPU无法完成的计算成为可能。

TESLA的应用领域


    之前我们都曾经了解过,由于显卡的多个流处理器(例如GT200核心的240个SP)并行计算的机构,通过CUDA进行某些领域应用加速运算的时候可以比单纯依靠CPU提升很多倍。例如PC玩家比较感兴趣的视频编码加速、Photoshop运算提速等。不过TESLA针对的是行业计算领域,应用重点领域自然会有所区隔。

    生命科学: 用于癌症研究的Autodock软件提速,据美国国家癌症研究所报告,模拟速度提升高达12倍,将等待结果的时间从2个小时缩短至10分钟。AutoDock的作者、美国斯克利普斯研究所Garrett Morris博士表示:“从长远角度来讲,我们只希望能够通过Silicon Informatics公司的产品来加速找到各种疾病的治疗新药。其中包括从癌症到阿耳茨海默氏症、从艾滋病到疟疾等各种疾病。”

    科学: 美国国家大气研究中心气象研究和预报(WRF) 模型计算,WRF的1%已通过CUDA实现,整体速度提升了20%,节省了一个星期的分析时间。

显卡构建1U服务器 看TESLA近来的发展
实时观察服装设计的效果

    金融:Hanweck Associates Volera 实时期权评估引擎,利用三台NVIDIA Tesla S870实时评估美国上市的整个期权市场。

    设计: 用于服装布料物理特性的CAD设计,实时观察成品的效果。

显卡构建1U服务器 看TESLA近来的发展
TESLA在多个领域发挥的作用

    此外,TESLA产品还在多项科学计算领域发挥了不小的提速作用。图片显示的是8系列TESLA产品在不同领域发挥的作用。

TESLA 10系列——GPU构建1U服务器


    传统X86架构CPU为主构建的服务器,由于自身架构方面的原因,计算集群的数量比较庞大,并且随着服务器的增加,计算能力并非直线等比上升。而GPU服务器不同,大家对GPU在构建SLI或者CrossFire系统后性能的提升幅度都比较清楚。因此多个GPU构建服务器,性能提升比传统服务器更大。

显卡构建1U服务器 看TESLA近来的发展
TESLA C1060计算处理器,可以堪称没有视频输出接口的显卡

    随着NVIDIA新一代GT200核心GPU的发布,TESLA产品也以此为基础进行了更新。其中,C1060计算处理器的处理能力达到了1Tflops,“显存”也增加为4GB。

    有了这种基础,TESLA在10系列不再只是考虑组建塔式服务器,而是进军机架式服务器领域,这就是新的S1070 1U服务器系统。从构造就可以看出,该1U系统内部主要由4片“显卡”——C1060组成,其它除了散热系统和电源系统,没有别的设备了。

显卡构建1U服务器 看TESLA近来的发展
核心为4片GPU的1U服务器

    S1070的计算能力达到了4Tflops,功率为700W。不过,正如我们看到的其内部架构的原因,S1070是不能单独上机架使用的,需要和CPU服务器配合使用。

    根据NVIDIA的数据,1个4核心CPU 1U服务器计算能力大约0.07Tflops,单价2000美元,功率400W。假如要构建一个100TF处理能力的数据中心,需要1429台服务器,造价310万美元,总功率571KW。如果搭配S1070 1U服务器使用,单台S1070的造价是8000美元。那么只需要25台CPU服务器和25台S1070就可以构建一个100TF的数据中心,造价31万美元,功率21KW。

清华微电子教授分析TESLA在EDA方面的应用


    清华大学微电子研究所的邓仰东教授分析了GPU在EDA软件方面的应用。所谓EDA软件,是指设计集成电路的软件工具,例如设计CPU等。以现有45nm CPU的典型设计规模举例,大约是100M逻辑门,1G时需路径,1T版图图形。

显卡构建1U服务器 看TESLA近来的发展
清华大学微电子研究所的邓仰东教授

    而自1970年以来,处理器的复杂度大大提高。1971年的Intel 4004只有2300个晶体管,而Core 2 Extreme的晶体管达到了2亿9千1百万个。相对于处理器的发展,设计团队的规模增加却不到10倍。原因就是EDA软件自动化设计能力。

    如今,主流工艺向45nm过渡,集成电路复杂度仍然在增加,并且由于高昂的制造成本,需要在设计阶段高强度验证保证首次投片成功。对于计算需求量的大幅度提升,目前主流多核CPU的性能对应提升,是非常有限的。而CUDA和TESLA产品的出现使得EDA软件具有更多的机会。

    使用CUDA加速,传统利用CPU需要1小时的全芯片STA利用GPU只需要1小时即可完成。而传统CPU进行全芯片统计性STA几乎不可行,利用GPU则是可行的。

    此外,GPU运算还有故障仿真、快速门逻辑仿真、电路布局等多方面运算的优势。由于专业性太强,这里就不过多介绍了。需要明白的就是,微电子研究所的专家对于GPU对EDA软件的加速前景非常看好。

TESLA和CUDA的前景


    单就性能来看,CUDA加速和TESLA无疑是很有优势的。不过,服务器和科学计算相对来说,是一个专业性和封闭性比较强的行业。TESLA的计算方式,相对于传统来说无疑是一个革命性的挑战。并且,NVIDIA并非一个服务器供应商,不会直接销售产品给终端用户。很显然NVIDIA需要首先说服大的服务器供应商采用他们的TESLA方案。

    NVIDIA TESLA GPU计算事业部高级产品经理Sumit Gupta表示,目前已经开始明确销售TESLA服务器的有Sun、联想等厂商,还有的厂商虽然也在卖类似的产品,但未公开。到2008年年底,会有专门的相关信息发布。

显卡构建1U服务器 看TESLA近来的发展
NVIDIA TESLA GPU计算事业部高级产品经理Sumit Gupta

    另外,之前不少人有疑问,对于“显卡服务器”这样新概念的产品,如果只有NVIDIA一家去推广并且和传统产品竞争,显然不如生产GPU产品的厂商一起来使用并推广更好。对此,Sumit表示,CUDA完全是开放的C语言编写的API,其它GPU厂商想要使用无需授权。但是,其它厂商GPU的架构、技术等方面,从目前来看并不太适合通过CUDA来进行加速运算。

    从前景来看,TESLA在计算方面和传统的服务器/工作站相比是很有优势的,但是面临的问题也有一些。首先NVIDIA需要在产品和软件上进一步完善,其次市场的推广和用户接受方面需要进一步加大力度。很多用户并不知道TESLA到底是做什么用的,由哪些硬件和软件组成,有什么样的处理能力,效果如何,等等。还有TESLA已经发布一年多了,公开表示支持并发售TESLA相关产品的服务器厂商还不够多。这些都还需要NVIDIA方面去做。

快速转帖:
  • 人人网
  • 淘宝网
  • 搜狐微博
  • 网易微博
  • 腾讯微博

本文共有 条评论,点击查看读者的评论

    
欢迎转载泡泡网原创文章,请注明:转载自泡泡网 [ http://www.pcpop.com/ ]
关于我们 | 网络营销 | 泡泡网快讯 | 产品服务 | 网站地图 | 招聘信息 | 联系我们 | 合作网站 | 法律声明 | 渠道合作
电信与信息服务业务经营许可证:京ICP证070141号 | 北京市公安局海淀分局网监中心备案编号:1101081229