显卡构建1U服务器看TESLA近来的发展-泡泡网

泡泡网显卡频道 PCPOP首页 / 显卡 / 新闻 / 正文

显卡构建1U服务器看TESLA近来的发展

2008年07月29日 00:08作者：肖冠丁编辑：肖冠丁文章出处：泡泡网原创

NVIDIA TESLA产品问世已经一年多了，由于主要是面向行业用户进行科学计算的产品，DIY玩家可能对TESLA并不太清楚。2008年6月，NVIDIA在德国发布了TESLA的第二代产品，TESLA 10系列方案，包括新的1U服务器和TESLA C1060处理器。借这个机会，我们简单介绍一下TESLA的构成、应用和近年来的发展。

NVIDIA的CUDA经过一段时间的宣传，玩家应该比较熟悉了，简单来说就是C语言编写的一种API，通过CUDA可以利用GPU来进行一些软件的加速运算，使GPU不仅仅在图形领域发挥作用。而TESLA正是以CUDA为基础开发的、面向行业科学计算的产品。

{imageTitle}
塔式TESLA产品

TESLA处理器以GPU为核心，外观来看跟显卡非常相似，只是没有显示输出接口，我们可以理解为没有视频输出接口的显卡。而这种“显卡”的主要作用就是，多块并联，通过CUDA来进行行业科学运算。和传统服务器/工作站相比，塔式TESLA主机也有CPU等常规硬件，只是内部有多块“显卡”组多路SLI，如图所示。

了解了基本的硬件构成，对于熟悉CUDA的玩家来说，TESLA产品就非常好理解了，简单来说就是“显卡服务器”。通过多路显卡的强大并行处理能力去使一些以往主要依靠CPU计算的领域大大提速，甚至使部分传统依靠CPU无法完成的计算成为可能。

之前我们都曾经了解过，由于显卡的多个流处理器（例如GT200核心的240个SP）并行计算的机构，通过CUDA进行某些领域应用加速运算的时候可以比单纯依靠CPU提升很多倍。例如PC玩家比较感兴趣的视频编码加速、Photoshop运算提速等。不过TESLA针对的是行业计算领域，应用重点领域自然会有所区隔。

生命科学: 用于癌症研究的Autodock软件提速，据美国国家癌症研究所报告，模拟速度提升高达12倍，将等待结果的时间从2个小时缩短至10分钟。AutoDock的作者、美国斯克利普斯研究所Garrett Morris博士表示：“从长远角度来讲，我们只希望能够通过Silicon Informatics公司的产品来加速找到各种疾病的治疗新药。其中包括从癌症到阿耳茨海默氏症、从艾滋病到疟疾等各种疾病。”

科学: 美国国家大气研究中心气象研究和预报(WRF) 模型计算，WRF的1%已通过CUDA实现，整体速度提升了20%，节省了一个星期的分析时间。

实时观察服装设计的效果

金融:Hanweck Associates Volera 实时期权评估引擎，利用三台NVIDIA Tesla S870实时评估美国上市的整个期权市场。

设计: 用于服装布料物理特性的CAD设计，实时观察成品的效果。

TESLA在多个领域发挥的作用

此外，TESLA产品还在多项科学计算领域发挥了不小的提速作用。图片显示的是8系列TESLA产品在不同领域发挥的作用。

传统X86架构CPU为主构建的服务器，由于自身架构方面的原因，计算集群的数量比较庞大，并且随着服务器的增加，计算能力并非直线等比上升。而GPU服务器不同，大家对GPU在构建SLI或者CrossFire系统后性能的提升幅度都比较清楚。因此多个GPU构建服务器，性能提升比传统服务器更大。

TESLA C1060计算处理器，可以堪称没有视频输出接口的显卡

随着NVIDIA新一代GT200核心GPU的发布，TESLA产品也以此为基础进行了更新。其中，C1060计算处理器的处理能力达到了1Tflops，“显存”也增加为4GB。

有了这种基础，TESLA在10系列不再只是考虑组建塔式服务器，而是进军机架式服务器领域，这就是新的S1070 1U服务器系统。从构造就可以看出，该1U系统内部主要由4片“显卡”——C1060组成，其它除了散热系统和电源系统，没有别的设备了。

{imageTitle}
核心为4片GPU的1U服务器

S1070的计算能力达到了4Tflops，功率为700W。不过，正如我们看到的其内部架构的原因，S1070是不能单独上机架使用的，需要和CPU服务器配合使用。

根据NVIDIA的数据，1个4核心CPU 1U服务器计算能力大约0.07Tflops，单价2000美元，功率400W。假如要构建一个100TF处理能力的数据中心，需要1429台服务器，造价310万美元，总功率571KW。如果搭配S1070 1U服务器使用，单台S1070的造价是8000美元。那么只需要25台CPU服务器和25台S1070就可以构建一个100TF的数据中心，造价31万美元，功率21KW。

清华大学微电子研究所的邓仰东教授分析了GPU在EDA软件方面的应用。所谓EDA软件，是指设计集成电路的软件工具，例如设计CPU等。以现有45nm CPU的典型设计规模举例，大约是100M逻辑门，1G时需路径，1T版图图形。

{imageTitle}
清华大学微电子研究所的邓仰东教授

而自1970年以来，处理器的复杂度大大提高。1971年的Intel 4004只有2300个晶体管，而Core 2 Extreme的晶体管达到了2亿9千1百万个。相对于处理器的发展，设计团队的规模增加却不到10倍。原因就是EDA软件自动化设计能力。

如今，主流工艺向45nm过渡，集成电路复杂度仍然在增加，并且由于高昂的制造成本，需要在设计阶段高强度验证保证首次投片成功。对于计算需求量的大幅度提升，目前主流多核CPU的性能对应提升，是非常有限的。而CUDA和TESLA产品的出现使得EDA软件具有更多的机会。

使用CUDA加速，传统利用CPU需要1小时的全芯片STA利用GPU只需要1小时即可完成。而传统CPU进行全芯片统计性STA几乎不可行，利用GPU则是可行的。

此外，GPU运算还有故障仿真、快速门逻辑仿真、电路布局等多方面运算的优势。由于专业性太强，这里就不过多介绍了。需要明白的就是，微电子研究所的专家对于GPU对EDA软件的加速前景非常看好。

单就性能来看，CUDA加速和TESLA无疑是很有优势的。不过，服务器和科学计算相对来说，是一个专业性和封闭性比较强的行业。TESLA的计算方式，相对于传统来说无疑是一个革命性的挑战。并且，NVIDIA并非一个服务器供应商，不会直接销售产品给终端用户。很显然NVIDIA需要首先说服大的服务器供应商采用他们的TESLA方案。

NVIDIA TESLA GPU计算事业部高级产品经理Sumit Gupta表示，目前已经开始明确销售TESLA服务器的有Sun、联想等厂商，还有的厂商虽然也在卖类似的产品，但未公开。到2008年年底，会有专门的相关信息发布。

{imageTitle}
NVIDIA TESLA GPU计算事业部高级产品经理Sumit Gupta

另外，之前不少人有疑问，对于“显卡服务器”这样新概念的产品，如果只有NVIDIA一家去推广并且和传统产品竞争，显然不如生产GPU产品的厂商一起来使用并推广更好。对此，Sumit表示，CUDA完全是开放的C语言编写的API，其它GPU厂商想要使用无需授权。但是，其它厂商GPU的架构、技术等方面，从目前来看并不太适合通过CUDA来进行加速运算。

从前景来看，TESLA在计算方面和传统的服务器/工作站相比是很有优势的，但是面临的问题也有一些。首先NVIDIA需要在产品和软件上进一步完善，其次市场的推广和用户接受方面需要进一步加大力度。很多用户并不知道TESLA到底是做什么用的，由哪些硬件和软件组成，有什么样的处理能力，效果如何，等等。还有TESLA已经发布一年多了，公开表示支持并发售TESLA相关产品的服务器厂商还不够多。这些都还需要NVIDIA方面去做。<

1人已赞

显卡构建1U服务器 看TESLA近来的发展

关注我们

显卡构建1U服务器看TESLA近来的发展