|
|
今日导读
|
NVIDIA TESLA产品问世已经一年多了,由于主要是面向行业用户进行科学计算的产品,DIY玩家可能对TESLA并不太清楚。2008年6月,NVIDIA在德国发布了TESLA的第二代产品,TESLA 10系列方案,包括新的1U服务器和TESLA C1060处理器。借这个机会,我们简单介绍一下TESLA的构成、应用和近年来的发展。
NVIDIA的CUDA经过一段时间的宣传,玩家应该比较熟悉了,简单来说就是C语言编写的一种API,通过CUDA可以利用GPU来进行一些软件的加速运算,使GPU不仅仅在图形领域发挥作用。而TESLA正是以CUDA为基础开发的、面向行业科学计算的产品。

塔式TESLA产品
TESLA处理器以GPU为核心,外观来看跟显卡非常相似,只是没有显示输出接口,我们可以理解为没有视频输出接口的显卡。而这种“显卡”的主要作用就是,多块并联,通过CUDA来进行行业科学运算。和传统服务器/工作站相比,塔式TESLA主机也有CPU等常规硬件,只是内部有多块“显卡”组多路SLI,如图所示。
了解了基本的硬件构成,对于熟悉CUDA的玩家来说,TESLA产品就非常好理解了,简单来说就是“显卡服务器”。通过多路显卡的强大并行处理能力去使一些以往主要依靠CPU计算的领域大大提速,甚至使部分传统依靠CPU无法完成的计算成为可能。
之前我们都曾经了解过,由于显卡的多个流处理器(例如GT200核心的240个SP)并行计算的机构,通过CUDA进行某些领域应用加速运算的时候可以比单纯依靠CPU提升很多倍。例如PC玩家比较感兴趣的视频编码加速、Photoshop运算提速等。不过TESLA针对的是行业计算领域,应用重点领域自然会有所区隔。
生命科学: 用于癌症研究的Autodock软件提速,据美国国家癌症研究所报告,模拟速度提升高达12倍,将等待结果的时间从2个小时缩短至10分钟。AutoDock的作者、美国斯克利普斯研究所Garrett Morris博士表示:“从长远角度来讲,我们只希望能够通过Silicon Informatics公司的产品来加速找到各种疾病的治疗新药。其中包括从癌症到阿耳茨海默氏症、从艾滋病到疟疾等各种疾病。”
科学: 美国国家大气研究中心气象研究和预报(WRF) 模型计算,WRF的1%已通过CUDA实现,整体速度提升了20%,节省了一个星期的分析时间。
金融:Hanweck Associates Volera 实时期权评估引擎,利用三台NVIDIA Tesla S870实时评估美国上市的整个期权市场。
设计: 用于服装布料物理特性的CAD设计,实时观察成品的效果。
此外,TESLA产品还在多项科学计算领域发挥了不小的提速作用。图片显示的是8系列TESLA产品在不同领域发挥的作用。
TESLA 10系列——GPU构建1U服务器
传统X86架构CPU为主构建的服务器,由于自身架构方面的原因,计算集群的数量比较庞大,并且随着服务器的增加,计算能力并非直线等比上升。而GPU服务器不同,大家对GPU在构建SLI或者CrossFire系统后性能的提升幅度都比较清楚。因此多个GPU构建服务器,性能提升比传统服务器更大。

TESLA C1060计算处理器,可以堪称没有视频输出接口的显卡
随着NVIDIA新一代GT200核心GPU的发布,TESLA产品也以此为基础进行了更新。其中,C1060计算处理器的处理能力达到了1Tflops,“显存”也增加为4GB。
有了这种基础,TESLA在10系列不再只是考虑组建塔式服务器,而是进军机架式服务器领域,这就是新的S1070 1U服务器系统。从构造就可以看出,该1U系统内部主要由4片“显卡”——C1060组成,其它除了散热系统和电源系统,没有别的设备了。

核心为4片GPU的1U服务器
S1070的计算能力达到了4Tflops,功率为700W。不过,正如我们看到的其内部架构的原因,S1070是不能单独上机架使用的,需要和CPU服务器配合使用。
根据NVIDIA的数据,1个4核心CPU 1U服务器计算能力大约0.07Tflops,单价2000美元,功率400W。假如要构建一个100TF处理能力的数据中心,需要1429台服务器,造价310万美元,总功率571KW。如果搭配S1070 1U服务器使用,单台S1070的造价是8000美元。那么只需要25台CPU服务器和25台S1070就可以构建一个100TF的数据中心,造价31万美元,功率21KW。
清华大学微电子研究所的邓仰东教授分析了GPU在EDA软件方面的应用。所谓EDA软件,是指设计集成电路的软件工具,例如设计CPU等。以现有45nm CPU的典型设计规模举例,大约是100M逻辑门,1G时需路径,1T版图图形。

清华大学微电子研究所的邓仰东教授
而自1970年以来,处理器的复杂度大大提高。1971年的Intel 4004只有2300个晶体管,而Core 2 Extreme的晶体管达到了2亿9千1百万个。相对于处理器的发展,设计团队的规模增加却不到10倍。原因就是EDA软件自动化设计能力。
如今,主流工艺向45nm过渡,集成电路复杂度仍然在增加,并且由于高昂的制造成本,需要在设计阶段高强度验证保证首次投片成功。对于计算需求量的大幅度提升,目前主流多核CPU的性能对应提升,是非常有限的。而CUDA和TESLA产品的出现使得EDA软件具有更多的机会。
使用CUDA加速,传统利用CPU需要1小时的全芯片STA利用GPU只需要1小时即可完成。而传统CPU进行全芯片统计性STA几乎不可行,利用GPU则是可行的。
此外,GPU运算还有故障仿真、快速门逻辑仿真、电路布局等多方面运算的优势。由于专业性太强,这里就不过多介绍了。需要明白的就是,微电子研究所的专家对于GPU对EDA软件的加速前景非常看好。
单就性能来看,CUDA加速和TESLA无疑是很有优势的。不过,服务器和科学计算相对来说,是一个专业性和封闭性比较强的行业。TESLA的计算方式,相对于传统来说无疑是一个革命性的挑战。并且,NVIDIA并非一个服务器供应商,不会直接销售产品给终端用户。很显然NVIDIA需要首先说服大的服务器供应商采用他们的TESLA方案。
NVIDIA TESLA GPU计算事业部高级产品经理Sumit Gupta表示,目前已经开始明确销售TESLA服务器的有Sun、联想等厂商,还有的厂商虽然也在卖类似的产品,但未公开。到2008年年底,会有专门的相关信息发布。

NVIDIA TESLA GPU计算事业部高级产品经理Sumit Gupta
另外,之前不少人有疑问,对于“显卡服务器”这样新概念的产品,如果只有NVIDIA一家去推广并且和传统产品竞争,显然不如生产GPU产品的厂商一起来使用并推广更好。对此,Sumit表示,CUDA完全是开放的C语言编写的API,其它GPU厂商想要使用无需授权。但是,其它厂商GPU的架构、技术等方面,从目前来看并不太适合通过CUDA来进行加速运算。
从前景来看,TESLA在计算方面和传统的服务器/工作站相比是很有优势的,但是面临的问题也有一些。首先NVIDIA需要在产品和软件上进一步完善,其次市场的推广和用户接受方面需要进一步加大力度。很多用户并不知道TESLA到底是做什么用的,由哪些硬件和软件组成,有什么样的处理能力,效果如何,等等。还有TESLA已经发布一年多了,公开表示支持并发售TESLA相关产品的服务器厂商还不够多。这些都还需要NVIDIA方面去做。