黄仁勋:串行计算过时并行计算是未来
记者:借助NVIDIA的Tesla,中国的超级计算机取得了世界领先的成绩。我想中国要保持这种领先的成绩,在未来,需要做哪些方面的努力和创新?第二个问题,NVIDIA在这个过程中,对中国未来的超级计算机将会提供哪些支持?谢谢!
刘光明:刚才我给大家讲过,中国的要性能计算机的发展经历了将近30年的历程,从78年开始,以银河1号为代表,中国就全面开展了高性能计算机的研制,这个研制并不是为了在世界上去争排名,确确实实是因为我们国家急需这样的高性能计算机。作为天河来讲,经过32年的积累,在怎么做高性能计算机,特别是研制承担国家科技部“863”这个项目,千万亿次级别的高性能计算机研究过程中,遇到了一个世界性的难题,就是怎么去做。从2005年到2007年一直在研究,通用CPU我们这也有,我们的“飞腾1000”,在技术上怎么用别的有的称为协处理器,有的称为加速器,这种结构也就叫做异构的结构去解决世界的难题。这里面过去实验过我们自己的流处理器芯片,当时叫“飞腾100”,去年我们用的是AMD的,最后发现了NVIDIA的芯片的性能更好。
有一点请各位朋友注意的是,超级计算机做出来运算峰值能做到4700万亿次,平均值2566万亿次,世界靠前。但这并不等于你能把这个机器在实际运作中,能用的非常好。实际上在高性能计算方面是两个问题,第一个是怎么把这台计算机做出来,综合性能是不错的,刚才杨教授介绍了,这就涉及到一个体系结构的问题,涉及到我们计算部件的系统(计算子系统),包括高性能的通信系统。
第二个挑战也是现在全世界都面临的,就是它的应用。也就是说,解决实际问题怎么去编程序。在这种通用CPU+GPU这种国际,国际上学术界称为异构协同、并行处理,或者叫异构结构,它在编程上是非常困难的。这也是当今世界上,人们面临的第二个大的技术挑战,并不是所有的程序拿过来之后,都能够在这个结构上用的很好,包括国外。所以我们现在有一个很好的团队,像杨教授带领的这么一个团队,从几年前就在解决这个问题,应该说现在已经取得了非常好的成绩。我们这一次能够在实现4700万亿次情况下,能够做到53%的计算效率,把平均值测到了2566万亿次,如果用同样的结构去给别的用户测,测不到这个水平,因为我们过去一直尝试从事体系结构的研究,就是机器怎么做,芯片的研制,知道这个程序怎么划分。
通俗的讲,这样一个结构里面,大家算出来它的核,包括通用CPU的核,再包括GPU的核,几十万亿次,18万多个。什么概念?就是一件工作你把它分为1000个人好分,1000个人你好领导,把一件工作分给18万个人,而且要把他们协调起来,让他们同步听命令、听指挥的干好这件事,这在国际上也是个难题,对我们现在也是个难题,但是我们现在不断的去解决,解决过程中有NVIDIA CUDA这样的一个编程环境支持,又使这个难题开始解决了一部分,核心问题还要对物理过程分析怎么去并行化,计算机一般有超级计算机有超级并行计算机,所以也就是并行。很直观的讲,18万个人去干同一件事,这个组织,令行禁止,然后统一的行动都是一个很难的事。大家可能知道,当个小班长、当个小团队的老总很好当,当个大国企的领导就不好当了,也就是这个道理。
所以现在我们也在花很大力气把应用,就是过去在通用CPU环境下的应用不断的移植到异构结构,应该说我们取得了很好的成绩,当然后面也还有大量的工作要去做,也请大家在宣传的时候跟读者们讲清这个事。并不是说计算机做好之后就会用好,还需要我们进一步的努力,把这机器在这样的结构情况下,在NVIDIA CUDA支持的情况下,还有新的技术上的突破、创新、进步的基础上,把应用提升到一个更高、更实用的水平,使计算机天河一号A真正发挥它的实际用处。
黄仁勋:刘教授说的很对,并行计算是一个非常复杂、非常大规模的计算,它的困难非常的多,但实际上如果你解决了这些困难的话,它能够带来的收益和效率也是非常可观的。并行计算今天遇到的问题是整个计算界在过去30年,一直不停想要解决的问题,但是过去30年一直都没有成功过。
有多少个超级计算机的公司在全球真正开发出来异构计算、并行计算的呢?过去从事并行计算的这些公司今天都已经不再存在了,因为他们的技术和产品都没有发挥作用。今天我们推出CUDA的新技术,实际上是异构计算,CPU+GPU的计算,一方面它很容易进行推广,另外一方面,它有非常强的扩张能力。
革命性的一件事情是,花了NVIDIA公司很多年的时间来开发这个技术,也花费了我们几十亿美元的投资。在这个世界上,没有任何一家公司在并行计算当中的投资能超过NVIDIA。我们今天可以看到,因为CUDA,并行计算有非常光明的前景。当然,像刘博士刚才提到的,在这里我们还面临着非常多的挑战。在未来,我们需要不断和刘博士及他的团队进行合作,不断地创造出更多或创造出下一代世界上最强的超级计算机。
中国已经非常清楚地认识到,开发和推广超级计算机对于未来的知识、科学和技术的发展都有非常大的推动作用。我们公司非常荣幸,能够和国内很多的科学家、研究人员、很到公司,还有很多的超级计算机中心一起合作,为超级计算方面的发展提供支持。在中国,超级计算机领域的进步以及中国在科学发展当中不断的进步,会在全人类范围内给我们提供好处。
各位知道,世界已经开始变得越来越小。现在对于知识、技术、科学的探索,对于全球整个人类都非常有益。我们会让我们公司最强的技术人员和最强的技术队不断支持刘博士和杨博士以及整个超级计算天津中心,我们会用我们最出色的软件工程师帮助刘博士的团队开发和拓展新的软件,在CUDA上发挥得更好。我们会尽我们所有的力量,不断投入,保证在中国所有的大学都能教授CUDA的课程,中国所有的大学都有这方面的知识和能力去不断的推广和教授并行计算的新技术。我深信,所有的计算机科学家和工程人员,都要学习并行计算。串行计算已经是一个过去时,并行计算才是未来。
刘光明:非常感谢各位朋友到我们天津中心来,也感谢NVIDIA的黄仁勋先生来现场和我们一起探讨超级计算领域现有的技术以及未来的发展,给予我们很多新的启示。从天河一号A得到世界靠前之后,获得了世界和我们国家的关注,我们国家超级计算天津中心现在正在做两件事儿,第一件事就是利用天河一号A,真正为滨海新区和天津地区的经济发展做好科技服务,这是最关键的。未来,我们除了需要在高性能计算机方面做好科技服务之外,还会成立一个天津的云计算中心,尽管这是科学计算和数据服务两件事,但我们会全方位服务于国家的发展。
第二方面,国家科技部在进行“十二五”高性能计算机的发展规划,根据我们现在研制高性能计算机的经验和积累的技术,会规划一个未来符合国家整体战略发展的新的更大的计算机,这一点在“十二五”期间肯定会实现。我也希望跟NVIDIA的合作过程中,不断利用双方的经验、技术,为我们国家的高性能计算,为全世界高性能计算机的发展做出我们更大的贡献。谢谢各位!■<
关注我们
