黄仁勋:异构GPU计算代表主流服务器架构

间隙填充
正睿科技  发布时间:2010-12-25 09:12:47  浏览数:2110

  2010年12月21日, NVIDIA在京举办首届“GPU高性能计算峰会”。图形技术领域教父级人物NV总裁兼首席执行官黄仁勋率高层在华布道,与中国国家超级计算天津中心的“天河”超级计算机缔造者、合作伙伴惠普、联想高层以及数百位中国GPU计算领域的专家学者,一同探讨新兴的GPU计算技术发展趋势及未来之路。

  在今年10月全球超级计算机前500名榜单上,中国国防科学技术大学研制、安装部署在中国国家超级计算天津中心的“天河一号”超级计算机排名第一成为当今世界最快的超级计算机。“天河一号”扬名世界不仅使全球同业者对中国在高性能计算领域的技术实力刮目相看,同时天河一号系统所采用的7168颗Tesla M2050 GPU也使得GPU计算在高性能计算领域所发挥的突破性作用受到更大的瞩目。事实上,以Tesla广泛应用为代表的GPU计算热潮在此之前早已悄然在世界各地逐渐升温。而这也是NV“GPU高性能计算峰会”举办的最主要动因。


黄仁勋:异构GPU计算是三大服务器之一
NV总裁兼首席执行官黄仁勋

  峰会开场,黄仁勋表达了在中国召开首次峰会的喜悦之情。NV的GPU计算大会一年一度在美国召开,今年来到中国。正是由于GPU计算在全球超级计算领域所引导发的热潮,使得GPU计算大会每一年的反响热烈。黄仁勋表示,目前NVIDIA有三大业务构成,即传统的绘图业务、移动及个人显示芯片业务以及是新的基于Tesla的服务器和云计算的业务。

    设计模拟计算拉动需求HPC渗透各行各业

  提起高性能计算(High Performance Computing)或者超级计算机(Super Computer),许多人联想到的可能是像“流体力学计算”“量子化学计算”“生物制药”这样的尖端科技字眼儿。然而黄仁勋认为:高性能计算之所以如此重要,不仅仅是因为它在科技创新尖端技术研究方面的作用,当前越来越多的行业正在应用到高性能计算。从军研、医药、石油勘探、到汽车制造、日用品、数字多媒体、电影娱乐等,HPC正在强力渗透到各行各业。

  黄仁勋回忆,早在1981年他本人大大学进修时,经常要在实验室进行各种原型(Prototype)设计和制造。然而,在当今类许多大型企业的工程师和研究者们已经基本上不会再以制造实物的方式进行实验了,因为许多的实验都是通过计算机模拟来完成的。他以NV公司为例,NV拥有一个超级计算机中心其规模相当于日本超算中心的四分之一,每年需要投入一亿美元更新4万颗CPU。这个计算机中心上运行着公司100多个应用,但是65-70%的计算资源是应用在产品研发的逻辑模拟方面。“如果模拟运算的速度能快10倍,不仅能节省大量的成本,同时整个行业将得到重塑,我们将能够模拟和解决更困难的问题从而设计出更好的产品”

黄仁勋:异构GPU计算代表主流服务器架构
英伟达公司总裁兼首席执行官黄仁勋先生戴上中科院赠送的粒子模拟图案围巾

  黄仁勋强调:不仅仅是在NVIDIA公司,包括药品、汽车、银行电信、城市交通、娱乐等各行各业,其计算资源的应用中三分之二是用于模拟实验的。因此他认为:企业要找出一两个关键性的应用,通过高性能计算的变革引领行业变革!而GPU计算,正是打开企业关键性计算应用之门的“金钥匙”。

  服务器市场变革:异构GPU计算与X86同样重要

  黄仁勋认为,因为企业用户应用方向的转变,当前服务器市场正在经历一场前所未有的变革。“X86架构服务器不再是惟一的”他大声宣布:今后X86服务器市场只是作为通用商业计算的服务器形式的一种。而除此之外,还有另外两类服务器,一种应对互联网广泛普及而诞生的WEB SERVER网络服务器,采用这类型服务器的代表厂商包括facebook、ebay、谷歌等,对于这些厂商来说不需要通用服务器所采用的CPU和整体架构,他们采用的是为了应对每时每刻数以百万计的小型任务请示而设计专有服务器形式;而另外一种形式便是以GPU计算所驱动的高性能计算服务器。这是一种完全新类别的服务器,由GPU负担超过65%的计算量。


黄仁勋:异构GPU计算代表主流服务器架构

  黄仁勋以高性能计算500强的近几十年的发展趋势图举例表示,在2006年以前随着CPU频率的提升HPC产业一直是与摩尔定律的发展同步的,然而在2006年以后以种趋势起了变化。因为CPU集群成本效率已经发展到瓶颈,超级计算机在快速扩展的过程中无法得到相应的性能收益。此外,过高的投入成本使得超级计算机技术一直藏在深阁,无法为企业应用服务。

黄仁勋:异构GPU计算代表主流服务器架构
英伟达公司总裁兼首席执行官黄仁勋先生与国家超级计算天津中心杨灿群教授共同揭秘天河一号A

  然而黄仁勋坚信:高性能计算不应该仅仅在各个超算中心服务,而应该成为主流的三大计算形式的一类,应该服务到人类的生产生活的各个方面。他列举了宝洁公司如何通过模拟研究解决薯片生产的例子验证了高性能计算服务于民生。

  异构计算是王道 GPU计算如同“时光机器”

  “GPU计算如同一部时光机器,将原来需要几个月完成的工作在几天甚至几小时内帮我们实现了。”黄仁勋如此描述GPU计算的神奇。为什么基于TESLA的GPU计算拥有如此“魔力”?黄仁勋表示,GPU计算是在传统的CPU旁边再配置一个GPU辅助计算。GUP和CPU协同呀荼共同执行通用的计算任务。由于CPU并非专为并行计算而设计,更擅长基于串行方式的任务,而GPU擅长于处理大量相似的数据,因此可以利用GPU的数百的内核进行处理。黄仁勋认为,各尽所能,在特定的处理任务上运用最合适的处理器才能使计算速度发挥极限,因而只有基于“异构”的GPU协同模式能发挥出惊人的计算能力。


黄仁勋:异构GPU计算代表主流服务器架构
英伟达公司总裁兼首席执行官黄仁勋先生为CUDA校园编程竞赛获奖选手颁奖

  当然,GPU计算并非全能,因而只有当程序员修改应用程序利用GPU数以百计的并行核心才能真正发挥其威力,而GPU计算所擅长的是在浮点运算。NVIDIA的GPU计算平台名叫CUDA,它是专为并行计算所设计的架构。河一号实测运算速度可达每秒2570万亿次正是利用的这一架构进行了特别优化。在NV最新的代号为“Fermi”的CUDA架构芯片上,采用了超过30亿个晶体管,同时支持C++,使程序员面向其开发GPU并行处理更加容易。

  中国家超级计算天津中心主任刘光明表示:如果没有GPU,天河一号A的性能与效率几乎是不可能实现的。天河一号“的投入运行,将有力带动中国的科技进步和经济、社会发展,国家超级计算天津中心将基于”天河一号“,向全中国乃至全世界开放,为人类的科技进步做贡献。

  “如同在厨房里做不同的菜需要不同的炊具一样,高性能计算也需要针对不同的计算需求应用最合适的计算架构”黄仁勋如是说。世界三台速度最快的计算机中有两台由GPU提供动力。对于希望加快发现速度科学家来说,GPU 超级计算机是不可或缺的工具。

    从最新的高性能计算TOP100中,我们不难发现GPU加速已经成为不可不选的必由之路。在2010年的超级计算机前100榜上有名的,采用CPU+GPU混合架构的高性能计算机就达到了7套其中有6套是英特尔CPU与NVIDIA GPU的搭配,其中在TOP10中,就有5套采用了CPU+GPU的结构。

    黄仁勋认为,大约每10年时间全球超级计算机便会经历一次计算架构的根本性转变。基于集群的计算广泛取代基于向量的计算,成为大型计算设备的实际标准大约是10年前发生的,而这一转变也见证了超级计算行业跨越千万亿次浮点运算的性能障碍。下一个性能目标是实现亿亿次级计算,因此并行计算的转变是独一无二的选择。


黄仁勋:异构GPU计算代表主流服务器架构

   黄仁勋公布了未来三年内Tesla的最新路线图。根据介绍,2011年下半年,NVIDIA计划将会推出基于Kepler架构的GPU,相关产品将会使用28nm工艺,相比当前基于Fermi架构的图形处理器,新架构图形处理器将会带来在性能上的显著提升。根据NVIDIA公司的介绍,Fermi架构每瓦典型DP(double precision)性能为1.5GFLOPS,而Kepler架构则将会提升3-4倍,因此新架构图形处理器可以在将TDP保持在250W的情况下每瓦典型DP(double precision)性能可以达到1.125TFLOPS - 1.50TFLOPS。尽管这一性能指标并不能与图形处理器实际的性能相挂钩,但是基本上可以确定的是Kepler架构图形处理器在游戏中的性能表现将至少会是Fermi的2-3倍。而Maxwell架构将会于2013年推出。其每瓦典型DP性能将会达到16GFLOPS,其提升幅度可以用飞跃来形容。

黄仁勋:异构GPU计算代表主流服务器架构
英伟达公司总裁兼首席执行官黄仁勋先生与CUDA校园编程竞赛获奖选手合影

   当前,GPU计算已经为高性能计算铺就了一条新的路径。在新的起跑线上,中国的高性能计算机终于得以与发达国家同台竞技并已经初步取得了小的成功(天河一号)。不过,GPU计算显然也不是完美无缺的,当下除了软件编程和移植比较难之外,计算系统效率低以及局限性较大也是不小的问题。对于黄仁勋来说,GPU计算的新征程才刚刚开始。