Intel和AMD超级计算机鏖战
上周,每半年评选一次的超级计算机TOP500新鲜出炉,IBM超级计算机“走鹃”(Roadrunner)以每秒1.105千万亿次的浮点运算速度卫冕成功,再次成为世界上最快的超级计算机,而Cray的XT5 Jaguar系统为列第二。IBM成为最大的赢家,在前十名中占据了5位。
位列前十的超级计算机
再从处理器类型上来看,英特尔占有率最高,在TOP500中占据了接近80%。不过AMD并不示弱,虽然占有率要远远低于英特尔,但是前10强超级计算机中有4台使用了AMD处理器、前20强超级计算机中有9台使用了AMD处理器,超过其它的处理器供应商,排名第一的“走鹃”超级计算机也采用了AMD处理器。
超级计算机处理器统计
在Top500中,英特尔“Nehalem”至强和AMD六核“Istanbul”皓龙都已经得到了应用,如AMD六核皓龙已经出现在了两台Cray XT5超级计算机中、也有33套系统凭借英特尔Nehalem处理器在计算能力上大幅提升,迅速占领榜单的重要位置。
Intel和AMD节点Linpack比较
已经不耐烦来比较英特尔四核Xeon 5500系列和AMD六核Opteron 2400系列在超级计算负载中的性能,在榜单中我们都可以找到答案。近日,服务器集群制造商Advanced Clustering Technologies(简称ACT)公司将高性能基准测试Linpack应用到了两台双插槽机架服务器节点上,比较两个平台的独立节点性能。
Top500中的超级计算机包含了成百上千,甚至上万个节点,通过MPI( message passing interface)协议同时运行,这样系统的性能往往会受到用于连接这些节点的网络光纤的影响,而正确的评估服务器节点的性能,可以衡量采用不同连接方式下系统级别的性能。
两个测试平台配置如下:
英特尔平台采用了2颗四核至强X5550,核心频率2.66GHz,功耗95W(ATC工程师原本希望安装2颗2.53GHz的至强E5540处理器,功耗为80W,在HPC集群中更加常用),此外配置了12GB 1.33GHz的DDR3内存。
AMD平台采用了2颗2.66GHz的六核Opteron 2435,功耗75W,配置了16GB 800MHz DDR2内存。(看起来功耗为80W的至强E5540是一个更好的对比平台,不过任何比较都有妥协性)。
ATC工程师为两个平台采用了相同的电源、硬盘和操作系统??操作系统采用了Linux。两个平台采用了不同容量的内存是因为两个平台对于内存频率和通道的支持不同,比如Nehalem至强每个处理器支持三通道内存,而AMD皓龙每个处理器只支持两个内存通道,配置不同容量的内存是为了更好的达到平衡。
测试结果:
经过测试,至强5500平台得到了85.12 gigaflops(千兆浮点运算)的理论峰值,而实际负载峰值为74.03 gigaflops,也就是说至强5500平台在实际工作中的理论效率为86.97%。英特尔平台的价格为3800美金,每gigaflop的计算费用为51.33美金。
再来看AMD平台,Opteron 2435平台获得了124.8 gigaflops的理论峰值,实际负载峰值为99.38 gigaflops,实际工作中的理论效率为79.63%。但是AMD皓龙平台在成本上要更占优势,平台价格为3500美金,每gigaflop的计算费用仅为35.21美金。
从结果我们可以清楚地看出性能上的优劣,AMD四核皓龙需要两个内存通道,而六核皓龙可能需要三个内存通道,ATC工程师猜测也许是内存通道数影响了“Istanbul”的执行效率。
但是六核“Istanbul”处理器实际性能要高出34.2%,系统价格要低了7.9%,在系统级别上所消耗的能量可能也要低上数十瓦,故而ATC还是非常支持AMD皓龙节点。