犹如当年的双核一样,多核服务器给企业用户带来的利好是显而易见的,有条件的用户总是希望使用更快更好的服务器。的确是这样,单台服务器可以支持的核心更多,服务器的处理速度更快,并可以借助虚拟化技术,将上百台服务器整合到数台多核心处理器服务器。但同时也存在更多需要预先考虑的问题。想要充分发挥多核处理器的效能,就要处理好处理器、存储和I/O等方面搭配最佳化的问题。
从2010年3月份开始,英特尔发布6核心的至强5600,到4月份AMD发布12核心的皓龙6000,可以看出来英特尔和AMD都非常看好多核服务器的市场前景,甚至AMD还宣布将在2011年推出16核心x86服务器处理器。有处理器市场上的两个霸主的大力参与,多和服务器的市场想不火都难。
32纳米服务器处理器给我们带来的惊喜
英特尔总能给我们带来惊喜,继2009年推出至强5500之后,2010年推出的至强5600延续了英特尔在至强5500中提出的三大智能计算新主张:智能性能、智能节能、虚拟化。其重要变化在于:32纳米工艺、6核心12线程设计、3.46GHz的更高主频、12MB的更大L3缓存,以及在能耗管理方面的增强技术等。其中最重要的当然属于32纳米工艺,由于采用了第二代高-K金属栅极晶体管技术,用于高K材料的等价氧化物(电介质)的厚度从45纳米工艺时的1纳米缩小至0.9纳米,栅极长度缩小到了30纳米,所以单位面积可以集成更多晶体管,处理器的同比封装尺寸将是45nm产品的70%;同时采用了第4代应变硅,电子在晶体管中的流通更顺畅,阻力更小,耗电更低。因此,相比较于45纳米,最新的32纳米处理器更小,更快,更强,更高能效。
32纳米工艺进一步提升了英特尔部署晶体管密度的能力,提升了单位晶体管的性能,降低了单位晶体管的能耗。因此,可以在相同成本下提高性能,在同样的功耗下提升主频,也可以加入更多内核,把缓存做得更大。比如,得益于工艺进步,与上一代产品中最高端的X5570(2.93GHz,95w)相比,L5640(6核,2.26GHz,60w)的性能相当,但功耗却降低了30%。这使得用户可以实现更高密度的部署。
在自适应能效方面,至强5600主要在4个方面进行了改进,一是CPU功耗更低,每瓦特性能更高,六核版本至强5600的最低功耗为60W,四核版本至强5600的最低功耗只有40W。二是增强了智能节能技术,可以调节六个内核的能耗状态,性能功耗比更接近理想的线性状态。三是处理器内核的能耗管理算法进行了更新,可以让Turbo Boost睿频更高效,同时对内存的能耗管理做到更精细化。四是使用了DDR3低电压内存技术,预计内存能耗最多可减少10%,每条内存可降低2瓦特。
在虚拟化方面,至强5600主要增强了安全性方面的考虑,引入了AES-NI和Intel TXT技术,从而降低未来云计算时代虚拟化环境的安全风险。
第2页:AMD后来者居上祭出多路市场12核处理器
就在英特尔推出至强5600一个月,其竞争对手AMD很快推出AMD皓龙6000,而且是后来者居上,推出了12核和8核X86处理器,颇有些你追我赶的意思。这块处理器在性能是上一代六核处理器的两倍,其中整体性能提升了88%,浮点性能提升高达119%,主要面向主流的双路以及高附加值四路市场,增强的集成内存控制器支持四通道DDR3内存,整体内存带宽提升2.5倍。与上一代产品相比,内存容量提升了50%,每个处理器配备了多达12个DIMM插槽。
另外,配备的AMD5600系列芯片组拥有I/O虚拟化功能、超传输3.0技术以及PCI-E 2.0,新皓龙平台在双路及四路服务器之间实现了芯片组及接口兼容性,并且与代号为Bulldozer的下一代AMD服务器处理器核心相兼容。更加深入的电源管理特性:新的系统(包括在Magny-cours和在Lisbon的平台上)在电源管理方面都引入了C1E空载状态的休眠技术。
在虚拟化方面,皓龙6000可以支持更多的虚拟机,同时内存带宽和不同功耗产品之间具有一致性,因此内存带宽不会因功耗降低而受到影响和牺牲。至于这一点如何实现,AMD方面说,这主要基于直连架构2.0的功劳,不管是现在推出的12核处理器,还是明年要推出的16核产品,在整个产品的研发和设计过程中,非常关注能效方面的管理及相应的对超传输总线、及内存的带宽,包括内存通道的需求。所以通过一个综合考量,对其进行了很好的规划。
Magny-cours采用四通道的内存,增加了一条超传输总线。对于这种设计,AMD当初的想法是将皓龙6000平台最好的应用在虚拟化、数据库、高性能计算等方面,尤其高性能计算的客户,皓龙6000的特点可以帮助HPC用户实现更紧凑的系统部署。
在高性能计算领域中颇受人关注的Linpack测试方面,AMD皓龙6000也有长处。如果分析Linpack测试软件,其主要是看高性能计算里有多少浮点计算流水线,再配以处理器的主频,这就是Linpack的理论峰值的来源(不过一般实际运算无法达到峰值)。
AMD在G34上目前单颗处理器最大核心数量可达到12核,即四路48核的总流水线,这就决定了其浮点计算能力非常强,值得一提的是G34的48核最多可以支持到0.5TB内存。这就意味着在内存敏感型计算中,这个平台将会表现优异。
在Istanbul处理器的时候,AMD就引入了HT Assist技术来提高多路处理器相互访问的性能,现在Magny-cours的超传输总线技术可以让多路系统走一条直线,从而实现CPU之间的一跳式访问,AMD认为这是AMD未来相关升级性及多核心的关键性技术。在Magny-cours的四条超传输总线中,三条超传输总线用来进行CPU互联,第四条则连接到北桥芯片上。在老的多路平台上,CPU没有相互直连,比如对角两个处理器要互相访问,需要跳两次。而在新的AMD皓龙6000平台上,通过更多的超传输总线,可以实现直接访问。
借由这种关键技术的改进,我们有理由相信2010年的多路服务器市场一定会有翻天覆地的服务器更新热潮。
第3页:多核心处理器加强性能同时保证低能耗
多核心处理器加强性能同时保证低能耗
在多核心处理器上,可以看见虚拟化技术扮演着越来越重要的角色,让用户能够将上百台服务器整合到数台多核心处理器服务器。因此很多人惊呼,这是否预示着多核服务器时代即将来临了?的确,我们可以看见,多核处理器的性能相对于以前有多飞速的进步。例如,至强5600的性能是单核至强的15倍,更新服务器可以带来维护管理成本、空间成本、电力成本、软件许可证费用的极大节省。
如果利用至强5600来对这些单核产品进行15:1的整合,每年可以节省95%的电力支出,得益于电力、软件方面的成本节省,仅5个月就可以收回投资。如果实现1:1的替换,性能可以提高15倍,预计每年电力支出可以减少8%。
多核处理器不仅仅在性能有了大幅度提升,而且在节能控制上有了大踏步提高。其中,Magny-Cours系统(包括在Magny-cours和在Lisbon的平台上),在电源管理方面都引入了C1E空载状态的休眠技术。以4路48个核心为例,功耗可以节省50瓦。在AMD皓龙4000系列的平台当中,我们也运用了一些功耗、电源优化的管理系统,比如Adelaide平台,我们从它BIOS的设定,及相关的环节都可以做到功耗的节省。通过这些管理技术和管理机制,我们就可以实现我们前面提到的50瓦功耗的节省。
小结:
随着多核心处理器的相继推出,很多人猜测,这是否预示着多核心处理器时代的来临?记者认为仅仅只有厂商的宣传还只能算是独角戏,必须有更多用户的积极使用和体验。根据IDC在去年第三季度发布的统计数据,全球市场中仍然保有38%的单核服务器和42%的双核服务器。可以看出来,单核和双核仍然占据着服务器的主流,所以多核服务器市场仍然有很多路要走,而目前只能算是刚刚打开了多核服务器的一扇窗。不过,我们相信,随着处理器市场上两大霸主英特尔和AMD的全力参与,用户对多核服务器的需求会逐渐被唤醒,犹如当年有单核迈向双核一样,用户迈入多核服务器时代已经为时不远。