正睿服务器  >  新闻中心  >  业界资讯
新闻中心

六大亮点 Nehalem架构开创至强新时代

间隙填充
正睿科技  发布时间:2009-05-18 09:14:48  浏览数:2808

  伴随着的时钟“滴嗒”,英特尔著名的“Tick-Tock”开发模式也在今年走入了架构创新的Tock年,就在3月底,英特尔将如约推出广受业界瞩目的“Nehalem-EP”至强处理器,而作为至强新一代的产品,Nehalem-EP处理器在架构等方面的创新性改变让我们走入了更快、更高效、更节能的时代,而其必将推动X86服务器的发展,现在,而Nehalem与其前辈相比究竟有多大的改变呢?现在,就让我们一起来看看它那些引人注目的亮点吧。

Nehalem
英特尔著名的“Tick-Tock”开发模式

  1、真正的原生四核设计

  四核的真伪在Intel上一代的Penryn架构的四核“Harpertown”至强5400时代和AMD的“巴塞罗那”Opteron之间曾引起了一场争论,当时由于技术以及保证良品率等诸多原因Intel的四核产品采用的是将两颗双核芯片封装在一个CPU种的做法,这也被业界诟病为“胶水四核”。

Nehalem
"Penryn"架构的四核至强

  “胶水四核”最大的缺点就是由于单颗CPU中的两个双核芯片耦合度较低而造成的协作方面的困难。由于单颗CPU中的两个双核芯片之间没有直接的通讯通道,当二者需要协作时就需要通过北桥等第三方进行中专,这无疑会造成较长的时间延迟而导致效率降低,这也是“胶水四核”为业界诟病的最主要原因。

Nehalem
"Nehalem"架构的四核至强

  而在Nehalem-EP 至强5500系列发布之后这样的问题就不复存在了,Nehalem架构的至强处理器采用的是原生四核设计,即四个核心位于同一个芯片上,这样一来协作困难的问题就迎刃而解,同时在功耗的控制上也更加容易,Intel此次推出的Nehalem-EP 至强5500系列处理器就采用了自动化能源控制技术,每个核心都可以方便地进行控制,效率更高。

  2、集成内存控制器 数据读取更高效

  将内存控制器集成在处理器中并不是Nehalem的首创,早在2003年AMD发布的K8架构的处理器就采用了这样的设计,这在以前也是AMD的处理器于Intel处理器的重要区别之一,不过这样的情况在Nehalem架构的产品发布之后就会不同了。

  内存控制器,英文名:Memory Controller,顾名思义,内存控制单元,它是计算机系统中控制内存并且控制内存与CPU之间交换数据的重要组成部分。内存控制器决定了计算机系统所能使用的内存容量、内存类型和速度、内存数据宽度等等重要参数,因而也的决定了计算机系统的内存系统,从而也对计算机系统的整体性能产生较大影响。在传统的计算机系统中,由于中央处理器处理数据的速度很快,但是硬盘受限于自身的物理结构,速度相对较慢,要解决这个问题,于是就产生了内存。处理器要处理数据,先是将硬盘中的数据读写暂存到内存里面,然后由处理器在内存中将数据进行处理,这样大大的提高了计算机系统的速度。

Nehalem
集成内存控制器的设计可以使处理器更快地读取外部数据

  在过去Intel处理器的架构中,内存控制器并不是放置在处理器中,而是被安排在主板北桥芯片中,要处理的数据都是暂存与内存之中,CPU要处理数据的时候,都是先在内存中查找,如果没有的话,才会在硬盘中提取,因此这一共骤需要5个过程 “处理器--北桥--内存--北桥—处理器”,这样的安排与AMD直接省去北桥的方案相比无疑会造成更多的延迟。为了解决这个问题,Intel引入了FBD全缓冲内存技术,FBD内存与传统内存最大的区别就在与其在内存条中间加了一块高级内存缓冲(AMB)芯片,该芯片的出现使得内存控制器不在需要和每个DRAM芯片进行数据交换,通过预读等操作能够有效提高内存数据的读取速度。但FBD有一个致命的缺陷就在于其能耗方面的表现比较糟糕,这与当今“绿色IT”风潮背道而驰,而由于FBD内存使用的是串行信号传输方式,也容易在成第一条内存发热高的问题,散热的不均匀性也会为系统设计带来不便。于是,Intel在最新的Nehalem架构中舍弃了该技术。

Nehalem
"Nehalem"双路四核至强芯片示意
 

     在全新的Nehalem架构中,Intel将内存控制器直接集成在了处理器芯片中,这样处理器在提取内存数据时的步骤就变成了“处理器--内存—处理器”,省去了对北桥的访问,而北桥芯片在新的平台中也蜕化成了I/O控制器,更少的访问步骤换来了更快的数据读取速度,而且新的Nehalem架构至强处理器集成的是DDR3内存控制器,较之以前的平台,大大提高了带宽(使用DDR3-1333可以达到32GB/s的峰值带宽,较之以前的平台具有四到六倍的带宽提升),显著地降低了内存延迟,从而提升了性能,为每个CPU提供了访问本地内存资源的快速通道。与前一代平台不同的是,每个CPU直接提供DDR3的3个内存通道,每个通道支持2-4条内存,所以最大支持到每个CPU接口96GB的DDR3内存容量,将来最大容量可以达到144GB,为高端的企业运算提供了强有力的内存支持。

  不过在处理器中集成内存控制器也不是没有坏处,其中显著的缺点就在于降低了内存选用时的灵活性,比如最新的推出的Nehalem-EP至强5500系列处理器只能与DDR3内存配合使用,而不能像过去那样只要改变北桥就可以在不同种类的内存之间进行选择,比如过去P45芯片组即可以支持DDR2也可以支持DDR3。

  3、QPI总线 轻松实现点对点连接

  一直以来,FSB频率就是Intel处理器的一项重要参数,它决定了处理器的I/O速率,不过从Nehalem开始,这项参数也要走入历史了,取而代之的是全新的QPI总线。

Nehalem
双路服务器QPI连接示意图

  QPI总线也是最新的Nehalem架构与Intel原有架构的重要区别之处,同样在AMD的产品中我们也能找到类似的技术,但Intel的QPI总线传输速率明显要更高一些。

Nehalem
多路服务器QPI连接示意图

  在Intel以往的架构当中,双路以及多路系统中不同的处理器之间信息交互都要通过FSB总线至北桥芯片进行中转,而且FSB总线还承担了内存信息到处理器的数据I/O功能,但是在全新的Nehalem架构中,内存控制器的引入使得系统不再需要通过北桥进行处理器与内存的信息交互,而QPI的设计也使得多路处理器之间的信息交互变成了更高效的点对点方式,如此一来,传统的北桥已经蜕化成了I/O控制器。

Nehalem
不同的处理器QPI总线的规格也不同

  QPI是基于数据包传输,高带宽低延迟的点到点传输技术,速度可以最高达到6.4GT/s,而根据处理器规格的不同,Intel也把QPI速率分为3种,低端的E5506和E5504 QPI速率为4.8GT/S,中端的E5502、E5530、E5540 QPI速率为5.86GT/S,高端的X5550、X5560、X5570也拥有最高的6.4GT/s的QPI总线。

  4、超线程技术 充分发挥计算潜能

  Intel Hyper-Threading Technology(英特尔超线程技术)同样不是Nehalem架构的首创,在Intel前几代的Pentium 4产品中我们就曾经看到过该技术的应用,此次Nehalem架构的设计团队与Pentium 4相同,同为俄勒冈州的Hillsboro研发中心,因此我们也不难理解该技术的回归,而在Nehalem前一代的至强处理器由于采用的是脱胎于移动平台的酷睿架构,二该架构是没有超线程技术。

Nehalem
Intel Hyper-Threading Technology(英特尔超线程技术)
 

  超线程技术此次回归并不是简单的新瓶装旧酒,Nehalem全新的架构设计,大容量的缓存等等优势使得超线程所起到的作用也远不是以往的Pentium 4所能同日而语的。Hyper-Threading Technology此前曾经被Intel使用过一个更加专业化的名词叫SMT(Simultaneous Multi-Threading),中文名称为并发多线程技术,其最大的优点就在于能够充分地发挥每个核心运算潜能,这从下面的示意图就能够很清楚地看到。大家都知道,增加运算单元是提高处理器运算能力的有效方法,这也就是为什么现在的处理器内核数量不断增加由但到双再到四核以及八核的原因,但是添加运算单元的数量需要在一个芯片上增加大规模的电路,对于生产工艺和成本的造成了很大的压力,但超线程技术却不然,虽然不能像增加内核那样成倍地提高运算性能,但其有点在于只需增加很少的电路就能够使处理器一次完成更多的指令,使得处理器的性能优10%-30%的提高。

  5、自动超频加功耗管理 平衡性能与效能

  Nehalem处理器在芯片内部设计有PCU(功耗控制单元)电路,其作用就在于监控处理器的温度、电流、功耗情况,对每一个核心进行相应的控制。同时,Nehalem处理器还设计有一个Turbo模式,在该模式下,处理器会通过PCU对当前的运行状态进行判断,在不超过热设计功耗(TDP)的情况下对处理器进行2级超频功能,从原来频率基础上,增加2个133M的频率,从而获得更好的运算性能。

Nehalem
自动超频功能

  这样设计的最大好处就在于能够很好地平衡性能与效能的要求,这与当前“绿色IT”的要求非常契合。在处理器的运行中,PCU单元可以对每个内核进行精确的电源调节,当期发现有内核处于空闲状态时可以将其关闭从而降低处理器的能耗,这也就是新一代的Xeon 5500系列能够比上一代的Xeon 5400系列的空闲能耗下降30%以上的原因。

Nehalem
Nehalem处理器会自动关闭闲置核心

  而通过PCU的帮助,Nehalem处理器还可以实现Turbo Boost运行模式下的自动超频,就像下图所示的那样,只要不超过处理器的TDP限制,系统会自动使内核在更高的频率下运行,系统也可以关闭闲置的内核从而将每一点能耗都供给其他内核使用,不造成一点浪费,而且Nehalem处理器的状态切换非常迅速,只需要2微秒左右。

Nehalem
不是所有的Nehalem至强都有自动超频功能

  不过,并不是所有的XEON都会支持这个功能,例如面对低端市场的XEON 5502和XEON5504,这两个型号的CPU,也将会有可能只有2个核心的版本,共享了4M二级缓存,也不支持超线程技术,从这方面来看,intel把改省的都省下了,呵呵。从中端的XEON E5506,到XEON E5540都支持了Turbo Boost。不同的是高功耗版本的XEON X5550,功耗达到了95W,它可以在使用2个核心的情况下,实现3级超频功能,也就是133M×3。例如XEON X5570本来频率是2.93G,如果四个核心同时使用,那么每个核心可以自动超频到3.2G;如果只使用了2个核心,那么这2个核心可以自动超频到3.33G运行。

  6、增强的SSE4.2指令集和虚拟化功能

  SSE指令集是1999年Inter公司在Pentium III CPU产品中推出了数据流单指令序列扩展指令,它兼容早先的MMX指令,可以通过SIMD(单指令多数据技术)和单时钟周期并行处理多个浮点来有效地提高浮点运算速度。而SSE指令集随着Intel处理器的发展也经过了不断的扩充,此次随Nehalem亮相的已经是SSE4.2版本。

  SE4指令集被认为是2001年以来Intel最重要的指令集扩展,包含54条指令。 Intel在Penryn处理器中加入了对SSE4.1的支持,共增加了47条新指令,提升了处理器在图形、3D图像与游戏、视频编码与影音处理等方面的性能表现。本次在Nehalem处理器中,进一步支持了SSE4.2指令集。SSE4.2完整的实现了SSE4指令集,相对于SSE4.1加入了7条新指令。

Nehalem
增强的SSE4.2指令集

  SSE4.2新加入的几条新指令有两类。第一类是字符串与文本新指令STTNI,STTNI包含了四条具体的指令。STTNI指令可以对两个16位的数据进行匹配操作,以加速在XML分析方面的性能。据Intel表示,新指令可以在XML分析方面取得3.8倍的性能提升。第二类指令是面向应用的加速指令ATA。ATA包括冗余校验的CRC32指令、计算源操作数中非0位个数的POPCNT指令,以及对于打包的64位算术运算的SIMD指令。CRC32指令可以取代上层数据协议中经常用到的循环冗余校验,据Intel表示其加速比可以达到6.5~18.6倍;POPCNT用于提高在DNA基因配对、声音识别等包含大数据集中进行模式识别和搜索等操作的应用程序性能。 Intel也公布了支持新指令集的开发工具。这些工具涵盖了主流的编译开发环境。目前已明确支持SSE4.2的开发环境包括:Intel C++ Compiler 10.X、微软的Visual Studio 2008 VC++、GCC 4.3.1、Sun Studio Express等。

  除此之外,Nehalem架构的至强处理器还强化了在服务器虚拟化方面的性能。

  服务器的虚拟化由于能够对服务器实施有效的整合,节约预算、能耗等诸多优势而倍业内普遍认为是服务器技术发展的必然趋势,而服务器的虚拟化并不是只有软件所能够达成的,硬件的支持对虚拟机的运行效率稳定性等诸多方面也有着莫大的关系,因此Intel早在前几代的Xeon至强处理器中就采用了Intel VT-x技术来辅助实现虚拟化任务优先权配置和虚拟机的迁移,如今,在全新的Nehalm架构中,该技术再一次得到了强化,Nehalem架构的至强处理器新添了EPT与VPID两个部分。

  EPT的全称是Extended Page Tables即扩展表页,其作用在于通过硬件来实现虚拟机内存地址与物理地址的转换,有效减少了以往通过软件实现该功能带来的时间延迟,并且由于是硬件实现,可靠性也更高。而VPID的全称是Virtual Processor IDs,翻译成中文名叫虚拟处理器,它的引入省去了虚拟机在迁移或者进入退出时系统对TLB(页表缓冲)的转存与擦除操作,这也会省去不少的开销,从而提高服务器的性能。

  从上面的分析我们不难看出,全新的Nehalem至强处理器无在运算性能、功耗控制等诸多方面都比前一代的Penryn架构处理器有了很大的提升,他打破了以往处理器升级只是简单地主频的提升和核心数量增加的定律,在注重性能的同时也采用了诸多设计实现效能方面的平衡,相信这款产品在X86服务器处理器的发展史上一定会成为里程碑式的作品。

  • 正睿合作伙伴
  • 社区
首页 | 注册 | 网站地图 | 通告 | 联系我们
CopyRight(C)2004-2022 Chongqing Zhengrui Technology Co.,Ltd. All rights reserved.
重庆正睿科技有限公司(C)版权所有 未经书面授权 不得转载、复制或建立镜像
渝ICP备11002339号-1  渝公网安备 50010702500475号