高效能竞赛
当英特尔推出酷睿架构的时候,标志着处理器产业从追求高性能转向追求高效能。随着今年英特尔推出7400和Core i7,处理器的高效能指标也进入了新的阶段。
英特尔在去年发布7300系列处理器时,资料显示一颗至强7300处理器的典型功耗为80W,这较上一代至强7100的150W下降一半,所以,与英特尔前代双核至强MP产品相比,7300系列处理器的性能和性能功耗比分别提升了两倍和三倍之多。而到了今年9月,六核至强7400处理器发布,7400伴随着45纳米高k制程工艺,以及高k金属栅极技术重新设计的晶体管的采用,使其可以在更低的能耗下提供更为强劲的性能。在某些应用中,至强7400系列处理器平台能够在功耗降低10%的同时取得近50%的性能提升。此次英特尔发布的7400中,有三款是低功耗的版本,有一款的功耗甚至只有50瓦特。由于至强7400采用了45纳米制程工艺,使得其和上一代至强7300相比,性能提升了50%。同时,功耗反而降低了10%。
而11月发布的Nehalem架构的Core i7处理器,则又将能耗比戴上了新的台阶。其最先发布的7款处理器功耗包括130W、90W、65和50W。在Core i7的外核中集成了PCU单元,可以单独控制内核各个核心的频率、电压,并且还可以负责监控核心温度。据资料显示,在同等TDP的情况下,当少于四个核被同时激活时,酷睿i7消耗的电能比起之前一代的45纳米 Core 2减少了10-20%。而当所有的核都满负载运行时,Core i7则基本上消耗同样的电能。
在能耗控制方面,AMD和英特尔有着不同的理念。AMD上海处理器使用了更多的节能技术,如双重动态电源管理和独立动态核心技术等。其中较有特色的是双重动态电源管理,可以根据用户的策略在不同的应用方案面前进行能耗的平衡,以动态的方式找到最佳的节能方案。与上代皓龙处理器相比,“上海”在空载状态的能耗可以大幅降低35%,而性能可提高达35%。"上海"采用了众多的新型节能技术:AMD智能预取技术,可允许处理器核心在空载时进入"暂停"状态,而不会对应用性能和缓存中的数据有任何影响,从而显著降低能耗;AMD CoolCore技术能够关闭处理器中非工作区域以进一步节省能耗,现在这一技术被扩展应用到L3缓存中,可以相应地单独关闭L3缓存的非工作区域以节省能耗。
由外而内的变化
过去,英特尔处理器只能使用并行的前端总线通过北桥与外界交流,这种总线依然采用老旧的AGTL+信号技术。不但总线频率难以提高,同时也容易在多处理器场合引起处理器?北桥?内存的通路,由于信息传输过于繁忙而阻塞。更糟的是由于需要经过北桥访问内存,因此内存读写的延迟较大。
Core i7中则将处理器分为内核外核两部分,内核部分包含执行核心及其专属的一级、二级缓存,外核部分则包含共享式三级缓存、集成的内存控制器IMC、QPI接口以及功耗、频率控制部分。集成的内存控制器将直接与专署的内存交换数据,而由于北桥中不再含内存控制器,所以原来MCH(Memory Control Hub)的名称也改为IOH。而QPI接口则替代前端总线来与其它处理器和北桥进行连接。
由于采用内外核的模块式设计,因此可伸缩性十足,可以根据需要增减QPI的数量,比如台式机版本有1个QPI接口,而工作站、服务器的Bloomfield-EX核心则会有2个QPI接口。
另外,与上一代处理器有明显不同的地方,是在Core i7的缓存设计上。在上一代酷睿2处理器中,采用的是各个核心独享一级缓存,共享二级缓存的设计方案。而在Core i7上则改变为一、二级缓存独享,三级缓存共享的设计方案。
容量方面,独享的一级指令、数据缓存仍与酷睿2一样,为32/32 KB,读写延迟比酷睿2的3周期稍慢,约为4周期,不过Core i7更优秀的内存读写延迟可以较好地弥补;二级缓存部分,每个核心独享256KB容量,读写延迟约12周期。三级缓存部分则为共享式,容量8MB,读写延迟约30-40周期。
虽然都使用了三级共享式缓存,但与AMD的K10有所不同的是,Core i7的三级缓存采用inclusive(内含式)设计。也就是说在各个核心的一级、二级缓存中的数据,在三级缓存中都会进行保存。而AMD的K10则采用Mostly exclusive(非内含式)设计,一级、二级缓存中的数据并不常在三级缓存中进行备份。
硬件辅助虚拟化更上一层楼
从7300开始,英特尔就一直觊觎由Power和SPARC统治的高端服务器市场。而7400系列所具备的强劲性能、低能耗特性特等,让英特尔争夺高端市场的底气更足了一些。而这其中,被英特尔当作最厉害的武器的,就是虚拟化,英特尔力图将7400系列打造成满足虚拟化2.0需求的计算平台。
根据IDC的研究,从2005年开始持续至今的虚拟化热则可以被看作虚拟化的起步阶段。在这个阶段中,企业将计算资源的动态集中和共享作为实施虚拟化的主要任务,也就是虚拟化1.0。而从2007年开始,虚拟化技术已经发展到了一个新的阶段,这时虚拟化实施的重点已经转移到了灾备、迁移以及负载均衡上,也就是虚拟化2.0。而7400系列凭借更出色的性能,更优秀的功耗控制,更完善的硬件辅助虚拟化技术,以及高可靠性和可用性,为用户的灾备、负载均衡提供了更强大、稳定的平台。
除此之外,英特尔还在今年强化了Flex-Magretion虚拟化技术。这一技术虽然在在Penryn里就以及实现,但是英特尔在Core i7里得到了加强。相较于之前的英特尔VT技术,FlexMigration则更偏向传统对虚拟化技术的定义,这种技术可以让虚拟机上的应用在英特尔不同产品线的处理器上进行动态迁移,提高处理器使用率。Davis表示,FlexMigration系动态转移虚拟机到其他硬件。过去虽然VMWare的VMotion也能提供类似功能,但是过去VMotion只能虚拟化同一代的Xeon服务器;在Penryn内建的FlexMigration,则确保只要是采用Core Microarchitecture的Xeon处理器服务器,都能够跨代支持虚拟化功能。