英特尔日前宣布,将在2010年推出针对高效能运算(HPC)优化的Nehalem-EX处理器──据称这款6核心版本芯片执行频率比Nehalem-EX的8核心版本快。至此,加上AMD的Magny-Cours和IBM的Power 7,明年初不出意外的话我们就能见到6核、8核、12核等五花八门的服务器芯片新品。当然,CPU的性能不能只看内核的数量,内存、I/O等方面的性能才更为重要。在我们期待着这三个处理器架构下凡的时候,我们不妨先来看看它们各自的技术分析。
英特尔Nehalem-EX
将于今年底前推出Ct技术的测试版(Betaprogram),2010年还将推出针对高效能运算(HPC)优化的Nehalem-EX处理器──据称这款6核心版本芯片执行频率比Nehalem-EX的8核心版本快。
预计明年上半年问世的6核心版本Nehalem-EX芯片将能让客户享有更大的内存带宽和容量,有助于打造新一代超集计算机──256颗此类芯片可用于建置超集计算机,而一个超级计算机丛集将可包括多台内含此处理器的计算机。
AMD Magny-Cours
Magny-Cours的12核心处理器的微架构设计,将采用 Multi-Chip Package 技术,把两颗六核心封装在同一颗处理器上,同时将改良内存技术减低内存延迟的出现。
Magny-Cours 将会采用 45nm 制程,它是由两颗六核心 Istanbul 所组成,并透过Multi-Chip Package 技术封装在同一颗处理器上。
多个核心封装拼接的情况同Intel Core 2 Quad类似,但不同的是Magny-Cours的两颗核心是采用Hyper-Transport 3.0通讯协议直接联系,而不需要像 Intel 采用 FSB 技术,中间通过北桥芯片大幅增加延迟值降低了效率。
由于制程的进步,让单一Socket 可支持 12 核心,因此现有的 4 Way 系列将可以提供 48 核心的强大运算能力,在同一体积下运算能力将大幅提升一倍。
微架构设计方面, Magny-Cours 仍基于现有的 K10 微架构,每一个 Die 拥有六颗核心,每颗核心拥有 512KB L2 Cache,并共享 6MB L3 Cache ,再透过 Hyper-Transport Ports 连接另一颗核心。
此外,Magny-Cours 支持 HT Assist 技术,处理器的内存寻址数据可存于 L3 Cache 中,约占 1MB 内存空间,储存内存系统的寻址数据,此举将减少内存系统所出现的延迟,由120ns 减少至只有50ns,但 L3 Cache 容量减少将可能减低命中率,不过,Pat Conway 表示HT Assist 对命中率并不明显。
最后,Pat Conway 透露将在 Opteron 处理器中加入类似 Intel Hyper-Threading 的技术,但效果将进一步被强化,相信将会在下一代微架构Bulldozer“推土机”中出现。他并没有透露有关其多线程能力和更多的细节,不过AMD的做法和Intel的HT是不同的,类似Sun的同步多线程功能,1个物理核心扩展到4个线程。
IBM Power7
Power7处理器将有四核心、六核心、八核心等不同版本,最多会集成12亿个晶体管,内部互联采用混合环线(Ring)和交叉开关(CrossBar)方式,但具体细节没有披露,而且具体频率也未公布,不过功耗与当前的Power6保持在同一水平(100-190W)。
Power7的每个核心拥有12个执行单元,包括ISU、DFU、FXU、VSX FPU、IFU、CRU/BRU、LSU等等,同时每个核心都支持四线程,也就是总计最多32个线程,同时该处理器支持最多32路并行,那就是1024个线程。
Power7处理器每个核心均搭配256KB二级缓存,共享32MB eDRAM三级缓存,同时还集成了两个四通道DDR3内存控制器,持续内存带宽100GB/s,SMP带宽360GB/s,整个芯片总带宽高达590GB/s。