新架构新工艺 32nm时代I/A产品技术谈

正睿科技发布时间：2010-07-23 09:30:25 浏览数：2430

时间过的可真快，一眨眼的功夫2010年已经过去一半的时间了。在这上半年里，两家芯片巨头除了拿出了一些新工艺以及六核等概念性产品之外，就再也没有什么可值得称赞的东西了。这是为何？为何两家芯片巨头都不在上半年发力？答案很简单，那就是她们不约而同的正在着手32nm工艺的下一代架构产品，我们暂且称之为融合架构。当然，很多读者朋友对I/A的融合架构还不甚了解，所以我们今天的选题便是为大家详细介绍I/A两家的融合架构。

　　针对融合架构，我们首先要从双方的共同点入手。既然说了是融合，那么就需要解释到底什么是融合。读者朋友也许应该了解，在现在市场中销售的酷睿i5/i3处理器中有一部分是带有整合IGP芯片的，它们的出现首次将本属于主板的IGP整合进了CPU当中，令CPU也拥有了视频输出的功能。需要向您指出的是，这些个处理器仅仅是简单的将两个芯片封装在了一个基板上而已。而融合恰巧在使用的过程中与这些简单封装的产品有些类似，不同的是已经不在是简单的两个芯片的封装，而是将CPU和IGP完全整合进了一个芯片当中,这一全新的设计便是融合技术。

新架构新工艺 32nm时代I/A产品技术谈
Intel Sy Bridge是融合技术的代表

　　融合处理器的代表分别是Intel一派的Sy Bridge和AMD的APU（主要为Lynx平台，高端的Bulldozer为非整合芯片）。它们都无一例外的将IPG芯片融入进了CPU Die中，并且采用了当前最先进的32nm工艺制造。据Intel与AMD的技术介绍。之所以迅速的推出这类融合芯片，其主要目的就是为了对抗已经渐入主流趋势的GPGPU通用计算。要知道在这方面NVIDIA走的比两家CPU巨头远很多，而且更有发言权。更何况庞大的市场份额已经被NVIDIA占去了不少。眼看大笔大笔的钞票被一家独占可不是Intel和AMD想看到的事情。

新架构新工艺 32nm时代I/A产品技术谈
NVIDIA Tesla是专为通用计算开发的产品

　　前边说了，I/A两家都在开发融合处理器，那到底是谁先提出来的呢？据笔者了解，在概念的提出上AMD要快了Intel一步，准确的说是提前了3年。不过成品上倒是Intel抢先了一步，这也一如既往的与之前的新技术产品发布情况一样。至于那时的AMD是否想到了GPGPU通用计算这一概念我们目前已经无从考证，反正现在来其目的是这样的。

新架构新工艺 32nm时代I/A产品技术谈
当年AMD提出融聚计划的时候不知道有没有想到GPGPU

　　好了，说到这里基本上已经讲完了Intel与AMD下一代融合处理器的共同点。接下来我们就从技术层面着手为您介绍Intel与AMD两家融合处理器到底都有哪些不同。想必接下来的部分也是您最想看的，同时也是本篇文章的重中之重

Sy Bridge是Intel最新开发的产品架构，其目的是用于接替当前市场中的Nehalem架构以及Core架构两代产品。Sy Bridge不仅采用了最新的32nm工艺制程引入了融合技术，还针对密集型浮点运算增添了“高级矢量扩展”指令集，简称“AVE”(Advanced Vectors Extensions)。

新架构新工艺 32nm时代I/A产品技术谈
Intel官方路线图中队Sy Bridge的介绍

　　其实关于Sy Bridge的整合显示核心方面的技术介绍还比较少，可能是Intel对GPU的性能还比较保守的原因，毕竟三家芯片巨头中Intel在显示芯片上的成绩不如另外两家。但据Intel在IDF上和computex上对Sy Bridge显示核心的演示来看，其性能运行一般的DX10游戏已经不成问题。至于IGP芯片能否帮助CPU进行通用计算目前还未有官方资料可以证明。不过笔者倒是从Intel技术人员那里了解到了一些内容，有可能Sy Bridge加入了GPGPU的技术应用。

新架构新工艺 32nm时代I/A产品技术谈
Sy Bridge核心曝光照

　　据官方资料，Sy Bridge将采用Intel第二代32nm HKMG工艺制造，将会有双核心，四核心版本和八核心版本三种（关于八核心的详细资料Intel官方还没有提供更多的消息）。其中四核心低端版本为LGA1155封装接口，四核心高端版本和八核心版本采用LGA2011封装接口。四核心一级缓存为8路关联256KB，二级缓存8路关联4×256KB，三级缓存12路关联8MB，整合Intel第六代图形核心，支持超线程技术和AES-NI、AVX指令集，其中AES-NI新增七条指令，可加速数据加密和解密，AVX(高级矢量扩展)则针对密集型浮点运算，并协助一般用途和工程应用的加速。至于八核心版本处理器除了知道封装接口采用LGA2011和将搭配X68主板之外，我们能够再进一步了解到的消息就只有16MB的大容量三级缓存和最高的4通道内存这样的消息了。

新架构新工艺 32nm时代I/A产品技术谈
Sy Bridge所使用的32nm工艺

　　Sy Bridge所使用的32nm工艺与当前酷睿i3/i5/六核i7处理器并无差别，同样是基于第二代高-K金属栅级及第四代应变硅技术。当然由于该技术已经有了一年的使用时间，因此Sy Bridge所使用的32nm工艺将会更加成熟。性能功耗比也将会更高。

之前我们已经提到过，Sy Bridge将是第一个拥有高级矢量扩展指令集（Advanced Vector Extensions）的微架构。这种新的指令能够以256bit数据块的方式处理数据，以加快图像、视频和音频等应用程序的浮点计算。

新架构新工艺 32nm时代I/A产品技术谈
IDF上Intel对AVX指令集做出的解释

　　此外Sy Bridge增加了一个新的扩展指令集AVX。其目的非常明确，就是为了提高CPU的浮点运算能力。在Sy Bridge中，向量寄存器被提高到了256bit，比之前的128bit提高了很多，这样的做法正是为了AVX指令集读取256bit数据而设计。在更高的带宽以及新的扩展指令集帮助下，Sy Bridge的浮点运算能力应该能够得到数倍于前代产品的性能提升。如果再加上IGP芯片的帮助，Sy Bridge在游戏性能的表现方面应该是显而易见的。当然了，后者能否参与运算目前还没有得到Intel的官方证实。

新架构新工艺 32nm时代I/A产品技术谈
LGA1155接口与LGA1156接口对比图

　　至于Sy Bridge的接口方面，想必已经有很多读者了解到了。没错，据Intel官方介绍，在Sy Bridge架构产品正式发布时，将会启用全新的LGA 1155（H2）接口，而老一些的LGA 1156（H1）接口已经不能再兼容Sy Bridge架构处理器。也许您作为消费者要对Intel进行一番谩骂，毕竟LGA1156的升级扩展能力被Intel全面剥夺，但且看一看官方为您给出的LGA1155针脚定义再骂也不迟。

新架构新工艺 32nm时代I/A产品技术谈
LGA1156与LGA1155对比设计图

LGA1156、LGA1155电源层布局图

　　上边两幅图为LGA1155与LGA1156接口针脚定义对比图，LGA 1155相比目前的LGA 1156接口将减少1个触点；除了在触点数量上的变化外，两种处理器边上的凹槽位置也并不一致，LGA 1155的为11.5mm而LGA 1156的为9mm，内部方面，LGA1155也相对LGA1156接口进行了电源层的调整，因此老的Clarkdale系列产品已经完全不能够得到LGA1155接口的支持了。

到这里也该说一说有关Sy Bridge的详细参数了。很感谢Intel在前不久放出了Sy Bridge的参数，型号等详细资料。在这一点AMD则做的不够好。目前我们已知的Sy Bridge处理器将会继续沿用酷睿i3/i5/i7这一命名方式。不过其数字部分已经提高到了4位。

新架构新工艺 32nm时代I/A产品技术谈
Sy Bridge处理器的命名

　　目前我们已知的第一批即将发布的Sy Bridge架构处理器将涵盖酷睿i7/i5/i3这三个级别的产品。其中酷睿i7处理器为四核设计，8MB三级缓存，支持超线程技术。酷睿i5依然为四核心设计，不过三级缓存被砍到了6MB，也支持超线程技术。最后的酷睿i3处理器采用是双核心设计，支持超线程技术，三级缓存进一步缩减为3MB。据了解Sy Bridge将继续支持睿频加速技术，TDP将被控制在95W以下。下表为最新Sy Bridge处理器的型号及其参数：

型号	主频	核心	线程	三级缓存
Core i3-2100	3.1GHz	2	4	3MB
Core i3-2120	3.3GHz	2	4	3MB
Core i5-2400	3.1GHz	4	4	6MB
Core i5-2500	3.3GHz	4	4	6MB
Core i7-2600	3.4GHz	4	8	8MB

　　介绍了Sy Bridge处理器自然不能不介绍支持它的主板。据了解，支持Sy Bridge处理器的主板型号一共有两种，分别对应LGA2011接口和LGA1155接口。其中对应LGA2011接口的主板为X68，定位于高端。据悉该主板已经为单芯片设计，最高支持4通道内存，DDR3规格升级至1600MHz。至于最新PCIe3.0规格由于技术方面的原因很有可能将不会出现在这一平台当中，这多少令高端用户有些失望。

新架构新工艺 32nm时代I/A产品技术谈
computex上曝光的P67主板

　　定位主流级别的产品有P67，H67和H61三款产品，P67和H67芯片主板均可原生支持SATA 6Gbps接口，USB 3.0接口因技术原因我们还无法看到。此外提供14个USB 2.0接口，而H61芯片主板则不支持SATA 6Gbps，且USB 2.0接口也缩减至10个；另外，主板PCH与CPU的DMI Link将采用4x PCIe2.0。除了P67外其余的6系列芯片均可支持Blu-ray Audio/Video输出保护功能；P67芯片主板与目前的P55一样不具备视频输出接口，不过会特别加入“Performance Tunning”功能，但暂时还不清楚该功能的具体作用。

新架构新工艺 32nm时代I/A产品技术谈
Sy Bridge处理器的上市时间被定在了2011年

　　至于Sy Bridge处理器的上市时间，虽然Intel并没有为我们提供具体的时间，但Roadmap已经为我们给出了大概的答案，那就是2011年的第一季度。只是我们现在还无法得知Sy Bridge在发布之后的售价如何。如果AMD的APU表现优秀的话，消费者还是有可能享受到低价产品的，但如果AMD的APU表现与当前产品无异。那留给消费者的恐怕又将会是悲剧的结局。

　相比Intel在Sy Bridge上的大作宣传，AMD却显得非常低调，这不禁让人有些担心APU又将会是一款悲剧式的产品。好在前不久computex上的一次实物展示为APU揭开了神秘面纱，也终于让广大的硬件爱好者们亲眼见到了AMD融合技术的实体产物。

新架构新工艺 32nm时代I/A产品技术谈
AMD APU晶圆首次公开亮相

　　关于APU的点子提出最早始于2006年年底，当时的Intel在IDF上向公众展示了拥有80个核心的处理器晶圆，引起业界的轰动，并称未来将集成成百上千个微核心。作为竞争对手的AMD，在刚刚收购ATi之后野心也迅速膨胀，并且对Intel的做法提出了质疑，认为单纯提升核心的数量并不是提高处理器性能的最好方法。着眼于未来高性能计算的需要，AMD提出了加速处理单元（Accelerated Processing Units）的概念。

新架构新工艺 32nm时代I/A产品技术谈
06年时AMD公布的APU计划架构图

　　APU，中文译为加速处理单元，是一种多核心芯片，它是集成了若干个CPU和其它专用处理器内核的集合。通过将CPU和不同种类的专用处理器内核进行组合搭配，就可以产生满足不同需求的APU产品，这有点类似于IBM Cell处理器架构中的协处理器。AMD本打算计划在2009年发布的Fusion处理器将是AMD在APU方向迈出的第一步。Fusion集成了GPU专用处理单元，将首先面向移动计算领域。AMD表示，未来还会加入更多种类的专用处理器内核，这些类Fusion处理器中的专用内核可以帮助CPU处理物理效果、音频/视频、甚至人工智能方面的应用。

新架构新工艺 32nm时代I/A产品技术谈
AMD在2007年对APU进行了调整，放弃了Fusion的命名更改为Swift

　　早先的APU计划并没有针对桌面级产品线，仅仅是针对于移动计算领域。目的是在低功耗和低成本的前提下提供图形解决方案。当时该计划的名称为Fusion，但随着计划的进行，一些新的概念不断的加入其中，Fusion一词也被放弃而转用了新的Swift这一命名方式。

新架构新工艺 32nm时代I/A产品技术谈
07年时AMD为APU的架构进行了更改

　　06年Fusion计划刚刚开始的时候，AMD宣称APU仅仅针对移动平台开发，并且不会为该核心的GPU部分提供过高的性能，也就是不会融入进高端显示核心。但在07年的时候，AMD似乎更为看好APU的发展前景，不仅宣布APU将进军桌面领域，还首次提出了要将高端显示核心整合进APU当中。工艺将采用当时最先进的45nm技术。当然，后来这一计划随着AMD的45nm工艺的停滞不前以及竞争对手新产品的成功而宣布作罢。而APU计划也一拖再拖进行了多次更改，恐怕AMD这次的冒进行为也是令她在近几年中一直被竞争对手打压的原因之一。

　在关于新产品规格等细节透露方面，AMD显然做得不如Intel那么透明公开，也许是受了之前计划推迟的影响有些信心不足的原因。但拜互联网所赐，从国外一些知名的IT网站上我们还是得到了一些关于APU的信息。不过从这些信息中来看，APU显得并没有多少新技术的应用，反而让人有些质疑AMD是否对新APU进行了大范围的重新设计。

新架构新工艺 32nm时代I/A产品技术谈
AMD展示APU所采用的32nm晶圆

　　目前已知的关于APU的消息是它将采用全新的32nm工艺，这一点在AMD方面倒是一个新的技术应用，它的出现肯定会帮助新处理器在晶体管数量上有很大的帮助，同时对性能的提高和功耗的控制也有一定帮助。但在APU的参数细节上则显得有些让人失望。据了解，代号Llano的APU处理器将采用四核心设计，全部四颗核心与当前的Phenom II级别的x86处理器并无差异，这也就是说CPU部分的性能并不会比当前的Phenom II提高多少。显示部分将整合HD5000系列流处理单元，流处理器的数量为480个（另一说法为200个）。如果流处理器数量真为480个的话推测其性能与HD5000系列低端独立显卡差别不大。

新架构新工艺 32nm时代I/A产品技术谈
老版本的HD5670显示核心

　　关于APU的显示性能应该还是值得称赞的，如果真的是拥有480个流处理器的话，那么它的性能应该足以与老版本400个流处理器的HD5670有一拼。为什么这样讲呢？首先APU虽然在工艺上有了进步，但考虑到没有配备高速显存的前提下，显示核心的性能必然会受到一定的影响，此外，为保证APU整体的功耗不会偏高，所以GPU部分的频率也不能太高。由此推测其性能应该与400个流处理器的HD5670相当。有可能还会偏弱一些。但如果真的是200个流处理器的话，那么APU的性能与低端独显相比还是要差上不少。

新架构新工艺 32nm时代I/A产品技术谈
APU核心照片

　　从以上的参数来看，APU处理器只不过是采用了32nm制程新工艺整合了Phenom II处理器核心，HD5000系列独立显卡核心的产物。与当前的酷睿i3处理器相比可能好处就是将IGP方面的性能进行了提升，且将它和CPU部分做在了一个芯片上而已，实在是谈不上有什么高新技术可言，而且也严重违背了AMD自己在06年时候所提出的新概念。换句话讲，APU也只能是给低端用户使用取代整合主板而已，与前代产品相比，如果功耗控制不好，不但得不到性能的提升，反而还会出现性能的下降，让用户得不偿失。当然了，这一切现在还只是推测，具体的详细情况还要等到APU正式投产之后我们才能知晓。更何况关于GPU参与通用计算的部分目前AMD还只字未提。

　在标题中我们写到，32nm时代I/A产品技术谈，因此我们的文章就不能仅限于整合架构处理器。毕竟人家AMD方面还有一款定位高端的独立非整合架构??“Bulldozer”推土机。拜AMD所赐，推土机架构的参数细节要比之前的APU透露的多了一些，也许是定位高端底气较足的原因吧，其实笔者也非常看好“Bulldozer”推土机架构，它最大的魅力在于使用了一个全新的技术设计，“逆向超线程技术”。细节在哪？咱们往下看。

新架构新工艺 32nm时代I/A产品技术谈
“Bulldozer”推土机架构独立核心示意图

　　对处理器技术较为了解的朋友应该会知道，Intel的Nehalem架构处理器重新引入了超线程技术，它可以实现单核心双线程任务。而AMD“Bulldozer”推土机架构则反其道而行之，将每两个核心捆绑在一块儿，称之为一个“推土机模块”(Bulldozer Module)，彼此共享预取和解码单元、浮点调度器(和两个128-bit FMAC乘法累加单元)、二级缓存，同时和其他核心共享三级缓存，但又有各自独立的执行管线、整数调度器和一级缓存，多线程执行能力将会更加强大、灵活。

新架构新工艺 32nm时代I/A产品技术谈
“Bulldozer”推土机架构双核心簇示意图

新架构新工艺 32nm时代I/A产品技术谈
“Bulldozer”推土机架构四核心簇示意图

　　据悉AMD已经有意推出基于“Bulldozer”推土机架构的更多核心产品。有可能将会是4核心、8核心甚至12核心处理器，目前“Bulldozer”推土机架构处理器已经成功流片，在今年年底左右既可以成功投产。如果生产顺利的话，“Bulldozer”推土机架构将在明年第一、或者第二季度即可与消费者见面。

新架构新工艺 32nm时代I/A产品技术谈
AMD展示Globalfoundries试产的32nm晶圆

　　遗憾的是，由于AMD已经将旗下全部的晶圆工厂售予他人，因此在生产工艺方面已经不能自己做主，相对于Intel来讲，我们能够了解到有关AMD生产工艺方面的信息也不够全面。目前已知的是AMD将会利用Globalfoundries工厂进行32nm工艺处理器的生产，所使用的工艺为32nm SOI以及high-k metal gate。

　说过了AMD的融合处理器，也说过了下一代高端的非融合处理器，恐怕很多读者朋友对这两种架构产品的详细参数和未来支持这两款产品的主板已经产生了浓厚的兴趣。不过在这里笔者要为大家泼盆冷水了。目前这两种产品虽然都已流片，但目前还尚无真正用于测试的产品出现，所以关于他们的参数还仅仅停留在官方介绍与硬件爱好者们的猜测。

新架构新工艺 32nm时代I/A产品技术谈
APU参数图表

　　AMD的APU产品分为移动平台和桌面平台两个版本，关于移动平台我们不在这里进行介绍。桌面平台我们已知的APU参数是之前已经提到的Phenom II核心即K10.5架构。此外APU还将支持DDR3 1866内存，采用32nm工艺制造还有TDP将在100W以下。由于处理器当中已经融入了显示部分，因此现有的针脚定义已经无法满足处理器的需要，所以现有的平台已经无法支持APU处理器，这对当前打算升级APU的用户来说是打击性的消息。

新架构新工艺 32nm时代I/A产品技术谈
AMD 09年底发布的Roadmap介绍了平台趋势

　　APU更换了新的平台，“Bulldozer”推土机也没有好到哪去。AMD在09年末的时候曾经发布了一次Roadmap，其中介绍了“Bulldozer”推土机架构的大致参数以及平台组成。新“Bulldozer”推土机架构将使用32nm制程，支持DDR3 1866内存，三级缓存容量为8MB，继续使用AM3接口平台，也就是说现有的平台将可以实现无缝式升级。但最新的一次消息介绍说，“Bulldozer”推土机架构将采用Socket AM3 r2接口，至于这多出来的r2是否与AM3有关系还不好说。但此消息对于广大的现有平台用户并非好事。希望这AM3 r2接口能够像当年的AM2/AM2+接口那样可以进行无缝升级。

新架构新工艺 32nm时代I/A产品技术谈
APU又跳票了

　　关于AMD两款产品的上市时间，估计很多网友已经猜到了，没错，就是不定！就在笔者撰写这篇文章的过程中，AMD又放出了APU因为技术和生产方面的原因再一次推迟发布的消息。从AMD第一次确定APU发布时间，到现在的再一次推迟发布，已经给用户留下了深刻的印象。所以即使AMD官方放出了确定的发布时间，几乎所有用户也会在这个时间点上打一个问号。就算是AMD拿出了成品，它的发布时间也依然飘忽不定，不要忘了羿龙II四核960T就是很好的例子（羿龙II四核960T因为发生破解成为六核已经被AMD无限期推迟发布）。

　　文章写到这里也该到了最后的收尾总结了。说真的，笔者进行到最后一步的时候真的有些诚惶诚恐。生怕因为说了任何一方不好的话遭到另一派粉丝的攻击。但出于对用户负责的心，笔者还是要硬着头皮写下去。首先说的是Intel的新一代架构Sy Bridge。

新架构新工艺 32nm时代I/A产品技术谈
Sy Bridge核心照片

　　Sy Bridge作为融合核心的典型产品，确实做到了CPU与GPU的真正融合，而且这融合还有相辅相成的意思。尤其是新架构针对浮点运算进行了深度优化，加入了最新的AVX扩展指令集，并且将向量寄存器提高到了256bit，使处理器的浮点运算能力得到了全面加强。此外32nm工艺的深度运用也可以令处理器在提高性能的同时降低功耗。从以上这些特性来讲，Sy Bridge是一款非常值得期待的产品。但即使这样Sy Bridge依然存在着很多的问题。

第一：显示核心部分性能令人质疑。

　　酷睿i3/i5处理器虽然CPU性能不俗，但自带的IGP性能一直被用户称为鸡肋。想必在Sy Bridge的IGP在没有做出突破性设计的前提下，即使提高核心频率，对显示性能的发挥也是非常有限。

第二：不能与现有接口通用。

　　不能与现有接口通用令正在使用LGA1156接口平台的用户升级成本大幅攀升。要知道LGA1156经过1年的普及，已经有不少用户进行了平台的转换。但Sy Bridge所使用的LGA1155让这些用户升级的美梦彻底破碎，要知道升级和扩展性是DIY的精髓所在，所以这也成为了Sy Bridge的最大诟病。

　　即使拥有以上两大问题，Sy Bridge依然可以算的上是一个极具概念性设计的处理器，至少笔者是这样看待它的。

　　接下来说一说AMD的下一代架构产品APU和Bulldozer”推土机架构

　　对AMD的APU笔者实在是没什么好感所言。毕竟在让人等待了5年之久并且经历了多次修改和跳票之后，我们所能看到的仅仅是一款定位中低端并且将上一代产品架构CPU和GPU的融合而已。虽然引入了32nm工艺，恐怕换来的只是一小部分的性能提升。至于功耗的控制，由于GPU的加入，反而到让笔者对AMD的官方数据的45W TDP产生了质疑。

新架构新工艺 32nm时代I/A产品技术谈
“Bulldozer”推土机架构独立核心示意图

　　“Bulldozer”推土机架构这一全新的设计让笔者眼前一亮，尤其是逆向性超线程技术的引入，让多核心参与单线程运算成为了可能。要知道在当前单线程任务为主的条件下，这样的设计无疑是突破性的，逆向性超线程技术可以充分利用处理器的各个核心资源，大幅提高单线程的运算性能。笔者估计最直接的表现就是未来在Super pi等这类单线程运算，或者是单线程游戏上性能提升了。

　　至于“Bulldozer”推土机架构的问题，笔者担心的还是生产工艺方面，要知道现在的Globalfoundries拥有者并非AMD，所以成产工艺的成败也就只能指望他人。如果在生产工艺环节上出了问题的话，造成的影响就不止是供货不足那么简单。很有可能造成处理器功耗过或者高性不济，要么干脆就是遍地都是可破解处理器。这样一来虽然便宜了消费者，但对AMD来讲无疑是沉重的打击。

　　综上所述，融合架构虽然设计前卫，但还仅仅停留在简单的CPU与GPU的叠加上，并没有完全做到芯片之间的相辅相成。所以要想真正意义上的看到CPU与GPU之间做到辅助运算，恐怕还需要几年的时间才能做到。当然，这期间的成本依然需要由消费者来付出。