其中,作为英特尔在2011年的创新---第二代英特尔® 酷睿™处理器,代号Sy Bridge的相关主题讲座将成为此次IDF的重头之一。届时,众多技术专家除了对Sy Bridge 架构、指令集增强特性以及核芯显卡的特性进行更为详尽的讲述。还会为在座的来宾讲解新架构在3D处理能力方面的关键性能提升以及全新英特尔图形性能分析器技术。与会嘉宾还将深入了解英特尔博锐技术架构以及第二代英特尔酷睿处理器中的媒体创新等更为贴近行业需求的相关技术。
关注PC产品的玩家或许会注意到,自Intel 09年发布了LynnField核心以来,主流桌面级别处理器便是45nm Core i5/i7的领地。尽管在入门级和发烧级方面,i3/i7 900系列的双核和六核心CPU产品都更新了32nm制程,就连服务器用的至强四核也更新了32nm制程,唯独主流桌面四核CPU依然只有45nm LynnField可以选择。
而随着Intel全新架构的32nm制程Sy Bridge处理器将全面上市,取代之前的CPU系列产品。其产品的特色之一就在于处理器提出一个新的理念“融合”。即将CPU和GPU集合起来。在核心代号为Clarkdale的32nm工艺i3/i5处理器中,Intel已经“做到”了。不过他们的解决方案是将一颗32nm制程的CPU核心和45nm的GPU核心封装在一起,而Sy Bridge则是32nm的CPU和GPU都在一块晶圆上。
除了广受关注的英特尔核芯显卡,睿频加速2.0技术依然备受期待。睿频加速2.0在核心概念并没有变化,而是加入更多功能特性。同样是运行多个任务,使用睿频加速2.0技术之后可以在满负载的情况下自动超频。从而更好的完成工作。
与上一代睿频加速1.0技术相比,睿频加速2.0技术的设计方向更多的针对多线程应用,不仅能够提供更高的多线程加速频率,而且调节机制更具弹性。当启动一个运行程序后,处理器会自动加速到合适的频率,而原来的运行速度会提升 10%?20% 以保证程序流畅运行;应对复杂应用时,处理器可自动提高运行主频以提速,轻松进行对性能要求更高的多任务处理;当进行工作任务切换时,如果只有内存和硬盘在进行主要的工作,处理器会立刻处于节电状态。这样既保证了能源的有效利用,又使程序速度大幅提升。
仔细分析不难发现,睿频加速2.0技术有以下特点:
一、真正意义上的智能核心,英特尔睿频加速2.0技术可根据应用负荷,实现微秒级应变。瞬息之间提升主频,迸发震撼动力,令性能全面突破;亦可随时减速至休眠,延长待机减少发热。
CPU会确定其当前工作功率、电流和温度是否已达到最高极限,如仍有多余空间,CPU会逐渐提高活动内核的频率,以进一步提高当前任务的处理速度,当程序只用到其中的某些核心时,CPU会自动关闭其它未使用的核心,睿频加速技术无需用户干预,自动实现。
二、睿频加速技术2.0版打破了加速状态下受制于TDP的局限性,不再简单地以TDP作为极限频率的考量,而是以温度为阈值,允许处理器短时 间地运行在超过TDP的状态,直至温度达到预设值才会降低频率。这就是Sy Bridge为什么能更长时间运行于高频状态的秘诀。
三、由于新一代电源平衡算法的引入,核芯显卡也能从睿频加速中受益。新算法允许处理器核心与核芯显卡之间拥有的动态平衡,当侦测到系统要求更强大的CPU运算性能或图形性能时,会将TDP资源暂时向其倾斜,以此在发热和功耗允许的范围内提供更大的超频空间。
Sy Bridge最大的亮点是引入了“高级矢量扩展”指令集,简称“AVX”,它的出现与经典的SSE多媒体指令集有着异曲同工的作用。而之所以可以添加更多的指令集,与核心面积、制作工艺的革新有着密不可分的关系。
以最小的核心面积为基础,Intel将所有SIMD单元都转向了256-bit。AVX支持256-bit操作数,能够很好地满足更高吞吐量的浮点引擎。Sy Bridge允许256-bit AVX指令借用128-bit的整数SIMD数据路径,这就使用最小的核心面积实现了双倍的浮点吞吐量,每个时钟可以进行两个256-bit AVX操作。Sy Bridge的峰值浮点性能翻了一番,这就对载入和存储单元提出了更高要求。Sy Bridge架构中载入和存储地址端口是对称的,都可以执行载入或者存储地址,载入带宽因此翻倍。 SNB的整数执行也有了改进,ADC指令吞吐量翻番,乘法运算可加速25%。
最终看来新指令集的加入让Sy Bridge处理器改进了性能,丰富了功能,可以提供更好的数据管理、组织能力。比如数码相片编辑、数字内容创作等等都可以体会到新指令集的妙用所在。
除了DIY市场,Sy Bridge平台在移动平台方面的影响也是意义深远。第二代智能处理器处理器采用第二代32nm工艺、第二代高K金属栅极(HKMG)技术制造,集成大约10亿个晶体管。CPU与GPU核心采用了合并设计,与目前主流的Clarkdale/Arrale处理器采用32nm处理器+45nm图形核心的双芯片封装方式完全不一样,而这也是第二代智能处理器最大的卖点之一。
除了直接整合GPU之外,内存控制器等单元依然被整合在了处理器之内。此次基于32纳米制程工艺的全新酷睿家族依然是按性能区分为酷睿i7、i5 和i3处理器系列,我们也收集到了一些处理器的基本情况,与上一代32nm处理器完全采用采用了成本更低的双核心结构,通过超线程技术来实现双核4线程的工作方式不同,此次的32nm产品序列中出现了四核心产品,由于目前发布的处理器产品均支持第二代的超线程技术,所以四核心的处理器产品也就同时具备了四核心八线程的处理能力。
新的处理器依然是为每个核心都配备256KB高速二级缓存,并且还集成DDR3内存控制器,然后按照产品级别的不同分别配以3-8MB不等的三级缓存(L3 Cache)。而在主频方面,酷睿i5-2520M处理器以2.5GHz起跳,经过睿频加速后可以达到最高3.2GHz的水平,而频率最高的i7-2920XM处理器起始频率可以达到2.5GHz,在睿频技术加速之后可以达到3.5GHz,与老版的原生四核心移动i7处理器相比,主频增幅更高,不管是睿频主频还是绝对主频都足够满足绝大部分用户对处理器主频、运算能力的需求了。
从目前SNB的产品分布来看,新的第二代智能英特尔酷睿处理器在绝对性能上已经超越老版的45nm酷睿i7处理器,而且凭借32nm制程工艺的先进,第二代智能英特尔酷睿处理器拥有着老版酷睿i7处理器所不能比拟的低功耗、低发热。
▲提升30% Intel第2代移动智能处理器评测
而且凭借着32nm制程工艺下提供原生四核心设计,全线产品支持超线程技术(截止目前)、CPU/GPU完全整合,全32nm工艺制程带来更低的功耗与发热量、GPU性能增强,移动版处理器图形核心拥有12个执行单元,性能比上一代HD集显提升2倍、第二代的睿频加速技术,可以达到更高的睿频加速主频,同时支持CPU/GPU性能动态调节、加入效率更高、功能更强大的AVX指令集等特色,其在整体性能方面都远远超过了目前主流的酷睿平台,这也让我们对未来的笔记本性能有了更高的期待。
英特尔酷睿处理器课程 | ||||
日期/时间 | 教室 | 课程摘要 | 主题 | 演讲者 |
04/12,14:05 |
学术报告厅 |
• Sy Bridge 架构概述 • 功耗和性能优势,包括下一代英特尔® 睿频加速技术 • 指令集增强特性,包括英特尔® 高级矢量扩展指令集(AVX) • Sy Bridge 的环形架构与共享高速缓存结构" |
第二代英特尔® 酷睿™ 微架构: 新的处理器创新成果 |
Opher Kahn Senior Principal Engineer, Sy Bridge Interconnect Integration Team, Intel Corporation |
04/12,16:10 |
307B |
• 与 2010 年英特尔® 核芯显卡相比,在3D处理能力方面的关键性能提升 • 介绍全新英特尔® 图形性能分析器(英特尔® GPA)第 4 版 • 使用 英特尔® GPA 来识别和减少英特尔® 酷睿™ 处理器图形处理的性能瓶颈 |
针对第二代英特尔® 酷睿™ 处理器图形处理功能优化您的游戏 |
Cage Lu Application Engineer, Intel Corporation Luis Gimenez Americas IT Innovation Research Manager, Intel Corporation |
04/13,13:00 |
308 |
• 深入了解英特尔® 博锐™ 技术架构 • 2011 平台新特性 • 云计算与英特尔博锐技术 • 桌面虚拟化与英特尔博锐技术 |
2011 英特尔® 酷睿™ 博锐™ 商用处理器系列概述 |
Matt Jung Product Marketing Engineer, Intel Corporation |
04/13,14:05 |
308 |
• 桌面虚拟化 • 云计算 • KVM 远程控制、IDE 重定向、局域网串行、电源控制部署考虑事项 • 基于主机的配置 • 英特尔® 防盗技术(英特尔® AT) |
技术深入探索: 全新 2011 英特尔® 酷睿™ 博锐™ 处理器系列 |
Matt Jung Product Marketing Engineer, Intel Corporation |
04/13,15:10 |
308 |
• 架构概述 • 媒体技术 • 软件堆栈与工具 |
第二代英特尔® 酷睿™ 处理器中的媒体创新 |
Hong Jiang Senior Principal Engineer, Intel Corporation |