处理器缓存大小会影响效能吗?

间隙填充
正睿科技  发布时间:2008-01-23 09:48:11  浏览数:2778

快取(缓存)大小有何影响?

具备 L2 快取 (不过并未整合在 CPU 内) 的第一款处理器是 1995 年的 Pentium Pro,它在裸晶上拥有 256 kB 或 512 kB 第二快取,因此较之高速缓存置于主机板上的一般 Pentium 处理器,前者具备重大效能优势。安装在 Slot 1 模块上的 Pentium II 推出时,专用高速缓存就内植在处理器上了。不过一直等到 Socket 370 脚位的第二代 Pentium III,高速缓存才真正放进处理器裸晶中。基于效能的理由,这个现象时至今日仍未改变,但某些处理器的快取较少,某些较多。那么值得把钱花在较多快取身上吗?在过去,额外快取并未造成效能上的重大差异。

虽然快取多寡的处理器之间,存在着可量测到的差别,但购买较小快取省钱的做法较为明智。但在 Core 2 Duo 之前并未有处理器型号会以三种快取大小的口味供货。

Pentium 4 第一代 (Willamette, 180 nm) 搭载 256 kB L2 快取,并在最叫座的第二代 (Northwood, 130 nm) 采用 512 kB。此时具备较少高速缓存的低价 Celeron ,是使用相同处理核心生产。Celeron 所代表的意义在于第一次出现了高阶与低价产品源于相同技术的情况,其间唯一差别在于可用快取大小与 FSB/核心时脉速度。后来产品又加入更多特色差异,以进一步区隔市场。

90-nm Prescott 核心推出时具备 1-MB 快取,它代表 Intel 桌上型处理器产品组合的骨干-直到 2-MB 快取、65-nm 的 Cedar Mill 核心接手。Intel 甚至还使用两个这颗核心,来建立第二代 Pentium D 900 系列。不过即使在当时,较快的时脉速度与快取大小并无太大意义。但情况已经改变,Core 2 Duo (Conroe, 65 nm) 的较佳效能与较低耗电都和快取大小习习相关。

对于增加快取大小的时机与方式,AMD 一向持谨慎的态度。推测起来,这可能是因为 AMD 当时的 65-nm 输出无法满足市场需求,而仍必须依赖经济利益较低的 90-nm 制程,所以硅晶上的空间更显得寸土寸金。在另一方面,Intel 拥有以 65-nm 生产所有主流处理器的优势,所以试图增加 L2 快取容量。以 45-nm Penryn 核心为基础的下一代 Core 2 将搭载最高达 6 MB L2 快取。这只是市场手段,抑或是 L2 快取容量的膨胀真能改善效能?让我们一起来找出答案。

大快取:效能或商业考量?

处理器中快取的唯一目的就是缓冲常用数据,以降低内存存取次数。虽然时下的主存储器通常在 512 MB 到 4 GB 之间,但快取大小则视处理器型号而定,在 256 kB 到 8 MB 之间。但即使是 256-kB 或 512-kB 的小容量快取,也足以带来我们已视为理所当然的实质效能增进。

建置快取分层性有几个方法。大多数 PC 系统安装了具备小小第一层快取 (L1,最多 128 kB) 的处理器;L1 通常划分为数据快取与指令快取,较大的 L2 快取通常用来储存内存数据,并由 Intel Core 2 CPU 的两个核心共享,而 Athlon 64 X2 或 Pentium D 则是每个核心拥有专用 L2 快取。L2 快取可以排他或包容方式运作,这代表它们可以储存一份 L1 的内容-或是不储存。AMD 不久将提供第三层快取技术,该公司会用来当做最多四核心的 AMD Phenom 处理器的共享高速缓存。Intel 2008 年的 Nehalem 处理器架构预计也有相同设计,它将取代 Core 2。

L1 快取一向都放在处理器上,而早期的 L2 芯片建置在主机板上,例如许多 486DX 或 Pentium 计算机。当时 L1 芯片内存是使用简单的 SRAM 芯片 (静态 RAM),后来则由管线式脉冲快取取而代之 (Pentium),直到芯片与裸晶内含快取技术成为可能。150 到 200 MHz 的 Pentium Pro 是第一款在 CPU 内装载 256-kB L2 快取的处理器,因此成为桌上型或工作站产品中体积最大的陶瓷封装产品。Socket 370 的 Pentium III (时脉速度在 500 MHz 到 1.13 GHz 之间) 是第一款在裸晶上搭载 256 kB L2 快取的处理器,这种设计的优点在于无延迟,而且快取是以 CPU 速度运作。

整合式 L2 快取可横跨几乎所有应用软件,大幅提升效能。效能方面的影响大到可以这样说:L2 快取是 x86 微处理器的最重要效能因素,关闭 L2 快取所降低的系统效能,大于关闭双核处理器中的第二个 CPU 核心。

然而高速缓存不仅是影响效能的因素,快取也成为针对低阶、主流与高阶市场打造不同处理器型号的强力工具,处理器厂商可藉以善用产品瑕疵率与时脉速度。无瑕疵硅晶可使用整个 L2 快取区,也可完美搭配高时脉速度。要是成品未能达到目标时脉速度,裸晶仍可成为高阶处理器的初阶型号,例如具有 4 MB 快取与较低时脉速度的 Core 2 Duo 6000 系列。要是 L2 快取出现瑕疵,制造厂商也可以选择遮蔽这个功能,并打造高速缓存较少的更低阶型号,例如具备 2-MB 快取的 Core 2 Duo E4000 系列,甚至是只有 1-MB 快取的 Pentium Dual Core。这种做法很合理,但根本问题在于:高速缓存大小到底能对效能产生多大的差异?

Core 2 Duo 的不同版本

Intel 在市场上推出了多样化的桌上型处理器,虽然目前仍可见某些 Pentium 4 与 Pentium D 处理器,但大多数产品都是以 Core 微架构打造。我们明确建议不要购买任何 Pentium 4 或 Pentium D-虽然它们高达 3.8 GHz 的时脉速度相当诱人。2.2 GHz 或以上速度的 Core 2 处理器即可打败最快的 Pentium D 型号 (Athlon 64 X2 也是),原因是 Core 2 提供较高的每时脉效能。请查阅我们的 CPU 比较表,以比较 Pentium D 与 Core 2 Duo 处理器及大多数的 AMD CPU。

拜 Core 2 的较低时脉速度水准之赐,它更具能源效率。Pentium D 800 顶级型号可能吃电高达 130 W,而 Core 2 只有 Core 2 Extreme 四核超出 100 W。所有双核处理器都额定 65 W 耗电。此外,Core 2 Duo 处理器的闲置耗电要求甚至更低,也得归因于闲置时降低的时脉速度 (Core 2 Duo/Quad 最低 1.2 GHz,而 Pentium D/4 处理器为 2.8 GHz)。降低漏电流的改良晶体管设计,也有助功耗降低。

现在 Intel 产品也出现 E 与 X 型号。E 代表主流处理器,而 X 代表 Extreme Edition。Q 代表四核-Intel 是将两个双核裸晶放到一个实体处理器封装里。E6000 若是型号大于 E6400,或拥有 -20 的结尾 (如 E6320),则拥有 4 MB L2 快取。以 -00 (例如 E6600) 结尾的型号是跑 266 MHz 系统时脉速度 (FSB1066),而 -50 型号 (E6750) 是指采用 333 MHz (FSB1333) 速度。后者需要搭配 P35 或 X38 芯片组,并提供稍高的效能。E4000 是跑 200 MHz 系统速度 (FSB800),并拥有 2 MB L2 快取。1 MB 版本是以 Pentium Dual Core E2140、E2160 与 E2180 的名称销售,时脉速度在 1.6 到 2.0 GHz 之间。除了名称及 Intel 针对低价型号关闭的某些功能外,这些 Pentium Dual Core 与 Core 2 Duo 处理器并无二致。



测试设定

效能测试与设定



效能测试结果

游戏效能测试

应用软件效能测试



音讯/视讯软件效能测试



综合软件效能测试



结论

虽然快取大小对于PCMark05 等综合效能测试的影响有限,但在大多数现实生活相关效能测试中的效能差异不小。乍看之下,这个结果令人意外,因为经验告诉我们效能差异通常可见于大多数综合效能测试中,但鲜少会最终反应在现实生活的效能测试中。

这里先回答本文标题的答案:是的,快取大小变得重要了-至少 Core 2 Duo 处理器世代如是。我们这次使用了 4-MB Core 2 Extreme X6800、2 MB Core 2 Duo E4400 与 Pentium Dual Core E2160 (实际上是只有 1 MB L2 快取的 Core 2 Duo)。所有处理器都是在 266-MHz 前侧总线 (FSB) 速度及 9 倍频 (成为 2400 MHz) 的相同测试系统上运作。但处理器的真正差别在于于快取大小上,因为除了旧 Pentium D 之外的所有 Intel 双核处理器都是相同设计。良率与市场需求是 Intel 决定将裸晶标成 Core 2 Extreme Edition 或 Pentium Dual Core 的因素。

如果比较《猎魂》与《雷神之锤 4》等 3D 射击游戏的效能测试及我们 CPU 比较表中的典型游戏效能测试,1 MB 与 4 MB L2 快取之间的效能差异,大约等于一个时脉速度级距。相同结果也适用于 DivX 6.6 与 XviD 1.1.2 编码/译码器的转码效能测试及使用 WinRAR 3.7 进行的档案压缩。3DStudio Max 8、Lame MP3 Encoder 或 MainConcept 的 H.264 Encoder V2 等 CPU 密集的效能测试,则无法从较大的快取获得重大裨益。

不过 Intel 善用硅芯片 (由于裸晶从 65 nm 缩小为 45nm 所腾出的空间) 的概念,对 Core 2 Duo 架构而言相当合理。广为人知的事实是 L2 快取具有相当效率-尤其是当它由两个处理器核心所共享时。因此快取可以弥补不同内存速度的影响,并避免前侧总线的瓶颈,快取扮演的这个角色相当尽责,我们可见只有 1 MB 第二快取的测试处理器明显落后。

就这个观点而言,针对 45-nm 双核 Penryn 处理器 (Core 2 Duo E8000 系列),将 L2 快取从 4 MB 升级为最大 6 MB 的做法,不无道理。从 65-nm 缩小为 45-nm 不但提供 Intel 增加快取大小的空间,增加的快取大小也可带来更多的效能。不过最重要的好处是 Intel 可以提供 6 MB、4 MB、2 MB 甚至是 1MB L2 快取版本的处理器,如此一来,Intel 可提高单一晶圆上的裸晶使用率,在过去这些散置的瑕疵可能会迫使 Intel 只好丢弃裸晶。事实证明,较大的快取大小似乎对处理器效能或 Intel 的获利,都扮演举足轻重的角色。