三通道DDR3都不够用!i7超频不传之秘
集众多先进技术与一身的Intel Core i7处理器给我们带来了很多惊喜,其中令人映像最深刻的莫过于与数字“3”有关的三大技术:
- 引入大容量共享式三级缓存
- 处理器集成三通道内存控制器
- 彻底抛弃DDR2仅支持DDR3内存
三级缓存的引入有助于降低处理器存取数据时的等待时间,整合式内存控制器则进一步降低了内存存取延迟,三通道让内存带宽比上代双通道提高了50%,DDR3内存本身的速度就是DDR2的1.5倍……在这些先进技术的共同作用下,Core i7的内存性能比Core2提升了两倍以上!那么内存子系统能否满足Core i7的胃口呢?
相信关心电脑硬件的朋友,都会知道CPU集成内存控制器的意义。从电脑工作原理上讲,PC系统的运行就是从存储设备读取数据交由CPU计算指令的过程。要知道,目前CPU的计算能力都十分强悍,反倒是存储设备因为速度问题拖了后腿。导致两者间的配合不同步导致性能降低,CPU总是等待存储设备读取数据再行计算。鉴于PC的工作原理,为了提升系统性能,降低存储设备对性能的影响,PC系统中出现了缓存的概念。
为了使CPU和存储间的配合更好,CPU中加入了缓存的设计,L1L2L3之间就是延时的差异,延时越小带宽越高。而我们常见的内存,延时高达38.1ns(这样的延时在内存中已经算是优品了),和CPU缓存的延时相差甚远,性能表现差距4倍有余。带宽越高,提供给CPU进行计算的数据越充足,CPU处理的数据越多,系统表现更快。
i7内存带宽翻倍,这还不够用吗?
正因为如此,PC系统的每代升级,都致力于内存带宽的提高,而集成内存控制器的意义正是于此。传统北桥的定义,在CPU和内存间架起了一座桥,势必会提高两者间的延时。而通过集成内存控制器,使传统北桥中负责和内存协调的控制器离CPU更近,缩短桥的长度,使内存和CPU间的延时减低。那么,集成了内存控制器的nehalem,我们又该如何提高其性能呢。
◆ Intel Core i7 + X58 + 三通道DDR3平台 精华文章汇总:
在FSB(前端总线)时代,因北桥横跨在CPU和内存之间,系统的延时问题很明显,Core2处理器虽然性能很强大,但是在很多压力较大的软件和测试项目中,Core2与A64之间的性能相差并不多。尤其是在服务器市场,采用HT总线的Opteron甚至比采用FSB的Xeon还受欢迎。
整合内存控制器+HT总线,AMD处理器在高负荷多路系统中表现可圈可点
造成这样的原因,很大程度是AMD处理器集成内存控制器所致。虽然AMD处理器核心效率不高,但是因为集成内存控制器,所以CPU核心得到的数据充足,核心一直处于喂饱的状态。反观Core2处理器,虽然核心效率高,但受限于FSB困扰,核心负载经常供不应求,两者相抵,CPU间的差异就不是十分明显了。
QPI会大幅提升多核处理器及多路系统的效能
老谋深算的Intel,知道自家CPU的性能短板,自然不能接受这个现实,在落后AMD推出集成内存控制器4年后,Intel终于推出了业界领先的集成3通道内存控制器的nehalem。
我们知道,CPU集成内存控制器的最大好处就是降低CPU和内存间的延时,减低延时有助于提高内存的实际表现带宽,那么,传统的提高内存频率提高内存带宽的方法,是否在i7时代仍旧有效?
对Core i7的使用,笔者已经1月有余,虽然不能说研究的很精通,但是长期使用中也获得些小经验,在此,笔者分享些经验给读者,为想购买i7平台的用户做个参考。
此次nehalem集成内存控制器就是为了降低系统间的延时,从CPU架构上分析,集成内存控制器,仅是将内存和CPU处理核心连接的更紧密,实际上两者间还是有延时的。那么顺应这条思路,笔者决定通过超频将延时进一步减小,以获取更大的内存性能提升。
Isochronous Suppot作用:根据intel资料显示,开启后可以保证USB, HD audio的性能。建议选择开启。
在X58的旗舰主板中,笔者比较推崇技嘉主板,过硬的主板做工品质和RD们勤勤恳恳开发的完善BIOS,有什么理由让用户不选择呢。经过同级别几款X58的比较,笔者认为技嘉X58 Extreme对nehalem的支持度较完善。尤其是QPI方面,更有独到的地方。
为了提高系统性能,笔者采用的方案是进一步降低系统延时,在QPI小参中,笔者发现了神秘的uncore frequency,该参数的含义就是内存控制器的频率,我们知道,频率越高延时就越短,我们为了降低延时,只需要提高uncore frequency的频率即可。默认情况下,该参数为内存频率的两倍,而经过调节后,稳定后的频率可以达到4000MHz。
为了验证QPI总线频率的对内存性能的影响,笔者的测试方案如下,使用i7 965频率默认在3.2GHz下,比较同CPU频率下不同北桥频率下的内存性能差异。同时对比内存在1333MHz和1600MHz频率下的性能。
硬件系统配置 | |
处理器 |
Core i7 Extreme Edition 965 (四核/3.2GHz/4x256K L2/8M L3) |
主板 |
技嘉EX58- Extreme |
硬盘 |
西部数据 velociraptor (300GB, 10,000 RPM, 16M,SATA300) |
内存 |
海盗船 TR3X3G1333C9 3X1G DDR3 1333MHz (9-9-9-24 1T) |
显卡 |
NVIDIA GTX260+ |
电源 |
海盗船 Corsair HX1000W |
显示器 |
ASUS 24寸 |
软件系统配置 | |
操作系统 |
Windows VISTA Ultimate SP1 32BIT |
显示驱动 |
Foreceware 180.48WHQL |
● 测试设定:
QPI频率:恒定6400MHz
BClock频率(传统意义上的CPU外频):恒定133MHz
CPU Turbo Mode、C1E、EIST、SpeedStep全部关闭
超线程技术开启
-
模式一:全默认状态,内存1333MHz,NB频率2666MHz
-
模式二:内存保持1333MHz,NB频率超至4000MHz
-
模式三:内存超至1600MHz,NB频率自动升为3200MHz(默认内存的两倍)
-
模式四:内存超至1600MHz,NB频率超至4000MHz
为了不使测试平台的其它部分作为瓶颈,选用了技嘉X58-extreme搭配GTX260+进行辅助测试,为了不使内存带宽成为瓶颈,使用海盗船1333排装组成三通道测试内存带宽,同时存储方面使用目前最快的SATA硬盘velociraptor,将平台性能发挥到最大。
作为世界内存领导型企业,海盗船的领先技术一次次让业界震撼,这次根据nehalem的架构特性对内存的特殊需要——高频低压,抢先业界推出i7御用的排装内存条(3根)。
因为nehalem引入了3通道概念,内存套装的描述也发生了变化,原来的对条、一对等称谓已不适合。那么3根内存我们如何称呼呢?海盗船给我们做出了表率,一排、排装内存。
内存模组型号为XMS3-1333,默认电压1.5V,延时为9-9-9-24,单条容量为1024MB,加装银灰色铝质散热片,金手指采用电镀工艺,PCB为高级的brainpower生产。在内存costdown严重的今天,实属难能可贵,体现出国际内存领导型企业的风采。
根据笔者实测,此排内存可以稳定工作在1600MHz的频率下,而电压仅为1.55V,符合intel i7处理器的规范电压,对于市售X58主板的兼容性非常完美!
● EVERST内存性能测试
我们采用了EVERST Ultimate软件中的内存测试项目考验双款平台的内存性能。这样可以测试出CPU集成内存控制器对内存性能的影响。
从测试成绩来看,Everest的内存测试可以很好地反应NB frequency对内存带宽的影响,NB frequency的提高,比内存频率的提高对带宽的影响更明显。内存在1333MHz NB 4000MHz下比内存1600MHz NB 3200MHz下性能表现更好。
与此同时,NB频率的提高还能进一步降低内存延迟,每缩短1ns都是来之不易的提升!
● ScienceMark 性能测试
ScienceMark是一款通过运行一些科学方程式来测试系统性能的工具。主要用于桌面台式机和工作站上测试内存子系统,同时也用于测试服务器环境中的读写延时,当然,它对内存的带宽及CPU与内存控制器之间的速度等也可进行测试。
从Sciencemark的测试结果看,所有成绩差别不是很大,但名次排列也充分反映出了NB频率的重要性——比直接超内存管用多了。
● Sisoftware Sandra性能测试
Sisoftware Sandra是一套功能强大的系统分析评比工具,拥有电脑你能想到的各种设备的测试方案,作为一款系统测试软件,除了可以提供详细的硬件信息外,还可以做产品的性能对比。其中算数和浮点运算程序直观明了,能够大体知道一款CPU的性能表现。
虽然都是纯理论的内存带宽测试,SiSoftware与Everest的成绩还是有出入的,SiSoftware的结果还是内存频率对带宽的共享更大一些,但NB频率所带的提升也十分可观,只有内存和NB同时超频,才能获得最强性能。
延迟测试中,NB频率的提高令人十分欣喜,总体来看光超内存是远远不够的。
● PCMark Vantage 性能测试
PCMark Vantage 是Futuremark发布的新一代基准测试软件,并比较完美的对多核心处理器进行了优化,而且是专为Windows vista 32/64-bit打造的,不再支持Windows 2000/XP。
PCMark Vantage可以衡量各种类型PC的综合性能,主要分为三大部分进行:1、处理器测试:基于数据加密、解密、压缩、解压缩、图形处理、音频和视频转码、文本编辑、网页渲染、邮件功能、处理器人工智能游戏测试、联系人创建与搜索。2、图形测试:基于高清视频播放、显卡图形处理、游戏测试。3、硬盘测试:使用Windows Defender、《Alan Wake》游戏、图像导入、Windows vista启动、视频编辑、媒体中心使用、Windows Media Player搜索和归类,以及以下程序的启动:Office Word 2007、Adobe Photoshop CS2、Internet Explorer、Outlook 2007。
PCMark是日常应用的合集,包含大多数能够体现内存对系统影响的程序测试。遗憾的是,在前面测试中性能差异明显的四种内存状态,在PCMark下表现并不大,笔者推断,是PCMark测试项目的负载较低所致。
● PHOTOSHOP CS4打开图片效率测试
打开大量的大体积图片文件,相信也是不少用户面临的工作,测试软件选取最新的PHOTOSHOP CS4,打开的文件是20张未经压缩、分辨率大于6000X4000、体积为10MB左右的图片,测试时计算打开时间,衡量不同设定下的性能差距。
若问内存性能的提高,真实效能有多少,笔者并不能够明确的告诉您,但是根据电脑中缓存的原理,打开高分辨率照片的过程,对CPU的计算能力是个考验。在同样CPU频率下,内存间的差异体现明显,更高的带宽和更低的延迟带来的是图片打开速度的明显加快。
真是不测不知道,一测吓一跳,在CPU没超内存也没超的情况下,PhotoShop打开图片的速度能够减少9秒之多,NB频率的重要性可见一斑!相比之下,超频内存所带来的提升就小多了,NB频率同为4000MHz,内存从1333MHz超至1600MHz,时间才缩短了3秒,看来内存延迟的作用远大于带宽!
● WINRAR压缩文件效率测试
WinRAR这款压缩解压缩软件相信每个人在电脑使用过程中都会接触到,压缩速度的快慢影响日常工作的效率,其性能与CPU速度、效率、核心线程数、内存性能各方面都息息相关,这其中内存的贡献有多大呢?
四核心八线程的Core i7处理器性能已经非常强劲了,比同为3.2GHz的QX9770提高了近一倍之多,这其中很大部分都来自于三通道DDR3内存高带宽以及集成内存控制器的贡献。
现在当我们进一步优化内存及内存控制器之后,Core i7的压缩性能更上一层楼,内存带宽和延迟的贡献几乎是同等的。同一颗CPU频率下,仅仅是NB频率和内存频率的提高,就带来了600KB/s的升幅,可见内存在解压缩运算中占很大比重。
前面的测试中,我们已经看到内存带宽的增大,可以带来多么大的性能提升,要知道此时CPU一点都没超频呢。那么,在X58平台下,对CPU稍加超频的话,内存带宽究竟可以突破多少呢?
全新架构的nehalem,已经唾弃了老旧的FSB,就此简单的提升BCLK的频率,内存性能提升并不明显。
风冷3.7GHz对于i7来说轻而易举
海盗船DDR3-1333勇超1860MHz!
经过BIOS调节,同时提高QPI BUS 速度,QPI BUS=BCLK x QPI LINK,uncore frequency和内存频率。BCLK设定在155,内存1860MHz,此时系统内存带宽高达20148MB/s,突破了2W大关。
再次,笔者不得不佩服工艺提高带来的性能提高,拿内存来说,依托和内存晶圆厂的深厚关系,运用新工艺的海盗船TR3X3G1333C9,电压仅加0.2V,电压1.7V的情况下,就达到了1860MHz的频率,而在此频率下内存表现很惊人,没有高频低能的现象出现,带宽更是在NB frequency的配合下一举突破2W大关。看来在DDR2时代沉寂了一段时间的海盗船,在DDR3时代王者归来,未来的i7平台上必有一番斩获。
至此,X58平台下内存频率和NB频率的对比测试到此结束了,对所有的测试成绩进行分析对比后,可以得出以下结论:
-
i7时代,外频BCLK对系统性能影响不大,往日的超CPU就是超外频概念已经被颠覆;
-
内存延时(参数)对系统带宽的影响不大,笔者认为高频内存比延时对性能的表现来的更好;
-
NB Frequency也就是BIOS中的Uncore Frequency,该频率的提升,能够明显提高内存带宽。
-
QPI BUS速度对内存带宽的影响不大,因为6.4GT/s所提供的理论带宽已经非常高了,目前的三通道DDR3内存还不容易填满这条大水管;
-
由于集成内存控制器,NB Frequency的表现实际和CPU主频有一定关系,若主频太低,即便NB Frequency很高也不能提高内存带宽。
值得一提的是,虽然我们测试用的CPU是Intel最优异的Core i7 965 ES版,实际上市售版较低段的Core i7 920超频性能也相当不错,i7 920和i7 940除了倍频上锁之外,QPI频率和NB频率都是可以自由调节的,因此大家通过仔细尝试慢慢调教,一样可以获得相当强悍的性能。
低压超频利器
此外,本此测试中海盗船排装XMS3-1333的表现相当不俗,虽然默认仅为1333MHz,但默认电压就能上1600MHz,加压后最高可达1900MHz左右,三通道模式下依然有如此优异的体制令人赞叹不已,高频率低延迟,微调参数及QPI NB Frequency之后,将会让Core i7的性能更上一层楼!<