在开始我们的测试前,首先了解一下Intel超线程技术,以及为何在Nehalem系列处理器中引入超线程技术。
超线程技术历史 超线程,早在2002年Intel便已经推出了这一技术,并且广泛的在奔腾4处理器中大规模应用。据当时的Intel官方资料,采用了超线程技术的奔腾4处理器可以比原产品效能提升10%-15%左右,可见Intel对超线程技术的运用是信心满满的。 但是事实却出乎Intel的意料。首先是来自操作系统端的问题,当时微软已经发布了Windows 2000系统,然而该系统并没有加入对超线程技术的支持,虽然后来出现的Windows XP系统加入了对该技术的支持,但也最终因为应用软件端对超线程技术的优化较少而作罢。另一个问题是来自于Intel自身的奔腾4处理器。基于NetBurst架构的奔腾4处理器由于过分的追求高主频加长了流水线设计,这导致了处理器的主频虽然达到了3GHz以上,却并没有提供3GHz主频相等的性能。由于过高的流水线已经造成数据运算错误率提高,在加上超线程技术的双核模拟容易让CPU在运算时命中失败,且对带宽的惊人需求。超线程技术不但没为处理器带来更高的执行效率,反而在某些情况下降低了奔腾4处理器的性能。所以说超线程技术虽然是一个非常先进且使用的概念,但在那个时代并不适合。

早在奔腾4时代Intel就加入了HT超线程技术
进入酷睿2时代后,由于内存带宽没有获得突飞猛进,而且酷睿2处理器的短流水设计并不适合超线程技术,因此新一代的酷睿架构处理器也就取消了超线程这一概念。 随着技术的进步,Intel已经进入了45nm工艺和Nehalem架构时代,在最新的Nehalem Core i7处理中,由于对DDR3内存控制器的整合,同时引入了三通道内存技术,内存带宽得到了质的飞跃,QPI总线的引入也令处理器的带宽大幅提升。这为超线程技术的回归提供了契机,于是乎Intel在酷睿i7系列以及未来的双核酷睿i5处理器中加入了超线程技术。 
Nehalem架构时代 超线程技术再次回归 此外,新一代操作系统的推出也给多线程处理器提供了施展拳脚的机会,而3D游戏以及众多的应用软件也针对多线程进行了优化,可以说超线程技术在此时回归时绝对的最佳时机。 ● Nehalem超线程技术细节 超线程技术就是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理芯片,让单个处理器都能使用线程级并行计算,进而兼容多线程操作系统和软件,减少了CPU的闲置时间,提高的CPU的运行效率。 Nehalem架构采用的为同步多线程技术(Simultaneous Multi-Threading,SMT)。基于2路设计,即每颗核心可以同时执行2个线程。在多任务情况下可以有效提升性能,采用这种模拟的逻辑运算核心绝对比直接增加一颗物理运算核心成本低。 
超线程技术让酷睿i7在设备管理器中被识别为8个核心
超线程技术的应用不仅需要指令集方面的帮助,同时也需要消耗一部分晶体管以在硬件上提升处理器运算效率。推测这一晶体管的数目大概为数百万个,但具体数量我们现在还不得而知。 需要指出的是,超线程技术虽然让处理器实现了线程数量翻倍的目的,但它并不像两个物理核心,每个核心都具有独立的资源。当两个线程都同时需要某一个资源时,其中一个要暂时停止,并让出资源,直到这些资源闲置后才能继续。因此超线程的性能并不等于两颗CPU的性能,所以处理器的性能并没有达到翻倍的效果。这一点还需要广大的用户群进一步了解。
性能测试的硬件、软件平台状况 ● 测试系统硬件环境 本次测试采用酷睿i7 870处理器与酷睿i5 750处理器,通过开启/关闭超线程以测试超线程的作用,同时找出超线程技术的问题。酷睿i5 750为关闭超线程技术后的酷睿i7 870性能对比对象,以下为本次测试所使用的硬件及软件测试项目:
测 试 平 台 硬 件 | 中央处理器 | Intel Core i7 870 | (45nm/四核/133MHz*22/8MB三级缓存) | Intel Core i5 750 | (45nm/四核/133MHz*20/8MB二级缓存) | 散热器 | Intel 原厂散热器 | For LGA1156 | 内存模组 | 宇瞻 2GB DDR3 1333*2 | SPD C3-12800 CL9 | 主板 | Intel DP55KG | (Intel P55 Chipset) | 显示卡 | NVIDIA Geforce GTX480 | (GF100 / 1536MB / 核心:700MHz / 显存:3696MHz /) | 硬盘 | Western Digital 鱼子酱 KS 640G SATA | (640GB / 7200RPM / 16M缓存 / 30GB NTFS系统分区) | 电源供应器 | Topwer TOP-900W | (ATX12V 2.0 / 900W) | 显示器 | SAMSUNG P2450 | (24英寸LCD / 1920*1080分辨率) |
● 测试系统的软件环境 操 作 系 统 及 驱 动 | 操作系统 | Microsoft Windows 7 Ultimate RTM | (中文版 / 版本号7600) | 主板芯片组
驱动 | Intel Chipset Device Software for Vista/7 | (WHQL / 版本号 9.1.1.1014) | 显卡驱动 | Geforce Driver Release 258.96 For Vista/7 32 bit | (WHQL / 版本号 258.96) | 桌面环境 | 1920*1080_32bit 60Hz |
● 测试系统的软件环境 操 作 系 统 及 驱 动 | 操作系统 | Microsoft Windows 7 Ultimate RTM | (中文版 / 版本号7600) | 主板芯片组
驱动 | Intel Chipset Device Software for Vista/7 | (WHQL / 版本号 9.1.1.1014) | 显卡驱动 | Geforce Driver Release 191 For Vista/7 32 bit | (WHQL / 版本号 191.07) | 桌面环境 | 1920*1080_32bit 60Hz |
理论性能
测试软件 | PCMark Vantage | Futuremark / 版本号1.00 | 3DMark 06 | Futuremark / 版本号1.02 / 使用默认渲染路径 | 3DMark Vantage | Futuremark / 版本号1.00 / 使用默认渲染路径 | Fritz 10 | 软件自带测试脚本,测试2遍取第二遍成绩 | 视频/音频
图像处理
压缩软件 | 暴风转码 | 版本号:1.2.0.7 / 将一段影片转换为MP4通用格式 | WinRAR | Alexander Roshal / 版本号3.9 | Cinebench R11.5 | 软件自带测试脚本 | 光影魔术手 3.1.2.102 | 将100张图片进行批量处理 | 3D游戏
相关软件 | 魔兽世界 巫妖王之怒 | 手动测试,使用Fraps进行帧数记录 | 街头霸王4 | 使用游戏自带Benchmark测试 | 英雄连 | 游戏自带 Benchmark脚本 | 失落星球2 | 游戏自带 Benchmark脚本 | 系统信息获取 | CPU-Z | www.cpuid.com / 版本号1.55 |
各类合成测试软件和直接测速软件都用得分来衡量性能,数值越高越好,以时间计算的几款测试软件则是用时越少越好。 首先进行的是常规性的3Dmark和PCMark测试。通过该测试我们可以先得到酷睿i7 870在开启和关闭超线程时的理论性能。初步了解到超线程技术在3D运算方面的作用。首先是DX9环境下的3DMark 06测试。

酷睿i7 870开启超线程3Dmark 06测试成绩
总分:20804分 CPU子项得分5524分

酷睿i7 870关闭超线程3Dmark 06测试成绩
总分:20150分 CPU子项得分4934分

3Dmark 06测试
在该项测试中,关闭超线程后的酷睿i7 870在总成绩上并没有太大的变化,这与显卡及内存性能较高有很大关系。但CPU子项得分已经出现了较大幅度的下降。可见超线程技术对DX9环境3D性能的影响还是较为明显的。与酷睿i5 750相比,酷睿i7 870凭借主频的优势取得了小幅度领先。
接下来的是DX10特效3Dmark Vantage测试,该测试我们选定为P模式,关闭没有必要的显卡测试项目Feature Test。以下为最终测试成绩截图。

酷睿i7 870开启超线程3Dmark Vantage测试成绩
总分:21838分 CPU子项得分52651分

酷睿i7 870关闭超线程3Dmark Vantage测试成绩
总分:21878分 CPU子项得分54381分

3Dmark Vantage测试
在DX10特效环境下,开启超线程与关闭超线程对总成绩的影响都较小。但在CPU子项上开启超线程的成绩出现了小幅度下降。在与酷睿i5 750的对比上,开启超线程技术的酷睿i7 870性能表现并没有超过酷睿i5 750很多。可见在3Dmark Vantage测试项目上,超线程技术反倒帮了倒忙。好在影响并不算大,所以不会影响视听感受。 |