又快又省的双重考验

时间:2022-09-21 08:12:30

核“芯”进阶

Merom的问世带来了很多期待,虽然与之相得益彰的965芯片组(Crestine)还要在下一代移动平台Santa Rosa时才能亮相,但它的更高性能、更低功耗对于渴望抢鲜的消费者来讲,绝对有着足够的诱惑力。

出色的能效和更具响应性的多任务处理能力,以及Merom开始支持的64位运算技术,都将为家庭、办公和移动中的用户带来更精彩的体验。在酷睿微体系架构下,Merom采用了如下重要的性能与功耗创新技术。

创新一宽区动态执行

宽区动态执行可以让每个时钟周期执行更多指令,以缩短执行时间并改进能效。每个执行内核可同时获取、分配、执行和返回4条完整指令。这项技术使得处理器的每一个内核可同时处理更多指令,增大了数据流量,无疑提升了数据处理能力。进一步提高效率的特性包括可以进一步提高执行灵活性的更准确的分支预测、更深的指令缓冲区等等。

创新二智能功率能力

这是一项在不影响性能的前提下,有效降低功耗和设计要求的能力。该特性可以管理所有处理其执行内核运行时的功耗。它含有一项高级功率门控能力,该能力可以在仅需要单独处理的逻辑子系统上运行极其高效的逻辑控制。此外,许多总线和阵列被分开,一些操作模式中所需的数据在不需要时可被变换为低功耗状态。

创新三数字媒体增强

这是一项显著提高执行SIMD流指令扩展(SSE)指令性能的特性。128位SIMD整数算法和128位SIMD双精度浮点操作,减少了执行特定程序任务所需的全部指令数。通过增加每个周期处理的指令数量,将促使整体性能提高。在运行包括图形、视频和音频的诸多重要多媒体操作,以及处理其他使用SSE、SSE2、SSE3指令的数据集时,高级数字媒体增强的作用更为明显。

创新四智能高速缓存

它是通过增加双核处理器每个执行内核从高速缓存子系统中获取数据的可能性来提高性能的。为此,Intel在内核之间共享了二级高速缓存,通过共享,数据仅需存储在每个内核均可访问的同一个地方,使高速缓存利用更充分。同时,高级智能高速缓存还可以让内核动态地利用二级高速缓存,当一个内核只需较少的高速缓存,其他内核便可以增加其占用的百分比,以提高性能。

创新五智能内存访问

这项能力的目标就是为了确保能尽快地使用数据,并使数据尽可能地用于需要的地方,将延迟最小化。这项技术包括一项重要的新能力――内存消歧,该能力提高了乱序处理的效率,它可以为执行内核提供内建的智能,以帮助其在执行完所有预先存储的指令前,预测性地载入和读取指令即将需要执行的数据,大幅提高了执行程序的效率。

性能测试

为了全面考察Merom处理器的实际性能,我们对工程样机HP Compaq V3000进行了实际测试。出于帮助读者从测试数据上直观比较的考虑,我们尽可能地选择硬件配置上与工程样机相对接近,并采用Yonah移动处理器的笔记本电脑进行对比。此次作为基准平台的是Dell XPS M1710,它基于Napa平台,处理器为Core Duo T2600,与HP Compaq V3000采用的Merom处理器Core 2 Duo T7400主频相同,内存容量、硬盘接口及转速也相同。二者最明显的差别在于显卡,对于某些测试项目会有一定影响,在这些成绩的分析中,我们将做特别说明。

在测试过程当中,我们着重考察前后两代处理器在多任务处理、游戏性能、运算性能以及多媒体处理等多个项目当中的对比表现。在测试方案上,我们分作基准测试、专项测试和实际应用测试三大部分。

基准测试

基准测试选择了PCMark05和Sisoft2005两项测试软件,PCMark05主要测试整机综合性能,而Sisoft2005则用来测试子系统性能。

系统基准性能测试

这项测试与整机性能关系很大,尽管受到显卡明显处于劣势的影响,在CPU单项测试当中,T7400平台相比T2600仍然处于明显领先地位,有近9%的性能提升。可以分析认为,在显卡相当的情况下,T7400平台相比T2600将有更为明显的性能跃升。

在总分一项当中,因为PCMark05测试的是整机多项指标综合考量、加权计算。由于显卡分数相差十分悬殊,因此T7400平台的整机分数相对要落后些,但其中的主要原因是硬件配置造成的,单从处理器本身来看,T7400是处于绝对领先的。

子系统基准性能测试(一)

子系统基准性能测试(二)

在这一项目当中,我们测试了关于CPU的多媒体性能和算术运算性能两大项。从基准测试的成绩中可以看出,在多媒体性能浮点(CPU MultiMediaFloating-Point iSSE)和整数(CPU MultiMediaInteger iSSE)测试项中,T7400平台相对于T2600平台的优势非常明显,浮点一项的提升为38.9%,整数一项的提升为37.5%。可见,T7400保持了整数运算的一贯优势,在游戏中广泛使用的浮点运算上有了大幅度提升。在CPU的算术运算项目中,T7400的浮点运算单元、逻辑运算单元等项成绩都是处于领先的,且幅度都在10%以上。

专项测试

专项测试主要是游戏性能和多任务处理、运算性能的考察,我们选择Quake4(雷神之锤)和CS:S(反恐精英起源),这两个游戏与与处理器性能的关联程度相对较高,在一定程度上考验的是CPU的处理能力。另外,我们还设计了同时对Divx6.1.1和Lame mp3进行视频和音频编辑,在此基础上,使用Super PI来计算1M位的耗时;并使用Super PI来考察处理器的运算性能。

多任务处理性能测试

多任务处理:我们使用Divx6.1.1和Lame mp3同时进行视频和音频编辑,来模拟用户在日常办公应用中的多任务处理环境。同时,我们使用Super PI来计算1M位的耗时,从测试结果来看,T7400平台用时29秒,而T2600平台则使用了35秒,性能提升了17%。该提升与Merom使用智能内存访问技术和共享二级缓存的存取模式关系密切,共享的二级缓存使核心之间通信更灵活有效,全新的存取算法也明显提高了处理器核心访问数据的命中率。

运算性能测试

运算性能:Super PI是传统的测试CPU运算性能的工具,一般都选取1M位处理时间作为测试的考量标准(时间越短越好)。从这项测试来看,同主频的两代处理器,T7400用时23秒,比T2600处理时间节省了6秒,提升的比率达到了21%。

游戏性能:我们选择Quake4和CS:S两款游戏来测试处理器的游戏性能。Merom工程样机的Quake4成绩为8.5fps,CS:S的成绩为34.77 fps,这样的测试成绩并不很理想。虽然这两项游戏对处理器的依赖很大,但对显卡的要求也同样很高。工程样机的配置存在瓶颈直接从成绩中反映出来,在这款机型上,游戏测试很难如实反映出Merom处理器在游戏性能方面的提升。

续航测试:样机的电池规格为4300mAh,容量相对较小。我们使用BatteryMark 4.0.1-Life测试了续航时间,结果为1小时12分钟,在续航时间上没有表现出明显优势。

实际应用测试

实际应用测试当中,我们使用的是Business Winstone 2004和Multimedia CC Winstone 2004两款工具软件,这两款软件都是通过模拟用户的实际应用来反映整机的综合性能。

商务办公性能测试

商务办公性能:这项测试是模拟商务用户的日常办公环境,虽然显卡配置上,工程样机处于劣势,但考虑到这项测试与显卡的关联性并不高,因此,我们仍然可以从实际测试的成绩中得出结论,前后两代双核处理器在商务办公这项性能表现上没有明显差距。

多媒体内容创建测试

多媒体内容创建:在这一项测试当中,T7400平台相对于T2600平台有近11%的提升,该项软件测试需要大量调用不同应用软件,基于酷睿微体系架构的处理器采用的智能内存访问技术、智能的大容量二级高速缓存都将对这一项应用产生直接而有效的影响。

上一篇:年轻人的网络 下一篇:雄狮:整合营销出新招