DX10前夜――最新DirectX10显示卡专题测试

时间:2022-08-30 01:00:45

DX10前夜――最新DirectX10显示卡专题测试

微软公司的Windows Vista已经如期了,对于广大游戏玩家来说,Windows Vista除了带来全新、华丽的界面外,最受瞩目的就是随之而来的DirectX 10。DirectX 10相对于之前的DirectX 9而言,其改变可以说是革命性的。过去的3D显示卡虽然每一代新产品的出现总会带来一些惊喜,并且也有相当大的性能提升。但是这种提升背后的代价却是随着每次的性能提升不断增加的-随之而来的是更高的功耗,更大的发热量,而提升的性能往往十分有限。

纵观3D显示卡进化的路线,我们不难发现,只有在最基础的运算、渲染架构发生革命性改变时,产品的性能才会有极大的提升。之前我们熟知的Vertex+Pixel架构,每次升级的改变其实就是不断的提高Shader的频率、增加Shader的数量、扩大GPU与显存之间的带宽而已,其本质并未发生改变。因此也就很难在性能上有较大的突破。

造成这种情况的原因,并不是可以简单的归结为3D芯片设计厂商没有设计出更好的产品。决定芯片架构的一大重要因素就是API接口,API决定了系统如何调用硬件资源。早期的3dfx为了能让自己的Voodoo运行的更好,曾经自己开发了一套API,即“Glide”。不过PC不是游戏机,PC讲究的是兼容,专用API在游戏、软件开发商那里绝对不会比通用API更受青睐-尤其是当通用API可以做得和专用API一样好,甚至是超越专用API的时候。而Voodoo的架构决定了它在通用API,也就是DirectX下无法得到令人满意的性能和效果,因此被淘汰也并不令人意外。现在新一代的DirectX的推出,决定了芯片设计厂商必须更新自己产品的架构,不然下场只会和3dfx一样。

API革命

那么DirectX 10相对于之前我们熟知的DirectX 9系列,究竟有什么样的改变呢?最为明显的一点改变就是统一渲染架构取代了原来的Vertex和Pixel分离的渲染架构。以往的3D图形渲染流程是,首先由Vertex Shader生成构成3D物体的表面,这些表面由具有屏幕坐标信息的顶点构成,完成模型构筑后,再由Texture Unite赋予物体材质,最后由Pixel Shader进行光影演算等后期处理,最终完成屏幕上我们看到的3D图形图像。不过这种渲染架构并不灵活,在某些特殊情况下,其处理能力存在一定缺陷。比如某些场景下,物体的模型非常复杂,而材质、光源却很简单,那么这时候这种传统渲染架构的弊端就暴露出来了―Vertex Shader的工作负荷非常大,而Pixel Shader的工作负荷非常小,并且由于传统架构下的Vertex和Pixel Shader的比例是1:2或是1:3,此时系统的整体性能就会受到Vertex Shader运算能力的限制,同时Pixel Shader不能满负荷运算也是一种极大的资源浪费。

统一渲染架构可以说是从根本上解决了这一问题。在统一渲染架构中,物理结构相同的处理单元既可以完成顶点运算,又可以完成像素运算,甚至可以完成几何、物理运算,其灵活性不言而喻。并且由于处理单元的物理结构相同,在渲染图像时可以轻松的实现动态分配资源,最大化利用系统性能。

除了定义了新的统一渲染架构外,DirectX 10还在几何运算部分增加了新的处理单元,即Geometry Shader(几何渲染单元)。Geometry Shader可以进行非常复杂的几何运算,增加了Geometry Shader的顶点处理单元不再是仅仅输出一个个顶点的信息,进而转为输出图元信息。图元相对于顶点而言,内容更为丰富,从一个单独的顶点,到由顶点构成的表面都是图元信息可以容纳包含的东西。由此而来,几何运算功能能够提供更为精致的模型细节。

Geometry Shader除了可以建造更为复杂的模型外,其更为有意义的作用是把CPU从繁重的建模运算中彻底解放出来。从而使得CPU可以更多的去执行游戏中的A.I.运算等任务。除此之外,Geometry Shader的引入,可以更好与物理运算相结合。这样一来,Geometry Shader的引入可以说是从另外一个方向上提升了未来3D游戏的真实性,使得3D游戏可以更接近现实。

我们知道,DirectX 9.0c所提供的Shader Model版本为3.0版,此次DirectX 10给我们带来了全新的Shader Model 4.0。SM4.0中的指令长度被提升到大于64K的水平,这是SM 3.0规格的128倍。由于渲染指令长度大幅提升,SM 4.0中相应的寄存器规格也有所增强,如Constant寄存器采用16×4096阵列、Tmp寄存器则有4096个、Input寄存器采用16/32规格等,上述指标都比以前的DirectX有明显的改进。此外,SM 4.0在纹理数量方面也有提高。DirectX 10允许在渲染物体时使用128个纹理,而DirectX 9只提供4/16规格,更多的纹理意味着物体表面精度更接近真实。

最后,DirectX 10是随着Windows Vista一同的,仍旧停留在Windows XP平台的用户即便是购买了DirectX 10的显示卡,也无法享受到DirectX 10游戏带来的乐趣,因为微软不准备开发Windows XP版本的DirectX 10,这是因为Windows Vista改变了驱动程序模型,Windows XP无法实现这种改变,因此无法支持DirectX 10的运行。而那些已经升级到Windows Vista,却仍旧使用着DirectX 9显卡的用户也不必担心自己的显示卡是不是可以在Windows Vista下运行得很好。这种担心是完全没有必要的,DirectX 9的显卡也可以非常流畅的运行Aero Glass效果,这是毫无疑问的。

谁来支持DX10

早在Windows Vista正式之前,NVIDIA就了其可以完整支持DirectX 10的全新3D显示核心,即研发代号为G80的GeForce 8800系列产品。在上市之初,这一系列产品包括GeForce 8800GTX和GeForce 8800GTS两款产品,这两款产品的价格相当高。而在07年的第一季度,为了能够加速DX10显卡的普及率,NVIDIA又推出了一款GeForce 8800GTS 320M,这是一款砍掉一半容量显存的精简版GeForce 8800GTS,其核心架构与GeForce 8800GTS标准版完全相同,仅仅是显存容量从640MB下降到320MB。

G80 3D显示核心采用90nm工艺制成,集成了6亿8千1百万个晶体管,完全面向DirectX 10设计。G80核心中最大的变化在于抛弃了传统“像素处理单元+顶点处理单元”的设计,而是采用了统一渲染架构。G80核心内建了128个流处理器、64个纹理单元和24个光栅单元。这样一来每个流处理器都可以进行Vertex Shader运算和Pixel Shader运算,并且根据具体需要来安排两者的比例,可以最大限度提高核心的效率,从而避免了传统架构中经常出现的资源浪费现象。另外G80还提供对于替代CineFX引擎的Lumenex Engine以及全新的shader model 4.0,这就为G80带来众多全新的特性,如CSAA、128bit HDR、10bit Display Pipeline以及Quantum Effects等等。

G80采用了统一渲染架构,运算方式与以往的传统架构有所区别。G80可以通过线程控制,实现大规模并行运算。同时,每个处理单元可以根据需要动态地被定义为顶点处理单元、像素处理单元,或是物理特性运算单元,以此方式可以最大化利用GPU的资源,并且通过这种工作方式赋予Shader程序最大的编程弹性。此外,每个处理单元利用率提高,有助于减少处理单元处于空闲状态下产生的功耗,从而变相提升GPU的性能功耗比。

G80系列GPU完全针对DX10以及Shader Model 4.0设计。G80支持DX10以及Shader Model 4.0提供的全部全新特性,包括Geometry Shader、Stream Output、Improved Instancing。并且由于其Unified Architecture,以及完全支持DX10,G80可以有效地降低3D运算对于CPU的依赖性,将更多的运算转移到GPU上来。

NVIDIA的G80上集成了名为Quantum Effects的几何运算技术,该技术的主要作用是将几何运算由CPU转移至GPU运算。由于G80的Stream Processors特别擅长处理几何运算,并且拥有128个Stream Processors的G80可以提供性能强劲的浮点运算能力,这使得G80在几何运算方面拥有极强的性能,并且能够生成令人惊讶的逼真特效。通过优秀的几何引擎,游戏可以实现更多的即时演算效果,比如烟雾、火光、爆炸,或是以往难以做到真实的毛发、水面效果,现在也可以仅靠GPU运算即可实现。

G80同样支持NVIDIA的SLI技术,允许用户使用两块显卡实现双卡并行运算,进一步提升性能。而我们看到实际上GeForce 8800GTX上有两个用于连接桥接器的接口,可以在顶级主板上轻易实现Quad SLI功能。除此之外,与G70系列一样,G80系列同样支持Pure Video技术,并且G80的Pure Video进一步升级为Pure Video HD。Pure Video HD由集成在显示核心内的硬件解码单元、驱动程序,以及基于Pure Video技术的播放器组成。其作用是加速HD Video的解码速度,并增强画面质量。Pure Video HD可以支持H.264、VC-1、WMV/WMV-HD以及MPEG-2 HD的解码加速。

对于G80,本刊在早些时候曾经进行过较为详尽的测试介绍。从测试性能上来看,G80所带来的性能提升是非常显著的。不过即便是NVIDIA推出320MB版本的GeForce 8800GTS,GeForce 8800系列产品作为顶级旗舰产品,其售价仍旧很难被大多数用户接受,更为让我们关注的其实是基于这一核心架构的主流产品。在本次专题的制作过程中,NVIDIA正式了采用G80架构的主流和入门级3D芯片,即核心代号为G84和G86的GeForce 8600、GeForce 8500系列产品。

按照惯例,G84和G86核心通过精简处理单元的数量来控制产品的生产成本,从而达到成本缩减的目的。在技术规格方面,最为关键的Shader单元,即流处理器,G84缩减到了2组32个,G86缩减到了1组16个,与G80相比有着巨大的减幅。除了Shader的数目较少外,G84、G86在其他特性上与G80完全相同,同样支持DirectX 10、Shader Model 4.0、Lumenex Engine以及强悍的Quantum Effects几何运算技术。

而与G80的不同之处在于,G84和G86提供了全新的VP2(Video Processer)视频处理器,这是G80所不具备的。新的VP2包含一个BSP(BitStream Processer)处理引擎。支持BSP的G84/86在打开Pure Video HD视频加速功能后,可以实现H.264视频全GPU解码,使得CPU彻底从视频解码运算中得以解放。这项能力,连之前的G80都无法做到,G80在解码高清视频时仍需借助CPU的帮助。

可见,NVIDIA这次的主流产品并非只是针对3D游戏而来,而是更多的考虑到了3D显示卡的多方面应用。随着“蓝光”的不断普及,高清电影的播放很快就会成为用户的主要应用之一,因而仅仅是提供高性能的3D运算,不再是衡量3D显示卡价值的唯一标准。未来的主流显示卡必须兼顾多个应用层面才能满足用户的需要。

由于NVIDIA新产品的时间点刚好在本次专题制作过程中,因此我们无法邀请到太多的新产品,这不能不说是一种遗憾。所幸,我们还是拿到了两款GeForce 8600GTS产品。在随后的测试中,我们将一起来看看未来的主流产品将给我们带来怎样的3D性能。至于高清视频播放部分,我们并未对这两款产品进行测试。原因是目前尚无可以支持该功能的Windows XP驱动程序,而且目前也没有采用DirectX 10设计的游戏,因此我们的所有性能测试均在Windows XP下完成,基于前面提到的驱动程序问题,我们放弃了高清视频加速性能测试。此外,由于NVIDIA提供的用于测试新产品的驱动程序,在对SLI的支持方面仍存在一定问题,我们无法完成相关测试,对此我们感到非常遗憾。

未来主流有多强

新的GeForce 8600GTS毫无疑问在不远的将来会成为市场上的主流产品,那么用户最为关心的就是它究竟能带来多少性能提升。简化后的G84,Shader数量可以说是少的可怜,它是否还能像G80那样,给我们带来强烈的冲击呢?为此,我们专门针对G84进行了性能测试。

测试所使用的GeForce 8600GTS来自华硕和富彩两家公司,其中华硕的产品采用了全静音热管设计,而富彩的产品则与公版相同。测试时,我们选择的对比产品为时下主流的GeForce 7900GT,以及GeFoce 7600GT。同时,我们还测试了高端的GeForce 8800GTX和GeForce 8800GTS 320M的性能,以供用户对比。

在测试软件的选择上,我们除了测试了标准的3DMark外,还选择了4款较为流行的3D游戏,包括2款传统的FPS设计游戏(Quake4、F.E.A.R)、1全新的FPS游戏(S.T.A.L.K.E.R)、1款赛车类游戏(极品飞车卡本峡谷)。本次测试使用了两种不同的分辨率,分别是1280x1024@32bit和1920x1200@32bit。

测试平台

CPU:AMD Athlon 64 X2 4200+

主板:nForce 590SLi

内存:512MB DDR2 667 X 2

硬盘:Seagate 7200.10 750GB

操作系统:Windows XP SP2英文版

软件设置

3DMark 05:4x FSAA、4x ASF

3DMark 06:4x FSAA、4x ASF

Quake4:Ultra High

F.E.A.R:最高特效,4x FSAA、4x ASF,测试分辨率1280x960、1600x1200

S.T.A.L.K.E.R:最高特效,4x FSAA、4x ASF

极品飞车卡本峡谷:最高特效,4x FSAA、4x ASF,测试分辨率1280x1024、1600x1200

从测试成绩上来看,最新推出的GeForce 8600GTS与目前市场上的GeForce 7900系列产品基本处于同一性能区段。GeForce 8600GTS的性能要比GeForce 7600有很大的提升,但与GeForce 7900GT仍有一点差距。同时我们看到,大规模削减Stream Processor对于性能的影响是十分明显的。而从价格上来看,GeForce 8600GTS与目前的GeForce 7900系列产品相仿,这就会让用户产生“是否值得”这样的疑问。

实际上,这种疑问是毫无必要的。GeForce 8600GTS可以运行未来的DX10应用和游戏,而GeForce 7系列产品则只能运行DX9应用和游戏。此外,从本次测试中,你会发现GeForce 7系列产品的3DMark 06成绩均为N/A,这是因为GeForce 7系列产品无法在打开FSAA模式下支持HDR,所以测试无法完成。另外,前面曾经提到了GeForce 8600/8500系列产品采用了VP2视频处理引擎,在视频编/解码加速方面更有优势。

DX10降临之际选什么

虽然目前GeForce 8系列产品已经全面上市了,但目前基于DX10的应用还无法见到,而DX10应用的真正普及,至少要到今年年底才能实现。而到了年底,我们就很可能要迎接新一代的DX10显卡的了-显然新一代的DX10显卡要比现在的产品更为成熟,性能也更好。换句话说,我们可以认为至少在2007年,仍旧是DX9显卡的天下。这些产品更成熟,更便宜,也完全适合现在的各种应用使用,包括大家比较关注的Windows Vista Aero Glass效果。

那么该如何来选择产品呢?在以往的专题中,我们往往会按照性能,或是按照芯片来划分产品线,以便向用户推荐产品。但对于现在的市场状况而言,这种方式并不合适。目前,AMD和NVIDIA的DX9产品都非常成熟,各种小编号产品层出不穷,仅仅按照性能或芯片的大版本来划分产品的话,有些产品很难归类。因此本次专题我们选择按照价格区段来划分产品,用户只要对照自己的显卡投资预算额度,就可以找到适合自己的产品。

500元以下

实际上这一档次产品还是相当复杂的,涵盖的芯片种类很多,从Radeon X800XL到GeForce 7300系列产品都有涵盖。不过这一区段的产品属于入门级产品,选择起来并不复杂。首先是从性能上来说,这系列的产品性能差异并不大,而大多数选择这一档次产品的用户往往对于系统的3D性能要求也并不高。在这一档次产品中,性能较好的包括GeForce 6600LE、GeForce 7300LE、Radeon X800XL、Radeon X1300、Radeon X700等等,这些看上去有些“过气”的产品,构成了入门级产品的主体。

事实上我们并不推荐用户选择这类产品,原因很简单。首先,我们既然决定选择独立显示卡,那么就表示至少我们希望显示卡的性能能够达到一定水平,运行一些3D游戏;其次,这一档次的产品,其实距离主流入门级产品只差100元,甚至更少的资金投入,选择这样一款产品远不如再追加一点资金投入,选择一款性能更好、更主流的产品;最后,如果真的对3D性能没有太多要求,那么完全可以选择一块集成显示核心的主板,省掉显示卡的资金投入。事实证明,许多整合主板上的显示单元也拥有不错的性能,同样可以运行Windows Vista的Aero Glass效果,也能在较低的分辨率和画面质量下流畅运行一些3D游戏。

因此我们不建议用户购买这一档次价位的产品,如果一定要买,那么在这些产品中我们推荐用户使用较新的芯片,比如GeForce 7300或是Radeon X1300系列产品。至少这些产品具有较新的特性,比如在视频播放方面的优化等等,过于老旧的产品就不应该考虑了。

500至1000元

这一价位是大多数主流产品的售价。到了这一档的产品,用户的选择就多了起来。处在这个价位上的产品可以说是非常丰富。从GeForce 7300GT到GeForce 7950GT,从Radeon X1650GT到Radeon X1950GT都可以看到。这就会让用户感到很大的困惑,事实上就连我们自己要做出选择也不容易。造成这种情况的主要原因是,各家厂商对于自身产品的定位以及定价存在着很大的差异。

这就造成了中端主流市场产品较多,价格差异也很大这种现状。从表面上看,这样的市场格局可以让用户花很少的钱买到性能很好的产品,但实际上一些小厂推出的产品在做工和设计上的确存在着一定缺陷,比如将原本标配的GDDR3显存更换为DDR或GDDR2后低价销售等等。这也是造成了这一区段产品数量众多,小版本产品不计其数的主要原因。与此同时,有些产品的做工和用料并不能得到很好的保证,个别产品出现问题是常有的事情。用户在选择产品时应当更加注意。

不过不管怎么说,这一区段的产品是市场的主流产品,1000元这个心理价位一直是很多用户选择显卡的重要依据。在此我们为大家推荐两款比较出色的芯片供用户参考。事实上,我们推荐的产品是相当保守的,偶尔有些厂商推出的中高端产品也会出现在这一价格段。至于具体产品品牌以及产品价格,就要看用户自己的选择了。

与Radeon X1950系列产品一样,Radeon X1650XT也是在AMD推出支持DX10的显示卡之前进行的一次小小的更新。它的性能略好于GeForce 7600GT,尤其是在应对最新的游戏方面,更多的Pixel Shader可以得到更好的性能,可以说是这一价格段中性价比最好的产品。

GeForce 7600GT可以说是这一价格段内的一个小小的神话,可以说它是目前市场上的绝对主力,是大多数用户的选择。它可以提供完美的SM3.0支持,并且拥有极高的运行频率,可以提供相当优秀的性能。美中不足是它的显存宽只有128bit,这在某种程度上限制了它的性能发挥。即便如此,它仍是这一价格区间内最具竞争力的产品之一。

1000至1500元

相对于前两档价位而言,这一档次的产品选择要简单的多。在这一价格区段的产品,就我个人来看是最具性价比的产品。它们往往拥有新架构、新特性,芯片运行频率更高,配备的显存也更快。不过它们面临的最大问题是超出了主流用户“显卡1000元”的心理价位。同时,它们的产品定位略尴尬一些,1500元左右的产品价格不算便宜,但性能却与更高端的型号存在一定差距。这在某种程度上,让这些产品的定位略显尴尬。

不过,随着GeForce 8600系列产品的推出,这种状况得到了一定程度上的缓解。采用全新统一渲染架构的GeForce 8600系列产品给这一价格区间的产品注入了新的活力。截止到发稿之前,我们已经可以在市面上见到1500元左右的GeForce 8600GTS和1200元左右的GeForce 8600GT,这些拥有全新架构和特性的产品将成为这一价格区间内最具竞争力的产品。另外一方面,AMD的Radeon X1950系列产品近期的几次价格调整,也逐渐进入了这一价格区段内。我们都还记得Radeon X1950XTX推出时的震撼,不到3000元的价格却带来了无与伦比的性能。作为Radeon X1950XTX的衍生产品,无论是Radeon X1950Pro还是Radeon X1950GT都有着不错的性价比。

Radeon X1950系列产品并不是简单的将Radeon X1900升级得来的,Radeon X1950可以说是重新设计后,性能更强、功耗低的全新芯片。作为Radeon X1950系列中的主流型号,Radeon X1950Pro拥有相当不错的性价比。最为吸引人的莫过于数量众多的Pixel Shader,这让Radeno X1950Pro在应对时下流行的游戏时,显得更为从容。

毫无疑问,GeForce 8600系列产品是近期最为耀眼的一系列产品。全面支持DirectX 10,全新的统一渲染架构,全新的视频处理引擎(VP2),让这一系列产品无论在3D性能上还是高清视频回放方面,均有良好的表现。可以说,在AMD推出支持DirectX 10的产品之前,GeForce 8600GT在这个价格段内的产品性能方面没有对手。

1500至2000元

事实上,这一价格段的产品已经很少了。两家厂商目前在这个价格段的产品数量都不多。AMD方面,我们能看到的产品是Radeon X1950XT以及少量显存容量较大的Radeon X1950Pro;而NVIDIA方面由于近期了GeForce 8600GTS,因此产品显得略丰富一些,在这一价格段拥有GeForce 8600GTS、GeForce 7900GT。

那么实际上在这个价格区段内的选择就会变得比较简单。首先,我们要明确的一个道理是,作为一款主流产品GeForce 8600GTS停留在这个价格区间的时间将是非常短暂的,很快它就会进入1500元以内的价格区间,而且因为NVIDIA不对其下线厂商推出的GeForce 8500GT做频率上的限制,因此实际上处于中端入门位置的GeForce 8600GT会下滑至入门级产品之内,相应的GeForce 8600GT和GeForce 8600GTS的位置也会随之进行调整。至于AMD方面,截止到发稿日,虽然已经有消息表明R600将很快,不过限于杂志周期,我们无法在本次专题内报道任何关于R600的消息。

对于这款产品而言,它的频率仅比更高端的Radeon X1950XTX低25MHz,GeForce 7900GTX也不是它的对手。甚至在一些DX9的游戏测试中,它的性能已经逼近GeForce 8800GTS,而GeForce 8800GTS要比Radeon 1950XT贵上不少。这得益于它良好的架构设计,48个Pixel Shader在处理大规模像素运算时可以说是得心应手。

其实从产品定位来看,GeForce 8600GTS是无法与Radeon X1950XT相比较的,毕竟后者是作为高端旗舰级产品出现的,而无论怎么看GeForce 8600GTS都是一款面向主流的产品-无论是从Shader数量还是显存宽上来看,它并不具备高端卡应有的配置。但是,它的优势在于全新的统一渲染架构,以及对于DirectX 10和SM 4.0的支持上。除此之外,它的价格也更为便宜些,而性能方面的良好表现令我们十分满意。

2000元以上

就目前的市场情况来看,2000元以上的产品是NVIDIA的天下,GeForce 8800系列产品涵盖了从高到低的各个区段,而在2000元以上这个级别的产品中,AMD可以说只有部分Radeon X1950XT和Radeon 1950XTX在应对着来自强悍的G80的压力。这种局面在AMD的R600之前不会有任何改变。

到了这个价格以上,可以说很多顶级发烧友已经不在意资金上的投入了。因此就算Radeon 1950XTX的性价比再好,大多数用户还是会义无反顾地购买GeForce 8800系列产品。这并不难理解―既然已经决定在显示卡上投入这么多的资金,为什么不买最新、最强的产品呢?在R600正式面世之前,选择2000元以上的显卡非常简单,GeForce 8800系列产品就是你最好的选择。

像素魔术――3D游戏与显示卡的发展

最近一段时间发售的新游戏,让不少玩家颇感头疼。比如去年年底的《Need For Speed Carbon》,很多玩家都会觉得自己的显卡在开启高画质高分辨率后性能衰减较为严重。而近期的几个游戏,比如《S.T.A.L.K.E.R》、《Command & Conquer 3》,或是采用Unreal Engine的《分裂细胞双重间谍》等等,对性能的要求更为严重。从视觉效果来看,这些游戏的共同特点就是拥有华丽的光影、烟雾等效果,并且物理特性、光学特性也更接近于现实。除此之外,这几个游戏的另外一个共同之处就是它们都是跨平台发行的游戏,除了拥有PC版外,还有PS2或PS3,甚至是Xbox 360等游戏机平台的版本。

从游戏机游戏开发来看,在次时代游戏机上,制作人想要表现的效果已经不仅仅是我们所熟知的3D场景,进而转为要表现更为真实的空间感、空气感。这两种画面感可以理解成景深和物体之间的粒子系统填充-因为我们并不是生活在真空中,空气中总是会有些尘埃,这些尘埃在特定的光影环境下会产生十分特别的视觉效果,也会让3D画面更为逼真。下面的这些游戏画面就很能说明问题。复杂的模型、精确的物理特性,这些已经成为3D游戏基本应该拥有的特性。更真实的画面感,来自更复杂的光源阴影演算和各种体现空气质感的粒子雾化效果。

而这些复杂的光源阴影运算和粒子系统对于3D显示卡的像素渲染能力要求极大。更多对3D游戏中的渲染处理详细调查报告表明:渲染的复杂程度不仅在逐渐的增加,就连它们的渲染方式也在发生改变。渲染指令大致可以分为两个类别:

从显存中拾取数据的纹理操作。

完成数学变换的算术处理操作。

早期的渲染处理是粗略的把渲染资源平等的分配给上述两种类型的渲染指令,但近来分配给算术处理操作的渲染处理资源比重越来越大,在最近的游戏中,这个平均的比例是算术处理操作:纹理操作=5:1,从许多下一代的3D游戏设计蓝图看来,这个比例还有继续往上增加的趋势。

在另一些对现今3D游戏的研究报告中指出,大部分的像素处理过程都是双线性过滤操作或者从整数纹理中进行点取样,并没有纹理查找的过程,这些渲染操作都能被纹理处理单元在一个或更少的时钟周期内执行,而剩下的像素处理操作则是三线性过滤、各向异性过滤和浮点指令纹理查找过程,这些操作将被安排在超过一个时钟周期后执行。

在算术处理与纹理操作之间一个很重要的差异就是:纹理操作过多依赖显存容量和带宽这些外界因素,当在显存容量和带宽不够用的情况下,去增加更多的纹理操作单元对纹理操作性能的提升并无帮助;而算术处理操作则不同,它的处理能力并不依靠这些外界因素,仅取决于在GPU中集成的算术处理单元数量。

程序中的纹理是一个可以加以利用的重要技术技巧,首先我们可以通过加上相应的约束参数把像素渲染程序用来生成算术的纹理,通过这样来变相的减少用于存储纹理数据的必需的显存容量和带宽;除此之外渲染程式还可以用来添加变化和现有纹理的细节,以此来减少存储于显存中不同纹理模板的数量。这两种运用的技巧虽然过程不同,但都异曲同工,用来降低纹理操作对外界因素的依赖,减少对显存容量和带宽的需求。当CPU已经成为渲染速度提高的瓶颈时,GPU越来越强的渲染处理能力已经开始在共享原本属于CPU的工作量,例如在粒子系统、纺织物、流体流动这些物理仿真动作在处理器处理不过来时,就会被映射到GPU的工作列表中,使用GPU强大的渲染能力来处理。不过,这些从CPU处理列表中转移过来的资源毕竟远离标准的图形绘制范畴,所以更多的渲染处理能力被用来搭建负载平衡系统,去提升整体的帧渲染速度。

我们都知道ATi的3D显示卡产品在芯片架构上集成了更多的Shader处理单元,那么是否意味着在应对新游戏时能够得到更好的性能呢?为此我们专门进行了一些新游戏的性能测试。测试所选择的显示卡是目前比较主流的产品,包括Radeon X1950GT、Radeon X1650GT、GeForce 7900GS,以及GeForce 7600GS。这4款产品基本处于同一档次,而且均为目前比较成熟的产品。因此,我们在测试新游戏性能时,放弃了3DMark和传统游戏测试。测试项目包括《极品飞车卡本峡谷》、《S.T.A.L.K.E.R切尔诺贝利疑云》,以及《命令与征服3泰伯利亚战争》。

《极品飞车卡本峡谷》中除了使用了时下非常流行的HDR动态光影效果外,在打开全部特效后,还有一种被称之为Motion Blur的动态模糊效果,以体现赛车飞驰的速度感。《S.T.A.L.K.E.R切尔诺贝利疑云》拥有非常精致的建模,其中的一草一木都会随着风吹轻轻摆动,有粒子系统制作的半雾化效果将空气感表现的淋漓尽致。《命令与征服3泰伯利亚战争》中的所有烟雾、爆炸、火光等效果全部为即时演算完成,并且任何动作都会对周围的场景造成影响,此外丰富的细节也是这款游戏的特色之一。

以上3款游戏的共同特点就是,像素运算压力极大。同时,我们的测试设置也极为苛刻,所有测试均打开了游戏的最高设置,同时测试了两个不同分辨率,分别是目前标准的1280x1024@32bit,和该游戏可支持的最高分辨率。除了《极品飞车卡本峡谷》最高只能支持1600x1200@32bit模式外,其他两款游戏的最高分辨率均可达到1920x1200@32bit。

从性能测试来看,也许我们得到的数据并不好看,整体分数偏低。但这些成绩足以说明问题了。在ATi强调的3:1架构(所谓3:1架构就是指Arithmetic:Texture=3:1或是ALU:TMU=3:1。Arithmetic指算术运算,由ALU完成;Texture也可以指纹理运算,由TMU完成)体系下,Radeon X1950GT和Radeon X1650GT在面对这种像素渲染压力较大的游戏时所表现出的性能,的确要好于使用2:1架构的GeForce 7系列产品。

这种优势是建立在分离渲染架构体系下的,一旦3D显示卡整体进入统一渲染架构体系时代,这种优势将不复存在。想要在未来的3D显示卡领域处于领先地位,就要看在统一架构渲染体系下,谁的设计更为优秀了。不过在DX10正式普及之前,要想流畅的运行那些光影绚丽多彩的游戏,Radeon X1000系列产品显然更适合一些。

本次专题我们共收到29款产品,其中除了最新的GeForce 8600GTS外,其他产品均为上市已久的成熟产品。因此我们简化了这些产品的测试(GeForce 8600GTS在之前我们已经详细测试过)。测试分辨率为1280x1024@32bit、4x FSAA、4x ASF(其中NVIDIA的产品在测试3DMark 06时未打开FSAA)。除此之外,每款产品的价格均来自我们CNet旗下网站中关村在线.cn提供的实际市场价格。

实际上,本次专题我们测试的产品并不多,对于产品的测试也较之以前的专题测试简单了许多,好在收到的产品都是市场上的成熟产品,测试虽然简单,但也足以说明问题了。对于产品的评选方面,我们重点考虑的是产品的性价比、做工和产品附加值这几个方面。经过仔细的考量后,我们将编辑选择奖授予如下产品:

ASUS EN8600GTS Silent

Forsa GeForce 8600GTS魔龙版

Leadtek WinFast PX8800GTS/TDH

MSI NX7600GT涡轮风暴

Sapphire X1950GT黄金版

七彩虹镭风X1650GT-GD3 CF白金版

这些产品基本上都是非常有特色的产品。ASUS的EN8600GTS Silent不但采用了最新的GeForce 8800GTS显示核心,而且还提供了零噪音解决方案,并且附带有ASUS的多种独特功能和技术;Forsa的GeForce 8600GTS魔龙版是第一批上市的GeForce 8600GTS产品之一,它拥有很好的性价比;Leadtek的WinFast PX8800GTS/TDH无论是在设计还是做工上都体现了Leadtek的大厂风范,而且价格较为便宜;MSI的NX7600GT涡轮风暴的散热器设计较为出色,虽然尺寸上可能略有出入,但这种设计思路值得其他厂商学习,并且它的性能也是相当不错的;蓝宝的X1950GT黄金版以不足1000元的售价带来的是相当出众的性能,并且其做工和用料堪称顶级;七彩虹的镭风X1650GT-GD3 CF则是体现性价比的典范之作,低廉的价格,中上的性能和出色的稳定性,是这款产品的最大特色。

ASUS

一款成熟的芯片,由一家成熟的大厂设计并制造,就是我们看到的这款EN7900GS TOP。无论是设计、做工,还是用料,都十分令人满意。而且和ASUS的其他显示卡产品一样,这款EN7900GS TOP同样支持诸如靓彩等ASUS特有的技术。

ASUS

这款产品除了采用最新的GeForce 8600GTS外,还使用了全热管静音散热装置。虽然我们有点担心它到底能不能稳定的工作,但是事实上它表现的近乎完美,无论是性能还是稳定性。同样,这也是一块ASUS的靓彩系列产品。

ASUS

采用高端的GeForce 8800GTS显示核心让这款产品在性能上卓尔不群,虽然与旗舰级产品GeForce 8800GTX仍有一定差距,但它仍然能够带给你足够的视觉震撼。此外,由于它的显存只有320MB,它的售价要比标准版的GeForce 8800GTS略便宜一些,更易被用户接受。

ASUS

极限,是对这款产品的最佳形容。这恐怕是目前民用显卡里最为夸张的一款产品了。它的最大特色是采用了全液冷散热,并且用户拿到手里就已经是组装好的全套产品,只要安置在机箱内就可以使用了。同时,强悍的GeForce 8800GTX显示核心能给你最棒的视觉体验。

Forsa

GeForce 7600GS魔龙版

这是一款面向主流市场的产品,拥有不错的性能和稳定性。虽然价格较低,但这款产品的设计和做工还是可圈可点的。它的布线清晰,用料扎实。散热器的选择方面也较为令人放心。

Forsa

GeForce 7900GS魔龙版

不足1000元的价格,以及相当不错的性能,让它成为一款颇具竞争力的产品。这款产品的设计和做工都很不错,并且为了保证稳定性,这款产品的显存颗粒上也设置了独立的散热片。

Forsa

GeForce 8600GTS魔龙版

这是一款采用GeForce 8600GTS显示核心的产品,这款产品在性能上的表现较为令人满意。在设计上,这款产品采用的版型和NVIDIA的公版基本一致,散热器方面配备的也是中规中矩的铜质散热器。与同价位的产品相比,这款产品显然更具竞争力。

GIGABYTE

这款采用GeForce 7600GT显示核心的产品采用了独特的热管散热器设计。其优点是在保证系统正常运行的同时,提供零噪音环境。不过由于在设计这款产品的热管时,将一组散热器设置在了显卡背面,因此这款产品在与某些主板搭配使用时,会因为主板北桥散热片位置问题,给安装造成一定困难。

GIGABYTE

这款显卡采用的显示核心是GeForce 7900GS。作为一款面向主流高端市场的产品,这款显卡的配置还是相当不错的。它保持了GIGABYTE一贯的优良做工,在测试时表现出的稳定性令人满意。

GIGABYTE

这款采用了Radeon X1950Pro的产品在测试时表现出的性能和稳定令人满意,而且其3:1架构在应对那些像素运算复杂的游戏时,将会得到更好的效果。当然,这款产品无论是在做工还是用料方面都保持着GIGABYTE的优良品质,值得信赖。

Leadtek

WinFast PX7600GS/

作为NVIDIA旗下第一大显卡厂商,Leadtek出品的显卡一直以来都是品质的代名词。这款产品也不例外,它的用料和做工相当出色。虽然只是一款面向中端用户的产品,但Leadtek并未因此而偷工减料。

Leadtek

WinFast PX7600GS/

对于那些使用PC作为高清视频播放源的用户来说,这款显卡再合适不过了。它是本次专题中唯一款带有HDMI接口的产品,用户不再需要任何转接设备,即可把HD-TV与PC相连欣赏影片。

Leadtek

WinFast PX7600GT/

中端主流产品的传奇-GeForce 7600GT,在Leadtek手中得到了很好的发挥。这款产品所表现出的性能相当令人满意。中规中矩的外表之下,是极棒的稳定性和性能表现,本次专题中的很多对比测试均由这款产品完成,其表现令人满意。

Leadtek

WinFast PX8800GTS/

这款采用GeForce 8800GTS显示核心,并搭配320MB高速GDDR3显存的产品,让我们想起了法拉利赛车散热器设计十分有特色。它的散热器整体架构为热管+散热片+风扇+整流罩,整流罩后半部为金属拉丝设计,质感十足。当然,除了漂亮之外它的性价也比较为令人满意。

MSI

NX7300GT-TD128E

MSI给这款产品配备了DDR显存,并且从定价来看,这款产品绝对是一款面向入门级应用的产品。从测试的性能来看,这款产品的表现还是相当不错的。此外,与其他入门级产品相比,用户从MSI能得到更好的品质保证。

MSI

这款产品的散热器设计可以说是大大的超出了我们对于显卡散热器的认识。不过必须肯定的是,这种前后抽送空气的方式的确是一种符合机箱内部空气流动的设计。从性能上来看,它的表现不错,价格也不算太贵,是很不错的选择。不过我们担心的是,过于臃肿的散热器会不会影响用户使用SLi呢?

Sapphire

做为ATi旗下第一大下线显卡设计制造厂商,蓝宝出品的ATI显卡在品质上可以与在加拿大销售的ATi原厂卡相媲美。这款采用Radeon X1650GT显示核心的产品在测试中表现出的性能和稳定性都十分令人满意。

Sapphire

通过一系列的测试(主要是一些针对最新游戏的对比测试),我们不得不说,这款采用Radeon X1950GT显示核心的产品,是一款极具性价比的产品。在1000元这一档产品中,无论是在性能还是稳定性上都足以令人满意,性价比可以说无人能及。

Unika火旋风

也许是这款采用了Radeon X1950GT的产品为了保证自己能够稳定的工作吧,它的散热器很大,工作起来噪音不小。而且最为令人担心的是它散热器的固定方式,在显卡背面,我们看到4颗仅用塑料垫圈做绝缘处理的螺丝钉,这种方式未免有些潦草。不过它的性价比倒是不错,值得预算紧张的用户考虑。

Unika速配

作为一款入门级产品,Unika速配PCX7318GT Pro超强版做的还是相当不错的。这款产品所配备的GDDR3显存可以让GeForce 7300GT有更好的发挥。从实际测试来看,也的确是如此,它的表现符合它的定位。

铭狂镭

这款采用Radeon X1650GT的显示卡产品搭配了256MB GDDR3显存,更多的显存可以让显卡在应对材质操作较多的应用时表现得更为自如一些。这款产品在测试中表现出的性能和稳定性都很不错,是一款性价比相当不错的产品。

铭狂镭

这款产品与Unika的火旋风PCX19528GT极为相似,同样的散热器设计,同样的版型。它们在性能表现上也十分接近,价格方面仅差1元。作为一款面向1000元以下用户的产品来看,它的性能表现还是不错的,价格也不算太贵。

铭狂镭

这款产品的看点在于256bit的显存位宽。作为曾经的王者之一,Radeon X800XTPE曾经给我们带来了不小的震撼。如今,作为Radeon X800的血脉,Radeon X800XL的性能表现依然不容小觑,只是它的定位已经从曾经的旗舰级产品变成现在的入门级产品。对于那些对3D性能要求不高的用户来说,这款狂镭X800XL不失为一种不错的选择。

七彩虹镭风

X1650GT-GD3 CF白金版

这款七彩虹的Radeon X1650GT给我们留下了相当深刻的印象,它的性能相当不错,稳定性也算得上很好。但价格却要比同类产品便宜不少。这也是一直让我们感到不解的地方,为什么七彩虹总是能做出性价比很好的产品呢?不管怎么说,这款产品绝对值得用户考虑。

七彩虹镭风

这款采用Radeon X1950GT的产品在性能表现方面无可挑剔,同时它的价格也比较容易让用户接受。美中不足就是在产品的附加值方面略显单薄了一些。不过总体来说,对于那些喜欢追求性价比的用户而言,这款产品还是相当合适的。

七彩虹天行

7300GT-GD3 UP

当GeForce 7300GT已经成为入门之选时,我们也就不能对采用这款芯片的产品提出过多的要求。这款天行7300GT-GD3 UP烈焰战神足以满足普通用户日常应用或是玩一些简单的3D游戏的需求,而且价格便宜。

七彩虹天行

这就是目前市场上主流产品的典范了,不足600元的售价,加上这款产品不错的性能表现,很容易让大多数用户为之打开钱包。它的性能足以满足大多数的3D应用需要,但记住它只是一块面向主流的产品,不要让它运行超出它能力范围的东西。

七彩虹天行

7600GT-GD3 UP烈焰战神

说实话,在面对七彩虹的产品时,如果不看显卡背面的铭牌,就算是我们这些整天接触产品的人也难以分清它们之间的区别。这几款采用NVIDIA芯片的显卡太像了,不过它们的性能还是有区别的。选择GeForce 7600GT是比较稳妥的选择,它足以支撑到DX10应用大范围普及。

七彩虹天行

冰封骑士是七彩虹对其旗下采用热管散热装置的产品的命名。这款采用NVIDIA GeForce 7900GS显示核心的产品,在性能表现上还是相当不错的。不过它的价格在目前这种情况来看,就要面对来自GeForce 8600GTS的压力了。如何选择,就要看用户自己的意愿了。

“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文”

上一篇:口袋里的办公室 下一篇:汉王创意大师绘图板