admin管理员组

文章数量:1539550

2024年7月2日发(作者:)

维普资讯

瓣 .p C a j C 0㈧ 

Radeon HD 2900XT深度解析 

擎繇 让理性;{导消费 让DI y改变生活 

整整半年以前,NVIDIA发布了业界第一款支持DirectX 10 API的图形显示芯片G80,从此,NVIDIA带领我们走入了 

DirectX 1O时代。DirectX 10带给消费者的是完全不同的视觉盛宴。作为唯一一家能够和NVIDIA竞争的图形显示芯片巨头, 

ATI一直致力于DirectX10产品的研发.终于在今年的5月14日,ATI正式发布了我们期待已久的RadeonHD 2900XT 吹 

响了DirectX 10的第一次决战号角。 

重重危机,R600让ATI走出危难 竞争对手率先构架完成产品线 

早在1年之前,无数的消息来源显示了ATI和 

NVIDIA,均将在最短时间内发布支持DirectX l0 

API的图形显示芯片R600和G80。在2006年l 1月. 

NVIDIA率先推出了支持DirectX l0的G80图形显 

示核心。很快的,NVIDIA通过G80的良好销售 

抢夺了一些高端市场份额 紧接着NVIDIA再次推 

出了在显存规格上Costdown的G80产品.从ATI 

手中抢走绝大部分中高端市场份额;但NVIDIA并 

不满足,在今年的4月17日.又推出了G84/G86图 

形显示核心,将DirectX 10引入了主流市场。至此. 

GeForce 8系列的产品线基本构架完成。 

结束了1 9个月的等待 

般来说 图形显示芯片的技术、架构的更新 

周期,大约是12-1 8个月 显然,从2005年10月 

维普资讯

策划:本刊编辑部 

HD 2000系列将不但在性能上具有竞争力,在高清 

视频、高保真音频以及其他影音娱乐方面同样具有 

易用性和竞争力。无论是以性能为前提,还是以娱 

乐为前提的用户,都可以通过Radeon HD 2000系 

列产品,获得最好的影音娱乐享受。 

ATIRadeonHD2000系列产品线介绍 

高端对决——2900XT Vs 8800GTS 

R600是ATI本代高端产品的研发代号,其对 

应的产品是已经推出的Radeon HD 2900XT以及 

RadeON HD 2900XTX。,目前的Radeorl HD 

22日发布R520到现在, R600已经经历了19个月 

的酝酿,从更新周期上计算,推出的时间并不算太 

晚。但从市场的角度来考虑,ATI已经失去了先机, 

如果要抢回被竞争对手占据的份额,就意味着ATI 

2900XTX只是特供OEM的产品,在零售市场上很 

难找到其踪迹。目前已经上市的:R ad eon HD 

2900XT拥有7.2亿晶体管,采用80纳米制造工艺, 

拥有恐怖的320个Stream Processor Units,核心频 

率740MHz,具备了16个Texture Units、16个ROP, 

可以搭配GDDR4/GDDR3显存 公版采用了单颗 

显存32bit 32MB规格的设计,16颗显存组成了 

512bit

必须拿出性能更加优秀、价格更加低廉的产品。终 

于在今年的5月l4日,ATI发布了支持DirectX l0 

的产品Radeon HD 2900XT。 

其实,ATI稍晚发布R600,也是有一定原因的。 

竞争对手率先透露的产品信息 效能信息,尤其是 

AMD在半导体方面的开发经验,都使得ATI对 

512MB的显存规格;显存频率1650MHz, 

待机功耗低于215W。 

Radeon HD 2900XT是AT1次高端的产品,其 

l 

R600的改进更具有针对性。ATI也在这段时间内, 

充分的调整了架构以及产品线,并且通过和半导体 

芯片制造商更深层次的合作,有效的降低了成本。 

可以说,Radeon HD 2000系列图形显示芯片,是 

翳 醛… 

慰 _ 

ATI花费巨大精力后,推出的产品。 

 I I

看Radeon HD 2000系列迎战NVIDIA 

我们在上文中提到了,NVIDIA已经在低、中、 

高端分别推出了产品,ATI面临的是来自NVIDIA 

和市场的双重压力,能否后来居上,Radeon HD 

2000系列产品将起到决定性的作用。Radeon HD 

2000系列产品,包括了高端的Radeon HD 2900系 

列;中端的Radeon HD 2600系列以及低端的 

Radeon HD 2400系列,3个系列的产品涵盖了整个 

! 

GeForce 8800GTS将是2900XT的最大竞争对手 

竞争对手为NVIDIA采用G80图形显示核心的高端 

产品GeForce 8800GTS,单从规格上来看,无论是 

流处理单元的数量还是显存位宽,Radeon HD 

2900XT要明显强于GeForce 8800GTS,甚至是更 

强悍的GeForce 8800GTX、8800Ultra。除了这些 

参数差别外,Radeon HD 2900XT还拥有数字音频 

输出以及HDMI视频、音频输出功能!更重要的一 

点,Radeon HD 2900XT的价格相当便宜,官方定 

桌面图形芯片市场。 

从产品的命名上,ATI放弃了Radeon X1000 

系列的“x”,转而使用 HD”来做数字之前的标 

价为399美金(512bit/512MB GDDR3显存版本)。 

号,全新命名方式的采用,体现了ATI在产品推广 

方面的用意一一性能将和附加功能并重,Radeon 

而同样价格的GeForce 8800GTS,只拥有96个流 

处理器、320bit显存位宽。 

维普资讯

W W。w P C d l Y C O 

‘ 

Radeon HD 2900XT深度解析 

p 稻 让理性} 消费 

12D f Y改变生活 i釜一 

中端战役——2600系列Vs 8600系列 

在主流市场上.Radeon HD 2600系列将成为 

ATI的主打产品,Radeon HD 2600系列研发代号 

为RV630,采用65纳米制造工艺,集成了超过3.8 

亿晶体管,拥有120个Stream Processor Units,核 

心频率600MHz以上.具备8个Texture Units、4 

Radeon HD 2400系列.这个系列的产品主要面向 

中低端市场,Radeon HD 2400系列核心研发代号 

为RV610.采用65纳米制造工艺.集成了1.8亿晶 

体管.拥有4O个Stream Processor Units.核心频 

率525MHz以上,具备4个Texture UnitS、4个ROP, 

显存位宽64bit.容量可选.可以搭配GDDR3或 

小于25w。 

个ROP.显存位宽128bit,容量256MB,厂商可 

GDDR2显存,显存频率高于800MHz.待机功耗 

以根据产品的定位、需求,为Radeon HD 2600系 

列搭配GDDR4/GDDR3/GDDR2显存,显存频率 

高于800MHz,待机功耗小于45W。 

Radeon HD 2600系列的主要竞争对手是 

NVIDIA GeForce 8600系列产品 Radeon HD 2600 

Radeon HD 2400系列产品.‘是ATI即将在低 

端市场上投放的一颗重磅炸弹,面对竞争对手的 

GeForce 8500GT和Costdown的GeForce 8400GS. 

adeon HD 2400系列产品以65纳米制造工艺和 

系列从参数上依旧是领先对手,并且,Radeon HD 

2600还能够支持AVIVO HD、数字音频输出以及 

HDMI。AVIVO HD是ATI引以为傲的AVIVO视 

频回放技术的改进版,能够针对H264、VC一1以及 

MPEG2等高清视频编码格式进行硬件解码,因此, 

64bit显存位宽,降低了产品的成本。但成本的降低 

并没有减少Radeon HD 2400系列产品的功能, 

Radeon HD 2400系列同样支持AVIVO HD、 

具备AVIVO HD视频回放技术的Radeon HD 2600 

系列,能够流畅的播放HD—DVD以及蓝光电影,最 

大程度的降低对CPU的依赖。 

HDMI视频音频输出和数字音频输出,一定程度上 

降低了数字家庭构架的成本。 

火拼低端——2400系列Vs 8500/8400 

除了Radeon HD 2600系列外,ATI还推出了 

匮 DIV No.7.2007 57 

维普资讯

策划:本刊编辑部 

R600架构分析  ’

行浮点运算或函数运算.和处理整数指令.拥有128 

个Streaming Processors的G80.理论上在同一个 

作为ATI第一款支持DirectX 10 API的图形 

显示芯片.Radeon HD 2000系列抛弃了传统的像 

素Shader、顶点Shader的分离式架构。转而采用统 

周期内.最多能够完成128个数据以及指令运算。 

在加入了Dua1 ISSUE的设计后.进行Multiply 

Shader架构。说到统一Shader架构.就不得不谈 

ADD运算时.可以多进行~组Multipy运算。但 

G80的Streaming Processors频率和核心频率并不 

到ATI为微软Xbox360游戏主机所设计的Xenos图 

形显示芯片。 

同步。举例来说.GeForce 8800GTX的核心频率 

仅仅为575MHz.而Shader频率却高达1.35GHzj 

这就大大提升了Streaming Processors的处理能力。 

而在R600的设计中.ATI同步了Stream Processor 

设计源自Xenos图形显示芯片 

Units和核心频率.Radeon HD 2900XT的Shader 

频率仅仅为740MHz,几乎比GeForce 8800GTX 

低了一倍。一 

Xenos拥有48个Unified Shaders.可以根据需 

求.进行顶点运算或者进行像素运算.虽然并不支 

持DirectX 10.但Xenos却拥有数据流输出功能. 

效率较分离式架构的图形芯片高出不少;同时. 

Xenos还可以支持多线程分配。ATI将Xenos称之 

为第一代统一Shader架构的图形显示芯片。有了 

Xenos的开发经验.R600的统一Shader架构开发 

起来更加得心应手.加之和微软的紧密合作.AT1 

对DirectX 10的理解可以说更加深刻。在之前的杂 

志中.我们详细分析了G80核心架构.在下面的文 

章中.我们会通过R600架构和G80架构的对比,详 

细的解析ATI第二代统一Shader架构。 

320个流处理单元一一颠覆性的数量 

众所周知,统一Shader架构中,流处理器的数 

量相当重要,R600拥有320个Stream Processdr 

Units,而GeForce 8800Ultra只有128个Streaming 

Processors

数量上大大超过了G80。不过我们需 

要解释的是:G80和R600是完全不同的架构,流处 

理器的数量对比是没有任何意义的。 

让我们先回顾下G8 0的设计.G 80的每个 

Streaming Processors

在分解ATI R600图形显示核心的架构后,能 

够发现ATI和NVIDIA的本质差异。ATI采用了 

SIMD(Single Instrucion Multiple Data】的设计, 

均能够在同一个周期中,进 

核心拥有4组流处理器,并各自连接一组Texture 

Units

每组拥有16个流处理器,共计64个流处理 

58 No.7.2007馐 DIV 

维普资讯

爨, 黪 搿f 0 } 

1“ 

Radeon HD 2900XT深度解析 

繇 让理性引导消费 让D l Y改变生括 

器。细心的读者可能会发现.ATI宣传的Radeon 

HD 2900XT拥有320个Stream Processor Units. 

翻译成中文是流处理单元.并不是320个流处理 

器。 

的指令数量.在很大程度上.要取决于UTDP(Ultra 

Thred Displath Processor)能将更多的简单指令. 

集合成一组VLIW指令.填满一条流水线上的16个 

流处理器.80个ALU。为了提升SIMD的运算效 

率.ATI在2900XT中加入了8KB的读取缓存.作 

为虚拟暂时存储空间.配合Stream Out Buffer.存 

储一些不需要经过渲染后端处理的数据。 

早在上代的R580图形显示核心中,ATI在每 

个Pixel Shader Unit中。集成了4个ALU,R580采 

用了标量+矢量的设计 所以每个周期只能处理2 

组Scalar运算或1组VectorSD 1组Scalar运算。R600 

采用了经过革新的SuperSCalar架构,不再分为 

还记得ATI黄金3比1架构吗7每条渲染管线 

中拥有3个Pixel Shader Units;ATI的统一Shader 

架构和3比1架构拥有异曲同工之妙一一实际上 

ATI每个流处理器中,拥有5组ALu.这5组ALu 

也就是所谓的5组Stream Processor Units,64个 

流处理器共有320个Stream Processor Units。 

在ATI每个流处理器中.1组闲置的ALu分支 

分预测单元,配置了缓存器,可以存放输出/输出 

数据,5组ALu最多可以处理5份数据。所以, 

2900XT 320个Stream Processor Units,在一个周 

期内.可以完成320分数据。不过,每个SIMD只 

能执行一份VLIW指令,因此,每个周期能够执行 

Vector和Scalar,所以5个ALU最多可以处理5组 

Scalar运算或1组Vector和2组Scalar运算。不过, 

无论是5D,还是4D+1D.5个ALU并不是全功能 

的,根据ATI的设计.5个ALU中.只有1个能够 

执行函数运算.浮点运算以及Multipy运算.但不 

能进行ADD运算;其余的4个只能做Multipy ADD 

运算。不过,R600的优势很大一个部分在于,每个 

流处理器都能够独立执行完全不同的指令,而 

NVIDIA的每个流处理器只能在一个周期内,执行 

完全相同的指令。 

根据ATI提供的信息,Radeon HD 2900XT最 

高可以达到475GFLOPs的运算能力,竞争对手的 

『i DlV No.7.2o07 59 

维普资讯

策划:本刊编辑部 

8800Ultra可以达到576GFLOPs,但运算能力的差 

别,并不能代表一切,二者的流处理器设计完全不 

同:各自的优势会根据软件的不同而不同 

有助于提高执行效率,所以在R600中,一个周期 

可以处理32个Stencil Shadow。另外,8比l的z 

Compression压缩比显然已经不够了,R600中, 

ATI将Z Compression的压缩比提升到了16比1, 

Z Compression压缩比的提升,能够有效的降低显 

存位宽的占用。纹理数据所占用的空间进一步降 

低。Z Compression压缩比的提升,对Z—Buffer的 

要求也有所提高,ATI将R600的Z—Buffer设置成 

可以独立进行压缩运算,进一步的提升了效率。 

很重要的一点是,R600加入了Re—Z机制,在 

Re—Z机制中,Pixel在进行Render之前,会首先检 

查,滤除不会被显示在画面上的Pixel;而普通的图 

ATI为了提高R600的sIMD架构的执行效率, 

在设定引擎中,增加了指令合并的功能~一每个不 

形显示核心,会在Pixel进行Render后进行检查,大 

大浪费了系统的资源。我们可以认为,Re—Z机制就 

是R600绘制预测的一个部分。 

是完全独立的指令,将被合成成一个较长的指令, 

再交给流处理器,提升了ALU的利用率。在另一个 

方面,ATI延续了Ultra Threaded Dispatch Pro- 

NVIDIA的G80图形显示核心,整合了6个 

Render-Back Ends,从理论上来说,G80在一个周 

期内能够处理24 Pixels,G80拥有两组Z/Stencil 

Processor Units

cessor的设计,在数据和指令交给流处理器和顶点/ 

纹理单元之前,需要经过2个排序以及仲裁单元,决 

定哪些指令需要优先处理,哪些指令不需要等待运 

算结果,哪些指令需要为其他指令腾出空间,等等。 

另外,Shader Instuction Cache以及Shader Constant 

Cache,都存储了一些资源,当重复的时候,可以 

因此.G80在一个周期内,能够 

进行48个Stencil Shadow的运算。从单纯的规格上 

看,G80在这个部分的确要强于R600,但16比1 

的Z Compression压缩比和Re—Z机制的加入,可 

以在软件的支持下,挽回一些差距。 

直接从缓存中提取,降低延迟,从而提升执行效率。 

虽然,每一组SIMD都是完全独立的,ult ra 

Threaded Dispatch Processor却可以将相关的运算, 

迟。 

更灵活的CFAA反锯齿模式 

抗锯齿设置一直是提升画质的技术,而高端图 

同时放入相同的SIMD中,进一步降低了运算的延 

形显示芯片恰恰能够在速度和画质之间,具备良好 

的平衡性——不会因为画质的提升而降低应用软件 

的速度。一直以来,ATI和NVIDIA在画质方面均 

有所进步。NVIDIA在G80中,加入了CSAA,抗 

锯齿的等级从上代产品的8x提升到了16x,画面质 

量大幅度提升。ATI同样在R600中,加入了全新 

的抗锯齿模式CFAA。 

新一代的Radeon HD 2900XT和上代的 

Radeon X1950XTX相比,保持了4个Render・Back 

Ends的设计,理论上来说,一个周期能够处理l6个 

Pixels

但是R600较上代产品.多出了一组z, 

Stencil Processor Unit

Z/Stencil处理单元的出现. 

60 No.7.2007 I ̄DIY 

维普资讯

e辔{ e 0 m 

Radeon HD 2900XT深度解析 

让理性 |导消费 让D 1 y改变生活 

CFAA是Custom Filter Anti—Aliasing的简写 

般的抗锯齿技术的采样数据 均为采样点范围内 

的数据 而CFAA则可以读出采样点边缘外围的数 

据 大大的提升了采样的精确度。根据ATI的技术 

资料 CFAA可以分为Narrow Tent以及Wide 

Tent。 

细心的读者会发现:R600一直宣传支持24x 

CFAA 为什么无论采用Narrow Tent还是Wide 

Tent 都没有达到24x CFAA呢?是的 R600中的 

确加入了一项名为Edge Detection的锯齿侦测技术 

能够修补画面上所有被侦测出的锯齿 当4x AA和 

8x AA搭配Edge Detection技术后 才能够称之为 

12x和24x CFAA。实际上 ATI目前尚未完成Edge 

Detection技术驱动程序的开发 所以我们依旧无 

法看到Edge Detection技术带来的画面体验。抗锯 

齿等级的增加 同时带来了另外一个问题:显存带 

宽的占用率越来越高 为了解决这个问题 ATI将 

压缩比提升到了128比1 一定程度上降低了CFAA 

模式对显存部分的负载。 

实际上Narrow Tent和Wide Tent两种取样方 

式很容易理解 Narrowt Tent是指读取取样点范围 

全新Tessellation增益技术 

Tessellation增益技术是ATI备受瞩目 且引 

以为傲的技术 这项技术首先出现在微软的 

Xbox360游戏主机中 Xenos图形显示核心就具备 

内较近的数据 正常的2x AA/4x AA/8X AA搭配 

Narrowt Tent后 变成4x AA/6x AA,12x AA 

(CFAA);而Wide Tent读取的则是取样点范围内 

较远的数据 使用后2x AA/4x AA/8X AA将变成 

6x AA/8x AA/16x AA(CFAA)。 

Tessellation增益技术。Tessellation增益技术可以 

将数据在进入Vertex Shader运算前 以编程技术做 

出修补。Te s sel1atiOn增益技术是微软下一代 

DirectX的必备功能 由于和微软紧密的关系 ATI 

在R600中已经整合了该技术。 

厦 DlV No.7.2007 61 

维普资讯

策划:本刊编辑部 

根据ATI的官方资料显示,Tessellation增益 

技术可以把一个简单的多边形,分割成更少的三角 

形.并且以优秀的编程技术,并使这些三角形加入 

更加细致的轮廓。经过Pre—Tessellation技术缩减 

后.高达1280038个三角形组成的物件,可以减少 

到840个:而通过Tessellation增益技术后.可恢 

复到100080238个。不过,这些三角形所占用的 

VBS(VRAM Buffer Size)由之前的45MB下降 

dress Unit

这些Texture Address Unit可以用作 

Shader指令,为Texture进行寻址工作。每组Texture 

Address Unit可以运算1个Geometry Shader或 

Pixel Shader的Texture Fetches(纹理拾取):但如 

果要执行Vertex Texture Fetches的话.就需要多 

负责一个Vertex Fetches。 

到100KB左右:但是执行时间增长至之前的两倍。 

由此可见,Tessellation增益技术可以使游戏的执 

行效率提升,或者提升游戏的精细度,相当灵活 

Tessellation增益技术必须通过游戏 应用软 

揭开Texture Unit,我们能够看到Texture 

Samplers

R600中共计80个。每个Texture Sam— 

pier在一个周期可以处理1次FP32数据.如果进行 

Vertex Fetches计算,则必须占用4个T,exture 

Samplers:如果进行Vertex Texture Fetches计算, 

必须占用16个。这就意味着每组Texture Units单 

元,正好符合同时处理Vertex Fetches和Vertex 

Texture Fetches计算的要求。此外,执行Geometry 

Shader或Pixel Shader的Texture Fetches,均需要 

20个Texture Samplers。 

每组Texture Unit内建了4个FP32 Texture 

Filiter Units,R600中共有16个,每个周期可以处 

理1组64bit的BilinearFiltering(双线性过滤).或 

2个周期处理1组l28bit的Bilinear Filtering。这些 

件的支持才能够实现,Tessellation增益技术会不 

会像DX10一样,陷入没有软件支持的尴尬7.ATI 

Texture Filiter Units也可以处理不同格式的Trilin. 

ear Filtering或Anisotropic Filtering。在R580中, 

在R600中集成了这项技术,想必是希望游戏厂商 

能够在引擎开发时,提供对Tessellation增益技术 

的支持,目前.ATI的Tessellation增益技术开发 

包正在准备中。 

GPU并不支持FP Texture Filtering.而在R600中, 

可以支持FP32 Texture Filtering,这算是ATI的一 

个进步吧。 

所有的Texture Unit都会连接32KB的Vertex 

Cache.这些Vertex Cache只能供给VS使用;Tex— 

更强的Texture单元 

Texture Unit一直都是图形显示核心中.最重 

要的部分之一。R600在Texture Unit的设计上.采 

用了每组SIMD连接l组Texture Unit的方式.R600 

ture Unit还连接了可以供给所有Shader使用的 

32KB L1 Texture Cache。这种弹性的设计令Ver— 

tex Fetch资源,能够被再利用在Texture Fetches 

上.一定程度上提高了效率,减少了资源的浪费: 

容量巨大的256KB L2 Cache也有助于提升Texture 

中共有4组Texture Unit。每个纹理单元中,拥有 

8个Texture Address Unit共计32个Texture Ad. 

的计算效率。另外.ATI在R600中,引入了压缩 

维普资讯

键 键 pi,/镑{ e 0 m 

Radeon HD 2900XT深度解析 

繇 让理性引导消费 让D l Y改变生活 

比9:9:9:5的REGB 32bit HDR模式(DX10中 

还有一种是11:11:10模式),能够提供对67MT 

(Texture Size=8192 x 8192)解析度Texture的支 

持。 

反观竞争对手的G80图形显示核心,G80整合 

了32个Texture Address Units 64个Texture Fil— 

ter Units

理论上每个周期可以进行32个Unfil— 

tered Texture Samples或者Filtered Texture Samples 

的计算。R600最多只能在一个周期内,处理16个 

Unfiltered Texture Samples和l 6个Filtered Texture 

Samples,或32个Unfiltered Texture Samples。R600 

在技术规格上有一些劣势,但却能够同时处理UTS 

和FTS,所以只要有软件的支持,R600的整体表现 

会更进一步。 . 

业界领先的51 2bit显存位宽 

512bit显存位宽是R600图形显示芯片在规格 

上的另一个特点 虽然只搭配了1 6 50MH z的 

DDR3显存 但显存带宽已经达到了l05 6GB/s,而 

R580中优秀的环形总线设计,经过改进后 使R600 

外,R600中加入了PCI Express Ringstop,这样GPU 

在读取数据的时候,同样不需要Crossbar Switch。 

达到了1024bit内部环形显存位宽。 

以往的Crossbar Switch在进行内存读取的时 

AVIVO HD 

蓝光和HD—DVD的推出,引领我们进入了高 

清时代。越来越多的高清影片采用H 264、VC一1、 

Mpeg2等方式进行编码。PC在进行视频解码的时 

候,需要CPU担负起大量工作 而拥有超过CPU 

晶体管数量数倍的图形显示芯片,却一直在闲置。 

ATI和NVIDIA都看到了这一点,为了解放CPU, 

降低CPU在高清视频影片播放时的负载,ATI和 

NVIDIA纷纷推出了自主研发的AVIV0和 

候,Client Interface会对显存控制器提出读取请求 

显存控制器会做出计划,并对显存发出指令,要求 

PureVideo视频回放技术。 

从Radeon Xl000系列图形显示芯片开始 ATI 

The HD V ̄de。 ecode Ch 

H 264/AVC can also use cABAc 

based compression 

CABAC offers verv high 

compression ratos w^Ile 

min}mizing}nformat ̄bn fvideo 

将数据传输到控制器中,再由显存控制器传回到 

Cleint Interface

e:CABAC 

HPEG ̄

A 

 ̄,C 

延迟很高。在R600的环形显存总 

线的设计中,由平常的2组256bit只读环形管道,增 

加了2组256bit只写环形管道,所以,写入的时候 

detail)Ioss ‘ 

_豳 擘 ¨ i 

不需要通过Crossbar Switch,写入效率大幅度提 

升。4组256bit的环形管道,组成了l024bit的内部 

环形显存位宽。 

在R600中,Ringstop数量依然是4组,每组的 

RingStop内部包括了128bit显存界面,可以连接4颗 

The adeoff}s that Its very 

computationafly expensive and 

challenging to pc processors 

Process ls particularly 

unfriendly to CPU's branch 

prediction Joglc 

Not paralleIizable so}t doesn 

ift On the GPU pipeline 

曩 。7 1.誊 ¨ M 

圜。l5 1t~,0。 ¨一 矗 

蟹 ~~一 … 

维普资讯

策划:本刊编辑部 

在所有的图形显示芯片中,整合了AVIVO硬件视 

频解码引擎.R600也不例外.ATI改进了AVIVO. 

并重新命名为AVIVO HD。AVIVO HD不再是简 

单的视频引擎.还增加了音频部分。而音频部分的 

加入,正是AVIVO HD最大的革新。Radeon HD 

2000系列图形显示核心内部整合了5.1数字音频控 

制单元.数字音频数据能够通过HDMI输出,同时 

还能够输出视频信号.而目前市场上大部分提供 

HDMI的显卡.均不能够提供音频输出.或只能通 

过转接提供音频输出。当然,如果你有一块高档声 

卡.也可以通过同轴接口,将音频数据输入R600 

AVIVO HD提供了一个完整的视频解码解决方 

案 我们知道,高清视频解码的流程是:比特流处 

理/信息有损解码~波形变换~像素预测~区块重排 

中.再由HDMI进行音频、视频数据输出。 

遗憾的是,Radeon HD 2900XT拥有AVIVO 

HD音/视频处理的能力,却缺少UVD通过视频解 

后期处理,如果是全部为CPU进行解码,那么这 

些工作都需要CPU去做,CPU占用率自然而然难 

以控制;而AVIVO视频解码技术.在比特流处理/ 

信息有损解码这个部分是CPU来进行的;但是全新 

的UVD能够独立运算4个部分,完全将CPU从繁 

杂的工作中解脱出来。 

竞争对手NVIDIA在G84/86上引入了全新的 

PureVideo HD PureVideo HD基于一颗集成在核 

心内的BSP处理器,专门负责硬件解码。有趣的是 

面向主流、中低端市场的G84/86系列图形显示芯 

片 才能够支持第二代PureVideo引擎 GS0只支 

持第一代PureVideo。 

Radeon HD 2900XT显卡介绍 

码控制器.而只有Radeon HD 2600系列和Radeon 

HD 2400系列图形显示芯片.才整合了UVD视频 

解码控制器。实际上。高端的2900XT不整合UVD 

也是有一定道理的。高端显卡必定搭配高端的处理 

器。处理器能够独立完成对VC一1、H.264的解码运 

算;HD 2600和2400系列图形显示芯片通常会搭 

配主流、低端处理器 处理器的解码能力相对较低。 

搭配了UVD的2600和2400系列产品。能够分担 

CPU的工作。使CPU能够在播放视频的时候.同 

时能够进行一些后台运算。 

维普资讯

糖 

★ 

》 } q 

§ 0 ; 

《 

# 

l A 

嬉由 

§ 

O - 

垂 

誊 

毒 

{ 

嚣 

^ 

. .+ 

《 

# 

¨ 

。冀 

0 ●

0 

l 

诤 

0 

‘ 

, 

口 

O 

0 

。 

々 

o 

o 

’ , 

三 §博 

,“ 

静 

# . 

§ 

∥ 

§罐、 

。 

. 。。 

未0 ≥;豁 

々≈ l :.{《鬈l ..  , {tj; l  lt , 1 + 

;… 鑫 

!} *《 

n 

● 

《 

§ 协 。 

:薅 _ 

0 

0 

√ ; 

0 

O O Ie} 

川 

鬟 

纛 

《 } 冀 一 

} { }, 搿 

一 

。0 

.1 

一 “ 

警● 

铡 

8 

l 

舞 

藕 

黪 

一。 景 

. 

£ 

_l l-. 

O 

-- ;  ’

… 

: : 篙蠢篱 

: 

, 

十 

‘ 

fl 

: 

{ 藉 簧麓 

潦 

自 

l { 

::: 

 ;

0 

㈠ 

{ ¨

_・ 

●=:: 

: 

’。-- 

・・I 

: 

¨一 f 

● 

:: 

静 

■” 

0 

:0 - 

; ÷{ 

; 

毋 

, 

0 

’ 

.I0 == ! 

臻 辩 … 。搽。 ! 辩 

≈f ll一 

l 

巷 

维普资讯

策划:本刊编辑部 

Radeon HD 2900XT性能测试 

硬件测试平台 

处理器 

主板 

Intc1C0糟2Dl的E6850 

^sJusP5KDe1m【e(DDR2} 

内存 

硬盘 

操作系统 

显示驱动 

DireetX版本 

Corsair删S2 DDR2.1O66 2GB Du8l Channel 4-4—4—12 

WD R印t0rx 15OGB loo0o ̄m 

软件测试平台 

Wm ̄ws XP Professna1 SP2tWi ̄ws Vista H0me Edid0n 

Forccwarc 158.24 F0r Vist ̄158.22 For)(P WHQL 

A11Cata1ysl 7,5 ForVista/XPWHQL 

. Direct)(9.oc,Direct)(10 

关于测试的说明:测试中,我们使用了Fraps 

记录路点之间的FPS,为了保证测试的准确性,我 

们以5次作为一个基准,测试结果是5次测试结束 

后,去掉最高值和最低值后,剩下3次加权平均后 

获得。另外,由于Windows Vista下OpenGL性能 

低下,所以测试中我们将OpenGL测试项目《雷神 

之锤4》放在了Windows XP下进行。 

至于在整个2900XT测试中的对比显卡,我们 

选择了ATI上代旗舰Radeon X195oxTx、NVIDIA 

基于G80图形显示核心l的GeForce 8800GTX、 

GeForce 8800GTS 640MB、GeForce 88OOGTS 

高的频率将使得这款8800GTS获得更强的性能。 

测试成绩分析 

正如技术部分对R600的分析,320个Stream 

能,但是纹理单元的弱势,也令R600失去了一些 

项目获胜的机会。测试我们选择了被NVIDIA指责 

 Units在性能测试中表现出了优异的性 

3 20MB,同时还选择了市场上比较特殊的一款 

Processor

GeForce 8800GTS 640MB OC版本。这款产品的 

核心频率达到了600MHz.显存频率1800MHz ̄更 

游戏基准测试Fu ̄re 3DMark系列 

I RadonHD 2900xT l Ra ̄onX1950XTX GeFo ̄e 8800GTX.I GeF0rce 8800GTS l GeF0rce 8800GTS oc I GeF0rce 8800GTS 320 

3DMar ̄l 10396  l6690 1o635 I 8870 I 1o503 I 7725 

3DMark05 I 17950  I13568 16845 I 155o6 l 18O64 I 145ol 

分辨率160o×1 00HighQuai 

Radcon}ID 

2弓00XT 

。 

GeF0rce 

880 玎 0C 

RadeOn 

X1950XTX 

GeFdree 

8800GTX 

GcFote ̄ 

8800G.rS 

GeForce 

88(10(邢32o 

极度恐慌 

彩虹六号:维加斯 

极品飞车1O 

富神之锤4 

上古卷轴4 

无限试驾 

122 

48.9 

48.8 

129.8 

63.1 

74.9 

85 

252 

35.6 

93.7 

32.1 

34.4 

129.0 

21.3 

N,A 

156 

47.0 

56.2 

137.4 

59.6 

67.8 

ll3 

32.9 

39.8 

115.6 

44.8 

51.3 

136 

38.8 

43.2 

129.6. 

59.2 

62.1 

170.3 

41.0 

26 

11O 

3Z4 

39.4 

60.8 

43.8 

50.8 

152.8 

l1.0 

N,A 

半条命2:失落海岸线 

切尔诺贝利阴云 

狂野西部(DX10) 

147.3 

2q.3 

24 

178.2 

46 8 

27 

156.4 

35.2 

22 

、 

分辨率1920×1200HigIl QlI蛐ty 

R耐eonHD Rade0ll GeForee GeForce GeFo ̄e GeForee 

2900XT X195o】 8800GTX 8800Grs 88咖GTSoc 8800(I1’S 32O 

极度恐慌 

彩虹六号维加斯 

极品飞车10 

富神之锤4 

上古卷轴4 

无限试驾 

半条命2:失落海岸线 

切尔诺贝利阴云 

狂野西部(DX10) 

l02 

41.3 

43.6 

126.3 

56.2 

64.2 

l27.6 

26.2 

20 

75 

2L9 

30.1 

8o.9 

29.0 

30.9 

94.1 

18.2 

NIA 

137 

39.6 

47.2 

133.2 

52.3 

60.1 

165.6 

’ 加6 

24 

96 

28.3 

33.6 

l109 

加.9 

43.2 

138.4 

29.4 

16 

l13 

37.2 

41.5 

130.6 

48.0 

522 

145.9 

35.7 

19 

95 

20.0 

33.9 

47.3 

加.6 

43.1 

138.4 

10.7 

N,A 

66 No.7.2007 嘲 V 

维普资讯

魄魄嗡 

Radeon HD 2900XT深度解析 

e 

C d y e()m 

让D I Y改变生活 Y 让理性 导消费 

分辨率2560 X 160t)High Qu棚ty 

Radeon HD Radeon GeForcc GeForcc GeForcc GeForce 

2900XT Xl95OX1lx 880(N3Tx 880oGTs 880oGTS 0C 880oGTS 320 

极度恐慌 62 42 85 印 7l 58 

彩虹六号:维加斯 

极品飞车l0 

25.6 

29.7 

l】6 

l7.5 

27.8 

2q9 

l8.2 

20.6 

23.6 

25.1 

3.0 

N/A 

上古卷轴4 

无限试驾 

36.7 

43.0 

20.6 

20.6 

386 

36.6 

28.3 

27 3 

34.7 

334 

276 

2l 2 

半条命2.失落海岸线 

切尔诺贝利阴云 

・ 

87.9 

16 7 

26.8 

10.6 

1326 

26.1 

97.3 

l8.5 

l】5.2 

22.9 

97.4 

3.5 

分辨率l60o×l2004A ̄I6AFHighQu ̄lty 

Rade0nHD 

. 

Radean 

X195OXTx 

GeForee 

880013Tx 

GeForee 

880oGTS 

GeForce 

880oGTS oC 

GeForee 

880oGTS 320 2900xT 

极度恐慌 

彩虹六号维加斯 

极品飞车l0 

留神之锤4 

61 

43.3 

32.5 

94.2 

59 

22-3 

32.2 

70.2 

86 

30 3 

49.8 

l10.6 

印 

226 

346 

77.7 

73 

26_3 

40 8 

90.6 

59 

Nf 

340 

加0 

上古卷轴4 48.6 28.9 50.0 38.4 43.7 

半条命2:失落海岸线 l22.7 ll2.6 l49.5 l】2.6 138.6 

37.0 

lo8.7 

分辨率1920×1200 4A ̄I6AF High Qu ̄ty、 

RadeonHD 

2900xT 

RacIeon 

Xl950X1lx 

GeForee 

880013Tx 

GeForce 

880oGTS 

GeForce 

880oGTs O12 

GeFor ̄ 

880oGTS 320 

极度恐慌 54 49 72 53 62 52 

彩虹六号:维加斯 

橛品飞车l0 

留神之锤4 

40.2 

27.8 

82 6 

19.6 

26.7 

6o.7 

279 

40.6 

93-3 

l22 

29.4 

69.5 

14.5 

33-3 

81.0 

N,A 

29.0 

25.8 

上古卷轴4 

半条命2:失落海岸线 

42l3 

86.4 

‘ 

IhdeonHD 

29(}QXT 

25 8 

77.2 

45.2 

l30.2 

33-3 

卯.2 

40.1 

1l7.8 

33-3 

784 

分辨率256o×16004A ̄I6AFHighQuanty 

Rlld ̄n 

X】950X1X 

GeFor ̄ 

880013Tx 

GeFo ̄e 

880oGTS 

GeForce 

8N)OGTSOC 

GeForce 

8800GTS 320 

极度恐慌 

彩虹六号:维加斯 

极品飞车l0 

33 

24.5 

17.9 

29 

9.8 

l6.2 

39 

l6 

246 

27 

l 5 

l5 9 

3l 

3.9 

l8.8 

2l 

N/A 

N/A 

上古卷轴4 

半条命2:失落海岸线 

29.2 

56.8 

l8.6 

5l 

289 

82.9 

20.2 

53.6 

24.7 

76.2 

6.5 

l9.5 

偏向ATI的游戏,也选择了被ATI认为,和NVIDIA 

有着良好关系的游戏,当然,也有被广大玩家、厂 

商认为是比较公正的测试项目。但经过测试我们发 

现:性能依旧是成绩的主导,在NVIDIA的优势项 

目中,ATI并不输给NVIDIA,还在-_些测试中大 

幅度的领先NVIDIA。这就说明了,320个sPu的 

实力的确不可小视。 

Radeon HD 2900XT高清视频回放测试 

高清视频播放自从Radeon X1000图形显示卡 

发布后,就成为了我们测试中的一个必备项目, 

Radeon HD 2900XT的测试也不例外。在高清视频 

回放测试中,我们使用了H.264编码的《通天塔》 

1080P版本。为了最大程度的体现体现GPU对于 

CPU的解放程度,我们将Intel Core 2 Duo E6850 

处理器降频到l33MHz外频。 

嘲D No.7_2007 67 

维普资讯

簧捌:本刊编辑部 

功耗和运行时的高温、噪音 一直是高端显卡 

所拥有的三大”特性” 甚至有些消费者很难想象 

款显卡的功耗在250W以上 这个功耗已经达到 

了自己电源的额定功率!而温度更是高达待机60 

度,满载80~90度j如果不能够将高温迅速散去 就 

可能导致核心、显存或供电部分烧毁.因此高端显 

卡的散热器不但 个头 巨大,工作起来的噪声也 

非常恐怖。其实,高端显卡的高功耗 高温都是能 

够理解的。例如说2900XT 晶体管的数量达到了 

7亿个 采用了80纳米制造工艺 但核心面积只有 

21mm×20mm 而NVIDIA G80图形核心,集成 

了6.81亿晶体管 基于TSMC 90纳米制造工艺 核 

心面积420~490平方毫米。这么高的集成度 功耗、 

温度的控制难度可想而知。 

为了保证测试的稳定 我们使用了Seasonic 

M12 800W电源 800W的功率足以满足整套平台 

的使用,同时,为了达到最好的测试效果 我们也 

使用了一款额定功率400W的电源进行测试,测试 

中2900XT的稳定性同样优秀。 

测试结果和我们的猜测几乎一致 Radeon HD 

2900XT并没有能够表现出较低的温度和功耗 但 

绝不像外界传闻的那么高 400W的电源已经能够 

满足一套中高端平台和2900XT的需求。 

Radeon HD 2900XT抗锯齿画面对比 

在文章的前一个技术部分 我们已经谈到了 

2900XT在抗锯齿方面的一些改变,枯燥的技术是 

很难被人接受的,还是让我们了解下GeFO rce 

8 800GTS、RadeOil HD 2900XT和Radeon 

X1950XTX三款显卡的抗锯齿表现。测试版的驱动 

可以令Radeon HD 2900XT工作在24x CFAA下 

但我们使用的驱动程序却无法打开24x cFAA。 

对比三张图片,除了1950XTX渲染后锯齿较 

为明显外 2900XT和GeForce 8800GTS打抗锯齿 

后 图片锯齿有了明显的改善,但是2900XT的柔 

化度要更好一些。遗憾的是.大多数的用户目前还 无法打开24x CFAA

 }‘R耐eonHD 2900XT温度、功耗测试(待机/满载) 

。 

 }f 2900XT f 1950XI'X l 8800GTS f 8800GTX 

I功耗 

温度 

l 

} 

224/340W 

66/92。c 

I 

I 

172t230W 

53/72。c 

I 

J 

195/270W 

65/77。c 

I 

J 

203/320W 

74/85。C 

维普资讯

W W /9 C a i y.e 0 m 

让理性引导消费 让D I Y改变生活 

Radeon HD 2900XT深度解析 

c 、 

ATI Mobility Radeon HD 2000系列产品规格表 

MobiliyRadeotnHD MobiliyRatdeonHD MobiliyRatdeonHD 

’ 

MobiifyRatdeonHD Mobiliyt Radeon HD 

2300 

产品定位 

核心频率 

显存频率 

240。... 

主流市场 

350,-450MHz 

4O0--500h 

2400xT 

主流市场 

5OO-600 珏Iz 

600--700 № 

260o 

性能甩户 

400-500MI ̄ 

550H目0m 

2600xT 

.-游戏用户 

6OO--700h珏Iz 

700-750l吡 

八门级 

450-,48砸 

400-550 ̄仆k 

制造工艺 

DirectX版本 。 

9Ohm 

9.0e 

65nm 

DX10 

65nm 

DX10 

65rim 

DX10 

65//m 

DX10 

UVD 

Powerplay 

支持 

6.0 

支持 

7.0 

支持 

7.0 

支持 

7.0 

支持 

7 0 

显存位宽 64,12蹦t 64bit 64bit 64,128bit 641128bit 

衍生一一移动平台同样出色 

基于R600出色的统一Shader架构.ATI继 

下,Shader的运算能力也不会低于G80。不过.我 

们更加关心R600的纹理过滤部分。根据我们的测 

试结果.2900XT在16x AF下的纹理过滤运算能力 

要低于GeForce 8800GTS.未来ATI会拿出什么样 

的改进方式,我们不得而知。 

NVIDIA后,即将推出拥有统一Shader架构的 

Mobility Radeon HD 2000系列图形显示芯片.这 

就意味着在短时间内.移动平台也将会全面进入 

DirectX 10时代。Mobility Radeon HD 2000系列 

图形显示芯片目前共有5款产品.分别是Mobility 

Radeon HD 2300、2400、2400XT

我们现在无法对R600和G80的优劣做出一个 

评价一一用DirectX 10的显卡运行DirectX 9游戏 

2600、2600XT。 

根本无法展现其真实性能.而DirectX 10游戏目前 

很难见到。多数游戏厂商尚未完成DirectX 10下游 

戏的开发,或者在进行引擎的改进。另外.游戏引 

擎和显卡的联系很大,采用不同引擎的游戏.在测 

试中多少都具有一些倾向性。我们缺少一款能够作 

Mobility Radeon HD 2300作为一款有差别的 

HD 2000系列产品.产品定位入门级,无论是制造 

工艺、PowerPlay节电技术还是DirectX版本.都 

要落后其余的2000系列产品。我们从ATI了解到. 

Mobility Radeon HD 2300将会是一款面向低端用 

为基准的DirectX 10测试程序进行测试.从而得到 

优劣的结论。 

户的产品.价格相对比较低廉.因此规格上有所缩 

减也是无可厚非的。 

写在最后的话 

我们花费了一段时间.对R600进行了比较详 

细的测试。理论上来说.次高端的Radeon HD 

2900XT的竞争对手应该是GeForce 8800GTS.但 

从规格上看,2 900XT已经超过了G eFO rc e 

8800GTX!但是在实际性能测试中.Radeon HD 

2900XT战胜了GeForce 8800GTS.但和性能更强 

的8 800GTX还有一段差距。至于高频版本的 

GeForce 8800GTS 640MB

性能较公版高出很多. 

399美元的Radeon HD 2900XT.效能较同类 

别产品来说.相当的优秀。Radeon HD 2900xT虽 

然功耗和温度都较高.但这并不足以埋没2900XT 

的能力。我们同样期待ATI面向移动和桌面Radeon 

但在大多数测试项目上.和2900XT相比依旧落败。 

2900XT有一些我们认为很特殊、很优秀的特 

性.例如Tessellation增益技术、320个Stream 

Processor Units。遗憾的是.不完善的驱动无法完 

全发挥这些优秀特性的性能。ATI对于超标量架构 

的诠释.还需要继续加强;同时.VLIW指令的整 

合也是需要解决的一个问题。相比于G80.R600核 

心更加偏重于平行的大数量Shader运算.平行条件 

HD 2600、2400系列产品的发布.毕竟这些产品才 

是大多数消费者能够接受的。 

本文标签: 能够测试显存显示技术