论文部分内容阅读
面对CrossFire的现实威胁,nVIDIA显然不会停止不前,该公司表示将开发第二代SLI技术。
SLI多显卡技术让nVIDIA在高端领域大出风头,连同配套的nForce4 SLI芯片组,nVIDIA组建了一套超越所有对手的高端游戏和工作站平台。这项举措让nVIDIA获得近乎辉煌的胜利,它不仅成功捍卫了显卡霸主的地位,同时也大大增强了nForce 4芯片组的竞争力,大量的高端用户都将“SLI显卡+nForce 4”平台作为购机首选。由于nForce4 SLI最初只有AMD版本,用户若要体验SLI平台就必须选择AMD平台,这在很大程度上增强了AMD平台的竞争力。英特尔公司显然不乐意见到此种情况,它很快与nVIDIA达成相关协议,以免收P4总线授权费的代价来支持nVIDIA公司开发Intel版的nForce 4 SLI,同时自身也获得SLI的技术授权,实现了双赢合作。然而在这个过程中,nVIDIA公司却成为最大的赢家,它不仅重新在图形领域获得优势,同时也大大增强自身在芯片组领域的影响力,在新一轮的竞争中占据十分有利的地位。
在SLI发布之后,ATI立刻意识到该技术的威胁性,开始把研发重点放到多显卡技术上。经过半年多时间的努力,ATI成功拿出名为“CrossFire”的多显卡技术,并在6月初召开的Computex(台北电脑展)上正式发布。此外,ATI也同期推出配套的“Radeon Xpress 200 CrossFire Edition”芯片组,与nVIDIA的SLI平台展开全面对决。那么,CrossFire究竟有哪些长处和短处?它是否能够从SLI手中抢夺市场份额?在下面的文字中,我们将对ATI CrossFire平台作完整的介绍,内容涉及CrossFire技术的工作模式、配套的Radeon Xpress 200 CrossFire Edition芯片组以及该平台所能达到的具体性能水准,从中读者应该可以得出比较明晰的答案。
CrossFire的技术起源
如果要说多3D显卡平台的鼻祖,当属消逝已久的3Dfx公司,当年拥有一套Voodoo2 SLI 3D加速卡曾经是无数游戏发烧友心中的梦想。此后,SLI模式演变为单卡双芯片方案,Voodoo5 5500便是其中代表。在3Dfx公司之后,第二个推行多3D显卡方案的便是当时在家用领域还籍籍无名的ATI。1999年,ATI推出集成双Rage 128 Pro芯片的Rage Fury Maxx显卡,可惜由于性能无法领先于对手,Rage Fury Maxx没有获得多大反响,业绩十分惨淡。加之成本高昂,ATI在很短的时间内就决定在消费领域放弃这条道路,将重点转移到新一代GPU核心的开发,这才有后来的Radeon芯片。
但在此期间,多GPU技术其实没有被ATI完全抛弃,而是将其转入专业领域。2002年,ATI秘密推出一项名为“Multi Rendering”的多渲染技术,该技术在继承Rage Fury Maxx技术的基础上有了相当大的提高,但它所针对的并不是民用市场,而是军用和专业领域,所采用的API也是针对专业领域的OpenGL而非微软的D3D。Multi Rendering技术一直被Evans & Sutherland计算机公司用在飞机的3D模拟器系统,为军事和民航企业服务。出于可以理解的理由,ATI长期都没有对外公开这项技术,直到面临nVIDIA SLI的现实威胁,ATI才决定重新在消费领域启动多显卡方案,该方案最初被称为“Multi VPU”,不过在正式推出时ATI决定将名称改为“CrossFire(交叉火力)”,其中的寓意不难了解。
在CrossFire技术中,我们看到Rage Fury Maxx的多芯片渲染模式仍然得到完整的继承,当然,CrossFire更应该看作是一项全新开发的技术而非Rage Fury Maxx的延续品,只是ATI将以往的成果收纳其中成为子集而已。在基本原理上,CrossFire平台与SLI平台类似,两块显卡通过连接在一起,共同渲染一个3D场景,通过两者的紧密协作,CrossFire可实现大幅度的效能提升。另外,两者都需要显卡与芯片组紧密配合,配套主板都要求具有两个PCI Express图形插槽,但我们不能够因此将CrossFire视作SLI技术的克隆品。事实上,这两大平台无论在硬件系统的搭建,还是3D渲染的协作、合成方式都存在巨大的差异,这也是本文接下来两个部分要向大家重点讲述的内容。
CrossFire系统的双卡协作机制
平台搭建方式是CrossFire与SLI的最大区别之一。众所周知,SLI平台要求由两块一模一样的显卡方可组成,“一模一样”的意思是两块显卡型号相同,使用同样的GPU核心和相同的工作频率设定,甚至要求两块显卡使用相同版本的BIOS—这三个因素只要有任何一项存在差异,这套系统都无法正常运作,用户基本没有什么灵活性。如果用户在之前就购买了一块采用PCI Express ×16接口但不支持SLI技术的中高端nVIDIA显卡,是无法在此基础上平滑构建一套SLI系统的。用户要么干脆选择放弃SLI的想法,要么就得花费大价钱重新购置一套新的平台。相较之下,ATI的CrossFire技术明显占优:该系统的两块显卡有主从之分,其中主显卡(Master Card)带有CrossFire连接器,而从卡(Slave Card)只要求采用与主卡相当的GPU,并不要求具备CrossFire功能。例如,一块Radeon X850 CrossFire Edition显卡,可与任意一块采用Radeon X850 显卡搭配。同样,一块Radeon X800 CrossFire Edition显卡,也可以同任何一块采用Radeon X800系列GPU的高端显卡组成CrossFire系统。但很遗憾的是,CrossFire的自由度并非如传言所说,可以无条件混插不同系列的显卡(例如Radeon X850混插Radeon X700),ATI明确表示该技术目前仅能对应高端的Radeon X800/850系列及未来将推出的R520,还无法支持针对中端的Radeon X700系列。这难免让那些高度期待该技术的A卡Fans们大失所望,但我们公正地说,CrossFire的组建方式已经颇为自由,至少高端用户的已有投资可得到很好保护。
CrossFire的另一项重大优势在于其广泛的兼容性。在发布该技术时ATI表示,CrossFire系统可以让所有的游戏都从中获得高幅度的效能增益,而不管游戏是在什么时候发布,用户也无需为所谓的“支持CrossFire”打上专门的补丁包。相比之下,SLI系统在这方面就成为人们诟病的地方,在市场上能买到的上千款3D游戏中,真正可支持SLI的只有可怜的十几款,其他多数游戏在SLI平台中都无法获得什么效能增益,同传统的单显卡没有太大区别。nVIDIA一直都在努力解决这个问题,可惜收效甚微,SLI技术的实际意义因此大打折扣。从实用性角度考虑,ATI CrossFire平台的确相当具有竞争力。
CrossFire的上述两项优势来自该系统独特的设计。我们知道,nVIDIA SLI的控制逻辑被直接整合于GPU内,只有内建该逻辑的GPU才可以构建SLI模式。在工作的过程中,两块显卡地位对等,分别获得任务指派并完成渲染工作,然后才将结果合成并统一输出。这种做法的优点在于两块GPU可以进行高效率的通讯,但缺陷同样非常明显:两块显卡必须严格同步,否则将无法正常运行。相比之下,ATI的CrossFire系统采用完全不同的实现方案。CrossFire的控制逻辑并没有被GPU所整合,而是被ATI独立出来,做成单独的“合成引擎(Compositing Engine)”芯片,显卡上集成该芯片的Radeon X850或Radeon X800显卡就可以作为CrossFire系统的“主卡”使用。而另一块显卡只要求同属于X850或X800系列、具备PCI Express ×16图形接口,并不要求是否拥有合成引擎芯片,该显卡被称为CrossFire系统的“从卡”。换句话说,用户手头上的Radeon X850或X800系列显卡都可以作为从卡来使用。那么,问题产生了—由于从卡上没有合成引擎,那么它与主卡如何实现任务指派和3D场景合成呢?
我们先来看看SLI系统。两块显卡通过专门的SLI接口和连接器连接在一起,任务指派和渲染结果相关的数据都借助该连接器传输,场景合成完毕之后再由DVI接口实现输出。而CrossFire系统所采用是一种看起来非常新颖的连接模式,主卡上拥有一个HD-DMS(High Density DMS)接口和DVI接口,其中HD-DMS接口可同时实现显示数据的输入和输出。同时,CrossFire系统还拥有一个专门的外部连接线缆,将从卡的DVI输出接口与主卡的HD-DMS接口连接起来。任务指派由驱动程序负责,从卡完成渲染任务后将显示结果通过DVI接口传输给主卡,并最终被合成引擎芯片接收。合成引擎芯片负责将主卡的渲染结果与从卡的渲染结果合成为完整的图像帧,之后再经由HD-DMS接口将它输出到显示设备(最终输出由外部线缆延伸出的DVI接口实现,用户若有需要还可以将它转接成D-Sub模拟输出)。从形式上看起来,这套方案看起来很像当年3Dfx的Voodoo2 SLI方案,但两者存在根本性的差异。Voodoo2 SLI中外部数据线传输的是模拟显示信号,而CrossFire从卡输出至主卡的是数字显示信号,两者的渲染模式也大不相同,这一点我们会在下一个部分深入分析。
在CrossFire系统中,驱动程序绝对是一个重要的角色,它负责对每块显卡的时钟频率进行自动控制,并在必要的时候达到同步。CrossFire系统的“同步”概念并不要求两块显卡必须工作在同样的时钟频率,只要求二者都是一个基准频率的整数倍即可。为了与多种形式的显卡配合,驱动程序还可以灵活调整主卡的像素管线。例如,ATI现在发布的所有CrossFire显卡都拥有16条像素管线,但在与12管线的家用显卡协作时,主卡的4条管线可被驱动程序禁用。虽然主卡将因此出现明显的性能损失,但整体来看,构建出的CrossFire系统所拥有的图形效能肯定优于16管线的单卡方案。这种灵活调节的机制也让CrossFire具有极好的适应性,用户在使用过程中不需要担心GPU芯片不一致导致双显卡协作困难的问题。此外,CrossFire系统的主从卡在工作时需共享一些系统内存,这样每块显卡都能使用到所有数据,而不要求为每个帧作单独处理,内存资源的分配也是由驱动程序负责掌管。最后,驱动程序还会根据运行程序和渲染模式的不同为每块显卡配置不同的命令队列,保证并行渲染工作可以顺利进行。
多渲染模式与超级反锯齿
除了协作方式迥异外,CrossFire的渲染模式与SLI技术也有巨大的差别。在SLI系统中,两枚GPU同时渲染一个图像帧,每一帧图像被分为上、下两部分,分别由两枚GPU负责,然后渲染结果再被合成在一起输出。由于游戏画面经常都会遇到上半部分简单、下半部分复杂的情况,对应的渲染任务量也大不相同,为了让两枚GPU可以同步完成两部分画面的渲染工作,nVIDIA还为SLI引入了一项动态负载平衡技术,该技术可根据实际情况对画面作不同比例的实时划分。例如,在赛车游戏中,上半部分的天空变化极小,对应的渲染任务就很轻,而下半部分场景剧烈变动,承担绝大多数渲染工作。此时,SLI的动态负载平衡机制就可以发挥效应,它可以将画面划分为2:1的非均等模式,使得两枚GPU负责的渲染量保持一致。每一帧的情况不同,对应的划分规则也要作相应的变化,也就是说,这个画面尺度调整完全是以动态的方式进行,确保SLI系统能够始终工作在效率最佳的理想状态下。
SLI只能支持上述渲染模式,相比之下,CrossFire在这方面就丰富许多,它不仅可支持类似SLI的“Scissor”分割帧渲染模式,还可支持名为“Supertiling”的棋盘式渲染和“Alternate frame rendering”交替帧渲染等两种模式。
Supertiling“棋盘式”渲染
Supertiling从字面上来理解就是瓦片式渲染(Tiling,英文瓦片之意),但我们认为称之为“棋盘式渲染”应该更贴切一些。在这种渲染模式下,每个图像帧都会被分成若干32×32像素的方形小区域(类似国际象棋棋盘上的黑格和白格),每个小区域就是GPU渲染的基本单位,CrossFire主卡与从卡以交叉轮流的方式渲染这些小区域,然后主卡上的合成引擎将所有渲染完毕的小区域合并为完整的渲染图像帧。从示意图上看,主卡与从卡分得的渲染图案酷似棋盘图形(图4)。
Supertiling渲染方式最大的优点就是任务量的分布非常均匀,由于每个渲染区域只有32×32像素大小,即便运行画面上下两部分复杂度差异甚大的赛车游戏,Supertiling渲染模式也可保证两块显卡负载平衡,而不会出现一块显卡不堪重负,而另一块显卡却处于等待状态的糟糕情形。在这样的理想协作模式下,CrossFire系统的实际效能可相当于两块显卡之和,这也是双卡系统所能实现的最高水准。
不过,Supertiling渲染虽可让CrossFire系统的效能获得充分发挥,但它在兼容性方面有所牺牲。ATI表示,只有D3D游戏才可以使用该种渲染模式,而所有的OpenGL游戏都无法选择Supertiling渲染。其次,Supertiling模式成功地实现了渲染任务的均等分配,这就要求CrossFire主卡与从卡必须具有相同的效能,如果两块显卡在工作频率或像素管线数量上有所区别,CrossFire系统就会对速度快的显卡进行调整—要么适当降低工作频率、要么关闭若干条像素管线,以保证两块显卡能够实现同步运作。
Scissor分割帧渲染
对于所有无法采用Supertiling渲染的OpenGL游戏来说,CrossFire所提供的Scissor分割帧渲染应该是理想的选择之一。实际上,该种方式与nVIDIA SLI的渲染机制如出一辙,都是将画面分成上下两个部分,由两枚GPU分别负责渲染,然后统一合成输出。当然,Scissor也遇到当初nVIDIA SLI遇到的难题。如果画面上下两部分图像所需要的渲染工作量相差悬殊,很可能令两块显卡无法协调工作,出现一块显卡先期完成任务处于等待状态,而另一块显卡仍处于繁忙状态的情形。前面我们介绍过,SLI的解决办法是引入动态平衡负载技术,渲染画面的比例可根据任务量作动态的调整,令两块显卡成功实现了同步渲染。而CrossFire的Scissor渲染模式也引入类似的机制,它可支持6:4或7:3的比例来划分画面,一定程度缓解了问题。但不幸的是,CrossFire无法支持动态调节机制,画面比例必须在事先确定,且在渲染的过程中也不会作动态调整,因此很难获得完美的平衡效果。可以预见,对于某些场景变化频繁的3D游戏,若选择Scissor渲染模式将无法充分发挥出CrossFire系统的真正效能。
尽管Scissor在平衡负载方面不如Supertiling模式,但它却拥有极好的兼容性。Scissor分割帧渲染可适用于所有的3D游戏,不管它是支持微软D3D还是OpenGL API。另外,如果用户的CrossFire系统主从显卡运算力不均等,选择Scissor渲染模式或许可获得更出色的效能表现。
交替帧渲染
Alternate Frame Rendering交替帧渲染是CorssFire系统提供的第三种渲染方式。该模式不再采用画面分割、分别渲染的套路,而是由两块显卡对图像帧作交替渲染,其中,主显卡负责渲染奇数帧,从卡负责渲染偶数帧,然后再将结果传回由合成引擎芯片负责合成输出。这种模式在实现上最为简单,它也可同时支持D3D和OpenGL两种API,但如果用户采用主从卡不相同的组建方案,速度最快的显卡就必须与较慢的卡看齐,否则将无法协调工作步调。如果我们将Alternate Frame Rendering渲染模式与ATI当年的Rage Fury Maxx显卡作对比,便会发现两者的渲染方式如出一辙,区别仅在于Rage Fury Maxx为双芯片显卡,而CorssFire系统则采用两块独立的显卡。
超级反锯齿模式
虽然CrossFire比SLI具有更广泛的适用性,但仍然有一些早期游戏无法从这个多GPU方案中获得大幅度的效能增益。为平衡这方面的损失,ATI为CrossFire加入一项名为“Super AA(Antialiasing)”的超级反锯齿技术。该技术的着眼点在于,尽管两枚GPU都在渲染整个场景,但它们分别采用各自的反锯齿采样点,当从卡渲染的图像帧传到主卡后,合成引擎会将反锯齿的效果合而为一,整套CrossFire系统就可实现提高一倍的反锯齿效果。换句话说,虽然这部分游戏无法从CrossFire中体验到近乎翻倍的效能,但游戏的画面效果可得到明显的改善,这一点明显比nVIDIA的SLI系统更富人性化。
接下来,我们更进一步了解CrossFire的Super AA反锯齿技术拥有什么样的威力。众所周知,nVIDIA的GeForce 6系列最高只能支持8X FSAA模式,尽管此时画面品质可得到非常显著的改善,但游戏性能下降也非常明显—当分辨率超过1024×768时,游戏几乎无法顺畅运行,反锯齿运算对硬件资源的消耗相当惊人。而ATI的Radeon X800和X850系列则只支持6X FSAA模式,规格上略逊于对手,但在CrossFire系统中,ATI的劣势获得根本性扭转。凭借并行运算的威力,CrossFire最高可实现14X反锯齿运算,创下该领域的最高纪录。其实,GPU本身的FSAA模式并没有什么变化,Radeon X850 CrossFire版显卡本身最高也只能支持6X FSAA模式,但如果主从卡都工作在4X FSAA模式,CrossFire系统就可对应8X FSAA效果;如果主从卡工作在6X FSAA模式,CrossFire系统便实现了12X FSAA。不过,ATI对此仍不知足,它们认为完全依靠FSAA抗锯齿技术将难以实现更完美的效果,为此CrossFire系统还增加了SSAA反锯齿模式。SSAA(Supersample Antialiasing,超级采样抗锯齿)的做法是预先在更高的分辨率下渲染整个场景,然后对图像进行重新取样,合成为想要的分辨率输出。SSAA反锯齿在提高画面质量方面效果极其明显,但它最大的毛病就是对硬件要求太高,开启后会严重影响效能,故被业界逐渐弃用。但对于CrossFire系统情况就大不相同,双卡并行的超强运算力足够支持SSAA反锯齿运算,CrossFire系统的反锯齿能力由此可提升到10X AA(4X FSAA+4X FSAA+2X SSAA)和14X AA(6X FSAA+6X FSAA+2X SSAA)的水平,让3D游戏的画面质量更上一层楼。
有必要提到的是,Super AA超级反锯齿功能并不只是对早期的游戏有意义,只要用户愿意,可以在任何时候开启这项功能,而不管CrossFire平台上运行的是什么游戏、采用何种渲染方式。这项技术让ATI的CrossFire系统在功能上稳步领先于nVIDIA的SLI平台,而后者显然没有将双显卡的威力充分挖掘出来。
CrossFire芯片组
芯片组是CrossFire系统的重要组成部分,ATI在发布多款CrossFire显卡同时,也同期推出与之配套的Radeon Xpress 200 CrossFire芯片组。顾名思义,Radeon Xpress 200 CrossFire是ATI先前推出Radeon Xpress 200芯片组的CrossFire版本,那么除此之外它还带来哪些改进呢?
RD480/RD400北桥
Radeon Xpress 200 CrossFire可同时支持AMD和Intel两大平台,其中,AMD平台版本的开发代号是RD480,针对英特尔平台的CrossFire芯片组代号则为RD400,而这两者的前一代型号分别是RS480和RS400。
与RS480相比,新推出的RD480在整体规格上几乎没什么变动,区别只在于RD480的PCI Express ×16图形接口可以分拆为两个×8模式,因此RD480可以对应两条PCI Express图形接口,组建CrossFire双显卡平台。从技术上讲,双×8方案显然不如双×16方案来得完美,如果工作在极端条件下接口带宽有可能会出现瓶颈。但比较幸运的是,这种“极端条件”看来远还没有出现,PCI Express×8方案所能提供的4GBps带宽在绝大多数时候都可以很好满足需要。而退一步说,nVIDIA的SLI系统也面临着同样的问题,CrossFire平台在这方面并不显得逊色。还有必要注意一点,RD480在提供PCI Express ×16图形接口的同时,也直接支持4个PCI Express ×1扩展通道,它的地位就好像是系统的PCI Express控制中枢。相比之下,其他多数芯片组都是由南桥来实现PCI Express ×1扩展功能,RD480此种设计会在I/O传输效率上具有一定的优势—来自PCI Express ×1扩展设备的I/O数据只需经过更短的传输通道就能够到达内存,响应速度比常规设计更快、传输效率更高。
针对英特尔平台的RD400也是类似的情况,但它在上一代RS400基础上追加了对Intel Pentium D双核心处理器的支持,内存控制器的规格也提升至最高的双通道DDR2-800方案—这也是目前英特尔平台芯片组的最高规格了。但可惜的是,Pentium D处理器的前端总线限制在800MHz或1066MHz,只要双通道DDR2-533方案就可满足需要,搭载速度更快的内存无法带来明显的效能增益。
在推出第一代Radeon Xpress 200芯片组时,北桥整合的Radeon X300核心被外界认为是最大的亮点。这项设计在RD480/RD400中也得到保留,虽然整合图形核心无法作为CrossFire系统的一部分,但却可以同CrossFire系统同步工作实现多显示输出。ATI方面表示,RD480/RD400主板的整合显卡可驱动两个显示器(要求主板提供两个DVI/D-Sub显示接口),CrossFire主卡也可提供两个显示输出,而从卡也具有同样的威力。这样,整套系统便能够驱动多达六个显示器,创下消费PC在多显示方面的最高纪录。但要实现最高等级的多显示输出,系统中的两块显卡必须保持相互独立,无法捆绑在一起构成CrossFire平台。
ATI IXP450与ULi M1575南桥
在推出RD480/RD400的同时,ATI也发布了与之相配的IXP450南桥芯片。我们知道,现时的Radeon Xpress 200平台采用的是ATI自家的IXP400南桥,但该款南桥功能相当薄弱,不仅没有支持High Definition Audio音效,也缺乏必需的以太网功能,主板厂商必须使用第三方的控制芯片。此外,IXP400的磁盘接口规格也明显落后于同时代的产品,甚至在USB接口设计上都存在Bug。由于IXP400的可用性太差,多数主板厂商都不愿意采用,而是以ULi出品的M1573南桥来代替IXP400。ATI当然希望能够改变这种情况,此番推出的IXP450南桥被寄以厚望。
IXP450在音频和磁盘接口方面有了明显的改进,它可以支持八声道High Definition Audio音效,加入了串行ATA和RAID功能,也修正了USB接口的Bug。但不幸的是,它依然没有整合十分关键的网络功能,而且在磁盘接口方面的努力也未能跟上主流步伐。现时的主流技术是串行ATA 2.0接口、NCQ原生命令队列和RAID5阵列模式,但IXP450都无法提供,它在规格上看起来更像是前一代的产品,整体功能甚至还不如ULi推出已久的M1573南桥。但对ATI来说,主板厂商大量采用第三方南桥让它颇感尴尬,为此极力鼓动合作伙伴使用IXP450南桥,并许诺问题总会解决。游说看来起到了一定的效果,至少在刚过去的Computex台北电脑展上,有不少厂商展出采用IXP450南桥的CrossFire主板,虽然在同时这些厂商也对IXP450抱怨频频。
在ATI努力提升南桥规格的同时,ULi并没有停止不前,该公司目前已推出为CrossFire平台量身定制的M1575南桥。M1575是M1573的后续,它在功能上又比前代产品有了明显的进步,除了可支持High Definition Audio技术外,还加入串行ATA 2.0、RAID 5阵列等一系列先进功能,其他方面的规格也一应俱全,完全可媲美Intel ICH7、nVIDIA MCP-04等新一代南桥,当然也明显优于ATI自家的IXP450。很自然,M1575获得主板厂商的广泛认可,华硕、技嘉两个主板大厂率先表示将在RD480/RD400主板中搭载M1575芯片,预计M1575将可以顺利击败IXP450成为主流的解决方案。
关于芯片组开放授权的争议
尽管有M1575南桥的强援,芯片组仍然是CrossFire系统中最薄弱的一环。而nVIDIA在该领域的绝对优势人所共知—AMD平台,nForce4系列早已成为最受认可的产品,高端用户普遍对nForce4系列青睐有加,SLI自然成为双卡系统中唯一的选择。英特尔平台,nVIDIA后来推出的nForce4 Intel Edition是无可争议的旗舰之作,而Intel自家的i945/955X系列也都可以支持SLI系统。毋庸置疑,SLI已然在芯片组领域抢占了制高点,这将明显增强SLI系统对高端用户的吸引力。两相对比,我们可以看到ATI在该领域处于明显劣势地位,前次推出的Radeon Xpress 200固然受到广泛关注,但市场成绩十分不理想,南桥功能的不足令它难以进入高端领域;而新推出的Radeon Xpress 200 CrossFire虽然在规格上有所进步,但它仍然难以对高端用户产生多少吸引力,ATI不仅无法借助芯片组来推广CrossFire平台,反而必须依赖CrossFire来拉动芯片组业务,这不可避免让该平台的吸引力大打折扣。
面对严峻的形式,开放CrossFire技术授权无疑是最英明的做法。其实,无论是组建CrossFire系统还是组建SLI系统,理论上都只要求主板提供两个PCI Express ×16插槽,并以一定的方式分享×16通路即可,但如果没有取得ATI或nVIDIA的技术授权,芯片组厂商就无法推出这样的产品,否则便构成侵权。对nVIDIA来说,它在芯片组领域已经拥有巨大的影响力,并不着急将SLI全面开放—Intel i945/955X能够支持SLI其实是与nVIDIA交换授权的结果。可对ATI来说情况恰恰相反,全面开放授权无疑会对推广CrossFire平台非常有利,但ATI方面普遍担忧此举将给自身芯片组业务产生重大打击,所以它们更可能倾向部分授权的方式。据悉,ATI目前正与SiS洽谈CrossFire授权事宜,虽然SiS在芯片组领域对ATI威胁不大,但SiS在高端领域几乎一片空白,即便它能够很快推出支持CrossFire运作的芯片组,也很难提升CrossFire平台的竞争力。至于英特尔方面,i945/955X已可支持SLI双显卡运作,ATI表示说它们应该都能够支持CrossFire双卡系统。而在AMD平台,ATI自家的RD480将承担重任,而nForce 4理论上虽然也可支持CrossFire,但我们不应指望nVIDIA会如此慷慨。
迈向并行显卡时代
毫无疑问,CrossFire系统在功能上有一定的优势,但高端用户更为看重的应该是它的实际效能。一些国外网站率先对CrossFire、SLI两大平台进行对比评测,除显卡和主板外,两套平台都采用相同的硬件配置,并运行《DOOM3》的Demo。实际测试成绩让人们充分领略到CrossFire“交叉火力”的强大威力:在单卡运行时,Radeon X850XT PE CrossFire显卡明显落后于nVIDIA的GeForce 6800 Ultra,但组成CrossFire双卡系统后,实测成绩一举超过采用双GeForce 6800 Ultra的SLI平台,CrossFire的高效率在此获得充分体现。而在更换新的催化剂驱动后,CrossFire系统的测试成绩可进一步提升,整体上稍领先于nVIDIA SLI平台。虽然这个结果不足以让我们作出CrossFire性能全面优于SLI的结论,但至少可说明CrossFire不会在性能上落后对手,加之在功能、使用便易性和兼容性等指标上全面占优,CrossFire对高端玩家来说显然会有相当不错的吸引力。
面对CrossFire的现实威胁,nVIDIA显然不会停止不前,该公司表示将开发第二代SLI技术,除了芯片组可能将支持双×16通道外,其他的细节还不得而知。ATI也计划将于年内推出第二代CrossFire芯片组RD500/580。新款产品将会在现有RD400/480基础上增加双×16支持,这样nVIDIA、ATI双方事实上又将处于同一条起跑线上。此外,双方的下一代GPU芯片发布在即,对应的SLI和CrossFire系统都将实现性能大跃进,新一轮的图形争霸战即将打响,对此我们将拭目以待。
SLI多显卡技术让nVIDIA在高端领域大出风头,连同配套的nForce4 SLI芯片组,nVIDIA组建了一套超越所有对手的高端游戏和工作站平台。这项举措让nVIDIA获得近乎辉煌的胜利,它不仅成功捍卫了显卡霸主的地位,同时也大大增强了nForce 4芯片组的竞争力,大量的高端用户都将“SLI显卡+nForce 4”平台作为购机首选。由于nForce4 SLI最初只有AMD版本,用户若要体验SLI平台就必须选择AMD平台,这在很大程度上增强了AMD平台的竞争力。英特尔公司显然不乐意见到此种情况,它很快与nVIDIA达成相关协议,以免收P4总线授权费的代价来支持nVIDIA公司开发Intel版的nForce 4 SLI,同时自身也获得SLI的技术授权,实现了双赢合作。然而在这个过程中,nVIDIA公司却成为最大的赢家,它不仅重新在图形领域获得优势,同时也大大增强自身在芯片组领域的影响力,在新一轮的竞争中占据十分有利的地位。
在SLI发布之后,ATI立刻意识到该技术的威胁性,开始把研发重点放到多显卡技术上。经过半年多时间的努力,ATI成功拿出名为“CrossFire”的多显卡技术,并在6月初召开的Computex(台北电脑展)上正式发布。此外,ATI也同期推出配套的“Radeon Xpress 200 CrossFire Edition”芯片组,与nVIDIA的SLI平台展开全面对决。那么,CrossFire究竟有哪些长处和短处?它是否能够从SLI手中抢夺市场份额?在下面的文字中,我们将对ATI CrossFire平台作完整的介绍,内容涉及CrossFire技术的工作模式、配套的Radeon Xpress 200 CrossFire Edition芯片组以及该平台所能达到的具体性能水准,从中读者应该可以得出比较明晰的答案。
CrossFire的技术起源
如果要说多3D显卡平台的鼻祖,当属消逝已久的3Dfx公司,当年拥有一套Voodoo2 SLI 3D加速卡曾经是无数游戏发烧友心中的梦想。此后,SLI模式演变为单卡双芯片方案,Voodoo5 5500便是其中代表。在3Dfx公司之后,第二个推行多3D显卡方案的便是当时在家用领域还籍籍无名的ATI。1999年,ATI推出集成双Rage 128 Pro芯片的Rage Fury Maxx显卡,可惜由于性能无法领先于对手,Rage Fury Maxx没有获得多大反响,业绩十分惨淡。加之成本高昂,ATI在很短的时间内就决定在消费领域放弃这条道路,将重点转移到新一代GPU核心的开发,这才有后来的Radeon芯片。
但在此期间,多GPU技术其实没有被ATI完全抛弃,而是将其转入专业领域。2002年,ATI秘密推出一项名为“Multi Rendering”的多渲染技术,该技术在继承Rage Fury Maxx技术的基础上有了相当大的提高,但它所针对的并不是民用市场,而是军用和专业领域,所采用的API也是针对专业领域的OpenGL而非微软的D3D。Multi Rendering技术一直被Evans & Sutherland计算机公司用在飞机的3D模拟器系统,为军事和民航企业服务。出于可以理解的理由,ATI长期都没有对外公开这项技术,直到面临nVIDIA SLI的现实威胁,ATI才决定重新在消费领域启动多显卡方案,该方案最初被称为“Multi VPU”,不过在正式推出时ATI决定将名称改为“CrossFire(交叉火力)”,其中的寓意不难了解。
在CrossFire技术中,我们看到Rage Fury Maxx的多芯片渲染模式仍然得到完整的继承,当然,CrossFire更应该看作是一项全新开发的技术而非Rage Fury Maxx的延续品,只是ATI将以往的成果收纳其中成为子集而已。在基本原理上,CrossFire平台与SLI平台类似,两块显卡通过连接在一起,共同渲染一个3D场景,通过两者的紧密协作,CrossFire可实现大幅度的效能提升。另外,两者都需要显卡与芯片组紧密配合,配套主板都要求具有两个PCI Express图形插槽,但我们不能够因此将CrossFire视作SLI技术的克隆品。事实上,这两大平台无论在硬件系统的搭建,还是3D渲染的协作、合成方式都存在巨大的差异,这也是本文接下来两个部分要向大家重点讲述的内容。
CrossFire系统的双卡协作机制
平台搭建方式是CrossFire与SLI的最大区别之一。众所周知,SLI平台要求由两块一模一样的显卡方可组成,“一模一样”的意思是两块显卡型号相同,使用同样的GPU核心和相同的工作频率设定,甚至要求两块显卡使用相同版本的BIOS—这三个因素只要有任何一项存在差异,这套系统都无法正常运作,用户基本没有什么灵活性。如果用户在之前就购买了一块采用PCI Express ×16接口但不支持SLI技术的中高端nVIDIA显卡,是无法在此基础上平滑构建一套SLI系统的。用户要么干脆选择放弃SLI的想法,要么就得花费大价钱重新购置一套新的平台。相较之下,ATI的CrossFire技术明显占优:该系统的两块显卡有主从之分,其中主显卡(Master Card)带有CrossFire连接器,而从卡(Slave Card)只要求采用与主卡相当的GPU,并不要求具备CrossFire功能。例如,一块Radeon X850 CrossFire Edition显卡,可与任意一块采用Radeon X850 显卡搭配。同样,一块Radeon X800 CrossFire Edition显卡,也可以同任何一块采用Radeon X800系列GPU的高端显卡组成CrossFire系统。但很遗憾的是,CrossFire的自由度并非如传言所说,可以无条件混插不同系列的显卡(例如Radeon X850混插Radeon X700),ATI明确表示该技术目前仅能对应高端的Radeon X800/850系列及未来将推出的R520,还无法支持针对中端的Radeon X700系列。这难免让那些高度期待该技术的A卡Fans们大失所望,但我们公正地说,CrossFire的组建方式已经颇为自由,至少高端用户的已有投资可得到很好保护。
CrossFire的另一项重大优势在于其广泛的兼容性。在发布该技术时ATI表示,CrossFire系统可以让所有的游戏都从中获得高幅度的效能增益,而不管游戏是在什么时候发布,用户也无需为所谓的“支持CrossFire”打上专门的补丁包。相比之下,SLI系统在这方面就成为人们诟病的地方,在市场上能买到的上千款3D游戏中,真正可支持SLI的只有可怜的十几款,其他多数游戏在SLI平台中都无法获得什么效能增益,同传统的单显卡没有太大区别。nVIDIA一直都在努力解决这个问题,可惜收效甚微,SLI技术的实际意义因此大打折扣。从实用性角度考虑,ATI CrossFire平台的确相当具有竞争力。
CrossFire的上述两项优势来自该系统独特的设计。我们知道,nVIDIA SLI的控制逻辑被直接整合于GPU内,只有内建该逻辑的GPU才可以构建SLI模式。在工作的过程中,两块显卡地位对等,分别获得任务指派并完成渲染工作,然后才将结果合成并统一输出。这种做法的优点在于两块GPU可以进行高效率的通讯,但缺陷同样非常明显:两块显卡必须严格同步,否则将无法正常运行。相比之下,ATI的CrossFire系统采用完全不同的实现方案。CrossFire的控制逻辑并没有被GPU所整合,而是被ATI独立出来,做成单独的“合成引擎(Compositing Engine)”芯片,显卡上集成该芯片的Radeon X850或Radeon X800显卡就可以作为CrossFire系统的“主卡”使用。而另一块显卡只要求同属于X850或X800系列、具备PCI Express ×16图形接口,并不要求是否拥有合成引擎芯片,该显卡被称为CrossFire系统的“从卡”。换句话说,用户手头上的Radeon X850或X800系列显卡都可以作为从卡来使用。那么,问题产生了—由于从卡上没有合成引擎,那么它与主卡如何实现任务指派和3D场景合成呢?
我们先来看看SLI系统。两块显卡通过专门的SLI接口和连接器连接在一起,任务指派和渲染结果相关的数据都借助该连接器传输,场景合成完毕之后再由DVI接口实现输出。而CrossFire系统所采用是一种看起来非常新颖的连接模式,主卡上拥有一个HD-DMS(High Density DMS)接口和DVI接口,其中HD-DMS接口可同时实现显示数据的输入和输出。同时,CrossFire系统还拥有一个专门的外部连接线缆,将从卡的DVI输出接口与主卡的HD-DMS接口连接起来。任务指派由驱动程序负责,从卡完成渲染任务后将显示结果通过DVI接口传输给主卡,并最终被合成引擎芯片接收。合成引擎芯片负责将主卡的渲染结果与从卡的渲染结果合成为完整的图像帧,之后再经由HD-DMS接口将它输出到显示设备(最终输出由外部线缆延伸出的DVI接口实现,用户若有需要还可以将它转接成D-Sub模拟输出)。从形式上看起来,这套方案看起来很像当年3Dfx的Voodoo2 SLI方案,但两者存在根本性的差异。Voodoo2 SLI中外部数据线传输的是模拟显示信号,而CrossFire从卡输出至主卡的是数字显示信号,两者的渲染模式也大不相同,这一点我们会在下一个部分深入分析。
在CrossFire系统中,驱动程序绝对是一个重要的角色,它负责对每块显卡的时钟频率进行自动控制,并在必要的时候达到同步。CrossFire系统的“同步”概念并不要求两块显卡必须工作在同样的时钟频率,只要求二者都是一个基准频率的整数倍即可。为了与多种形式的显卡配合,驱动程序还可以灵活调整主卡的像素管线。例如,ATI现在发布的所有CrossFire显卡都拥有16条像素管线,但在与12管线的家用显卡协作时,主卡的4条管线可被驱动程序禁用。虽然主卡将因此出现明显的性能损失,但整体来看,构建出的CrossFire系统所拥有的图形效能肯定优于16管线的单卡方案。这种灵活调节的机制也让CrossFire具有极好的适应性,用户在使用过程中不需要担心GPU芯片不一致导致双显卡协作困难的问题。此外,CrossFire系统的主从卡在工作时需共享一些系统内存,这样每块显卡都能使用到所有数据,而不要求为每个帧作单独处理,内存资源的分配也是由驱动程序负责掌管。最后,驱动程序还会根据运行程序和渲染模式的不同为每块显卡配置不同的命令队列,保证并行渲染工作可以顺利进行。
多渲染模式与超级反锯齿
除了协作方式迥异外,CrossFire的渲染模式与SLI技术也有巨大的差别。在SLI系统中,两枚GPU同时渲染一个图像帧,每一帧图像被分为上、下两部分,分别由两枚GPU负责,然后渲染结果再被合成在一起输出。由于游戏画面经常都会遇到上半部分简单、下半部分复杂的情况,对应的渲染任务量也大不相同,为了让两枚GPU可以同步完成两部分画面的渲染工作,nVIDIA还为SLI引入了一项动态负载平衡技术,该技术可根据实际情况对画面作不同比例的实时划分。例如,在赛车游戏中,上半部分的天空变化极小,对应的渲染任务就很轻,而下半部分场景剧烈变动,承担绝大多数渲染工作。此时,SLI的动态负载平衡机制就可以发挥效应,它可以将画面划分为2:1的非均等模式,使得两枚GPU负责的渲染量保持一致。每一帧的情况不同,对应的划分规则也要作相应的变化,也就是说,这个画面尺度调整完全是以动态的方式进行,确保SLI系统能够始终工作在效率最佳的理想状态下。
SLI只能支持上述渲染模式,相比之下,CrossFire在这方面就丰富许多,它不仅可支持类似SLI的“Scissor”分割帧渲染模式,还可支持名为“Supertiling”的棋盘式渲染和“Alternate frame rendering”交替帧渲染等两种模式。
Supertiling“棋盘式”渲染
Supertiling从字面上来理解就是瓦片式渲染(Tiling,英文瓦片之意),但我们认为称之为“棋盘式渲染”应该更贴切一些。在这种渲染模式下,每个图像帧都会被分成若干32×32像素的方形小区域(类似国际象棋棋盘上的黑格和白格),每个小区域就是GPU渲染的基本单位,CrossFire主卡与从卡以交叉轮流的方式渲染这些小区域,然后主卡上的合成引擎将所有渲染完毕的小区域合并为完整的渲染图像帧。从示意图上看,主卡与从卡分得的渲染图案酷似棋盘图形(图4)。
Supertiling渲染方式最大的优点就是任务量的分布非常均匀,由于每个渲染区域只有32×32像素大小,即便运行画面上下两部分复杂度差异甚大的赛车游戏,Supertiling渲染模式也可保证两块显卡负载平衡,而不会出现一块显卡不堪重负,而另一块显卡却处于等待状态的糟糕情形。在这样的理想协作模式下,CrossFire系统的实际效能可相当于两块显卡之和,这也是双卡系统所能实现的最高水准。
不过,Supertiling渲染虽可让CrossFire系统的效能获得充分发挥,但它在兼容性方面有所牺牲。ATI表示,只有D3D游戏才可以使用该种渲染模式,而所有的OpenGL游戏都无法选择Supertiling渲染。其次,Supertiling模式成功地实现了渲染任务的均等分配,这就要求CrossFire主卡与从卡必须具有相同的效能,如果两块显卡在工作频率或像素管线数量上有所区别,CrossFire系统就会对速度快的显卡进行调整—要么适当降低工作频率、要么关闭若干条像素管线,以保证两块显卡能够实现同步运作。
Scissor分割帧渲染
对于所有无法采用Supertiling渲染的OpenGL游戏来说,CrossFire所提供的Scissor分割帧渲染应该是理想的选择之一。实际上,该种方式与nVIDIA SLI的渲染机制如出一辙,都是将画面分成上下两个部分,由两枚GPU分别负责渲染,然后统一合成输出。当然,Scissor也遇到当初nVIDIA SLI遇到的难题。如果画面上下两部分图像所需要的渲染工作量相差悬殊,很可能令两块显卡无法协调工作,出现一块显卡先期完成任务处于等待状态,而另一块显卡仍处于繁忙状态的情形。前面我们介绍过,SLI的解决办法是引入动态平衡负载技术,渲染画面的比例可根据任务量作动态的调整,令两块显卡成功实现了同步渲染。而CrossFire的Scissor渲染模式也引入类似的机制,它可支持6:4或7:3的比例来划分画面,一定程度缓解了问题。但不幸的是,CrossFire无法支持动态调节机制,画面比例必须在事先确定,且在渲染的过程中也不会作动态调整,因此很难获得完美的平衡效果。可以预见,对于某些场景变化频繁的3D游戏,若选择Scissor渲染模式将无法充分发挥出CrossFire系统的真正效能。
尽管Scissor在平衡负载方面不如Supertiling模式,但它却拥有极好的兼容性。Scissor分割帧渲染可适用于所有的3D游戏,不管它是支持微软D3D还是OpenGL API。另外,如果用户的CrossFire系统主从显卡运算力不均等,选择Scissor渲染模式或许可获得更出色的效能表现。
交替帧渲染
Alternate Frame Rendering交替帧渲染是CorssFire系统提供的第三种渲染方式。该模式不再采用画面分割、分别渲染的套路,而是由两块显卡对图像帧作交替渲染,其中,主显卡负责渲染奇数帧,从卡负责渲染偶数帧,然后再将结果传回由合成引擎芯片负责合成输出。这种模式在实现上最为简单,它也可同时支持D3D和OpenGL两种API,但如果用户采用主从卡不相同的组建方案,速度最快的显卡就必须与较慢的卡看齐,否则将无法协调工作步调。如果我们将Alternate Frame Rendering渲染模式与ATI当年的Rage Fury Maxx显卡作对比,便会发现两者的渲染方式如出一辙,区别仅在于Rage Fury Maxx为双芯片显卡,而CorssFire系统则采用两块独立的显卡。
超级反锯齿模式
虽然CrossFire比SLI具有更广泛的适用性,但仍然有一些早期游戏无法从这个多GPU方案中获得大幅度的效能增益。为平衡这方面的损失,ATI为CrossFire加入一项名为“Super AA(Antialiasing)”的超级反锯齿技术。该技术的着眼点在于,尽管两枚GPU都在渲染整个场景,但它们分别采用各自的反锯齿采样点,当从卡渲染的图像帧传到主卡后,合成引擎会将反锯齿的效果合而为一,整套CrossFire系统就可实现提高一倍的反锯齿效果。换句话说,虽然这部分游戏无法从CrossFire中体验到近乎翻倍的效能,但游戏的画面效果可得到明显的改善,这一点明显比nVIDIA的SLI系统更富人性化。
接下来,我们更进一步了解CrossFire的Super AA反锯齿技术拥有什么样的威力。众所周知,nVIDIA的GeForce 6系列最高只能支持8X FSAA模式,尽管此时画面品质可得到非常显著的改善,但游戏性能下降也非常明显—当分辨率超过1024×768时,游戏几乎无法顺畅运行,反锯齿运算对硬件资源的消耗相当惊人。而ATI的Radeon X800和X850系列则只支持6X FSAA模式,规格上略逊于对手,但在CrossFire系统中,ATI的劣势获得根本性扭转。凭借并行运算的威力,CrossFire最高可实现14X反锯齿运算,创下该领域的最高纪录。其实,GPU本身的FSAA模式并没有什么变化,Radeon X850 CrossFire版显卡本身最高也只能支持6X FSAA模式,但如果主从卡都工作在4X FSAA模式,CrossFire系统就可对应8X FSAA效果;如果主从卡工作在6X FSAA模式,CrossFire系统便实现了12X FSAA。不过,ATI对此仍不知足,它们认为完全依靠FSAA抗锯齿技术将难以实现更完美的效果,为此CrossFire系统还增加了SSAA反锯齿模式。SSAA(Supersample Antialiasing,超级采样抗锯齿)的做法是预先在更高的分辨率下渲染整个场景,然后对图像进行重新取样,合成为想要的分辨率输出。SSAA反锯齿在提高画面质量方面效果极其明显,但它最大的毛病就是对硬件要求太高,开启后会严重影响效能,故被业界逐渐弃用。但对于CrossFire系统情况就大不相同,双卡并行的超强运算力足够支持SSAA反锯齿运算,CrossFire系统的反锯齿能力由此可提升到10X AA(4X FSAA+4X FSAA+2X SSAA)和14X AA(6X FSAA+6X FSAA+2X SSAA)的水平,让3D游戏的画面质量更上一层楼。
有必要提到的是,Super AA超级反锯齿功能并不只是对早期的游戏有意义,只要用户愿意,可以在任何时候开启这项功能,而不管CrossFire平台上运行的是什么游戏、采用何种渲染方式。这项技术让ATI的CrossFire系统在功能上稳步领先于nVIDIA的SLI平台,而后者显然没有将双显卡的威力充分挖掘出来。
CrossFire芯片组
芯片组是CrossFire系统的重要组成部分,ATI在发布多款CrossFire显卡同时,也同期推出与之配套的Radeon Xpress 200 CrossFire芯片组。顾名思义,Radeon Xpress 200 CrossFire是ATI先前推出Radeon Xpress 200芯片组的CrossFire版本,那么除此之外它还带来哪些改进呢?
RD480/RD400北桥
Radeon Xpress 200 CrossFire可同时支持AMD和Intel两大平台,其中,AMD平台版本的开发代号是RD480,针对英特尔平台的CrossFire芯片组代号则为RD400,而这两者的前一代型号分别是RS480和RS400。
与RS480相比,新推出的RD480在整体规格上几乎没什么变动,区别只在于RD480的PCI Express ×16图形接口可以分拆为两个×8模式,因此RD480可以对应两条PCI Express图形接口,组建CrossFire双显卡平台。从技术上讲,双×8方案显然不如双×16方案来得完美,如果工作在极端条件下接口带宽有可能会出现瓶颈。但比较幸运的是,这种“极端条件”看来远还没有出现,PCI Express×8方案所能提供的4GBps带宽在绝大多数时候都可以很好满足需要。而退一步说,nVIDIA的SLI系统也面临着同样的问题,CrossFire平台在这方面并不显得逊色。还有必要注意一点,RD480在提供PCI Express ×16图形接口的同时,也直接支持4个PCI Express ×1扩展通道,它的地位就好像是系统的PCI Express控制中枢。相比之下,其他多数芯片组都是由南桥来实现PCI Express ×1扩展功能,RD480此种设计会在I/O传输效率上具有一定的优势—来自PCI Express ×1扩展设备的I/O数据只需经过更短的传输通道就能够到达内存,响应速度比常规设计更快、传输效率更高。
针对英特尔平台的RD400也是类似的情况,但它在上一代RS400基础上追加了对Intel Pentium D双核心处理器的支持,内存控制器的规格也提升至最高的双通道DDR2-800方案—这也是目前英特尔平台芯片组的最高规格了。但可惜的是,Pentium D处理器的前端总线限制在800MHz或1066MHz,只要双通道DDR2-533方案就可满足需要,搭载速度更快的内存无法带来明显的效能增益。
在推出第一代Radeon Xpress 200芯片组时,北桥整合的Radeon X300核心被外界认为是最大的亮点。这项设计在RD480/RD400中也得到保留,虽然整合图形核心无法作为CrossFire系统的一部分,但却可以同CrossFire系统同步工作实现多显示输出。ATI方面表示,RD480/RD400主板的整合显卡可驱动两个显示器(要求主板提供两个DVI/D-Sub显示接口),CrossFire主卡也可提供两个显示输出,而从卡也具有同样的威力。这样,整套系统便能够驱动多达六个显示器,创下消费PC在多显示方面的最高纪录。但要实现最高等级的多显示输出,系统中的两块显卡必须保持相互独立,无法捆绑在一起构成CrossFire平台。
ATI IXP450与ULi M1575南桥
在推出RD480/RD400的同时,ATI也发布了与之相配的IXP450南桥芯片。我们知道,现时的Radeon Xpress 200平台采用的是ATI自家的IXP400南桥,但该款南桥功能相当薄弱,不仅没有支持High Definition Audio音效,也缺乏必需的以太网功能,主板厂商必须使用第三方的控制芯片。此外,IXP400的磁盘接口规格也明显落后于同时代的产品,甚至在USB接口设计上都存在Bug。由于IXP400的可用性太差,多数主板厂商都不愿意采用,而是以ULi出品的M1573南桥来代替IXP400。ATI当然希望能够改变这种情况,此番推出的IXP450南桥被寄以厚望。
IXP450在音频和磁盘接口方面有了明显的改进,它可以支持八声道High Definition Audio音效,加入了串行ATA和RAID功能,也修正了USB接口的Bug。但不幸的是,它依然没有整合十分关键的网络功能,而且在磁盘接口方面的努力也未能跟上主流步伐。现时的主流技术是串行ATA 2.0接口、NCQ原生命令队列和RAID5阵列模式,但IXP450都无法提供,它在规格上看起来更像是前一代的产品,整体功能甚至还不如ULi推出已久的M1573南桥。但对ATI来说,主板厂商大量采用第三方南桥让它颇感尴尬,为此极力鼓动合作伙伴使用IXP450南桥,并许诺问题总会解决。游说看来起到了一定的效果,至少在刚过去的Computex台北电脑展上,有不少厂商展出采用IXP450南桥的CrossFire主板,虽然在同时这些厂商也对IXP450抱怨频频。
在ATI努力提升南桥规格的同时,ULi并没有停止不前,该公司目前已推出为CrossFire平台量身定制的M1575南桥。M1575是M1573的后续,它在功能上又比前代产品有了明显的进步,除了可支持High Definition Audio技术外,还加入串行ATA 2.0、RAID 5阵列等一系列先进功能,其他方面的规格也一应俱全,完全可媲美Intel ICH7、nVIDIA MCP-04等新一代南桥,当然也明显优于ATI自家的IXP450。很自然,M1575获得主板厂商的广泛认可,华硕、技嘉两个主板大厂率先表示将在RD480/RD400主板中搭载M1575芯片,预计M1575将可以顺利击败IXP450成为主流的解决方案。
关于芯片组开放授权的争议
尽管有M1575南桥的强援,芯片组仍然是CrossFire系统中最薄弱的一环。而nVIDIA在该领域的绝对优势人所共知—AMD平台,nForce4系列早已成为最受认可的产品,高端用户普遍对nForce4系列青睐有加,SLI自然成为双卡系统中唯一的选择。英特尔平台,nVIDIA后来推出的nForce4 Intel Edition是无可争议的旗舰之作,而Intel自家的i945/955X系列也都可以支持SLI系统。毋庸置疑,SLI已然在芯片组领域抢占了制高点,这将明显增强SLI系统对高端用户的吸引力。两相对比,我们可以看到ATI在该领域处于明显劣势地位,前次推出的Radeon Xpress 200固然受到广泛关注,但市场成绩十分不理想,南桥功能的不足令它难以进入高端领域;而新推出的Radeon Xpress 200 CrossFire虽然在规格上有所进步,但它仍然难以对高端用户产生多少吸引力,ATI不仅无法借助芯片组来推广CrossFire平台,反而必须依赖CrossFire来拉动芯片组业务,这不可避免让该平台的吸引力大打折扣。
面对严峻的形式,开放CrossFire技术授权无疑是最英明的做法。其实,无论是组建CrossFire系统还是组建SLI系统,理论上都只要求主板提供两个PCI Express ×16插槽,并以一定的方式分享×16通路即可,但如果没有取得ATI或nVIDIA的技术授权,芯片组厂商就无法推出这样的产品,否则便构成侵权。对nVIDIA来说,它在芯片组领域已经拥有巨大的影响力,并不着急将SLI全面开放—Intel i945/955X能够支持SLI其实是与nVIDIA交换授权的结果。可对ATI来说情况恰恰相反,全面开放授权无疑会对推广CrossFire平台非常有利,但ATI方面普遍担忧此举将给自身芯片组业务产生重大打击,所以它们更可能倾向部分授权的方式。据悉,ATI目前正与SiS洽谈CrossFire授权事宜,虽然SiS在芯片组领域对ATI威胁不大,但SiS在高端领域几乎一片空白,即便它能够很快推出支持CrossFire运作的芯片组,也很难提升CrossFire平台的竞争力。至于英特尔方面,i945/955X已可支持SLI双显卡运作,ATI表示说它们应该都能够支持CrossFire双卡系统。而在AMD平台,ATI自家的RD480将承担重任,而nForce 4理论上虽然也可支持CrossFire,但我们不应指望nVIDIA会如此慷慨。
迈向并行显卡时代
毫无疑问,CrossFire系统在功能上有一定的优势,但高端用户更为看重的应该是它的实际效能。一些国外网站率先对CrossFire、SLI两大平台进行对比评测,除显卡和主板外,两套平台都采用相同的硬件配置,并运行《DOOM3》的Demo。实际测试成绩让人们充分领略到CrossFire“交叉火力”的强大威力:在单卡运行时,Radeon X850XT PE CrossFire显卡明显落后于nVIDIA的GeForce 6800 Ultra,但组成CrossFire双卡系统后,实测成绩一举超过采用双GeForce 6800 Ultra的SLI平台,CrossFire的高效率在此获得充分体现。而在更换新的催化剂驱动后,CrossFire系统的测试成绩可进一步提升,整体上稍领先于nVIDIA SLI平台。虽然这个结果不足以让我们作出CrossFire性能全面优于SLI的结论,但至少可说明CrossFire不会在性能上落后对手,加之在功能、使用便易性和兼容性等指标上全面占优,CrossFire对高端玩家来说显然会有相当不错的吸引力。
面对CrossFire的现实威胁,nVIDIA显然不会停止不前,该公司表示将开发第二代SLI技术,除了芯片组可能将支持双×16通道外,其他的细节还不得而知。ATI也计划将于年内推出第二代CrossFire芯片组RD500/580。新款产品将会在现有RD400/480基础上增加双×16支持,这样nVIDIA、ATI双方事实上又将处于同一条起跑线上。此外,双方的下一代GPU芯片发布在即,对应的SLI和CrossFire系统都将实现性能大跃进,新一轮的图形争霸战即将打响,对此我们将拭目以待。