论文部分内容阅读
不管是驱动不够成熟还是架构设计问题,总之AMD R9 Fury X的性能表现相当不稳定,在主流的1080p分辨率下,它还不及对手的次旗舰GTX 980Ti。只有在4K分辨率下它才能力挽狂澜,和对手最顶级的GTX TITANX一较高下。可能对大多数AFans来说,Fury X的表现没能达到他们的预期,只有能耗比相比前代大幅提升,差不多追平对手这一点让粉丝们稍感安慰。就在大家以为Fiji核心的表演将在次旗舰Fury的发布后落下帷幕时,AMD又再次发布了一款基于Fiji核心的产品——R9 Fury nano。不为别的,就单看其TDP功耗在Fury X的基础上降低了100W这一点,它就足够让所有AFans为之兴奋。这一次,AMD似乎真的准备在能耗比上逆袭NVIDIA的Maxwell了!实际情况如何?谜底马上为你揭晓……
用AMD的话来说,Fury nano并不是一款临时添加的产品,它早就出现在了AMD的发布计划中。只是在临近正式发布前,都还没有最终确认它的核心和具体规格,所以显得nano更神秘一些。其实更早的时候MC确实从AMD Fury X发布会现场获知了nano的存在,只是那时候nano究竟是不是基于Fiji核心都还未知,所以我们并没有报道。而在之后的逐步披露中,我们逐渐获知nano依旧是一款基于Fiji核心的产品,更让人在意的是它的官方参数中,TDP功耗仅175W,与之对比Fury X的TDP官方参数都高达275W。由此我们开始猜测Fury nano会在完整Fiji核心的基础上大幅度阉割计算规格、大幅度降低工作频率,将被AMD定位到低功耗mini游戏PC系统中。
完整Fiji单8Pin!
现在Fury nano正式发布,事实证明,我们的猜测犯了经验主义错误,nano不仅拥有完整的4096个流处理器,其频率还高达1000MHz。对比参数表你会发现,Fury nano相对Fury X仅仅是核心最高频率降低了50MHz,其他诸如显存规格、光栅、纹理单元等在内的所有重要参数均完全一致。也就是说Fury nano也使用了完整的Fiji显示核心,而不像Fury那样屏蔽了不少硬件单元。所以我们看到在理论计算眭能上Fury nano和Fury X的差距只来自频率的差异,Fury X理论计算能力达到8.6TFLOPs,Fury nano也高达8.19TFLOPs,远超过Fury的7.16TFLOPs。显存带宽则保持了HBM系统的优势,和Fury、FuryX一样达到了惊人的512GB/s。在此基础上,Fury nano却大幅降低了能耗,TDP降低到175W,外接供电也由FuryX的双8Pin削减至了单8Pin。
至于Fiji核心的架构,我们在首次评测R9 Fury X的时候已经有过比较详细的介绍。这里只把两个需要特别注意的重点再做)2,梳理,以帮助读者更好地理解该架构的特性,尤其是有关DirectX 12的相关架构设计。以便读者更容易理解接下来我们的评测重点,以及R9 Fury nano在DirectX 11、DirectX 12两种API游戏模式下的成绩变化趋势。
1、ACE(Asynchronous Compute Engine)异步计算单元
在解析R9 Fury×的时候,我们就重点介绍过ACE异步计算机制,这是DX12的一个重要底层改变。是否支持ACE异步着色,也可以看作是衡量一张显卡是否能良好支持DX12 API的重要指标。ACE机制允许将复杂的串行渲染负载分解为多个可以并行执行的简单负载,使得工作的并行度更高,减少GPU内处理单元的闲置率。借此能在同硬件平台下,挖掘出更强的硬件性能,为玩家提供更高级的画面特效。而且这种任务分拆机制,还非常适合虚拟现实渲染时的多重渲染应用环境。毫无疑问,跟R9 Fury X一样使用了完整Fiji核心的Fury自然也完全具备这种任务拆分处理能力。以往的DX11上,不同任务使用GPU内中不同模块的计算资源,但都得等待前续任务结束后才会被执行。在R9 Fury系列上,它们将在同一时间内被送往GPU中的不同功能模块,完成并行处理,很显然比以往的显卡架构效率高出不少。很明显,一款显卡中拥有的ACE处理单元越多,越利于大任务拆分,越利于并行运算。Fiji拥有8个硬件ACE处理模块,这里之所以要强调硬件,是相对于软件支持而言,这样的方式效率显然更高,更契合DX12回归“底层”设计、增强运算效率的理念。从这个角度看,早在HD 7000系列起就开始引入ACE硬件单元,在R9 290X上就已经将ACE扩展到8组规模的AMD GCN架构确实一早就做好了迎接DX12的准备。
2、HBM高带宽优势助力并发计算
在之前的R9 Fury X首发测试中,我们就已经详细介绍过HBM(High Bandwidth Memory,高带宽显存)。它高达4096bit的显存位宽让我们印象深刻,而仅4G B的总容量也让不少玩家不爽,总让人觉得在高分辨率下,它的显存系统会不够用。坦白说,就当前游戏普遍还在使用1080p的贴图精度情况来看(4K分辨率也只是拉伸填充,绝大多数游戏并没有使用真的4K超高清纹理贴图设计),Fury系列很少会在当前游戏的4K超高清分辨率下遇到爆显存危机。在我们测试Fury X时,已经证明了这一点,其在4K超高清分辨率下的表现相对低分辨率甚至更好,能扳回低分辨率时的颓势,部分游戏还反超了对手的旗舰显卡。毫无疑问,使用了同样的Fiji核心,基予旧同的GCN2.0架构,Fury nano的显存容量也不太需要玩家担心,反而应该期待它在高分辨率下的表现。倘若真的遇到会让Fury nano爆显存的超高分辨率、高特效设定,那也多半不是单张显卡就能胜任的图形处理需求了。此时HBM在DX12下的另一特性,CrossFirex之后,显存容量叠加的优势又将凸显。2张显卡8GB、3张显卡12GB的显存容量,绝对能在当下的游戏中游刃有余。 在这里,我们觉得有必要强调的是,HBM不再被安放在PCB上,而是和GPU焊接在同一块硅基板上的特性,不仅赋予了Fury系列显卡更节省PCB空间的优势。而且HBM直接通过硅基中阶层和GPU连接就好比内部缓存一样,延迟和功耗相对GDDR5系统都更低。这赋予了Fiji架构更高效的并行数据吞吐能力,对大量异步计算需要高并行数据存取需求的DX12应用来说,这无疑又是一剂强心针。
15cm身材让对手“羡慕嫉妒恨”
ITX显卡的要求是长度低于17cm,一般来说在18cm以内的产品都不会在ITX机箱上遇到安装兼容性问题。更别提一些标榜安装兼容性的mini ITX机箱,能将显卡安装长度扩展到300mm左右,足以安装顶级产品。但对一部分追求极致小体积的mini PC用户来说,如何能在尽可能小的体积内,搭建出性能尽可能强的PC是他们永恒不变的研究课题。小体积、高性能反差越强烈的产品,越能获得他们的芳心。就这个角度来说,使用了旗舰级显示核心的Furynano应该是他们的不二之选。得益于HBM显存的使用,Fury X已经将PCB长度压缩到18cm以内。Furynano在此基础上进一步降低了PCB长度至15cm,且因转而使用风冷散热,卸下了安装水冷排的包袱,让Fury nano彻底瘦身,可以随意进入各种mini机箱。
公版风冷设计得相当用心
在R9 Fury X发布之初,AMD就一再强调过,使用水冷并非Fiji发热量巨大,风冷压制不住。而是综合了各种因素,期望给玩家提供更好游戏体验而选择了水冷。借此,Fury X即使长时间高负载游戏,核心温度也不超60℃,风扇噪音依旧跟待机时相差无几,这赋予了它极高的使用舒适性。Fury nano改用风冷,除了想瘦身,印证自己所言非虚可能也是AMD的用意之一。但无论怎么看,要在不足15cm长度的空间上设计出压制Fiji核心的风冷散热器都是个不小的挑战。为此,AMD祭出了均热板加独立热管模块加焊接洞状鳍片的组合,就风冷散热来说,这完全就是秀工艺的具体表现。总之,我们在公版Fury nano上看到了一款设计非常精巧的全覆盖吸热底座系统,用料和做工都堪称风冷系统中的顶级。
毫无疑问,实际游戏性能永远是玩家关心显卡的第一要素。我们的测试自然遵循以性能为基础,综合考量显卡功耗、温度、噪音等表现。于以往不同的是,得益于《奇点灰烬Benchmark》的公布,我们首次在显卡测试中加入了DXl2项目,而不再是单纯的DX12 DEMO欣赏。借此,我们终于有机会来初窥两大显示核心巨头的架构究竟谁对DX12的支持更好。
性能:“up to”1000MHz!动态频率拖累整体表现
单从规格参数表看,我们想读者们都会有Fury nano性能介于Fury X与Fury之间的主观揣测。这和我们的第一感觉是一致的,但实际测试结果却显得更加复杂,并不像我们想象中这么简单,接下来让我们具体问题具体分析……
vs R9 Fury X差距比想象中更大
Fury nano在规格表上,仅比Fury X低50MHz核心频率而已,频率差距幅度仅5%。就算Fiji显卡性能与频率能成线性正比关系,Fury nano顶多也只会比Fury X低5%左右的性能。但我们的测试结果却与此大相径庭,Fury nano的性能无论是在3DMark等理论测试软件中,还是实际的游戏帧数对比中,都明显落后Fury X,落后幅度多数情况下都超过了10%。实际上在多数测试中,Fury nano的表现还不及阉割了512个流处理器的Fury。这是怎么回事?这跟AMD官方给出的理论计算能力排名严重不符。其实这都是动态频率惹出来的麻烦。从R9 200系列开始,AMD跟随行业大潮,开始在规格表中标注所谓的上限频率,对应NVIDIAB卡就是核心Boost频率。只不过与NVIDIA同时标注基础和上限频率不同,AMD只告诉用户这款显示核心最高能到多少,而基础频率则完全是个动态值。理解了这个概念,玩家们就应该能够猜到问题了,是的,Fury nano在实际高负载运行中的核心频率并不如我们想象中那么高,远远达不到1000MHz。我们用软件在游戏后台实时监控了核心频率的变化,在绝大多数时间里,Fury nano的核心频率都没有超过850MHz,基本在780MHz~830MHz之间变化。与之对比,Fury X很多时候都以1000Mhz左右的频率在工作。这样的问题在不少用户看来,不免有AMD有意忽悠消费者的嫌疑。为了帮助读者们更准确、深入地了解和评价动态频率,MC觉得有必要向大家介绍一下AMD核心频率控制机制的基本原理。其实说简单点,就是显卡会根据实时负载中核心耗电和发热量水平,来动态调整频率,以免显卡超过预先设定的TDP或者出现供电不足。请注意这两个重要参数,一个是TDP一个是供电。在前文的介绍中我们已经强调过,Fury nano的一大特色就是TDP比Fury X低100W,带来的改变就是风冷散热替代了水冷。而另一大特色就是外接供电由Fury X的双8Pin改为了单8Pin。很显然,前一个变化让Fury nano对核心发热量的控制更加敏感。因为设计得再精巧的风冷散热器,也没有办法像水冷系统一样为显卡提供极高的TDP冗余度,那么只能从降低TDP发热的角度去弥补。而后者则是将显卡的最大供电能力从150W(单8Pin理论最大值) 150W 75W(PCI-E接口理论供电量)总计375W,大幅下调到了150W 75W总计225W的水平。这150W的供电差距决定了Fury nano没有办法同时喂饱处于高频、持续高强度运行的核心和显存,必须要有所取舍,降低核心频率无疑能大幅降低功耗开支。综上两点,Fury nano完全不具备持续高频稳定运行的条件,得到这样的测试结果也就在情理之中了。而AMD宣称中的高达(“up to”)1000MHz,也许只有在温度情况良好的环境中,偶尔达到吧。 vs GTX 980低分辨率依旧水土不服
Fu ry nano的定位是顶级mini游戏PC,遗憾的是,NVIDIA产品线中没有定位与之类似的产品。旗舰级做不到这么小,能做小的最高就到GTX 970。而GTX 970无论是规格还是定价,都完全不是Fu rVnano的对手。就售价来说,Fury nano介于GTX980Ti和GTX 980之间,且与GTX 980在供电和TDP需求上与之类似。因此,我们对比测试了GTX980Ti和GTX 980。测试结果比较有意思,1080p、2560×1440和4K,三个分辨率设定,获得了三个截然不同的结果。Fury nano完全沿袭了Fury X的特性,低分辨率表现相对糟糕,高分辨率开始反击。1080p分辨率下,除了理论测试力压GTX 980外,实际游戏平均帧对比中Fury nano基本全面落败。但落后幅度并不太大,平均没有超过5%。分辨率提升到2560×1440后,游戏平均帧基本和GTX 980持平。等分辨率提高到4K,Fury nano则开始全面逆袭,开始大幅度领先GTX 980,平均帧甚至逼近更高一级的GTX 980Ti。在多款游戏的4K分辨率测试中,Fury nano相比GTX 980的领先幅度都超过了20%,比3DMark等理论测试软件中的领先幅度都还高。另外,就以往测试中GTX 970普遍落后GTX 980 15%左右的性能来说,这样的性能对比结果等于是宣布了最强mini显卡桂冠的易主。在mini TX体积的显卡中,Fury nano绝对是当之无愧的性能王。倘若设一个性能/体积比的排名,Fury nano毫无疑问能以巨大的优势问鼎。
能耗比:超越Maxwell的新高度!
Fury X在能耗比上的大幅度进步,让我们印象深刻。也是基于此,我们对Fury nano的能耗比表现异常关注,甚至超过了对性能的关注程度。实际测试结果也确实没有让我们失望,借助动态频率调整机制,Fury nano虽在绝对性能上不及我们预期,但却成功降低了核心耗电量和发热量。在同平台拷机测试中,它的能耗比Fury X低了120W左右,实际游戏能耗低大约60W。这跟官方宣传的TDP功耗低1 00W算是基本吻合的。对比对手供电需求相当的GTX 980,Fury nano的实际游戏功耗与之相当,拷机功耗则略低。综合以上实际性能表现(尤其是高分辨率下的成绩),相比Fury X,Furynano确实在能耗比上获得再一次提升,不是比肩而是超越了同功耗水平的Maxwell架构显卡。只不过体积过小的单风扇风冷散热系统太难做到完美,通常都只能在散热性能和噪音控制中偏重其一。在Furynano上,AMD毫无疑问选择了散热性能。满载是核心依旧只有75℃,一些搭载了三风扇散热系统的旗舰卡都未必能有如此表现。缺点自然是满载时,Fury nano散热风扇转速有点高,噪音比较明显。
实际上我们知道,在同架构产品中,能耗、发热和频率的关系往往不是线性的,而更倾向于指数型。频率提高带来的性能提升幅度,远远没有能耗和发热量的提升幅度大。Fury nano定位的是mini游戏PC,在相对狭小、散热流动性较差的miniPC环境中,低能耗比和低发热量往往比绝对性能显得更重要,是长时间稳定运行的基础。就此说,AMD在Furynano上牺牲性能换能耗的做法其实是非常符合定位需求的,只是过高的up to频率参数诱导了玩家过高的性能预期。
DX12首秀:GCN架构显然更具预见性
《奇点灰烬Benchmark》的出现,让我们有机会首次体验DX12游戏的魅力。先说我们在这款DX12游戏上感觉到的变化,首先是多单位的个性处理。在以往DX11的游戏中,遇到大量单位同时出现的游戏场景时,难免出现动作、运行轨迹和角度的重复性,也就是简化计算资源,一资源多用的典型。而在《奇点灰烬Benchmark》中,你仔细观察会发现,在多单位同时出镜的场景中,每个单位的动作、轨迹会显得更加个性,重复性大幅降低。而且同屏烟雾、火焰效果变得相当丰富,层次感大幅提升。这在以往的DX11游戏中是比较难想象的,资源耗费无疑非常巨大。而DX12更接近底层设计的优势,让硬件的潜力被充分挖掘,让以往的一些不可能变得有可能实现。这其中,ACE异步计算无疑是尤为值得一提的功臣,也是DX12整体效率更高的一个重要原因。
接下来我们分别在DX11和DX12两个模式下,测试了各款显卡在《奇点灰烬Benchmark》中的表现。结果比较让人意外,AMD基于Fiji核心的三款显卡都能在DX12中获得大幅提升,平均帧率相对DX11模式提高了20%甚至更多。而NVODIA基于Maxwell的GTX 980Ti和GTX980的情况恰恰相反,DX12下的表现相比DX11模式不升反降。GTX 980在DX12模式中完全不是Fury nano的对手,被拉开了高达50%的性能差距。GTX980Ti也只能与Fury X握手言和,以小幅优势胜过Fury nano。这足以证明Fiji内合8个独立ACE硬件处理模块的实用性,这显著提高TAMD GCN架构在DX12时代的运行效率,充分挖掘出了计算资源占优,但计算资源利用效率一向偏低的GCN架构显卡的潜力。可以预见包含R9 390系列和R9 290系列在内的搭配了多达8个ACE硬件处理模块的显卡,都将因DX12的异步计算机制而受益。
与之相比,NVIDIA显卡的糟糕表现不得不让我们怀疑Maxwell架构压根就没有设计独立的ACE硬件处理模块。这里必须提到一个小插曲,考虑到《奇点灰烬》的开发商Oxide多年来一直都是AMD的合作伙伴,从Mantle问世时就在合作。所以难免会有人怀疑这个基准测试的公正性,一如之前NVIDIA在Gameworks游戏中被人怀疑的那样。所以开发商Oxide也不得不作出公开回应,并指出了NVIDIA显卡在游戏中表现不佳是因为不能完善支持ACE异步运算,这也侧面印证了我们的猜疑。
MC点评:
最强mini卡,没有之一!
测试到此告一段落,继R9 Fury X之后,R9 Fury nano的性能表现可能再次不及玩家们的预期,但是能耗比表现却再创新高。抛开它使用了旗舰显示核心的立场,仅仅将它定位到mini ITX领域的话,那么它无疑很好地完成7AMD交给它的任务,可谓当前全球最强的mini显卡,没有之一。在对手仅能拿出GTX 970mini的背景下,R9 Fury nano毫无疑问地会成为性能控mini游戏PC玩家的最佳选择。另外,得益于Fiji架构对ACE异步计算机制的纯硬件支持,R9 Fury nano在未来DX12游戏中的表现自然更加值得玩家们期待。就当前NVIDIA还没能完全适应DX12节奏,没有吃透ACE机制的情况看,基于GCN架构的AMD显卡无疑赢得了先机。
用AMD的话来说,Fury nano并不是一款临时添加的产品,它早就出现在了AMD的发布计划中。只是在临近正式发布前,都还没有最终确认它的核心和具体规格,所以显得nano更神秘一些。其实更早的时候MC确实从AMD Fury X发布会现场获知了nano的存在,只是那时候nano究竟是不是基于Fiji核心都还未知,所以我们并没有报道。而在之后的逐步披露中,我们逐渐获知nano依旧是一款基于Fiji核心的产品,更让人在意的是它的官方参数中,TDP功耗仅175W,与之对比Fury X的TDP官方参数都高达275W。由此我们开始猜测Fury nano会在完整Fiji核心的基础上大幅度阉割计算规格、大幅度降低工作频率,将被AMD定位到低功耗mini游戏PC系统中。
完整Fiji单8Pin!
现在Fury nano正式发布,事实证明,我们的猜测犯了经验主义错误,nano不仅拥有完整的4096个流处理器,其频率还高达1000MHz。对比参数表你会发现,Fury nano相对Fury X仅仅是核心最高频率降低了50MHz,其他诸如显存规格、光栅、纹理单元等在内的所有重要参数均完全一致。也就是说Fury nano也使用了完整的Fiji显示核心,而不像Fury那样屏蔽了不少硬件单元。所以我们看到在理论计算眭能上Fury nano和Fury X的差距只来自频率的差异,Fury X理论计算能力达到8.6TFLOPs,Fury nano也高达8.19TFLOPs,远超过Fury的7.16TFLOPs。显存带宽则保持了HBM系统的优势,和Fury、FuryX一样达到了惊人的512GB/s。在此基础上,Fury nano却大幅降低了能耗,TDP降低到175W,外接供电也由FuryX的双8Pin削减至了单8Pin。
至于Fiji核心的架构,我们在首次评测R9 Fury X的时候已经有过比较详细的介绍。这里只把两个需要特别注意的重点再做)2,梳理,以帮助读者更好地理解该架构的特性,尤其是有关DirectX 12的相关架构设计。以便读者更容易理解接下来我们的评测重点,以及R9 Fury nano在DirectX 11、DirectX 12两种API游戏模式下的成绩变化趋势。
1、ACE(Asynchronous Compute Engine)异步计算单元
在解析R9 Fury×的时候,我们就重点介绍过ACE异步计算机制,这是DX12的一个重要底层改变。是否支持ACE异步着色,也可以看作是衡量一张显卡是否能良好支持DX12 API的重要指标。ACE机制允许将复杂的串行渲染负载分解为多个可以并行执行的简单负载,使得工作的并行度更高,减少GPU内处理单元的闲置率。借此能在同硬件平台下,挖掘出更强的硬件性能,为玩家提供更高级的画面特效。而且这种任务分拆机制,还非常适合虚拟现实渲染时的多重渲染应用环境。毫无疑问,跟R9 Fury X一样使用了完整Fiji核心的Fury自然也完全具备这种任务拆分处理能力。以往的DX11上,不同任务使用GPU内中不同模块的计算资源,但都得等待前续任务结束后才会被执行。在R9 Fury系列上,它们将在同一时间内被送往GPU中的不同功能模块,完成并行处理,很显然比以往的显卡架构效率高出不少。很明显,一款显卡中拥有的ACE处理单元越多,越利于大任务拆分,越利于并行运算。Fiji拥有8个硬件ACE处理模块,这里之所以要强调硬件,是相对于软件支持而言,这样的方式效率显然更高,更契合DX12回归“底层”设计、增强运算效率的理念。从这个角度看,早在HD 7000系列起就开始引入ACE硬件单元,在R9 290X上就已经将ACE扩展到8组规模的AMD GCN架构确实一早就做好了迎接DX12的准备。
2、HBM高带宽优势助力并发计算
在之前的R9 Fury X首发测试中,我们就已经详细介绍过HBM(High Bandwidth Memory,高带宽显存)。它高达4096bit的显存位宽让我们印象深刻,而仅4G B的总容量也让不少玩家不爽,总让人觉得在高分辨率下,它的显存系统会不够用。坦白说,就当前游戏普遍还在使用1080p的贴图精度情况来看(4K分辨率也只是拉伸填充,绝大多数游戏并没有使用真的4K超高清纹理贴图设计),Fury系列很少会在当前游戏的4K超高清分辨率下遇到爆显存危机。在我们测试Fury X时,已经证明了这一点,其在4K超高清分辨率下的表现相对低分辨率甚至更好,能扳回低分辨率时的颓势,部分游戏还反超了对手的旗舰显卡。毫无疑问,使用了同样的Fiji核心,基予旧同的GCN2.0架构,Fury nano的显存容量也不太需要玩家担心,反而应该期待它在高分辨率下的表现。倘若真的遇到会让Fury nano爆显存的超高分辨率、高特效设定,那也多半不是单张显卡就能胜任的图形处理需求了。此时HBM在DX12下的另一特性,CrossFirex之后,显存容量叠加的优势又将凸显。2张显卡8GB、3张显卡12GB的显存容量,绝对能在当下的游戏中游刃有余。 在这里,我们觉得有必要强调的是,HBM不再被安放在PCB上,而是和GPU焊接在同一块硅基板上的特性,不仅赋予了Fury系列显卡更节省PCB空间的优势。而且HBM直接通过硅基中阶层和GPU连接就好比内部缓存一样,延迟和功耗相对GDDR5系统都更低。这赋予了Fiji架构更高效的并行数据吞吐能力,对大量异步计算需要高并行数据存取需求的DX12应用来说,这无疑又是一剂强心针。
15cm身材让对手“羡慕嫉妒恨”
ITX显卡的要求是长度低于17cm,一般来说在18cm以内的产品都不会在ITX机箱上遇到安装兼容性问题。更别提一些标榜安装兼容性的mini ITX机箱,能将显卡安装长度扩展到300mm左右,足以安装顶级产品。但对一部分追求极致小体积的mini PC用户来说,如何能在尽可能小的体积内,搭建出性能尽可能强的PC是他们永恒不变的研究课题。小体积、高性能反差越强烈的产品,越能获得他们的芳心。就这个角度来说,使用了旗舰级显示核心的Furynano应该是他们的不二之选。得益于HBM显存的使用,Fury X已经将PCB长度压缩到18cm以内。Furynano在此基础上进一步降低了PCB长度至15cm,且因转而使用风冷散热,卸下了安装水冷排的包袱,让Fury nano彻底瘦身,可以随意进入各种mini机箱。
公版风冷设计得相当用心
在R9 Fury X发布之初,AMD就一再强调过,使用水冷并非Fiji发热量巨大,风冷压制不住。而是综合了各种因素,期望给玩家提供更好游戏体验而选择了水冷。借此,Fury X即使长时间高负载游戏,核心温度也不超60℃,风扇噪音依旧跟待机时相差无几,这赋予了它极高的使用舒适性。Fury nano改用风冷,除了想瘦身,印证自己所言非虚可能也是AMD的用意之一。但无论怎么看,要在不足15cm长度的空间上设计出压制Fiji核心的风冷散热器都是个不小的挑战。为此,AMD祭出了均热板加独立热管模块加焊接洞状鳍片的组合,就风冷散热来说,这完全就是秀工艺的具体表现。总之,我们在公版Fury nano上看到了一款设计非常精巧的全覆盖吸热底座系统,用料和做工都堪称风冷系统中的顶级。
毫无疑问,实际游戏性能永远是玩家关心显卡的第一要素。我们的测试自然遵循以性能为基础,综合考量显卡功耗、温度、噪音等表现。于以往不同的是,得益于《奇点灰烬Benchmark》的公布,我们首次在显卡测试中加入了DXl2项目,而不再是单纯的DX12 DEMO欣赏。借此,我们终于有机会来初窥两大显示核心巨头的架构究竟谁对DX12的支持更好。
性能:“up to”1000MHz!动态频率拖累整体表现
单从规格参数表看,我们想读者们都会有Fury nano性能介于Fury X与Fury之间的主观揣测。这和我们的第一感觉是一致的,但实际测试结果却显得更加复杂,并不像我们想象中这么简单,接下来让我们具体问题具体分析……
vs R9 Fury X差距比想象中更大
Fury nano在规格表上,仅比Fury X低50MHz核心频率而已,频率差距幅度仅5%。就算Fiji显卡性能与频率能成线性正比关系,Fury nano顶多也只会比Fury X低5%左右的性能。但我们的测试结果却与此大相径庭,Fury nano的性能无论是在3DMark等理论测试软件中,还是实际的游戏帧数对比中,都明显落后Fury X,落后幅度多数情况下都超过了10%。实际上在多数测试中,Fury nano的表现还不及阉割了512个流处理器的Fury。这是怎么回事?这跟AMD官方给出的理论计算能力排名严重不符。其实这都是动态频率惹出来的麻烦。从R9 200系列开始,AMD跟随行业大潮,开始在规格表中标注所谓的上限频率,对应NVIDIAB卡就是核心Boost频率。只不过与NVIDIA同时标注基础和上限频率不同,AMD只告诉用户这款显示核心最高能到多少,而基础频率则完全是个动态值。理解了这个概念,玩家们就应该能够猜到问题了,是的,Fury nano在实际高负载运行中的核心频率并不如我们想象中那么高,远远达不到1000MHz。我们用软件在游戏后台实时监控了核心频率的变化,在绝大多数时间里,Fury nano的核心频率都没有超过850MHz,基本在780MHz~830MHz之间变化。与之对比,Fury X很多时候都以1000Mhz左右的频率在工作。这样的问题在不少用户看来,不免有AMD有意忽悠消费者的嫌疑。为了帮助读者们更准确、深入地了解和评价动态频率,MC觉得有必要向大家介绍一下AMD核心频率控制机制的基本原理。其实说简单点,就是显卡会根据实时负载中核心耗电和发热量水平,来动态调整频率,以免显卡超过预先设定的TDP或者出现供电不足。请注意这两个重要参数,一个是TDP一个是供电。在前文的介绍中我们已经强调过,Fury nano的一大特色就是TDP比Fury X低100W,带来的改变就是风冷散热替代了水冷。而另一大特色就是外接供电由Fury X的双8Pin改为了单8Pin。很显然,前一个变化让Fury nano对核心发热量的控制更加敏感。因为设计得再精巧的风冷散热器,也没有办法像水冷系统一样为显卡提供极高的TDP冗余度,那么只能从降低TDP发热的角度去弥补。而后者则是将显卡的最大供电能力从150W(单8Pin理论最大值) 150W 75W(PCI-E接口理论供电量)总计375W,大幅下调到了150W 75W总计225W的水平。这150W的供电差距决定了Fury nano没有办法同时喂饱处于高频、持续高强度运行的核心和显存,必须要有所取舍,降低核心频率无疑能大幅降低功耗开支。综上两点,Fury nano完全不具备持续高频稳定运行的条件,得到这样的测试结果也就在情理之中了。而AMD宣称中的高达(“up to”)1000MHz,也许只有在温度情况良好的环境中,偶尔达到吧。 vs GTX 980低分辨率依旧水土不服
Fu ry nano的定位是顶级mini游戏PC,遗憾的是,NVIDIA产品线中没有定位与之类似的产品。旗舰级做不到这么小,能做小的最高就到GTX 970。而GTX 970无论是规格还是定价,都完全不是Fu rVnano的对手。就售价来说,Fury nano介于GTX980Ti和GTX 980之间,且与GTX 980在供电和TDP需求上与之类似。因此,我们对比测试了GTX980Ti和GTX 980。测试结果比较有意思,1080p、2560×1440和4K,三个分辨率设定,获得了三个截然不同的结果。Fury nano完全沿袭了Fury X的特性,低分辨率表现相对糟糕,高分辨率开始反击。1080p分辨率下,除了理论测试力压GTX 980外,实际游戏平均帧对比中Fury nano基本全面落败。但落后幅度并不太大,平均没有超过5%。分辨率提升到2560×1440后,游戏平均帧基本和GTX 980持平。等分辨率提高到4K,Fury nano则开始全面逆袭,开始大幅度领先GTX 980,平均帧甚至逼近更高一级的GTX 980Ti。在多款游戏的4K分辨率测试中,Fury nano相比GTX 980的领先幅度都超过了20%,比3DMark等理论测试软件中的领先幅度都还高。另外,就以往测试中GTX 970普遍落后GTX 980 15%左右的性能来说,这样的性能对比结果等于是宣布了最强mini显卡桂冠的易主。在mini TX体积的显卡中,Fury nano绝对是当之无愧的性能王。倘若设一个性能/体积比的排名,Fury nano毫无疑问能以巨大的优势问鼎。
能耗比:超越Maxwell的新高度!
Fury X在能耗比上的大幅度进步,让我们印象深刻。也是基于此,我们对Fury nano的能耗比表现异常关注,甚至超过了对性能的关注程度。实际测试结果也确实没有让我们失望,借助动态频率调整机制,Fury nano虽在绝对性能上不及我们预期,但却成功降低了核心耗电量和发热量。在同平台拷机测试中,它的能耗比Fury X低了120W左右,实际游戏能耗低大约60W。这跟官方宣传的TDP功耗低1 00W算是基本吻合的。对比对手供电需求相当的GTX 980,Fury nano的实际游戏功耗与之相当,拷机功耗则略低。综合以上实际性能表现(尤其是高分辨率下的成绩),相比Fury X,Furynano确实在能耗比上获得再一次提升,不是比肩而是超越了同功耗水平的Maxwell架构显卡。只不过体积过小的单风扇风冷散热系统太难做到完美,通常都只能在散热性能和噪音控制中偏重其一。在Furynano上,AMD毫无疑问选择了散热性能。满载是核心依旧只有75℃,一些搭载了三风扇散热系统的旗舰卡都未必能有如此表现。缺点自然是满载时,Fury nano散热风扇转速有点高,噪音比较明显。
实际上我们知道,在同架构产品中,能耗、发热和频率的关系往往不是线性的,而更倾向于指数型。频率提高带来的性能提升幅度,远远没有能耗和发热量的提升幅度大。Fury nano定位的是mini游戏PC,在相对狭小、散热流动性较差的miniPC环境中,低能耗比和低发热量往往比绝对性能显得更重要,是长时间稳定运行的基础。就此说,AMD在Furynano上牺牲性能换能耗的做法其实是非常符合定位需求的,只是过高的up to频率参数诱导了玩家过高的性能预期。
DX12首秀:GCN架构显然更具预见性
《奇点灰烬Benchmark》的出现,让我们有机会首次体验DX12游戏的魅力。先说我们在这款DX12游戏上感觉到的变化,首先是多单位的个性处理。在以往DX11的游戏中,遇到大量单位同时出现的游戏场景时,难免出现动作、运行轨迹和角度的重复性,也就是简化计算资源,一资源多用的典型。而在《奇点灰烬Benchmark》中,你仔细观察会发现,在多单位同时出镜的场景中,每个单位的动作、轨迹会显得更加个性,重复性大幅降低。而且同屏烟雾、火焰效果变得相当丰富,层次感大幅提升。这在以往的DX11游戏中是比较难想象的,资源耗费无疑非常巨大。而DX12更接近底层设计的优势,让硬件的潜力被充分挖掘,让以往的一些不可能变得有可能实现。这其中,ACE异步计算无疑是尤为值得一提的功臣,也是DX12整体效率更高的一个重要原因。
接下来我们分别在DX11和DX12两个模式下,测试了各款显卡在《奇点灰烬Benchmark》中的表现。结果比较让人意外,AMD基于Fiji核心的三款显卡都能在DX12中获得大幅提升,平均帧率相对DX11模式提高了20%甚至更多。而NVODIA基于Maxwell的GTX 980Ti和GTX980的情况恰恰相反,DX12下的表现相比DX11模式不升反降。GTX 980在DX12模式中完全不是Fury nano的对手,被拉开了高达50%的性能差距。GTX980Ti也只能与Fury X握手言和,以小幅优势胜过Fury nano。这足以证明Fiji内合8个独立ACE硬件处理模块的实用性,这显著提高TAMD GCN架构在DX12时代的运行效率,充分挖掘出了计算资源占优,但计算资源利用效率一向偏低的GCN架构显卡的潜力。可以预见包含R9 390系列和R9 290系列在内的搭配了多达8个ACE硬件处理模块的显卡,都将因DX12的异步计算机制而受益。
与之相比,NVIDIA显卡的糟糕表现不得不让我们怀疑Maxwell架构压根就没有设计独立的ACE硬件处理模块。这里必须提到一个小插曲,考虑到《奇点灰烬》的开发商Oxide多年来一直都是AMD的合作伙伴,从Mantle问世时就在合作。所以难免会有人怀疑这个基准测试的公正性,一如之前NVIDIA在Gameworks游戏中被人怀疑的那样。所以开发商Oxide也不得不作出公开回应,并指出了NVIDIA显卡在游戏中表现不佳是因为不能完善支持ACE异步运算,这也侧面印证了我们的猜疑。
MC点评:
最强mini卡,没有之一!
测试到此告一段落,继R9 Fury X之后,R9 Fury nano的性能表现可能再次不及玩家们的预期,但是能耗比表现却再创新高。抛开它使用了旗舰显示核心的立场,仅仅将它定位到mini ITX领域的话,那么它无疑很好地完成7AMD交给它的任务,可谓当前全球最强的mini显卡,没有之一。在对手仅能拿出GTX 970mini的背景下,R9 Fury nano毫无疑问地会成为性能控mini游戏PC玩家的最佳选择。另外,得益于Fiji架构对ACE异步计算机制的纯硬件支持,R9 Fury nano在未来DX12游戏中的表现自然更加值得玩家们期待。就当前NVIDIA还没能完全适应DX12节奏,没有吃透ACE机制的情况看,基于GCN架构的AMD显卡无疑赢得了先机。