中高端显卡市场一战封神　NVIDIA GeForce RIX 3070首发测评

来源 :微型计算机 | 被引量 : 0次 | 上传用户：laoshuzhuimao

【摘要】

：

【作者】

：

《微型计算机》评测室

【出处】

：

微型计算机

【发表日期】

：

2020年22期

【关键词】

：

架构核心单元光线张量模块

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　2020年10月29日，NVIDIA在Ampere架构显卡全球发布会上首先公布的三款新一代GeForceRTX 30系显卡的最后一位成员-GeForce RTX 3070（后文简称RTX 3070，RTX 3080、RTX 3090同）如期而至。相对于先推出的RTX 3080-卡难求、玩家持币待购的高冷和高高在上“俯视众生”的RTX 3090，首发价格499美金、国内上市酋发价格为3899元起的GeForce RTX 3070显然更接地气。仅比RT×2070SUPER稍高一点的价格，是否真有超越RTX 2080 Ti的表现？这样的RTX 3070，会不会成为新一代的中高端游戏神卡？本期，我们就将用RTX 3070公版及6款非公版产品来一探究竟！
　　全面超越RTX 2080 Ti
　　GeForce RTX 3070 FounderSEdition评测解析
　　复习：NVIIDIA Ampere架构特色
　　在进行RTX 3080显卡的首发评测时，我们就已经对NIVIDIA新一代的Ampere核心进了详细的解析。作为Ampere架构GPU家族第三名亮相的成员，RTX 3070自然也继承了Ampere架构的所有特色技术，在这里我们来简单地复习—下。我们可以将Ampere架构的核心技术归结为三点（更详细的关于Ampere架构的技术解析，请参考本刊RTX 3080首发评测文章）。
　　全新的SM模块，CUDA翻倍
　　SM （Streaming Multi-processer，流式多处理器模块）模块—直是NIVIDIA GPU的计算核心，在新的GA10X核心的Ampere架构上，由于计算任务的变化，GA10X的SM模块也有了巨大的变化。
　　在之前的图灵SM模块的单个计算单元配置上（4个SM计算单元组成一个SM模块），每个SM模块中的计算单元拥有1个warp调度单元和1个派遣单元，16384 x32bit寄存器、1 6个FP32內核和16个INIT32内核，2个张量核心以及后端的LD/ST单元、特殊功能单元（Special Function Unit，简称SFU）等。
　　在新的GA10X Ampere SM的计算单元内部，依1日配置了1个warp调度单元和1个派遣单元、16384x32bit寄存器和后端LD/ST、SFU单元，但是在计算的部分却包含了1组16个可自由执行FP32和INIT32计算的双功能计算单元（ALU）-它们既可以完成FP32计算，又可以完成INIT32计算，另外还包含了1组16个FP32计算单元和1个新的第三代张量核心。这样，同为4个SM计算单元组成的SM模块，GA10XAmpere架构拥有等效128个CUDA核心（极致情况下），相当于图灵核心的两倍。
　　这对游戏性能有什么影响？是的，影响很大。我们知道，图形计算、现代着色器工作负载通常使用FP32算术指令，同时FP32加速也有助于光线追踪降噪着色器。光线追踪渲染工作负载越大，Ampere核心GPU相对于上一代产品的性能提升越大。
　　第二代RT Core光追核心
　　图灵架构为游戏引入实时光线追踪，轰动一时，为游戏带来了逼真的光照、图像质量、游戏玩法和沉浸感、阴影和特效，并带来超出想象的游戏画质表现。
　　Ampere架构的第二代RT Core的性能提升一倍，带来2倍于Turing第一代RT Core的吞吐量，同时支持光线追踪和着色，使光线追踪性能达到全新高度。换而言之，光线追踪使用率越高，速度提升越大！同时第二代RT Core还引入了动态模糊等重要特性。
　　NVIDIA Ampere架构的RT Core将光线交汇处理速度提高一倍，同时支持光线追踪与着色。光线三角形吞吐量增加一倍，Ampere架构的RT Core可达39.7 RT TFLOPS，Turing架构为23.8 RT TFLOPS，提升巨大。
　　第三代Tensor Core张量核心
　　Tensor Core可加速用于深度神经网络处理功能的线性代数，这是现代Al的基础。全新第三代Tensor Core加速AI功能，例如用于Al超分辨率的NIVIDIA DLSS和用于Al增强的声画处理技术NVIDIA Broadcast应用。
　　从本质上讲，Tensor Core让DLSS能够加快游戏速度，同时带来高画质图像，甚至更细致的图像。借助第三代Tensor Cores的性能，NIVIDIA Ampere架构GPU上的DLSS性能得到进一步增强。伴随Ampere显卡的发售，目前DLSS已经进化到了2.1版本，支持最高9X的游戏帧速率加速，这对于防止在高分辨率下开启光追效果后的游戏帧率下跌有着非常重要的意义。
　　从规格上来看，RTX 3070完全就是RT×3080的简化版，SM模组降低到了46组，比RTX 3080少了22组，按照NIVIDIA对Ampere核心的CUDA数量定义，每一个SM模组中包含128个CUDA核心（含64个FP32/INT32混合核心）来看，RTX 3070就刚好比RTX 3080少281 6个CUDA核心，也就是为5888个。同样，SM模组少了22个也直接导致RTX 3070在RT Core上也比RT×3080少了22个（22xl），为46个。而在Tensor Core张量核心上，RTX 3070相比RTX 3080则少了88个（22×4），为1 84个。而在显存的配置上，或许是出于对性价比的追求，RTX 3070并没有配置RTX 3090和RTX 3080上使用的高速GDDR6X显存，而仍然为8GB GDDR6，显存速率为14Gbps（等效显存频率7000MHz），相比RTX 3080配置的19Gbps的10GB GDDR6X有一定差距。所以，综合RTX 3070和RTX 3080的规格参数差异来看，初步估计RTX 3070与RTX 3080之间的性能差异大致应该在平均30%上下。　　再从命名上看RTX 3070相对于上一代同定位产品的对比。相对于RTX 2070仅有2304个CUDA核心而言，RTX 3070的5888个CUDA核心近乎带来了2.5倍的数量提升，此外在纹理单元、ROPs、RT Gore等参数上也有不小的增幅（详见附表）。不过在显存类型和容量上，RTX 3070则与RTX 2070完全一样。我们知道，对NIVIDIA GeForce GPU来说，CUDA核心数量一直以来都是最为核心与关键的参数，也会对GPU的3D图形性能带来最直接的影响。但同时又必须要指出，对Ampere核心的GPU来说，无论是RTX 3090、RTX 3080还是今天的主角RTX 3070，其CUDA核心数量都是在极限情况下的理论值（也就是SM中的FP32/INIT32混合运算单元全部用于FP32计算时），而在实际应用中几乎不会出现。因此必须要考虑实际应用中CUDA核心数量会在标称值的50%—100%可用的范围内波动，结合之前我们测试的RTX 3080相對于RTX 2080的性能增幅，我们可以保守地估计RTX 3070的性能相对RTX 2070应该会有50%以上的超越或更高。
　　NIVIDIA在Ampere架构显卡全球首发的时候曾提及RTX 3070的游戏性能将超过RTX 2080 Ti，这到底是不是噱头？其实从规格参数上来看，RTX 3070仅在理论CUDA核心数量上相对于RTX 2080 Ti有明显优势。而在显存、纹理单元、RT Core数量、Tensor Core数量等众多参数上，RTX 3070都不如RTX 2080 Ti。不过考虑到RTX 3070配置的是更先进、执行效率更高的第二代RT Core光追核心和第三代Tensor Core张量核心，因此数量上的损失也未必不能用效率来弥补。同时，理论CUDA核心数量的增幅也有效地弥补了一部分显存等的弱势带来的性能损失。因此，综合来看，RTX 3070的性能超越RTX 2080 Ti是很有可能的，但这个幅度应该不会太大。
　　RTX 3070赏析，这一代公版Ampere显卡真美
　　首先来看—下RTX 3070 Founders Edition的真容！在我们看来，无论是RTX 3090、RTX 3080还是这次的RTX 3070，在工艺和外观上设计上，真的是做得太棒了（参考左侧图）！
　　在风格上，RTX 3070仍然沿袭了RTX 3080与RTX 3090冷酷与时尚并重的浓郁“全金属”风格。金属质感的香槟银配色外框搭配黑色硕大的散热片非常优雅。与RTX 3080和RTX 3090不同的是，RTX 3070采用了正面双风扇的散热设计而不是此前那种前吸后吹的正反双风扇的散热结构。这应该与RTX 3070本身功耗相对较低有直接关系。
　　到底RTX 3070的性能表现如何？在游戏、创作等各个不同的领域内是否能如NVIDIA所说超越上一代的旗舰RTX 2080 Ti？相对于上一代的对位产品RTX 2070来说，它的性能提升到底有多大？我知道你们都等急了，下面让我们马上进入实际测试。
　　NVIDIA GeForce RTX 3070产品资料
　　GPU： NVIDIA GA104-300（GeForce RTX 3070）
　　CUDA数量：5888个（理论最大值）
　　Tensor Core：184（第三代）
　　RT Core： 46（第二代）
　　显存：8GB GDDR6@14Gbps
　　TGP功耗：220W
　　参考价格：3899元
　　性能实测，意外惊喜超越RTX 2080 Ti
　　从RT×3070的定位来看，它应该是NIVIDIA在中高端市场上布局的核心产品，毕竟其首发价格仅为3899元，而目前市场上部分高频版的RTX 2070 SUPER都差不多这个价位，更不要提目前仍然在5000元价位的RT×2080 SUPER了。
　　我们准备从两个方面去考察RT×3070的性能表现——游戏和NVIDIA倡导的RT×Studio创作性能。在对比测试的显卡选择上，自然是以上一代的对位产品RT×2070为主，同时为了验证RTX 3070是否已经全面超越了RT×2080 Ti，我们也将RT×2080 Ti列入了对比对象的名单。
　　测试平台
　　显卡：NVIDIA GeForce RTX 3070 FE、RTX 2070FE、RTX 2080 Ti FE
　　处理器：Intel酷睿i9-10900K
　　主板：Intel 2490
　　内存：芝奇皇家战戟32GB DDR4 3200（双通道）
　　硬盘：Intel 750 PCle SSD l.2TB
　　显示器：DELL VP3218K（7680x4320@60Hz）
　　电源：Tt ToughPower1200W
　　注：本次RTX 3070公版及非公版产品评测皆为此平台，后文及专题其余评测文章内不再赘述。
　　首先用3DMark这个公认的显卡3D性能权威测试软件进行显卡的测试毫无疑问，相信大家已经非常熟悉。而在游戏测试部分，我们选择了9款同时支持光追和DLSS的3A级游戏大作、7款不支持光追和DLSS的大型3D游戏以及一款只支持DLSS不支持光追的3D游戏大作来进行综合的测试。我们希望在各种复杂的游戏场景中，通过光追、DLSS和普通游戏这三种典型场景，来检测RTX 3070的综合游戏性能表现。同时，我们考虑到RTX 3070的中高端市场定位，因此在游戏测试部分我们统一不取1080p分辨率的成绩，而使用2.5K（2560 x1440）以及4K《3840×2160）两个分辨率下的测试成绩来进行对比衡量。　　3DMark理论成绩
　　在3DMark Port Royal测试中，RTX 3070居然小负于RTX2080 Ti或许是由于在RT Gore数量上RTX 3070仍有较小的劣势，或者是3DMark目前的Port Royal测试对于第二代光追核心的优化还不是很到位？
　　除此之外，RT×3070的表现确实非常亮眼——在几乎所有项目的测试中都相对于RTX 2080 Ti有小幅度的性能提升——平均约5%上下。而在與上一代对位显卡RT×2070的比较上，RT×3070相对于前者则表现出了50%—60%的3DMark理论性能成绩的提升。
　　光追 DLSS双支持游戏测试
　　在光追与DLSS的支持下，尤其是在改进的、更高效的第二代RT Gore与第三代Tensor Core的支持下，RT×3070的光追游戏性能有怎样的改变？为此，我们也特别选择了9款同时支持实时光线追踪与DLSS的3D游戏大作进行了测试，它们是：《控制》《德军总部：新血脉》《地铁：离去》《堡垒之夜》《边境》《光明记忆：无限》《战地V》《逆水寒

其他文献

房价问题与中国社会各阶级分析

在今天的中国,所谓房价问题,已远远不只是房子问题,而是财富分配的杠杆、阶级分化的标志。　　　　中国百姓的财富分配1949年后有两次大的变化。一次从上世纪50年代开始,各个社会阶层经济上的差别尽量消除。第二次变化在上世纪80年代以降,因两个原因而迅速拉大。一是职业分工,下海经商、官员寻租、外企甚至民企国企的高薪阶层等。二是同在工薪阶层,收入、地位接近,却仅仅因为十几年内买卖房子的机遇、运气、策略不同

期刊

阶级房价房产税房子政府收入

是基因测病还是街头算命？

有介绍基因检测的文章提到某被检测者“患哮喘的几率很可能低于平均值”，这简直跟街头摆摊算卦的有一拼了—那就是无论你将来出现哪种情况，他们的检测结果都可以自圆其说。　　　　基因测的是疾病易感性　　　　时至今日，如果有哪个高人说他可以通过某种手段预知您哪天可能遭到雷击或出车祸而且如果你愿意破财，他可以化解之，您一定会对其嗤之以鼻。可若有人说如今一项低额的基因检测就能帮你找到身体健康方面的最大威胁，您信么

期刊

基因疾病易感人类就能细胞

三大运营商合推SG消息短信业务迎来“革命”

4月8日，中国移动、中国电信、中国联通共同发布了《5G消息白皮书》，将5G消息正式带入了大众的视野。同时，华为、小米、OPPO，中兴等11家终端厂商也纷纷为其站台，可谓是一时风光无限，赚足眼球。那么，5G消息是什么，它又能给我们的生活带来哪些改变？让我们通过本文来一探究竟。　　什么是5G消息？　　想必很多用户首次看到5G消息时，会想当然地将它和当下热门的5G联系到一起，认为它是5G所催生的全新应用

期刊

消息业务用户短信运营商企业

以高性价比为“羽翼”罗技K845机械键盘＆雷神KL30无线RGB机械键盘

虽然推出搭配黑科技和独特设计的产品，固然能彰显自己的研发实力。但为了巩固已有的市场份额，无论是新晋品牌，还是老牌强者，依然需要推出高性价比产品来完成这一保障。作为一线外设厂商，罗技自然深谙这个道理，所以他们于最近推出了售价平易近人的K845机械键盘。与之相对的则是以游戏本为基础，切入外设领域没几年的雷神，它也在同段时间推出了主打高性价比的KL30无线RGB机械键盘。那么它们究竟能带给玩家怎样的体验

期刊

键盘罗技机械雷神的是这款

秒搭家庭数据中心体验联想个人云存储T1

生活在如今这个信息化的时代，每一个人都被各种电子设备所围绕——手机、平板、笔记本电脑、PC……随之而来的是它们在工作、生活中产生的大量数据：文件、照片、视频等等。在免费网盘市场已经萎缩到可以忽略不计的今天，不少人都在为这些数据寻找一个能方便存储，集中管理，并可以跨平台、跨设备随时随地共享的地方。对于公有云在隐私性、访问速度等方面的疑虑让很多人偏向搭建属于自己的私有云。但对于这类设备不那么熟悉的消费

期刊

用户硬盘备份数据功能设备

自研芯片液态镜头小米首款折叠屏手机MIX FOLD发布

3月30日，小米公司在小米科技园举办2021年春季新品发布会，会上正式发布了旗下首款折叠屏手机小米MIX FOLD，其搭载自主研发的澎湃C1 专业影像处理器，并全球首发手机液态镜头，可谓看点十足。　　作为小米首款折叠屏手机，小米MIX FOLD 采用了U 型铰链设计，在重量和可靠性方面都有较大的提升，重量降低27%，可靠性弯折测试达到20 万次，极限可靠性弯折测试最高可达100 万次。小米MIX

期刊

小米售价刷新率系列真我首款

我们的经济是一个困局

任何一种改革,都是资源的重新分配,而在我们现今缺乏自由的市场背景下谈论改革,或多或少像一部轻喜剧,台上的人卖力表演,台下的人,要么鼾声如雷,要么含笑不语。　　　　一国之经济,自有它内在的格局。20世纪80年代,一群经济学家试图使用传统的经济学经验与技巧来解释国家经济的可持续发展,“经济自由度指数”从此粉墨登场。大名鼎鼎的弗里德曼和其他几位推崇自由市场经济的学者参与其中。他们从管理控制、定价、货币政

期刊

的人经济都是市场自由每个人

错以为是照片的逼真画作

博主:B型血的兔子　　http://blog.sina.com.cn/s/blog_4ca92fe10100mrj2.html?tj=1　　　　链接:你有没有看过那种画得极其真实、细腻的画,就像下面的图片—让你错以为是照片,或是要想一想才能确定不是照片。画家们认为,他们的画,内涵远远超过照片,因为他们在描绘物体的时候,运用了他们全部的判断力,创造出的作品,其影响与原始的照片完全不同。

期刊

照片他们的让你就像要想判断力

来一份白色的信仰 ROG-STRIX-RTX3080-010G-WHITE显卡深度评测

相信在不少玩家的印象中，显卡的配色多以黑色、灰色为主，而白色则是非常罕见的配色。在GeForce RTX 30系列显卡上市之后，显卡厂商纷纷在显卡外观设计上推陈出新，以往极为罕见的白色也作为主色调被应用在显卡的外观设计上，本文将和大家分享的ROG-STRIX-RTX3080-O10G-WHITE显卡就是当下“白色显卡”中的颜值担当。当然，从MC的读者调查结果来看，除了颜值，玩家同样看重一款显卡的性

期刊

显卡这款散热风扇系列显卡风扇轴流

钢琴与钢琴师

根据我的观影经验,以音乐家为题材的电影,再差也查不到哪里去,至少可以听到好听的音乐。所以,这一类的影碟可以放心大胆地收藏。但有几部关于钢琴家的影片,其翻译过来的片名总是容易把人弄糊涂。于是,我最近专门将这几部影片的片名做了梳理:简坎皮恩导演,霍利亨特和哈威凯特尔主演的《钢琴别恋》,迈克尔哈内克导演,伊莎贝尔于佩尔主演的《钢琴教师》,罗曼波兰斯基导演,阿德里安布洛迪主演的《钢琴师》,朱塞佩托纳多雷导

期刊

影片钢琴钢琴师自己的的是导演

中高端显卡市场一战封神 NVIDIA GeForce RIX 3070首发测评

与本文相关的学术论文

中高端显卡市场一战封神　NVIDIA GeForce RIX 3070首发测评