泡泡网显卡频道 PCPOP首页      /      显卡     /      评测    /    正文

更亲民的”图灵“ 映众GeForce RTX 2070黑金至尊显卡首发评测

    8月20日,NVIDIA在科隆游戏展上发布了全新一代RTX 20系列显卡,全新的Turing”图灵“架构除了可观的性能提升之外,还带来了可以大幅度提升游戏画质的实时光线追踪技术(RTX)和大幅度优化高分辨率下游戏运行效率同时完成抗锯齿作业的“深度学习超采样”(DLSS)技术。而落实到实际产品,黄仁勋除了拿出新一代的旗舰RTX 2080Ti和次旗舰RTX 2080之外,还一起发布了全新的中端主力显卡RTX 2070。随着两款高端显卡的相继解禁和上市销售,RTX 2070也将在今晚迎来评测的解禁和首发销售。我们也提前拿到了来自映众的RTX 2070黑金至尊。RTX 2070是否能够不负众望,撑起未来至少一年里NVIDIA在中端显卡市场的一片天空呢?

RTX 2070规格一览


    RTX 2070使用12nm工艺制造的TU104-350 GPU核心,共2304个CUDA单元,约为RTX 2080Ti的53%。负责光线追踪的RT Cores 达到36个,负责DLSS计算的Tenser Cores达到 288个。显存方面使用了与RTX 2080相同的8GB GDDR6显存,等效频率达到14000MHZ,位宽256bit,映众RTX 2070的标准Boost频率达到1620MHz。TDP方面则只有175W。当然售价方面相比RTX 2080Ti和RTX 2080而言也要亲民许多。 

核心架构解析


    RTX 2070和两位“老大哥”一样也采用了全新一代的“图灵"架构,同样也支持了全新的RTX实时光线追踪和DLSS深度学习超采样技术。

RTX 2070所使用的TU106显示核心

    完整的TU102核心

    通过上面两张图可以看出来,RTX 2070所使用的TU106显示核心事实上是在完整TU102的基础上减半的结果,仅有36个SM单元,除显存位宽外几乎所有的规格都是TU102核心的一半。这与Pascal架构的GTX 1070所所使用的GP104为GP102一般的策略保持一致。

    每一组SM单元中都配备了一个RT Core,以及两两成对的TENSOR Cores。可以看出,至少表面上来看上这一代FP32和INT32单元所占据的晶体管比例其实相对不那么高。从底层来看,这的确是近12年来GPU核心架构变化最大的一代产品。

    把目光聚焦到Tensor Core本身,图灵架构的Tensor Core相对于Pascal上搭载的相同结构的最大变化就是将处理方式从2D平面升级到了3D,这意味着效率将以指数级增长。

    GDDR6显存是基于前一代产品GDDR5X的继续优化产物,通过提升频率到7000MHz(等效14000MHz)将带宽提升到了14Gbps的水平,同时降低了40%的串扰。虽然性能仍然不能与HBM相比,但胜在成本低,良率高,可以持续大规模供货,不会出现显存供货影响显卡销售的隐患。

  光线追踪与实时光线追踪

  传统的光栅化渲染其实将一个3D图形的几何信息转变为一个个栅格组成的2D图像的过程,可以理解为在这个3D图形的每个点都包含有颜色、深度以及纹理数据,经过一系列计算变换后,将其转换为2D图像的像素,进而呈现在显示设备上。更多的是一种基于作者认为“这里应该有这个”的创作性质的图形渲染方式,一定以上来说就是已知结果并把结果写出来,而并不能知道这个结果是正确的还是错误的。

  而光线追踪技术则是通过通过光源位置、射线、和物体关系进行真实的光线模拟运算,来得出这里应该有哪些光线,有怎样的反射关系。这样得出的游戏画面的光影效果也就更加真实。

  光线追踪在以往游戏中的应用都是在游戏的制作中提前进行运算,将得出的结果写到游戏程序中,显卡所做的也仅仅是将已经写好的“台词”念出来。这样的做法意味着无法实现大量且精细的光线追踪,那将意味着海量的计算过程和无比巨大的供调用的结果数据。

  而“实时光线追踪”就是将光线追踪的运算过程拿到游戏过程中来,实时地计算出光线应该投影和反射形成的效果。如果性能足够强大,不仅可以在同样的场景中做到更高数量级的光线追踪效果,游戏画面可以得到显著的提高,还能大幅度降低游戏开发者的运算量。

  如果把图形渲染比喻成一场考试,那么光栅化渲染基本上约等于不会做题目所有的选项都靠直觉来答题;而“光线追踪”则是将尽可能多的题目死记硬背,靠题海战术来完成答卷;而“实时光线追踪”(RTX)技术则是将做题的方式学会,通过聪明的大脑来运算解决遇到的每一个题目。这样毫无疑问,最后一种方式所得到的分数必然要远胜前两者。

  落实到游戏的话,目前宣称支持光线追踪的游戏并不多,由于微软DXR的延期,《古墓丽影:暗影》等游戏虽然已经承诺支持,但并未在首发版本中加入。而另一款NVIDIA演示的RTX游戏《战地V》也延期上市。所以目前还不能玩到支持实时光线追踪技术的游戏。但是相信不久的将来,在NVIDIA的推动下,会有更多的支持RTX技术的游戏来到我们面前。

DLSS深度学习超采样技术


  基于AI人工智能技术的“深度学习超级采样”(DLSS)技术是RTX 20系列显卡除光线追踪外的另一项“黑科技”, 这也是图灵GPU核心中的数量庞大的Tensor Core的用途所在。

  原理是这样的,NVIDIA 使用自己的超级计算机以64 倍于标准分辨率的分辨率运行游戏,绘制出极多的超高画质的画面,再用一定的方式挑选出一些细分画面作为完美渲染的“标准答案”。然后通过DLSS深度学习,将标准分辨率的画面和这些画面进行对比,生成一张最优画面,然后再与全尺寸(64倍超采样)进行对比,得出差别,然后将这些差别反推到神经网络中,进行循环训练。在几轮之后就人工智能网络就可以学会如何将标准画面渲染到接近64倍分辨率原图的方法。

  这些学习结果定期通过软件更新提供给图灵GPU的显卡,通过Tensor Cores,就可以进行实时比对,将较低分辨率的画面“脑补”为正确的高分辨率画面,从而实现画面细节的提升。超采样也消灭了画面中可能存在的锯齿。

  最终的效果就是,要得出一个4K分辨率的高画质反锯齿画面,通过DLSS技术并不需要真的在4K分辨率下渲染画面,实际渲染一个低分辨率画面,通过DLSS技术即可达到需要的效果。这样不仅画质有所保证,还可以大幅度降低游戏的性能需求,游戏的运行效率将大幅度提升。

  虽然效率提升,但画质方面却并不会因为DLSS技术而受到损失,相反的,相比TAA(时间性反锯齿),DLSS技术大量的机器学习可以避免拖影和细节错位,从而获得更好的反锯齿效果。

  相比需要更深度技术基础的实时光线追踪而言,DLSS更加容易实现,所以很多现有的游戏很快就可以经过NVIDIA的运算后支持DLSS技术,运行效率,尤其是4K下的性能会显著提升。目前NVIDIA承诺的DLSS技术游戏包括《绝地求生》《古墓丽影:暗影》《剑侠情缘三》等众多我们熟悉的作品。

  由于需要硬件层面的支持,DLSS技术也是图灵架构GPU的专属功能,前代显卡并不能通过这一技术得到性能上的提高。

    本次我们拿到的是来自映众的GeForce RTX 2070黑金至尊,这是一款采用了公版PCB设计的小尺寸显卡。

    由于采用的是短卡方案,所以散热器方面也将风扇缩减到了两个,正面纯黑色的外壳十分低调,也没有花哨的装饰和“光污染”存在。

    背板上硕大的INNO3D表示显示了它的身份,铝合金材质的背板在GPU核心的位置进行了镂空设计,在起到加固作用的同时也尽可能保证了更好的散热。

    接口部分并没有按照公版方案设计,而是令人意外地将DVI接口进行了回归,以更好适配老款显示器。除此之外,两枚DP1.4接口和一枚HDMI2.0接口均可以支持4K  HDR输出。另外这一代还准备了一枚用于VR头显的USB-C接口。

    散热器方面由于体积的限制,所以并没有像黑金至尊系列的RTX 2080Ti和RTX 2080一样采用均热板设计,转而使用了效率更高的纯铜底座+四热管方案,可以在有限的体积下实现尽可能优良的散热效能。

    PCB部分采用的是NVIDIA公版方案设计,共8相数字供电,接口部分则使用单8Pin。19厘米左右的长度让这块PCB显得非常紧凑。

    显存颗粒部分采用的是来自镁光的GDDR6产品,单颗容量1GB,总容量8GB。

    显示核心代号TU106-400-A1,而没有像人们意料中那样采用TU104加后缀的代号来命名,核心的默认频率1410MHz,Bosst频率达到1620MHz,拥有2304个CUDA核心。

    测试平台方面,我们采用了与RTX系列显卡首测相同的硬件配置,尽可能避免意外因素对成绩的影响。

    酷睿i7-8086K处理器采用Coffee Lake架构,拥有6个物理核心和12个线程,最高睿频可以达到惊人的5.0GHz,是目前游戏性能最为强悍的处理器产品。

    为了更好的展现逼真的游戏画面,我们特意找到了一台来自明基的PD2700U显示器,这是一款27英寸的超窄边框4K HDR显示器产品。采用标准16:9比例的3840x2160分辨率原生10bit面板,并支持HDR10标准。色域方面达到了99% sRGB,除了游戏之外,专业修图也可以胜任。支架也支持旋转升降,使用十分方便。

    为了实时监控系统功耗情况,我们使用了一款来自NZXT的E850全模组电源,额定功率达到850W,转化率达到80Plus金牌认证标准,当然我们选择它的主要原因是自带了负载软件监测功能,可以非常方便地查看显卡、CPU等硬件的实时功耗数据。

基准性能测试


    


可以看到,在DX11项目中映众RTX 2070的性能水平与GTX 1080非常接近,且拥有着5%左右的性能优势。

    而在DX12项目中RTX 2070的性能明显有所增强,相比GTX 1080有着12%的性能优势,甚至已经十分接近GTX 1080Ti的水平,这说明新一代的图灵架构运行DX12程序的效率有明显的提升。

1080P游戏性能测试


2K游戏性能测试


4K游戏性能测试


    整体来看,映众RTX 2070的游戏性能相比GTX 1080有一定的性能优势,在大多数游戏测试中都取得了更好的游戏表现。从绝对帧数来看,RTX 2070的性能完全可以在2K分辨率下流畅运行大多数高画质大作。1080P分辨率下也可以保证电竞游戏打满144Hz以上的高刷新显示器。

    最后是关于NVIDIA黑科技 DLSS技术的测试,从结果来看,在不开启DLSS技术的情况下,RTX 2070的性能基本与GTX 1080保持一致,而开启DLSS技术之后性能表现提升了高达38%,甚至表现已经超越了上代旗舰GTX 1080Ti!事实证明DLSS技术的确可以很大幅度地提高游戏的运行效能。但可惜的是截至目前,暂未有一款完整的支持DLSS技术的游戏面世,我们还需要耐心等待。

功耗发热测试


    功耗发热测试我们在室温25摄氏度的室内采用FurMark进行一段时间的烤机测试,记录最高温度情况。

    双风扇设计的映众RTX 2070黑金至尊满载烤机温度约78摄氏度,不影响正常使用。在仅仅19厘米的超小尺寸下实现这样的散热表现,还是值得肯定的。

    功耗方面,通过CPU和显卡双满载测试,使用CAM软件记录功耗情况。满载峰值功耗在325W左右。实际使用推荐选择450W以上的电源产品。

总结


    RTX 2070作为全新一代的中端主力,在一定程度上相比RTX 2080Ti和RTX 2080有着更多的受众和出场机会。性能上与GTX 1080相仿,实际游戏则有一定的优势存在。完全可以满足最高2K分辨率下的高画质流畅体验。市场零售价预计3999元左右的RTX 2070和价位接近的GTX 1080谁更加值得购买呢?笔者认为,对于画质革命——“实时光线追踪”技术的支持以及未来通过DLSS技术大幅度提升游戏表现的潜力都意味着RTX 2070是一款更具购买价值的产品。当然如果使用小型机箱,映众这款RTX 2070黑金至尊将是你一个非常不错的选择。

本文编辑:孙斌

关注泡泡网,畅享科技生活。

1人已赞

关注我们

泡泡网

手机扫码关注