泡泡网DIY攒机频道 PCPOP首页      /      DIY攒机     /      评测    /    正文

映众RTX 4070 SUPER曜夜显卡评测:4899元,性能价格皆给力

  2024年伊始,NVIDIA一口气推出了3款RTX 40 SUPER系列台式机显卡,希望为广大用户提供更多的攒机选择。目前RTX 4070 SUPER已率先解禁,该显卡起售价4899元,产品定位介于RTX 4070和RTX 4070 Ti之间。

  之前RTX 4070的起售价是4799元,RTX 4070 Ti的起售价6499元。而现在RTX 4070 SUPER的起售价只比RTX 4070高了100元,NVIDIA这个定价笔者是真没想到。在如此定价的背景下,全新的RTX 4070 SUPER性能能够比RTX 4070高出多少,这无疑是很有看点的。

  本篇评测,笔者便利用映众RTX 4070 SUPER曜夜这款新显卡,为大家揭晓答案。

  Ada Lovelace架构与全新的RTX 4070 SUPER

  RTX 4070 SUPER基于英伟达Ada Lovelace架构设计。为了让大家更好地了解到这款新显卡,笔者首先会对Ada Lovelace架构以及所支持的一些重要技术进行介绍。

  (一) RTX 40 SUPER系列台式机显卡第1弹——RTX 4070 SUPER

(RTX 4070 SUPER基于AD104-350显示核心设计,具备56组SM单元)

  RTX 4070 SUPER基于AD104-350显示核心设计,拥有7168个CUDA核心,搭配12GB容量、192bit位宽的GDDR6X显存。

  而之前的RTX 4070基于AD104-250显示核心设计,拥有5888个CUDA核心,搭配12GB容量、192bit位宽的GDDR6X显存。

  RTX 4070 Ti基于AD104-400显示核心设计,拥有7680个CUDA核心,搭配12GB容量、192bit位宽的GDDR6X显存。

  从硬件规格来看,RTX 4070 SUPER更加接近RTX 4070 Ti。

(映众RTX 4070 SUPER曜夜显卡的GPU-Z信息)

  本文选用的映众RTX 4070 SUPER曜夜显卡与RTX 4070 SUPER创始人版保持一致,其GPU频率为1980MHz,Boost频率为2475MHz,显存频率为1313MHz(等效21000MHz)。

  (二) Ada Lovelace架构核心

(Ada Lovelace架构核心)

(Ada Lovelace架构核心GPC单元)

  Ada Lovelace架构核心配备了全新的第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)。根据NVIDIA官方的介绍,Ada Lovelace架构核心所采用的第3代RT Core不仅将光线与三角形求交性能提高了一倍,还将RT-TFLOP峰值性能提高了一倍之多。第3代RT Core还配备了全新的Opacity Micromap (OMM)引擎和Displaced Micro-Mesh (DMM)引擎,进一步提升了光追计算的性能以及减少计算开销,带来了更好的光线追踪效果表现。Ada Lovelace架构核心配备的第四代Tensor Core引入了来自专业级H100数据中心GPU的FP8 Transformer引擎带来了更加强悍的AI算力。

(第三代RT Core结构示意图,相比前代,增加了2个功能)

  Ada Lovelace架构核心在SM单元上引入了Shader Execution Reordering(SER着色器执行重排序)技术来更好的对于着色器的工作进行调度排序,在使用上可以根据不同的负载需求来执行渲染,可对负载较为统一的画面进行渲染,降低工作开销。根据英伟达官方的介绍,这一个SER功能将作为API开放给开发者使用。英伟达官方宣称,SER功能的加入至高可带来两倍RT Core性能上的改善,对于光追游戏来说更可带来体验的升级。根据NVIDIA官方的数据,全新的SM(流式单元处理器)可带来至高两倍的性能以及能效升级,这一项升级不可谓不小。

(Ada Lovelace架构核心SM结构图)

  Ada Lovelace架构核心除了第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)的升级以外,带来了全新的第八代NVENC硬件编码器,这一全新的第八代NVENC硬件编码器整合了对AV1视频编码格式的支持,可以在传统的H.264等格式之外,加入了对AV1这一主流新标准的支持,可以进行对于AV1格式的编码与解码,有效提升了生产力方面的表现,对于创作型用户、游戏主播等群体来说更是如虎添翼。来自NVIDIA官方的数据显示,第八代NVENC硬件编码器在AV1的效率上比H.264编码器的效率提高了40%,这一提升非常明显。

  而除了核心上的升级以外,Ada Lovelace架构核心还大幅度提升了其L2缓存。其中RTX 4070 SUPER显卡所采用的AD104-350显示核心拥有48MB的L2缓存,L2缓存容量相比上一代RTX 3090 Ti显卡(6MB L2缓存)可谓提升巨大。大容量的L2缓存带来了数据命中率的有效提升,在现阶段显存带宽提升有效的情况下,通过升级更大容量的L2缓存,可以进一步提升数据命中表现,带来性能方面的升级,根据NVIDIA官方的说法,大容量L2缓存的加入为GPU的一系列操作到带来了更高的收益,尤其是在光线追踪等场景下,表现更为明显。

  (三) DLSS 3与NVIDIA Reflex

  Ada Lovelace架构的一系列升级还带来了全新的DLSS 3技术的独占以及NVIDIA Reflex方面的体验提升。

  DLSS 3包含有DLSS 2(DLSS超分辨率技术),以及全新加入的DLSS帧生成技术,这一项DLSS帧生成技术依托于Ada Lovelace架构的独立光流处理器以及Tensor Core的AI算力。在一项技术在运行过程中,其通过光流处理器所得到的一系列数据后,以光流加速技术(Optical Flow Acceleration,简称为OFA)来生成画面信息,而AI算力则负责来对画面进行进一步的优化,从而在游戏中加入了更多的帧画面,进行帧数的提升。

  DLSS 3可直接生成游戏第1帧3/4的像素以及整个游戏第2帧,相当于使用1/8的算力,就完成了整个计算过程,而通过这一个流程的循环,可在提升帧数的同时节省资源开销,进一步带来更好游戏体验。

  而在DLSS 3的帧生成技术上,由于可能带来延迟的增加,因此DLSS 3在使用上也将通过整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟。而根据NVIDIA官方的说法,DLSS 3通过整合NVIDIA Reflex以及一系列的技术,可以使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。

  目前DLSS 3版本已更新至DLSS 3.5。DLSS 3.5特别新增光线重建(Ray Reconstruction,简称RR),主要是解决目前光追游戏中人工设计的降噪器所带来的画面质量问题。

  在DLSS 3.5出现之前,降噪器的调整主要是交给游戏开发者来做的,也就是前文所说的人工设计的降噪器。降噪器会用前几帧的图像,以及混合邻近的像素去达成填充画面的目的。不过即便图像是完整的,但是仍有一些缺陷,比如说多帧结合产生的鬼影,还有画面细节上的缺失。为了得到较好的结果,一般多个降噪器会同时运行,这也对帧率造成了影响。而DLSS 3.5中的光线重建是人工设计降噪器的替代品。NVIDIA为其投入了DLSS 3的5倍训练数据量,因此它能识别出不同的光线追踪效果,从而准确处理图像中的每个像素。

  映众RTX 4070 SUPER曜夜显卡欣赏

  在外观设计上,映众RTX 4070 SUPER曜夜与笔者之前评测过的映众RTX 4070曜夜大体一致,还是熟悉的样子。

  映众RTX 4070 SUPER曜夜以黑、灰色为主色调,主打轻薄双槽特色。该显卡没有设计RGB灯效,也没有什么花哨的设计,低调不张扬。

  由于采用的是双风扇散热设计,这款显卡的尺寸比较短,实测约25cm。加上标准双槽厚度设计,令这款显卡的安装兼容性很不错。

  显卡背面设计了金属背板,上面有一些镂空设计,以便兼顾散热效果。

  显卡输出接口为三个DP 1.4以及一个HDMI 2.1。

  散热器顶部上面印有“INNO3D GEFORCE RTX”的字样。

  显卡辅助供电接口为12VHPWR接口。

  下面将散热器拆卸下来,露出显卡PCB,继续欣赏一下它的用料。

  这款显卡虽然长度为25cm,但是它的PCB并不长。通过对比明显能够看出散热器和背板比PCB长出很多。

  映众RTX 4070 SUPER曜夜的供电设计基于RTX 4070 SUPE创始人版方案。GPU左右共设计了8+2相供电,搭配电容铁素体电感、固态电容等高品质元器件,用料值得信赖。

  全新的AD104-350显示核心,芯片面积为294.5平方毫米,看上去尺寸比较小。

  显存是来自美光的GDDR6X,单颗2GB容量。这款显卡PCB正面共设计有6颗显存,组建了12GB显存容量。

  这款显卡采用的是HERCULEZ X2散热器,搭配有两枚直径约9cm散热风扇。风扇支持可拆洗 ,便于用户们日常保养清灰。此外,这款散热器支持智能风扇停转功能,在待机状态下或者轻负载状态下,它的这2枚风扇会全部停转,以便实现安静的运行效果。

  这款散热器的金属主体部分比较大,纯铜镀镍底座,5根纯铜镀镍热管,加上大面积散热鳍片矩阵,不仅能够为GPU进行散热,而且还能够为显存、电感以及MOS管进行散热。

  测试平台介绍

  笔者组建了一套性能出色酷睿i9-14900K测试平台,用来测试显卡性能。为了对比映众RTX 4070 SUPER曜夜的性能,笔者此次测试还加入RTX 4070以及RTX 4070 Ti的成绩。

  此次测试所选用的这款RTX 4070是一款非公版显卡,其GPU频率为1920MHz,Boost频率为2505MHz,显存频率为1313MHz(等效21000MHz)。

  此次测试所选用的这款RTX 4070 Ti同样是一款非公版显卡,其GPU频率为2310MHz,Boost频率为2670MHz,显存频率为1313MHz(等效21000MHz)。

  英特尔酷睿14代处理器搭配RTX 40系列独立显卡是支持Resizable BAR技术的。为了充分发挥映众RTX 4070 SUPER曜夜的性能表现,以下测试环节均是在Resizable BAR开启状态下进行的。

  游戏性能测试

  (一) 3DMark基准测试

  首先是映众RTX 4070 SUPER曜夜在3DMark基准测试当中的表现。性能到底有多强,大家一看便知。

  在3DMark Time Spy测试项目中,这款映众RTX 4070 SUPER曜夜的性能约为RTX 4070的118%。

  在3DMark Port Royal光线追踪测试项目中,这款映众RTX 4070 SUPER曜夜的性能约为RTX 4070的117%。

  显而易见,映众RTX 4070 SUPER曜夜的游戏性能明显要好于RTX 4070。

  (二) DLSS 3游戏实测

  目前已有《赛博朋克2077》、《瘟疫传说:安魂曲》、《光明记忆:无线》、《生死轮回》等热门游戏大作支持DLSS 3技术。此次DLSS 3游戏实测,笔者将利用3款游戏进行测试。

  DLSS 3游戏测试版——《赛博朋克2077》

  DLSS 3游戏——《瘟疫传说:安魂曲》

  DLSS 3游戏——《极限竞速:地平线5》

  通过上述3款DLSS 3游戏来看,DLSS 3技术为RTX40系列显卡带来的游戏帧数提升是巨大的。借助DLSS 3技术,即使是在4K分辨率下,映众RTX 4070 SUPER曜夜依然能够畅玩大量新时代光追游戏,表现很好。

  (三) 其它游戏实测

  接下来,笔者再测试一些非DLSS 3游戏。

  游戏实测——《中土世界:暗影之战》

  游戏实测——《战争机器5》

  游戏实测——《幽灵行动:荒野》

  游戏实测——《古墓丽影:暗影》

  游戏实测——《地铁:离去》增强版

  非DLSS 3游戏中,映众RTX 4070 SUPER曜夜的性能表现依然很好,4K游戏基本无压力。

  生产力性能测试

  (一) AV1硬件加速编解码测试

  为什么AV1编解码技术越来越受欢迎?理由很简单,采用AV1编解码的视频能够以更低的码率,实现其它主流编解码视频相同的画质。说白了,在视频画质相同的情况下,采用AV1编解码的视频文件体积会更小,以至于能够为视频创作者们节省大量的硬盘空间。

  目前剪映、万兴喵影、达芬奇等视频软件已可支持AV1硬件加速编/解码功能。接下来笔者利用剪映这款软件,将一部H264编码的MP4视频,导出为一部AV1编码的MP4视频。

  显而易见,在RTX 40系列显卡AV1视频编码加速的助力之下,转换时间比单用处理器转换大幅缩短,加速效果相当显著。

  (二) DLSS 3.5渲染测试——D5渲染器

  目前国产渲染器——D5渲染器已更新DLSS 3.5预览支持,可以让用户在复杂渲染模型的预览场景中获得更为流畅的使用反馈,为用户提供更高帧率的显示。笔者此次利用映众RTX 4070 SUPER曜夜进行了D5渲染器场景列车中环境非常复杂的《木构建筑》预览体验,并记录开启以及关闭DLSS 3.5进行预览的帧数变化。

  从帧数表现可见,这个渲染预览场景对于性能要求非常高,在未开启DLSS 3.5的情况下,预览帧数仅有11帧,不过在开启DLSS 3.5进行预览之后,帧数会提升到帧31。虽然还不是非常流畅,但是已拥有了接近3倍的预览视觉效果提升,DLSS 3.5的作用还是非常明显的。

  (三) AI图片生成测试

  RTX 40系列显卡的Tensor核心拥有强大的深度学习能力,可以高效完成AI绘图创作。这次测试我们使用Satble Diffusion应用运行AI程序,绘制20张1000×1000分辨率的图片,并计算每分钟生成的张数。

  结果显示,映众RTX 4070 SUPER曜夜平均每分钟可生成8.8757张图片,AI绘图创作效率是比较高的。

  散热器测试

  (注:笔者所处的室温维持在26℃)

  利用FurMark,笔者将对映众RTX 4070 SUPER曜夜进行压力测试。

  通过10分钟的烤机,默认频率下满载时GPU温度稳定在约69℃,GPU频率稳定在约2805MHz左右,显卡满载功耗约221.8W左右。散热设计可靠,同时静音效果也不错,令人放心。

  产品总结

  在起售价仅比RTX 4070多100元的情况下,RTX 4070 SUPER的性能提升是相当显著的,4K游戏基本畅玩,同时还拥有很不错的生产力性能,对于这款NVIDIA的新SUPER,笔者是比较满意的。

  作为本文的测试显卡,映众RTX 4070 SUPER曜夜尺寸小巧,用料扎实,散热可靠,运行静音,值得笔者推荐。该显卡首发价4899元,心仪的用户可以到京东商城映众旗舰店进行购买。

  好了,此次评测就写到这里。本月NVIDIA还将陆续解禁RTX 4070 Ti SUPER和RTX 4080 SUPER,笔者届时也会对它们进行评测,敬请期待。

3人已赞

关注我们

泡泡网

手机扫码关注