英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!

创作专武,游戏神兵,我就是NVIDIA GeForce RTX 4090。NVIDIA 新一代Ada Lovelace GPU 架构,首款旗舰卡后正式推出,不仅制程升级、时序飞升,更带来Tensor Core 与RT Core 升级,以及新一代DLSS 3 的AI 补帧技术开启GPU 加速大时代,同时具备AV1 双编码引擎,不仅满足游戏玩家4K 百帧的梦想,更是3D 渲染、创作、模拟、运算上的专武神兵,让我们从架构、规格与性能来检测这新一代卡后的升级体验。

遇见新一代旗舰卡后Ada Lovelace、NVIDIA GeForce RTX 4090

NVIDIA 新一代Ada Lovelace 微架构、RTX 40 系列,首发旗舰GeForce RTX 4090 将于明日10/12 日正式发售,美金定价$1599 元。接着GeForce RTX 4080 16GB 与12GB 的两张新卡也将在11 月推出,美金定价为$1199、$899 元。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ Ada Lovelace – A Quantum Leap.

这代NVIDIA 改用TSMC 4N 客制制程与Ada Lovelace 微架构,让GPU 可以拥有更多的SM 单元,进一步的增加CUDA、Tensor Core 与RT Core 等数量,同时也让TMUs、ROPs 等单元数量提升,再加上2.5GHz Boost 的超高时序,让RTX 4090 可用2-4x 倍快的性能超越RTX 3090 Ti。

GeForce RTX 4090 拥有着16384 个CUDA 核心、512 个4 代Tensor Core 与128 个3 代RT Core,以及2.52 GHz Boost 时序与24GB GDDR6X 内存。以超狂的规格同时满足专业创作、渲染与旗舰游戏玩家的需求。

而GeForce RTX 4080 则有两种规格,RTX 4080 16GB 有着CUDA 9728 个、Tensor Core 304 个、RT Core 76 个、2.51GHz Boost 时序;而RTX 4080 12GB 则是CUDA 7680 个、Tensor Core 240 个、RT Core 60 个、2.61GHz Boost 时序。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ RTX 4090、RTX 4080 规格表。
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ RTX 4090 会取代RTX 3090 / Ti 的产品,而RTX 4080 则是取代RTX 3080 12GB / Ti 的产品

若从美金定价来看确实这代RTX 4080 价格较高,但若以目前NVIDIA 给出的性能依据是RTX 4090 比RTX 3090 Ti 快2-4x 倍,而RTX 4080 则比RTX 3080 Ti 快2-4x 倍。因此以性能价格来看RTX 4090 性价比肯定优于RTX 3090 Ti,甚至RTX 4080 12GB 性能就能与RTX 3090 Ti 抗衡的状况下,也让这代RTX 4080 价格跟着提升。

到底为何NVIDIA 能这么狂的每代性能2-4x 倍的提升,除了制程提升、时序飞升外,更重要的是Ada Lovelace 新架构所带来的新技术SER、Displaced Micro-Mesh Engine、Opacity Micromap Engine,以及Optical Flow Accelerator 与DLSS 3 的AI 补帧,这才是NVIDIA 最狂的技术实力。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ Ada Lovelace 重点技术

Ada Lovelace:制程时序升级、精进光线追踪与双AV1 Encode

Ada Lovelace 微架构的完整核心AD102 GPU,达到763 亿个电晶体、总共有着12 组GPC、72 组TPC 与144 组SM 单元,也就是说总共有着18432 个CUDA、576 个Tensor Core 与144 个RT Core。而这代目前的旗舰RTX 4090 也不过128 组SM 单元下,意味着未来还是有RTX 4090 Ti 能超越目前旗舰产品的可能。

Ada 除了改进SM 单元外,亦有着GDDR6X 高速内存、第4 代Tensor Cores 提升AI 推论性能、第3 代RT Core 提升光线追踪的质量,以及第8 代影音编码器支持AV1 硬件编码功能,还有着DLSS 3 所带来的2-4x 的性能升级。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ AD102 完全体GPU 区块图

ADA 第4 代Tensor Core

Tensor Core 是专注于高性能的运算核心,这对于深度学习的训练与推论所需的矩阵计算带来突破性的性能提升,核心针对“矩阵乘法”与“积累数学运算”(accumulate math operations)所设计,并在AI 与HPC 的应用中扮演相当重要的角色。

相较于Ampere 架构,Ada 能够带来2x 倍的FP16、BF16、TF32、INT8 与INT4 的Tensor TFLOPS 性能提升,同时加入Hopper 架构的FP8 Transformer Engine,能提供1.3 PetaFLOPS 的Tensor Core 性能。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ Ada Lovelace

ADA 第3 代RT Core 与新光追技术

Ada 架构的第3 代RT Core 能带来2x 倍快的Ray-Triangle Intersection 输出性能(相较于上代Ampere)。而新加入的“Opacity Micromap Engine”,让物件有着Micro-Triangles 的Virtual Mesh,可用来记录物体的不透明状态,有着不透明、透明或未知等三种状态。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ ADA 的Opacity Micromap Engine 能够让物体有着Virtual Mesh 纪录不透明状态

若光线追踪至不透明的表征时则记录“击中”并返回,而若是透明的区域则是直接忽略光线追踪,至于未知的区域则要交给SM 通过程序化的Shader 来处理光线交集。Opacity Micromap Engine 就是用来评估不透明遮罩(opacity mask),也就是正三角形遮罩使用重心坐标报告“光线/ 三角形”的交集。

通过Opacity Micromap Engine 能直接进行几何的alpha-test,降低Shader 的alpha 运算负担,而这功能可让开发者绘制更复杂的形状、半透明的物件,像是蕨类植物、栅栏等物体,并透过Ada RT Core 进行有效的光线追踪。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 像是游戏画面的烟雾,利用Opacity Micromap Engine 技术,能够降低光线追踪的复杂度
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 上图左是原始光线追踪量,颜色越深计算的光线就越多,但明明烟雾效果有着相当多是半透明的状态,却导致整体性能降低;图右则是套用Opacity Micromap Engine 后所需的光线追踪计算量,借此提升光线追踪在处理复杂物件、透明效果时的性能

此外,Ada RT Core 加入“Displaced Micro-Mesh Engine”,用来解决越来越复杂的几何场景,所造成的光线追踪的运算负担,以及降低BVH 资料的内存/ 储存所需的容量。Displaced Micro-Mesh 是利用几何空间的相关性,将复杂几何以基准三角点加上位移方向来表示。

如此一来在光线追踪时可避免大量的BVH 结构的产生,并有着更有效的BVH traversal 的性能,而在光栅化时使用既有的Micro-Mesh LOD 来呈现几何原有的样子。也就是说Displaced Micro-Mesh Engine 使用简单的BVH、基准三角点加上位移方向地图,就能够创造高细致度的几何光线追踪。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 要能细致的利用光线追踪来渲染螃蟹外壳,就会需要将螃蟹细分为1024 个Triangles,再利用BVH 算法去计算每个位置的光线变化,这会产生非常大量的BVH 资料与性能损耗
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ Ada 的Displaced Micro-Mesh Engine,是将复杂的表面以1 个Triangles 加上位移方向地图,如此一来只需一个简单的BVH 计算后,在利用位移方向地图来推算出每个位置的光线变化

这代Ada 加入新的“Shader Execution Reordering”(SER) 功能,可以动态的排列Shader 处理光线达到更好执行效益。

简单来说,当一个场景计算光线追踪,从主要光线开始计算碰到的物件,接着主要光线产生的反射、环境漫射则会进行第二次光线追踪,但第二次的光线追踪则是乱序的状况,也导致第二次光线追踪的Shader 执行上效益不佳。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 简单来说SER 能够优化光线追踪的Shader,让运算更有效率

因此Shader Execution Reordering 加入光线追踪的流水线后,能够重新排序、群组相同的第二次光线追踪击中的Shader,让光线追踪的Shader 有更好的效率。SER 可提供2x 倍的RT Shader 性能提升,而且在Cyberpunk 2077 以Overdrive Mode 执行时,有着44% 性能增长来至SER 的成果。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 这张图比较好解释SER 功用。第一道光线追踪的计算是循序的状态,但第二道光线追踪则包含反射、折射、漫射,因此Shader 在计算时因为乱序的关系无法有最佳的性能,通过SER 优化后即可大幅提升性能

大加速时代DLSS 3 与Optical Flow Accelerator

随着游戏有着丰富的物件、更复杂的几何、美轮美奂的世界,以及基于物理拟真的光线追踪等技术堆叠下,传统的GPU 渲染性能以跟不上当代游戏的需求,也因此NVIDIA 最早开发AI 深度学习加速的DLSS 技术,这也让各家GPU 制造商,推出自有的加速技术,也正式开创GPU 的大加速时代。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 2018 年问世的《战地风云V》导入光线追踪时,每个像素仅39 道光线追踪量,但是4 年后《电驭叛客2077》每个像素能达到635 道光线追踪量,这运性能可是一个巨大的变化

RTX 40 独有的“DLSS 3”则是基于DLSS 2 的技术下,加入“AI 补帧”的概念,也就是纳入Optical Flow Accelerator 的功能。Optical Flow 是电脑视觉所使用的光流法,用来计算连续的影像中,每个像素的移动方向与移动量。

DLSS 3 技术则需要游戏引擎提供:较低解析度的渲染画面与Motion Vectors,通过DLSS 的深度学习网路推论出高解析度的影像,并将影像提供给Optical Flow Accelerator 计算每个像素的移动方向与移动量,最后通过Optical Multi Frame Generation 产生出AI 补帧的画面。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ DLSS 3 利用Optical Flow Accelerator 计算画面像素的光流移动方向与向量,借此利用Optical Multi Frame Generation 的AI 推论出Frame2 的影像,白话就是AI 补帧
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ AI 补帧为何需要Optical Flow Accelerator?主要原因在于,上图的物件可通过游戏引擎的Motion Vectors 得知运动方向,但是地面上的阴影并非物件的状况下,会缺少阴影的运动向量,这时在补帧时就会出现问题
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 通过引擎的Motion Vectors 与Optical Flow 的像素向量的结合,可以产生出更稳定的AI 补帧

当游戏开启DLSS 3、Frame Generation 并通过Reflex 降低延迟后,游戏画面的Frame1 会有1/4 的像素是游戏渲染的,剩下的3/4 则是DLSS Super Resolution 推论出的像素,接着到下一个画面Frame2,这张则会有DLSS Frame Generation 产生,因此Frame1 + Frame2 的画面总共有7/8 是由DLSS 3 的AI 所产生的画面。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ Frame1 由引擎渲染低解析度的影像(1/4)剩下的3/4 影像则是DLSS 产生,接着Frame2 则是完全由DLSS Frame Generation 画出,因此2 个Frame 总共有7/8 是由DLSS 的AI 推论而生

DLSS 3 通过AI 补帧能够提供2-4x 倍的游戏性能提升,同时维持着与原生渲染相似的画质,但是也会增加游戏的整体延迟,因此NVIDIA 强制DLSS 3 包含Reflex 技术,借由取消Render Queue 让CPU 处理完GPU 立刻接手渲染,达到更低的系统延迟效果。

因此DLSS 3 结合AI Super Resolution、Frame Generation 与ReFlex 等技术,靠着第4 代Tensor Core、Optical Flow Accelerator,以及NVIDIA 用来训练AI 的超级电脑,满足次世代游戏玩家4K100fps 的极致性能。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ DLSS 3 Full Stack

DLSS 3 需要Ada 的Optical Flow Accelerator 硬件才能启用Frame Generation 达到应有的性能提升,因此DLSS 3 目前是RTX 40 系列专属的功能,而未来支持DLSS 3 的游戏也会相容DLSS 2,也就是DLSS Super Resolution,而NVIDIA Reflex 则是GTX 900 以上都支持。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ DLSS 3 = Super Resolution + Frame Generation + Reflex。而原本的DLSS 2 则是只需要Super Resolution 即可

双AV1 影音编码、Portal RTX 11 月推出

创作方面Ada Lovelace 除了上述的升级外,还搭载双第8 代NVENC 编码引擎,主要是加入AV1 的影音编码功能,至于解码还是第5 代NVDEC 与Ampere 相同,毕竟NVDEC 已经完整支持各式影音解码的能力。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ Ada Lovelace

RTX 40 系列搭载双第8 代NVENC 编码引擎,主要纳入AV1 影音编码的功能,这也是未来主流的影音串流编码比起H.264 有更好的讯噪比,也就是说在相同解析度、码率的比较下,AV1 的影像画面会优于H.264 编码。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ AV1 影音编码能有更好的画质与性能提升,这也是未来串流的主要影音编码
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 左AV1、右H.264 同样8Mbps 码率下,地板的细节差异相当明显(4K SBS 比较)
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 左AV1、右H.264 同样8Mbps 码率下,马路的纹路差异清晰可见(4K SBS 比较)

而双第8 代NVENC 编码引擎,要能获得2x 倍的影片输出性能提升,需要影片编辑软件支持像是DaVinci Resolve、Voukoder、简映都会在第一时间支持RTX 40 的双编码引擎,至于主流的Adobe Premiere Pro 则要等日后更新了。

像是录制8K60 影像时可以利用双Encoder 每个负责7680 x 2160 的解析度,获得更好的性能提升。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 双编码引擎

除了AV1 编码与双编码引擎外,NVIDIA Omniverse 也支持的DLSS 3 新技术,以及RTX Remix 的神级游戏Mod 的制作工具。

但对于玩家来说,经典游戏Portal With RTX 将于11 月推出免费DLC,支持Vulkan RT 相容的GPU,当然最佳体验就是使用RTX 40 与DLSS 3。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ Ada 创作重点
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ Portal With RTX 将于11 月推出免费DLC;RTX Remix 则会尽快推出

NVIDIA GeForce RTX 4090 创始版显卡开箱/ 背面即是正面经典再强化

Ada Lovelace 卡后NVIDIA GeForce RTX 4090 创始版,维持着Ampere 世代开创的显卡美学新设计“背面即是正面”、“少但更好”GeForce。创始版采用坚固、耐用的铝合金打造X-Frame 框架,表面采用阳极氧化处理带来高级的质感与金色的金属质感。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 媒体版NVIDIA RTX 4090 创始版
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 箱内特殊的设计

而框架内则是填满散热鳍片,内部则是均温板替GPU、VRAM 散热,再借由热导管将废热引导至散热鳍片。而这代RTX 4090 创始版采用更大的116mm、FDB、7 扇叶的双风扇,并且增加显卡厚度至3-Slot、减少显卡长度至30.48cm(12 inch)。

这代均温板也有着优化,并针对内存有着专属的切口,让均温板可以更均匀的与GPU 接触,同时内存的导热垫则降低至1.5mm 带来更好的热传导效应;这代散热器可支持到650W Qmax 的解热能力。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 背面即是正面的经典,RTX 4090 与显卡前方穿透式散热气流
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 原本的正面也以金属框架填满散热鳍片与后方风扇,带来独特的美学设计

RTX 4090 全面换上PCIe 12+4 Pin(12VHPWR)的供电接口,一线最高可传输600W 的功耗外,也让新卡装机时整线可以更佳美观。当然创始版也提供了1 条12VHPWR 转4 个PCIe 6+2pin 的连接线。

一般电源建议至少连接3 个PCIe 6+2pin 来转换,若是新买电源建议选择符合ATX12 V3.0 与EPS12V V2.92 规范的新电源,如此一来就可以将有点丑的冲天炮收起来,只要一条12VHPWR 连接线即可提供显卡所需的供电。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ RTX 4090 使用PCIe 12+4 Pin(12VHPWR)供电
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 配件中的12VHPWR 转4 个PCIe 6+2pin 连接线(冲天炮)
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 专业的新电源只要一条线即可满足RTX 4090 供电需求

RTX 4090 显示输出提供1 个HDMI 2.1a 支持VRR、4K120Hz / 8K60Hz HDR,以及3 个DisplayPort 1.4a DSC 支持12-bit 4K240Hz HDR / 12-bit 8K60Hz HDR 等输出能力,最多同时连接4 个显示器输出。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ RTX 4090 显示输出

NVIDIA GeForce RTX 4090 创作影音输出、GPU 渲染性能测试

此次测试包含创作Adobe Premiere Pro 2020、DaVinci Resolve 18 与Blender等创作测试,游戏则以2160p、1440p 解析度、特效全开测试电竞、AAA 游戏与光追游戏的性能,并加入额外的DLSS 3 前期测试,让玩家能全面了解RTX 4090 为何强悍(这么贵)。

比较性能的显卡分是NVIDIA GeForce RTX 3090 创始版。

测试平台
处理器:Intel Core i9-12900K
主板:华擎 Z690 PG Velocita
内存:海盗船 DOMINATOR PLATINUM RGB DDR5 32GBx2 5200MHz
显卡:NVIDIA GeForce RTX 4090 创始版、NVIDIA GeForce RTX 3090 创始版
系统碟:Solidigm P41 Plus 1TB PCIe 4.0 SSD
散热器:ASUS ROG STRIX LC II 280mm
电源:Seasonic PRIME PX-1000
操作系统:Windows 11 Pro 21H2 64bit、Resizable BAR On
驱动版本:NVIDIA 521.90

GPU-Z 已可检测NVIDIA GeForce RTX 4090 资讯,采用4nm 制程的AD102 GPU,有着16384 个渲染CUDA 核心,以及24576 MB GDDR6X(Micron)内存,而GPU 预设时序2235 MHz、Boost 2520 MHz。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ GPU-Z
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ DXVA Check 解码器测试,目前所有影音编码都支持各解析度的解码

DaVinci Resolve 18 纯粹通过GPU 加速的影片剪辑程序,更包含强大的色彩校正与特效功能,并且直接使用CUDA 核心运算,让影片剪辑的回放与输出都有着相当好的性能。测试版本则包含支持NVIDIA AV1 编码功能。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ DaVinci Resolve 18

这段测试分为两部分,第一段测试的专案使用4K Blackmagic RAW 影像,并分别有着Wedding_Heavy_Styles 时间轴,这段影片使用非常多的Resolve 效果,像是OFX: Light Rays / Glow / Sketch 等,输出相当高风格的影片类型。

Bride_FaceRefine_Selective_Color 则使用Face Refinement 做人脸的追踪,并将主体新娘使用颜色凸显;50% Retime 与Optical Flow – Enhanced Better 都使用Optical Flow 技术降低影像50% 速度。

SuperScale2x 4K Source 使用4K ProRES 来源影片制作2x Zoom In 主体的4K 影片输出;SuperScale4x HD_Source 则是使用HD H.264 来源影片,利用Resolve Super Scale 输出成4K 影片。

这部分RTX 4090 性能可说是非常突出,尤其在Optical Flow 测试中节省了近2 倍的输出时间,让创作者有着更快的输出性能。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ DaVinci Resolve 18,时间越短越好

第二段测试为双NVENC 编码的AV1 与HEVC 编码测试,测试专案是一段44 秒的小短片,来至于Blender Open Movie Project《Tears of Steel》,并有着8k Prores442HQ 30FPS 与4K Prores422HQ 30FPS 的影片,可用来测试输出为HEVC、AV1 编码的性能。

输出设置主要是使用NVIDIA Encoder、Quality: Restrict to 80000 Kb/s、Encoding Profile: Main、Rate Control: Constant Bitrate、Preset: Faster、Tuning: High Quality、Two Pass: Disable 等输出设置。

性能上在4K30 输出时RTX 4090 性能与RTX 3090 差异不大,但在处理8K 输出时,RTX 4090 的双编码引擎让HEVC 输出时间加速了2x 倍之多,而且AV1 编码的速度也相当快,可见只要影音编辑软件支持RTX 40 双编码引擎,即可获得相当出色的编码性能成长。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ DaVinci Resolve 18 双NVENC 编码测试,时间越短越好

Adobe Premiere Pro 2022 影音剪辑软件,采用自家开发的Mercury Playback Engine GPU 加速,可借助GPU 的编码引擎加速影像输出速度。测试使用的专案1 为公司1080p60fps 的开箱影片;而BigMix4K 专案其采用3 段FinalAdjusted_MPE 1920×1080 的影像组成一段4K 时间轴,进行H.264、HEVC 格式输出。

(测试的Premiere Pro 2022 还未支持RTX 4090 双编码功能。)

性能上RTX 4090 依旧能有着比RTX 3090 还要快的输出速度,但不像支持的DaVinci Resolve 可以有着惊人的输出时间缩短。因此,这测试主要提供给各位参考。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ Adobe Premiere Pro 2022
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ Adobe Premiere Pro 2022 输出,时间越短越好

Blender 是跨平台、开源的3D 创作工具,支持着各种3D 作业:Modeling、Rigging、Animation、Simulation、Rendering、Compositing 与Motion Tracking 等。而测试,则以Blender Benchmark 3.3.0 进行Demo 专案的渲染工作测试。

Blender Benchmark 3.3.0 测试,可见RTX 4090 在3 个场景的每分钟Sample 数量(性能)高于RTX 3090 约两倍之多,展现出Ada Lovelace 的3D 创作实力。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ Blender,性能越高越好

V-Ray Benchmark 是由Chaos Group 所开发,V-Ray 是基于物理法则所设计的光线渲染软件,而此工具可分别针对CPU 与GPU 进行光线追踪的渲染图像的运算测试。

V-Ray 不论是GPU RTX 或者CUDA 计算下,RTX 4090 以1.9x 倍的Vpaths 数量赢过RTX 3090。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ V-Ray Benchmark,性能越高越好

SPECviewperf 2020 基于专业应用所开发的标准绘图性能测试工具,测试各式专业的计算机图形软件如:3ds Max、Catia、Creo、Energy、Maya、Medical、SNX、SolidWorks 等绘图测试与工程模拟。

测试为1920 x 1080 解析度、成绩为FPS。这性能表现则根据使用的工具有关,RTX 4090 的性能提升约在1~2.9x 倍之间,端看测试的程序与情境。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ SPECviewperf 2020,FPS 越高越好

NVIDIA GeForce RTX 4090 – 3DMark 跑分性能测试

3DMark Fire Strike 性能测试,为主流的DirectX 11 API 的测试情境,分别测试1080p、Extreme 1440p 与Ultra 2160p 的性能。

RTX 4090 让Fire Strike 达到54174 分的成绩,而从Ultra Graphics 的成绩比起RTX 3090 快了2x 倍的性能提升,而Extreme 则是1.8x 倍、FHD 1.6x 倍。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 3DMark Fire Strike,分数越高越好

3DMark Time Spy 则是采用DirectX 12 API 所设计的测试情境,同样是锁定在AAA 游戏等级,分别测试1440p 与Extreme 2160p 的性能。

RTX 4090 在Time Spy 达到32638 分的总成绩,比起RTX 3090 分别有着1.8x、1.9x 倍的性能提升。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 3DMark Time Spy,分数越高越好

针对光线追踪测试,3DMark Port Royal 在AAA 游戏中的场景中加入光线追踪功能,考验着新一代GPU 对于硬件光线追踪加速的能力。同时DXR 测试,则是使用DirectX Raytracing API 进行的功能测试。

RTX 4090 即便不用DLSS 也能有着相当惊人的光追性能,Port Royal 达到119 FPS、DXR 138 FPS 的成绩,对比RTX 3090 同样带来1.95x、2.44x 倍的性能提升。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 3DMark Port Royal,越高越好

3DMark DLSS Feature Test 可针对DLSS 3、DLSS 2 进行性能测试,设置为3840 x 2160、Performance 加速下,RTX 4090 在DLSS 2 可获得138 FPS / 2.3x 倍的性能提升,DLSS 3 使用AI 产生画面后可达到193 FPS / 3.3x 倍的性能提升。

后续会使用游戏来实测DLSS 3 的性能表现。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 3DMark DLSS Feature Test,越高越好

NVIDIA GeForce RTX 4090 – 4 款电竞游戏性能测试

4 款电竞游戏:《虹彩六号:围攻行动》、《英雄联盟》、《APEX 英雄》与《CS:GO》等,都是重技巧、团队的战术竞技射击、DOTA 类型的游戏,因此游戏画质、细节不高的状况下,游戏FPS 也都是平均百帧以上的表现。测试以2160p、1440p、特效最高设置进行。

对于电竞游戏来说RTX 4090 带来的性能增长并不明显,毕竟RTX 3090 在2160p 也能提供电竞游戏相当强的性能,测试中仅《虹彩六号:围攻行动》有着较明显的性能提升,其余3 款则是相对接近。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 2160p 电竞游戏测试,FPS 越高越好
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 1440p 电竞游戏测试,FPS 越高越好

NVIDIA GeForce RTX 4090 – 11 款游戏性能测试

11 款AAA 游戏平均性能,同样测试2160p、1440p、特效全开进行测试,这段测试仅F1 使用光追,其余游戏无光追下、无DLSS 加速,测试GPU 的实际传统渲染游戏性能。

游戏测试名单有入门的《F1 2021》、《极限竞速地平线5》赛车游戏、《古墓奇兵:暗影》、电影游戏《死亡搁浅》、《战争机器5》、《全境封锁2》、《地平线:期待黎明》,以及吃重性能的《边缘禁地3》、《刺客教条:维京纪元》、《碧血狂杀2》与《战神》等测试。

RTX 4090 在2160p、AAA 游戏当中有着相当不错的性能提升,11 款游戏平均达148 FPS,比起RTX 3090 平均89 FPS,可达到平均约1.7x 倍的性能升级。

但在1440p 解析度下则是RTX 4090 平均200 FPS、RTX 3090 平均143 FPS 约1.4x 倍性能提升。

可见RTX 4090 在主力2160p 解析度下,不靠着DLSS 加速即可带给玩家约1.7x 倍的性能提升,若以百分比表现则是有着平均66% 的性能升级。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 2160p AAA 游戏测试,FPS 越高越好
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 1440p AAA 游戏测试,FPS 越高越好

NVIDIA GeForce RTX 4090 – 9 款光追游戏测试

9 款光追DXR 游戏测试,则使用最热门的《电驭叛客2077》、《控制》、《看门狗:自由军团》、《战栗深邃:流亡》、《漫威蜘蛛人重制版》、《漫威星际异攻队》、《鬼线:东京》、《极地战嚎6》与《恶灵古堡村庄》等游戏进行测试。测试2160P、1440p 解析度,特效/ 光追最高设置外,也会启用DLSS 加速,详细设置请参考图表说明。

RTX 4090 在《电驭叛客2077》DLSS 2 加速下可达到平均110 FPS,比起RTX 3090 平均60 FPS 还要高出许多;同样在《控制》与《鬼线:东京》等光追游戏上,都能感受到RTX 4090 所带来的强劲光追游戏性能升级。

RTX 4090 在2160p、9 款光追游戏测试下平均可达132.3 FPS,相较于RTX 3090 则有着平均82 FPS,光追游戏性能提升约在1.6x 倍、平均65% 的升级量。

至于1440p 则是,RTX 4090 平均169 FPS、RTX 3090 平均119.8 FPS,约1.4x 倍、41% 性能提升。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 2160p 光追游戏测试,FPS 越高越好
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 1440p 光追游戏测试,FPS 越高越好

NVIDIA GeForce RTX 4090 – DLSS 3 性能实测

这代Ada Lovelace GPU 更新的一大重点“DLSS 3”,在测试期间NVIDIA 有提供预先释出的测试版本,主要让媒体可以一览DLSS 3 所带来的性能提升。测试的游戏包含《微软模拟飞行》、《瘟疫传说:安魂曲》、《Unreal Engine 5: Lyra》、《F1® 22》、《Unity Enemies》、《电驭叛客2077》与《逆水寒Justice Online》,使用2160p 解析度、光追最高设置。

DLSS 3 游戏设置中,会有明确的“Super Resolution”与“Frame Generation”的选项,必须同时启用两这两个功能才能使用DLSS 3 的技术,而RTX 30 / 20 系列的玩家,则只能开启Super Resolution 功能,Frame Generation 会无法启用。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 《微软模拟飞行》DLSS 3 设置
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ 《电驭叛客2077》DLSS 3 设置

RTX 4090 通过DLSS 3 加速,《电驭叛客2077》可达到平均140 FPS 约3.5x 倍的性能提升;而Unity 引擎释出的Enemies 电影动画,在即时光追渲染下靠着DLSS 3 亦可达到103 FPS 约3.68x 倍的性能升级。

RTX 4090 在DLSS 3 Performance 设置下,可达到约1.9x~4.7x 倍的性能提升,平均下来约在2.95x 倍,这也符合NVIDIA 发表时所说的2-4x 倍性能的表现。

但同样需要等待游戏支持DLSS 3 技术,才能让RTX 40 系列的玩家受惠,但由RTX 4090 初始开拓DLSS 3 的支持性,等到未来中阶、入门的RTX 4060 问世时,玩家就能获得更好的游戏加速性能升级。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ DLSS 3 游戏性能测试,越高越好

NVIDIA GeForce RTX 4090 功耗与温度测量

显卡的功耗与温度测试,使用Time Spy Stress test 与《电驭叛客2077》进行测试。功耗测量时使用NVIDIA 提供的PACT 工具,可监控PCIe 插槽与电源12V 提供的瓦数。

显卡温度方面,RTX 4090 创始版在压力测试最高温维持在67.8°C,至于2077 游戏时温度则会稍微降低65°C,而比较的RTX 3090 创始版则有改过导热垫,因此温度表现相当。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ RTX 4090 创始版GPU 温度

显卡TBP 功耗测试,在Time Spy Stress test 时RTX 4090 平均都达到390W 的功耗、瞬时最高462W,而2077 游戏时则是平均358W、瞬时398W 的功耗表现。

RTX 4090 使用Furmark Xtreme burn-in 最高可来到平均458W 的功耗,这也是NVIDIA 预设的功耗上限,若是品牌自制卡带超频的状况下应该也会在500W 左右,除非使用2 个12VHPWR 供电。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ RTX 4090 创始版GPU 功耗
英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!
↑ Furmark Xtreme burn-in 平均来到458W、瞬时482W

总结

NVIDIA GeForce RTX 4090 再次用实力超越以前的自己,在双NVENC 的加速下让DaVinci Resolve 18 有着更快的影音输出性能,以及支持新一代AV1 编码功能,这将成为RTX 40 系列的标配,而3D 创作性能Blender、V-Ray 都有着近2x 倍的性能升级,这无疑是创作最强的专武。

游戏性能方面,再次制霸2160p、4K 的AAA、光追游戏性能,AAA 游戏平均1.7x 倍提升、光追游戏平均1.6x 倍升级,倘若DLSS 3 普及AI 补帧可带来平均2.95x 倍加速,满足玩家4K100fps 百帧的梦想,无疑是外挂级的游戏神兵。

DLSS 3 目前公布的游戏有达35 款(含程序)支持,但每款游戏的释出、更新时间不同,因此需要等待一点时间让新技术普及。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!

而这代有着近乎2x 倍的性能升级,更可预期未来RTX 4080 的表现依旧亮眼,但相对的2x 倍性能提升下,RTX 4090 价位相比RTX 3090 可说划算,但是RTX 4080 价位跟着提高的状况下,不知各位玩家有多少预算来追求这极致的性能?尤其未来主流RTX 4060,能否切中玩家的期待与价格的甜蜜,这就要看NVIDIA 如何盘算了。

英伟达(NVIDIA)GeForce RTX 4090 显卡测试报告出炉:4K百帧无压力,创作专武,游戏神兵!

RTX 4090 将于明日10/12 日晚上9:00 开卖,建议售价为12999 元起,至于国内是否会发售创始版,则要留待NVIDIA 国内自行揭晓;至于RTX 4080 则要等到11 月。可预期明年应该会有RTX 40 笔电GPU,但首款旗舰价位应该会相当高,对于电竞笔电有兴趣的玩家可以稍加留意明年CES 的消息。

给TA打赏
共{{data.count}}人
人已打赏
显卡测评

新甜品级显卡!Intel Arc A770 与A750 游戏显卡测试报告出炉/ 挑战2K 最强性价比!

2022-10-11 15:56:44

显卡测评

华硕(ASUS) TUF Gaming GeForce RTX 4090 OC 显卡测评:军规旗舰级,10+4 相供电,新风扇更大的散热器

2022-10-13 13:51:18

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索