【超詳實測】NVIDIA GeForce RTX 4090 FE!Ada Lovelace 架構威力驗證!

| 賴立賢 | 11-10-2022 21:01 | |

NVIDIA GeForce RTX 4090 FE 超詳實測!NVIDIA 發布新一代 GeForce RTX 40 顯示卡,使用 Ada Lovelace 顯示核心架構及 TSMC 4N 定制工藝,效能創新高!ezone.hk 今次除了解構 Ada Lovelace 顯示核心架構特點外,更為各位實測當中最強的 GeForce RTX 4090 FE (Founders Edition) 型號,並與上代 Ampere 架構最強 GeForce RTX 3090 Ti 作比較。

ezone.hk 首先為各位詳解 NVIDIA 新一代 Ada Lovelace 顯示核心架構的特點:

Spot 01:最高 18,432 個 CUDA Core

Ada Lovelace 顯示核心使用 TSMC 4N 定制工藝打造,當中 GeForce RTX 4090 使用的 AD102 核心,內建 763 億顆電晶體,相比之下上代 RTX 3090 Ti 使用由 Samsung 以 8nm 製程代工的 GA102 核心只有 283 億顆電晶體。 完整的 AD102 核心,內建  12 個 GPC (Graphics Processing Clusters),每個 GPC 設有 6 個  TPC (Texture Processing Clusters) 及  12 個 SM(Streaming Multiprocessors),而每個 SM 則擁有 4 組處理模組,每模組設 16 個 FP32 CUDA Cores 及 16 個 FP32/INT32 CUDA Cores。因此,完整的 AD102 核心可提供高達  18,432 個 CUDA Cores、72 個 TPC、576 個 Tensor Cores 及 144 個 RT Cores。 

【精選消息】

【精選消息】

完整的 AD102 核心,內建 12 個 GPC。

上代 Amprer 與最新 Ada Lovelace 比較。

不過, GeForce RTX 4090 只啟用了 AD102 核心當中 11 個 GPC,故提供了 16,384 個 CUDA Core、64 個 TPC.、512  個 Tensor Cores 及 128 個 RT Cores,但較上代  RTX 3090 Ti 已大幅提升。此外,Ada Lovelace 架構內的 L2 容量也大幅增加,以 GeForce RTX 4090 為例,L2 Cache 容量由 RTX 3090 Ti 的 6,144KB 激增至 73,728KB。

每個 GPC 設有 6 個 TPC (Texture Processing Clusters) 及 12 個 SM(Streaming Multiprocessors)。

每個 SM 則擁有 4 組處理模組,每模組設 16 個 FP32 CUDA Cores 及 16 個 FP32/INT32 CUDA Cores。

Spot 02:新一代 RT Cores

Ada Lovelace 架構內的 Tensor Cores、RT Cores 不單在數目上有所增加,更分別升級至第 3 代及第 4 代。當中第 3 代的 RT Cores 擁有 2 倍速度的透明度遍歷(Alpha Traversal),這是由全新的 OMM (Opacity Micro-Map) 來達成。OMM 通過減少幾何圖形透明度(Alpha)測試數量,最終減少著色器的透明度運算。這個新功能可以讓開發人員緊湊的描述不規則形狀,或者半透明物體,比如蕨類植物、柵欄,最讓第三代 RT Core 能夠更有效的執行光線追踪效率。

Ada Lovelace 架構第 3 代的 RT Cores

Ada Lovelace 架構第 3 代的 RT Cores,大幅提升 RT 表現。

OMM 通過減少幾何圖形透明度(Alpha)測試數量,最終減少著色器的透明度運算。

OMM 通過減少幾何圖形透明度(Alpha)測試數量,最終減少著色器的透明度運算。

同時,第 3 代的 RT Cores 也增加了 DMM  (Displaced Micro-Mesh) 引擊,它讓第 3 代 RT Core 能夠在節省 20 倍的層次包圍盒加速算法(Bounding Volume Hierarchies,BVH)空間內,以 10 倍的速度執行 BVH。DMM 也是全新的單元,它用來處理 RT Core 本地微求交結構網格,通過使用較少的基本求交三角形來描述比以往更複雜的幾何形狀。

DMM (Displaced Micro-Mesh) 引擊。

OMM 通過減少幾何圖形透明度(Alpha)測試數量,最終減少著色器的透明度運算。

Spot 03:DLSS 3 技術加持

與 GeForce RTX 40 系列一同發布的還有 DLSS 3  (Deep Learning Super Sampling 3) 技術。DLSS 3 主要的功能主要可分為 DLSS FRAME GENRATION、DLSS SUPER RESOLUTION 與 REFLEX,而主要的更新 DLSS FRAME GENRATION 是 RTX 40 系列獨有的功能,它利用  Ada Lovelace GPU 內第 4 代 Tensor Cores 新加入的 Optical Flow Accelerator 單元,再配合   Optical Multi Frame Generation 技術,通過 AI 能夠重建影像,藉此大幅提升遊戲效能。至於,DLSS SUPER RESOLUTION 則是 RTX 20/30/40 系列 GPU 都支援,而 REFLEX 這功能本就是獨立的降低延遲技術,只是在 DLSS 3 當中整合至內建功能當中。

LSS 3 (Deep Learning Super Sampling 3) 技術。

LSS 3 (Deep Learning Super Sampling 3) 技術大幅提升遊戲流暢度。

DLSS FRAME GENRATION 是 RTX 40 系列獨有的功能,它利用 Ada Lovelace GPU 內第 4 代 Tensor Cores 新加入的 Optical Flow Accelerator 單元,再配合 Optical Multi Frame Generation 技術,通過 AI 能夠重建影像,藉此大幅提升遊戲效能。

DLSS FRAME GENRATION 是 RTX 40 系列獨有的功能,它利用 Ada Lovelace GPU 內第 4 代 Tensor Cores 新加入的 Optical Flow Accelerator 單元,再配合 Optical Multi Frame Generation 技術,通過 AI 能夠重建影像,藉此大幅提升遊戲效能。

DLSS SUPER RESOLUTION 則是 RTX 20/30/40 系列 GPU 都支援,而 REFLEX 這功能本就是獨立的降低延遲技術,只是在 DLSS 3 當中整合至內建功能當中。

解構 NVIDIA GeForce RTX 4090 FE (Founders Edition)

NVIDIA GeForce RTX 4090 FE

GeForce RTX 40 系列擁有 GeForce RTX 4090、RTX 4080 16GB 及 RTX 4080 12GB 三款型號,當中最頂級的 RTX 4090 擁有高達 16,384 CUDA Cores,Boost Clock 達到 2.52GHz,配上 24GB 384-bit GDDR6X 記憶體,今次送測的 RTX 4090 FE 版本定價為 US$1,599 (約 HK$12,473)。

NVIDIA GeForce RTX 4090 FE

RTX 4090 只啟用 AD102 核心中的 11 組 GPC。

GeForce RTX 4090 與 RTX 3090 Ti 規格比較。

GeForce RTX 4090 與 RTX 3090 Ti 規格比較。

GeForce RTX 4090 與 RTX 3090 Ti 規格比較。

今次送測的 NVIDIA GeForce RTX 4090 FE (Founders Edition) 可以說是地上最強電競「巨獸」來形容,全卡達到 304mm x 137mm x 61mm,佔用多達 3-Slot,體積與上代頂級的 RTX 3090 Ti FE (313mm x 138mm x 61mm) 相近。

佔用多達 3-Slot。

GeForce RTX 4090 FE 設有 1 x HDMI、3 x DisplayPort

使用 PCIe 4.0 x16 介面。

GeForce RTX 4090 FE 使用的 AD102 核心,NVIDIA 指其 PCB 設計經過全面優化, PCB 層數由上代的 12 層加至 14 層,額外的 2 層 PCB 更並升級了介質材料由 IT150GS 改為 NPG-170D,以提升訊號傳送效率,當中 GDDR6X 的訊號完整性,可更好地與電源雜訊的接地隔離。此外,NVIDIA 更將 PCB 上的 GPU 晶片向北移,以改善電源佈局,以優化相位之間的阻抗平衡,而供電相數也由 16 升級至 20。

RTX 4090 FE PCB 大幅優化設計。

供電方面,GeForce RTX 4090 FE 的 TDP 功耗與 RTX 3090 Ti 同樣為 450W,並要供電源供應器最低 850W 輸出。此卡,同樣配有 PCIe 5.0 規格的 16-Pin (12VHPWR) 供電接口,但附送的轉線,由上代的 3 組 8-Pin 輸入改為 4 組 8-Pin 輸入。

配有 PCIe 5.0 規格的 16-Pin (12VHPWR) 供電接口

附送轉線改為 4 組 8-Pin 輸入。

散熱方面,GeForce RTX 4090 FE 採用正反雙風扇、一體式散熱模組設計,並設有『GEFORCE RTX』燈效字樣。值得一提,NVIDIA 指 GeForce RTX 4090 FE 雙風扇增大,使用 7 扇葉刀片設計,直徑由 110mm 增至 116mm ,風量增加 20%,同時音噪更低!

GeForce RTX 4090 FE 散熱器也經過大幅改良。

NVIDIA 指 GeForce RTX 4090 FE 雙風扇增大,風量增加 20%。

-------------------------------------

GeForce RTX 4090 FE 效能‧功耗‧溫度詳測

為了發揮 GeForce RTX 4090 FE 的最高效能,使用 12 核心、支援 PCIe 4.0 的 AMD Ryzen 9 7900X 處理器及 ASUS ROG CROSSHAIR X670E HERO 主機板進行測試。

《GPU-Z 2.50.0》正確顯示 RTX 4090 所有資料。

<測試平台>
●處理器:AMD Ryzen 9 7900X● 主機板:ASUS ROG CROSSHAIR X670E HERO (X670E)●記憶體:G.Skill Trident Z5 RGB DDR5-6000MHz 2 x 16GB●顯示卡:NVIDIA GeForce RTX 4090 FE、ZOTAC GAMING GeForce RTX 3090 Ti AMP Extreme Holo ●SSD:WD Black SN850 NVMe SSD 2TB●作業系統:《Windows 11 Pro 64-bit》●驅動程式:AMD《Chipset Drivers 4.07.21.042》、NVIDIA《GeForce Driver 521.90》●散熱:ASUS ROG Strix LC II 360 ARGB


Test 01:3DMark 理論‧遊戲效能

分析:驚人的超高效能

NVIDIA GeForce RTX 4090 FE 使用新一代 Ada Lovelace 架構的 AD102 核心,擁有高達 16,384 CUDA Cores,Boost Clock 達到 2.52GHz,《3DMark》- Time Spy Extreme 得分達到 17,044 的新高,較 RTX 3090 Ti (10,961 分) 快約 55%,而在其他遊戲測試 RTX 4090 FE 也以大幅度領先。值得一提,於著重考驗 GPU Ray Tracing 效能的《Boundary Benchmark》中, RTX 4090 FE 領先 RTX 3090 Ti 高 82% 之多,可見第 3 代 RT Cores 之威力。

RTX 4090 於《3DMark》- Time Spy Extreme 得分達到 17,044,創史上新高。

著重考驗 GPU Ray Tracing 效能的《Boundary Benchmark》中, RTX 4090 FE 領先 RTX 3090 Ti 高 82% 之多,可見第 4 代 RT Cores 之威力。

Test 02:DLSS 3 效能‧畫質測試

GeForce RTX 40 系列另一大賣點是完整支援 DLSS 3 (Deep Learning Super Sampling 3) 技術,當中重點的 DLSS FRAME GENRATION 功能是由 Ada Lovelace GPU 內第 4 代 Tensor Cores 進行處理。ezone.hk 找來多款對應 DLSS 3 技術的 3D 遊戲及《3DMark》進行測試。

----------------------------------------

《A Plague Tale: Requiem》

《A Plague Tale: Requiem》只要配合新一代 GeForce RTX 40 系列,才可開啟「DLSS Frame Generation」功能。

效能測試:

GeForce RTX 4090 內建第 4 代 Tensor Cores 進行「DLSS Frame Generation」,有效提升遊戲 FPS 流暢度,當中 DLSS off 與 DLSS Qualtiy 設定,FPS 已相差達 26%,而在 Ultra Performance 設定,更提速近一倍。相比之下,GeForce RTX 3090 Ti 只能使用 DLSS 3 中的 DLSS SUPER RESOLUTION 及 REFLEX,加速表現明顯被比下去。

畫質方面,GeForce RTX 4090 在 DLSS off (左) 及 DLSS Quality (右) 比較,DLSS 物件邊緣比原畫面銳利,石頭上的紋理也更突出,正正是 AI 發揮的威力。

---------------------------------------

《Cyberpunk 2077》

《Cyberpunk 2077》「DLSS Frame Generation」選項。

效能測試:

《Cyberpunk 2077》對系統要求極高,在 4K 解像度下設定最高畫質及全開光追效果,上代最強的 GeForce RTX 3090 Ti 亦只有 32 FPS,而 GeForce RTX 4090 憑著新一代  Ada Lovelace 架構及第 3 代的 RT Cores,即使未使用 DLSS 技術,已能提供 111 FPS 的流暢畫面,流暢度大幅拋離 GeForce RTX 3090 Ti,而啟用 DLSS 3 技術後,流暢更進一步提升 。

畫質方面,比較汽車前端的金屬邊緣及車軑,「DLSS:Quality」(右) 的紋理非常清晰,更與 DLSS off (左) 設定時相近。

---------------------------------------

《F1 22》

《F1 22》「DLSS Frame Generation」選項。

效能測試:

《F1 22》全面優化 DLSS 3 技術,在「DLSS Quality」設定下,已能將 GeForce RTX 4090 的 FPS 96 大幅提升至 178,而在「Ultra Performance」下更達到 255 FPS 的超流暢度表現,作為要即時快速反應的賽車遊戲,就最適合。相比之下,GeForce RTX 3090 Ti 在啟用 DLSS 後,的提速表現明顯落後。

DLSS off (左) 及 DLSS Quality (右) 畫面比較。

---------------------------------------

《Justice Online》 (逆水寒)

《Justice Online》「DLSS Frame Generation」選項。

效能測試:

《Justice Online》大量使用 RT 技術,當中路徑追踪通過 NVIDIA RTX 直接照明(RTXDI)、像素完美的陰影、提供更佳的反射,而遊戲內如照片般逼真的細節,晝夜都有自然的全局光照,由 NVIDIA 基於儲層的時空重要性重採樣全局光照 (ReSTIR GI) 提供。此外,為了對光線追踪結果進行降噪,《Justice Online》 更利用了NVIDIA Real Time Denoiser (NRD)。

正因如此,《Justice Online》對系統要求極高,在 4K 最高畫質及全開 RT 下,GeForce RTX 4090 也只能提供 16fps,可幸配合 DLSS 3 技術及第 4 代 Tensor Cores 進行 DLSS Frame Generation,立刻將遊戲流暢度大幅提升至 54,而在 DLSS Performance 下更達 82 FPS。

DLSS off (左) 及 DLSS Quality (右) 畫面比較。

---------------------------------------

《3DMark》 DLSS 測試

《3DMark》DLSS 測試 GPU 在使用不同 DLSS 設定的流暢度,測試可見 RTX 4090 在啟用 DLSS Quality 及 Performance 後,FPS  分別提升了 127.5% 及 189.5%,相反 RTX 3090 Ti 則只提升了 78.4% 及 151.1%。

---------------------------------

Test 03:運作溫度.功耗    

分析:功耗控制理想

RTX 4090 雖然 CUDA Cores、電晶體數目、時脈均大幅提升,但受惠於 TSMC 4N 定制工藝,故 TGP 功耗未有提升,同樣保持在 450W,在顯示核心全負載測試,平台總功耗 585.5W,比非公版的 RTX 3090 Ti 平台更低。

平台總功耗 585.5W,比非公版的 RTX 3090 Ti 平台更低。

溫度方面,受測的 GeForce RTX 4090 FE 以雙風扇增大,葉刀片直徑由 110mm 增至 116mm ,風量增加 20%,全負載溫度為 73℃,與 RTX 3090 Ti 相近,屬相對涼快的水評,而此時風扇轉速只為約 1,500rpm,噪音也能在保持在低水評,可見其散熱設計相當優良。

全負載溫度為 73℃,與 RTX 3090 Ti 相近。

評語:地上最強卡王

GeFoce RTX 4090 採用 Ada Lovelace  新架構,CUDA 數目高達 16,384 個,加上核心加速再創新高,再配合 DLSS 3 技術,在所有測試均創出新高,絕對稱得上是地上最強卡王。不過,AMD 使用新一代 RDNA 3 架構的 Radeon RX 7000 系列將於今月內發布,預期每 Watt 效能提升超過 50%,相信或可與 GeFoce RTX 40 系列一較高下。

【相關報道】

【相關報道】

即刻【按此】,用 App 睇更多產品開箱科技影片

Source:ezone.hk

相關文章

Page 1 of 9