GeForce RTX 4090搭載おすすめグラボ&パソコン比較

2022年に発売されたGeForce RTX 4090はRay Tracing処理にOut-of-Order実行が実装されたことで、Ray Tracing処理に対応したゲームでは大幅な性能向上を実現しています。そのため各種ベンチマークにおいても、3DMark Port RoyalのようなRay Tracing性能計測に対応したベンチマークでは非常に高いスコアを叩き出しています。

NVIDIA GeForce RTX 4090の詳細スペックと特徴

メーカー・モデル名NVIDIA GeForce RTX 4090
CUDA Core数16,384
ブーストクロック2,520 MHz
メモリ容量24GB
共有キャッシュ72MB
単精度性能82.57536 TFLOPS
倍精度性能1.291 TFLOPS
Tensor Core性能660.60288 TFLOPS
TDP450W
発売日2022年10月
Ray Tracing性能191 TFLOPS
ベースクロック2,230 MHz
ピクセル・レート443.5 GPixel毎秒
テクスチャ・レート1290.2 GTexel毎秒
メモリタイプGDDR6X
メモリクロック21.0 GT毎秒
メモリバス幅384bit
メモリ帯域幅1008.3 GB毎秒
接続規格PCIe 4.0 x16
アーキテクチャAda Lovelace (GeForce 4000 series)
コードネームAD102-300
ファウンドリTSMC
プロセスルール4nm (4N)
トランジスタ密度125.3 MTr/mm²
トランジスタ数763億
ダイサイズ608.5mm²
SM数128
無効化SM数16
TMU数512
ROPユニット数176
Tensor Core数512
RayTracing Core数128
NVLink非対応
3DMark Speed Way(DX12)10,009
3DMark Port Royal(DX12)26,072
3DMark Night Raid(DX12)193,018
3DMark Time Spy(DX12)36,225
3DMark Wild Life(DX12)163,951
3DMark Fire Strike(DX11)73,839
PassMark GPU39,084
Userbenchmark GPU(実効)370
Userbenchmark DX10461

GeForce RTX 4090はAda Lovelaceアーキテクチャを採用し最初に発売されたGPUです。カタログスペックは非常に優秀で、CUDA Coreは前世代のGeForce RTX 3090Ti比で約1.5倍です。しかも動作クロックも大幅に伸びており、GeForce RTX 3090Ti比で1.35倍です。結果的にFLOPS性能は2倍超というとんでもない性能向上を実現しています。

機械学習(≒deep learning)の高速化を意識しており、Tensor Coreは8bit精度浮動小数点数演算に対応しつつ16bit精度でも大幅にFLOPS値が伸びました。

しかし欠点もあります。Radeon RX 6950XTで実装された大容量共有キャッシュのサイズには負けており、結果的に一部のベンチマークではRadeon RX 6950XTに負ける結果となっています。

AD102チップの144基のStreaming Multiprocessor(SM)のうち16基が無効化され128基

GeForce RTX 4090が搭載するSMはGeForce RTX 3090Tiの84基、RTX3090の82基と比較し大幅に増加して128基となっています。これでも16基が無効化されているため、これらを有効化して144基に近づけたGeForce RTX 4090Tiがいずれ発売されるでしょう。

AMD Radeon RXを意識して増量してきたL2共有キャッシュ72MB

GPUにもCPUと同様にキャッシュが存在します。各演算器(コア)ごとのキャッシュの他に共有キャッシュも存在します。NVIDIA GeForceの場合L2共有キャッシュという形で実装されており、AMD Radeonの場合はL3共有キャッシュとして実装されています。

このGeForce RTX 4090のL2共有キャッシュは72MBですが、Radeon RX 6950XTのL3共有キャッシュは128MBもあります。結果的に、データセットが小さいベンチマークである3DMark Night Raidにおいてはほぼ全てのデータがRadeon RX 6950XTの共有キャッシュに乗ることになり、Radeon RX 6950XTがGeForce RTX 4090に勝つベンチマーク結果になっています。

そして、実際のゲームでも共有キャッシュが効きやすい局面が多いのが事実です。FPSゲームにおいて顕著ですが、FPSゲームにおいては⊿t秒後のプレーヤの位置座標はその近傍であり、データの空間的局所性が高いです。マップをランダムに転々とするような挙動のゲームなら別ですが、実際のゲームはそのようにはなっておらず、現時点の座標の近傍のデータを何度も参照します。こういった状況ではキャッシュが効きやすいため、キャッシュサイズが大きいのは有利です。

演算器の性能といった面ではRadeon RX 6950XTよりもGeForce RTX 4090が圧倒的に優れているのは確かです。それをAMDも自覚しているためあえてキャッシュサイズを大きくし「実力の差を埋める」対策を打っていますがこれが意外と効果を上げており、GeForce RTX 4090とRadeon RX 6950XTのカタログスペックの差ほどは実際のゲームでのフレームレート差は無いと言っていいです。

余談:これまであまり験のいいコードネームではなかったAda

Adaはこれまでのコンピュータ史において度々使用されてきたコードネームです。学術的に有名なのは米国国防総省が独自開発していたプログラミング言語Adaです。プログラミング言語Adaも今回のGPUと全く同じAda Lovelaceという実在した人物に因んだものです。国防総省が所管する安全保障分野上、防衛システム等の組込みシステムにバグが混入すると被害が甚大であるためできるだけバクが発生しにくいプログラミング言語の開発が求められていました。そのために国防総省が独自開発したのがAdaです。C言語はきわめて型付けがゆるい言語ですが、Adaは非常に厳格な型付けを持っています。実行段階でバグを潰すのではなく、実行前の段階の静的(static)検査によってバグを潰しやすい文法が採用されました(プログラミング検証論)。

しかしこのAdaプロジェクトは成功とはいい難く、日本で言えば経産省が主導し失敗した情報大航海プロジェクト(2007年に東大:喜連川研究室が中心となり発足した打倒Googleを掲げて和製検索エンジンを作るプロジェクト)や第5世代コンピュータプロジェクトのように大失敗に終わりつつも有耶無耶にされてしまったプロジェクトです。その後、米国国防総省で採用されていった言語はAdaではなくC++やJavaです。F35ではC++になり、国防総省の業務システムに関してはJavaになりました。理由は「Adaを書ける優秀な人材が確保できなかった」ことにあります。世の中には大勢のC++やJavaプログラマが存在しており競争が働いています。その中で優秀な人材を採用した方がバグが少ない堅牢なシステムができることが後に判明し、非常に狭い世界でしか使われずプログラマ人口が少ないAdaは淘汰されました。Adaは「壮大な構想で理論的な設計段階では優れていたものの実際の実用段階で失敗した言語」と失敗の烙印を押されています。

また元ネタとなっているAdaという人物に関しては「本当に史上最初のプログラマなのか?」と常に疑義がつきまとってきた人物です。実際は、数学を理解していた他者の指示に従って、Adaが単純な現業作業をしていた(当時のコンピュータへ入力するためのテープへのパンチ作業や配線切り替え作業をしていた)のみであり、Ada彼女自身はアルゴリズムとデータ構造を全く理解していなかったとされています。

コンピュータサイエンスの講学上も、例えばアラン・チューリングの考案したチューリング・マシンは文脈自由文法と同値であり、オートマトンが正規表現と同値であるのと並び言語理論を学ぶ上で欠かせない概念となっています。しかしエイダ・ラブレスはそのような普遍的かつ不朽の概念を全く産み出していないため、コンピュータサイエンスの分野でAdaを目にするのは「過去こういうことがあった」というコンピュータ史ぐらいなものです。今日まで影響を及ぼす業績は皆無と言っていいでしょう。

NVIDIA GeForce RTX 4090を搭載した各メーカーおすすめグラボの横断比較

ここではGeForce RTX 4090を搭載した各メーカーのグラフィックボードを横断的に比較していきます。いわゆるオリジナルファンモデルを比較していきます。GeForce RTX 4090自体はNVIDIA社が供給するGPUであり、そのGPUを各グラボメーカーが組み立て(アセンブル)してグラフィックボードという形で完成させています。そのためGeForce RTX 4090だけでも多数のメーカーから多数のグラボが発売され存在しています。それらのスペックと価格をまとめています。

1位: MSI GeForce RTX 4090 SUPRIM LIQUID X 24G (VD8261)

GPUNVIDIA GeForce RTX 4090
型番MSI GeForce RTX 4090 SUPRIM LIQUID X 24G (VD8261)
発売日2022年10月
専有スロット数2.2 slot
全幅43 mm
全長280 mm
全高140 mm
質量等2.353kg / ファン込みのラジエータサイズ274mm x 121mm x 55mm
ブーストクロックExtreme Performance: 2,640 MHz (MSI Center)、Boost: 2,625 MHz (GAMING & SILENT Mode)
単精度(32bit)性能86.50752 TFLOPS
倍精度(64bit)性能1.352 TFLOPS
Tensor(行列積和)性能692.06016 TFLOPS
メモリ容量24GB
補助電源16pin (12VHPWR, PCIe5.0 12+4pin) ×1
推奨電源容量1000W (最低限850W)
冷却機構簡易水冷
ファン数本体ファン×1、ラジエータファン×2
出力コネクタDisplayPort×3, HDMI×1

簡易水冷一体型タイプのグラボです。下記モデル「MSI GeForce RTX 4090 SUPRIM X 24G (VD8262)」の簡易水冷一体型版に相当します。ブーストクロック値は同じですがこちらの方が冷却性能が高いため、高クロックを長時間維持できます。結果的に性能はこちらが上です。メリットはPCI Expressカード本体は2スロット占有程度の厚さに収まっているためSmall Form Factorパソコンケースや古いタイプのPCケースにも搭載できつつ高い冷却性能を有していることです。本体についているファンはGPU以外の電子部品を冷やすためにあります。GPUは高さが均一な平面であるため冷却しやすいですが電子部品は高さがまちまちであり水冷で画一的に冷却が難しいためです。ラジエータサイズはありきたりなサイズで、ファン込みで厚さは55mmです。ファンの厚さが25mmであるためラジエータの実質的な厚さは25mm、水冷と言えどそこまで高い冷却性能はありません。

2位: MSI GeForce RTX 4090 SUPRIM X 24G (VD8262)

GPUNVIDIA GeForce RTX 4090
型番MSI GeForce RTX 4090 SUPRIM X 24G (VD8262)
発売日2022年10月
専有スロット数3.9 slot
全幅78 mm
全長336 mm
全高142 mm
質量等2.413kg / 3.72ℓ
ブーストクロックExtreme Performance: 2,640 MHz (MSI Center)、Boost: 2,625 MHz (GAMING & SILENT Mode)
単精度(32bit)性能86.50752 TFLOPS
倍精度(64bit)性能1.352 TFLOPS
Tensor(行列積和)性能692.06016 TFLOPS
メモリ容量24GB
補助電源16pin (12VHPWR, PCIe5.0 12+4pin) ×1
推奨電源容量1000W (最低限850W)
冷却機構空冷
ファン数本体ファン×3
出力コネクタDisplayPort×3, HDMI×1

上記モデル「MSI GeForce RTX 4090 SUPRIM LIQUID X 24G (VD8261)」の空冷版です。水冷版はラジエータが別途あるため本体は2スロット占有に収まっていますが、こちらは空冷であるため78mm厚もあります。実質的にほぼ4スロット占有です。下記モデルの「MSI GeForce RTX 4090 GAMING X TRIO 24G (VD8263)」より上位に位置付けられるグラボなので、予算がある人はこちらの方がいいです。

3位: MSI GeForce RTX 4090 GAMING X TRIO 24G (VD8263)

GPUNVIDIA GeForce RTX 4090
型番MSI GeForce RTX 4090 GAMING X TRIO 24G (VD8263)
発売日2022年10月
専有スロット数3.85 slot
全幅77 mm
全長337 mm
全高140 mm
質量等2.17kg / 3.63ℓ
ブーストクロックExtreme Performance: 2,610 MHz(MSI Center)、Boost: 2,595 MHz (GAMING & SILENT Mode)
単精度(32bit)性能85.52448 TFLOPS
倍精度(64bit)性能1.337 TFLOPS
Tensor(行列積和)性能684.19584 TFLOPS
メモリ容量24GB
補助電源16pin (12VHPWR, PCIe5.0 12+4pin) ×1
推奨電源容量850W
冷却機構空冷
ファン数本体ファン×3
出力コネクタDisplayPort×3, HDMI×1

価格は他のグラボより多少低めです。見ての通り3スロット占有を余裕で超えています。ブーストクロックは純正ツールで保証範囲内で引き上げることができますがたった+15MHzなので購入して素のままで使って問題ありません。デザイン面から言うと個人的に好きではないので、他のグラボが流通してないから消去法的に買ってもいいかな程度のモデルです。特にエッジが見当たらないグラボです。

4位: GAINWARD GeForce RTX 4090 Phantom GS NED4090S19SB-1020P (VD8255)

GPUNVIDIA GeForce RTX 4090
型番GAINWARD GeForce RTX 4090 Phantom GS NED4090S19SB-1020P (VD8255)
発売日2022年10月
専有スロット数3.5 slot
全幅69.7 mm
全長329.4 mm
全高141.6 mm
質量等3.25ℓ
ブーストクロック2,610 MHz
単精度(32bit)性能85.52448 TFLOPS
倍精度(64bit)性能1.337 TFLOPS
Tensor(行列積和)性能684.19584 TFLOPS
メモリ容量24GB
補助電源16pin (12VHPWR, PCIe5.0 12+4pin) ×1
推奨電源容量
冷却機構空冷
ファン数本体ファン×3
出力コネクタDisplayPort×3, HDMI×1

下記モデル「GAINWARD GeForce RTX 4090 Phantom NED4090019SB-1020P (VD8256)」の高クロック版です。工場出荷時のファクトリーオーバークロック値が+90MHz高いだけでデザインやヒートシンク含めてクロック以外のスペックは全く同じです。よって価格が安ければ下記モデルを購入して手動でオーバークロックしてしまっても結果は同じになります。ただしファクトリーオーバークロックされているブーストクロック値なら定格動作の範囲内ということで保証範囲内なので、余計なオーバークロック操作をしたくない人はこちらの方がいいです。

5位: GAINWARD GeForce RTX 4090 Phantom NED4090019SB-1020P (VD8256)

GPUNVIDIA GeForce RTX 4090
型番GAINWARD GeForce RTX 4090 Phantom NED4090019SB-1020P (VD8256)
発売日2022年10月
専有スロット数3.5 slot
全幅69.7 mm
全長329.4 mm
全高141.6 mm
質量等3.25ℓ
ブーストクロック2,520 MHz
単精度(32bit)性能82.57536 TFLOPS
倍精度(64bit)性能1.291 TFLOPS
Tensor(行列積和)性能660.60288 TFLOPS
メモリ容量24GB
補助電源16pin (12VHPWR, PCIe5.0 12+4pin) ×1
推奨電源容量
冷却機構空冷
ファン数本体ファン×3
出力コネクタDisplayPort×3, HDMI×1

GAINWARDはPalitの子会社が展開しているブランドです。コンセプトとしては価格の安さ重視。高級路線はASUS等が先を行っているのでそれに取って代わるようなことは目指してなく、競争地位の4類型で言えばフォロワーの企業です。GAINWARDは決してニッチャーでもありません。

このグラボも大して高性能でもなく品質重視でもない、単に価格の安さ重視で出てきたグラボです。

GeForce RTX 4090&第13世代Intel Core(Raptor Lake)搭載のパソコン比較

GeForce RTX 4090を搭載したパソコンは同時期に発売された第13世代Intel Coreと組み合わせられることが多いです。

パソコン工房 iiyama PC SENSE-F079-LC139KF 【Core i9 13900KF,  メモリ32GB~, SSD1TB~, 65.9ℓ】

商品名パソコン工房 iiyama PC SENSE-F079-LC139KF
CPUIntel Core i9 13900KF
GPUNVIDIA GeForce GT 1030, GeForce RTX 3070, GeForce RTX 3080 10GB, GeForce RTX 4090, NVIDIA RTX A2000, NVIDIA RTX A4500
メモリ32GB
SSD1TB
OSWindows 11 Home or Windows 11 Pro
サイズ65.9ℓ
価格\ 675,800(税込)

選択できるCPUはCore i9 13900KF一択なので基本構成価格がどうしても高額になってしまっているパソコンです。メモリ容量が最低でも32GBからしか選択できないのと、パソコンケースが大型なことがデメリットですがそれ以外はよくできています。このパソコンはグラボがローエンドなGeForce GT 1030を選ぶ選択肢も存在しますが、ここではRTX4090とCore i9 13900KFの組み合わせになってしまうのでこれだけ高額になっています。

マウスコンピューター G-Tune XP-Z 2210XP-Z790W11 【Core i7 13700KF, GeForceRTX4090, メモリ64GB, SSD2TB,HDD選択必須, 54.0ℓ】

商品名マウスコンピューター G-Tune XP-Z 2210XP-Z790W11 (第13世代Intel)
CPUIntel Core i7 13700KF
GPUNVIDIA GeForce RTX 4090
メモリ64GB
SSD2TB
HDD4TB(HDD選択必須)
OSWindows 11 Home or Windows 11 Pro
サイズ54.0ℓ / 19.7kg
価格\ 683,100(税込)

見ての通り非常に高額です。価格の高さは殆がRTX4090のグラボによるものです。メモリ64GBやSSD2TBも必要なくもっと少なくてもいいから価格を安くと考えるユーザは多いでしょう。しかしこれがこのモデルの最小構成です。メモリが64GBやSSD2TBのように容量が大きい分には価格以外のデメリットは無いのでいいにしても、せめてHDDは非搭載カスタマイズできるようにして欲しいものです。

NVIDIA GeForce RTX 4090の総合平均ベンチマークスコア

GeForce RTX 4090を各種ベンチマークで評価したスコアから平均値を求め、一つの結果に集約した「総合平均」スコアで他のGPUと比較した結果を示します。一つのベンチマークだけでは特定のGPUを贔屓することが可能なので、多くのベンチマークの平均を取ることで公平さを担保します。平均値を計算する前に、各種ベンチマークの結果を正規化(ノーマライズ)します。なぜならベンチマークによってスコアの絶対値がまちまちだからです。これは日経平均株価において株価の絶対値が大きい「値がさ株」の重み付けが大きくなってしまい、値がさ株一つの動向によって平均が大きく動いてしまう問題と似ています。そうならないように、各ベンチマークごとのスコアを正規化し揃えた上で平均値と取ることで各ベンチマークのスコアの重み付けを均一にし公平化しています。その結果は以下の通りです。

GPU(グラボ)名 総合平均GPU(グラボ)ベンチマーク性能評価スコア値
GeForce RTX 4090 96,870 +0.0%
GeForce RTX 4080 78,182 -23.9%
GeForce RTX 4070 Ti 65,941 -46.9%
GeForce RTX 3090 Ti 63,452 -52.7%
Radeon RX 6950 XT 59,801 -62.0%
GeForce RTX 3090 57,673 -68.0%
Radeon RX 6900 XT 57,325 -69.0%
GeForce RTX 3080 Ti 57,196 -69.4%
GeForce RTX 3080 12G 54,823 -76.7%
GeForce RTX 4070 53,829 -80.0%
Radeon RX 6800 XT 51,931 -86.5%
GeForce RTX 3080 51,031 -89.8%
NVIDIA TITAN RTX 45,102 -114.8%
GeForce RTX 3070 Ti 44,561 -117.4%
Radeon RX 6800 44,143 -119.4%
GeForce RTX 2080 Ti 42,829 -126.2%
GeForce RTX 4060 Ti 42,351 -128.7%
GeForce RTX 3070 40,894 -136.9%
NVIDIA TITAN V 40,009 -142.1%
Radeon RX 6750 XT 39,293 -146.5%
Radeon RX 6700 XT 37,564 -157.9%
GeForce RTX 3060 Ti 35,805 -170.6%
GeForce RTX 2080 Super 35,583 -172.2%
NVIDIA TITAN Xp 35,438 -173.4%
Radeon RX 6700 34,300 -182.4%
GeForce RTX 4060 34,268 -182.7%
GeForce RTX 2080 33,562 -188.6%
GeForce GTX 1080 Ti 33,214 -191.7%
Radeon VII 32,801 -195.3%
Radeon RX 5700 XT 32,748 -195.8%
Radeon RX 6650 XT 32,483 -198.2%
NVIDIA TITAN X 32,461 -198.4%
GeForce RTX 2070 Super 31,901 -203.7%
Radeon RX 6600 XT 31,613 -206.4%
Radeon RX 5700 28,937 -234.8%
GeForce RTX 2070 28,590 -238.8%
GeForce RTX 3060 28,197 -243.5%
GeForce RTX 2060 Super 28,030 -245.6%
Radeon RX 5600 XT 27,096 -257.5%
GeForce GTX 1080 26,706 -262.7%
Radeon RX 6600 26,550 -264.9%
GeForce GTX 1070 Ti 24,577 -294.2%
GeForce RTX 2060 24,299 -298.7%
NVIDIA GTX TITAN X 24,196 -300.4%
GeForce GTX 1070 21,939 -341.5%
Radeon RX 5600 21,812 -344.1%
GeForce GTX 1660 Ti 21,139 -358.3%
GeForce GTX 1660 Super 20,778 -366.2%
GeForce RTX 3050 20,505 -372.4%
GeForce GTX 1660 20,378 -375.4%
Radeon RX 590 18,910 -412.3%
GeForce GTX 1650 Super 17,955 -439.5%
Radeon RX 5500 XT 17,703 -447.2%
Radeon RX 580 17,297 -460.0%
Radeon RX 5500 16,807 -476.4%
GeForce GTX 1060 15,805 -512.9%
Radeon RX 570 15,350 -531.1%
Radeon RX 6500 XT 15,072 -542.7%
GeForce GTX 1650 13,558 -614.5%
Radeon RX 5300 13,339 -626.2%
Radeon RX 6400 12,131 -698.6%
GeForce GTX 1050 Ti 10,074 -861.6%
GeForce GTX 1630 8,412 -1,051.5%
GeForce GTX 1050 8,337 -1,062.0%
Radeon RX 560 7,420 -1,205.6%
Radeon RX 550 5,105 -1,797.7%
GeForce GT 1030 4,603 -2,004.3%
Radeon 540 3,468 -2,693.1%
GeForce GT 1010 2,251 -4,204.0%
Radeon 530 1,975 -4,805.1%
Radeon 520 1,789 -5,314.7%
GeForce GT 710 1,020 -9,396.7%

各種ベンチマークの平均値をとってもGeForce RTX 4090の強さは圧倒的です。Radeon RX 6950XTから見ると+50%も高い性能を有しており、GeForce RTX 3090Tiから見ると+45%、GeForce RTX 3090から見ると+60%もの性能水準です。軒並み前世代から+50%程度性能向上してると見ていいでしょう。平均を取る対象の各種ベンチマークの結果は本ページの後半に掲載していますが、3DMark Night RaidのようにGeForce RTX 4090の結果が芳しくないベンチマークはあれど、全体の平均を取ればこのようにGeForce RTX 4090が圧勝します。

NVIDIA GeForce RTX 4090の各種ベンチマーク比較

GeForce RTX 4090を各種ベンチマークごとに、どのあたりの位置づけにあるか比較していきます。グラフ先のパーセンテージは「低い方のGPUから見たGeForce RTX 4090とのスコア差」を意味します。たとえばあるGPUで-120%と書いてある場合は、そのGPUから見てGeForce RTX 4090の性能が+120%上という意味です。

3DMark Port Royal (DirectX 12):GeForce RTX 4090は他を引き離し圧勝

3DMark Port Royalは2018年にリリースされたベンチマークで、3DMarkの中でも最新モデルで高いスコアが出やすくなっています。RayTracing CoreやTensor Coreの性能を考慮するベンチマークだからです。前世代のGeForce RTX 3000Ampereを過去のものにするほど大幅な性能向上を遂げました。

GPU(グラボ)名 3DMark Port Royal(Graphics)のベンチマーク性能評価スコア値
GeForce RTX 4090 26,072 +0.0%
GeForce RTX 4080 17,884 -45.8%
GeForce RTX 3090 Ti 14,840 -75.7%
GeForce RTX 4070 Ti 13,961 -86.7%
GeForce RTX 3090 13,640 -91.1%
GeForce RTX 3080 Ti 13,229 -97.1%
GeForce RTX 3080 12G 12,173 -114.2%
GeForce RTX 3080 11,578 -125.2%
GeForce RTX 4070 11,115 -134.6%
Radeon RX 6950 XT 10,818 -141.0%
Radeon RX 6900 XT 10,393 -150.9%
NVIDIA TITAN RTX 9,869 -164.2%
Radeon RX 6800 XT 9,534 -173.5%
GeForce RTX 2080 Ti 9,111 -186.2%
GeForce RTX 3070 Ti 8,854 -194.5%
NVIDIA GTX TITAN X 8,323 -213.3%
GeForce RTX 3070 8,302 -214.0%
GeForce RTX 4060 Ti 8,057 -223.6%
Radeon RX 6800 7,812 -233.7%
GeForce RTX 2080 Super 7,005 -272.2%
GeForce RTX 3060 Ti 6,977 -273.7%
GeForce RTX 2080 6,441 -304.8%
Radeon RX 6750 XT 6,259 -316.6%
GeForce RTX 2070 Super 6,037 -331.9%
GeForce RTX 4060 6,024 -332.8%
Radeon RX 6700 XT 5,974 -336.4%
GeForce RTX 2070 5,186 -402.7%
GeForce RTX 3060 5,138 -407.4%
GeForce RTX 2060 Super 5,073 -413.9%
Radeon RX 6700 5,065 -414.7%
Radeon RX 6650 XT 4,648 -460.9%
Radeon RX 6600 XT 4,512 -477.8%
GeForce RTX 2060 4,150 -528.2%
NVIDIA TITAN V 3,820 -582.5%
Radeon RX 6600 3,755 -594.3%
GeForce RTX 3050 3,531 -638.4%
NVIDIA TITAN Xp 2,397 -987.7%
NVIDIA TITAN X 2,261 -1,053.1%
GeForce GTX 1080 Ti 2,205 -1,082.4%
GeForce GTX 1660 Ti 1,657 -1,473.4%
GeForce GTX 1080 1,634 -1,495.6%
GeForce GTX 1660 Super 1,563 -1,568.1%
GeForce GTX 1070 Ti 1,489 -1,651.0%
GeForce GTX 1070 1,244 -1,995.8%
GeForce GTX 1060 813 -3,106.9%
Radeon RX 6500 XT 385 -6,671.9%
Radeon RX 6400 329 -7,824.6%

GeForce RTX 4090よりも2年前に発売されたGeForce RTX 3090が-90%程度となっていますが、これは逆に見ると「GeForce RTX 3090から見たGeForce RTX 4090のスコアが+90%向上」を意味します。ほぼ2倍の性能向上です。

3DMark Night Raid (DirectX 12):GeForce RTX 4090はRadeon RX 6950XTに負ける

3DMark Night Raidは2018年にリリースされたベンチマークで、3DMark Time Spyの軽量版です。軽量版というのは描画において実行されるスレッド数が少ないことを意味します。処理が軽いため、NVIDIA GeForceのCUDA Core数の多さが活かされないベンチマークの一つです。

GPU(グラボ)名 3DMark Night Raid(Graphics)のベンチマーク性能評価スコア値
GeForce RTX 4090 193,018 +0.0%
GeForce RTX 4080 174,942 -10.3%
Radeon RX 6950 XT 168,384 -14.6%
GeForce RTX 4070 Ti 164,542 -17.3%
Radeon RX 6900 XT 159,221 -21.2%
Radeon RX 6800 XT 155,724 -23.9%
GeForce RTX 3090 Ti 154,158 -25.2%
GeForce RTX 4070 149,181 -29.4%
GeForce RTX 3080 12G 141,310 -36.6%
GeForce RTX 3080 Ti 141,143 -36.8%
GeForce RTX 4060 Ti 137,005 -40.9%
Radeon RX 6750 XT 136,603 -41.3%
GeForce RTX 3090 135,618 -42.3%
Radeon RX 6800 134,980 -43.0%
GeForce RTX 3070 Ti 130,430 -48.0%
GeForce RTX 3080 129,188 -49.4%
Radeon RX 6700 XT 127,437 -51.5%
Radeon RX 6700 121,154 -59.3%
NVIDIA TITAN RTX 120,471 -60.2%
Radeon RX 6650 XT 119,360 -61.7%
Radeon RX 6600 XT 118,627 -62.7%
GeForce RTX 4060 118,195 -63.3%
NVIDIA TITAN V 116,967 -65.0%
GeForce RTX 3070 116,553 -65.6%
GeForce RTX 2080 Ti 113,336 -70.3%
NVIDIA TITAN Xp 112,752 -71.2%
GeForce RTX 2080 Super 107,166 -80.1%
GeForce RTX 3060 Ti 105,724 -82.6%
Radeon RX 5700 XT 103,481 -86.5%
NVIDIA TITAN X 103,025 -87.4%
GeForce RTX 2070 Super 101,545 -90.1%
Radeon RX 6600 100,429 -92.2%
GeForce RTX 2080 99,518 -94.0%
Radeon VII 99,004 -95.0%
GeForce RTX 3060 94,864 -103.5%
GeForce GTX 1080 Ti 94,663 -103.9%
GeForce RTX 2060 Super 91,434 -111.1%
Radeon RX 5700 91,384 -111.2%
GeForce RTX 2070 91,124 -111.8%
Radeon RX 5600 XT 87,497 -120.6%
GeForce RTX 2060 82,443 -134.1%
GeForce GTX 1080 81,404 -137.1%
GeForce GTX 1070 Ti 77,792 -148.1%
GeForce GTX 1660 Ti 75,482 -155.7%
GeForce GTX 1660 Super 73,975 -160.9%
GeForce RTX 3050 72,698 -165.5%
GeForce GTX 1070 71,862 -168.6%
GeForce GTX 1660 65,774 -193.5%
NVIDIA GTX TITAN X 65,253 -195.8%
Radeon RX 6500 XT 64,674 -198.4%
Radeon RX 6400 64,674 -198.4%
Radeon RX 590 62,220 -210.2%
Radeon RX 5500 XT 60,852 -217.2%
Radeon RX 5500 60,644 -218.3%
GeForce GTX 1650 Super 59,637 -223.7%
Radeon RX 580 57,050 -238.3%
GeForce GTX 1060 54,011 -257.4%
Radeon RX 570 50,436 -282.7%
GeForce GTX 1650 45,311 -326.0%
GeForce GTX 1050 Ti 33,327 -479.2%
GeForce GTX 1630 29,368 -557.2%
GeForce GTX 1050 26,945 -616.3%
Radeon RX 560 25,667 -652.0%
Radeon RX 550 18,012 -971.6%
GeForce GT 1030 15,860 -1,117.0%
GeForce GT 1010 6,754 -2,757.8%
Radeon 530 5,471 -3,428.0%
Radeon 520 4,892 -3,845.6%
GeForce GT 710 3,077 -6,172.9%

実際GeForce RTX 3090Tiよりも高いスコアにはなっていますが、AMD Radeon RX 6950XTには勝てていません。一つの理由として、RTX 3090Tiと比較しRadeon RX 6950XTの方がクロックが高いためです。スレッド数が少なく単精度コア数(NVIDIA CUDA Core数)の多さの恩恵が受けられないため、RTX4090とRTX3090の性能差が殆ありません。

また、クロックが高いGeForce RTX 4090であっても3DMark Night RaidにおいてRadeon RX 6950XTに勝てていないのはRadeon RX 6950XTのL3共有キャッシュサイズが128もあることによります。Night Raidはデータセットが小さい上にスレッドが少ないベンチマークであるためキャッシュが非常に効きやすく、キャッシュサイズが大きいRadeon RX 6950XTが有利です。