2022年に発売されたGeForce RTX 4090はRay Tracing処理にOut-of-Order実行が実装されたことで、Ray Tracing処理に対応したゲームでは大幅な性能向上を実現しています。そのため各種ベンチマークにおいても、3DMark Port RoyalのようなRay Tracing性能計測に対応したベンチマークでは非常に高いスコアを叩き出しています。
- NVIDIA GeForce RTX 4090の詳細スペックと特徴
- NVIDIA GeForce RTX 4090を搭載した各メーカーおすすめグラボの横断比較
- 1位: MSI GeForce RTX 4090 SUPRIM LIQUID X 24G (VD8261)
- 2位: MSI GeForce RTX 4090 SUPRIM X 24G (VD8262)
- 3位: MSI GeForce RTX 4090 GAMING X TRIO 24G (VD8263)
- 4位: GAINWARD GeForce RTX 4090 Phantom GS NED4090S19SB-1020P (VD8255)
- 5位: GAINWARD GeForce RTX 4090 Phantom NED4090019SB-1020P (VD8256)
- GeForce RTX 4090&第13世代Intel Core(Raptor Lake)搭載のパソコン比較
- NVIDIA GeForce RTX 4090の総合平均ベンチマークスコア
- NVIDIA GeForce RTX 4090の各種ベンチマーク比較
NVIDIA GeForce RTX 4090の詳細スペックと特徴
メーカー・モデル名 | NVIDIA GeForce RTX 4090 |
---|---|
CUDA Core数 | 16,384 |
ブーストクロック | 2,520 MHz |
メモリ容量 | 24GB |
共有キャッシュ | 72MB |
単精度性能 | 82.57536 TFLOPS |
倍精度性能 | 1.291 TFLOPS |
Tensor Core性能 | 660.60288 TFLOPS |
TDP | 450W |
発売日 | 2022年10月 |
Ray Tracing性能 | 191 TFLOPS |
---|---|
ベースクロック | 2,235 MHz |
ピクセル・レート | 443.5 GPixel毎秒 |
テクスチャ・レート | 1290.2 GTexel毎秒 |
メモリタイプ | GDDR6X |
メモリクロック | 21.0 GT毎秒 |
メモリバス幅 | 384bit |
メモリ帯域幅 | 1008 GB毎秒 |
接続規格 | PCIe 4.0 x16 |
アーキテクチャ | Ada Lovelace (GeForce 4000 series) |
コードネーム | AD102-300 |
ファウンドリ | TSMC |
プロセスルール | 4nm (4N) |
トランジスタ密度 | 125.3 MTr/mm² |
トランジスタ数 | 763億 |
ダイサイズ | 608.5mm² |
SM数 | 128 |
---|---|
無効化SM数 | 16 |
TMU数 | 512 |
ROPユニット数 | 176 |
Tensor Core数 | 512 |
RayTracing Core数 | 128 |
NVLink | 非対応 |
3DMark Speed Way(DX12) | 10,009 |
3DMark Port Royal(DX12) | 26,072 |
3DMark Time Spy(DX12) | 36,225 |
3DMark Night Raid(DX12) | 193,018 |
3DMark Wild Life(DX12) | 163,951 |
3DMark Fire Strike(DX11) | 73,839 |
PassMark GPU | 39,084 |
Userbenchmark GPU(実効) | 370 |
Userbenchmark DX10 | 461 |
GeForce RTX 4090はAda Lovelaceアーキテクチャを採用し最初に発売されたGPUです。カタログスペックは非常に優秀で、CUDA Coreは前世代のGeForce RTX 3090Ti比で約1.5倍です。しかも動作クロックも大幅に伸びており、GeForce RTX 3090Ti比で1.35倍です。結果的にFLOPS性能は2倍超というとんでもない性能向上を実現しています。
機械学習(≒deep learning)の高速化を意識しており、Tensor Coreは8bit精度浮動小数点数演算に対応しつつ16bit精度でも大幅にFLOPS値が伸びました。
しかし欠点もあります。Radeon RX 6950XTで実装された大容量共有キャッシュのサイズには負けており、結果的に一部のベンチマークではRadeon RX 6950XTに負ける結果となっています。
AD102チップの144基のStreaming Multiprocessor(SM)のうち16基が無効化され128基
GeForce RTX 4090が搭載するSMはGeForce RTX 3090Tiの84基、RTX3090の82基と比較し大幅に増加して128基となっています。これでも16基が無効化されているため、これらを有効化して144基に近づけたGeForce RTX 4090Tiがいずれ発売されるでしょう。
AMD Radeon RXを意識して増量してきたL2共有キャッシュ72MB
GPUにもCPUと同様にキャッシュが存在します。各演算器(コア)ごとのキャッシュの他に共有キャッシュも存在します。NVIDIA GeForceの場合L2共有キャッシュという形で実装されており、AMD Radeonの場合はL3共有キャッシュとして実装されています。
このGeForce RTX 4090のL2共有キャッシュは72MBですが、Radeon RX 6950XTのL3共有キャッシュは128MBもあります。結果的に、データセットが小さいベンチマークである3DMark Night Raidにおいてはほぼ全てのデータがRadeon RX 6950XTの共有キャッシュに乗ることになり、Radeon RX 6950XTがGeForce RTX 4090に勝つベンチマーク結果になっています。
そして、実際のゲームでも共有キャッシュが効きやすい局面が多いのが事実です。FPSゲームにおいて顕著ですが、FPSゲームにおいては⊿t秒後のプレーヤの位置座標はその近傍であり、データの空間的局所性が高いです。マップをランダムに転々とするような挙動のゲームなら別ですが、実際のゲームはそのようにはなっておらず、現時点の座標の近傍のデータを何度も参照します。こういった状況ではキャッシュが効きやすいため、キャッシュサイズが大きいのは有利です。
演算器の性能といった面ではRadeon RX 6950XTよりもGeForce RTX 4090が圧倒的に優れているのは確かです。それをAMDも自覚しているためあえてキャッシュサイズを大きくし「実力の差を埋める」対策を打っていますがこれが意外と効果を上げており、GeForce RTX 4090とRadeon RX 6950XTのカタログスペックの差ほどは実際のゲームでのフレームレート差は無いと言っていいです。
余談:これまであまり験のいいコードネームではなかったAda
Adaはこれまでのコンピュータ史において度々使用されてきたコードネームです。学術的に有名なのは米国国防総省が独自開発していたプログラミング言語Adaです。プログラミング言語Adaも今回のGPUと全く同じAda Lovelaceという実在した人物に因んだものです。国防総省が所管する安全保障分野上、防衛システム等の組込みシステムにバグが混入すると被害が甚大であるためできるだけバクが発生しにくいプログラミング言語の開発が求められていました。そのために国防総省が独自開発したのがAdaです。C言語はきわめて型付けがゆるい言語ですが、Adaは非常に厳格な型付けを持っています。実行段階でバグを潰すのではなく、実行前の段階の静的(static)検査によってバグを潰しやすい文法が採用されました(プログラミング検証論)。
しかしこのAdaプロジェクトは成功とはいい難く、日本で言えば経産省が主導し失敗した情報大航海プロジェクト(2007年に東大:喜連川研究室が中心となり発足した打倒Googleを掲げて和製検索エンジンを作るプロジェクト)や第5世代コンピュータプロジェクトのように大失敗に終わりつつも有耶無耶にされてしまったプロジェクトです。その後、米国国防総省で採用されていった言語はAdaではなくC++やJavaです。F35ではC++になり、国防総省の業務システムに関してはJavaになりました。理由は「Adaを書ける優秀な人材が確保できなかった」ことにあります。世の中には大勢のC++やJavaプログラマが存在しており競争が働いています。その中で優秀な人材を採用した方がバグが少ない堅牢なシステムができることが後に判明し、非常に狭い世界でしか使われずプログラマ人口が少ないAdaは淘汰されました。Adaは「壮大な構想で理論的な設計段階では優れていたものの実際の実用段階で失敗した言語」と失敗の烙印を押されています。
また元ネタとなっているAdaという人物に関しては「本当に史上最初のプログラマなのか?」と常に疑義がつきまとってきた人物です。実際は、数学を理解していた他者の指示に従って、Adaが単純な現業作業をしていた(当時のコンピュータへ入力するためのテープへのパンチ作業や配線切り替え作業をしていた)のみであり、Ada彼女自身はアルゴリズムとデータ構造を全く理解していなかったとされています。
コンピュータサイエンスの講学上も、例えばアラン・チューリングの考案したチューリング・マシンは文脈自由文法と同値であり、オートマトンが正規表現と同値であるのと並び言語理論を学ぶ上で欠かせない概念となっています。しかしエイダ・ラブレスはそのような普遍的かつ不朽の概念を全く産み出していないため、コンピュータサイエンスの分野でAdaを目にするのは「過去こういうことがあった」というコンピュータ史ぐらいなものです。今日まで影響を及ぼす業績は皆無と言っていいでしょう。
NVIDIA GeForce RTX 4090を搭載した各メーカーおすすめグラボの横断比較
ここではGeForce RTX 4090を搭載した各メーカーのグラフィックボードを横断的に比較していきます。いわゆるオリジナルファンモデルを比較していきます。GeForce RTX 4090自体はNVIDIA社が供給するGPUであり、そのGPUを各グラボメーカーが組み立て(アセンブル)してグラフィックボードという形で完成させています。そのためGeForce RTX 4090だけでも多数のメーカーから多数のグラボが発売され存在しています。それらのスペックと価格をまとめています。
1位: MSI GeForce RTX 4090 SUPRIM LIQUID X 24G (VD8261)
GPU | NVIDIA GeForce RTX 4090 |
---|---|
型番 | MSI GeForce RTX 4090 SUPRIM LIQUID X 24G (VD8261) |
発売日 | 2022年10月 |
専有スロット数 | 2.2 slot |
全幅 | 43 mm |
全長 | 280 mm |
全高 | 140 mm |
質量等 | 2.353kg / ファン込みのラジエータサイズ274mm x 121mm x 55mm |
ブーストクロック | Extreme Performance: 2,640 MHz (MSI Center)、Boost: 2,625 MHz (GAMING & SILENT Mode) |
単精度(32bit)性能 | 86.50752 TFLOPS |
倍精度(64bit)性能 | 1.352 TFLOPS |
Tensor(行列積和)性能 | 692.06016 TFLOPS |
メモリ容量 | 24GB |
補助電源 | 16pin (12VHPWR, PCIe5.0 12+4pin) ×1 |
推奨電源容量 | 1000W (最低限850W) |
冷却機構 | 簡易水冷 |
ファン数 | 本体ファン×1、ラジエータファン×2 |
出力コネクタ | DisplayPort×3, HDMI×1 |
簡易水冷一体型タイプのグラボです。下記モデル「MSI GeForce RTX 4090 SUPRIM X 24G (VD8262)」の簡易水冷一体型版に相当します。ブーストクロック値は同じですがこちらの方が冷却性能が高いため、高クロックを長時間維持できます。結果的に性能はこちらが上です。メリットはPCI Expressカード本体は2スロット占有程度の厚さに収まっているためSmall Form Factorパソコンケースや古いタイプのPCケースにも搭載できつつ高い冷却性能を有していることです。本体についているファンはGPU以外の電子部品を冷やすためにあります。GPUは高さが均一な平面であるため冷却しやすいですが電子部品は高さがまちまちであり水冷で画一的に冷却が難しいためです。ラジエータサイズはありきたりなサイズで、ファン込みで厚さは55mmです。ファンの厚さが25mmであるためラジエータの実質的な厚さは25mm、水冷と言えどそこまで高い冷却性能はありません。
2位: MSI GeForce RTX 4090 SUPRIM X 24G (VD8262)
GPU | NVIDIA GeForce RTX 4090 |
---|---|
型番 | MSI GeForce RTX 4090 SUPRIM X 24G (VD8262) |
発売日 | 2022年10月 |
専有スロット数 | 3.9 slot |
全幅 | 78 mm |
全長 | 336 mm |
全高 | 142 mm |
質量等 | 2.413kg / 3.72ℓ |
ブーストクロック | Extreme Performance: 2,640 MHz (MSI Center)、Boost: 2,625 MHz (GAMING & SILENT Mode) |
単精度(32bit)性能 | 86.50752 TFLOPS |
倍精度(64bit)性能 | 1.352 TFLOPS |
Tensor(行列積和)性能 | 692.06016 TFLOPS |
メモリ容量 | 24GB |
補助電源 | 16pin (12VHPWR, PCIe5.0 12+4pin) ×1 |
推奨電源容量 | 1000W (最低限850W) |
冷却機構 | 空冷 |
ファン数 | 本体ファン×3 |
出力コネクタ | DisplayPort×3, HDMI×1 |
上記モデル「MSI GeForce RTX 4090 SUPRIM LIQUID X 24G (VD8261)」の空冷版です。水冷版はラジエータが別途あるため本体は2スロット占有に収まっていますが、こちらは空冷であるため78mm厚もあります。実質的にほぼ4スロット占有です。下記モデルの「MSI GeForce RTX 4090 GAMING X TRIO 24G (VD8263)」より上位に位置付けられるグラボなので、予算がある人はこちらの方がいいです。
3位: MSI GeForce RTX 4090 GAMING X TRIO 24G (VD8263)
GPU | NVIDIA GeForce RTX 4090 |
---|---|
型番 | MSI GeForce RTX 4090 GAMING X TRIO 24G (VD8263) |
発売日 | 2022年10月 |
専有スロット数 | 3.85 slot |
全幅 | 77 mm |
全長 | 337 mm |
全高 | 140 mm |
質量等 | 2.17kg / 3.63ℓ |
ブーストクロック | Extreme Performance: 2,610 MHz(MSI Center)、Boost: 2,595 MHz (GAMING & SILENT Mode) |
単精度(32bit)性能 | 85.52448 TFLOPS |
倍精度(64bit)性能 | 1.337 TFLOPS |
Tensor(行列積和)性能 | 684.19584 TFLOPS |
メモリ容量 | 24GB |
補助電源 | 16pin (12VHPWR, PCIe5.0 12+4pin) ×1 |
推奨電源容量 | 850W |
冷却機構 | 空冷 |
ファン数 | 本体ファン×3 |
出力コネクタ | DisplayPort×3, HDMI×1 |
価格は他のグラボより多少低めです。見ての通り3スロット占有を余裕で超えています。ブーストクロックは純正ツールで保証範囲内で引き上げることができますがたった+15MHzなので購入して素のままで使って問題ありません。デザイン面から言うと個人的に好きではないので、他のグラボが流通してないから消去法的に買ってもいいかな程度のモデルです。特にエッジが見当たらないグラボです。
4位: GAINWARD GeForce RTX 4090 Phantom GS NED4090S19SB-1020P (VD8255)
GPU | NVIDIA GeForce RTX 4090 |
---|---|
型番 | GAINWARD GeForce RTX 4090 Phantom GS NED4090S19SB-1020P (VD8255) |
発売日 | 2022年10月 |
専有スロット数 | 3.5 slot |
全幅 | 69.7 mm |
全長 | 329.4 mm |
全高 | 141.6 mm |
質量等 | 3.25ℓ |
ブーストクロック | 2,610 MHz |
単精度(32bit)性能 | 85.52448 TFLOPS |
倍精度(64bit)性能 | 1.337 TFLOPS |
Tensor(行列積和)性能 | 684.19584 TFLOPS |
メモリ容量 | 24GB |
補助電源 | 16pin (12VHPWR, PCIe5.0 12+4pin) ×1 |
推奨電源容量 | ― |
冷却機構 | 空冷 |
ファン数 | 本体ファン×3 |
出力コネクタ | DisplayPort×3, HDMI×1 |
下記モデル「GAINWARD GeForce RTX 4090 Phantom NED4090019SB-1020P (VD8256)」の高クロック版です。工場出荷時のファクトリーオーバークロック値が+90MHz高いだけでデザインやヒートシンク含めてクロック以外のスペックは全く同じです。よって価格が安ければ下記モデルを購入して手動でオーバークロックしてしまっても結果は同じになります。ただしファクトリーオーバークロックされているブーストクロック値なら定格動作の範囲内ということで保証範囲内なので、余計なオーバークロック操作をしたくない人はこちらの方がいいです。
5位: GAINWARD GeForce RTX 4090 Phantom NED4090019SB-1020P (VD8256)
GPU | NVIDIA GeForce RTX 4090 |
---|---|
型番 | GAINWARD GeForce RTX 4090 Phantom NED4090019SB-1020P (VD8256) |
発売日 | 2022年10月 |
専有スロット数 | 3.5 slot |
全幅 | 69.7 mm |
全長 | 329.4 mm |
全高 | 141.6 mm |
質量等 | 3.25ℓ |
ブーストクロック | 2,520 MHz |
単精度(32bit)性能 | 82.57536 TFLOPS |
倍精度(64bit)性能 | 1.291 TFLOPS |
Tensor(行列積和)性能 | 660.60288 TFLOPS |
メモリ容量 | 24GB |
補助電源 | 16pin (12VHPWR, PCIe5.0 12+4pin) ×1 |
推奨電源容量 | ― |
冷却機構 | 空冷 |
ファン数 | 本体ファン×3 |
出力コネクタ | DisplayPort×3, HDMI×1 |
GAINWARDはPalitの子会社が展開しているブランドです。コンセプトとしては価格の安さ重視。高級路線はASUS等が先を行っているのでそれに取って代わるようなことは目指してなく、競争地位の4類型で言えばフォロワーの企業です。GAINWARDは決してニッチャーでもありません。
このグラボも大して高性能でもなく品質重視でもない、単に価格の安さ重視で出てきたグラボです。
GeForce RTX 4090&第13世代Intel Core(Raptor Lake)搭載のパソコン比較
GeForce RTX 4090を搭載したパソコンは同時期に発売された第13世代Intel Coreと組み合わせられることが多いです。
パソコン工房 iiyama PC SENSE-F079-LC139KF 【Core i9 13900KF, メモリ32GB~, SSD1TB~, 65.9ℓ】
商品名 | パソコン工房 iiyama PC SENSE-F079-LC139KF |
---|---|
CPU | Intel Core i9 13900KF |
GPU | NVIDIA GeForce GT 1030, GeForce RTX 3070, GeForce RTX 3080 10GB, GeForce RTX 4090, NVIDIA RTX A2000, NVIDIA RTX A4500 |
メモリ | 32GB |
SSD | 1TB |
OS | Windows 11 Home or Windows 11 Pro |
サイズ | 65.9ℓ |
価格 | \ 675,800(税込) |
選択できるCPUはCore i9 13900KF一択なので基本構成価格がどうしても高額になってしまっているパソコンです。メモリ容量が最低でも32GBからしか選択できないのと、パソコンケースが大型なことがデメリットですがそれ以外はよくできています。このパソコンはグラボがローエンドなGeForce GT 1030を選ぶ選択肢も存在しますが、ここではRTX4090とCore i9 13900KFの組み合わせになってしまうのでこれだけ高額になっています。
マウスコンピューター G-Tune XP-Z 2210XP-Z790W11 【Core i7 13700KF, GeForceRTX4090, メモリ64GB, SSD2TB,HDD選択必須, 54.0ℓ】
商品名 | マウスコンピューター G-Tune XP-Z 2210XP-Z790W11 (第13世代Intel) |
---|---|
CPU | Intel Core i7 13700KF |
GPU | NVIDIA GeForce RTX 4090 |
メモリ | 64GB |
SSD | 2TB |
HDD | 4TB(HDD選択必須) |
OS | Windows 11 Home or Windows 11 Pro |
サイズ | 54.0ℓ / 19.7kg |
価格 | \ 683,100(税込) |
見ての通り非常に高額です。価格の高さは殆がRTX4090のグラボによるものです。メモリ64GBやSSD2TBも必要なくもっと少なくてもいいから価格を安くと考えるユーザは多いでしょう。しかしこれがこのモデルの最小構成です。メモリが64GBやSSD2TBのように容量が大きい分には価格以外のデメリットは無いのでいいにしても、せめてHDDは非搭載カスタマイズできるようにして欲しいものです。
NVIDIA GeForce RTX 4090の総合平均ベンチマークスコア
GeForce RTX 4090を各種ベンチマークで評価したスコアから平均値を求め、一つの結果に集約した「総合平均」スコアで他のGPUと比較した結果を示します。一つのベンチマークだけでは特定のGPUを贔屓することが可能なので、多くのベンチマークの平均を取ることで公平さを担保します。平均値を計算する前に、各種ベンチマークの結果を正規化(ノーマライズ)します。なぜならベンチマークによってスコアの絶対値がまちまちだからです。これは日経平均株価において株価の絶対値が大きい「値がさ株」の重み付けが大きくなってしまい、値がさ株一つの動向によって平均が大きく動いてしまう問題と似ています。そうならないように、各ベンチマークごとのスコアを正規化し揃えた上で平均値と取ることで各ベンチマークのスコアの重み付けを均一にし公平化しています。その結果は以下の通りです。
GPU(グラボ)名 | 総合平均GPU(グラボ)ベンチマーク性能評価スコア値 |
---|---|
GeForce RTX 4090 | +0.0% |
GeForce RTX 4080 Super | -23.9% |
GeForce RTX 4080 | -23.9% |
GeForce RTX 4070 Ti Super | -23.9% |
GeForce RTX 4070 Ti | -46.9% |
GeForce RTX 3090 Ti | -52.7% |
Radeon RX 6950 XT | -62.0% |
GeForce RTX 3090 | -68.0% |
Radeon RX 6900 XT | -69.0% |
GeForce RTX 3080 Ti | -69.4% |
GeForce RTX 3080 12G | -76.7% |
GeForce RTX 4070 Super | -80.0% |
GeForce RTX 4070 | -80.0% |
Radeon RX 6800 XT | -86.5% |
GeForce RTX 3080 10G | -89.8% |
NVIDIA TITAN RTX | -114.8% |
GeForce RTX 3070 Ti | -117.4% |
Radeon RX 6800 | -119.4% |
GeForce RTX 2080 Ti | -126.2% |
GeForce RTX 4060 Ti 16GB | -128.7% |
GeForce RTX 4060 Ti 8GB | -128.7% |
GeForce RTX 3070 | -136.9% |
NVIDIA TITAN V | -142.1% |
Radeon RX 6750 XT | -146.5% |
Radeon RX 6700 XT | -157.9% |
GeForce RTX 3060 Ti | -170.6% |
GeForce RTX 2080 Super | -172.2% |
NVIDIA TITAN Xp | -173.4% |
Radeon RX 6700 | -182.4% |
GeForce RTX 4060 | -182.7% |
GeForce RTX 2080 | -188.6% |
GeForce GTX 1080 Ti | -191.7% |
Radeon VII | -195.3% |
Radeon RX 5700 XT | -195.8% |
Radeon RX 6650 XT | -198.2% |
NVIDIA TITAN X | -198.4% |
GeForce RTX 2070 Super | -203.7% |
Radeon RX 6600 XT | -206.4% |
Radeon RX 5700 | -234.8% |
GeForce RTX 2070 | -238.8% |
GeForce RTX 3060 12G | -243.5% |
GeForce RTX 3060 8G | -243.5% |
GeForce RTX 2060 Super | -245.6% |
Radeon RX 5600 XT | -257.5% |
GeForce GTX 1080 | -262.7% |
Radeon RX 6600 | -264.9% |
GeForce GTX 1070 Ti | -294.2% |
GeForce RTX 2060 | -298.7% |
NVIDIA GTX TITAN X | -300.4% |
GeForce GTX 1070 | -341.5% |
Radeon RX 5600 | -344.1% |
GeForce GTX 1660 Ti | -358.3% |
GeForce GTX 1660 Super | -366.2% |
GeForce RTX 3050 8G | -372.4% |
GeForce RTX 3050 6G | -372.4% |
GeForce GTX 1660 | -375.4% |
Radeon RX 590 | -412.3% |
GeForce GTX 1650 Super | -439.5% |
Radeon RX 5500 XT | -447.2% |
Radeon RX 580 | -460.0% |
Radeon RX 5500 | -476.4% |
GeForce GTX 1060 | -512.9% |
Radeon RX 570 | -531.1% |
Radeon RX 6500 XT | -542.7% |
GeForce GTX 1650 | -614.5% |
Radeon RX 5300 | -626.2% |
Radeon RX 6400 | -698.6% |
GeForce GTX 1050 Ti | -861.6% |
GeForce GTX 1630 | -1,051.5% |
GeForce GTX 1050 | -1,062.0% |
Radeon RX 560 | -1,205.6% |
Radeon RX 550 | -1,797.7% |
GeForce GT 1030 | -2,004.3% |
Radeon 540 | -2,693.1% |
GeForce GT 1010 | -4,204.0% |
Radeon 530 | -4,805.1% |
Radeon 520 | -5,314.7% |
GeForce GT 710 | -9,396.7% |
各種ベンチマークの平均値をとってもGeForce RTX 4090の強さは圧倒的です。Radeon RX 6950XTから見ると+50%も高い性能を有しており、GeForce RTX 3090Tiから見ると+45%、GeForce RTX 3090から見ると+60%もの性能水準です。軒並み前世代から+50%程度性能向上してると見ていいでしょう。平均を取る対象の各種ベンチマークの結果は本ページの後半に掲載していますが、3DMark Night RaidのようにGeForce RTX 4090の結果が芳しくないベンチマークはあれど、全体の平均を取ればこのようにGeForce RTX 4090が圧勝します。
NVIDIA GeForce RTX 4090の各種ベンチマーク比較
GeForce RTX 4090を各種ベンチマークごとに、どのあたりの位置づけにあるか比較していきます。グラフ先のパーセンテージは「低い方のGPUから見たGeForce RTX 4090とのスコア差」を意味します。たとえばあるGPUで-120%と書いてある場合は、そのGPUから見てGeForce RTX 4090の性能が+120%上という意味です。
3DMark Port Royal (DirectX 12):GeForce RTX 4090は他を引き離し圧勝
3DMark Port Royalは2018年にリリースされたベンチマークで、3DMarkの中でも最新モデルで高いスコアが出やすくなっています。RayTracing CoreやTensor Coreの性能を考慮するベンチマークだからです。前世代のGeForce RTX 3000Ampereを過去のものにするほど大幅な性能向上を遂げました。
GPU(グラボ)名 | 3DMark Port Royal(Graphics)のベンチマーク性能評価スコア値 |
---|---|
GeForce RTX 4090 | +0.0% |
GeForce RTX 4080 Super | -45.8% |
GeForce RTX 4080 | -45.8% |
GeForce RTX 4070 Ti Super | -45.8% |
GeForce RTX 3090 Ti | -75.7% |
GeForce RTX 4070 Ti | -86.7% |
GeForce RTX 3090 | -91.1% |
GeForce RTX 3080 Ti | -97.1% |
GeForce RTX 3080 12G | -114.2% |
GeForce RTX 3080 10G | -125.2% |
GeForce RTX 4070 Super | -134.6% |
GeForce RTX 4070 | -134.6% |
Radeon RX 6950 XT | -141.0% |
Radeon RX 6900 XT | -150.9% |
NVIDIA TITAN RTX | -164.2% |
Radeon RX 6800 XT | -173.5% |
GeForce RTX 2080 Ti | -186.2% |
GeForce RTX 3070 Ti | -194.5% |
NVIDIA GTX TITAN X | -213.3% |
GeForce RTX 3070 | -214.0% |
GeForce RTX 4060 Ti 16GB | -223.6% |
GeForce RTX 4060 Ti 8GB | -223.6% |
Radeon RX 6800 | -233.7% |
GeForce RTX 2080 Super | -272.2% |
GeForce RTX 3060 Ti | -273.7% |
GeForce RTX 2080 | -304.8% |
Radeon RX 6750 XT | -316.6% |
GeForce RTX 2070 Super | -331.9% |
GeForce RTX 4060 | -332.8% |
Radeon RX 6700 XT | -336.4% |
GeForce RTX 2070 | -402.7% |
GeForce RTX 3060 12G | -407.4% |
GeForce RTX 3060 8G | -407.4% |
GeForce RTX 2060 Super | -413.9% |
Radeon RX 6700 | -414.7% |
Radeon RX 6650 XT | -460.9% |
Radeon RX 6600 XT | -477.8% |
GeForce RTX 2060 | -528.2% |
NVIDIA TITAN V | -582.5% |
Radeon RX 6600 | -594.3% |
GeForce RTX 3050 8G | -638.4% |
GeForce RTX 3050 6G | -638.4% |
NVIDIA TITAN Xp | -987.7% |
NVIDIA TITAN X | -1,053.1% |
GeForce GTX 1080 Ti | -1,082.4% |
GeForce GTX 1660 Ti | -1,473.4% |
GeForce GTX 1080 | -1,495.6% |
GeForce GTX 1660 Super | -1,568.1% |
GeForce GTX 1070 Ti | -1,651.0% |
GeForce GTX 1070 | -1,995.8% |
GeForce GTX 1060 | -3,106.9% |
Radeon RX 6500 XT | -6,671.9% |
Radeon RX 6400 | -7,824.6% |
GeForce RTX 4090よりも2年前に発売されたGeForce RTX 3090が-90%程度となっていますが、これは逆に見ると「GeForce RTX 3090から見たGeForce RTX 4090のスコアが+90%向上」を意味します。ほぼ2倍の性能向上です。
3DMark Night Raid (DirectX 12):GeForce RTX 4090はRadeon RX 6950XTに負ける
3DMark Night Raidは2018年にリリースされたベンチマークで、3DMark Time Spyの軽量版です。軽量版というのは描画において実行されるスレッド数が少ないことを意味します。処理が軽いため、NVIDIA GeForceのCUDA Core数の多さが活かされないベンチマークの一つです。
GPU(グラボ)名 | 3DMark Night Raid(Graphics)のベンチマーク性能評価スコア値 |
---|---|
GeForce RTX 4090 | +0.0% |
GeForce RTX 4080 Super | -10.3% |
GeForce RTX 4080 | -10.3% |
GeForce RTX 4070 Ti Super | -10.3% |
Radeon RX 6950 XT | -14.6% |
GeForce RTX 4070 Ti | -17.3% |
Radeon RX 6900 XT | -21.2% |
Radeon RX 6800 XT | -23.9% |
GeForce RTX 3090 Ti | -25.2% |
GeForce RTX 4070 Super | -29.4% |
GeForce RTX 4070 | -29.4% |
GeForce RTX 3080 12G | -36.6% |
GeForce RTX 3080 Ti | -36.8% |
GeForce RTX 4060 Ti 16GB | -40.9% |
GeForce RTX 4060 Ti 8GB | -40.9% |
Radeon RX 6750 XT | -41.3% |
GeForce RTX 3090 | -42.3% |
Radeon RX 6800 | -43.0% |
GeForce RTX 3070 Ti | -48.0% |
GeForce RTX 3080 10G | -49.4% |
Radeon RX 6700 XT | -51.5% |
Radeon RX 6700 | -59.3% |
NVIDIA TITAN RTX | -60.2% |
Radeon RX 6650 XT | -61.7% |
Radeon RX 6600 XT | -62.7% |
GeForce RTX 4060 | -63.3% |
NVIDIA TITAN V | -65.0% |
GeForce RTX 3070 | -65.6% |
GeForce RTX 2080 Ti | -70.3% |
NVIDIA TITAN Xp | -71.2% |
GeForce RTX 2080 Super | -80.1% |
GeForce RTX 3060 Ti | -82.6% |
Radeon RX 5700 XT | -86.5% |
NVIDIA TITAN X | -87.4% |
GeForce RTX 2070 Super | -90.1% |
Radeon RX 6600 | -92.2% |
GeForce RTX 2080 | -94.0% |
Radeon VII | -95.0% |
GeForce RTX 3060 12G | -103.5% |
GeForce RTX 3060 8G | -103.5% |
GeForce GTX 1080 Ti | -103.9% |
GeForce RTX 2060 Super | -111.1% |
Radeon RX 5700 | -111.2% |
GeForce RTX 2070 | -111.8% |
Radeon RX 5600 XT | -120.6% |
GeForce RTX 2060 | -134.1% |
GeForce GTX 1080 | -137.1% |
GeForce GTX 1070 Ti | -148.1% |
GeForce GTX 1660 Ti | -155.7% |
GeForce GTX 1660 Super | -160.9% |
GeForce RTX 3050 8G | -165.5% |
GeForce RTX 3050 6G | -165.5% |
GeForce GTX 1070 | -168.6% |
GeForce GTX 1660 | -193.5% |
NVIDIA GTX TITAN X | -195.8% |
Radeon RX 6500 XT | -198.4% |
Radeon RX 6400 | -198.4% |
Radeon RX 590 | -210.2% |
Radeon RX 5500 XT | -217.2% |
Radeon RX 5500 | -218.3% |
GeForce GTX 1650 Super | -223.7% |
Radeon RX 580 | -238.3% |
GeForce GTX 1060 | -257.4% |
Radeon RX 570 | -282.7% |
GeForce GTX 1650 | -326.0% |
GeForce GTX 1050 Ti | -479.2% |
GeForce GTX 1630 | -557.2% |
GeForce GTX 1050 | -616.3% |
Radeon RX 560 | -652.0% |
Radeon RX 550 | -971.6% |
GeForce GT 1030 | -1,117.0% |
GeForce GT 1010 | -2,757.8% |
Radeon 530 | -3,428.0% |
Radeon 520 | -3,845.6% |
GeForce GT 710 | -6,172.9% |
実際GeForce RTX 3090Tiよりも高いスコアにはなっていますが、AMD Radeon RX 6950XTには勝てていません。一つの理由として、RTX 3090Tiと比較しRadeon RX 6950XTの方がクロックが高いためです。スレッド数が少なく単精度コア数(NVIDIA CUDA Core数)の多さの恩恵が受けられないため、RTX4090とRTX3090の性能差が殆ありません。
また、クロックが高いGeForce RTX 4090であっても3DMark Night RaidにおいてRadeon RX 6950XTに勝てていないのはRadeon RX 6950XTのL3共有キャッシュサイズが128もあることによります。Night Raidはデータセットが小さい上にスレッドが少ないベンチマークであるためキャッシュが非常に効きやすく、キャッシュサイズが大きいRadeon RX 6950XTが有利です。