【2025年】おすすめグラボのベンチマーク性能比較と選び方　Blackwell世代NVIDIA GeForce RTX 5090から、AMD Radeon RXまで横断的にゲーム用グラボをランキング評価

グラフィックボード

2025.05.06

グラフィックボードについては大半の人がゲーム用に関心があると思うのでゲーム用途を前提としたグラボ評価も行っていきますが、「ゲームをやらないけど事務処理のグラフィックを軽くしたい」というニーズが大きいため、「ゲームをやるには力不足だけどブラウザ/動画再生/Excel/Word用途なら十分」なグラボも掲載してランキング化しています。

一方でグラフィックボードというのはメインのホストプロセッサ(Intel Core i9, Xeon等)の性能のみでは足りないときに、グラボを「コプロセッサ」として使う深層学習や金融分析などの科学技術計算分野でも重要視されています。ゲーム用途に比べたら遥かに少数派でしょうが、一応そのような科学技術計算の観点からの評価はこちらに分けて掲載しています。

当ページの中盤では各種ベンチマークでの評価結果をグラフ（ヒストグラム）で載せて比較しています。

同時に、それらのベンチマーク結果を統合した「総合平均ベンチマーク」を算出し、一部のベンチマーク結果に左右されない一元化したベンチマーク結果を掲載しています。数多くのベンチマーク結果を列挙されても「結局どれを見て選べばいいのか」となるだけなので、一つのデータにベンチマーク結果の情報を集約することが重要なためです。

インデックス：

1位： NVIDIA GeForce RTX 5090
2位： NVIDIA GeForce RTX 4090
3位： NVIDIA GeForce RTX 5080
4位： NVIDIA GeForce RTX 5070 Ti
5位： NVIDIA GeForce RTX 5070
6位： NVIDIA GeForce RTX 3090 Ti
7位： AMD Radeon RX 6950 XT
8位： NVIDIA GeForce RTX 3090
9位： NVIDIA GeForce RTX 3080 Ti
10位： NVIDIA GeForce RTX 3080 12GB版
11位： NVIDIA GeForce RTX 3080
12位： NVIDIA GeForce RTX 3070 Ti
13位： NVIDIA GeForce RTX 3070
14位： AMD Radeon RX 6900 XT
15位： NVIDIA GeForce RTX 3060 Ti
16位： NVIDIA TITAN RTX
17位： NVIDIA GeForce RTX 2080 Ti
18位： AMD Radeon RX 6800 XT
19位： NVIDIA GeForce RTX 3060
20位： AMD Radeon RX 6800
21位： NVIDIA GeForce RTX 2080 Super
22位： NVIDIA GeForce RTX 2080
23位： NVIDIA GeForce GTX 1080 Ti
24位： NVIDIA GeForce RTX 2070 Super
25位： NVIDIA GeForce Titan X
26位： NVIDIA GeForce RTX 2070
27位： AMD Radeon VII
28位： NVIDIA GeForce GTX 1080
29位： NVIDIA GeForce RTX 2060 Super
30位： NVIDIA GeForce RTX 2060
31位： AMD Radeon RX 5700 XT
32位： NVIDIA GeForce GTX 1070 Ti
33位： AMD Radeon RX 5700
34位： NVIDIA GeForce GTX 1070
35位： NVIDIA GeForce GTX 1660 Ti
36位： NVIDIA GeForce GTX 1660 Super
37位： NVIDIA GeForce GTX 1660
38位： AMD Radeon RX 5600 XT
39位： NVIDIA GeForce GTX 1650 Super
40位： AMD Radeon RX 590
41位： NVIDIA GeForce GTX 1060
42位： AMD Radeon RX 5500 XT
43位： AMD Radeon RX 580
44位： NVIDIA GeForce GTX 1650
45位： AMD Radeon RX 570
46位： NVIDIA GeForce GTX 1050 Ti
47位： NVIDIA GeForce GTX 1050
48位： AMD Radeon RX 560
49位： AMD Radeon RX 550
50位： NVIDIA GeForce GT 1030
51位： Intel UHD Graphics 630
52位： NVIDIA GeForce GT 710
【総合平均スコア】複数のベンチマーク評価結果の平均値を計算し比較
【ベンチマーク1】3DMark Speed Way (DirectX 12 Feature Level 12_2 + RayTracing 1.1 、 2560×1440)
【ベンチマーク2】3DMark Port Royal (DirectX 12 Feature Level 12_1 + RayTracing 1.0 、 2560×1440)
【ベンチマーク3】3DMark Solar Bay (Vulkan1.1 + RayTracing @ Windows, Android 、 Metal@iOS 、 2560×1440)
【ベンチマーク4】3DMark Steel Nomad (DirectX 12 Feature Level 12_0 、 3840×2160＝4K)
【ベンチマーク5】3DMark Time Spy (DirectX 12 Feature Level 11_0 、 2560×1440)
【ベンチマーク6】3DMark Night Raid (DirectX 12 Feature Level 11_0 、 1920×1080)
【ベンチマーク7】3DMark Wild Life (Vulkan1.1@Windows,Android、Metal@iOS 、 2560×1440)
【ベンチマーク8】3DMark Fire Strike (DirectX 11 Feature Level 11 、 1920×1080)
【ベンチマーク9】PassMark (Videocard Benchmarks：G3D)
【ベンチマーク10】PassMark (Videocard Benchmarks：G2D)
【ベンチマーク11】Userbenchmark GPU(DX10)
【ベンチマーク12】Userbenchmark GPU(DX9)
GPUの単精度コア数とクロック数による特性
グラフィックボードとGPUの違い　AIB、オリジナルモデル、オリジナルファンモデルの用語解説
グラフィックボードの選び方

1位： NVIDIA GeForce RTX 5090

メーカー・モデル名	NVIDIA GeForce RTX 5090
CUDA Core数	21,760
ブーストクロック	2,407 MHz
メモリ容量	32GB
共有キャッシュ	96MB
単精度性能	104.75264 TFLOPS
倍精度性能	1.637 TFLOPS
Tensor Core性能	838.02112 TFLOPS
TDP	575W
発売日	2025年1月

Ray Tracing性能	318 TFLOPS
ベースクロック	2,010 MHz
ピクセル・レート	423.6 GPixel毎秒
テクスチャ・レート	1637 GTexel毎秒
メモリタイプ	GDDR7
メモリクロック	28.0 GT毎秒
メモリバス幅	512bit
メモリ帯域幅	1,792 GB毎秒
接続規格	PCIe 5.0 x16
アーキテクチャ	Blackwell (GeForce 5000 series)
コードネーム	GB202-300
ファウンドリ	TSMC
プロセスルール	4nm (4N)
トランジスタ密度	122.9 MTr/mm²
トランジスタ数	922億
ダイサイズ	750 mm²
SM数	170
無効化SM数	6

TMU数	680
ROPユニット数	176
Tensor Core数	680
RayTracing Core数	170
NVLink	非対応
3DMark Speed Way(DX12)	14,579
3DMark Port Royal(DX12)	37,329
3DMark Solar Bay	212,210
3DMkark SteelNomad	14,309
3DMark Time Spy(DX12)	47,374
3DMark Night Raid(DX12)	210,189
3DMark Wild Life(DX12)	174,419
3DMark Fire Strike(DX11)	91,680
PassMark GPU G3D	40,097
Passmark GPU G2D	1,426
Userbenchmark DX10	777
Userbenchmark DX9	726

2025年1月に発売されたBlackwell世代GPUのフラッグシップモデル。2024年中にリリースされる予定だったのがTSMCとの歩留まり悪化トラブルで延期され2025年にずれ込みました。

GeForce RTX 5090の各種ベンチマーク評価結果は以下の通りです。

GPUベンチマーク名	NVIDIA GeForce RTX 5090のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	14,579
3DMark Port Royal (DX12+RT)	37,329
3DMark Solar Bay (Vulkan+RT)	212,210
3DMark Steel Nomad (DX12@4K)	14,309
3DMark Time Spy (DX12)	47,374
3DMark Night Raid (DX12@FHD)	210,189
3DMark Wild Life (Vulkan)	174,419
3DMark Fire Strike (DX11@FHD)	91,680
PassMark Videocard G3D	40,097
PassMark Videocard G2D	1,426
Userbenchmark (DX10)	777
Userbenchmark (DX9)	726
GPUベンチマーク総合平均スコア	98,578

このBlackwell世代のGPUを買うべきかどうか結論から言うと、既にGeForce RTX 4000シリーズを持ってる人ならわざわざ買う必要はありません。GeForce RTX 3000番台以下世代からの買い替えだとしても、新品で価格の安いGeForce4000シリーズの在庫があるならそちらを買うのがおすすめです。ただしGeForce RTX 4000シリーズは品薄のため新品中古ともに価格が高騰しており、RTX 5000シリーズを買った方がむしろ低コストになる場合が多いです。

特にGPU購入が急ぎでない人ならGeForce5000シリーズ購入を見送るか、GeForce RTX 5050のようなローエンドモデルが発売されるまで待つのがいいと思います。

スペック表を見ると分かる通り、FP16(16bit単精度浮動小数点数)演算性能は100TFLOPSの大台に乗りました。8年前の2017年3月に発売されたPascal世代のGeForce GTX 1080Tiが約10TFLOPSだったので、8年でFP16ベクトル演算性能は10倍になったことになります。ただし、その後4×4行列の積和演算に特化したTensorCoreが導入されたため、行列演算性能に関しては10倍どころではなく更に性能向上しています。

GeForce RTX 5090 vs. GeForce RTX 4090ベンチマーク性能評価結果

GeForce RTX 5090と前世代のGeForce RTX 4090のベンチマーク結果を比較します。他のGPUと一覧して比較したい場合は当ページの後半に各種ベンチマーク結果を掲載してあります。

GPUベンチマーク名	NVIDIA GeForce RTX 5090 vs. NVIDIA GeForce RTX 4090のベンチマーク性能比較
3DMark Speed Way (DX12+RT)	NVIDIA GeForce RTX 5090：14,579+44.7%
3DMark Speed Way (DX12+RT)	NVIDIA GeForce RTX 4090：10,076
3DMark Port Royal (DX12+RT)	NVIDIA GeForce RTX 5090：37,329+43.2%
3DMark Port Royal (DX12+RT)	NVIDIA GeForce RTX 4090：26,072
3DMark Solar Bay (Vulkan+RT)	NVIDIA GeForce RTX 5090：212,210+13.5%
3DMark Solar Bay (Vulkan+RT)	NVIDIA GeForce RTX 4090：186,968
3DMark Steel Nomad (DX12@4K)	NVIDIA GeForce RTX 5090：14,309+55.2%
3DMark Steel Nomad (DX12@4K)	NVIDIA GeForce RTX 4090：9,222
3DMark Time Spy (DX12)	NVIDIA GeForce RTX 5090：47,374+30.8%
3DMark Time Spy (DX12)	NVIDIA GeForce RTX 4090：36,225
3DMark Night Raid (DX12@FHD)	NVIDIA GeForce RTX 5090：210,189+7.6%
3DMark Night Raid (DX12@FHD)	NVIDIA GeForce RTX 4090：195,290
3DMark Wild Life (Vulkan)	NVIDIA GeForce RTX 5090：174,419+6.3%
3DMark Wild Life (Vulkan)	NVIDIA GeForce RTX 4090：164,134
3DMark Fire Strike (DX11@FHD)	NVIDIA GeForce RTX 5090：91,680+26.9%
3DMark Fire Strike (DX11@FHD)	NVIDIA GeForce RTX 4090：72,242
PassMark Videocard G3D	NVIDIA GeForce RTX 5090：40,097+4.7%
PassMark Videocard G3D	NVIDIA GeForce RTX 4090：38,309
PassMark Videocard G2D	NVIDIA GeForce RTX 5090：1,426+10.2%
PassMark Videocard G2D	NVIDIA GeForce RTX 4090：1,294
Userbenchmark (DX10)	NVIDIA GeForce RTX 5090：777+68.5%
Userbenchmark (DX10)	NVIDIA GeForce RTX 4090：461
Userbenchmark (DX9)	NVIDIA GeForce RTX 5090：726+16.2%
Userbenchmark (DX9)	NVIDIA GeForce RTX 4090：625

現時点ではGeForce RTX 5090が最高峰なので、GeForce RTX 5090側は他のグラボと比較し相対的にトップであるため全ベンチマークにおいてヒストグラムが振り切れた結果になっています。3DMark Night Raidのような軽いベンチマークほど大して性能向上しておらず、4K解像度で実行され処理が重い3DMark Steel Nomadほど大きく性能向上しています。またリアルタイムレイトレーシング用のRayTracingCoreを評価に入れるベンチマークもGeForce RTX 4090よりGeForce RTX 5090が大幅に良い成績です。

実は殆ど進化していないBlackwell世代　フルモデルチェンジではなくマイナーチェンジ

今までのPascal→Turing→Ampere→Ada→Blackwellのマイクロアーキテクチャ世代進化から見ると、今回のAda→Blackwellの改良点は非常に乏しいものです。

製造プロセス（プロセスノード）面でも前世代のAdaと同じTSMC4nmを採用しており、トランジスタ密度は後退してるまであります。

マイクロアーキテクチャ面ではFP4（1/4精度浮動小数点数）演算性能が高速化されたのみで、FP6は今までと同様FP8と同じ性能しか出ませんし、チップ面積の拡大によるトランジスタ数の増加に応じてCUDA Core数を愚直に増やしただけのものです。

この大したことが無いBlackwellが過剰に期待or事前評価されてしまったのは2023年5月のNVIDIA決算で「AI企業の本丸はNVIDIA」だと、computer scienceに詳しくない一般層から認識されてしまったからです。”GeForce”どころか”NVIDIA”の名前すら知らなかった一般層から「次のBlackwellはすごいらしい」と”Blackwell”の文字が独り歩きするようになりました。今までのマイクロアーキテクチャの進歩やプロセスノードの改善を見てきた人達からすれば、今回のAda→Blackwell世代への交代はかなりしょぼい部類だとわかるはずです。

ゲーム向けのレガシーでFP16に引きずられるNVIDIAの限界

私は「今流行りの機械学習ブーム（いわゆるAIブーム）は過大評価されており最終的には極めて限定的な用途に収束する」と見ているのでNVIDIAがAIに全振りする必要は無いと思っていますが、「NVIDIA＝AIのガリバー」といった世間からの誤った認識に揺さぶられ中途半端な立ち位置にいるのがNVIDIAです。殆どの生成AI用途ではFP6精度あれば十分なのでBroadcomはFP6に特化したASICを手掛け始めていますが、NVIDIAは実はまだそこまで足を踏み入れてきれていません。

なぜならNVIDIAはゲーム向けのようなグラフィクスからスタートしていて、現在でもグラフィクス用途は捨てられない分野だからです。ゲーム用途ではFP16精度が重要であり、その半精度のFP8は高速化できています。そして今回BlackwellでFP4演算の高速化を導入しましたがFP6には手が入らず、ゲーム向けのFP16性能を「捨てきれてない」ところにNVIDIAの「創業からグラフィクス主軸でやってきた」未練さと中途半端さがあります。AI向けに特化しきれずゲーム向けにも特化できずにいる中途半端さです。

単にゲーム向けとしてGeForceを探しているPCユーザなら「AI向けのFP4性能とか4×4行列演算のTensorCoreとかどうでもいいからゲーム用途で必要なFP16ベクトル演算で性能が出て手頃なコストのGPUを出して欲しい」と思ってるでしょう。しかしNVIDIAはAI向けに片足を乗せたことで余計な拡張がされ高コスト化しました。この「ゲーマーからしても余計」「AI用途ユーザからしても中途半端」な状態に陥ってるのがBlackwell世代です。

RTX 5090ではRTX4090と比較しメモリ帯域幅が大幅に増加しましたが、これもAI用途の推論データを大量に置けるのが念頭にあります。生成AIは必要なメモリ絶対量が多く、同時にメモリアクセス量もゲーム用途より多大であるためですが、ここまでのメモリ拡張はゲーム用途には過大であり不要です。

2位： NVIDIA GeForce RTX 4090

メーカー・モデル名	NVIDIA GeForce RTX 4090
CUDA Core数	16,384
ブーストクロック	2,520 MHz
メモリ容量	24GB
共有キャッシュ	72MB
単精度性能	82.57536 TFLOPS
倍精度性能	1.291 TFLOPS
Tensor Core性能	660.60288 TFLOPS
TDP	450W
発売日	2022年10月

Ray Tracing性能	191 TFLOPS
ベースクロック	2,235 MHz
ピクセル・レート	443.5 GPixel毎秒
テクスチャ・レート	1290.2 GTexel毎秒
メモリタイプ	GDDR6X
メモリクロック	21.0 GT毎秒
メモリバス幅	384bit
メモリ帯域幅	1008 GB毎秒
接続規格	PCIe 4.0 x16
アーキテクチャ	Ada Lovelace (GeForce 4000 series)
コードネーム	AD102-300
ファウンドリ	TSMC
プロセスルール	4nm (4N)
トランジスタ密度	125.3 MTr/mm²
トランジスタ数	763億
ダイサイズ	608.5mm²
SM数	128
無効化SM数	16

TMU数	512
ROPユニット数	176
Tensor Core数	512
RayTracing Core数	128
NVLink	非対応
3DMark Speed Way(DX12)	10,076
3DMark Port Royal(DX12)	26,072
3DMark Solar Bay	186,968
3DMkark SteelNomad	9,222
3DMark Time Spy(DX12)	36,225
3DMark Night Raid(DX12)	195,290
3DMark Wild Life(DX12)	164,134
3DMark Fire Strike(DX11)	72,242
PassMark GPU G3D	38,309
Passmark GPU G2D	1,294
Userbenchmark DX10	461
Userbenchmark DX9	625

GeForce RTX 4090は2022年10月に発売されたGPUで、Ada Lovelaceアーキテクチャを採用した世代の最初の製品です。カタログスペックも規格外ですが実際の性能も規格外です。

前世代で最高峰だったGeForce RTX 3090Tiと比較しトランジスタ数が約2倍になってる一方でチップ面積は縮小。TSMC 4nmプロセスのメリットを最大限に活用しています。

各種ベンチマークの結果もずば抜けていて、ベンチマークによっては2倍弱(+100%弱)に近い性能向上になっています。

ここまで来るともはやAMD Radeon RXには勝ち目がないレベルです。残るRadeon RXの勝ち筋は、L3共有キャッシュを更に増加させること、そして単精度コア数の増加ではなくクロックの上昇に力を入れて「Full HD(1080p)でのゲーム性能ならNVIDIAに負けない」または「価格あたりのフレームレート性能ならNVIDIAに負けない」といった立ち位置を狙うことぐらいでしょう。

GeForce RTX 4090の欠点は価格の高さと、消費電力の高さによる外形サイズの大型化です。

またこれだけのスペックになるとゲーム向けというより機械学習(≒深層学習:deep learning)向けの色が強くなりました。一例として今回のTensor Coreから8bit精度浮動小数点数演算に対応しました。機械学習向けの行列演算では仮数部＋指数部合計で32bit精度(単精度)レベルの仮数部精度は必要なく16bit精度(半精度)で十分であることが指摘されてきましたが、何なら8bit精度でも十分な推論結果が得られるということでAda Lovelace世代から8bit精度浮動小数点数演算に対応したTensor Coreとなりました。コア数の増大はそういった機械学習(AI)ニーズに応えたものであり、4K解像度でゲームをする必要性が低いユーザにとっては価格に見合ったリターンが乏しいと考えられます。

NVIDIA GeForce RTX 4090チップを搭載した各メーカーのグラボはこちらで比較しています。

GeForce RTX 4090の各種ベンチマーク性能評価結果

GeForce RTX 4090単独のベンチマーク結果を掲載しておきます。他のGPUと一覧して比較したい場合は当ページの後半に各種ベンチマーク結果を掲載してあります。

GPUベンチマーク名	NVIDIA GeForce RTX 4090のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	10,076
3DMark Port Royal (DX12+RT)	26,072
3DMark Solar Bay (Vulkan+RT)	186,968
3DMark Steel Nomad (DX12@4K)	9,222
3DMark Time Spy (DX12)	36,225
3DMark Night Raid (DX12@FHD)	195,290
3DMark Wild Life (Vulkan)	164,134
3DMark Fire Strike (DX11@FHD)	72,242
PassMark Videocard G3D	38,309
PassMark Videocard G2D	1,294
Userbenchmark (DX10)	461
Userbenchmark (DX9)	625
GPUベンチマーク総合平均スコア	79,303

3DMark Speed Wayは一つ上の世代のRTX5090のRayTracingCoreが優秀であるために相対的にRTX4090のスコアが低くなっていますが、RayTracing評価をしない他のベンチマークでは概ね高いスコアになっています。Radeon RX 6950XTに対しては全てのベンチマーク項目で完勝しています。

3位： NVIDIA GeForce RTX 5080

メーカー・モデル名	NVIDIA GeForce RTX 5080
CUDA Core数	10,752
ブーストクロック	2,617 MHz
メモリ容量	16GB
共有キャッシュ	64MB
単精度性能	56.275968 TFLOPS
倍精度性能	0.879 TFLOPS
Tensor Core性能	450.207744 TFLOPS
TDP	360 W
発売日	2025年1月

Ray Tracing性能	171 TFLOPS
ベースクロック	2,300 MHz
ピクセル・レート	293.1 GPixel毎秒
テクスチャ・レート	879.3 GTexel毎秒
メモリタイプ	GDDR7
メモリクロック	30.0 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	960 GB毎秒
接続規格	PCIe 5.0 x16
アーキテクチャ	Blackwell (GeForce 5000 series)
コードネーム	GB203-400
ファウンドリ	TSMC
プロセスルール	4nm (4N)
トランジスタ密度	120.6 MTr/mm²
トランジスタ数	456億
ダイサイズ	378 mm²
SM数	84
無効化SM数	0

TMU数	336
ROPユニット数	112
Tensor Core数	336
RayTracing Core数	84
NVLink	非対応
3DMark Speed Way(DX12)	9,315
3DMark Port Royal(DX12)	23,167
3DMark Solar Bay	153,268
3DMkark SteelNomad	8,559
3DMark Time Spy(DX12)	33,105
3DMark Night Raid(DX12)	196,761
3DMark Wild Life(DX12)	148,785
3DMark Fire Strike(DX11)	74,944
PassMark GPU G3D	36,169
Passmark GPU G2D	1,399
Userbenchmark DX10	576
Userbenchmark DX9	469

ゲーム用途ならGeForce RTX 5090よりもこのGeForce RTX 5080の方がおすすめです。Blackwell世代ではGeForce RTX 5080のブーストクロックは飛び抜けて優秀であり、フルHD用途だったらGeForce RTX 5090よりもこのGeForce RTX 5080の方がいいです。総合スコアではGeForce RTX 4090よりも劣るためGeForce RTX 4090より下位に掲載しましたが、GeForce RTX 4090よりも流通量や価格面でGeForce RTX 5080が優れているのでGeForce RTX 4090を買うぐらいならGeForce RTX 5080がおすすめです。

GeForce RTX 5080の各種ベンチマーク性能評価結果

GeForce RTX 5080単独のベンチマーク結果を掲載しておきます。注目点は3DMark Steel Nomadのスコアです。

GPUベンチマーク名	NVIDIA GeForce RTX 5080のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	9,315
3DMark Port Royal (DX12+RT)	23,167
3DMark Solar Bay (Vulkan+RT)	153,268
3DMark Steel Nomad (DX12@4K)	8,559
3DMark Time Spy (DX12)	33,105
3DMark Night Raid (DX12@FHD)	196,761
3DMark Wild Life (Vulkan)	148,785
3DMark Fire Strike (DX11@FHD)	74,944
PassMark Videocard G3D	36,169
PassMark Videocard G2D	1,399
Userbenchmark (DX10)	576
Userbenchmark (DX9)	469
GPUベンチマーク総合平均スコア	75,239

GeForce RTX 5080で特段スコアが低いのは3DMark Steel Nomadです。これはベンチマーク実行時に解像度4Kで評価されるため、CUDA Core数がGeForce RTX 5090の半分以下しかないことにより高解像度で不利なことによります。GeForce RTX 5080のCUDA Core数はGeForce RTX 4090よりも少ないため、3DMark Steel NomadのスコアはGeForce RTX 4090にも負ける結果になっています。

4位： NVIDIA GeForce RTX 5070 Ti

メーカー・モデル名	NVIDIA GeForce RTX 5070 Ti
CUDA Core数	8,960
ブーストクロック	2,452 MHz
メモリ容量	16GB
共有キャッシュ	64MB
単精度性能	43.93984 TFLOPS
倍精度性能	0.693 TFLOPS
Tensor Core性能	351.51872 TFLOPS
TDP	300 W
発売日	2025年2月

Ray Tracing性能	133 TFLOPS
ベースクロック	2,300 MHz
ピクセル・レート	235.4 GPixel毎秒
テクスチャ・レート	693.0 GTexel毎秒
メモリタイプ	GDDR7
メモリクロック	28.0 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	896 GB毎秒
接続規格	PCIe 5.0 x16
アーキテクチャ	Blackwell (GeForce 5000 series)
コードネーム	GB203-300
ファウンドリ	TSMC
プロセスルール	4nm (4N)
トランジスタ密度	120.6 MTr/mm²
トランジスタ数	456億
ダイサイズ	378 mm²
SM数	70
無効化SM数	2

TMU数	280
ROPユニット数	96
Tensor Core数	280
RayTracing Core数	70
NVLink	非対応
3DMark Speed Way(DX12)	7,716
3DMark Port Royal(DX12)	19,204
3DMark Solar Bay	130,939
3DMkark SteelNomad	6,517
3DMark Time Spy(DX12)	27,637
3DMark Night Raid(DX12)	183,031
3DMark Wild Life(DX12)	139,732
3DMark Fire Strike(DX11)	65,990
PassMark GPU G3D	32,608
Passmark GPU G2D	1,345
Userbenchmark DX10	459
Userbenchmark DX9	398

このGeForce RTX 5070 Tiは、2025年1月~5月のBlackwell世代リリース当初に発売された6モデルの中では最もおすすめできないGPUです。GeForce RTX 5070 TiはGeForce RTX 4080 Superを少し上回る程度の性能であり、GeForce RTX 5080と比較すると大幅に性能が低いです。

ブーストクロックもBlackwell世代当初6モデルの中では最も低く、ゲーム用途としては不向きなGPUです。これならGeForce RTX 5070がおすすめです。クロックが低くてもよくCUDA Core数の多さを優先する生成AI用途ならGeForce RTX 5070よりもGeForce RTX 5070 Tiがおすすめですが、ゲーム前提ならGeForce RTX 5070 TiよりもGeForce RTX 5070で十分です。

GeForce RTX 5070 Tiの各種ベンチマーク性能評価結果

GeForce RTX 5070Ti単独のベンチマーク結果は以下の通りです。

GPUベンチマーク名	NVIDIA GeForce RTX 5070 Tiのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	7,716
3DMark Port Royal (DX12+RT)	19,204
3DMark Solar Bay (Vulkan+RT)	130,939
3DMark Steel Nomad (DX12@4K)	6,517
3DMark Time Spy (DX12)	27,637
3DMark Night Raid (DX12@FHD)	183,031
3DMark Wild Life (Vulkan)	139,732
3DMark Fire Strike (DX11@FHD)	65,990
PassMark Videocard G3D	32,608
PassMark Videocard G2D	1,345
Userbenchmark (DX10)	459
Userbenchmark (DX9)	398
GPUベンチマーク総合平均スコア	65,640

GeForce RTX 5070 TiのベンチマークスコアはGeForce RTX 5080のスコアを単純に下方向にパラレルシフトしたような結果になっています。4K解像度でCUDA Core数の多さが重要な3DMark Steel Nomadでも当然低いスコアであり、3DMarkでは標準的な解像度の2560×1440で実行されるベンチマークでもスコアが低く、フルHDの低解像度で実行される3DMark Fire Strikeでもクロックの低さでGeForce RTX 5080を大幅に下回る結果です。

5位： NVIDIA GeForce RTX 5070

メーカー・モデル名	NVIDIA GeForce RTX 5070
CUDA Core数	6,144
ブーストクロック	2,512 MHz
メモリ容量	12GB
共有キャッシュ	48MB
単精度性能	30.867456 TFLOPS
倍精度性能	0.484 TFLOPS
Tensor Core性能	246.939648 TFLOPS
TDP	250 W
発売日	2025年3月

Ray Tracing性能	94 TFLOPS
ベースクロック	2,160 MHz
ピクセル・レート	201 GPixel毎秒
テクスチャ・レート	483.8 GTexel毎秒
メモリタイプ	GDDR7
メモリクロック	28.0 GT毎秒
メモリバス幅	192bit
メモリ帯域幅	672 GB毎秒
接続規格	PCIe 5.0 x16
アーキテクチャ	Blackwell (GeForce 5000 series)
コードネーム	GB205-300
ファウンドリ	TSMC
プロセスルール	4nm (4N)
トランジスタ密度	118.3 MTr/mm²
トランジスタ数	311億
ダイサイズ	263 mm²
SM数	48
無効化SM数	2

TMU数	192
ROPユニット数	80
Tensor Core数	192
RayTracing Core数	48
NVLink	非対応
3DMark Speed Way(DX12)	5,909
3DMark Port Royal(DX12)	14,218
3DMark Solar Bay	103,526
3DMkark SteelNomad	5,042
3DMark Time Spy(DX12)	22,660
3DMark Night Raid(DX12)	166,974
3DMark Wild Life(DX12)	128,796
3DMark Fire Strike(DX11)	57,577
PassMark GPU G3D	27,962
Passmark GPU G2D	1,284
Userbenchmark DX10	370
Userbenchmark DX9	314

このGeForce RTX 5070はTDP250W（ベースクロックで全てのコアを動作させたときの消費電力が250W）であり、Blackwell世代GeForce5000シリーズの中で中間的な基準点にあるようなGPUです。

ブーストクロックは比較的高めで低解像度のゲーム用途にも向いており、かといってTensor Coreが少ないわけでもないので機械学習用途（≒生成AI用途）でも使える水準です。

生成AI用途を完全に捨ててゲーム用（ゲーム配信動画のリアルタイムエンコード含む）で使うのならGeForce RTX 5060 TiやGeForce RTX 5060でも十分です。

GeForce RTX 5070の各種ベンチマーク性能評価結果

GeForce RTX 5070単独のベンチマーク結果は以下の通りです。

GPUベンチマーク名	NVIDIA GeForce RTX 5070のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	5,909
3DMark Port Royal (DX12+RT)	14,218
3DMark Solar Bay (Vulkan+RT)	103,526
3DMark Steel Nomad (DX12@4K)	5,042
3DMark Time Spy (DX12)	22,660
3DMark Night Raid (DX12@FHD)	166,974
3DMark Wild Life (Vulkan)	128,796
3DMark Fire Strike (DX11@FHD)	57,577
PassMark Videocard G3D	27,962
PassMark Videocard G2D	1,284
Userbenchmark (DX10)	370
Userbenchmark (DX9)	314
GPUベンチマーク総合平均スコア	55,678

GeForce RTX 5070はリアルタイムレイトレーシング評価が行われるベンチマークや、3DMark Steel Nomadのような負荷が大きいベンチマークではAmpere世代のGeForce3000シリーズに負けてる部分が多いです。

しかし3DMark Time Spy、3DMark Fire Strikeのような負荷が軽い比較的古いベンチマークではそこそこ健闘しています。

6位： NVIDIA GeForce RTX 3090 Ti

メーカー・モデル名	NVIDIA GeForce RTX 3090 Ti
CUDA Core数	10,752
ブーストクロック	1,860 MHz
メモリ容量	24GB
共有キャッシュ	6MB
単精度性能	39.99744 TFLOPS
倍精度性能	0.625 TFLOPS
Tensor Core性能	319.97952 TFLOPS
TDP	450W
発売日	2022年3月

Ray Tracing性能	79.9 TFLOPS
ベースクロック	1,560 MHz
ピクセル・レート	208.3 GPixel毎秒
テクスチャ・レート	625 GTexel毎秒
メモリタイプ	GDDR6X
メモリクロック	21.0 GT毎秒
メモリバス幅	384bit
メモリ帯域幅	1008 GB毎秒
接続規格	PCIe 4.0 x16
アーキテクチャ	Ampere (GeForce 3000 series)
コードネーム	GA102-350-A1
ファウンドリ	Samsung
プロセスルール	10nm(8LPP)
トランジスタ密度	45.0 MTr/mm²
トランジスタ数	283億
ダイサイズ	628.4mm²

SM数	84
無効化SM数	0
TMU数	336
ROPユニット数	112
Tensor Core数	336
RayTracing Core数	84
NVLink	2-way対応
3DMark Speed Way(DX12)	5,903
3DMark Port Royal(DX12)	14,840
3DMark Solar Bay	109,115
3DMkark SteelNomad	5,904
3DMark Time Spy(DX12)	21,693
3DMark Night Raid(DX12)	155,509
3DMark Wild Life(DX12)	117,075
3DMark Fire Strike(DX11)	52,350
PassMark GPU G3D	29,511

GeForce RTX 3090TiはAmpere世代の後期モデルであり2022年4月に発売されました。2020年にAmpere世代が発売されてから2年が経過するタイミングでの発売です。RTX 4090が発売される前の滑り込みモデルなのであまりおすすめしません。これを買うくらいならGeForce RTX 4000シリーズを待つのが得策です。実際に同じTDP値のGeForce RTX 4090に対しRTX3090Tiは惨敗しています。

このGeForce RTX 3090TiはGeForce GTX 980Tiが出た頃と同じ位置づけだと捉えるのが適切です。GeForce GTX 980のマイナー改良版として発売されたGTX 980Tiですが、無理にCUDA Coreを増やしたため非常に高消費電力でした。しかもこれはまもなく発売されたGTX 1080にあっけなく負けてしまいます。GeForce RTX 3090Tiも同じ轍を踏むでしょう。

GeForce RTX 3090Tiの単位時間あたり発熱量はTDP450Wとなっており非常に高消費電力です。また、CUDA Core数をGeForce RTX 3090よりも増やすためにStreamingMultiprocessor84基を全て有効化しているため歩留りが悪く価格が無駄に高くなっています。

このようにStreamingMultiprocessorのいくつかを無効化しないで全てを有効化した「全力投球」は次期モデルが発売される直前に実施される風物詩です。

GPUベンチマーク名	NVIDIA GeForce RTX 3090 Tiのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	5,903
3DMark Port Royal (DX12+RT)	14,840
3DMark Solar Bay (Vulkan+RT)	109,115
3DMark Steel Nomad (DX12@4K)	5,904
3DMark Time Spy (DX12)	21,693
3DMark Night Raid (DX12@FHD)	155,509
3DMark Wild Life (Vulkan)	117,075
3DMark Fire Strike (DX11@FHD)	52,350
PassMark Videocard G3D	29,511
PassMark Videocard G2D	1,226
Userbenchmark (DX10)	297
Userbenchmark (DX9)	338
GPUベンチマーク総合平均スコア	54,345

7位： AMD Radeon RX 6950 XT

Radeon RX 6950XTはGeForce RTX 3090Tiに対抗するために投入されたGPUです。Radeon RX 6900XTではGeForce RTX 3090Tiに太刀打ちできなかったため、GeForce RTX 3090Tiを超えるためにRadeon RX 6950 XTが設定されましたが結果的にはGeForce RTX 3090Tiに負けています。

Radeon RX 6950XTの各種ベンチマーク性能評価結果

Radeon RX 6950 XTのベンチマーク実行結果は以下の通りです。

GPUベンチマーク名	AMD Radeon RX 6950 XTのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	4,075
3DMark Port Royal (DX12+RT)	10,818
3DMark Solar Bay (Vulkan+RT)	89,385
3DMark Steel Nomad (DX12@4K)	4,235
3DMark Time Spy (DX12)	21,850
3DMark Night Raid (DX12@FHD)	168,384
3DMark Wild Life (Vulkan)	107,557
3DMark Fire Strike (DX11@FHD)	60,183
PassMark Videocard G3D	28,472
PassMark Videocard G2D	1,042
Userbenchmark (DX10)	300
Userbenchmark (DX9)	323
GPUベンチマーク総合平均スコア	50,101

3DMark Night Raidのみ非常に高いスコアでありこれだけはGeForce RTX 4090を超えています。その理由はRadeon RX 6950 XTのL3共有キャッシュサイズが128MBもあり、GeForce RTX 4090のL2共有キャッシュサイズの72MBを大幅に超えているためです。3DMark Night Raidはデータセットが小さく動作するスレッド数も少ないためデータアクセスの空間的局所性が高くキャッシュの恩恵を強く受けることができます。

しかしそれ以外のベンチマークの結果は標準的です。DirectX10やFireStrike(DirectX11)のような古いベンチマークでは良い結果が出ますが、DirectX12のTimeSpyやPortRoyalのように新しいベンチマークになればなるほどスコアが悪化しています。これらのベンチマーク値をまとめた総合平均スコアではGeForce RTX 3090Tiに負ける水準です。

8位： NVIDIA GeForce RTX 3090

メーカー・モデル名	NVIDIA GeForce RTX 3090
CUDA Core数	10,496
ブーストクロック	1,695 MHz
メモリ容量	24GB
共有キャッシュ	6MB
単精度性能	35.58144 TFLOPS
倍精度性能	0.558 TFLOPS
Tensor Core性能	285.491 TFLOPS
TDP	350W
発売日	2020年9月

Ray Tracing性能	71.1 TFLOPS
ベースクロック	1,395 MHz
ピクセル・レート	189.8 GPixel毎秒
テクスチャ・レート	555.96 GTexel毎秒
メモリタイプ	GDDR6X
メモリクロック	19.5 GT毎秒
メモリバス幅	384bit
メモリ帯域幅	935.8 GB毎秒
接続規格	PCIe 4.0 x16
アーキテクチャ	Ampere (GeForce 3000 series)
コードネーム	GA102-300-A1
ファウンドリ	Samsung
プロセスルール	10nm(8LPP)
トランジスタ密度	45.0 MTr/mm²
トランジスタ数	283億
ダイサイズ	628.4mm²

SM数	82
無効化SM数	2
TMU数	328
ROPユニット数	112
Tensor Core数	328
RayTracing Core数	82
NVLink	2-way対応
3DMark Speed Way(DX12)	5,384
3DMark Port Royal(DX12)	13,640
3DMark Solar Bay	97,521
3DMkark SteelNomad	5,385
3DMark Time Spy(DX12)	19,909
3DMark Night Raid(DX12)	135,618
3DMark Wild Life(DX12)	102,249
3DMark Fire Strike(DX11)	47,343
PassMark GPU G3D	26,671

GPUベンチマーク名	NVIDIA GeForce RTX 3090のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	5,384
3DMark Port Royal (DX12+RT)	13,640
3DMark Solar Bay (Vulkan+RT)	97,521
3DMark Steel Nomad (DX12@4K)	5,385
3DMark Time Spy (DX12)	19,909
3DMark Night Raid (DX12@FHD)	135,618
3DMark Wild Life (Vulkan)	102,249
3DMark Fire Strike (DX11@FHD)	47,343
PassMark Videocard G3D	26,671
PassMark Videocard G2D	1,058
Userbenchmark (DX10)	262
Userbenchmark (DX9)	309
GPUベンチマーク総合平均スコア	48,554

GeForce RTX 3090はNVIDIAのゲーム用GPUとしてCUDA Coreが初の1万台に乗りました。ゲーム用途で重要な単精度浮動小数点演算性能は35TFLOPSです(32bit小数の乗算or加算を1秒間に35兆回実行できる速度)。

近年GeForceでは冷遇されていた倍精度性能が1TFLOPSまで復活したのもポイントです。

このGeForce RTX 3090をゲーム用途で使いこなせるかはディスプレイ表示の解像度によります。

ディスプレイ表示の解像度をWQHD(2560×1440)や4K(3940×2160)にせずにフルHDでゲームをやるのなら、GeForce RTX 3090はコストの割にさほどメリットのないGPUです(深層学習用アクセラレータとしては大いにメリットあり)。

RTX3080やRTX3070ではブーストクロックが余裕で1,900MHz台に乗るグラボが出てきていますが、RTX3090は単精度演算器数(CUDA Core数)が多いためギリギリ1,900MHzに乗るかどうかという水準です。

NVIDIA GeForce RTX 3090チップを搭載した各メーカーのグラボはこちらで比較しています。

GeForce RTX 3090搭載おすすめグラボ

高い冷却性能を有していながらも厚さが3スロット占有未満に収まっているのが魅力的なグラボです。

9位： NVIDIA GeForce RTX 3080 Ti

メーカー・モデル名	NVIDIA GeForce RTX 3080 Ti
CUDA Core数	10,240
ブーストクロック	1,665 MHz
メモリ容量	12GB
共有キャッシュ	6MB
単精度性能	34.0992 TFLOPS
倍精度性能	0.533 TFLOPS
Tensor Core性能	272.7936 TFLOPS
TDP	350W
発売日	2021年6月

Ray Tracing性能	68.2 TFLOPS
ベースクロック	1,365 MHz
ピクセル・レート	186.5 GPixel毎秒
テクスチャ・レート	532.8 GTexel毎秒
メモリタイプ	GDDR6X
メモリクロック	19 GT毎秒
メモリバス幅	384bit
メモリ帯域幅	912.0 GB毎秒
接続規格	PCIe 4.0 x16
アーキテクチャ	Ampere (GeForce 3000 series)
コードネーム	GA102-225-A1
ファウンドリ	Samsung
プロセスルール	10nm(8LPP)
トランジスタ密度	45.0 MTr/mm²
トランジスタ数	283億
ダイサイズ	628.4mm²

SM数	80
無効化SM数	4
TMU数	320
ROPユニット数	112
Tensor Core数	320
RayTracing Core数	80
NVLink	非対応
3DMark Speed Way(DX12)	5,331
3DMark Port Royal(DX12)	13,229
3DMark Solar Bay	96,544
3DMkark SteelNomad	5,331
3DMark Time Spy(DX12)	19,584
3DMark Night Raid(DX12)	141,143
3DMark Wild Life(DX12)	105,587
3DMark Fire Strike(DX11)	47,785
PassMark GPU G3D	26,976

GPUベンチマーク名	NVIDIA GeForce RTX 3080 Tiのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	5,331
3DMark Port Royal (DX12+RT)	13,229
3DMark Solar Bay (Vulkan+RT)	96,544
3DMark Steel Nomad (DX12@4K)	5,331
3DMark Time Spy (DX12)	19,584
3DMark Night Raid (DX12@FHD)	141,143
3DMark Wild Life (Vulkan)	105,587
3DMark Fire Strike (DX11@FHD)	47,785
PassMark Videocard G3D	26,976
PassMark Videocard G2D	1,088
Userbenchmark (DX10)	261
Userbenchmark (DX9)	309
GPUベンチマーク総合平均スコア	48,950

GeForce RTX 3080Tiは、GeForce RTX3090からStreaming Multiprocessorをさらに2コア無効化してCUDA Core数10,240コアまで減らしたGPUです。

しかしCUDA Core数の減少は些末な問題であり、このGeForce RTX 3080Tiが設定された本来の理由は、暗号資産マイニングのハッシュレートを引き下げる「Lite Hash Rate(LHR)」を搭載し、ゲーム用途でGeForceを購入するユーザに製品が行き届くようにするためです。要はGeForce RTX 3090が暗号資産マイニング目的のユーザに買い占められてしまっているので、その代替としてGeForce RTX 3080Tiが投入されました。

GeForce RTX 3090と酷似している点は多く、CUDA Core数はほぼ同じです。リファレンスモデルのベースクロックとブーストクロックはRTX 3090からそれぞれ30MHzずつ下がっています。

しかし、RTX3090と比較してRTX3080TiのCUDA Core数が微減してるにも関わらずクロックの上昇が無いどころかむしろ低下しており、あえて積極的に選ぶことをおすすめできないGPUです。これを選ぶくらいなら、同時に発売されたGeForce RTX 3070Tiを強くおすすめします。

NVIDIA GeForce RTX 3080 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

10位： NVIDIA GeForce RTX 3080 12GB版

メーカー・モデル名	NVIDIA GeForce RTX 3080 12GB版
CUDA Core数	8,960
ブーストクロック	1,710 MHz
メモリ容量	12GB
共有キャッシュ	6MB
単精度性能	30.6432 TFLOPS
倍精度性能	0.479 TFLOPS
Tensor Core性能	245.1456 TFLOPS
TDP	350W
発売日	2022年1月

Ray Tracing性能	61.3 FLOPS
ベースクロック	1,260 MHz
ピクセル・レート	177.8 GPixel毎秒
テクスチャ・レート	478.8 GTexel毎秒
メモリタイプ	GDDR6X
メモリクロック	19 GT毎秒
メモリバス幅	384bit
メモリ帯域幅	912.0 GB毎秒
接続規格	PCIe 4.0 x16
アーキテクチャ	Ampere (GeForce 3000 series)
コードネーム	GA102-220-A1
ファウンドリ	Samsung
プロセスルール	10nm(8LPP)
トランジスタ密度	45.0 MTr/mm²
トランジスタ数	283億
ダイサイズ	628.4mm²

SM数	70
無効化SM数	14
TMU数	280
ROPユニット数	96
Tensor Core数	280
RayTracing Core数	70
NVLink	非対応
3DMark Speed Way(DX12)	5,090
3DMark Port Royal(DX12)	12,173
3DMark Solar Bay	90,474
3DMkark SteelNomad	5,090
3DMark Time Spy(DX12)	18,555
3DMark Night Raid(DX12)	141,310
3DMark Wild Life(DX12)	101,861
3DMark Fire Strike(DX11)	46,134
PassMark GPU G3D	26,603

GPUベンチマーク名	NVIDIA GeForce RTX 3080 12GB版のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	5,090
3DMark Port Royal (DX12+RT)	12,173
3DMark Solar Bay (Vulkan+RT)	90,474
3DMark Steel Nomad (DX12@4K)	5,090
3DMark Time Spy (DX12)	18,555
3DMark Night Raid (DX12@FHD)	141,310
3DMark Wild Life (Vulkan)	101,861
3DMark Fire Strike (DX11@FHD)	46,134
PassMark Videocard G3D	26,603
PassMark Videocard G2D	1,087
Userbenchmark (DX10)	252
Userbenchmark (DX9)	280
GPUベンチマーク総合平均スコア	47,208

2022年1月に発売されたのがこのGeForce RTX 3080の12GBビデオメモリ版です。2020年9月に発売されたGeForce RTX 3080はビデオメモリ10GBでした。ただしGeForce RTX 3080の12GB版はGeForce RTX 3080から単にビデオメモリを増やしただけのGPUではなく、StreamingMultiprocessorが2基追加して有効化されているためCUDA Core数も増えていますしTensorCore性能もRayTracing性能も向上しています。GeForce RTX 3080無印を買うくらいならこの12GB版を買った方がいいのは当然ですが、RTX4000シリーズも視野に入れて検討するべきです。

11位： NVIDIA GeForce RTX 3080

メーカー・モデル名	NVIDIA GeForce RTX 3080 10GB版
CUDA Core数	8,704
ブーストクロック	1,710 MHz
メモリ容量	10GB
共有キャッシュ	5MB
単精度性能	29.768 TFLOPS
倍精度性能	0.465 TFLOPS
Tensor Core性能	238.141 TFLOPS
TDP	320W
発売日	2020年9月

Ray Tracing性能	59.5 TFLOPS
ベースクロック	1,440 MHz
ピクセル・レート	164.2 GPixel毎秒
テクスチャ・レート	465.12 GTexel毎秒
メモリタイプ	GDDR6X
メモリクロック	19 GT毎秒
メモリバス幅	320bit
メモリ帯域幅	760 GB毎秒
接続規格	PCIe 4.0 x16
アーキテクチャ	Ampere (GeForce 3000 series)
コードネーム	GA102-200-A1
ファウンドリ	Samsung
プロセスルール	10nm(8LPP)
トランジスタ密度	45.0 MTr/mm²
トランジスタ数	283億
ダイサイズ	628.4mm²

SM数	68
無効化SM数	16
TMU数	272
ROPユニット数	96
Tensor Core数	272
RayTracing Core数	68
NVLink	非対応
3DMark Speed Way(DX12)	4,633
3DMark Port Royal(DX12)	11,578
3DMark Solar Bay	85,939
3DMkark SteelNomad	4,633
3DMark Time Spy(DX12)	17,657
3DMark Night Raid(DX12)	129,188
3DMark Wild Life(DX12)	91,536
3DMark Fire Strike(DX11)	42,193
PassMark GPU G3D	25,153

GPUベンチマーク名	NVIDIA GeForce RTX 3080 10GB版のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	4,633
3DMark Port Royal (DX12+RT)	11,578
3DMark Solar Bay (Vulkan+RT)	85,939
3DMark Steel Nomad (DX12@4K)	4,633
3DMark Time Spy (DX12)	17,657
3DMark Night Raid (DX12@FHD)	129,188
3DMark Wild Life (Vulkan)	91,536
3DMark Fire Strike (DX11@FHD)	42,193
PassMark Videocard G3D	25,153
PassMark Videocard G2D	1,050
Userbenchmark (DX10)	234
Userbenchmark (DX9)	266
GPUベンチマーク総合平均スコア	44,052

GeForce RTX 3080はGeForce RTX 3090と同じGA102チップを使っていて多くの点で酷似しています。CUDA Coreを単純に減らしたのがGeForce RTX 3080です。CUDA Coreを減らしたことに付随してビデオメモリサイズやL2共有キャッシュサイズも削減されています。一方で、CUDA Coreを減らしたことによって一つ一つのコアに割り当てることのできる電力に余裕ができているため、動作クロックはGeForce RTX 3090より向上しています。

このGeForce RTX 3080のオリジナルファンモデルではブーストクロックが1,935MHzに達する製品が出てきています。この1,935MHzという動作クロックは前世代(Turing世代)のフラッグシップモデルだったGeForce RTX 2080Tiの空冷式オリジナルファンモデルの中で、大型ヒートシンクを搭載した高級モデルのブーストクロック1,815MHzを大幅に超える水準です。

一方で、GeForce RTX 2080ではNVLink対応だったのがGeForce RTX 3080では非対応になっている点は注意です。

NVIDIA GeForce RTX 3080チップを搭載した各メーカーのグラボはこちらで比較しています。

12位： NVIDIA GeForce RTX 3070 Ti

メーカー・モデル名	NVIDIA GeForce RTX 3070 Ti
CUDA Core数	6,144
ブーストクロック	1,770 MHz
メモリ容量	8GB
共有キャッシュ	4MB
単精度性能	21.74976 TFLOPS
倍精度性能	0.340 TFLOPS
Tensor Core性能	173.99808 TFLOPS
TDP	290W
発売日	2021年6月

Ray Tracing性能	43.5 TFLOPS
ベースクロック	1,575 MHz
ピクセル・レート	169.9 GPixel毎秒
テクスチャ・レート	339.8 GTexel毎秒
メモリタイプ	GDDR6X
メモリクロック	19 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	608.3 GB毎秒
接続規格	PCIe 4.0 x16
アーキテクチャ	Ampere (GeForce 3000 series)
コードネーム	GA104-400-A1
ファウンドリ	Samsung
プロセスルール	10nm(8LPP)
トランジスタ密度	44.3 MTr/mm²
トランジスタ数	174億
ダイサイズ	392.5mm²

SM数	48
無効化SM数	0
TMU数	192
ROPユニット数	96
Tensor Core数	192
RayTracing Core数	48
NVLink	非対応
3DMark Speed Way(DX12)	3,761
3DMark Port Royal(DX12)	8,854
3DMark Solar Bay	69,851
3DMkark SteelNomad	3,478
3DMark Time Spy(DX12)	14,821
3DMark Night Raid(DX12)	130,430
3DMark Wild Life(DX12)	85,408
3DMark Fire Strike(DX11)	37,129
PassMark GPU G3D	23,441

GPUベンチマーク名	NVIDIA GeForce RTX 3070 Tiのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	3,761
3DMark Port Royal (DX12+RT)	8,854
3DMark Solar Bay (Vulkan+RT)	69,851
3DMark Steel Nomad (DX12@4K)	3,478
3DMark Time Spy (DX12)	14,821
3DMark Night Raid (DX12@FHD)	130,430
3DMark Wild Life (Vulkan)	85,408
3DMark Fire Strike (DX11@FHD)	37,129
PassMark Videocard G3D	23,441
PassMark Videocard G2D	1,050
Userbenchmark (DX10)	180
Userbenchmark (DX9)	223
GPUベンチマーク総合平均スコア	39,087

GeForce RTX 3070Tiは2021年6月10日にリリースされたGPUです。2021年6月3日のGeForce RTX 3080Tiリリースとほぼ同時期です。このGPUが発売された時期は暗号資産のマイニング目的でGeForceシリーズが買い占められてしまい、本来はゲーム向けのGPUであるGeForceがゲーマーの手に行き届かないことが問題となっており、GeForce RTX 3070Tiは発売当初からハッシュレート制限機能が搭載されました。

評価については、既発売のGeForce RTX 3090,3080,3070,3060Ti,3060を含めて比較しても、FullHDでゲームをやるのならこのGeForce RTX 3070TiはAmpere世代GPUの中で最もおすすめできます。RTX3080よりもブーストクロック、ベースクロック共に向上しており、リファレンスモデルのベースクロックの高さに至ってはAmpere世代GPUの中でトップです。ブーストクロックの高さもGeForce RTX 3060に次いで2位です。GeForce RTX 3060はなぜブーストクロックが高いかというと、RTX3060はそもそもCUDA Core数が少ないGPUなのでブーストクロックを高めやすいという事情があります。

GeForce RTX 3060はCUDA Core数が控えめな一方で、GeForce RTX 3070Tiは6,144コアも搭載しています。RTX3060レベルのブーストクロックを実現しながらも、GeForce RTX 3070TiはCUDA Core数の多さとクロックの高さを両取りできている優秀なGPUになっています。

NVIDIA GeForce RTX 3070 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

13位： NVIDIA GeForce RTX 3070

メーカー・モデル名	NVIDIA GeForce RTX 3070
CUDA Core数	5,888
ブーストクロック	1,725 MHz
メモリ容量	8GB
共有キャッシュ	4MB
単精度性能	20.3136 TFLOPS
倍精度性能	0.3174 TFLOPS
Tensor Core性能	162.5088 TFLOPS
TDP	220W
発売日	2020年10月

Ray Tracing性能	40.6 TFLOPS
ベースクロック	1,500 MHz
ピクセル・レート	165.6 GPixel毎秒
テクスチャ・レート	317.4 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	14 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	448.0 GB毎秒
接続規格	PCIe 4.0 x16
アーキテクチャ	Ampere (GeForce 3000 series)
コードネーム	GA104-300-A1
ファウンドリ	Samsung
プロセスルール	10nm(8LPP)
トランジスタ密度	44.3 MTr/mm²
トランジスタ数	174億
ダイサイズ	392.5mm²

SM数	46
無効化SM数	2
TMU数	184
ROPユニット数	96
Tensor Core数	184
RayTracing Core数	46
NVLink	非対応
3DMark Speed Way(DX12)	3,454
3DMark Port Royal(DX12)	8,302
3DMark Solar Bay	64,204
3DMkark SteelNomad	3,162
3DMark Time Spy(DX12)	13,678
3DMark Night Raid(DX12)	116,553
3DMark Wild Life(DX12)	76,299
3DMark Fire Strike(DX11)	33,833
PassMark GPU G3D	22,256

GPUベンチマーク名	NVIDIA GeForce RTX 3070のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	3,454
3DMark Port Royal (DX12+RT)	8,302
3DMark Solar Bay (Vulkan+RT)	64,204
3DMark Steel Nomad (DX12@4K)	3,162
3DMark Time Spy (DX12)	13,678
3DMark Night Raid (DX12@FHD)	116,553
3DMark Wild Life (Vulkan)	76,299
3DMark Fire Strike (DX11@FHD)	33,833
PassMark Videocard G3D	22,256
PassMark Videocard G2D	998
Userbenchmark (DX10)	161
Userbenchmark (DX9)	209
GPUベンチマーク総合平均スコア	36,024

GeForce RTX 2080TiからCUDA Coreを大幅に増加させてる一方で、低消費電力化とブーストクロック向上を同時に達成しているGPUです。フルHDでゲームをする場合にはRTX3090,RTX3080よりもおすすめできます。

空冷式タイプでブーストクロックが1,935MHzに達するオリジナルファンモデルが既に存在するため、フレームレート性能を上げるために購入する際はできるだけファクトリーオーバークロック値のブーストクロックが高いモデルを選ぶのがおすすめです。

NVIDIA GeForce RTX 3070チップを搭載した各メーカーのグラボはこちらで比較しています。

14位： AMD Radeon RX 6900 XT

メーカー・モデル名	AMD Radeon RX 6900 XT
SP数	5,120
ブーストクロック	2,250 MHz
メモリ容量	16GB
共有キャッシュ	4MB
単精度性能	23.040 TFLOPS
倍精度性能	1.440 TFLOPS
Tensor Core性能	0 FLOPS
TDP	300W
発売日	2020年12月

Ray Tracing性能	0 FLOPS
ベースクロック	1,825 MHz
ピクセル・レート	288.0 GPixel毎秒
テクスチャ・レート	720.0 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	16 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	512 GB毎秒
接続規格	PCIe 4.0
アーキテクチャ	RDNA 2.0 (Radeon RX 6000 series)
コードネーム	Navi 21
ファウンドリ	TSMC
プロセスルール	7nm
トランジスタ密度	51.5 MTr/mm²
トランジスタ数	268億
ダイサイズ	519.8mm²

Compute Unit数	80
無効化CU数	0
TMU数	320
ROPユニット数	128
Tensor Core数	0
RayTracing Core数	0
Multi GPU	非対応
3DMark Speed Way(DX12)	3,890
3DMark Port Royal(DX12)	10,393
3DMark Solar Bay	86,759
3DMkark SteelNomad	4,081
3DMark TimeSpy(DX12)	20,538
3DMark NightRaid(DX12)	159,221
3DMark Wild Life(DX12)	107,501
3DMark FireStrike(DX11)	57,022
PassMark GPU G3D	26,115

GPUベンチマーク名	AMD Radeon RX 6900 XTのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	3,890
3DMark Port Royal (DX12+RT)	10,393
3DMark Solar Bay (Vulkan+RT)	86,759
3DMark Steel Nomad (DX12@4K)	4,081
3DMark Time Spy (DX12)	20,538
3DMark Night Raid (DX12@FHD)	159,221
3DMark Wild Life (Vulkan)	107,501
3DMark Fire Strike (DX11@FHD)	57,022
PassMark Videocard G3D	26,115
PassMark Videocard G2D	1,076
Userbenchmark (DX10)	291
Userbenchmark (DX9)	319
GPUベンチマーク総合平均スコア	48,422

AMD Radeon RX 6900 XTは末尾文字(suffix)に”XT”を使い、NVIDIA GeForce 3090よりも型番上は上のグレードに見せつつも実際は単精度コア数が5,120コアにとどまり、GeForce RTX 3090の10,496コアに遠く及ばなかったGPUです。

AMD Radeon RX 6900 XTはNavi21チップに搭載されている80基のCompute Unitを全て有効化しています。つまり最大限に背伸びしても5,120コアしか実現できなかったことになります。2基のStreaming Multiprocessorを無効化しても10,496コアを実現しているNVIDIA GeForce RTX 3090とは対照的です。

AMD Radeon RX 6900 XTチップを搭載した各メーカーのグラボはこちらで比較しています。

15位： NVIDIA GeForce RTX 3060 Ti

メーカー・モデル名	NVIDIA GeForce RTX 3060 Ti
CUDA Core数	4,864
ブーストクロック	1,665 MHz
メモリ容量	8GB
共有キャッシュ	4MB
単精度性能	16.19712 TFLOPS
倍精度性能	0.253 TFLOPS
Tensor Core性能	129.577 TFLOPS
TDP	200W
発売日	2022年10月

Ray Tracing性能	32.4 TFLOPS
ベースクロック	1,410 MHz
ピクセル・レート	133.2 GPixel毎秒
テクスチャ・レート	253.1 GTexel毎秒
メモリタイプ	GDDR6X
メモリクロック	19 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	608.0 GB毎秒
接続規格	PCIe 4.0 x16
アーキテクチャ	Ampere (GeForce 3000 series)
コードネーム	GA104-200-A1 / GA104-202
ファウンドリ	Samsung
プロセスルール	10nm(8LPP)
トランジスタ密度	44.3 MTr/mm²
トランジスタ数	174億
ダイサイズ	392.5mm²

SM数	38
無効化SM数	10
TMU数	152
ROPユニット数	80
Tensor Core数	152
RayTracing Core数	38
NVLink	非対応
3DMark Speed Way(DX12)	2,966
3DMark Port Royal(DX12)	6,977
3DMark Solar Bay	54,342
3DMkark SteelNomad	2,670
3DMark Time Spy(DX12)	11,766
3DMark Night Raid(DX12)	105,724
3DMark Wild Life(DX12)	66,934
3DMark Fire Strike(DX11)	29,417
PassMark GPU G3D	20,406

GPUベンチマーク名	NVIDIA GeForce RTX 3060 Tiのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	2,966
3DMark Port Royal (DX12+RT)	6,977
3DMark Solar Bay (Vulkan+RT)	54,342
3DMark Steel Nomad (DX12@4K)	2,670
3DMark Time Spy (DX12)	11,766
3DMark Night Raid (DX12@FHD)	105,724
3DMark Wild Life (Vulkan)	66,934
3DMark Fire Strike (DX11@FHD)	29,417
PassMark Videocard G3D	20,406
PassMark Videocard G2D	988
Userbenchmark (DX10)	145
Userbenchmark (DX9)	173
GPUベンチマーク総合平均スコア	32,192

2020年12月にリリースされたGeForce RTX 3060Tiは型番だけみるとミドルエンドに見えますが、実際はCUDA Coreを4,864コアも搭載している高性能GPUです。このCUDA Core数は前世代(Turing世代)のGeForce RTX 2080Ti(4,352コア)を超える水準です。

単にコア数を増やすだけでなく、ASUS ROG STRIX等のオリジナルファンモデルではブーストクロック1,900MHzに迫った高クロックモデルが存在しており、そのようなモデルを使うと競合他社のRadeon RX 6800 XTよりも遥かに高いフレームレート性能を叩き出します。

YouTube等のフレームレート比較動画では、GeForce RTX 3060TiとRadeon RX6800XTを比較したものではGeForce RTX 3060Tiのフレームレートが低いように見せかけているものが掲載されていますが、それはNVIDIAリファレンスモデルだったりブーストクロックが低い低グレードのオリジナルファンモデルのGeForce RTX 3060Tiを使って比較しているためです。

AMD製のGPU全般に言えることなのですが、Radeonはリファレンスモデルとオリジナルファンモデルのブーストクロックは殆ど変わらず性能も殆ど変わりません。

一方で、NVIDIA製GPUはリファレンスモデルのブーストクロックが低く設定されていて、オリジナルファンモデルのブーストクロックは大幅に高くなる傾向があり、リファレンスモデルとオリジナルファンモデルでブーストクロックに大きな差があります。ASUS,MSI,GIGABYTEといったメーカーが出しているオリジナルファンモデルの上位モデルを使うとGeForce RTX 3060Tiは非常に高速であり、どのような分野のゲームでもRadeon RX6800XTを上回るフレームレートになります。

NVIDIA GeForce RTX 3060 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

16位： NVIDIA TITAN RTX

メーカー・モデル名	NVIDIA TITAN RTX
CUDA Core数	4,608
ブーストクロック	1,770 MHz
メモリ容量	24GB
共有キャッシュ	6MB
単精度性能	16.312 TFLOPS
倍精度性能	0.5098 TFLOPS
Tensor Core性能	130.49856 TFLOPS
TDP	280W
発売日	2018年12月

Ray Tracing性能	0 FLOPS
ベースクロック	1,350 MHz
ピクセル・レート	169.92 GPixel毎秒
テクスチャ・レート	509.76 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	14 GT毎秒
メモリバス幅	384bit
メモリ帯域幅	672 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Turing (GeForce 2000 series)
コードネーム	TU102-400-A1
ファウンドリ	TSMC
プロセスルール	12nm
トランジスタ密度	24.7 MTr/mm²
トランジスタ数	186億
ダイサイズ	754mm²

SM数	72
無効化SM数	0
TMU数	288
ROPユニット数	96
Tensor Core数	576
RayTracing Core数	72
NVLink	2-way対応
3DMark Speed Way(DX12)	3,224
3DMark Port Royal(DX12)	9,869
3DMark Solar Bay	67,725
3DMkark SteelNomad	3,800
3DMark Time Spy(DX12)	15,190
3DMark Night Raid(DX12)	120,471
3DMark Wild Life(DX12)	78,804
3DMark Fire Strike(DX11)	37,783
PassMark GPU G3D	20,221

GPUベンチマーク名	NVIDIA TITAN RTXのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	3,224
3DMark Port Royal (DX12+RT)	9,869
3DMark Solar Bay (Vulkan+RT)	67,725
3DMark Steel Nomad (DX12@4K)	3,800
3DMark Time Spy (DX12)	15,190
3DMark Night Raid (DX12@FHD)	120,471
3DMark Wild Life (Vulkan)	78,804
3DMark Fire Strike (DX11@FHD)	37,783
PassMark Videocard G3D	20,221
PassMark Videocard G2D	831
Userbenchmark (DX10)	240
Userbenchmark (DX9)	229
GPUベンチマーク総合平均スコア	37,317

4,608コア搭載しブーストクロック1,770MHzのグラボで、Turing世代ゲーム用GPUの中ではフラッグシップモデル。

使用されているダイ(チップ)はTU102でRTX2080Tiと同じです。よってダイ面積も754m㎡で同じです。

ではRTX2080TiとこのTitan RTXでは何が違うかと言うと、Titan RTXではダイ上のすべてのコアが有効化されています。つまりダイ上にエラーが許されないため歩留まりが悪く、それがこの価格の高さに直結しています。

リファレンスモデルしかないので日本国内では菱洋エレクトロ株式会社が代理店となり単一製品を各小売店が販売しています。

FLOPS性能ではブーストクロック1,770MHz時に16.312TFLOPSあるため、2080Tiの「ZOTAC AMP Extreme」が実現しているブーストクロック1,815MHz時の15.798TFLOPSを上回る性能です。

しかし、4,352コアの2080Tiで1,770MHzのブーストクロックを実現した「MSI LIGHTNING Z」は3スロット占有かつ全長328mmの冷却機構を備えています。同じ1,770MHzで4,608コアのTITAN RTXはそれよりも発熱量が大きいのは当然にもかかわらず冷却は2スロット占有267mm全長でファン×2。どうみてもTITAN RTXは1,770MHzのブーストクロックを出すのには適していません。各自で簡易水冷化するなどして冷却しないと本来の性能を引き出すのは難しいです。

TITAN RTXの基板規格はRTX2080Ti Founders Editionと同じであり、RTX2080Tiでも使える簡易水冷化キットが使用可能です。Titan RTXは簡易水冷化キット＋CorsairやEVGA等の簡易水冷クーラーを組合せて使用しないと宝の持ち腐れになります。しかしこのTitan RTXは外形上の見た目が非常に良いので、簡易水冷化すると初期状態よりも見た目が悪くなるのは確実でありそこは非常にもったいない点です。

また、TITAN RTXの2080Tiより多いコア数がゲームでのフレームレート性能に直結するかといったらゲームによります。場合によってはコア数の多さよりも動作周波数の高さのほうがフレームレートの高さに貢献する場合があります。その場合は補助電源8ピン×3を搭載した「2080Ti MSI LIGHTNING Z」を限界までオーバークロックしたほうが有利です。

このTITAN RTXは十分に並列性が高い機械学習のコプロセッサとして使うには最適です。機械学習は応用分野によって単精度でいいか倍精度が必要か異なりますが、金融分析以外なら単精度で十分なので単精度浮動小数点演算能力に特化しているTITAN RTXは最適です。並列性が高く各コアを十分に使いきれるのなら補助電源8ピン×2で低い動作周波数であっても、オーバークロックした2080Tiより高いFlops性能が出ます。

難しいことを考えず単にゲーム用として使うことしか考えてないというのなら、2080Tiの「ZOTAC AMP Extreme」や「MSI LIGHTNING Z」を選んだほうが面倒がなくおすすめできます。

17位： NVIDIA GeForce RTX 2080 Ti

メーカー・モデル名	NVIDIA GeForce RTX 2080 Ti
CUDA Core数	4,352
ブーストクロック	1,545 MHz
メモリ容量	11GB
共有キャッシュ	6MB
単精度性能	13.448 TFLOPS
倍精度性能	0.42024 TFLOPS
Tensor Core性能	107.58144 TFLOPS
TDP	250W
発売日	2018年9月

Ray Tracing性能	0 FLOPS
ベースクロック	1,350 MHz
ピクセル・レート	135.96 GPixel毎秒
テクスチャ・レート	420.24 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	14 GT毎秒
メモリバス幅	352bit
メモリ帯域幅	616 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Turing (GeForce 2000 series)
コードネーム	TU102-300-K1-A1
ファウンドリ	TSMC
プロセスルール	12nm
トランジスタ密度	24.7 MTr/mm²
トランジスタ数	186億
ダイサイズ	754mm²

SM数	68
無効化SM数	4
TMU数	272
ROPユニット数	88
Tensor Core数	544
RayTracing Core数	68
NVLink	2-way対応
3DMark Speed Way(DX12)	3,041
3DMark Port Royal(DX12)	9,111
3DMark Solar Bay	64,275
3DMkark SteelNomad	3,538
3DMark Time Spy(DX12)	14,665
3DMark Night Raid(DX12)	113,336
3DMark Wild Life(DX12)	74,936
3DMark Fire Strike(DX11)	35,659
PassMark GPU G3D	21,852

GPUベンチマーク名	NVIDIA GeForce RTX 2080 Tiのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	3,041
3DMark Port Royal (DX12+RT)	9,111
3DMark Solar Bay (Vulkan+RT)	64,275
3DMark Steel Nomad (DX12@4K)	3,538
3DMark Time Spy (DX12)	14,665
3DMark Night Raid (DX12@FHD)	113,336
3DMark Wild Life (Vulkan)	74,936
3DMark Fire Strike (DX11@FHD)	35,659
PassMark Videocard G3D	21,852
PassMark Videocard G2D	940
Userbenchmark (DX10)	210
Userbenchmark (DX9)	217
GPUベンチマーク総合平均スコア	36,533

2018年発売のTuring(チューリング)世代ゲーム用グラボの中で上位に位置するモデルです。これより上にTITAN RTXがありますが、TITAN RTXはダイTU102のStreaming Multiprocessor72基全てを有効化しているため歩留まりが悪化し価格が非常に高くなってしまっています。そこで、このRTX2080TiではStreaiming Multiprocessorのうち4基を無効化し68基のみ有効化し歩留まりを改善し価格を安くしています。

Titan RTXでは4,608コア全てが有効化されていますが、RTX2080Tiではそのうち4,352コアが有効化されていることになります。

コア数を絞り1コアあたりの動作周波数を上げた「オーバークロック版の2080Ti」のほうがほとんどのゲームにおいてTITAN RTXよりもゲームのフレームレート(fps)が向上します。

「少ないコア数で高い動作周波数」と「多いコア数で低い動作周波数」なら、前者を達成するほうが後者を達成するよりも技術的に難易度が高いです。IntelもNVIDIAもできるだけ前者を目指していますが、それ以上どうしても動作周波数を上げられない場合はコア数を増やす水平展開をしています。それがTITAN RTXです。コア数を少なくして動作周波数の高さを追求してるのが2080Tiです。

AMDのグラボは動作周波数を高くする技術力がないためコア数の多さで勝負していますが、コア数が多いグラボを活かしきれるゲームが少ないため結果的に1コアの性能が高いNVIDIAのグラボのほうが有利です。

NVIDIA GeForce RTX 2080 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

18位： AMD Radeon RX 6800 XT

メーカー・モデル名	AMD Radeon RX 6800 XT
SP数	4,608
ブーストクロック	2,250 MHz
メモリ容量	16GB
共有キャッシュ	4MB
単精度性能	20.736 TFLOPS
倍精度性能	1.296 TFLOPS
Tensor Core性能	0 FLOPS
TDP	300W
発売日	2020年11月

Ray Tracing性能	0 FLOPS
ベースクロック	1,825 MHz
ピクセル・レート	288.0 GPixel毎秒
テクスチャ・レート	648.0 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	16 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	512 GB毎秒
接続規格	PCIe 4.0
アーキテクチャ	RDNA 2.0 (Radeon RX 6000 series)
コードネーム	Navi 21
ファウンドリ	TSMC
プロセスルール	7nm
トランジスタ密度	51.5 MTr/mm²
トランジスタ数	268億
ダイサイズ	519.8mm²

Compute Unit数	72
無効化CU数	8
TMU数	288
ROPユニット数	128
Tensor Core数	0
RayTracing Core数	0
Multi GPU	非対応
3DMark Speed Way(DX12)	3,634
3DMark Port Royal(DX12)	9,534
3DMark Solar Bay	78,389
3DMkark SteelNomad	3,690
3DMark TimeSpy(DX12)	19,103
3DMark NightRaid(DX12)	155,724
3DMark Wild Life(DX12)	99,507
3DMark FireStrike(DX11)	52,957
PassMark GPU G3D	24,079

GPUベンチマーク名	AMD Radeon RX 6800 XTのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	3,634
3DMark Port Royal (DX12+RT)	9,534
3DMark Solar Bay (Vulkan+RT)	78,389
3DMark Steel Nomad (DX12@4K)	3,690
3DMark Time Spy (DX12)	19,103
3DMark Night Raid (DX12@FHD)	155,724
3DMark Wild Life (Vulkan)	99,507
3DMark Fire Strike (DX11@FHD)	52,957
PassMark Videocard G3D	24,079
PassMark Videocard G2D	1,056
Userbenchmark (DX10)	251
Userbenchmark (DX9)	260
GPUベンチマーク総合平均スコア	44,785

2020年11月発売のRadeon RX 6800 XTは4,608コアの単精度演算器(StreamProcessor)を搭載し、2018年発売のNVIDIA TITAN RTXと同じ数の単精度演算器(CUDA Core)数です。

アーキテクチャ面ではNVIDIA Turingが、Radeon RX 6800 XTで採用されたAMD RDNA2アーキテクチャよりも優秀ですが、その技術力の差を埋めるためにRadeon RX 6800 XTでは動作クロックを2,000MHz台まで大幅に引き上げています。それでもNVIDIA Ampereアーキテクチャを採用したGeForce RTX 3070より低い性能です。

AMD Radeon RX 6800 XTチップを搭載した各メーカーのグラボはこちらで比較しています。

19位： NVIDIA GeForce RTX 3060

メーカー・モデル名	NVIDIA GeForce RTX 3060 12GB版
CUDA Core数	3,584
ブーストクロック	1,777 MHz
メモリ容量	12GB
共有キャッシュ	3MB
単精度性能	12.73754 TFLOPS
倍精度性能	0.199 TFLOPS
Tensor Core性能	101.900 TFLOPS
TDP	170W
発売日	2021年2月

Ray Tracing性能	25 TFLOPS
ベースクロック	1,320 MHz
ピクセル・レート	85.3 GPixel毎秒
テクスチャ・レート	199.0 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	15 GT毎秒
メモリバス幅	192bit
メモリ帯域幅	360.0 GB毎秒
接続規格	PCIe 4.0 x16
アーキテクチャ	Ampere (GeForce 3000 series)
コードネーム	GA106-300-A1 / GA106-302 / GA104-150-A1
ファウンドリ	Samsung
プロセスルール	10nm(8LPP)
トランジスタ密度	48.0 MTr/mm²
トランジスタ数	132.5億
ダイサイズ	276mm²

SM数	28
無効化SM数	2
TMU数	112
ROPユニット数	48
Tensor Core数	112
RayTracing Core数	28
NVLink	非対応
3DMark Speed Way(DX12)	2,181
3DMark Port Royal(DX12)	5,142
3DMark Solar Bay	40,966
3DMkark SteelNomad	1,961
3DMark Time Spy(DX12)	8,747
3DMark Night Raid(DX12)	98,839
3DMark Wild Life(DX12)	50,589
3DMark Fire Strike(DX11)	22,308
PassMark GPU G3D	16,870

GPUベンチマーク名	NVIDIA GeForce RTX 3060 12GB版のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	2,181
3DMark Port Royal (DX12+RT)	5,142
3DMark Solar Bay (Vulkan+RT)	40,966
3DMark Steel Nomad (DX12@4K)	1,961
3DMark Time Spy (DX12)	8,747
3DMark Night Raid (DX12@FHD)	98,839
3DMark Wild Life (Vulkan)	50,589
3DMark Fire Strike (DX11@FHD)	22,308
PassMark Videocard G3D	16,870
PassMark Videocard G2D	960
Userbenchmark (DX10)	110
Userbenchmark (DX9)	125
GPUベンチマーク総合平均スコア	26,423

2021年2月にリリースされたGeForce RTX 3060はGeForce RTX 2080Tiよりは低性能だけれども、GeForce RTX 2080を上回るフレームレート性能を実現する十分に高性能なGPUです。

ただし、GeForce RTX 3060TiとGeForce RTX 3060の間には大きな性能上の乖離があり、CUDA Core数を見てもGeForce RTX 3060Tiの4,864コアに対し、GeForce RTX 3060は3,584コアでありコア数の差にして1,280コアもの違いがあります。単にコア数だけではなく、採用されているGPUチップを見てもGeForce RTX 3060Tiで採用されているのは上位のGA104であり、GeForce RTX 3060で採用されているのはそれよりも下位のGA106チップです。

つまり、「GeForce RTX 3060はGeForce RTX 3060Tiよりちょっとだけ下」という認識は誤りです。「GeForce RTX 3060はGeForce RTX 3060Tiよりも大幅に下でその間に断絶がある」くらいの認識を持っておいた方がいいです。

あえてGeForce RTX 3060TiではなくGeForce RTX 3060を選ぶ理由があるとしたら低消費電力性です。本格的に低消費電力を狙うなら「補助電源不要または補助電源コネクタ6ピン×1」で動作するGeForce RTX 3050を待った方がいいでしょうが、Radeon RX 6800を上回る性能を有してそこそこ低消費電力のGPUを選ぶならGeForce RTX 3060は良いGPUです。

さらにこのGeForce GTX 3060は、2017年3月に発売された名作GPU「GeForce GTX 1080Ti」と同じCUDA Core数3,584コアを搭載しています。にもかかわらず消費電力は1080Tiよりも大幅に削減されており、ブーストクロックはむしろ大幅に上昇。さらにGeForce RTC 3060はTensorCoreという16bit4×4行列の積和浮動小数点演算(FMA)に特化した演算器も搭載し、深層学習(世間では人工知能と呼ばれている機械学習の一類型)向けの演算性能を高めているので、「同じCUDA Core数のGeForce GTX 1080Tiよりも消費電力を下げつつも性能を大幅に引き上げしかも低価格化を実現」したのがGeForce RTX 3060です。

NVIDIA GeForce RTX 3060チップを搭載した各メーカーのグラボはこちらで比較しています。

20位： AMD Radeon RX 6800

メーカー・モデル名	AMD Radeon RX 6800
SP数	3,840
ブーストクロック	2,105 MHz
メモリ容量	16GB
共有キャッシュ	4MB
単精度性能	16.166 TFLOPS
倍精度性能	1.0104 TFLOPS
Tensor Core性能	0 FLOPS
TDP	250W
発売日	2020年11月

Ray Tracing性能	0 FLOPS
ベースクロック	1,700 MHz
ピクセル・レート	202.1 GPixel毎秒
テクスチャ・レート	505.2 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	16 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	512 GB毎秒
接続規格	PCIe 4.0
アーキテクチャ	RDNA 2.0 (Radeon RX 6000 series)
コードネーム	Navi 21
ファウンドリ	TSMC
プロセスルール	7nm
トランジスタ密度	51.5 MTr/mm²
トランジスタ数	268億
ダイサイズ	519.8mm²

Compute Unit数	60
無効化CU数	20
TMU数	240
ROPユニット数	96
Tensor Core数	0
RayTracing Core数	0
Multi GPU	非対応
3DMark Speed Way(DX12)	3,059
3DMark Port Royal(DX12)	7,812
3DMark Solar Bay	64,572
3DMkark SteelNomad	3,188
3DMark TimeSpy(DX12)	15,828
3DMark NightRaid(DX12)	134,980
3DMark Wild Life(DX12)	89,046
3DMark FireStrike(DX11)	44,117
PassMark GPU G3D	21,206

GPUベンチマーク名	AMD Radeon RX 6800のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	3,059
3DMark Port Royal (DX12+RT)	7,812
3DMark Solar Bay (Vulkan+RT)	64,572
3DMark Steel Nomad (DX12@4K)	3,188
3DMark Time Spy (DX12)	15,828
3DMark Night Raid (DX12@FHD)	134,980
3DMark Wild Life (Vulkan)	89,046
3DMark Fire Strike (DX11@FHD)	44,117
PassMark Videocard G3D	21,206
PassMark Videocard G2D	997
Userbenchmark (DX10)	199
Userbenchmark (DX9)	223
GPUベンチマーク総合平均スコア	38,699

2020年11月発売のRadeon RX 6800は3,840コアの単精度演算器(StreamProcessor)を搭載しています。リファレンスモデルの時点でブーストクロックが高めですが、オリジナルファンモデルでもブーストクロックは殆ど増えず、むしろオリジナルファンモデルでも本来のブーストクロックを実現するだけの冷却性能を実現できるか微妙なほど高発熱なGPUです。

GeForce RTX 2080Tiよりもフレームレート性能が高いとしているベンチマーク動画が多く出回っていますが、それはリファレンスモデルのGeForce RTX 2080Tiと比較しているためです。NVIDIA GeForceはリファレンスモデルのブーストクロックが極めて低いため、リファレンスモデル同士で比較するとAMD Radeon RX 6800が有利に見えるようにできています。オリジナルファンモデル同士で比較するとGeForce RTX 2080Tiのフレームレート性能がRadeon RX 6800に対して圧勝してしまいます。

AMD Radeon RX 6800チップを搭載した各メーカーのグラボはこちらで比較しています。

21位： NVIDIA GeForce RTX 2080 Super

メーカー・モデル名	NVIDIA GeForce RTX 2080 Super
CUDA Core数	3,072
ブーストクロック	1,815 MHz
メモリ容量	8GB
共有キャッシュ	4MB
単精度性能	11.150 TFLOPS
倍精度性能	0.3485 TFLOPS
Tensor Core性能	89.21088 TFLOPS
TDP	250W
発売日	2019年7月

Ray Tracing性能	0 FLOPS
ベースクロック	1,650 MHz
ピクセル・レート	116.16 GPixel毎秒
テクスチャ・レート	348.48 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	15.5 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	496 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Turing (GeForce 2000 series)
コードネーム	TU104-450-A1
ファウンドリ	TSMC
プロセスルール	12nm
トランジスタ密度	24.7 MTr/mm²
トランジスタ数	136億
ダイサイズ	545mm²

SM数	48
無効化SM数	0
TMU数	192
ROPユニット数	64
Tensor Core数	384
RayTracing Core数	46
NVLink	2-way対応
3DMark Speed Way(DX12)	2,222
3DMark Port Royal(DX12)	7,005
3DMark Solar Bay	52,258
3DMkark SteelNomad	2,754
3DMark Time Spy(DX12)	11,633
3DMark Night Raid(DX12)	107,166
3DMark Wild Life(DX12)	64,303
3DMark Fire Strike(DX11)	28,692
PassMark GPU G3D	19,538

GPUベンチマーク名	NVIDIA GeForce RTX 2080 Superのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	2,222
3DMark Port Royal (DX12+RT)	7,005
3DMark Solar Bay (Vulkan+RT)	52,258
3DMark Steel Nomad (DX12@4K)	2,754
3DMark Time Spy (DX12)	11,633
3DMark Night Raid (DX12@FHD)	107,166
3DMark Wild Life (Vulkan)	64,303
3DMark Fire Strike (DX11@FHD)	28,692
PassMark Videocard G3D	19,538
PassMark Videocard G2D	933
Userbenchmark (DX10)	162
Userbenchmark (DX9)	181
GPUベンチマーク総合平均スコア	31,372

NVIDIA GeForce RTX 2080 Superは2019年7月リリースのGPUです。位置付けとしてはRTX2080Tiの下位版というよりも、RTX2080の性能を上昇させた位置付けです。

RTX2080Superで採用されているチップはTU104でありRTX2080と同じです。RTX2080TiではTPU102チップが採用されています。

つまりRTX2080Tiの性能を低く抑えたのではなく、RTX2080の性能を向上させる方法で実現されたのがRTX2080Superになります。CUDA Core数はRTX2080比+128の3,072コアで微増ですがクロック周波数が大幅に向上しています。

普通はコア数を増やすと消費電力(単位時間あたりの発熱量)の制約の観点からクロック周波数を引き下げるのが通例です。

例えば2018年発売に発売された2つのGPU、RTX2080(2,944コア、1,710MHz)とRTX2080Ti(4,352コア、1,545MHz)においてはRTX2080TiのCUDA Core数が大幅に多い一方でリファレンスモデルのブーストクロックは1,545MHz止まりとなり、RTX2080のブーストクロック1,710MHzより下がっています。RTX2080Tiオリジナルファンモデルの大型ヒートシンク搭載ZOTAC Amp ExtremeやMSI Lightning Zであってもファクトリーオーバークロック後のブーストクロック周波数1,815MHz止まりです。

しかしRTX2080Superではリファレンスモデルのブーストクロックでも1,815MHzを達成しています。さらにオリジナルファンモデルのZOTAC Amp Extremeではブーストクロック1,875MHzに届きます。

これはRTX2080を2018年にリリースしてから1年近くが経過し半導体製造における歩留まりが向上したことで、より低発熱（低消費電力）でクロック周波数が上昇する個体(チップ)を入手しやすくなったためです。

このようなCUDA Coreあたりのクロック周波数の向上は高画質設定時のフレームレート向上で有利です。CUDA Core数を増やすことは高解像度(4K,1440p)におけるフレームレート向上で有利ですが、逆に低解像度(1080p)ならCUDA Core(FP32演算器)数の多さよりもクロック周波数の高さが重要です。

つまりRTX2080Superでは、解像度をFullHD(1080p)から1440pや4Kまで上げたときのフレームレート性能の向上よりも、高画質設定にしたときのフレームレート性能向上が重視されていることになります。ゲームの結果を重視するなら解像度を1440pや4Kまで上昇させるニーズはほとんどありません。画質設定を高く設定してゲームをするのならRTX2080Superは非常に適しています。

またAMD Radeonとの比較においては、RTX2060Superにも勝てないRadeon RX 5700 XTでは当然RTX2080Superと全く勝負になりません。

そしてRTX2070Superにも勝てていないRadeon VIIも同様にRTX2080Superと全く勝負になりません。

RTX2070SuperとRTX2080を上回るこのRTX2080Super相手に、Radeon VIIやRadeon RX5700XTでは全く歯が立たないということです。つまりAMD RadeonシリーズはRTX2080Superの前では「戦力外」ということになります。RTX2080Superと比較するのはRTX2080TiかRTX2080です。

予算が許すなら簡易水冷版のRTX2080Tiが「価格と消費電力以外」のすべてにおいてRTX2080Superより優れています。簡易水冷版のRTX2080Tiなら120mmラジエータタイプでも1,900MHz弱を実現でき、240mmラジエータタイプなら2,000MHz超を50℃台ピークアウトで実現できます。つまりこの場合RTX2080TiがRTX2080SuperのCUDA Core数を上回りかつクロック周波数もRTX2080Superを上回ることになり完全に上位になります。ただし空冷版のRTX2080Tiになると最大クロック周波数がRTX2080Superと同等かそれ以下になり、「すべての場合においてRTX2080Tiの性能がRTX2080Superを上回るわけではない」ということになります。

RTX2080Super or RTX2080の比較では、空冷版であってもRTX2080SuperがCUDA Core数とクロック周波数両面においてRTX2080より優秀です。これは「高いけど高性能なRTX2080Super」か「安いけど低性能なRTX2080」という予算と性能のトレードオフでの比較になります。

NVIDIA GeForce RTX 2080 Superチップを搭載した各メーカーのグラボはこちらで比較しています。

22位： NVIDIA GeForce RTX 2080

メーカー・モデル名	NVIDIA GeForce RTX 2080
CUDA Core数	2,944
ブーストクロック	1,710 MHz
メモリ容量	8GB
共有キャッシュ	4MB
単精度性能	10.068 TFLOPS
倍精度性能	0.31464 TFLOPS
Tensor Core性能	80.54784 TFLOPS
TDP	215W
発売日	2018年9月

Ray Tracing性能	0 FLOPS
ベースクロック	1,515 MHz
ピクセル・レート	109.44 GPixel毎秒
テクスチャ・レート	314.64 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	14 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	448 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Turing (GeForce 2000 series)
コードネーム	TU104-400-A1
ファウンドリ	TSMC
プロセスルール	12nm
トランジスタ密度	25.0 MTr/mm²
トランジスタ数	136億
ダイサイズ	545mm²

SM数	46
無効化SM数	2
TMU数	184
ROPユニット数	64
Tensor Core数	368
RayTracing Core数	46
NVLink	2-way対応
3DMark Speed Way(DX12)	2,171
3DMark Port Royal(DX12)	6,441
3DMark Solar Bay	50,007
3DMkark SteelNomad	2,599
3DMark Time Spy(DX12)	11,098
3DMark Night Raid(DX12)	99,518
3DMark Wild Life(DX12)	60,829
3DMark Fire Strike(DX11)	27,647
PassMark GPU G3D	18,731

GPUベンチマーク名	NVIDIA GeForce RTX 2080のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	2,171
3DMark Port Royal (DX12+RT)	6,441
3DMark Solar Bay (Vulkan+RT)	50,007
3DMark Steel Nomad (DX12@4K)	2,599
3DMark Time Spy (DX12)	11,098
3DMark Night Raid (DX12@FHD)	99,518
3DMark Wild Life (Vulkan)	60,829
3DMark Fire Strike (DX11@FHD)	27,647
PassMark Videocard G3D	18,731
PassMark Videocard G2D	913
Userbenchmark (DX10)	150
Userbenchmark (DX9)	169
GPUベンチマーク総合平均スコア	29,851

CUDAコアを2,944コア搭載したTuring世代グラボです。RayTracingCoreやTensorCoreを搭載してしまったことにより、ゲーミング用に割り当てる演算回路のチップ上面積が減ってしまい、ゲーミング性能に関しては先代のGTX1080Tiと同程度に留まってしまいました。

とはいっても現在の価格は1080TiよりもRTX2080のほうが安いです。1080Tiは生産を終了し品薄になってしまったためであり現在は2080が主流です。

しかし1080Tiを使わず1080で済ませているプロゲーマーが多かったことから、RTX2080の性能は必要なくRTX2070で十分なケースもあります。

ゲームは画質設定を最低にしたほうが視認性がよくなるため、プロゲーマーでも1080を使い1080Tiを使わない人は多かったです。

TwitchやYoutubeでストリーマーとして配信するのなら見栄えにこだわるため高画質設定でもフレームレートが落ちにくい2080Tiや2080を買うのもありでしょうが、単にフレームレートを高くしゲームでの優位性だけを追求するのなら低画質設定でRTX2070でも十分です。

また各ゲームのフレームレートベンチマークでは、RTX2080TiよりもこのRTX2080無印のほうが上になることが多々あります。その理由はRTX2080無印はRTX2080TiよりもCUDA Core数が少ない一方で、動作クロックが高いためです。コア数を使いきれないゲームではコア数が多いRTX2080Tiではフレームレートが伸びません。そのかわり1コアあたりのクロックが高いRTX2080無印では計算すべきオブジェクト数が少ないゲームの場合、RTX2080Tiより高いフレームレートを叩き出します。

このようにしてみるとRTX2080Tiよりもフレームレートが高くなっているゲームがあることがわかると思います。例えばLoLです。LoLは明らかにハイエンドのグラボが不要なゲームですが、なぜハイエンドが不要かというと計算すべき対象のオブジェクト数が少ないからです。

NVIDIA GeForce RTX 2080チップを搭載した各メーカーのグラボはこちらで比較しています。

23位： NVIDIA GeForce GTX 1080 Ti

メーカー・モデル名	NVIDIA GeForce GTX 1080 Ti
CUDA Core数	3,584
ブーストクロック	1,582 MHz
メモリ容量	11GB
共有キャッシュ	2.75MB
単精度性能	11.3397 TFLOPS
倍精度性能	0.3543 TFLOPS
Tensor Core性能	0 FLOPS
TDP	250W
発売日	2017年3月

Ray Tracing性能	0 FLOPS
ベースクロック	1,480 MHz
ピクセル・レート	139.2 GPixel毎秒
テクスチャ・レート	354.3 GTexel毎秒
メモリタイプ	GDDR5X
メモリクロック	11 GT毎秒
メモリバス幅	352bit
メモリ帯域幅	484 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Pascal (GeForce 1000 series)
コードネーム	GP102-350-K1-A1
ファウンドリ	TSMC
プロセスルール	16nm
トランジスタ密度	25.5 MTr/mm²
トランジスタ数	120億
ダイサイズ	471mm²

SM数	28
無効化SM数	2
TMU数	224
ROPユニット数	88
Tensor Core数	0
RayTracing Core数	0
NVLink	4-waySLI対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	2,205
3DMark Solar Bay	25,889
3DMkark SteelNomad	2,231
3DMark Time Spy(DX12)	9,995
3DMark Night Raid(DX12)	94,663
3DMark Wild Life(DX12)	61,989
3DMark Fire Strike(DX11)	29,338
PassMark GPU G3D	18,401

GPUベンチマーク名	NVIDIA GeForce GTX 1080 Tiのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Port Royal (DX12+RT)	2,205
3DMark Solar Bay (Vulkan+RT)	25,889
3DMark Steel Nomad (DX12@4K)	2,231
3DMark Time Spy (DX12)	9,995
3DMark Night Raid (DX12@FHD)	94,663
3DMark Wild Life (Vulkan)	61,989
3DMark Fire Strike (DX11@FHD)	29,338
PassMark Videocard G3D	18,401
PassMark Videocard G2D	937
Userbenchmark (DX10)	144
Userbenchmark (DX9)	179
GPUベンチマーク総合平均スコア	28,955

1080Tiは2017年発売でもうかなり古いGPUですが、2018年発売のRTXシリーズが大コケしたため消去法的に価値あるグラボになってしまいました。

特に2018年発売Turing世代のRTX2080Tiは1080Tiに毛が生えた程度のベンチマーク性能しかなく、その後発売されたTuring世代のフラッグシップモデルTITAN RTXにいたってはオーバークロックしたRTX2080Tiにも負けてるということで、さらに1080Tiの価値が高まってしまいました。

残念ながら1080Tiは生産終了した上に正規品の新品は既に在庫が切れているため、高額な転売品を選ぶしか手がないので、それなら新品のRTX2080を正規で購入したほうがいいという状況です。本来ならこのレイトレーシング対応という大ミスをしたNvidiaの失策をチャンスとみてAMD Radeonが追撃するところですがRadeon VIIにはそれだけの力がなかったので、Turing世代の次がでる2020年4月までは2018年発売のRTX失敗作を選ぶしか無いのが現状です。

さすがにRTX2080無印には負けていますが、そこまで大きな差がついていません。特にApex Legendsではほぼ差がついていないので、既にGTX1080Tiを持っているのなら積極的にRTX2080無印に買い換える必要はないでしょう。

NVIDIA GeForce GTX 1080 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

24位： NVIDIA GeForce RTX 2070 Super

メーカー・モデル名	NVIDIA GeForce RTX 2070 Super
CUDA Core数	2,560
ブーストクロック	1,770 MHz
メモリ容量	8GB
共有キャッシュ	4MB
単精度性能	9.060 TFLOPS
倍精度性能	0.2832 TFLOPS
Tensor Core性能	72.49920 TFLOPS
TDP	215W
発売日	2019年7月

Ray Tracing性能	0 FLOPS
ベースクロック	1,605 MHz
ピクセル・レート	113.28 GPixel毎秒
テクスチャ・レート	283.20 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	14 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	448 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Turing (GeForce 2000 series)
コードネーム	TU104-410-A1
ファウンドリ	TSMC
プロセスルール	12nm
トランジスタ密度	24.7 MTr/mm²
トランジスタ数	136億
ダイサイズ	545mm²

SM数	40
無効化SM数	8
TMU数	160
ROPユニット数	64
Tensor Core数	320
RayTracing Core数	40
NVLink	非対応
3DMark Speed Way(DX12)	2,070
3DMark Port Royal(DX12)	6,037
3DMark Solar Bay	45,960
3DMkark SteelNomad	2,415
3DMark Time Spy(DX12)	10,184
3DMark Night Raid(DX12)	101,545
3DMark Wild Life(DX12)	57,930
3DMark Fire Strike(DX11)	25,590
PassMark GPU G3D	18,190

GPUベンチマーク名	NVIDIA GeForce RTX 2070 Superのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	2,070
3DMark Port Royal (DX12+RT)	6,037
3DMark Solar Bay (Vulkan+RT)	45,960
3DMark Steel Nomad (DX12@4K)	2,415
3DMark Time Spy (DX12)	10,184
3DMark Night Raid (DX12@FHD)	101,545
3DMark Wild Life (Vulkan)	57,930
3DMark Fire Strike (DX11@FHD)	25,590
PassMark Videocard G3D	18,190
PassMark Videocard G2D	894
Userbenchmark (DX10)	143
Userbenchmark (DX9)	152
GPUベンチマーク総合平均スコア	28,553

NVIDIA GeForce RTX 2070 Superチップを搭載した各メーカーのグラボはこちらで比較しています。

25位： NVIDIA GeForce Titan X

メーカー・モデル名	NVIDIA TITAN X
CUDA Core数	3,584
ブーストクロック	1,531 MHz
メモリ容量	12GB
共有キャッシュ	3MB
単精度性能	10.9742 TFLOPS
倍精度性能	0.3429 TFLOPS
Tensor Core性能	0 FLOPS
TDP	250W
発売日	2016年8月

Ray Tracing性能	0 FLOPS
ベースクロック	1,417 MHz
ピクセル・レート	146.9 GPixel毎秒
テクスチャ・レート	342.9 GTexel毎秒
メモリタイプ	GDDR5X
メモリクロック	10 GT毎秒
メモリバス幅	384bit
メモリ帯域幅	480 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Pascal (GeForce 1000 series)
コードネーム	GP102-400-A1
ファウンドリ	TSMC
プロセスルール	16nm
トランジスタ密度	25.5 MTr/mm²
トランジスタ数	120億
ダイサイズ	471mm²

SM数	28
無効化SM数	2
TMU数	224
ROPユニット数	96
Tensor Core数	0
RayTracing Core数	0
NVLink	4-waySLI対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	2,261
3DMark Solar Bay	24,612
3DMkark SteelNomad	2,243
3DMark Time Spy(DX12)	10,311
3DMark Night Raid(DX12)	103,025
3DMark Wild Life(DX12)	62,009
3DMark Fire Strike(DX11)	31,227
PassMark GPU G3D	13,660

GPUベンチマーク名	NVIDIA TITAN Xのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Port Royal (DX12+RT)	2,261
3DMark Solar Bay (Vulkan+RT)	24,612
3DMark Steel Nomad (DX12@4K)	2,243
3DMark Time Spy (DX12)	10,311
3DMark Night Raid (DX12@FHD)	103,025
3DMark Wild Life (Vulkan)	62,009
3DMark Fire Strike (DX11@FHD)	31,227
PassMark Videocard G3D	13,660
PassMark Videocard G2D	912
Userbenchmark (DX10)	139
Userbenchmark (DX9)	174
GPUベンチマーク総合平均スコア	28,194

2016年8月リリースの古いGPUでPascalアーキテクチャの中でも高額品です。メモリ容量が12GBなのがその理由です。このGPUは買うためのものではなく「性能の位置」を見るための参考値として重要です。

このTitanXは、Turingより1世代前のPascalアーキテクチャを採用した世代のNVIDIA製品の基本中の基本となっている根幹とも言える製品です。

GTX1080TiもQuadro GP100も全てこのTitanXの派生として簡単に導き出せます。

TITAN Xのコア数を3,584コアそのままで動作周波数を「引き上げた」のが1080Tiです。

そしてTITAN Xのコア数のままで倍精度浮動小数点演算能力に特化しつつ、動作周波数を「引き下げた」のがQuadro GP100です。

なぜ1080Tiでは動作周波数を引き上げたのかというと、ゲームを高速化するにはそれが一番手っ取り早いからです。

26位： NVIDIA GeForce RTX 2070

メーカー・モデル名	NVIDIA GeForce RTX 2070
CUDA Core数	2,304
ブーストクロック	1,620 MHz
メモリ容量	8GB
共有キャッシュ	4MB
単精度性能	7.46496 TFLOPS
倍精度性能	0.23328 TFLOPS
Tensor Core性能	59.71968 TFLOPS
TDP	175W
発売日	2018年10月

Ray Tracing性能	0 FLOPS
ベースクロック	1,410 MHz
ピクセル・レート	103.68 GPixel毎秒
テクスチャ・レート	233.28 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	14 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	448 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Turing (GeForce 2000 series)
コードネーム	TU106-400-A1
ファウンドリ	TSMC
プロセスルール	12nm
トランジスタ密度	24.3 MTr/mm²
トランジスタ数	108億
ダイサイズ	445mm²

SM数	36
無効化SM数	0
TMU数	144
ROPユニット数	64
Tensor Core数	288
RayTracing Core数	36
NVLink	非対応
3DMark Speed Way(DX12)	1,896
3DMark Port Royal(DX12)	5,186
3DMark Solar Bay	39,822
3DMkark SteelNomad	2,106
3DMark Time Spy(DX12)	9,125
3DMark Night Raid(DX12)	91,124
3DMark Wild Life(DX12)	52,436
3DMark Fire Strike(DX11)	23,197
PassMark GPU G3D	16,108

GPUベンチマーク名	NVIDIA GeForce RTX 2070のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	1,896
3DMark Port Royal (DX12+RT)	5,186
3DMark Solar Bay (Vulkan+RT)	39,822
3DMark Steel Nomad (DX12@4K)	2,106
3DMark Time Spy (DX12)	9,125
3DMark Night Raid (DX12@FHD)	91,124
3DMark Wild Life (Vulkan)	52,436
3DMark Fire Strike (DX11@FHD)	23,197
PassMark Videocard G3D	16,108
PassMark Videocard G2D	831
Userbenchmark (DX10)	136
Userbenchmark (DX9)	127
GPUベンチマーク総合平均スコア	25,643

RTX2070はGTX1080を上回る性能を有している上にそれなりに安いので人気のあるモデルです。全長16cm程度のヒートシンクとファン×１でも冷やし切れるため、全長170mm以内に抑えたMini ITXマザーボードからはみ出さないタイプのショートタイプグラボが存在するのもRTX2070のメリットです。

大多数のゲームにおいては下記のRadeon VIIよりもこちらのRTX2070のほうがフレームレートが高くなる上にこちらの2070のほうがRadeon VIIより安いため2070をおすすめします。

RTX2070における各ゲームのフレームレートベンチマークではRTX2080無印と比べると、PUBGのフレームレートが大きく減少しています。一方でApex Legendsはほとんど低下していません。PUBGをするならRTX2080を選んでおくのがおすすめです。

NVIDIA GeForce RTX 2070チップを搭載した各メーカーのグラボはこちらで比較しています。

27位： AMD Radeon VII

メーカー・モデル名	AMD Radeon VII
SP数	3,840
ブーストクロック	1,750 MHz
メモリ容量	16GB
共有キャッシュ	4MB
単精度性能	13.824 TFLOPS
倍精度性能	3.4585 TFLOPS
Tensor Core性能	0 FLOPS
TDP	300W
発売日	2019年2月

Ray Tracing性能	0 FLOPS
ベースクロック	1,400 MHz
ピクセル・レート	112 GPixel毎秒
テクスチャ・レート	420 GTexel毎秒
メモリタイプ	HBM2
メモリクロック	2 GT毎秒
メモリバス幅	4096bit
メモリ帯域幅	1,028 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	GCN 5th gen (Radeon VII series)
コードネーム	Vega 20
ファウンドリ	TSMC
プロセスルール	7nm
トランジスタ密度	39.9 MTr/mm²
トランジスタ数	132億
ダイサイズ	331mm²

Compute Unit数	60
無効化CU数	4
TMU数	240
ROPユニット数	64
Tensor Core数	0
RayTracing Core数	0
Multi GPU	2-way対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	―
3DMark Solar Bay	―
3DMkark SteelNomad	2,310
3DMark TimeSpy(DX12)	8,911
3DMark NightRaid(DX12)	99,004
3DMark Wild Life(DX12)	54,861
3DMark FireStrike(DX11)	27,973
PassMark GPU G3D	16,837

GPUベンチマーク名	AMD Radeon VIIのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Steel Nomad (DX12@4K)	2,310
3DMark Time Spy (DX12)	8,911
3DMark Night Raid (DX12@FHD)	99,004
3DMark Wild Life (Vulkan)	54,861
3DMark Fire Strike (DX11@FHD)	27,973
PassMark Videocard G3D	16,837
PassMark Videocard G2D	789
Userbenchmark (DX10)	113
Userbenchmark (DX9)	151
GPUベンチマーク総合平均スコア	30,412

Radeon VIIは2019年2月発売のGPUですが、2017年3月発売のGeForce GTX 1080Tiのゲーム性能を大幅に下回っています。2016年発売のGTX1080よりは性能は上です。しかしRadeon VIIは10万円近くするので、6万円程度だったGTX1080に比べたらコストパフォーマンスは圧倒的に悪いです。

Radeon VIIは2019年発売のGeForce RTX 2070と性能がほぼ互角です。ただしそれはレイトレーシング非対応ゲームに関してはほぼ互角というだけです。もしレイトレーシング対応ゲームで評価するとなると、Radeon VIIはRTX2070よりも大きく劣ります。

つまりRadeon VIIを買うなら1080TiかRTX2070を買ったほうがお得です。ただし1080Tiは既に品薄で手に入りづらく売っていても高値になってしまっているので、RTX2070が選択肢になります。RTX2070のほうがRadeon VIIより数万円程度安いので、合理的に判断するならばRadeon VIIよりもGeForce RTX2070のほうが得です。

それでも業界１位を嫌って業界第2位を応援したいユーザはこのRadeon VIIを選ぶようなので、合理的判断を抜きにして「AMDが好きだから」という判官びいきで買うのならRadeon VIIはおすすめだと思います。

Radeon VIIが評価できるのはRayTracing CoreやTensor Coreといったものを搭載せずに、シェーダ描画しているゲーム向けに純粋に特化したグラボに仕上がっていることです。

特にApexLegendsに関してはRTX2070を上回りRTX2080を少し下回る程度のフレームレートを叩き出しています。他のゲームだと微妙ですが、PUBGからApexへごっそり移動した現在ではPUBGのフレームレートは無視していいでしょうし、Apex重視ならこのRadeon VIIはおすすめできます。

AMD Radeon VIIチップを搭載した各メーカーのグラボはこちらで比較しています。

28位： NVIDIA GeForce GTX 1080

メーカー・モデル名	NVIDIA GeForce GTX 1080
CUDA Core数	2,560
ブーストクロック	1,733 MHz
メモリ容量	8GB
共有キャッシュ	2MB
単精度性能	8.8729 TFLOPS
倍精度性能	0.2772 TFLOPS
Tensor Core性能	0 FLOPS
TDP	180W
発売日	2017年4月

Ray Tracing性能	0 FLOPS
ベースクロック	1,607 MHz
ピクセル・レート	110.9 GPixel毎秒
テクスチャ・レート	277.2 GTexel毎秒
メモリタイプ	GDDR5X
メモリクロック	11 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	352 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Pascal (GeForce 1000 series)
コードネーム	GP104-410-A1
ファウンドリ	TSMC
プロセスルール	16nm
トランジスタ密度	22.9 MTr/mm²
トランジスタ数	72億
ダイサイズ	314mm²

SM数	20
無効化SM数	0
TMU数	160
ROPユニット数	64
Tensor Core数	0
RayTracing Core数	0
NVLink	4-waySLI対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	1,634
3DMark Solar Bay	19,623
3DMkark SteelNomad	1,625
3DMark Time Spy(DX12)	7,598
3DMark Night Raid(DX12)	81,404
3DMark Wild Life(DX12)	48,850
3DMark Fire Strike(DX11)	22,768
PassMark GPU G3D	15,346

GPUベンチマーク名	NVIDIA GeForce GTX 1080のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Port Royal (DX12+RT)	1,634
3DMark Solar Bay (Vulkan+RT)	19,623
3DMark Steel Nomad (DX12@4K)	1,625
3DMark Time Spy (DX12)	7,598
3DMark Night Raid (DX12@FHD)	81,404
3DMark Wild Life (Vulkan)	48,850
3DMark Fire Strike (DX11@FHD)	22,768
PassMark Videocard G3D	15,346
PassMark Videocard G2D	892
Userbenchmark (DX10)	123
Userbenchmark (DX9)	135
GPUベンチマーク総合平均スコア	24,077

GTX1070の150Wよりも30W発熱量が多くなっています。GTX1080は事実上Pascal世代最高性能のGPUです。実は1080Tiよりも1080のほうが高性能になる（例えばゲームにおいてフレームレートが高くなる）ことが多々あります。その理由として1080はコア数こそ1080Tiより少ないものの、動作周波数は1080のほうが高いからです。

この1080は980Tiと比較してどうなのかという有名な論点があります。これについては答えが出ています。基本的にグラフィックボードはCUDA Coreと呼ばれる整数・浮動小数演算器のコア数が多ければ多いほど速くなります。1080はコア数が980tiよりも少ないことが、「1080よりも980tiの方が速い」と一部の人達から未だに言われている根拠です。しかし、1080はコア数を減らした上で動作周波数を上げたので980Tiより高速になっています。この動作周波数が上がったことが1080が980Tiより高速になった一つの理由です。現在流行りのマルチコア化は「周波数を下げる」ことと「コアを増やす」ことを同時にやることです。ですが1080では少し逆戻りし、「周波数を上げて」「コアを減らす」ということをやりました。なぜこのようなことをしたかと言えば、多すぎるコア数を使い切れるゲームがないからです。それならば余分なコアを削って、その余裕ができた分だけ動作周波数を上げたのが1080です。

動作周波数を上げると１クロックあたりに電気信号が進める長さが短くなってしまい技術的に難しいのですが、コア数を減らすことで1080は動作周波数を上げることに成功しました。

GTX1080が高速になったもう一つの理由は、「倍精度」浮動小数点演算のコアを削って、その分だけ「単精度」浮動小数点演算のコアを増やしたことです。ゲームというのは「単精度」浮動小数点演算が重要であり、「倍精度」はそこまで必要としません。科学技術計算が「倍精度」かそれ以上を要求するのとはゲームは違います。ゲームでは64ビット用いる倍精度浮動小数点演算よりも、32ビット単精度浮動小数点演算用の演算器に半導体チップ面積を大きく割り当てた方が速くなるので、1080ではそのような最適化をしました。つまりはゲーム用途に徹底的に最適化したものが1080です。

GeForce GTX 1080で実行した各ゲームのフレームレートベンチマークでは、Apex Legendsで121fpsを実現していることから十分なフレームレートを叩き出していますが、PUBGでは87fpsしかなく60Hzモニタでゲームをするレベルのフレームレートに留まっています。グラフィック描画処理が重いゲームをやるのなら最低でもRTX2070、できればRTX2080以上を選択しておきたいところです。

NVIDIA GeForce GTX 1080チップを搭載した各メーカーのグラボはこちらで比較しています。

29位： NVIDIA GeForce RTX 2060 Super

メーカー・モデル名	NVIDIA GeForce RTX 2060 Super
CUDA Core数	2,176
ブーストクロック	1,650 MHz
メモリ容量	8GB
共有キャッシュ	4MB
単精度性能	7.180 TFLOPS
倍精度性能	0.224 TFLOPS
Tensor Core性能	57.44640 TFLOPS
TDP	175W
発売日	2019年7月

Ray Tracing性能	0 FLOPS
ベースクロック	1,470 MHz
ピクセル・レート	105.60 GPixel毎秒
テクスチャ・レート	224.40 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	14 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	448 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Turing (GeForce 2000 series)
コードネーム	TU106-410-A1
ファウンドリ	TSMC
プロセスルール	12nm
トランジスタ密度	24.3 MTr/mm²
トランジスタ数	108億
ダイサイズ	445mm²

SM数	34
無効化SM数	2
TMU数	136
ROPユニット数	64
Tensor Core数	272
RayTracing Core数	34
NVLink	非対応
3DMark Speed Way(DX12)	1,838
3DMark Port Royal(DX12)	5,073
3DMark Solar Bay	38,665
3DMkark SteelNomad	2,013
3DMark Time Spy(DX12)	8,792
3DMark Night Raid(DX12)	91,434
3DMark Wild Life(DX12)	51,578
3DMark Fire Strike(DX11)	22,497
PassMark GPU G3D	16,568

GPUベンチマーク名	NVIDIA GeForce RTX 2060 Superのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	1,838
3DMark Port Royal (DX12+RT)	5,073
3DMark Solar Bay (Vulkan+RT)	38,665
3DMark Steel Nomad (DX12@4K)	2,013
3DMark Time Spy (DX12)	8,792
3DMark Night Raid (DX12@FHD)	91,434
3DMark Wild Life (Vulkan)	51,578
3DMark Fire Strike (DX11@FHD)	22,497
PassMark Videocard G3D	16,568
PassMark Videocard G2D	879
Userbenchmark (DX10)	131
Userbenchmark (DX9)	122
GPUベンチマーク総合平均スコア	25,601

2019年7月発売。RTX2060SuperはRTX2070やRTX2060と同じTU106チップを用いていることから、RTX2060より上位でRTX2070より下位という位置づけです。しかし技術的に見れば、RTX2060の性能を引き上げたというよりも、RTX2070の性能を引き下げたという位置づけが妥当であり、RTX2060Superの性能はRTX2070に近いです。

まずTU106チップはStreaming Multiprocessorが全36コアあり、そのうち全て有効化し36コアにしたものがRTX2070、2つ無効化し34コアにしたものがRTX2060Super、6つ無効化し30コアにしたものがRTX2060です。つまりRTX2060から見たRTX2060Superのコア数は大幅に増えています。

コア数以外でも、RTX2060SuperがRTX2070により近い点があります。RTX2060のL2キャッシュサイズが3MBなのに対して、RTX2060SuperとRTX2070のL2キャッシュは両方とも4MBあります。

メモリの観点からもRTX2060SuperはRTX2070寄りです。RTX2060のメモリバス幅が192bitなのに対し、RTX2060SuperとRTX2070は256bitあります。これによりRTX2060SuperとRTX2070のメモリ帯域幅は448GB毎秒を達成しており、RTX2060の336MB毎秒を上回ります。

このように、RTX2060SuperのスペックはRTX2060よりもRTX2070により近くなっています。

それどころかRTX2070よりもRTX2060Superのほうが優れている点があります。それはクロック周波数です。コア数についてはRTX2070よりもRTX2060が少ないです。その代わりクロック周波数についてはRTX2060SuperがRTX2070を上回ります。リファレンスモデルにおけるRTX2060Superのベースクロック1,470MHz,ブーストクロック1,650MHzは、RTX2070のベースクロック1,410MHz,ブーストクロック1,620MHzを上回っています。

用途によってはコア数の多さよりもクロック周波数の高さが性能向上で有利になることがあります。ゲーム用途であってもPUBGのようにクロック周波数の高さがフレームレート向上に有利なゲームも存在します。主要用途を考慮してRTX2070かRTX2060Superどちらにするか選択するのがいいでしょう。

NVIDIA GeForce RTX 2060 Superチップを搭載した各メーカーのグラボはこちらで比較しています。

30位： NVIDIA GeForce RTX 2060

メーカー・モデル名	NVIDIA GeForce RTX 2060 6GB
CUDA Core数	1,920
ブーストクロック	1,680 MHz
メモリ容量	6GB
共有キャッシュ	3MB
単精度性能	6.4512 TFLOPS
倍精度性能	0.2016 TFLOPS
Tensor Core性能	51.60960 TFLOPS
TDP	160W
発売日	2019年1月

Ray Tracing性能	0 FLOPS
ベースクロック	1,365 MHz
ピクセル・レート	80.64 GPixel毎秒
テクスチャ・レート	201.60 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	14 GT毎秒
メモリバス幅	192bit
メモリ帯域幅	336 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Turing (GeForce 2000 series)
コードネーム	TU106-200-KA-A1
ファウンドリ	TSMC
プロセスルール	12nm
トランジスタ密度	25.0 MTr/mm²
トランジスタ数	136億
ダイサイズ	445mm²

SM数	30
無効化SM数	6
TMU数	120
ROPユニット数	48
Tensor Core数	240
RayTracing Core数	30
NVLink	非対応
3DMark Speed Way(DX12)	1,396
3DMark Port Royal(DX12)	4,134
3DMark Solar Bay	34,188
3DMkark SteelNomad	1,725
3DMark Time Spy(DX12)	7,571
3DMark Night Raid(DX12)	84,881
3DMark Wild Life(DX12)	46,783
3DMark Fire Strike(DX11)	19,768
PassMark GPU G3D	14,122

GPUベンチマーク名	NVIDIA GeForce RTX 2060 6GBのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Speed Way (DX12+RT)	1,396
3DMark Port Royal (DX12+RT)	4,134
3DMark Solar Bay (Vulkan+RT)	34,188
3DMark Steel Nomad (DX12@4K)	1,725
3DMark Time Spy (DX12)	7,571
3DMark Night Raid (DX12@FHD)	84,881
3DMark Wild Life (Vulkan)	46,783
3DMark Fire Strike (DX11@FHD)	19,768
PassMark Videocard G3D	14,122
PassMark Videocard G2D	746
Userbenchmark (DX10)	107
Userbenchmark (DX9)	113
GPUベンチマーク総合平均スコア	22,242

1世代前のGTX1070と同じCUDA Core数を持ちますが、性能がほとんど向上していません。しかもTDPを10W上乗せしてTDP160Wにしてこの性能ですから、事実上消費電力量をアップさせて達成した性能向上に見えます。

消費電力が増えたことで補助電源も8ピンになっています。GTX1070では補助電源は6ピン×1でした。6ピン補助電源は最大で75Wを供給すると規格化されています（実際はもっと多くの電力を取り出せますが規格で制限しています）。つまりマザーボードからの供給電力75Wと、6ピン補助電源の75Wでは150W止まりであり、RTX2060のTDP160Wの発熱量（消費電力はTDPより大きくなる）をまかないきれないためRTX2060では8ピン補助電源となりました。8ピン補助電源では最大150Wが規格化されているため、マザーボードからの75Wと合算して225Wもの電力供給があることになり、オーバークロックするとしたらかなり電力に余裕があります。

GTX1070と比較してほとんど性能向上していない理由は、RayTracingCoreやTensorCoreを搭載してしまったためゲーム用演算回路が1世代前からほぼ増加しなかったからです。ユーザーが求めていない機能をメーカーの独善で搭載してしまい失敗した典型例の一つになります。

GeForce RTX 2060で各ゲームを実行したフレームレートベンチマーク結果は非常に興味深い結果です。まずGTX1080よりもフレームレートで勝っているゲームもあれば、RTX2060が負けているゲームもあります。

GTX1080比でRTX2060のフレームレートが大きく下がったのがApex Legendsです。100fps割れしています。GTX1080では120fps超していたので大きな下落です。またApex LegendsにおいてはGTX1070TiのフレームレートよりもRTX2060が下です。

一方でGTX1080よりもフレームレート数が向上したのがPUBGです。RTX2060では102fpsになっており、GTX1080の87fpsから増加し100fps台に乗っています。

このような結果になったのはRTX2060はCUDA Core数がGTX1080よりも少ないものの、リファレンスモデルのクロックではGTX1080と同レベルを実現しているからです。さらに補助電源8ピン×1による225Wの電力供給に余裕があるためファクトリーオーバークロックされたオリジナルファンモデルのグラフィックボードだとコア数が少ないRTX2060がGTX1080より有利になります。1コアあたりの性能の高さがRTX2060でPUBGのフレームレートが伸びた要因です。

このようにRTX2060ではゲームによって大きく差がつくので、どのゲームをやるかでGPUを選択する必要があります。

NVIDIA GeForce RTX 2060チップを搭載した各メーカーのグラボはこちらで比較しています。

31位： AMD Radeon RX 5700 XT

メーカー・モデル名	AMD Radeon RX 5700 XT
SP数	2,560
ブーストクロック	1,905 MHz
メモリ容量	8GB
共有キャッシュ	4MB
単精度性能	9.754 TFLOPS
倍精度性能	0.6096 TFLOPS
Tensor Core性能	0 FLOPS
TDP	225W
発売日	2019年7月

Ray Tracing性能	0 FLOPS
ベースクロック	1,605 MHz
ピクセル・レート	121.9 GPixel毎秒
テクスチャ・レート	304.8 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	14 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	448 GB毎秒
接続規格	PCIe 4.0
アーキテクチャ	RDNA 1.0 (Radeon RX 5000 series)
コードネーム	Navi 10 XT
ファウンドリ	TSMC
プロセスルール	7nm
トランジスタ密度	41.0 MTr/mm²
トランジスタ数	103億
ダイサイズ	251mm²

Compute Unit数	40
無効化CU数	0
TMU数	160
ROPユニット数	64
Tensor Core数	0
RayTracing Core数	0
Multi GPU	2-way対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	―
3DMark Solar Bay	―
3DMkark SteelNomad	2,135
3DMark TimeSpy(DX12)	9,401
3DMark NightRaid(DX12)	103,481
3DMark Wild Life(DX12)	60,371
3DMark FireStrike(DX11)	27,488
PassMark GPU G3D	16,909

GPUベンチマーク名	AMD Radeon RX 5700 XTのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Steel Nomad (DX12@4K)	2,135
3DMark Time Spy (DX12)	9,401
3DMark Night Raid (DX12@FHD)	103,481
3DMark Wild Life (Vulkan)	60,371
3DMark Fire Strike (DX11@FHD)	27,488
PassMark Videocard G3D	16,909
PassMark Videocard G2D	951
Userbenchmark (DX10)	109
Userbenchmark (DX9)	139
GPUベンチマーク総合平均スコア	31,953

Radeon RX 5700XTはRadeon VIIより2ランク下のGPUとして投入されたAMD製GPUです。

RX5700XTは単精度32bit(FP32)演算器を2560コア搭載しています。2304コアのRTX2070より多く、2944コアのRTX2080より少ないです。

コア数だけ見ればRTX2070とRTX2080の中間にRadeon RX 5700XTが位置するように思えます。

しかし実際はGeForce RTX 2060より下のフレームレート性能です。

RX5700XTはGeForce RTX 2070のカウンターパートとなることを想定して投入されました。しかしAMD RadeonはNVIDIAよりも技術力で大きく劣っているため「対抗馬として想定しているGeForceモデルよりワンランク下のGPUに負ける」という傾向が続いており、RX5700XTも同じくRTX2060より下の性能になりました。

RX590でも勝てなかったGTX1070に勝てたのがRX5700XTの大きな進歩です。

そしてあまり注目されていないPCIe 4.0対応ですがこれには理由があります。GPUをコプロセッサとして使うGPGPU用途はPCIe 4.0の恩恵を大きく受けることができます。

一方でゲーム用途ではGPU1基ならPCIe3.0×8(64Gbps)の帯域があれば十分であることがわかっています。PCIe3.0×16(128Gbps)と×8(64Gbps)でどれほどフレームレート性能が変わるのか海外でもよく検証されていますが、結果はほぼ同じフレームレートで誤差の範囲内です。

ここでレーン数を更に少なくしてPCIe3.0×4(32Gbps)接続のGPUになると大きくフレームレートが落ちます。バスの帯域幅がボトルネックになっているためです。これは外付けのGPUをThunderbolt 3(40Gbps)で接続するとGPU本来の性能が出せずにフレームレートが下がるのと同じです。ゲーム用途のGPUではThunderbolt 3のような40Gbpsでは足りませんが64Gbpsもあれば十分です。つまりCPU管理のPCIe3.0×16の通信規格でSLI構成する場合は2-wayが限界です。

この点、PCIe4.0対応なら4-way SLIも可能になります。CPU管理のPCIe4.0のレーン数が16だと仮定してもPCIe4.0×4だけで64Gbpsもの帯域幅が得られるからです。4レーンでもフレームレートが落ちないとなれば4-way SLIも可能です。

ただゲームにおいて必要となるのはGPU×2くらいでせいぜい2-wayのSLI構成です。それならPCIe3.0×8の帯域幅でも十分だということでPCIe4.0接続のGPUはゲーマーにあまりアピールしにくい要素だったのでRadeon RX5700でもそれほど強調されていません。

しかしGPGPUとしての用途だったらPCIe4.0接続対応は大きなメリットがあるので積極的にPCIe4.0対応のGPUを採用する動機づけがあります。

AMD Radeon RX 5700 XTチップを搭載した各メーカーのグラボはこちらで比較しています。

派生モデル:AMD Radeon RX 5700 XT 50th Anniversary Edition

メーカー・モデル名	AMD Radeon RX 5700 XT 50th Anniv.
SP数	2,560
ブーストクロック	1,980 MHz
メモリ容量	8GB
共有キャッシュ	4MB
単精度性能	10.138 TFLOPS
倍精度性能	0.6336 TFLOPS
Tensor Core性能	0 FLOPS
TDP	235W
発売日	2019年7月

Ray Tracing性能	0 FLOPS
ベースクロック	1,680 MHz
ピクセル・レート	126.7 GPixel毎秒
テクスチャ・レート	316.8 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	14 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	448 GB毎秒
接続規格	PCIe 4.0
アーキテクチャ	RDNA 1.0 (Radeon RX 5000 series)
コードネーム	Navi 10 XTX
ファウンドリ	TSMC
プロセスルール	7nm
トランジスタ密度	41.0 MTr/mm²
トランジスタ数	103億
ダイサイズ	251mm²

Compute Unit数	40
無効化CU数	0
TMU数	160
ROPユニット数	64
Tensor Core数	0
RayTracing Core数	0
Multi GPU	2-way対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	―
3DMark Solar Bay	―
3DMkark SteelNomad	―
3DMark TimeSpy(DX12)	9,205
3DMark NightRaid(DX12)	98,577
3DMark Wild Life(DX12)	―
3DMark FireStrike(DX11)	27,530
PassMark GPU G3D	16,505

RX5700XTから動作クロックを少し高めただけのGPUです。クロックを高めた分だけTDPが上昇しておりその他のスペックは全く同じです。クロックを引き上げても正常に動作するチップを選別しているので価格が少し高くなっています。

これはRX590とRX580の関係と非常に似ています。RX590はRX580のクロックを引き上げただけのモデルとして登場しました。コア数等他のスペックは同じでした。RX590とRX580どちらがメインストリームかといえば当然RX580です。

これはRX5700シリーズでも同じで、「RX5700XT」と「RX5700XT Anniversary Edition」のどちらがメインストリームかと言えば当然RX5700XTです。Compute Unitを増やして搭載するFP32演算器を増やしていればRX5700XTより大きく高性能になっていましたが、コア数は全く同じでクロックを引き上げただけなので「ほんの少しだけRX5700XTよりマシ」という出来に仕上がっています。

このAnniversary Editionは米国・カナダといった北米各国、英国を含んだドイツ・フランス等の欧州各国でのみ正規販売され日本国内では正規品として販売されません。

32位： NVIDIA GeForce GTX 1070 Ti

メーカー・モデル名	NVIDIA GeForce GTX 1070 Ti
CUDA Core数	2,432
ブーストクロック	1,683 MHz
メモリ容量	8GB
共有キャッシュ	2MB
単精度性能	8.1861 TFLOPS
倍精度性能	0.2558 TFLOPS
Tensor Core性能	0 FLOPS
TDP	180W
発売日	2017年11月

Ray Tracing性能	0 FLOPS
ベースクロック	1,607 MHz
ピクセル・レート	107.7 GPixel毎秒
テクスチャ・レート	256 GTexel毎秒
メモリタイプ	GDDR5
メモリクロック	8 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	256 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Pascal (GeForce 1000 series)
コードネーム	GP104-300-A1
ファウンドリ	TSMC
プロセスルール	16nm
トランジスタ密度	22.9 MTr/mm²
トランジスタ数	72億
ダイサイズ	314mm²

SM数	19
無効化SM数	1
TMU数	152
ROPユニット数	64
Tensor Core数	0
RayTracing Core数	0
NVLink	非対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	1,489
3DMark Solar Bay	18,032
3DMkark SteelNomad	1,471
3DMark Time Spy(DX12)	6,851
3DMark Night Raid(DX12)	77,792
3DMark Wild Life(DX12)	44,317
3DMark Fire Strike(DX11)	20,121
PassMark GPU G3D	14,627

GPUベンチマーク名	NVIDIA GeForce GTX 1070 Tiのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Port Royal (DX12+RT)	1,489
3DMark Solar Bay (Vulkan+RT)	18,032
3DMark Steel Nomad (DX12@4K)	1,471
3DMark Time Spy (DX12)	6,851
3DMark Night Raid (DX12@FHD)	77,792
3DMark Wild Life (Vulkan)	44,317
3DMark Fire Strike (DX11@FHD)	20,121
PassMark Videocard G3D	14,627
PassMark Videocard G2D	883
Userbenchmark (DX10)	110
Userbenchmark (DX9)	125
GPUベンチマーク総合平均スコア	22,596

CUDA Cores:2,423、ベースクロック1,607MHz、ブーストクロック1,683MHz、TDP180W

GTX1070TiはPascal世代のGPUの中でも遅れてでてきたモデルです。

GTX1080と1070無印の間を埋めるという意味もありますが、GTX1070Tiの特徴は「1コアあたりの性能の高さ」にあります。

まずCUDA Core数はGTX1080より少ないです。その点はGTX1080より劣っています。しかしGTX1070Tiリファレンスモデルのベースクロックは1,607MHzでありGTX1080と同じです。リファレンスモデルのブーストクロックはGTX1070Tiが1,683MHzしかなく、GTX1080のリファレンスモデルブーストクロック1,733MHzより劣っていますが、ASUS等の各グラボメーカから発売されているオリジナルファンモデルならベースクロックもブーストクロックもファクトリーオーバークロックされているため、CUDA Core数が少ない分だけGTX1070Tiはオーバークロックで有利です。

そのため結果的にGTX1080とほぼ変わりないフレームレートベンチマーク結果となっています。

GeForce GTX 1070Tiで各ゲームを実行したフレームレートベンチマーク結果で着目すべき点はPUBGのフレームレート88fpsがGTX1080無印の87fpsと同レベルだということです。この1fpsは誤差の範囲でしょうがPUBGに限るならばGTX1070TiはGTX1080と同程度のフレームレートを叩き出します。PUBGは計算すべきオブジェクトの数が少ないのでコア数は少なくてもいいからクロックを高くしたほうが有利であり、動作クロックがGTX1080と同程度のGTX1070TiはGTX1080と同じレベルのフレームレートになります。

一方でApex LegendsはGTX1070TiではGTX1080と比較してマイナス20fps程度の103fpsとなっています。Apex Legendsではコア数の多さが重要なのでこのような結果になります。

33位： AMD Radeon RX 5700

メーカー・モデル名	AMD Radeon RX 5700
SP数	2,304
ブーストクロック	1,725 MHz
メモリ容量	8GB
共有キャッシュ	4MB
単精度性能	7.949 TFLOPS
倍精度性能	0.4968 TFLOPS
Tensor Core性能	0 FLOPS
TDP	180W
発売日	2019年7月

Ray Tracing性能	0 FLOPS
ベースクロック	1,465 MHz
ピクセル・レート	110.4 GPixel毎秒
テクスチャ・レート	248.4 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	14 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	448 GB毎秒
接続規格	PCIe 4.0
アーキテクチャ	RDNA 1.0 (Radeon RX 5000 series)
コードネーム	Navi 10 XL
ファウンドリ	TSMC
プロセスルール	7nm
トランジスタ密度	41.0 MTr/mm²
トランジスタ数	103億
ダイサイズ	251mm²

Compute Unit数	36
無効化CU数	4
TMU数	144
ROPユニット数	64
Tensor Core数	0
RayTracing Core数	0
Multi GPU	2-way対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	―
3DMark Solar Bay	―
3DMkark SteelNomad	1,863
3DMark TimeSpy(DX12)	8,316
3DMark NightRaid(DX12)	91,384
3DMark Wild Life(DX12)	53,268
3DMark FireStrike(DX11)	24,595
PassMark GPU G3D	14,640

GPUベンチマーク名	AMD Radeon RX 5700のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Steel Nomad (DX12@4K)	1,863
3DMark Time Spy (DX12)	8,316
3DMark Night Raid (DX12@FHD)	91,384
3DMark Wild Life (Vulkan)	53,268
3DMark Fire Strike (DX11@FHD)	24,595
PassMark Videocard G3D	14,640
PassMark Videocard G2D	917
Userbenchmark (DX10)	96.6
Userbenchmark (DX9)	124
GPUベンチマーク総合平均スコア	28,784

Radeon VIIより3ランク下のグレードとして2019年5月に発表されたGPUです。

コア数はRadeon RX 590と同じです。つまりコア数を維持したままコア性能を引き上げたのがこのRX 5700です。RX580→RX590にかけてはコア数を維持したままクロックを引き上げただけでした。そして今回もRX590→RX5700にかけてコア数を維持したままクロックを引き上げたものになっています。

Radeon RX 5700のTDPはRadeon RX 590より低いTDP180Wです。Radeon RX 590がGeForce GTX 1660無印より下の性能だったことを鑑みると、RX5700がGeForce GTX1660無印より上の性能になったということは大きな前進です。

AMDとしてはRadeon VIIのカウンターパートはGeForce RTX2080無印、Radeon RX 5700XTのカウンターパートはGeForce RTX2070、Radeon RX 5700のカウンターパートはGeForce RTX 2060を想定しています。

しかし実際は、GeForce RTX 2080無印のカウンターパートとなることを意識して投入されたRadeon VIIはフレームレートベンチマークでRTX 2070未満のフレームレートしか出せていません。

このようにAMDのGPUは「本来カウンターパートとして想定しているGeForceモデルの1ランク下のモデルに負ける」ということが常態化しています。

つまりRadeon RX 5700を買うならGeForce RTX 2060のほうが得どころかGeForce GTX1070Tiでも十分です。

AMD Radeon RX 5700チップを搭載した各メーカーのグラボはこちらで比較しています。

34位： NVIDIA GeForce GTX 1070

メーカー・モデル名	NVIDIA GeForce GTX 1070
CUDA Core数	1,920
ブーストクロック	1,683 MHz
メモリ容量	8GB
共有キャッシュ	2MB
単精度性能	6.4627 TFLOPS
倍精度性能	0.2019 TFLOPS
Tensor Core性能	0 FLOPS
TDP	150W
発売日	2016年6月/2018年12月

Ray Tracing性能	0 FLOPS
ベースクロック	1,506 MHz
ピクセル・レート	107.7 GPixel毎秒
テクスチャ・レート	201.9 GTexel毎秒
メモリタイプ	GDDR5/GDDR5X
メモリクロック	8 GT毎秒
メモリバス幅	256bit
メモリ帯域幅	256 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Pascal (GeForce 1000 series)
コードネーム	GP104-200-A1
ファウンドリ	TSMC
プロセスルール	16nm
トランジスタ密度	22.9 MTr/mm²
トランジスタ数	72億
ダイサイズ	314mm²

SM数	15
無効化SM数	5
TMU数	120
ROPユニット数	64
Tensor Core数	0
RayTracing Core数	0
NVLink	4-waySLI対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	1,244
3DMark Solar Bay	15,798
3DMkark SteelNomad	1,341
3DMark Time Spy(DX12)	6,094
3DMark Night Raid(DX12)	71,862
3DMark Wild Life(DX12)	40,257
3DMark Fire Strike(DX11)	18,715
PassMark GPU G3D	13,501

GPUベンチマーク名	NVIDIA GeForce GTX 1070のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Port Royal (DX12+RT)	1,244
3DMark Solar Bay (Vulkan+RT)	15,798
3DMark Steel Nomad (DX12@4K)	1,341
3DMark Time Spy (DX12)	6,094
3DMark Night Raid (DX12@FHD)	71,862
3DMark Wild Life (Vulkan)	40,257
3DMark Fire Strike (DX11@FHD)	18,715
PassMark Videocard G3D	13,501
PassMark Videocard G2D	857
Userbenchmark (DX10)	96
Userbenchmark (DX9)	104
GPUベンチマーク総合平均スコア	20,780

1,920コア単精度5.783TFlops、倍精度0.181TFlops TDP150W

Displayport 4K対応。HDMI2.0対応。PCI Express 3.0 x 16。最大同時表示画面数４画面。

1070になるとTDPは150Wになり、1060より発熱量が30W上昇します。しかしこれはあまり大きな上昇幅ではありません。1050Tiの75Wから1060の120Wのほうが大きな上昇幅です。

GeForce GTX 1070を使った各ゲームでのフレームレートベンチマーク結果では最も重いゲームに属するPUBGでも80fpsを実現しています。60Hzモニタで使うなら十分な性能です。Apex LegendsはGTX1080では120fps近いフレームレートがありましたがGTX1070では91fpsまで落ちています。これらのゲームで120fps以上を求めるユーザだとGTX1070は少し役不足かもしれません。ただし、軽いことで有名なFortniteは120fps以上をキープしているのでゲームによってはGTX1070でも十分です。

NVIDIA GeForce GTX 1070チップを搭載した各メーカーのグラボはこちらで比較しています。

35位： NVIDIA GeForce GTX 1660 Ti

メーカー・モデル名	NVIDIA GeForce GTX 1660 Ti
CUDA Core数	1,536
ブーストクロック	1,770 MHz
メモリ容量	6GB
共有キャッシュ	1.5MB
単精度性能	5.43744 TFLOPS
倍精度性能	0.16992 TFLOPS
Tensor Core性能	0 FLOPS
TDP	120W
発売日	2019年2月

Ray Tracing性能	0 FLOPS
ベースクロック	1,500 MHz
ピクセル・レート	72.00 GPixel毎秒
テクスチャ・レート	144.00 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	12 GT毎秒
メモリバス幅	192bit
メモリ帯域幅	288.0 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Turing (GeForce 1600 series)
コードネーム	TU116-400-A1
ファウンドリ	TSMC
プロセスルール	12nm
トランジスタ密度	23.2 MTr/mm²
トランジスタ数	66億
ダイサイズ	284mm²

SM数	24
無効化SM数	0
TMU数	96
ROPユニット数	48
Tensor Core数	0
RayTracing Core数	0
NVLink	非対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	1,657
3DMark Solar Bay	20,461
3DMkark SteelNomad	1,309
3DMark Time Spy(DX12)	6,378
3DMark Night Raid(DX12)	75,482
3DMark Wild Life(DX12)	39,457
3DMark Fire Strike(DX11)	16,605
PassMark GPU G3D	11,869

GPUベンチマーク名	NVIDIA GeForce GTX 1660 Tiのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Port Royal (DX12+RT)	1,657
3DMark Solar Bay (Vulkan+RT)	20,461
3DMark Steel Nomad (DX12@4K)	1,309
3DMark Time Spy (DX12)	6,378
3DMark Night Raid (DX12@FHD)	75,482
3DMark Wild Life (Vulkan)	39,457
3DMark Fire Strike (DX11@FHD)	16,605
PassMark Videocard G3D	11,869
PassMark Videocard G2D	706
Userbenchmark (DX10)	87.6
Userbenchmark (DX9)	95.1
GPUベンチマーク総合平均スコア	19,478

1,536コア単精度5.437TFlops、倍精度0.1699TFlops TDP120W

2019年発売なのに2016年発売のGTX1070無印よりもゲーム性能が低い微妙なチップです。レイトレーシング専用の演算回路が非搭載である点は評価できますが、レイトレーシングコアを削った割には性能が伸びていません。RTX2080TiからRayTracingCoreやTensorCoreといった一般的なゲーマーに不要な演算回路を全面的に削り、その空いた面積をゲーム用の演算用回路に置き換えたチップがリリースされるまで待ったほうがいいくらいの出来です。

NVIDIA GeForce GTX 1660 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

36位： NVIDIA GeForce GTX 1660 Super

メーカー・モデル名	NVIDIA GeForce GTX 1660 Super
CUDA Core数	1,408
ブーストクロック	1,785 MHz
メモリ容量	6GB
共有キャッシュ	1.5MB
単精度性能	5.02700 TFLOPS
倍精度性能	0.15708 TFLOPS
Tensor Core性能	0 FLOPS
TDP	125W
発売日	2019年10月

Ray Tracing性能	0 FLOPS
ベースクロック	1,530 MHz
ピクセル・レート	73.44 GPixel毎秒
テクスチャ・レート	134.64 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	14 GT毎秒
メモリバス幅	192bit
メモリ帯域幅	336.0 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Turing (GeForce 1600 series)
コードネーム	TU116-300-A1
ファウンドリ	TSMC
プロセスルール	12nm
トランジスタ密度	23.2 MTr/mm²
トランジスタ数	66億
ダイサイズ	284mm²

SM数	22
無効化SM数	2
TMU数	88
ROPユニット数	48
Tensor Core数	0
RayTracing Core数	0
NVLink	非対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	1,563
3DMark Solar Bay	19,257
3DMkark SteelNomad	1,279
3DMark Time Spy(DX12)	6,086
3DMark Night Raid(DX12)	73,975
3DMark Wild Life(DX12)	38,824
3DMark Fire Strike(DX11)	16,155
PassMark GPU G3D	12,768

GPUベンチマーク名	NVIDIA GeForce GTX 1660 Superのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Port Royal (DX12+RT)	1,563
3DMark Solar Bay (Vulkan+RT)	19,257
3DMark Steel Nomad (DX12@4K)	1,279
3DMark Time Spy (DX12)	6,086
3DMark Night Raid (DX12@FHD)	73,975
3DMark Wild Life (Vulkan)	38,824
3DMark Fire Strike (DX11@FHD)	16,155
PassMark Videocard G3D	12,768
PassMark Videocard G2D	821
Userbenchmark (DX10)	87.1
Userbenchmark (DX9)	88.8
GPUベンチマーク総合平均スコア	20,037

1,408コア、ブーストクロック1,785MHz

このGeForce GTX 1660 Superは、GeForce GTX 1660とコア数も、リファレンスモデルのクロック周波数も一緒ですが、メモリ帯域がGTX1660より強化されています。たったそれだけの違いしかありません。

既にGeForce GTX 1660を持っている人が、このGeForce GTX 1660 Superに買い換える必要性は全くありません。これからGeForce GTX 1660を買うくらいなら、代わりにこのGeForce GTX 1660 Superを買ったほうがいいくらいの位置づけです。

NVIDIA GeForce GTX 1660 Superチップを搭載した各メーカーのグラボはこちらで比較しています。

37位： NVIDIA GeForce GTX 1660

メーカー・モデル名	NVIDIA GeForce GTX 1660
CUDA Core数	1,408
ブーストクロック	1,785 MHz
メモリ容量	6GB
共有キャッシュ	1.5MB
単精度性能	5.02700 TFLOPS
倍精度性能	0.15708 TFLOPS
Tensor Core性能	0 FLOPS
TDP	120W
発売日	2019年10月

Ray Tracing性能	0 FLOPS
ベースクロック	1,530 MHz
ピクセル・レート	73.44 GPixel毎秒
テクスチャ・レート	134.64 GTexel毎秒
メモリタイプ	GDDR5
メモリクロック	8 GT毎秒
メモリバス幅	128bit
メモリ帯域幅	192.0 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Turing (GeForce 1600 series)
コードネーム	TU116-300-A1
ファウンドリ	TSMC
プロセスルール	12nm
トランジスタ密度	23.2 MTr/mm²
トランジスタ数	66億
ダイサイズ	284mm²

SM数	22
無効化SM数	2
TMU数	88
ROPユニット数	48
Tensor Core数	0
RayTracing Core数	0
NVLink	非対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	1,465
3DMark Solar Bay	18,090
3DMkark SteelNomad	1,065
3DMark Time Spy(DX12)	5,455
3DMark Night Raid(DX12)	65,774
3DMark Wild Life(DX12)	33,532
3DMark Fire Strike(DX11)	14,150
PassMark GPU G3D	11,725

GPUベンチマーク名	NVIDIA GeForce GTX 1660のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Port Royal (DX12+RT)	1,465
3DMark Solar Bay (Vulkan+RT)	18,090
3DMark Steel Nomad (DX12@4K)	1,065
3DMark Time Spy (DX12)	5,455
3DMark Night Raid (DX12@FHD)	65,774
3DMark Wild Life (Vulkan)	33,532
3DMark Fire Strike (DX11@FHD)	14,150
PassMark Videocard G3D	11,725
PassMark Videocard G2D	798
Userbenchmark (DX10)	71.8
Userbenchmark (DX9)	87
GPUベンチマーク総合平均スコア	18,313

1,408コア、OC無ブーストクロック1,785MHz、5.027TFlops、TDP120W

1世代前のGTX1060よりは高性能です。それも当然であり、1060では6ピンの補助電源×1が標準的でしたが、Turing世代のGTX1660では8ピン×1の補助電源が標準的になっています(ごく一部6ピン×1のモデルが存在する)。このグラボを買うなら1世代前の1070か、Turing世代の1660Tiをおすすめします。1660Tiは1660よりCUDAコア数を増やしているもののTDP値は同じであり補助電源も8ピン×1で変化ありません。TDP値が120W級で同じでしかも補助電源も同じなら、1660よりも1660Tiのほうが価格さえ気にしなければメリットが大きいです。

NVIDIA GeForce GTX 1660チップを搭載した各メーカーのグラボはこちらで比較しています。

38位： AMD Radeon RX 5600 XT

メーカー・モデル名	AMD Radeon RX 5600 XT
SP数	2,304
ブーストクロック	1,750 MHz
メモリ容量	6GB
共有キャッシュ	3MB
単精度性能	8.066 TFLOPS
倍精度性能	0.504 TFLOPS
Tensor Core性能	0 FLOPS
TDP	150~160W
発売日	2020年1月

Ray Tracing性能	0 FLOPS
ベースクロック	1,375 MHz
ピクセル・レート	112 GPixel毎秒
テクスチャ・レート	252 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	14 GT毎秒
メモリバス幅	192bit
メモリ帯域幅	288~336 GB毎秒
接続規格	PCIe 4.0
アーキテクチャ	RDNA 1.0 (Radeon RX 5000 series)
コードネーム	Navi 10 XLE
ファウンドリ	TSMC
プロセスルール	7nm
トランジスタ密度	41.0 MTr/mm²
トランジスタ数	103億
ダイサイズ	251mm²

Compute Unit数	36
無効化CU数	4
TMU数	144
ROPユニット数	64
Tensor Core数	0
RayTracing Core数	0
Multi GPU	非対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	―
3DMark Solar Bay	―
3DMkark SteelNomad	1,669
3DMark TimeSpy(DX12)	7,589
3DMark NightRaid(DX12)	87,497
3DMark Wild Life(DX12)	49,669
3DMark FireStrike(DX11)	22,272
PassMark GPU G3D	13,833

GPUベンチマーク名	AMD Radeon RX 5600 XTのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Steel Nomad (DX12@4K)	1,669
3DMark Time Spy (DX12)	7,589
3DMark Night Raid (DX12@FHD)	87,497
3DMark Wild Life (Vulkan)	49,669
3DMark Fire Strike (DX11@FHD)	22,272
PassMark Videocard G3D	13,833
PassMark Videocard G2D	912
Userbenchmark (DX10)	91.2
Userbenchmark (DX9)	117
GPUベンチマーク総合平均スコア	27,316

このRadeon RX 5600 XTはRadeon RX 5700と同じ「Navi 10」チップを使っているため、Radeon RX 5700をダウングレードした位置づけになります。

Radeon RX 5600 XTのCompute Unite数(NVIDIAでいうところのStreaming Multiprocessor数)は36基であり、Radeon RX 5700と全く同じです。その結果、Stream Processor数(NVIDIAでいうところのCUDA Core数)が2304基となっており、これもRadeon RX 5700と全く同じです。つまりコア数としてはRadeon RX 5700もRadeon RX 5600XTも同じです。

AMD Radeon RX 5600 XTチップを搭載した各メーカーのグラボはこちらで比較しています。

39位： NVIDIA GeForce GTX 1650 Super

メーカー・モデル名	NVIDIA GeForce GTX 1650 Super
CUDA Core数	1,280
ブーストクロック	1,725 MHz
メモリ容量	4GB
共有キャッシュ	1.5MB
単精度性能	4.41600 TFLOPS
倍精度性能	0.13800 TFLOPS
Tensor Core性能	0 FLOPS
TDP	100W
発売日	2019年11月

Ray Tracing性能	0 FLOPS
ベースクロック	1,530 MHz
ピクセル・レート	48.96 GPixel毎秒
テクスチャ・レート	122.40 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	12 GT毎秒
メモリバス幅	128bit
メモリ帯域幅	192.0 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Turing (GeForce 1600 series)
コードネーム	TU116-250-KA-A1
ファウンドリ	TSMC
プロセスルール	12nm
トランジスタ密度	23.2 MTr/mm²
トランジスタ数	66億
ダイサイズ	284mm²

SM数	20
無効化SM数	4
TMU数	80
ROPユニット数	32
Tensor Core数	0
RayTracing Core数	0
NVLink	非対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	―
3DMark Solar Bay	―
3DMkark SteelNomad	352
3DMark Time Spy(DX12)	4,701
3DMark Night Raid(DX12)	59,637
3DMark Wild Life(DX12)	29,952
3DMark Fire Strike(DX11)	12,237
PassMark GPU G3D	10,075

GPUベンチマーク名	NVIDIA GeForce GTX 1650 Superのベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Steel Nomad (DX12@4K)	352
3DMark Time Spy (DX12)	4,701
3DMark Night Raid (DX12@FHD)	59,637
3DMark Wild Life (Vulkan)	29,952
3DMark Fire Strike (DX11@FHD)	12,237
PassMark Videocard G3D	10,075
PassMark Videocard G2D	759
Userbenchmark (DX10)	64.7
Userbenchmark (DX9)	76.8
GPUベンチマーク総合平均スコア	18,538

このGeForce GTX 1650 Superは、GeForce GTX 1650と比較し大幅に性能向上が図られています。

GeForce GTX 1660 SuperはGeForce GTX 1660に毛が生えた程度の差すらありませんでしたが、GeForce GTX 1650 SuperはGeForce GTX 1650と比較しCUDA Core数が+384増えており合計1,280コアです。

GeForce GTX 1650 SuperがGTX1650と比較して大幅に高性能になった理由は、GeForce GTX 1650 SuperのチップはTU116であり、GeForce GTX 1660,1660Super,1660Tiと同じものを採用しているからです。

つまりGeForce GTX 1650 SuperはGeForce GTX 1650のアップグレード版というよりも、GeForce GTX 1660をダウングレードし、性能を若干低くしたというのが正しい位置づけです。

40位： AMD Radeon RX 590

GPUベンチマーク名	AMD Radeon RX 590のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Steel Nomad (DX12@4K)	1,081
3DMark Time Spy (DX12)	4,780
3DMark Night Raid (DX12@FHD)	62,220
3DMark Wild Life (Vulkan)	31,304
3DMark Fire Strike (DX11@FHD)	16,526
PassMark Videocard G3D	9,652
PassMark Videocard G2D	811
Userbenchmark (DX10)	66.9
Userbenchmark (DX9)	79.6
GPUベンチマーク総合平均スコア	20,216

2,304コア、OC無ベースクロック1,469MHz、ブーストクロック1,545MHz、7.120TFlops、TDP225W

RX580と同じコア数のまま動作周波数を引き上げた焼き直し版として2018年末に発売されたGPUです。AMDにとって2018年末～2019年初頭時点での本命はRadeon VIIであり、このRX590は第5世代RXチップの在庫処分目的でリリースされました。

AMDの決算発表を見るとわかりますが、2017年の仮想通貨ブームでAMDはRadeon RXチップを大量生産しました。しかし2018年に仮想通貨が暴落しブームが終了したことでチップが在庫として大量に積み上がってしまいました。その在庫をさばくためにRX580の焼き直し品としてこのRX590が企画されたわけです。

そのおかげでAMDの2018年1月～12月の通年決算は純利益（最終利益）が赤字でした。2019年1月～3月に順調にRadeon RXのチップ在庫を解消したことで、2019年1月～3月決算は純利益1600万ドルで一応黒字になっているのでこの在庫処分の効果がでているようです（ちなみにIntelは同期間の純利益40億ドルの黒字）。

このRX590は明確なコンセプトがあって企画されたものではなく単に在庫品が損失に化けてしまうのを防止するのが目的でありビジョンが全くないので、ゲーミング性能は1660無印にも負けており微妙な出来です。しかしPUBGでは大差で1660無印に負けていても、Apex Legendsでは健闘しているのでApexをするなら悪くないグラボです。

Radeon RX 590で各ゲームを実行したときのフレームレートベンチマーク結果ではグラフィック処理が軽いと言われてるFortniteでも100fpsを超える程度で、Apex Legendsも95fpsなので悪くはない数字です。しかしPUBGではRX 590をもってしても75fpsなので、コア数をいくら増やしてもクロックを増やせないGPUの限界がここに現れています。

AMD Radeon RX 590チップを搭載した各メーカーのグラボはこちらで比較しています。

41位： NVIDIA GeForce GTX 1060

メーカー・モデル名	NVIDIA GeForce GTX 1060
CUDA Core数	1,280
ブーストクロック	1,708 MHz
メモリ容量	6GB
共有キャッシュ	1.5MB
単精度性能	4.372480TFLOPS
倍精度性能	0.13664 TFLOPS
Tensor Core性能	0 FLOPS
TDP	120W
発売日	2017年4月

Ray Tracing性能	0 FLOPS
ベースクロック	1,506 MHz
ピクセル・レート	82.0 GPixel毎秒
テクスチャ・レート	136.7 GTexel毎秒
メモリタイプ	GDDR5
メモリクロック	9 GT毎秒
メモリバス幅	192bit
メモリ帯域幅	216.0 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Pascal (GeForce 1000 series)
コードネーム	GP106-410-A1
ファウンドリ	TSMC
プロセスルール	16nm
トランジスタ密度	22.0MTr/mm²
トランジスタ数	44億
ダイサイズ	200mm²

SM数	10
無効化SM数	０
TMU数	80
ROPユニット数	48
Tensor Core数	0
RayTracing Core数	0
NVLink	非対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	838
3DMark Solar Bay	11,200
3DMkark SteelNomad	907
3DMark Time Spy(DX12)	4,203
3DMark Night Raid(DX12)	54,563
3DMark Wild Life(DX12)	28,855
3DMark Fire Strike(DX11)	13,131
PassMark GPU G3D	10,080

1,280コア単精度3.855TFlops、倍精度0.120TFlops TDP120W

GTX1060は補助電源不要のGTX1050Tiと比較してだいぶ高性能になりますがTDPが一気に120Wまで増えます。GTX1050Tiが75Wであることと比較するとかなり大きい発熱量です。

1060のようにTDP120Wになるとグラボ単体でのファンレス化は難しく、ファンレスの1060グラボは売られていません。ただし1060をファンレスで冷やすためのPCケースは発売予定があります。オランダStreacom社のDB6という製品であり1060の熱をケース側面まで運びファンレスで冷やすことができます。2017年6月に発表されましたがケースは未発売です。

GTX1060はフレームレート60fps程度でゲームをするゲーマーにはぴったりのGPUです。

GeForce GTX 1060で各ゲームを実行したフレームレートベンチマーク結果ではCoD Bo4やPUBGでも60~70fps台あります。GTX1060まで来ると、動作が軽いと言われているFortniteでさえもさすがに120fpsを割ってしまいます。Fortniteでフレームレート120fps超が欲しい場合はGTX1070が必要です。

NVIDIA GeForce GTX 1060チップを搭載した各メーカーのグラボはこちらで比較しています。

42位： AMD Radeon RX 5500 XT

メーカー・モデル名	AMD Radeon RX 5500 XT
SP数	1,408
ブーストクロック	1,845 MHz
メモリ容量	8GB/4GB
共有キャッシュ	2MB
単精度性能	5.196 TFLOPS
倍精度性能	0.3247 TFLOPS
Tensor Core性能	0 FLOPS
TDP	130W
発売日	2019年12月

Ray Tracing性能	0 FLOPS
ベースクロック	1,717 MHz
ピクセル・レート	59.04 GPixel毎秒
テクスチャ・レート	162.4 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	14 GT毎秒
メモリバス幅	128bit
メモリ帯域幅	224 GB毎秒
接続規格	PCIe 4.0
アーキテクチャ	RDNA 1.0 (Radeon RX 5000 series)
コードネーム	Navi 14 XTX
ファウンドリ	TSMC
プロセスルール	7nm
トランジスタ密度	40.5 MTr/mm²
トランジスタ数	64億
ダイサイズ	158mm²

Compute Unit数	22
無効化CU数	2
TMU数	88
ROPユニット数	32
Tensor Core数	0
RayTracing Core数	0
Multi GPU	非対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	―
3DMark Solar Bay	―
3DMkark SteelNomad	1,032
3DMark TimeSpy(DX12)	4,856
3DMark NightRaid(DX12)	60,852
3DMark Wild Life(DX12)	32,100
3DMark FireStrike(DX11)	14,387
PassMark GPU G3D	9,190

AMD Radeon RX 5500 XTチップを搭載した各メーカーのグラボはこちらで比較しています。

43位： AMD Radeon RX 580

2,304コア単精度5,792TFlops、倍精度Flops値不明 TDP185W

2017年4月リリースのGPU。Radeon RX 580で各ゲームを実行したときのフレームレートベンチマーク結果ではFortniteのフレームレートはGTX1060に若干負けています。Apex Legendsでも78fps止まりとなっており、GTX1060の80fpsと誤差の範囲だと思いますがほぼ同等です。PUBGでも若干RX580が負けています。このように比較してみると、全体的にGTX1060より少しだけ性能が低いことがわかります。Radeon RTX 580はGTX1060と同等か少し下というのが結論です。

AMD Radeon RX 580チップを搭載した各メーカーのグラボはこちらで比較しています。

44位： NVIDIA GeForce GTX 1650

メーカー・モデル名	NVIDIA GeForce GTX 1650
CUDA Core数	896
ブーストクロック	1,590 MHz
メモリ容量	4GB
共有キャッシュ	1MB
単精度性能	2.84928 TFLOPS
倍精度性能	0.08904 TFLOPS
Tensor Core性能	0 FLOPS
TDP	75W
発売日	2020年4月

Ray Tracing性能	0 FLOPS
ベースクロック	1,410 MHz
ピクセル・レート	45.12 GPixel毎秒
テクスチャ・レート	78.96 GTexel毎秒
メモリタイプ	GDDR6
メモリクロック	8 GT毎秒
メモリバス幅	128bit
メモリ帯域幅	192.0 GB毎秒
接続規格	PCIe 3.0
アーキテクチャ	Turing (GeForce 1600 series)
コードネーム	TU117
ファウンドリ	TSMC
プロセスルール	12nm
トランジスタ密度	23.5 MTr/mm²
トランジスタ数	47億
ダイサイズ	200mm²

SM数	14
無効化SM数	2
TMU数	56
ROPユニット数	32
Tensor Core数	0
RayTracing Core数	0
NVLink	非対応
3DMark Speed Way(DX12)	―
3DMark Port Royal(DX12)	―
3DMark Solar Bay	12,317
3DMkark SteelNomad	328
3DMark Time Spy(DX12)	3,548
3DMark Night Raid(DX12)	45,311
3DMark Wild Life(DX12)	22,602
3DMark Fire Strike(DX11)	9,542
PassMark GPU G3D	7,821

単精度896コア、倍精度56コア　ベースクロック1,485MHz、ブーストクロック1,665MHz、単精度浮動小数点演算性能2.984TFlops、倍精度浮動小数点演算性能0.09324TFlops、TDP75W

2019年4月にリリースされたGPUです。2017年にリリースされたGTX1050Tiの後継モデルになります。

コンセプトは「補助電源なしのTDP75Wの範囲内でどこまで性能を高めることができるか」です。これはGTX1050Tiも同じでありこのコンセプトは引き継がれています。

競合するモデルはRadeon RX 570です。コア数だけで比較するとRadeon RX 570の2,048コアはGTX1650の896コアを圧倒しています。しかし、Radeon RX 570はGTX1650よりも動作周波数が低い上に、浮動小数点演算器がNVIDIAよりもAMDのほうが劣っているため結果的に性能はほぼ互角になっています。

PUBGの性能は互角なのですが、描画すべきオブジェクトが少ない場所ではGTX1650のほうがフレームレートが伸びます。例えば屋内や市街地以外のエリアです。屋内のような場所だと視界の中で描画すべきオブジェクトが少なく、その限られたオブジェクトだけを描画すればいいのでコア数が少なく動作周波数が高いNVIDIA GeForce GTX1650がフレームレート性能で有利です。

しかしApexLegendsのようにオブジェクトが常時多く画面に表示されるようなゲームでは、それらのオブジェクトを並列して演算するためのコア数が多いRX570が有利です。

RX570は補助電源が最低でも6ピンが必要でオーバークロックモデルになると8ピンが必要になるほど高消費電力なので、少ないコア数でも高い性能を実現した1650をRX570より上位にしました。

NVIDIA GeForce GTX 1650チップを搭載した各メーカーのグラボはこちらで比較しています。

45位： AMD Radeon RX 570

2,048コア単精度4.784TFlops、倍精度Flops値不明 TDP150W

2017年4月リリースのGPUです。Apex LegendsやPUBGのフレームレートベンチマークではGTX1060に負けています。このRX570を選ぶならGTX1060のほうが高性能で安いですが、GTX1060は品薄なのでGeForceGTX1660を選ぶことをおすすめします。

AMD Radeon RX 570チップを搭載した各メーカーのグラボはこちらで比較しています。

46位： NVIDIA GeForce GTX 1050 Ti

768コア単精度1.981TFlops、倍精度0.062TFlops TDP75W

Displayport 4K対応。HDMI2.0 4K対応。最大同時表示画面数３画面。PCI Express 3.0 x 16

1050TiはTDPが75Wであり1060の120Wと比べてかなり低くなっており補助電源が不要です。そのため1050TiはファンレスGPUとして用いられることが多いです。

特殊なケースの力を借りずに、グラボ単体でファンレスにできてかつ最も高性能なものはこの1050Tiになります。

グラボ単体でのファンレスとしては台湾Palit社が製造し日本のドスパラが販売するKalmXシリーズが有名です。ドスパラから売られているNE5105T018G1-1070H (GeForce GTX1050Ti 4GB KalmX)は1050Ti搭載グラボの中でも特におすすめです。

また1050TiはオランダStreacom製のファンレスケースでも冷やすことができます。

例えばStreacomのMini ITXケースDB4が該当し、このケースはTDP75Wまでのグラボをファンレスで冷やすことができます。グラボの熱をヒートパイプでケース側面まで運び、ケース自体をヒートシンクとして冷却するタイプです。これが1050Tiでなく1060になってしまうとTDPが120Wと急増するため一気に難しくなります。

1050Tiは比較的容易にファンレス環境が作れる上に、PUBGレベルの重いゲームでも60fps前後で動作することからとても貴重なグラフィックボードです。

GeForce GTX 1050Tiを用いた各ゲームのフレームレートベンチマーク結果ではLoLについては問題なく120fpsの大台をクリアしています。Fortniteについては60Hzモニタでプレイするのであれば問題ない程度のフレームレート85fpsを達成しています。

しかしSiegeやApex Legendsをやるのにはたとえ60Hzモニタを前提としても役不足になります。PUBGだと52fpsであり60fpsの達成には程遠いです。

120fps以上を求めるのなら1050Tiは向きません。60fps程度あれば十分だというゲーマーかつ、それなりにグラフィック処理が軽いゲームに絞るのならGTX1050Tiでも十分です。

NVIDIA GeForce GTX 1050 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

47位： NVIDIA GeForce GTX 1050

640コア単精度1.733TFlops、倍精度0.054TFlops、リファレンスモデルのブーストクロック1,455MHz、TDP75W

GTX1050は2016年発売です。これも1050Tiと同じくTDP75Wの低発熱かつ低消費電力がコンセプトですが、各メーカーがあまりこの1050無印チップに力を入れてないのもあって各メーカーからのラインナップが微妙です。

間違いやすいのがGTX1050には2GBのVRAMを搭載したもの(CUDA Core 640)と、3GBのVRAMを搭載したもの(CUDA Core 768)の2種類があるところです。一般的に出回っているのは2GB品なので、「GTX1050といったらVRAM2GB品でCUDA Core 640コア」と見ておけば間違いありません。

1050Tiより1050が優れている点は「価格の安さ」しかありません。他の部分は全て1050Tiが優れています。

GeForce GTX 1050で各ゲームを実行したフレームレートベンチマーク結果ではFortniteが82fpsである以外は、Apex LegendsもPUBGも低いフレームレートに落ち着いています。全体的に1050Tiのフレームレートを綺麗にそのままフレームレートを低くシフトさせた結果になっています。ここまでCUDA Coreが少ないモデル帯になると、1050Tiからコア数が減ってもApex Legendsだけのフレームレートが落ち込むということはなく、等しくPUBGのフレームレートも下がっています。1050Tiと同じく1050もゲーム用としては極一部のタイトルに限られそうです。

NVIDIA GeForce GTX 1050チップを搭載した各メーカーのグラボはこちらで比較しています。

48位： AMD Radeon RX 560

1,024コア単精度2.406TFlops、倍精度Flops値不明 TDP60～80W

コア数やFlops性能でみればGTX1050やGTX1050Tiを上回っているのですが、実際のゲームフレームレートベンチマークではGTX1050TiどころかGTX1050も下回っているGPUです。Apex LegendsでもPUBGにおいてもGTX1050のフレームレートのほうが上です。

AMD Radeon RX 560チップを搭載した各メーカーのグラボはこちらで比較しています。

49位： AMD Radeon RX 550

640コア単精度1.211TFlops、倍精度0.075TFlops TDP50W

ゲーミング性能ではApex LegendsだとNVIDIA GeForce GT1030より少し低いフレームレートです。PUBGだとGT1030より若干高いフレームレート性能です。コア数は640で、GT1030の384コアより多いですが、1コアあたりの性能はGT1030のほうが優秀であるため性能面ではほぼ横並びになっています。

GT1030はTDP30Wしかないのでロープロファイルでありながらファンレスにしたり1スロット占有(ファン×1)にしたりできていますが、RX550はコア数を増やしているぶんだけ消費電力は大きく、ロープロファイルにしていてもファンが2つ付いていたり、ファンレスにできなかったり、1スロット占有にできなかったりと性能の割にグラボ本体が大型になってしまっています。総合的にみればGT1030のほうがおすすめです。

AMD Radeon RX 550チップを搭載した各メーカーのグラボはこちらで比較しています。

50位： NVIDIA GeForce GT 1030

384コア単精度0.942TFlops、倍精度0.029TFlops TDP30W

Displayport４K対応。HDMI2.0対応。PCI Express 3.0 x 16(接続スロットはx16だが実際の動作はx4)。最大同時表示画面数２画面。

オンボードグラフィクス(内蔵グラフィクス)であるIntel UHD Graphicsが３画面4Kで表示できる中、このグラボは２画面までしかできないので物足りなく感じますが、内蔵グラフィクスよりもこのグラボのほうがFlops値は高いです。つまり描画能力が高いので高いフレームレートでYoutubeやTwitch再生ができます。ExcelやWordの描画も明らかに軽くなるので、ゲームをやらず事務作業をする人にはこのグラボで十分だと思いますが、２画面より３画面あると格段に作業効率がアップするので、できれば1050Tiを使ったほうがいいかもしれません。1050Tiにもロープロファイルモデルは存在します。

このGT1030は「ロープロファイルかつ（ファンレス or 1スロット占有）」を実現できているため、コンパクト製を優先するユーザから支持が大きいです。

GeForce GT 1030で各ゲームを実行したフレームレートベンチマーク結果ではLoLのようなゲームはGT1030でも十分なフレームレートを叩き出しています。しかし他のゲームではフレームレート60fpsを大きく割って30fps近くまでしか出ていません。「ゲーム用途であっても60fpsあれば十分」と主張するゲーマーも存在しますが、彼らでも「さすがに30fpsでは無理」という共通認識を持っています。GT1030でゲーム用途は一部の軽いゲームに限られます。

NVIDIA GeForce GT 1030チップを搭載した各メーカーのグラボはこちらで比較しています。

51位： Intel UHD Graphics 630

FMA演算器192コア、ベースクロック350MHz、ブーストクロック1,250MHz、単精度0.48TFlops

第7世代～第9世代のIntel Core i9,i7,i5,i3プロセッサやPentium Goldプロセッサに搭載されている内蔵グラフィクス(Integrated GPU)です。内蔵グラフィクスはWord/Excelの処理くらいなら十分ですがゲーム用途だと不十分なので、現在内蔵グラフィクスで済ませている人がゲーム用グラボを購入する際の指標としてフレームレートベンチマークを掲載しておきます。

PUBGではGT1030を超えていますが全体的にみればGT1030より下でGT710より上のフレームレートになっています。内蔵グラフィクスより上のグラボを買う場合は最低でもGT1030からになります。

52位： NVIDIA GeForce GT 710

GPUベンチマーク名	NVIDIA GeForce GT 710のベンチマーク性能評価スコア値(グラフ長は母数を元にノーマライズ)
3DMark Time Spy (DX12)	194
3DMark Night Raid (DX12@FHD)	3,068
3DMark Wild Life (Vulkan)	1,538
3DMark Fire Strike (DX11@FHD)	795
PassMark Videocard G3D	625
PassMark Videocard G2D	213
Userbenchmark (DX10)	4.5
Userbenchmark (DX9)	4.48
GPUベンチマーク総合平均スコア	2,648

192コア単精度0.366TFlops、倍精度0.0153TFlops TDP19W

HDMI 1.4a対応。PCI Express 2.0×16～1(接続スロットが×16のモデルもあれば×1のモデルもある)。最大同時表示画面数3画面。

このGT710は「ロープロファイルかつファンレスかつ1スロット占有」を実現できている貴重なグラボです。これより1ランク上位のGT1030では「ファンレスかつ1スロット占有」を実現できないため、ファンレスと1スロット占有を両立したい場合はこのGT710一択になります。

このグラボにはゲーミング性能は期待できません。単精度浮動小数点数演算性能が0.366TFlopsしかなく、Intel Coreプロセッサに搭載されているオンボードグラフィックス(iGPU:内蔵グラフィックス)よりも低性能です。

このGT710は、Xeon-WやXeon Scalable Familyプロセッサのようにオンボードグラフィックスを搭載していないCPUを使う場合に「とりあえずディスプレイが映ればいい」用途でよく使われるGPUです。

GT1030では最大2画面表示まででしたが、GT710は3画面表示可能です（ただしそのうち1画面はアナログD-Sub接続になる）。描画性能はGT1030より大きく劣っているものの、同時接続画面数はGT710のほうが優れています。

NVIDIA GeForce GT 710チップを搭載した各メーカーのグラボはこちらで比較しています。

【総合平均スコア】複数のベンチマーク評価結果の平均値を計算し比較

GPUの性能を計測するベンチマークは多く存在します。有名どころだと3DMarkです。しかし3DMarkだけでもベンチマーク種類は非常に多く、他にもPassMark等が存在します。それぞれのスコアをグラフで眺めても、結局どのGPUが優れているのか優劣を比較しにくい問題があります。

また、単一のベンチマークでは「NVIDIA GeForceに有利」「AMD Radeonに有利」といった偏りが出てきます。多くのベンチマークの値を統合することが公平なベンチマークに繋がります。

そこで当サイトでは10種類のベンチマークスコアを正規化（ノーマライズ）した後に平均値を取り「総合平均ベンチマークスコア」を計算しています。

ある一つのベンチマークがAMD Radeonを贔屓しようとAMD Radeonのみ高いスコアがでるような水増し行為をしようとしても、平均値を取ることによって総合平均スコアは殆ど上下しないようになり「よりrobust」なスコアを得ることができます。

正規化する理由は、各ベンチマークごとにスコアの絶対水準がまちまちだからです。最大10万レベルのスコアがあるベンチマークもあれば最大1万レベルのスコアのベンチマークもあります。

異なるベンチマーク間のスコア比較において重要なことは「それぞれのベンチマークの中で上位にあるか下位にあるか」の情報を正確に平均値に反映することです。そのため平均値を取る前に正規化する必要があります。

ここでは100,000を最大値とし各ベンチマークごとに正規化した後に平均値を取っています。つまり総合平均ベンチマークスコアは高々100,000になります。

GPU(グラボ)名	総合平均GPU(グラボ)ベンチマーク性能評価スコア値
GeForce RTX 5090	98,779
GeForce RTX 4090	80,305
GeForce RTX 5080	77,417
GeForce RTX 5070 Ti	68,321
GeForce RTX 4080 Super	67,706
GeForce RTX 4080	67,267
GeForce RTX 4070 Ti Super	60,888
GeForce RTX 5070	58,630
GeForce RTX 4070 Ti	58,183
GeForce RTX 3090 Ti	56,182
GeForce RTX 4070 Super	54,986
Radeon RX 6950 XT	53,137
Radeon RX 6900 XT	51,348
GeForce RTX 3080 Ti	50,675
GeForce RTX 3090	50,119
GeForce RTX 4070	49,099
GeForce RTX 3080 12G	49,026
Radeon RX 6800 XT	47,634
GeForce RTX 3080 10G	45,761
GeForce RTX 3070 Ti	41,330
Radeon RX 6800	41,305
Radeon RX 5700 XT 50th Anniv.	40,216
GeForce RTX 4060 Ti 8GB	40,176
GeForce RTX 4060 Ti 16GB	39,897
NVIDIA TITAN RTX	39,081
GeForce RTX 2080 Ti	38,478
GeForce RTX 3070	38,130
Radeon RX 6750 XT	37,307
NVIDIA TITAN V	36,656
Radeon RX 6700 XT	36,143
GeForce RTX 3060 Ti	34,319
GeForce RTX 4060	34,278
NVIDIA TITAN Xp	34,192
Radeon RX 5700 XT	34,107
GeForce RTX 2080 Super	33,372
Radeon RX 6700	32,998
GeForce GTX 1080 Ti	32,373
Radeon VII	32,223
Radeon RX 6650 XT	31,944
GeForce RTX 2080	31,756
NVIDIA TITAN X	31,497
Radeon RX 6600 XT	31,373
Radeon RX 5700	30,776
GeForce RTX 2070 Super	30,509
Radeon RX 5600 XT	29,292
GeForce RTX 3060 12G	28,493
GeForce RTX 2060 Super	27,576
GeForce RTX 2070	27,509
GeForce GTX 1080	27,191
Radeon RX 6600	27,178
Radeon RX 5600	26,645
GeForce RTX 3060 8G	26,243
GeForce RTX 2060 12GB	26,103
GeForce GTX 1070 Ti	25,580
NVIDIA GTX TITAN X	25,144
GeForce RTX 2060 6GB	23,947
GeForce GTX 1070	23,573
GeForce GTX 1660 Super	22,537
GeForce RTX 3050 8G	22,278
Radeon RX 590	21,811
Radeon RX 5300	21,801
GeForce GTX 1660 Ti	21,770
Radeon RX 5500 XT	21,111
GeForce GTX 1660	20,653
GeForce GTX 1650 Super	20,552
Radeon RX 5500	20,548
Radeon RX 580	20,245
GeForce RTX 3050 6G	18,671
Radeon RX 570	18,408
GeForce GTX 1060	18,031
Radeon RX 6500 XT	17,936
GeForce GTX 1650	15,727
Radeon RX 6400	14,691
GeForce GTX 1050 Ti	13,608
GeForce GTX 1630	13,051
GeForce GTX 1050	12,547
Radeon RX 560	10,191
Radeon 540	9,152
Radeon RX 550	8,279
GeForce GT 1030 GDDR5	7,416
GeForce GT 1030 DDR4	6,300
GeForce GT 1010	3,898
Radeon 520	3,464
Radeon 530	3,085
GeForce GT 710	2,648

【ベンチマーク1】3DMark Speed Way (DirectX 12 Feature Level 12_2 + RayTracing 1.1 、 2560×1440)

3DMark Speed Wayは2022年10月にリリースされたベンチマークであり、DirectX12 Ultimate (Feature Level 12_2)に対応したベンチマークです。

このベンチマークで評価するにはGPUがレイトレーシングに対応していることが必須です。3DMark Port RoyalではDirectX RayTracing Tier 1.0対応でしたが、この3DMark Speed WayはRayTracing Tier 1.1に対応しています。

Windows版のみであり、解像度は2560×1440の描画でベンチマーク評価されます。

GPU(グラボ)名	3DMark Speed Way (DX12+RT)のベンチマーク性能評価スコア値
GeForce RTX 5090	14,579
GeForce RTX 4090	10,076
GeForce RTX 5080	9,315
GeForce RTX 5070 Ti	7,716
GeForce RTX 4080 Super	7,450
GeForce RTX 4080	7,254
GeForce RTX 4070 Ti Super	6,397
GeForce RTX 5070	5,909
GeForce RTX 3090 Ti	5,903
GeForce RTX 4070 Ti	5,509
GeForce RTX 3090	5,384
GeForce RTX 3080 Ti	5,331
GeForce RTX 4070 Super	5,242
GeForce RTX 3080 12G	5,090
GeForce RTX 3080 10G	4,633
GeForce RTX 4070	4,452
Radeon RX 6950 XT	4,075
Radeon RX 6900 XT	3,890
GeForce RTX 3070 Ti	3,761
Radeon RX 6800 XT	3,634
GeForce RTX 3070	3,454
NVIDIA TITAN RTX	3,224
GeForce RTX 4060 Ti 16GB	3,216
GeForce RTX 4060 Ti 8GB	3,214
Radeon RX 6800	3,059
GeForce RTX 2080 Ti	3,041
GeForce RTX 3060 Ti	2,966
GeForce RTX 4060	2,646
Radeon RX 6750 XT	2,379
Radeon RX 6700 XT	2,271
GeForce RTX 2080 Super	2,222
GeForce RTX 3060 12G	2,181
GeForce RTX 2080	2,171
GeForce RTX 2070 Super	2,070
Radeon RX 6700	1,958
GeForce RTX 2070	1,896
GeForce RTX 2060 Super	1,838
Radeon RX 6650 XT	1,701
Radeon RX 6600 XT	1,674
GeForce RTX 3060 8G	1,621
GeForce RTX 2060 12GB	1,572
GeForce RTX 3050 8G	1,468
Radeon RX 6600	1,414
GeForce RTX 2060 6GB	1,396
GeForce RTX 3050 6G	1,122
Radeon RX 6500 XT	177
Radeon RX 6400	101

【ベンチマーク2】3DMark Port Royal (DirectX 12 Feature Level 12_1 + RayTracing 1.0 、 2560×1440)

3DMark Port Royalは2019年1月にリリースされたベンチマークで、3DMarkの中でも先端技術を計測可能なことに重きを置いたベンチマークです。比較的処理が重い部類に入ります。

3Dmark Speed Wayとの違いは、Speed WayはDirectX 12 Feature Level 12_2を利用したベンチマークであり、RayTracingCore評価のためにDirectX RayTracing Tier1.1を使っていますが、この3DMark Port Royalはそれより一世代古くDirectX 12 Feature Level 12_1を利用しており、RayTracingCore評価についてもDirectX RayTracing Tier1.0を利用して評価されています。

ベンチマーク評価における解像度は2560×1440で一律で揃えられており、各自で使っているディスプレイ解像度に依存しない仕組みです。対応しているOSはWindowsのみです。

まず第一にRayTracing Coreのパフォーマンス測定にも対応しています。これはDirectX RayTracing Tier1.0を利用して評価されます。

第二に、Deep Learning(深層学習)向けの半精度4×4行列に特化したTensor Coreをゲームに応用するDLSS (Deep Learning Super Sampling)にも対応しています。特にTensor Coreの4×4行列演算性能はNVIDIA RTXシリーズにおいて非常に強力なため、NVIDIA GeForce RTXにおいて良い結果がでます。

一方で、AMD Radeon RXシリーズではRayTracingや4×4行列演算器の性能に乏しいためRadeon愛好家からは敬遠されあまり好まれないベンチマークとなっています。

GPU(グラボ)名	3DMark Port Royal (DX12+RT)のベンチマーク性能評価スコア値
GeForce RTX 5090	37,329
GeForce RTX 4090	26,072
GeForce RTX 5080	23,167
GeForce RTX 5070 Ti	19,204
GeForce RTX 4080 Super	18,310
GeForce RTX 4080	17,957
GeForce RTX 4070 Ti Super	15,765
GeForce RTX 3090 Ti	14,840
GeForce RTX 5070	14,218
GeForce RTX 4070 Ti	13,984
GeForce RTX 3090	13,640
GeForce RTX 3080 Ti	13,229
GeForce RTX 4070 Super	13,110
GeForce RTX 3080 12G	12,173
GeForce RTX 3080 10G	11,578
GeForce RTX 4070	11,149
Radeon RX 6950 XT	10,818
Radeon RX 6900 XT	10,393
NVIDIA TITAN RTX	9,869
Radeon RX 6800 XT	9,534
GeForce RTX 2080 Ti	9,111
GeForce RTX 3070 Ti	8,854
NVIDIA GTX TITAN X	8,323
GeForce RTX 3070	8,302
GeForce RTX 4060 Ti 16GB	8,111
GeForce RTX 4060 Ti 8GB	8,096
Radeon RX 6800	7,812
GeForce RTX 2080 Super	7,005
GeForce RTX 3060 Ti	6,977
GeForce RTX 2080	6,441
Radeon RX 6750 XT	6,259
GeForce RTX 2070 Super	6,037
GeForce RTX 4060	6,024
Radeon RX 6700 XT	5,974
GeForce RTX 2070	5,186
GeForce RTX 3060 12G	5,142
GeForce RTX 2060 Super	5,073
Radeon RX 6700	5,065
Radeon RX 6650 XT	4,648
GeForce RTX 3060 8G	4,615
Radeon RX 6600 XT	4,512
GeForce RTX 2060 12GB	4,443
GeForce RTX 2060 6GB	4,134
NVIDIA TITAN V	3,820
Radeon RX 6600	3,755
GeForce RTX 3050 8G	3,541
GeForce RTX 3050 6G	2,809
NVIDIA TITAN Xp	2,397
NVIDIA TITAN X	2,261
GeForce GTX 1080 Ti	2,205
GeForce GTX 1660 Ti	1,657
GeForce GTX 1080	1,634
GeForce GTX 1660 Super	1,563
GeForce GTX 1070 Ti	1,489
GeForce GTX 1660	1,465
GeForce GTX 1070	1,244
GeForce GTX 1060	838
Radeon RX 6500 XT	385
Radeon RX 6400	329

Radeon RX 6900XTがGeForce RTX 3080より低い結果になっているのが特徴です。

【ベンチマーク3】3DMark Solar Bay (Vulkan1.1 + RayTracing @ Windows, Android 、 Metal@iOS 、 2560×1440)

3DMark Solar Bayは2023年8月にリリースされたベンチマークです。

Vulkan1.1とMetal APIを使ったベンチマークであり、DirectXを使用した実行ではありません。

Windows OS, Android OSではVulkan1.1を利用して実行されます。ARM版Windowsでも実行可能です。

このベンチマークはVulkan1.1上のベンチマーク評価ではGPU＋ドライバ側でのレイトレーシング対応必須です。RayTracingCoreといったハードウェアで対応している必要はなく、GeForce GTX 1000シリーズ(Pascal世代)のようにドライバ（ソフトウェア）でのリアルタイムレイトレーシングに対応していれば実行可能です。

一方で、iOS上でMetal APIを利用したベンチマーク実行では必ずしもレイトレーシング対応している必要はありません。RayTracingCore非搭載でハードウェア対応してなくていいのは勿論、ドライバでレイトレーシング対応してなくても実行できます。その点、iOSの方が実行要件が緩いです。

またこの3DMark Solar Bayは、レイトレーシングに対応しているか否かといった点ではスコアに影響が出ないようになっています。これはレイトレーシングに対応しているWindows端末と、レイトレーシングに対応していないiOS端末を同列で比較するために導入された評価方式でした（2023年下期に発売されたiPhone 15 Pro以降はiOS端末でもレイトレーシング対応）。

他の3DMarkベンチマークとの違いとしては、この3DMark Solar Bayは3DMark Port Royalよりは動作が軽量です。また、3DMark Solar BayはVulkan1.1 APIを使用している3DMark Wild Lifeのレイトレーシング追加版と捉えることもできます。

GPU(グラボ)名	3DMark Solar Bay (Vulkan+RT)のベンチマーク性能評価スコア値
GeForce RTX 5090	212,210
GeForce RTX 4090	186,968
GeForce RTX 5080	153,268
GeForce RTX 4080 Super	138,464
GeForce RTX 4080	136,723
GeForce RTX 5070 Ti	130,939
GeForce RTX 4070 Ti Super	116,023
GeForce RTX 3090 Ti	109,115
GeForce RTX 4070 Ti	108,184
GeForce RTX 5070	103,526
GeForce RTX 4070 Super	97,890
GeForce RTX 3090	97,521
GeForce RTX 3080 Ti	96,544
GeForce RTX 3080 12G	90,474
Radeon RX 6950 XT	89,385
Radeon RX 6900 XT	86,759
GeForce RTX 3080 10G	85,939
GeForce RTX 4070	82,658
Radeon RX 6800 XT	78,389
GeForce RTX 3070 Ti	69,851
NVIDIA TITAN RTX	67,725
Radeon RX 6800	64,572
GeForce RTX 2080 Ti	64,275
GeForce RTX 3070	64,204
GeForce RTX 4060 Ti 8GB	62,232
GeForce RTX 4060 Ti 16GB	62,136
GeForce RTX 3060 Ti	54,342
Radeon RX 6750 XT	52,706
GeForce RTX 2080 Super	52,258
Radeon RX 6700 XT	50,141
GeForce RTX 2080	50,007
GeForce RTX 4060	49,042
GeForce RTX 2070 Super	45,960
Radeon RX 6700	42,311
NVIDIA TITAN V	41,717
GeForce RTX 3060 12G	40,966
GeForce RTX 2070	39,822
GeForce RTX 3060 8G	38,911
Radeon RX 6650 XT	38,688
GeForce RTX 2060 Super	38,665
Radeon RX 6600 XT	37,501
GeForce RTX 2060 12GB	36,832
GeForce RTX 2060 6GB	34,188
Radeon RX 6600	30,247
GeForce RTX 3050 8G	30,001
NVIDIA TITAN Xp	26,363
GeForce GTX 1080 Ti	25,889
NVIDIA TITAN X	24,612
GeForce RTX 3050 6G	22,675
GeForce GTX 1660 Ti	20,461
Radeon RX 6500 XT	19,974
GeForce GTX 1080	19,623
GeForce GTX 1660 Super	19,257
GeForce GTX 1660	18,090
GeForce GTX 1070 Ti	18,032
GeForce GTX 1070	15,798
Radeon RX 6400	14,765
GeForce GTX 1650	12,317
GeForce GTX 1060	11,200

【ベンチマーク4】3DMark Steel Nomad (DirectX 12 Feature Level 12_0 、 3840×2160＝4K)

3DMark Steel Nomadは2024年5月にリリースされたGPUベンチマークです。

端的に言えば、この3DMark Steel Nomadは3DMark Time Spyの後継ベンチマークとしての位置づけです。

DirectX12 Feature Level 12_0またはVulkan1.1のAPI上で動作します。ちなみに両者ともにx86のWindows限定です。Vulkan1.1での実行だとしてもx86 Windows限定です。

この3DMark Steed NomadにはLite版が存在し、Lite版ではiOS, Android, ARM版Windows上でもベンチマーク実行できます。

3DMark Steed Nomadではリアルタイムレイトレーシングの評価は行っていません。つまりハードウェアとしてRayTracingCoreを搭載していてもその性能はベンチマークスコアに反映されません。これは逆に「レイトレーシングなんて不要」と捉えてるユーザにとっては好ましいベンチマークです。2024年では既にレイトレーシング対応のGPUがNVIDIAからもAMDからも多数出ている中で、あえてレイトレーシング評価をしないベンチマークをリリースしたのはこういったニーズがあってのことです。

実行解像度は4K(3840×2160)になっていて、先行ベンチマークのTime Spyの2560×1440より高解像度になっています。3DMark Time Spyの処理を重くした版が3DMark Steel Nomadと言っていいです。両者ともにレイトレーシング評価非対応であり、3DMark Steel NomadはDirectX12 Feature Level 12_0、3DMark Time SpyはDirectX Feature Level11_0であるように、両者ともに比較的バージョンが古いAPI上でのパフォーマンスを計測するベンチマークです。

GPU(グラボ)名	3DMark Steel Nomad (DX12@4K)のベンチマーク性能評価スコア値
GeForce RTX 5090	14,309
GeForce RTX 4090	9,222
GeForce RTX 5080	8,559
GeForce RTX 4080 Super	6,600
GeForce RTX 4080	6,564
GeForce RTX 5070 Ti	6,517
GeForce RTX 4070 Ti Super	6,397
GeForce RTX 3090 Ti	5,904
GeForce RTX 4070 Ti	5,509
GeForce RTX 3090	5,385
GeForce RTX 3080 Ti	5,331
GeForce RTX 4070 Super	5,241
GeForce RTX 3080 12G	5,090
GeForce RTX 5070	5,042
GeForce RTX 3080 10G	4,633
GeForce RTX 4070	4,452
Radeon RX 6950 XT	4,235
Radeon RX 6900 XT	4,081
NVIDIA TITAN RTX	3,800
Radeon RX 6800 XT	3,690
NVIDIA TITAN V	3,572
GeForce RTX 2080 Ti	3,538
GeForce RTX 3070 Ti	3,478
GeForce RTX 4060 Ti 16GB	3,217
GeForce RTX 4060 Ti 8GB	3,214
Radeon RX 6800	3,188
GeForce RTX 3070	3,162
GeForce RTX 2080 Super	2,754
GeForce RTX 3060 Ti	2,670
GeForce RTX 4060	2,646
GeForce RTX 2080	2,599
Radeon RX 6750 XT	2,549
Radeon RX 6700 XT	2,436
GeForce RTX 2070 Super	2,415
NVIDIA TITAN Xp	2,374
Radeon VII	2,310
NVIDIA TITAN X	2,243
GeForce GTX 1080 Ti	2,231
Radeon RX 5700 XT	2,135
GeForce RTX 2070	2,106
Radeon RX 6700	2,015
GeForce RTX 2060 Super	2,013
GeForce RTX 3060 12G	1,961
Radeon RX 5700	1,863
Radeon RX 6650 XT	1,859
Radeon RX 6600 XT	1,804
GeForce RTX 2060 12GB	1,801
GeForce RTX 2060 6GB	1,725
Radeon RX 5600 XT	1,669
GeForce GTX 1080	1,625
GeForce RTX 3060 8G	1,577
Radeon RX 6600	1,493
Radeon RX 5600	1,483
GeForce GTX 1070 Ti	1,471
GeForce GTX 1070	1,341
GeForce RTX 3050 8G	1,329
GeForce GTX 1660 Ti	1,309
GeForce GTX 1660 Super	1,279
NVIDIA GTX TITAN X	1,231
Radeon RX 590	1,081
GeForce GTX 1660	1,065
Radeon RX 5500 XT	1,032
Radeon RX 580	1,005
GeForce RTX 3050 6G	1,003
Radeon RX 5500	912
GeForce GTX 1060	907
Radeon RX 570	879
GeForce GTX 1650 Super	352
GeForce GTX 1650	328
GeForce GTX 1050 Ti	305
GeForce GTX 1630	289
Radeon RX 6500 XT	234
Radeon RX 6400	176
Radeon RX 560	164
Radeon RX 550	127
GeForce GTX 1050	122
GeForce GT 1030 GDDR5	35
GeForce GT 1030 DDR4	33
GeForce GT 1010	30

【ベンチマーク5】3DMark Time Spy (DirectX 12 Feature Level 11_0 、 2560×1440)

3DMark Time Spyは2016年7月にリリースされたベンチマークで、古いものの未だに広く使われているベンチマークです。未だに使われている理由は、多くのゲームがDirectX 12 Feature Level 11を利用して作られているため、この3DMark TIme Spyのスコアさえ高ければ事足りるユーザが多いからです。

また、2024年5月にリリースされた3DMkark Steel Nomadはこの3DMark Time Spyの後継ベンチマークであり、「レイトレーシング不使用」という共通点があります。ただし実行解像度は異なります。

3DMark Time Spyの解像度は2560×1440に一律で揃えられてベンチマーク実行されます。対応OSはWindowsのみです。

3DMark Time SpyはNVIDIAが得意とするTensor Coreをゲームの描画処理に応用したDLSSに対応していません。DLSSに対応していないということはGeForce RTXシリーズの強みを反映できないということで、NVIDIA GeForce RTXに対しAMD Radeon RXのスコアが水増しされるベンチマークです。3DMark Port RoyalはDLSSに対応しているためAMD Radeon RXにとって不利なスコアになりやすく、AMD Radeon RXユーザは「Port Royalで惨敗するぐらいならTime Spyで惜敗」を選択し比較したがる傾向があります。

GPU(グラボ)名	3DMark Time Spy (DX12)のベンチマーク性能評価スコア値
GeForce RTX 5090	47,374
GeForce RTX 4090	36,225
GeForce RTX 5080	33,105
GeForce RTX 4080 Super	28,304
GeForce RTX 4080	28,172
GeForce RTX 5070 Ti	27,637
GeForce RTX 4070 Ti Super	24,225
GeForce RTX 4070 Ti	22,741
GeForce RTX 5070	22,660
Radeon RX 6950 XT	21,850
GeForce RTX 3090 Ti	21,693
GeForce RTX 4070 Super	20,902
Radeon RX 6900 XT	20,538
GeForce RTX 3090	19,909
GeForce RTX 3080 Ti	19,584
Radeon RX 6800 XT	19,103
GeForce RTX 3080 12G	18,555
GeForce RTX 4070	17,826
GeForce RTX 3080 10G	17,657
Radeon RX 6800	15,828
NVIDIA TITAN RTX	15,190
GeForce RTX 3070 Ti	14,821
GeForce RTX 2080 Ti	14,665
GeForce RTX 3070	13,678
Radeon RX 6750 XT	13,569
GeForce RTX 4060 Ti 8GB	13,493
GeForce RTX 4060 Ti 16GB	13,470
NVIDIA TITAN V	13,178
Radeon RX 6700 XT	12,786
GeForce RTX 3060 Ti	11,766
GeForce RTX 2080 Super	11,633
Radeon RX 6700	11,213
GeForce RTX 2080	11,098
NVIDIA TITAN Xp	10,649
GeForce RTX 4060	10,598
NVIDIA TITAN X	10,311
GeForce RTX 2070 Super	10,184
Radeon RX 6650 XT	10,004
GeForce GTX 1080 Ti	9,995
Radeon RX 6600 XT	9,705
Radeon RX 5700 XT	9,401
Radeon RX 5700 XT 50th Anniv.	9,205
GeForce RTX 2070	9,125
Radeon VII	8,911
GeForce RTX 2060 Super	8,792
GeForce RTX 3060 12G	8,747
Radeon RX 5700	8,316
Radeon RX 6600	8,149
GeForce RTX 2060 12GB	8,025
GeForce GTX 1080	7,598
Radeon RX 5600 XT	7,589
GeForce RTX 2060 6GB	7,571
GeForce RTX 3060 8G	7,387
Radeon RX 5600	7,016
GeForce GTX 1070 Ti	6,851
GeForce GTX 1660 Ti	6,378
GeForce RTX 3050 8G	6,227
GeForce GTX 1070	6,094
GeForce GTX 1660 Super	6,086
NVIDIA GTX TITAN X	5,801
GeForce GTX 1660	5,455
Radeon RX 6500 XT	4,972
Radeon RX 5500 XT	4,856
GeForce RTX 3050 6G	4,853
Radeon RX 590	4,780
Radeon RX 5500	4,772
GeForce GTX 1650 Super	4,701
Radeon RX 580	4,351
GeForce GTX 1060	4,203
Radeon RX 570	3,850
Radeon RX 6400	3,605
GeForce GTX 1650	3,548
GeForce GTX 1050 Ti	2,356
GeForce GTX 1630	2,095
Radeon RX 560	1,862
GeForce GTX 1050	1,729
Radeon RX 550	1,192
GeForce GT 1030 GDDR5	1,087
GeForce GT 1030 DDR4	638
Radeon 530	525
GeForce GT 1010	519
Radeon 520	443
GeForce GT 710	194

このようにRadeon RX 6900XTがGeForce RTX 3090には勝っているので、3DMark Port RoyalよりはRadeonが健闘しています。しかし本来カウンターパートであるはずのGeForce RTX 3090Tiには負けています。

【ベンチマーク6】3DMark Night Raid (DirectX 12 Feature Level 11_0 、 1920×1080)

3DMark Night Raidは2018年10月にリリースされたベンチマークで、3DMark Time Spyの軽量版としての位置づけです。つまり実質的に2016年リリースのTime Spyと同様古いベンチマークです。

処理が軽いというのは実行解像度の違いを意味します。3DMark Night Raidは使っているディスプレイの解像度に関係なく1920×1080でベンチマーク実行されます。

解像度が低ければ実行されるスレッドが数が少ない上に、処理対象のデータサイズが小さいためキャッシュヒット率が高いことを意味します。そのため単精度コア数が少なく性能が低いAMD Radeon RXシリーズであっても、大きなL3キャッシュを搭載したモデルでは上位に食い込みやすいベンチマークになっています。

対応OSはWindowsのみですがx86命令セットだけでなくARM版Windowsでも動作します。

GPU(グラボ)名	3DMark Night Raid (DX12@FHD)のベンチマーク性能評価スコア値
GeForce RTX 5090	210,189
GeForce RTX 5080	196,761
GeForce RTX 4090	195,290
GeForce RTX 4080	184,031
GeForce RTX 5070 Ti	183,031
GeForce RTX 4080 Super	179,065
GeForce RTX 4070 Ti Super	174,665
GeForce RTX 4070 Ti	170,077
Radeon RX 6950 XT	168,384
GeForce RTX 5070	166,974
GeForce RTX 4070 Super	164,099
Radeon RX 6900 XT	159,221
Radeon RX 6800 XT	155,724
GeForce RTX 3090 Ti	155,509
GeForce RTX 4070	152,570
GeForce RTX 3080 12G	141,310
GeForce RTX 3080 Ti	141,143
GeForce RTX 4060 Ti 8GB	137,213
GeForce RTX 4060 Ti 16GB	136,968
Radeon RX 6750 XT	136,603
GeForce RTX 3090	135,618
Radeon RX 6800	134,980
GeForce RTX 3070 Ti	130,430
GeForce RTX 3080 10G	129,188
Radeon RX 6700 XT	127,437
GeForce RTX 4060	121,539
Radeon RX 6700	121,154
NVIDIA TITAN RTX	120,471
Radeon RX 6650 XT	119,360
Radeon RX 6600 XT	118,627
NVIDIA TITAN V	116,967
GeForce RTX 3070	116,553
GeForce RTX 2080 Ti	113,336
NVIDIA TITAN Xp	112,752
GeForce RTX 2080 Super	107,166
GeForce RTX 3060 Ti	105,724
Radeon RX 5700 XT	103,481
NVIDIA TITAN X	103,025
GeForce RTX 2070 Super	101,545
Radeon RX 6600	100,429
GeForce RTX 2080	99,518
Radeon VII	99,004
GeForce RTX 3060 12G	98,839
Radeon RX 5700 XT 50th Anniv.	98,577
GeForce GTX 1080 Ti	94,663
GeForce RTX 2060 12GB	93,158
GeForce RTX 2060 Super	91,434
Radeon RX 5700	91,384
GeForce RTX 2070	91,124
GeForce RTX 3060 8G	88,676
Radeon RX 5600 XT	87,497
GeForce RTX 2060 6GB	84,881
GeForce GTX 1080	81,404
GeForce GTX 1070 Ti	77,792
GeForce GTX 1660 Ti	75,482
GeForce RTX 3050 8G	74,353
Radeon RX 5600	74,026
GeForce GTX 1660 Super	73,975
GeForce GTX 1070	71,862
NVIDIA GTX TITAN X	65,805
GeForce GTX 1660	65,774
Radeon RX 6500 XT	64,674
Radeon RX 6400	64,674
Radeon RX 590	62,220
Radeon RX 5500 XT	60,852
GeForce RTX 3050 6G	60,787
Radeon RX 5500	60,644
GeForce GTX 1650 Super	59,637
Radeon RX 580	57,050
GeForce GTX 1060	54,563
Radeon RX 570	50,436
GeForce GTX 1650	45,311
GeForce GTX 1050 Ti	33,327
GeForce GTX 1630	29,368
GeForce GTX 1050	26,945
Radeon RX 560	25,667
Radeon RX 550	18,012
GeForce GT 1030 GDDR5	15,844
GeForce GT 1030 DDR4	8,004
GeForce GT 1010	6,767
Radeon 530	5,471
Radeon 520	4,892
GeForce GT 710	3,068

実際GeForce RTX 4090よりもRadeon RX 6950XTの方が性能が高く出ています。これはRadeon RX 6950 XTが搭載する128MBのL3共有キャッシュのおかげです。GeForce RTX 4090ではL2共有キャッシュが72MBしかありません。結果的にキャッシュミスが多発することになりスレッドの実行スループットが下がります。一方でRadeon RX 6950 XTではベンチマークで使うほぼ全てのデータが共有キャッシュに乗り切ってしまうためこれだけ高い性能が出ています。データセットが小さい3DMark Night Raidならではの結果です。

【ベンチマーク7】3DMark Wild Life (Vulkan1.1@Windows,Android、Metal@iOS 、 2560×1440)

3DMark Wild Lifeは2020年10月にリリースされたベンチマークで、WindowsのみならずiOSやAndroidにも対応したクロスプラットフォーム対応のベンチマークです。DirectXではなくVulkan1.1を使用しています。

モバイル向けの軽量ベンチマークと思われがちですが、評価解像度は2560×1440であり本格的なベンチマークになっています。

ただしレイトレーシングには非対応であり、GPUがレイトレーシング非対応でも動作します。この3DMark Wild Lifeの「レイトレーシング対応GPU必須版」が2023年8月にリリースされた3DMark Solar Bayです。

GPU(グラボ)名	3DMark Wild Life (Vulkan)のベンチマーク性能評価スコア値
GeForce RTX 5090	174,419
GeForce RTX 4090	164,134
GeForce RTX 5080	148,785
GeForce RTX 4080 Super	142,859
GeForce RTX 4080	142,338
GeForce RTX 5070 Ti	139,732
GeForce RTX 4070 Ti Super	130,434
GeForce RTX 5070	128,796
GeForce RTX 4070 Ti	124,603
GeForce RTX 4070 Super	118,594
GeForce RTX 3090 Ti	117,075
Radeon RX 6950 XT	107,557
Radeon RX 6900 XT	107,501
GeForce RTX 3080 Ti	105,587
GeForce RTX 4070	103,562
GeForce RTX 3090	102,249
GeForce RTX 3080 12G	101,861
Radeon RX 6800 XT	99,507
GeForce RTX 3080 10G	91,536
Radeon RX 6800	89,046
GeForce RTX 3070 Ti	85,408
GeForce RTX 4060 Ti 16GB	79,978
GeForce RTX 4060 Ti 8GB	79,490
NVIDIA TITAN RTX	78,804
Radeon RX 6750 XT	77,550
GeForce RTX 3070	76,299
Radeon RX 6700 XT	75,247
GeForce RTX 2080 Ti	74,936
NVIDIA TITAN V	73,253
GeForce RTX 3060 Ti	66,934
GeForce RTX 4060	64,812
Radeon RX 6700	64,314
GeForce RTX 2080 Super	64,303
Radeon RX 6650 XT	63,964
Radeon RX 6600 XT	63,381
NVIDIA TITAN Xp	63,219
NVIDIA TITAN X	62,009
GeForce GTX 1080 Ti	61,989
GeForce RTX 2080	60,829
Radeon RX 5700 XT	60,371
GeForce RTX 2070 Super	57,930
Radeon VII	54,861
Radeon RX 5700	53,268
GeForce RTX 2070	52,436
GeForce RTX 2060 Super	51,578
GeForce RTX 3060 12G	50,589
Radeon RX 5600 XT	49,669
GeForce RTX 3060 8G	49,252
GeForce RTX 2060 12GB	48,856
GeForce GTX 1080	48,850
Radeon RX 6600	48,667
GeForce RTX 2060 6GB	46,783
GeForce GTX 1070 Ti	44,317
GeForce GTX 1070	40,257
GeForce GTX 1660 Ti	39,457
NVIDIA GTX TITAN X	39,322
GeForce GTX 1660 Super	38,824
Radeon RX 5600	37,855
GeForce RTX 3050 8G	37,744
GeForce GTX 1660	33,532
Radeon RX 5500 XT	32,100
Radeon RX 6500 XT	31,820
Radeon RX 590	31,304
GeForce GTX 1650 Super	29,952
Radeon RX 580	28,901
GeForce GTX 1060	28,855
GeForce RTX 3050 6G	28,666
Radeon RX 5500	26,184
Radeon RX 570	25,622
Radeon RX 6400	23,672
GeForce GTX 1650	22,602
GeForce GTX 1050 Ti	16,553
GeForce GTX 1630	14,470
GeForce GTX 1050	12,717
Radeon RX 560	12,223
Radeon RX 550	8,082
GeForce GT 1030 GDDR5	7,973
GeForce GT 1030 DDR4	3,724
GeForce GT 1010	3,609
Radeon 530	2,846
GeForce GT 710	1,538

この結果は比較的適切です。GeForce RTX 3090TiよりもRadeon RX 6900XTの方が性能が低くでています。さらにGeForce RTX3070よりも古い世代のGeForce RTX 2080Tiの方が性能が低くなっているのも適切です。またGeForce GTX 1080TiよりもRadeon VIIの方が性能が低くなっているのも特徴です。

【ベンチマーク8】3DMark Fire Strike (DirectX 11 Feature Level 11 、 1920×1080)

3DMark Fire Strikeは2013年2月にリリースされたベンチマークで、3DMark系のベンチマークで現役で提供されている中では最も古いベンチマークです。長い間このFire Strikeでベンチマークを元にデータを集めて性能比較してきた自作PCマニアが多いため、未だに多くのグラボ比較サイトではこの古いFire Strikeを主軸に比較していることが多いです。なぜなら2013年以降蓄積してきたFire Strikeのベンチマークデータを思い切って捨てきれない人が多いことと、3DMark Port Royalのような新しいベンチマークで古いグラボのベンチマークを再度計測する面倒さを嫌っているフシがあることと、AMD Radeon RXにおいてはFire Strikeで良い結果がでるためです。よって未だにこのFire Strikeをメインで比較しているサイトが多いです。

3DMark Fire StrikeはDirectX12に対応しておらずDirectX11対応です。また当然ながらRayTracing Coreを搭載したGPUであってもレイトレーシングハードウェアを活用した評価をしません。つまりレイトレーシング非対応です。

また、これ以降リリースされた3DMarkは3DMark Night Raidを除き2560×1440以上の解像度で評価するベンチマークが主流となりましたが、このFire Strikeは1920×1080での評価になっています。これは2013年当時のハードウェア性能の制約上1920×1080を超えると極端にフレームレート性能が落ちていたためです。

GPU(グラボ)名	3DMark Fire Strike (DX11@FHD)のベンチマーク性能評価スコア値
GeForce RTX 5090	91,680
GeForce RTX 5080	74,944
GeForce RTX 4090	72,242
GeForce RTX 5070 Ti	65,990
GeForce RTX 4080	64,728
GeForce RTX 4080 Super	63,717
Radeon RX 6950 XT	60,183
GeForce RTX 5070	57,577
Radeon RX 6900 XT	57,022
GeForce RTX 4070 Ti Super	56,268
GeForce RTX 4070 Ti	53,575
Radeon RX 6800 XT	52,957
GeForce RTX 3090 Ti	52,350
GeForce RTX 4070 Super	50,145
GeForce RTX 3080 Ti	47,785
GeForce RTX 3090	47,343
GeForce RTX 3080 12G	46,134
Radeon RX 6800	44,117
GeForce RTX 4070	44,110
GeForce RTX 3080 10G	42,193
NVIDIA TITAN RTX	37,783
Radeon RX 6750 XT	37,573
GeForce RTX 3070 Ti	37,129
Radeon RX 6700 XT	35,994
GeForce RTX 2080 Ti	35,659
NVIDIA TITAN V	34,770
GeForce RTX 4060 Ti 8GB	34,436
GeForce RTX 4060 Ti 16GB	34,300
GeForce RTX 3070	33,833
NVIDIA TITAN Xp	31,734
Radeon RX 6700	31,388
NVIDIA TITAN X	31,227
GeForce RTX 3060 Ti	29,417
Radeon RX 6650 XT	29,410
GeForce GTX 1080 Ti	29,338
GeForce RTX 2080 Super	28,692
Radeon RX 6600 XT	28,688
GeForce RTX 4060	28,553
Radeon VII	27,973
GeForce RTX 2080	27,647
Radeon RX 5700 XT 50th Anniv.	27,530
Radeon RX 5700 XT	27,488
GeForce RTX 2070 Super	25,590
Radeon RX 5700	24,595
Radeon RX 6600	23,704
GeForce RTX 2070	23,197
GeForce GTX 1080	22,768
GeForce RTX 2060 Super	22,497
GeForce RTX 3060 12G	22,308
Radeon RX 5600 XT	22,272
GeForce RTX 2060 12GB	20,724
Radeon RX 5600	20,261
GeForce GTX 1070 Ti	20,121
NVIDIA GTX TITAN X	19,918
GeForce RTX 2060 6GB	19,768
GeForce RTX 3060 8G	19,331
GeForce GTX 1070	18,715
GeForce GTX 1660 Ti	16,605
Radeon RX 590	16,526
GeForce GTX 1660 Super	16,155
GeForce RTX 3050 8G	15,974
Radeon RX 6500 XT	15,526
Radeon RX 580	14,978
Radeon RX 5500 XT	14,387
Radeon RX 5500	14,153
GeForce GTX 1660	14,150
Radeon RX 570	13,440
GeForce GTX 1060	13,131
GeForce RTX 3050 6G	12,597
GeForce GTX 1650 Super	12,237
Radeon RX 6400	11,541
GeForce GTX 1650	9,542
GeForce GTX 1050 Ti	7,708
GeForce GTX 1050	6,773
Radeon RX 560	6,502
GeForce GTX 1630	5,609
Radeon RX 550	4,395
GeForce GT 1030 GDDR5	3,618
Radeon 530	1,857
GeForce GT 1030 DDR4	1,856
Radeon 520	1,635
GeForce GT 1010	1,596
GeForce GT 710	795

GeForce RTX 3090TiよりもRadeon RX 6900XTの方が高い結果が出ているのが特徴です。このような結果が出るのは3DMark系だと古いFire Strikeと、Time Spyの軽量版のNight Raidのみです。このFire StrikeはGeForce RTX 3070よりもGeForce RTX 2080Tiの方が上位に来る「逆転現象」が生じるのも特徴です。つまりNVIDIA GeForce間の優劣さえも今となってはFire Strikeで適切に評価できません。

【ベンチマーク9】PassMark (Videocard Benchmarks：G3D)

PassMarkは全体としてはNVIDIA GeForceに比較的有利な結果が出やすいです。ただしデータセットが小さいためデータアクセスの空間的局所性が小さくキャッシュが効きやすくなっています。そのためAMD Radeon RXの一部モデルに見られる極めて大きなL3キャッシュを搭載したモデルではそこまで惨敗せず健闘する結果となっています。

一方でL3キャッシュが多くないRadeon RXに関してはAMD RadeonにとってNVIDIA GeForceよりも大幅に不利な結果が出ます。

GPU(グラボ)名	PassMark Videocard G3Dのベンチマーク性能評価スコア値
GeForce RTX 5090	40,097
GeForce RTX 4090	38,309
GeForce RTX 5080	36,169
GeForce RTX 4080	34,519
GeForce RTX 4080 Super	34,290
GeForce RTX 5070 Ti	32,608
GeForce RTX 4070 Ti Super	31,759
GeForce RTX 4070 Ti	31,683
GeForce RTX 4070 Super	29,977
GeForce RTX 3090 Ti	29,511
Radeon RX 6950 XT	28,472
GeForce RTX 5070	27,962
GeForce RTX 3080 Ti	26,976
GeForce RTX 4070	26,955
GeForce RTX 3090	26,671
GeForce RTX 3080 12G	26,603
Radeon RX 6900 XT	26,115
GeForce RTX 3080 10G	25,153
Radeon RX 6800 XT	24,079
GeForce RTX 3070 Ti	23,441
GeForce RTX 4060 Ti 16GB	22,739
GeForce RTX 4060 Ti 8GB	22,720
GeForce RTX 3070	22,256
GeForce RTX 2080 Ti	21,852
Radeon RX 6800	21,206
GeForce RTX 3060 Ti	20,406
NVIDIA TITAN RTX	20,221
NVIDIA TITAN V	19,773
GeForce RTX 4060	19,736
Radeon RX 6750 XT	19,714
GeForce RTX 2080 Super	19,538
Radeon RX 6700 XT	19,237
NVIDIA TITAN Xp	19,127
Radeon RX 6700	18,806
GeForce RTX 2080	18,731
GeForce GTX 1080 Ti	18,401
GeForce RTX 2070 Super	18,190
Radeon RX 6650 XT	17,492
Radeon RX 5700 XT	16,909
GeForce RTX 3060 12G	16,870
Radeon VII	16,837
GeForce RTX 2060 Super	16,568
Radeon RX 5700 XT 50th Anniv.	16,505
GeForce RTX 2070	16,108
Radeon RX 6600 XT	16,051
GeForce RTX 2060 12GB	15,942
GeForce GTX 1080	15,346
GeForce RTX 3060 8G	15,309
Radeon RX 5700	14,640
GeForce GTX 1070 Ti	14,627
Radeon RX 6600	14,504
GeForce RTX 2060 6GB	14,122
Radeon RX 5600 XT	13,833
NVIDIA TITAN X	13,660
GeForce GTX 1070	13,501
NVIDIA GTX TITAN X	13,202
GeForce GTX 1660 Super	12,768
GeForce RTX 3050 8G	12,622
GeForce GTX 1660 Ti	11,869
GeForce GTX 1660	11,725
Radeon RX 5600	11,288
GeForce RTX 3050 6G	10,679
GeForce GTX 1060	10,080
GeForce GTX 1650 Super	10,075
Radeon RX 590	9,652
Radeon RX 6500 XT	9,305
Radeon RX 5500 XT	9,190
Radeon RX 580	8,924
Radeon RX 5500	8,806
Radeon RX 570	8,101
GeForce GTX 1650	7,821
Radeon RX 5300	7,266
Radeon RX 6400	6,936
GeForce GTX 1050 Ti	6,301
GeForce GTX 1050	5,202
GeForce GTX 1630	4,927
Radeon RX 560	3,610
Radeon RX 550	2,717
GeForce GT 1030 GDDR5	2,441
GeForce GT 1030 DDR4	2,441
Radeon 540	1,845
GeForce GT 1010	1,208
Radeon 530	973
Radeon 520	849
GeForce GT 710	625

このようにGeForce RTX 4090に対してもRadeon RX 6950XTは「他のベンチマークと比べれば」そこまで惨敗していません。

【ベンチマーク10】PassMark (Videocard Benchmarks：G2D)

PassMark G3Dは3Dグラフィクス描画性能を評価するベンチマークでしたが、このPassMark G2Dは2D描画性能を評価するためのベンチマークです。

3D性能の方は例えば3DMark Steel NomadだとGeForce RTX 5090とGeForce GTX 1050で100倍の性能差がついていますが、3D性能はGeForce RTX 5090とGeForce GTX 1050だとたった2倍程度の差しかついていません。

古いGPUでもPassMark G2Dのスコアが壊滅的に悪いというわけではないのです。各GPUのPassMark G2Dスコアは以下の通りです。

GPU(グラボ)名	PassMark Videocard G2Dのベンチマーク性能評価スコア値
GeForce RTX 5090	1,426
GeForce RTX 5080	1,399
GeForce RTX 5070 Ti	1,345
GeForce RTX 4090	1,294
GeForce RTX 5070	1,284
GeForce RTX 4080 Super	1,263
GeForce RTX 4080	1,234
GeForce RTX 3090 Ti	1,226
GeForce RTX 4070 Ti Super	1,216
GeForce RTX 4070 Ti	1,196
GeForce RTX 4070 Super	1,174
GeForce RTX 4070	1,161
GeForce RTX 3080 Ti	1,088
GeForce RTX 3080 12G	1,087
GeForce RTX 4060 Ti 8GB	1,083
GeForce RTX 4060	1,081
Radeon RX 6900 XT	1,076
GeForce RTX 4060 Ti 16GB	1,063
GeForce RTX 3090	1,058
Radeon RX 6800 XT	1,056
GeForce RTX 3080 10G	1,050
GeForce RTX 3070 Ti	1,050
Radeon RX 6950 XT	1,042
GeForce RTX 3070	998
Radeon RX 6800	997
Radeon RX 6700 XT	988
GeForce RTX 3060 Ti	988
GeForce RTX 3060 8G	974
Radeon RX 6600 XT	966
GeForce RTX 3060 12G	960
Radeon RX 6750 XT	959
Radeon RX 5700 XT	951
Radeon RX 6650 XT	945
Radeon RX 5700 XT 50th Anniv.	942
NVIDIA TITAN Xp	940
GeForce RTX 2080 Ti	940
GeForce GTX 1080 Ti	937
Radeon RX 5600	934
GeForce RTX 2080 Super	933
Radeon RX 6600	922
GeForce RTX 3050 8G	919
Radeon RX 5700	917
GeForce RTX 2080	913
Radeon RX 5600 XT	912
NVIDIA TITAN X	912
Radeon RX 6700	898
GeForce RTX 2070 Super	894
GeForce GTX 1080	892
GeForce GTX 1070 Ti	883
GeForce RTX 2060 Super	879
Radeon RX 6500 XT	857
GeForce GTX 1070	857
NVIDIA GTX TITAN X	851
NVIDIA TITAN V	848
GeForce RTX 3050 6G	847
GeForce RTX 2060 12GB	845
Radeon RX 5500	834
NVIDIA TITAN RTX	831
GeForce RTX 2070	831
GeForce GTX 1660 Super	821
Radeon RX 5500 XT	818
Radeon RX 590	811
GeForce GTX 1660	798
Radeon VII	789
Radeon RX 580	774
Radeon RX 5300	765
GeForce GTX 1650 Super	759
GeForce GTX 1060	747
GeForce RTX 2060 6GB	746
GeForce GTX 1630	740
Radeon RX 570	730
Radeon RX 6400	711
GeForce GTX 1660 Ti	706
GeForce GTX 1050	692
GeForce GTX 1050 Ti	650
GeForce GTX 1650	589
Radeon RX 560	503
Radeon RX 550	484
GeForce GT 1030 GDDR5	442
GeForce GT 1030 DDR4	442
Radeon 540	394
GeForce GT 1010	252
Radeon 520	215
GeForce GT 710	213
Radeon 530	180

PassMark G2Dではクロックの高さが物を言います。例えばGeForce RTX 5080はGeForce RTX 4090よりもCUDA Core数が少ないですが、ブーストクロックはGeForce RTX 5080が上であるためPassMark G2DスコアはGeForce RTX 5080が勝っています。

つまり2D描画性能を求める場合はCUDA Core数も当然重要ですがそれ以上にクロックの高さも重要だということです。

【ベンチマーク11】Userbenchmark GPU(DX10)

ゲームにおけるAPIではDirectX12とDirectX11が現在主流ですが2010年代半ばまではDirectX10が主流だったため未だにDirectX10のゲームが存在します。特に後述するDirectX9が「DirectX入門」として多用されるためDirectX10も普通に現役のAPIです。

GPU(グラボ)名	Userbenchmark (DX10)のベンチマーク性能評価スコア値
GeForce RTX 5090	777
GeForce RTX 5080	576
GeForce RTX 4090	461
GeForce RTX 5070 Ti	459
GeForce RTX 4080 Super	390
GeForce RTX 4080	385
GeForce RTX 5070	370
GeForce RTX 4070 Ti Super	337
GeForce RTX 4070 Ti	331
GeForce RTX 4070 Super	307
Radeon RX 6950 XT	300
GeForce RTX 3090 Ti	297
Radeon RX 6900 XT	291
GeForce RTX 3090	262
GeForce RTX 3080 Ti	261
GeForce RTX 4070	255
GeForce RTX 3080 12G	252
Radeon RX 6800 XT	251
NVIDIA TITAN RTX	240
GeForce RTX 3080 10G	234
GeForce RTX 2080 Ti	210
Radeon RX 6800	199
GeForce RTX 4060 Ti 8GB	193
GeForce RTX 4060 Ti 16GB	188
Radeon RX 6750 XT	187
GeForce RTX 3070 Ti	180
Radeon RX 6700 XT	177
Radeon RX 6700	175
NVIDIA TITAN V	173
Radeon RX 6650 XT	165
GeForce RTX 2080 Super	162
GeForce RTX 3070	161
Radeon RX 6600 XT	160
GeForce RTX 2080	150
NVIDIA TITAN Xp	146
GeForce RTX 3060 Ti	145
GeForce RTX 4060	144
GeForce GTX 1080 Ti	144
GeForce RTX 2070 Super	143
Radeon RX 6600	139
NVIDIA TITAN X	139
GeForce RTX 2070	136
GeForce RTX 2060 Super	131
GeForce GTX 1080	123
Radeon VII	113
GeForce RTX 2060 12GB	111
GeForce RTX 3060 12G	110
GeForce GTX 1070 Ti	110
Radeon RX 5700 XT	109
GeForce RTX 2060 6GB	107
Radeon RX 5700	96.6
GeForce GTX 1070	96
GeForce RTX 3060 8G	93.1
Radeon RX 5600 XT	91.2
NVIDIA GTX TITAN X	90.7
Radeon RX 5600	89.3
GeForce GTX 1660 Ti	87.6
GeForce GTX 1660 Super	87.1
GeForce RTX 3050 8G	73.5
GeForce GTX 1660	71.8
Radeon RX 6500 XT	67.3
GeForce GTX 1060	67.2
Radeon RX 590	66.9
GeForce GTX 1650 Super	64.7
GeForce RTX 3050 6G	61.3
Radeon RX 580	61
Radeon RX 570	54.7
Radeon RX 6400	54.6
Radeon RX 5500 XT	54.2
Radeon RX 5500	51.8
Radeon RX 5300	51.7
GeForce GTX 1650	49.2
GeForce GTX 1050 Ti	34.6
GeForce GTX 1050	31
GeForce GTX 1630	30.5
Radeon RX 560	27.2
Radeon RX 550	20.5
Radeon 540	16.1
GeForce GT 1030 GDDR5	15.8
GeForce GT 1030 DDR4	15.8
GeForce GT 1010	9.7
Radeon 530	8.59
Radeon 520	7.89
GeForce GT 710	4.5

【ベンチマーク12】Userbenchmark GPU(DX9)

DirectX9は2000年代のバージョンですが2020年代に入っても未だに現役のAPIです。DirectX9を習得している技術者が多いことと、ノウハウがいくらでもネット上に転がっているためです。旧作ゲームだけでなく、現在進行系で利用されているAPIです。

GPU(グラボ)名	Userbenchmark (DX9)のベンチマーク性能評価スコア値
GeForce RTX 5090	726
GeForce RTX 4090	625
GeForce RTX 5080	469
GeForce RTX 4080 Super	468
GeForce RTX 4080	447
GeForce RTX 5070 Ti	398
GeForce RTX 4070 Ti Super	377
GeForce RTX 4070 Ti	358
GeForce RTX 3090 Ti	338
Radeon RX 6950 XT	323
Radeon RX 6900 XT	319
GeForce RTX 4070 Super	319
GeForce RTX 5070	314
GeForce RTX 3090	309
GeForce RTX 3080 Ti	309
GeForce RTX 3080 12G	280
GeForce RTX 4070	271
GeForce RTX 3080 10G	266
Radeon RX 6800 XT	260
NVIDIA TITAN RTX	229
Radeon RX 6800	223
GeForce RTX 3070 Ti	223
GeForce RTX 2080 Ti	217
GeForce RTX 3070	209
NVIDIA TITAN V	209
GeForce RTX 4060 Ti 8GB	207
GeForce RTX 4060 Ti 16GB	201
NVIDIA TITAN Xp	183
GeForce RTX 2080 Super	181
Radeon RX 6750 XT	180
GeForce GTX 1080 Ti	179
Radeon RX 6700 XT	174
NVIDIA TITAN X	174
GeForce RTX 3060 Ti	173
GeForce RTX 2080	169
Radeon RX 6700	160
Radeon RX 6650 XT	154
GeForce RTX 2070 Super	152
Radeon RX 6600 XT	151
Radeon VII	151
GeForce RTX 4060	149
Radeon RX 5700 XT	139
GeForce GTX 1080	135
Radeon RX 6600	128
GeForce RTX 2070	127
GeForce RTX 3060 12G	125
GeForce GTX 1070 Ti	125
Radeon RX 5700	124
GeForce RTX 2060 Super	122
GeForce RTX 3060 8G	119
Radeon RX 5600	118
GeForce RTX 2060 12GB	118
Radeon RX 5600 XT	117
GeForce RTX 2060 6GB	113
GeForce GTX 1070	104
NVIDIA GTX TITAN X	104
GeForce GTX 1660 Ti	95.1
GeForce RTX 3050 8G	92.8
GeForce GTX 1660 Super	88.8
GeForce GTX 1660	87
Radeon RX 590	79.6
GeForce GTX 1650 Super	76.8
Radeon RX 6500 XT	76
GeForce RTX 3050 6G	74.8
Radeon RX 5500 XT	72.4
Radeon RX 580	71.9
GeForce GTX 1060	71.1
Radeon RX 5500	69
Radeon RX 5300	68.3
Radeon RX 570	63.6
Radeon RX 6400	58.9
GeForce GTX 1650	54.7
GeForce GTX 1050 Ti	39.1
GeForce GTX 1050	33.3
GeForce GTX 1630	31.7
Radeon RX 560	30.6
Radeon RX 550	21
Radeon 540	18.2
GeForce GT 1030 GDDR5	16.9
GeForce GT 1030 DDR4	16.9
GeForce GT 1010	9.8
Radeon 530	9.75
Radeon 520	8.41
GeForce GT 710	4.48

GPUの単精度コア数とクロック数による特性

GPUの特徴を要因分解する際は大雑把に単精度コア数とクロック数で分類するのが容易です。

同一メーカーのGPUで比較する場合、高い解像度でゲームをするならコア数が多い方が有利だが、低い解像度ならコア数が少ない方が有利

コア数を増やさず1コアあたりの性能の高さを優先するメリットは何でしょうか？

ここでは同一メーカー内のGPUラインナップで、どのGPUを選んだらいいかという観点で例を出します。例えばNVIDIA製GPUの中でどのGPUを選ぶべきかの指標です。AMD製GPUの中でどのGPUを選ぶべきかの場合も同様です。

まず、「2,000MHzの動作周波数を持った1,000コアのGPU」と、「1,000MHzの動作周波数を持った2,000コアのGPU」ではどちらが有利でしょうか。

理論性能では両者ともに単精度4TFlops(4,000GFlops)で同じです。しかし実際のゲーミング性能では前者のGPUが勝ちます。

GPUの仕事は、光源とオブジェクトと視点の座標（ベクトル）をCPUから受け取り、ディスプレイの各ピクセル（画素）の色（Red256通り×Green256通り×Blue256通り）を算出することです。1920×1080のフルHDディスプレイだったら、1920×1080=2,073,600ピクセル分の色を計算し終えたところで、1フレームの計算を終えたことになります。もしこの約200万ピクセル分の計算を0.01秒で終えることができるとフレームレート100fpsになります。計算に0.02秒かかるとフレームレートが50fpsになります。

例えば2,000コアのGPUが2,000コアをフルに稼働させて0.02秒で1フレーム分のピクセル数を計算できているとします。この場合フレームレートは50fpsです。

そうすると1,000コアのGPUは1,000コアをフルに稼働させて0.02秒で1フレーム分のピクセル数を計算できます。1,000コアは2,000コアの半分ですが、動作クロックが2倍の2,000MHzあるので、2,000コアのGPUと同じフレームレート50fpsを実現できるわけです。

しかしここで、CPUから送られてくるオブジェクトの数（計算対象の数）が少ない場合を考えます。そうなると2,000コアのようにいくらコア数があっても計算対象となるオブジェクト数が少ない以上、余ったコアは計算に使われずアイドリング状態（手持ち無沙汰）になってしまいます。つまり空回りです。

このようにオブジェクト数が少ない状態になると、2,000コアのGPUはそのうち1,000コアを稼働させて0.02秒で1フレーム分の計算を終えます。つまり先程の例と同じ50fpsです。しかし残り1,000コアは使われないまま放置状態になります。これが「コア数を使い切れない状態」になってしまう「コア数を増やす戦略の弱点」です。AMD Ryzenも同じ理由でコア数が使いきれず性能が伸びなくなっています。

一方で1,000コアのGPUは1,000コアをフルに使って計算をすることができます。もともとコア数が少ないのでコアが余ることがないからです。そして1,000コアのGPUでは2,000MHzの動作クロックがあるために、たった0.01秒で1フレーム分の計算が完了します。先程の例ではオブジェクトの数が多かったため0.02秒かかっていましたが、計算すべきオブジェクトの数が減ったため0.01秒で1フレームの計算を完了できます。そうすると1,000コアのGPUでは100fpsを実現できることになります。

これが「1コアあたりの性能が高い」GPUのメリットです。計算すべきオブジェクト数が多いときは2,000コアのGPUと差が付きませんが、オブジェクト数が少ないときは１コアあたりの性能が高い1,000コアのGPUの方が有利になります。

同一メーカーのGPUで比較する場合、フルHD解像度でゲームをするなら動作クロックが高いGPUが有利

ここでも同一メーカー内でのGPUの選び方を解説します。結論から言うと、同じNVIDIA内のGPUだったら動作クロックが高いGPUが有利です。

ゲームの入れ替わりは激しく、少し時間が経過しただけでそれまでビッグタイトルだったゲームも退場していきます。GPUは高価なPCパーツなので、多くの人は長く使える確かなものを選びたいと考えているはずです。

「今後どのようなゲームが登場しても高い性能を発揮できるGPU」を選ぶことが重要だと言えます。そのような場合には「1コアあたりの性能が高いGPU」が確かな選択です。

「1コアあたりの性能が高いGPU」は下図のうち「汎用」の青い線に該当します。一方で「1コアあたりの性能が低いGPU」は「特殊用途」の赤い線に該当します。横軸は各用途（ゲームの特性）です。

ここで重要なのは、青い線でも赤い線でも積分をすると面積は同じになるということです。

コア数が少なくても１コアあたりの性能が高いGPUでは「汎用性が高い」ため、どのようなゲームでも対応できるようになっています。

しかし、コア数は多いけど1コアあたりの性能が低いGPUでは、計算すべきオブジェクト数が多い一部のゲームでは高い性能を発揮できますが、計算すべきオブジェクト数が少ないゲームでは「1コアあたりの性能が高いGPU」よりも低い性能となってしまいます。

つまり「1コアあたりの性能が低いGPU」は汎用性を犠牲にするかわりに、計算すべきオブジェクト数が多く、多数のコアを使い切れるごく一部のゲームに特化することによってその場合には高い性能を発揮できるようにしているGPUです。4K解像度で主にゲームをする場合もこれに該当します。

一方で平均的に全体的にみれば、ほとんどのゲームで「1コアあたりの性能が高いGPU」の方がフレームレートが高くなっています。上図のように「1コアあたりの性能が低いGPU」の方が汎用性が高いためです。

もし「1コアあたりの性能が低いGPU」がマッチするごく一部のゲームしかやらないというのだったら「1コアあたりの性能が低いGPU」が最適な選択になります。しかし今後どのようなゲームをやることになっても手堅く性能を発揮したいというのなら「1コアあたりの性能が高いGPU」が良い選択です。

グラフィックボードとGPUの違い　AIB、オリジナルモデル、オリジナルファンモデルの用語解説

ここではグラフィックボードに関連する用語を解説します。

GPU (graphics processing unit)

GPUとはgraphics processing unitのことで、グラフィック処理に特化した演算器を搭載したチップそのものを指します。NVIDIAやAMDが主たるメーカーです。

graphics processingとは日本語にするとグラフィック処理になりますが、つまりは画面描画のための処理のことです。これは画面（ディスプレイ）の各画素（ドット）に何色を表示したらいいかを決定する計算処理です。

表示する色の決定のためには光源の向きと座標、物体の座標等が必要です。グラフィック処理ではそれらのベクトルを元にベクトルの内積の計算を多用します。この演算に特化しているのがGPUです。

グラフィックボード（グラボ）

一方でグラフィックボードとは、GPUを搭載し、パソコン等のコンピュータに追加的に搭載できるよう拡張ボード状にしたものです。GPUのまま単品で売られていても一般人にはどうすることもできません。動作させるためにはGPUを基盤に（電気的に接続し）搭載する必要があり、周辺の電源回路も必要になり、通信インターフェース回路も必要になります。そういった機能をまとめて組み込んだのがグラフィックボードです。グラフィックボードは、特に個人向け用途では略してグラボと呼ばれることが一般的です。

ビデオカード

ビデオカードはグラフィックボードと完全に同義です。ベンチマークのPassMarkではVideocard benchmarkと呼んでいるように、現在でもVideoCardという呼称は使われています。しかし日本国内においてはビデオカードと呼ばれることはほとんどありません。

日本においては3Dを描画するコンピュータ・グラフィクス（CG）のために必要な機器という意味合いで、「グラフィック」という単語には「重い3D描画と伴う」というイメージが付随するためビデオカードよりグラフィックボードの方がしっくりくると認識されたようです。

用語のイメージは国によって異なります。例えばAIという用語は日本ではゲーム等やロボットに搭載されているイメージが強く「遊び要素」「エンタテイメント要素」といったそこまで堅苦しくない印象があります。しかし英語圏ではAIのArtificial Intelligenceの「Intelligence」には、諜報、安全保障、軍事といったイメージがつきまとうため、英語圏ではAIというと民間のエンタメ要素といったイメージよりも国の軍事目的のイメージが強いです。

このように国によってその用語から連想するものは異なります。

また、日本におけるテレビゲームは米国ではビデオゲームと呼びます。しかし日本ではビデオというと番組を録画したものというイメージが強いためか、ビデオカードという呼称は「単に映像出力するもの」といった捉え方をする人が多いです。前述したように、いわゆるグラフィックボードは「ゲームの3D処理をするために必要な機器」というイメージが強いため、ビデオカードでは「3D処理をする機器」のイメージが捉えにくいのもありビデオカードという呼称はほとんど使われていません。

グラフィックボードの選び方

NVIDIAやAMDが提供するのはチップ（Processing Unit回路を搭載したダイ）のみであり、それを基板に搭載し冷却機構を用意、VRAMの搭載、補助電源回路の搭載といったことはASUS、MSI、ZOTAC等のグラボ製造各社が実施します。たとえ同じチップであってもこの部分で各グラフィックボードの差が付きます。以下、各社から大量にラインナップされているグラフィックボードの選び方を掲載します。

1. PCケースに収まる外形サイズを最優先する

まずは何はともあれ外形サイズが最も重要です。PCケースに搭載できない大きさのグラボを買っても意味がありません。

使用するPCケースが既に決定されている場合は簡単です。そのPCケースに合うサイズの外形のグラボを絞り込んでその中から選ぶだけです。

しかしまだPCケースが決まっていない場合は非常に大変な作業になります。

例えばFractal DesignのDefine Cには、GIGABYTEの簡易水冷一体型(240mmラジエータタイプ)グラボのラジエータをフロントに搭載すると、グラボ本体がサイズの制限で搭載できなくなります。全長が290mm台と長いのが搭載できない要因でありあと数mm足りず入り切らないようです。搭載するためにPCケースのネジ止め部分を4mm無理やり押し込んで曲げて搭載している人もいます。こういった改造（modification）をしてグラボを搭載することはあまりおすすめできません。

最もおすすめなのはPCケースとグラフィックボードを一体的に選択することです。PCケース側の問題としては、グラボの全長、厚み（占有スロット）、高さ（ロープロファイルかどうか）の対応状況が重要になります。またPCケースが334mmのグラボに対応していても、フロントに25mm厚ファンを搭載したり、水冷ラジエータ＋ファンを搭載すると290mmのグラボすら搭載できないこともあります。このような部分を詳細に調べて選ぶことが最優先です。

2. 冷却性能を後から向上させるのは難しい　最初から冷却性能が高いグラボを選択する

消費電力が高いグラボは必然的に高発熱になりGPUの性能を悪化させます。貧弱な冷却機構はGPU本来の性能を引き出せない要因です。

例えば3スロット占有で全長324mmもある大型グラボの「MSI 2080Ti LIGHTNING Z(補助電源8ピン×3)」が、それよりも消費電力が低い「Inno3D 2080Ti iCHILL BLACK(補助電源8ピン×2)」に3D Markスコアで負けてしまっている事実があります。

空冷だと、空冷の雄とも言える「ZOTAC AMP Extreme(補助電源8ピン×2)」をもってしても温度は85℃まで上がってしまいます。空冷だとこれが限界です。3スロット占有かつ全長324mmでもこの程度ですから、CPUを簡易水冷化にする前にまずは発熱量と消費電力量が大きいグラボこそまず先に簡易水冷化を考えるべきです。

簡易水冷化する場合、簡易水冷ユニット＋通常の空冷ファン(主にVRAMを冷却)のハイブリッド型と、簡易水冷のみでグラボ全体を冷却するタイプの２つがあります。

前者の場合は、「MSI SEA HAWKシリーズ」のような水冷＋空冷ファンのハイブリッド型を購入するか、「NZXT」「EVGA」から発売されている簡易水冷化キットを使ってハイブリッドタイプの簡易水冷化を行います。

後者の場合は「GIGABYTE WATERFORCEシリーズ」か「Inno3D Ichill Blackシリーズ」を選択することになります。

3. 補助電源コネクタ搭載数は多いに越したことはない　あとから最大電力を絞ることができる

PCIeの補助電源規格はCPU補助電源と比べて非常に冷遇されています。CPU補助電源は12Vの1ケーブルあたり7アンペア弱まで電流を流す仕様になっているマザーボードが多いです。実際は10Aも可能なのですが、あえて抑えています。それでも4ピンで160W程度、8ピンで320W程度も電力を取り出すことができ、8ピン＋4ピンのCPU補助電源ではTDP480W級CPUも対応可能です。

一方でPCI Expressの電源規格では、6ピン補助電源が上限75W、8ピン補助電源が上限150Wと「規定」されています。これはコネクタやケーブルの物理的な電流の上限値による制約ではなく、単なる仕様上の上限です。これは非常に絞ってあります。たとえばPCIe補助電源では8ピンであっても実際に来ている12Vのピン数はたった3つです。残り5ピンは全てGNDです。CPU補助電源では8ピンで12Vが4ピン、GNDが4ピンなのに比べるとPCIe補助電源はこの時点で劣っています。

そうなると12V×7A(CPU補助電源と同水準の電流値)×3=252Wまで取り出せると思うかもしれませんが実際は150Wまでです。なぜかというと1ピンあたり4Aまでしか電流を流さない「仕様」になっているからです。

これはあくまでも仕様なので、グラボ側の電源回路でこれを遵守しなければ8ピンPCIeコネクタから12V×7A取り出すことは可能で、実際にそのようなグラボも過去にはありました。しかし最近は律儀に「150W規制」を守っているグラボがほとんどです。

グラボへ供給できる電力は、マザーボードから供給される75Wに加えて、8ピン150W＋8ピン150Wの合計375Wが限界になっているものがほとんどです。PCIe電源規格を遵守するならさらに低く、マザーボードからの75W+8ピン150W+6ピン75Wで300Wが限界です。これではさすがに足りないということで、この規格を破って375Wグラボが大量にあるのが現実です。

しかしオーバークロックするとしたら375Wでも足りなくなることがあります。そこで8ピン×3の補助電源を搭載したグラボなら525Wまでグラボに電力供給できるようになります。空冷だとさすがに525Wは多すぎますが、多い分にはあとからツールで最大消費電力を絞って設定してあげればいいので、補助電源コネクタ数が多いに越したことはありません。残念なのは、2080Tiかつ消費電力375W運用で簡易水冷一体型だと最大温度が55℃止まりでさらにオーバークロックを狙えるのにもかかわらず、補助電源8ピン×2のみしか搭載されていないグラボが多いことです。8ピン×3のグラボが少ないのは、PCIe電源規格でコネクタ数は2つまでと規定されているため、堂々とコネクタ3つを搭載できないという事情があります。

4. ファクトリーオーバークロック値は目安　ツールで自由にオーバークロックできるため

NVIDIAが提供するリファレンスモデルは全くオーバークロックされていない基本的な動作クロックです。Founders Editionですらブーストクロックは若干オーバークロックされています。そしてASUS,MSI,ZOTAC各社のグラボはさらにオーバークロックされて出荷されておりこれを「ファクトリーオーバークロック」と呼んで区別しています。

実はファクトリーオーバークロックされていてもいなくても、各人で勝手に自由にオーバークロックできます。

ファクトリーオーバークロックだと、各自がツールでオーバークロック設定をする面倒がなく、購入してパソコンに搭載して電源を入れれば既にオーバークロックされた状態で動作するというメリットがあります。

そのためグラボのスペック表に書いてあるベースクロックの高低、ブーストクロックの高低はあまり気にする必要はありません。ファクトリーオーバークロック値が高すぎる（もっと低消費電力にしたい）場合はツールで動作クロックを落とすこともできます。実際にそのようにクロックを落としてTDP値を下げてファンレス運用しているユーザもいます。

逆にファクトリーオーバークロック値が低すぎる場合はツールでさらにオーバークロックすることもできます。ただしこの場合オーバークロックできる上限は、冷却性能と補助電源からの電力供給量によって制限されるので、冷却性能が高くかつ補助電源コネクタ数が充実しているグラボを選択することが重要です。

5. ファクトリーオーバークロック値は冷却性能の参考になる

「4」の項目でファクトリーオーバークロック値に関係なく各自で自由にオーバークロックできることを説明しました。ではファクトリーオーバークロック値は全く参考にならないかというとそうではありません。ファクトリーオーバークロック値はASUS,MSI,ZOTACといったグラボ製造元が「この程度のブーストクロックなら冷却し切れて正常に動作する」と太鼓判を押している値だからです。

メーカ側が用意した冷却機構で冷やしきれる範囲内でできるだけオーバークロックしようとするのが当然です。ブーストクロック値が大きければ大きいほど高性能なグラボだと消費者は考えるからです。そのためファクトリーオーバークロック値はそのグラボの冷却性能に追随して設定されているということです。メーカによってはギリギリのファクトリーオーバークロックをしたり、できるだけ余裕をもって低めのファクトリーオーバークロックに留めているという差があるので、ブーストクロック値が冷却性能をそのまま表すわけではないのですが参考値にはなります。実際、占有スロット数が大きい分厚いグラボや、全長が長いグラボほど高いファクトリーオーバークロック値が公称されているので一つの目安にはなります。