【2022年最新版】おすすめグラフィックボードの性能比較と選び方 NVIDIA GeForce RTX3090Ti,3080,3070,3060,3050からAMD Radeon RX6900XTまでゲーム用グラボをランキング評価

グラフィックボードについては大半の人がゲーム用に関心があると思うのでゲーム用途を前提としたグラボ評価も行っていきますが、「ゲームをやらないけど事務処理のグラフィックを軽くしたい」というニーズが大きいため、「ゲームをやるには力不足だけどブラウザ/動画再生/Excel/Word用途なら十分」なグラボも掲載してランキング化しています。

一方でグラフィックボードというのはメインのホストプロセッサ(core i9やXeonなど)の性能のみでは足りないときに、グラボを「コプロセッサ」として使う深層学習や金融分析などの科学技術計算分野でも重要視されています。ゲーム用途に比べたら遥かに少数派でしょうが、一応そのような科学技術計算の観点からの評価はこちらに分けて掲載しています。

またこのページの後半には「GPUのコア数と1コアあたりの性能」のように、時間の経過とともに変化しない普遍的なことを書いておきました。GPUは非常に進歩と陳腐化が早く入れ替わりが激しいコンピュータの構成要素ですが、根本的な部分を抑えておけば今後次々に新しいGPUが登場しても簡単に相対化して、座標のどのあたりに位置するGPUなのか判別できるようになります。

インデックス:

1位: NVIDIA GeForce RTX 3090 Ti

メーカー・モデル名NVIDIA GeForce RTX 3090 Ti
CUDA Core数10,752
TDP450W
発売日2022年3月
単精度性能39.99744 TFLOPS
倍精度性能0.625 TFLOPS
Tensor Core性能319.97952 TFLOPS
Ray Tracing性能79.9 FLOPS
ベースクロック1,560 MHz
ブーストクロック1,860 MHz
ピクセル・レート208.3 GPixel毎秒
テクスチャ・レート625 GTexel毎秒
メモリ容量24GB
メモリタイプGDDR6X
メモリクロック21.0 GT毎秒
メモリバス幅384bit
メモリ帯域幅1008.3 GB毎秒
L2共有キャッシュ6MB
接続規格PCIe 4.0 x16
アーキテクチャAmpere
コードネームGA102-350-A1
ファウンドリSamsung
プロセスルール10nm(8LPP)
トランジスタ密度45.0 MTr/mm²
トランジスタ数283億
ダイサイズ628.4mm²
SM数84
無効化SM数0
TMU数336
ROPユニット数112
Tensor Core数336
RayTracing Core数84
NVLink2-way対応
3DMark Port Royal(DX12)14,963

GeForce RTX 3090TiはAmpere世代の後期モデルであり2022年4月に発売されました。2020年にAmpere世代が発売されてから2年が経過するタイミングでの発売です。RTX4000シリーズが出る前の滑り込みモデルなのであまりおすすめしません。これを買うくらいならGeForce RTX 4000シリーズを待つのが得策です。

このGeForce RTX 3090TiはGeForce GTX 980Tiが出た頃と同じ位置づけだと捉えるのが適切です。GeForce GTX 980のマイナー改良版として発売されたGTX 980Tiですが、無理にCUDA Coreを増やしたため非常に高消費電力でした。しかもこれはまもなく発売されたGTX 1080にあっけなく負けてしまいます。GeForce RTX 3090Tiも同じ轍を踏むでしょう。

GeForce RTX 3090Tiの単位時間あたり発熱量はTDP450Wとなっており非常に高消費電力です。また、CUDA Core数をGeForce RTX 3090よりも増やすためにStreamingMultiprocessor84基を全て有効化しているため歩留りが悪く価格が無駄に高くなっています。

このようにStreamingMultiprocessorのいくつかを無効化しないで全てを有効化した「全力投球」は次期モデルが発売される直前に実施される風物詩です。

2位: NVIDIA GeForce RTX 3090

メーカー・モデル名NVIDIA GeForce RTX 3090
CUDA Core数10,496
TDP350W
発売日2020年9月
単精度性能35.686 TFLOPS
倍精度性能0.558 TFLOPS
Tensor Core性能285.491 TFLOPS
Ray Tracing性能71.1 TFLOPS
ベースクロック1,395 MHz
ブーストクロック1,695 MHz
ピクセル・レート189.8 GPixel毎秒
テクスチャ・レート555.96 GTexel毎秒
メモリ容量24GB
メモリタイプGDDR6X
メモリクロック19.5 GT毎秒
メモリバス幅384bit
メモリ帯域幅935.8 GB毎秒
L2共有キャッシュ6MB
接続規格PCIe 4.0 x16
アーキテクチャAmpere
コードネームGA102-300-A1
ファウンドリSamsung
プロセスルール10nm(8LPP)
トランジスタ密度45.0 MTr/mm²
トランジスタ数283億
ダイサイズ628.4mm²
SM数82
無効化SM数2
TMU数328
ROPユニット数112
Tensor Core数328
RayTracing Core数82
NVLink2-way対応
3DMark Port Royal(DX12)13,650

GeForce RTX 3090はNVIDIAのゲーム用GPUとしてCUDA Coreが初の1万台に乗りました。ゲーム用途で重要な単精度浮動小数点演算性能は35TFLOPSです(32bit小数の乗算or加算を1秒間に35兆回実行できる速度)。

近年GeForceでは冷遇されていた倍精度性能が1TFLOPSまで復活したのもポイントです。

このGeForce RTX 3090をゲーム用途で使いこなせるかはディスプレイ表示の解像度によります。

例えば今までフルHD解像度でGeForce RTX 2080Tiを使いゲームをしていた場合、GeForce RTX 3090を使えばフレームレートを落とさずにWQHD(2560×1440)で表示可能です。また、GeForce RTX 3090を2台購入してNVLink接続すれば、フルHD表示のRTX2080Tiと同等のフレームレートで4K表示することが可能です(NVLink対応ゲームであることが前提)。

逆に、ディスプレイ表示の解像度をWQHD(2560×1440)や4K(3940×2160)にせずにフルHDでゲームをやるのなら、GeForce RTX 3090はコストの割にさほどメリットのないGPUです(深層学習用アクセラレータとしては大いにメリットあり)。

GeForce RTX 3090では628.4mm²のチップに283億ものトランジスタを搭載することになったため、歩留まり(良品率)の悪いTSMC7nmプロセスを採用せずサムスン10nm(8LPP)プロセスルールを採用して、高いトランジスタ密度と低コストを両立しています。

RTX3080やRTX3070ではブーストクロックが余裕で1,900MHz台に乗るグラボが出てきていますが、RTX3090は単精度演算器数(CUDA Core数)が多いためギリギリ1,900MHzに乗るかどうかという水準です。

NVIDIA GeForce RTX 3090チップを搭載した各メーカーのグラボはこちらで比較しています。

3位: NVIDIA GeForce RTX 3080 Ti

メーカー・モデル名NVIDIA GeForce RTX 3080 Ti
CUDA Core数10,240
TDP350W
発売日2021年6月
単精度性能34.0992 TFLOPS
倍精度性能0.533 TFLOPS
Tensor Core性能272.7936 TFLOPS
Ray Tracing性能68.2 TFLOPS
ベースクロック1,395 MHz
ブーストクロック1,665 MHz
ピクセル・レート186.5 GPixel毎秒
テクスチャ・レート532.8 GTexel毎秒
メモリ容量12GB
メモリタイプGDDR6X
メモリクロック19 GT毎秒
メモリバス幅384bit
メモリ帯域幅912.0 GB毎秒
L2共有キャッシュ6MB
接続規格PCIe 4.0 x16
アーキテクチャAmpere
コードネームGA102-225-A1
ファウンドリSamsung
プロセスルール10nm(8LPP)
トランジスタ密度45.0 MTr/mm²
トランジスタ数283億
ダイサイズ628.4mm²
SM数80
無効化SM数4
TMU数320
ROPユニット数112
Tensor Core数320
RayTracing Core数80
NVLink非対応
3DMark Port Royal(DX12)13,262

GeForce RTX 3080Tiは、GeForce RTX3090からStreaming Multiprocessorをさらに2コア無効化してCUDA Core数10,240コアまで減らしたGPUです。

しかしCUDA Core数の減少は些末な問題であり、このGeForce RTX 3080Tiが設定された本来の理由は、暗号資産マイニングのハッシュレートを引き下げる「Lite Hash Rate(LHR)」を搭載し、ゲーム用途でGeForceを購入するユーザに製品が行き届くようにするためです。要はGeForce RTX 3090が暗号資産マイニング目的のユーザに買い占められてしまっているので、その代替としてGeForce RTX 3080Tiが投入されました。

GeForce RTX 3090と酷似している点は多く、CUDA Core数はほぼ同じです。リファレンスモデルのベースクロックとブーストクロックはRTX 3090からそれぞれ30MHzずつ下がっています。

しかし、RTX3090と比較してRTX3080TiのCUDA Core数が微減してるにも関わらずクロックの上昇が無いどころかむしろ低下しており、あえて積極的に選ぶことをおすすめできないGPUです。これを選ぶくらいなら、同時に発売されたGeForce RTX 3070Tiを強くおすすめします。

NVIDIA GeForce RTX 3080 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

4位: NVIDIA GeForce RTX 3080 12GB版

メーカー・モデル名NVIDIA GeForce RTX 3080 12GB版
CUDA Core数8,960
TDP350W
発売日2022年1月
単精度性能30.6432 TFLOPS
倍精度性能0.479 TFLOPS
Tensor Core性能245.1456 TFLOPS
Ray Tracing性能61.3 FLOPS
ベースクロック1,260 MHz
ブーストクロック1,710 MHz
ピクセル・レート177.8 GPixel毎秒
テクスチャ・レート478.8 GTexel毎秒
メモリ容量12GB
メモリタイプGDDR6X
メモリクロック19 GT毎秒
メモリバス幅384bit
メモリ帯域幅912.0 GB毎秒
L2共有キャッシュ6MB
接続規格PCIe 4.0 x16
アーキテクチャAmpere
コードネームGA102-220-A1
ファウンドリSamsung
プロセスルール10nm(8LPP)
トランジスタ密度45.0 MTr/mm²
トランジスタ数283億
ダイサイズ628.4mm²
SM数70
無効化SM数14
TMU数280
ROPユニット数104
Tensor Core数280
RayTracing Core数70
NVLink非対応
3DMark Port Royal(DX12)12,245

2022年1月に発売されたのがこのGeForce RTX 3080の12GBビデオメモリ版です。2020年9月に発売されたGeForce RTX 3080はビデオメモリ10GBでした。ただしGeForce RTX 3080の12GB版はGeForce RTX 3080から単にビデオメモリを増やしただけのGPUではなく、StreamingMultiprocessorが2基追加して有効化されているためCUDA Core数も増えていますしTensorCore性能もRayTracing性能も向上しています。GeForce RTX 3080無印を買うくらいならこの12GB版を買った方がいいのは当然ですが、RTX4000シリーズも視野に入れて検討するべきです。

5位: NVIDIA GeForce RTX 3080

メーカー・モデル名NVIDIA GeForce RTX 3080
CUDA Core数8,704
TDP320W
発売日2020年9月
単精度性能29.768 TFLOPS
倍精度性能0.465 TFLOPS
Tensor Core性能238.141 TFLOPS
Ray Tracing性能59.5 TFLOPS
ベースクロック1,440 MHz
ブーストクロック1,710 MHz
ピクセル・レート164.2 GPixel毎秒
テクスチャ・レート465.12 GTexel毎秒
メモリ容量10GB
メモリタイプGDDR6X
メモリクロック19 GT毎秒
メモリバス幅320bit
メモリ帯域幅760 GB毎秒
L2共有キャッシュ5MB
接続規格PCIe 4.0 x16
アーキテクチャAmpere
コードネームGA102-200-KD-A1
ファウンドリSamsung
プロセスルール10nm(8LPP)
トランジスタ密度45.0 MTr/mm²
トランジスタ数283億
ダイサイズ628.4mm²
SM数68
無効化SM数16
TMU数272
ROPユニット数96
Tensor Core数272
RayTracing Core数68
NVLink非対応
3DMark Port Royal(DX12)11,578

GeForce RTX 3080はGeForce RTX 3090と同じGA102チップを使っていて多くの点で酷似しています。CUDA Coreを単純に減らしたのがGeForce RTX 3080です。CUDA Coreを減らしたことに付随してビデオメモリサイズやL2共有キャッシュサイズも削減されています。一方で、CUDA Coreを減らしたことによって一つ一つのコアに割り当てることのできる電力に余裕ができているため、動作クロックはGeForce RTX 3090より向上しています。

このGeForce RTX 3080のオリジナルファンモデルではブーストクロックが1,935MHzに達する製品が出てきています。この1,935MHzという動作クロックは前世代(Turing世代)のフラッグシップモデルだったGeForce RTX 2080Tiの空冷式オリジナルファンモデルの中で、大型ヒートシンクを搭載した高級モデルのブーストクロック1,815MHzを大幅に超える水準です。

一方で、GeForce RTX 2080ではNVLink対応だったのがGeForce RTX 3080では非対応になっている点は注意です。

NVIDIA GeForce RTX 3080チップを搭載した各メーカーのグラボはこちらで比較しています。

6位: NVIDIA GeForce RTX 3070 Ti

メーカー・モデル名NVIDIA GeForce RTX 3070 Ti
CUDA Core数6,144
TDP290W
発売日2021年6月
単精度性能21.74976 TFLOPS
倍精度性能0.340 TFLOPS
Tensor Core性能173.99808 TFLOPS
Ray Tracing性能43.5 TFLOPS
ベースクロック1,575 MHz
ブーストクロック1,770 MHz
ピクセル・レート169.9 GPixel毎秒
テクスチャ・レート339.8 GTexel毎秒
メモリ容量8GB
メモリタイプGDDR6X
メモリクロック19 GT毎秒
メモリバス幅256bit
メモリ帯域幅608.3 GB毎秒
L2共有キャッシュ4MB
接続規格PCIe 4.0 x16
アーキテクチャAmpere
コードネームGA104-400-A1
ファウンドリSamsung
プロセスルール10nm(8LPP)
トランジスタ密度44.3 MTr/mm²
トランジスタ数174億
ダイサイズ392.5mm²
SM数48
無効化SM数0
TMU数192
ROPユニット数96
Tensor Core数192
RayTracing Core数48
NVLink非対応
3DMark Port Royal(DX12)8,875

GeForce RTX 3070Tiは2021年6月10日にリリースされたGPUです。2021年6月3日のGeForce RTX 3080Tiリリースとほぼ同時期です。このGPUが発売された時期は暗号資産のマイニング目的でGeForceシリーズが買い占められてしまい、本来はゲーム向けのGPUであるGeForceがゲーマーの手に行き届かないことが問題となっており、GeForce RTX 3070Tiは発売当初からハッシュレート制限機能が搭載されました。

評価については、既発売のGeForce RTX 3090,3080,3070,3060Ti,3060を含めて比較しても、FullHDでゲームをやるのならこのGeForce RTX 3070TiはAmpere世代GPUの中で最もおすすめできます。RTX3080よりもブーストクロック、ベースクロック共に向上しており、リファレンスモデルのベースクロックの高さに至ってはAmpere世代GPUの中でトップです。ブーストクロックの高さもGeForce RTX 3060に次いで2位です。GeForce RTX 3060はなぜブーストクロックが高いかというと、RTX3060はそもそもCUDA Core数が少ないGPUなのでブーストクロックを高めやすいという事情があります。

GeForce RTX 3060はCUDA Core数が控えめな一方で、GeForce RTX 3070Tiは6,144コアも搭載しています。RTX3060レベルのブーストクロックを実現しながらも、GeForce RTX 3070TiはCUDA Core数の多さとクロックの高さを両取りできている優秀なGPUになっています。

NVIDIA GeForce RTX 3070 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

7位: NVIDIA GeForce RTX 3070

メーカー・モデル名NVIDIA GeForce RTX 3070
CUDA Core数5,888
TDP220W
発売日2020年10月
単精度性能20.3136 TFLOPS
倍精度性能0.3174 TFLOPS
Tensor Core性能162.5088 TFLOPS
Ray Tracing性能40.6 TFLOPS
ベースクロック1,500 MHz
ブーストクロック1,725 MHz
ピクセル・レート165.6 GPixel毎秒
テクスチャ・レート317.4 GTexel毎秒
メモリ容量8GB
メモリタイプGDDR6
メモリクロック14 GT毎秒
メモリバス幅256bit
メモリ帯域幅448.0 GB毎秒
L2共有キャッシュ4MB
接続規格PCIe 4.0 x16
アーキテクチャAmpere
コードネームGA104-300-A1
ファウンドリSamsung
プロセスルール10nm(8LPP)
トランジスタ密度44.3 MTr/mm²
トランジスタ数174億
ダイサイズ392.5mm²
SM数46
無効化SM数2
TMU数184
ROPユニット数96
Tensor Core数184
RayTracing Core数46
NVLink非対応
3DMark Port Royal(DX12)8,308

GeForce RTX 2080TiからCUDA Coreを大幅に増加させてる一方で、低消費電力化とブーストクロック向上を同時に達成しているGPUです。フルHDでゲームをする場合にはRTX3090,RTX3080よりもおすすめできます。

空冷式タイプでブーストクロックが1,935MHzに達するオリジナルファンモデルが既に存在するため、フレームレート性能を上げるために購入する際はできるだけファクトリーオーバークロック値のブーストクロックが高いモデルを選ぶのがおすすめです。

NVIDIA GeForce RTX 3070チップを搭載した各メーカーのグラボはこちらで比較しています。

8位: AMD Radeon RX 6900 XT

メーカー・モデル名AMD Radeon RX 6900 XT
SP数5,120
TDP300W
発売日2020年12月
単精度性能23.040 TFLOPS
倍精度性能1.440 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,825 MHz
ブーストクロック2,250 MHz
ピクセル・レート288.0 GPixel毎秒
テクスチャ・レート720.0 GTexel毎秒
メモリ容量16GB
メモリタイプGDDR6
メモリクロック16 GT毎秒
メモリバス幅256bit
メモリ帯域幅512 GB毎秒
L2共有キャッシュ4MB
接続規格PCIe 4.0
アーキテクチャRDNA 2.0
コードネームNavi 21
ファウンドリTSMC
プロセスルール7nm
トランジスタ密度51.5 MTr/mm²
トランジスタ数268億
ダイサイズ519.8mm²
Compute Unit数80
無効化CU数0
TMU数320
ROPユニット数128
Tensor Core数0
RayTracing Core数0
Multi GPU非対応
3DMark Port Royal(DX12)10,400

AMD Radeon RX 6900 XTは末尾文字(suffix)に”XT”を使い、NVIDIA GeForce 3090よりも型番上は上のグレードに見せつつも実際は単精度コア数が5,120コアにとどまり、GeForce RTX 3090の10,496コアに遠く及ばなかったGPUです。

AMD Radeon RX 6900 XTはNavi21チップに搭載されている80基のCompute Unitを全て有効化しています。つまり最大限に背伸びしても5,120コアしか実現できなかったことになります。2基のStreaming Multiprocessorを無効化しても10,496コアを実現しているNVIDIA GeForce RTX 3090とは対照的です。

AMD Radeon RX 6900 XTチップを搭載した各メーカーのグラボはこちらで比較しています。

9位: NVIDIA GeForce RTX 3060 Ti

メーカー・モデル名NVIDIA GeForce RTX 3060 Ti
CUDA Core数4,864
TDP200W
発売日2020年12月
単精度性能16.19712 TFLOPS
倍精度性能0.253 TFLOPS
Tensor Core性能129.577 TFLOPS
Ray Tracing性能32.4 TFLOPS
ベースクロック1,410 MHz
ブーストクロック1,665 MHz
ピクセル・レート133.2 GPixel毎秒
テクスチャ・レート253.1 GTexel毎秒
メモリ容量8GB
メモリタイプGDDR6
メモリクロック14 GT毎秒
メモリバス幅256bit
メモリ帯域幅448.0 GB毎秒
L2共有キャッシュ4MB
接続規格PCIe 4.0 x16
アーキテクチャAmpere
コードネームGA104-200-A1
ファウンドリSamsung
プロセスルール10nm(8LPP)
トランジスタ密度44.3 MTr/mm²
トランジスタ数174億
ダイサイズ392.5mm²
SM数38
無効化SM数10
TMU数152
ROPユニット数80
Tensor Core数152
RayTracing Core数38
NVLink非対応
3DMark Port Royal(DX12)6,982

2020年12月にリリースされたGeForce RTX 3060Tiは型番だけみるとミドルエンドに見えますが、実際はCUDA Coreを4,864コアも搭載している高性能GPUです。このCUDA Core数は前世代(Turing世代)のGeForce RTX 2080Ti(4,352コア)を超える水準です。

単にコア数を増やすだけでなく、ASUS ROG STRIX等のオリジナルファンモデルではブーストクロック1,900MHzに迫った高クロックモデルが存在しており、そのようなモデルを使うと競合他社のRadeon RX 6800 XTよりも遥かに高いフレームレート性能を叩き出します。

YouTube等のフレームレート比較動画では、GeForce RTX 3060TiとRadeon RX6800XTを比較したものではGeForce RTX 3060Tiのフレームレートが低いように見せかけているものが掲載されていますが、それはNVIDIAリファレンスモデルだったりブーストクロックが低い低グレードのオリジナルファンモデルのGeForce RTX 3060Tiを使って比較しているためです。

AMD製のGPU全般に言えることなのですが、Radeonはリファレンスモデルとオリジナルファンモデルのブーストクロックは殆ど変わらず性能も殆ど変わりません。

一方で、NVIDIA製GPUはリファレンスモデルのブーストクロックが低く設定されていて、オリジナルファンモデルのブーストクロックは大幅に高くなる傾向があり、リファレンスモデルとオリジナルファンモデルでブーストクロックに大きな差があります。ASUS,MSI,GIGABYTEといったメーカーが出しているオリジナルファンモデルの上位モデルを使うとGeForce RTX 3060Tiは非常に高速であり、どのような分野のゲームでもRadeon RX6800XTを上回るフレームレートになります。

NVIDIA GeForce RTX 3060 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

10位: NVIDIA TITAN RTX

メーカー・モデル名NVIDIA TITAN RTX
CUDA Core数4,608
TDP280W
発売日2018年12月
単精度性能16.312 TFLOPS
倍精度性能0.5098 TFLOPS
Tensor Core性能130.49856 TFLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,350 MHz
ブーストクロック1,770 MHz
ピクセル・レート169.92 GPixel毎秒
テクスチャ・レート509.76 GTexel毎秒
メモリ容量24GB
メモリタイプGDDR6
メモリクロック14 GT毎秒
メモリバス幅384bit
メモリ帯域幅672 GB毎秒
L2共有キャッシュ6MB
接続規格PCIe 3.0
アーキテクチャTuring
コードネームTU102-400-A1
ファウンドリTSMC
プロセスルール12nm
トランジスタ密度24.7 MTr/mm²
トランジスタ数186億
ダイサイズ754mm²
SM数72
無効化SM数0
TMU数288
ROPユニット数96
Tensor Core数576
RayTracing Core数72
NVLink2-way対応
3DMark Port Royal(DX12)9,865

4,608コア搭載しブーストクロック1,770MHzのグラボで、Turing世代ゲーム用GPUの中ではフラッグシップモデル。

使用されているダイ(チップ)はTU102でRTX2080Tiと同じです。よってダイ面積も754m㎡で同じです。

ではRTX2080TiとこのTitan RTXでは何が違うかと言うと、Titan RTXではダイ上のすべてのコアが有効化されています。つまりダイ上にエラーが許されないため歩留まりが悪く、それがこの価格の高さに直結しています。

リファレンスモデルしかないので日本国内では菱洋エレクトロ株式会社が代理店となり単一製品を各小売店が販売しています。

FLOPS性能ではブーストクロック1,770MHz時に16.312TFLOPSあるため、2080Tiの「ZOTAC AMP Extreme」が実現しているブーストクロック1,815MHz時の15.798TFLOPSを上回る性能です。

しかし、4,352コアの2080Tiで1,770MHzのブーストクロックを実現した「MSI LIGHTNING Z」は3スロット占有かつ全長328mmの冷却機構を備えています。同じ1,770MHzで4,608コアのTITAN RTXはそれよりも発熱量が大きいのは当然にもかかわらず冷却は2スロット占有267mm全長でファン×2。どうみてもTITAN RTXは1,770MHzのブーストクロックを出すのには適していません。各自で簡易水冷化するなどして冷却しないと本来の性能を引き出すのは難しいです。

TITAN RTXの基板規格はRTX2080Ti Founders Editionと同じであり、RTX2080Tiでも使える簡易水冷化キットが使用可能です。Titan RTXは簡易水冷化キット+CorsairやEVGA等の簡易水冷クーラーを組合せて使用しないと宝の持ち腐れになります。しかしこのTitan RTXは外形上の見た目が非常に良いので、簡易水冷化すると初期状態よりも見た目が悪くなるのは確実でありそこは非常にもったいない点です。

また、TITAN RTXの2080Tiより多いコア数がゲームでのフレームレート性能に直結するかといったらゲームによります。場合によってはコア数の多さよりも動作周波数の高さのほうがフレームレートの高さに貢献する場合があります。その場合は補助電源8ピン×3を搭載した「2080Ti MSI LIGHTNING Z」を限界までオーバークロックしたほうが有利です。

このTITAN RTXは十分に並列性が高い機械学習のコプロセッサとして使うには最適です。機械学習は応用分野によって単精度でいいか倍精度が必要か異なりますが、金融分析以外なら単精度で十分なので単精度浮動小数点演算能力に特化しているTITAN RTXは最適です。並列性が高く各コアを十分に使いきれるのなら補助電源8ピン×2で低い動作周波数であっても、オーバークロックした2080Tiより高いFlops性能が出ます。

難しいことを考えず単にゲーム用として使うことしか考えてないというのなら、2080Tiの「ZOTAC AMP Extreme」や「MSI LIGHTNING Z」を選んだほうが面倒がなくおすすめできます。

NVIDIA Titan RTX Graphics Card
NVIDIA
¥377,999(2022/08/14 01:25時点)

11位: NVIDIA GeForce RTX 2080 Ti

メーカー・モデル名NVIDIA GeForce RTX 2080 Ti
CUDA Core数4,352
TDP250W
発売日2018年9月
単精度性能13.448 TFLOPS
倍精度性能0.42024 TFLOPS
Tensor Core性能107.58144 TFLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,350 MHz
ブーストクロック1,545 MHz
ピクセル・レート135.96 GPixel毎秒
テクスチャ・レート420.24 GTexel毎秒
メモリ容量11GB
メモリタイプGDDR6
メモリクロック14 GT毎秒
メモリバス幅352bit
メモリ帯域幅616 GB毎秒
L2共有キャッシュ6MB
接続規格PCIe 3.0
アーキテクチャTuring
コードネームTU102-300-K1-A1
ファウンドリTSMC
プロセスルール12nm
トランジスタ密度24.7 MTr/mm²
トランジスタ数186億
ダイサイズ754mm²
SM数68
無効化SM数4
TMU数272
ROPユニット数88
Tensor Core数544
RayTracing Core数68
NVLink2-way対応
3DMark Port Royal(DX12)9,109

2018年発売のTuring(チューリング)世代ゲーム用グラボの中で上位に位置するモデルです。これより上にTITAN RTXがありますが、TITAN RTXはダイTU102のStreaming Multiprocessor72基全てを有効化しているため歩留まりが悪化し価格が非常に高くなってしまっています。そこで、このRTX2080TiではStreaiming Multiprocessorのうち4基を無効化し68基のみ有効化し歩留まりを改善し価格を安くしています。

Titan RTXでは4,608コア全てが有効化されていますが、RTX2080Tiではそのうち4,352コアが有効化されていることになります。

コア数を絞り1コアあたりの動作周波数を上げた「オーバークロック版の2080Ti」のほうがほとんどのゲームにおいてTITAN RTXよりもゲームのフレームレート(fps)が向上します。

「少ないコア数で高い動作周波数」と「多いコア数で低い動作周波数」なら、前者を達成するほうが後者を達成するよりも技術的に難易度が高いです。IntelもNVIDIAもできるだけ前者を目指していますが、それ以上どうしても動作周波数を上げられない場合はコア数を増やす水平展開をしています。それがTITAN RTXです。コア数を少なくして動作周波数の高さを追求してるのが2080Tiです。

AMDのグラボは動作周波数を高くする技術力がないためコア数の多さで勝負していますが、コア数が多いグラボを活かしきれるゲームが少ないため結果的に1コアの性能が高いNVIDIAのグラボのほうが有利です。

NVIDIA GeForce RTX 2080 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

12位: AMD Radeon RX 6800 XT

メーカー・モデル名AMD Radeon RX 6800 XT
SP数4,608
TDP300W
発売日2020年11月
単精度性能20.736 TFLOPS
倍精度性能1.296 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,825 MHz
ブーストクロック2,250 MHz
ピクセル・レート288.0 GPixel毎秒
テクスチャ・レート648.0 GTexel毎秒
メモリ容量16GB
メモリタイプGDDR6
メモリクロック16 GT毎秒
メモリバス幅256bit
メモリ帯域幅512 GB毎秒
L2共有キャッシュ4MB
接続規格PCIe 4.0
アーキテクチャRDNA 2.0
コードネームNavi 21
ファウンドリTSMC
プロセスルール7nm
トランジスタ密度51.5 MTr/mm²
トランジスタ数268億
ダイサイズ519.8mm²
Compute Unit数72
無効化CU数8
TMU数288
ROPユニット数128
Tensor Core数0
RayTracing Core数0
Multi GPU非対応
3DMark Port Royal(DX12)9,546

2020年11月発売のRadeon RX 6800 XTは4,608コアの単精度演算器(StreamProcessor)を搭載し、2018年発売のNVIDIA TITAN RTXと同じ数の単精度演算器(CUDA Core)数です。

アーキテクチャ面ではNVIDIA Turingが、Radeon RX 6800 XTで採用されたAMD RDNA2アーキテクチャよりも優秀ですが、その技術力の差を埋めるためにRadeon RX 6800 XTでは動作クロックを2,000MHz台まで大幅に引き上げています。それでもNVIDIA Ampereアーキテクチャを採用したGeForce RTX 3070より低い性能です。

AMD Radeon RX 6800 XTチップを搭載した各メーカーのグラボはこちらで比較しています。

13位: NVIDIA GeForce RTX 3060

メーカー・モデル名NVIDIA GeForce RTX 3060
CUDA Core数3,584
TDP170W
発売日2021年2月 / 2021年9月
単精度性能12.73754 TFLOPS
倍精度性能0.199 TFLOPS
Tensor Core性能101.900 TFLOPS
Ray Tracing性能25 TFLOPS
ベースクロック1,320 MHz
ブーストクロック1,777 MHz
ピクセル・レート85.3 GPixel毎秒
テクスチャ・レート199.0 GTexel毎秒
メモリ容量12GB
メモリタイプGDDR6
メモリクロック15 GT毎秒
メモリバス幅192bit
メモリ帯域幅360.0 GB毎秒
L2共有キャッシュ3MB
接続規格PCIe 4.0 x16
アーキテクチャAmpere
コードネームGA106-300-A1 / GA104-150-A1
ファウンドリSamsung
プロセスルール10nm(8LPP)
トランジスタ密度48.0 MTr/mm² / 44.3 MTr/mm²
トランジスタ数132.5億 / 174億
ダイサイズ276mm² / 392.5mm²
SM数28
無効化SM数2
TMU数112
ROPユニット数48
Tensor Core数112
RayTracing Core数28
NVLink非対応
3DMark Port Royal(DX12)5,154

2021年2月にリリースされたGeForce RTX 3060はGeForce RTX 2080Tiよりは低性能だけれども、GeForce RTX 2080を上回るフレームレート性能を実現する十分に高性能なGPUです。

ただし、GeForce RTX 3060TiとGeForce RTX 3060の間には大きな性能上の乖離があり、CUDA Core数を見てもGeForce RTX 3060Tiの4,864コアに対し、GeForce RTX 3060は3,584コアでありコア数の差にして1,280コアもの違いがあります。単にコア数だけではなく、採用されているGPUチップを見てもGeForce RTX 3060Tiで採用されているのは上位のGA104であり、GeForce RTX 3060で採用されているのはそれよりも下位のGA106チップです。

つまり、「GeForce RTX 3060はGeForce RTX 3060Tiよりちょっとだけ下」という認識は誤りです。「GeForce RTX 3060はGeForce RTX 3060Tiよりも大幅に下でその間に断絶がある」くらいの認識を持っておいた方がいいです。

あえてGeForce RTX 3060TiではなくGeForce RTX 3060を選ぶ理由があるとしたら低消費電力性です。本格的に低消費電力を狙うなら「補助電源不要または補助電源コネクタ6ピン×1」で動作するGeForce RTX 3050を待った方がいいでしょうが、Radeon RX 6800を上回る性能を有してそこそこ低消費電力のGPUを選ぶならGeForce RTX 3060は良いGPUです。

さらにこのGeForce GTX 3060は、2017年3月に発売された名作GPU「GeForce GTX 1080Ti」と同じCUDA Core数3,584コアを搭載しています。にもかかわらず消費電力は1080Tiよりも大幅に削減されており、ブーストクロックはむしろ大幅に上昇。さらにGeForce RTC 3060はTensorCoreという16bit4×4行列の積和浮動小数点演算(FMA)に特化した演算器も搭載し、深層学習(世間では人工知能と呼ばれている機械学習の一類型)向けの演算性能を高めているので、「同じCUDA Core数のGeForce GTX 1080Tiよりも消費電力を下げつつも性能を大幅に引き上げしかも低価格化を実現」したのがGeForce RTX 3060です。

NVIDIA GeForce RTX 3060チップを搭載した各メーカーのグラボはこちらで比較しています。

14位: AMD Radeon RX 6800

メーカー・モデル名AMD Radeon RX 6800
SP数3,840
TDP250W
発売日2020年11月
単精度性能16.166 TFLOPS
倍精度性能1.0104 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,700 MHz
ブーストクロック2,105 MHz
ピクセル・レート202.1 GPixel毎秒
テクスチャ・レート505.2 GTexel毎秒
メモリ容量16GB
メモリタイプGDDR6
メモリクロック16 GT毎秒
メモリバス幅256bit
メモリ帯域幅512 GB毎秒
L2共有キャッシュ4MB
接続規格PCIe 4.0
アーキテクチャRDNA 2.0
コードネームNavi 21
ファウンドリTSMC
プロセスルール7nm
トランジスタ密度51.5 MTr/mm²
トランジスタ数268億
ダイサイズ519.8mm²
Compute Unit数60
無効化CU数20
TMU数240
ROPユニット数96
Tensor Core数0
RayTracing Core数0
Multi GPU非対応
3DMark Port Royal(DX12)7,796

2020年11月発売のRadeon RX 6800は3,840コアの単精度演算器(StreamProcessor)を搭載しています。リファレンスモデルの時点でブーストクロックが高めですが、オリジナルファンモデルでもブーストクロックは殆ど増えず、むしろオリジナルファンモデルでも本来のブーストクロックを実現するだけの冷却性能を実現できるか微妙なほど高発熱なGPUです。

GeForce RTX 2080Tiよりもフレームレート性能が高いとしているベンチマーク動画が多く出回っていますが、それはリファレンスモデルのGeForce RTX 2080Tiと比較しているためです。NVIDIA GeForceはリファレンスモデルのブーストクロックが極めて低いため、リファレンスモデル同士で比較するとAMD Radeon RX 6800が有利に見えるようにできています。オリジナルファンモデル同士で比較するとGeForce RTX 2080Tiのフレームレート性能がRadeon RX 6800に対して圧勝してしまいます。

AMD Radeon RX 6800チップを搭載した各メーカーのグラボはこちらで比較しています。

15位: NVIDIA GeForce RTX 2080 Super

メーカー・モデル名NVIDIA GeForce RTX 2080 Super
CUDA Core数3,072
TDP250W
発売日2019年7月
単精度性能11.150 TFLOPS
倍精度性能0.3485 TFLOPS
Tensor Core性能89.21088 TFLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,650 MHz
ブーストクロック1,815 MHz
ピクセル・レート116.16 GPixel毎秒
テクスチャ・レート348.48 GTexel毎秒
メモリ容量8GB
メモリタイプGDDR6
メモリクロック15.5 GT毎秒
メモリバス幅256bit
メモリ帯域幅496 GB毎秒
L2共有キャッシュ4MB
接続規格PCIe 3.0
アーキテクチャTuring
コードネームTU104-450-A1
ファウンドリTSMC
プロセスルール12nm
トランジスタ密度24.7 MTr/mm²
トランジスタ数136億
ダイサイズ545mm²
SM数48
無効化SM数0
TMU数192
ROPユニット数64
Tensor Core数384
RayTracing Core数46
NVLink2-way対応
3DMark Port Royal(DX12)7,006

NVIDIA GeForce RTX 2080 Superは2019年7月リリースのGPUです。位置付けとしてはRTX2080Tiの下位版というよりも、RTX2080の性能を上昇させた位置付けです。

RTX2080Superで採用されているチップはTU104でありRTX2080と同じです。RTX2080TiではTPU102チップが採用されています。

つまりRTX2080Tiの性能を低く抑えたのではなく、RTX2080の性能を向上させる方法で実現されたのがRTX2080Superになります。CUDA Core数はRTX2080比+128の3,072コアで微増ですがクロック周波数が大幅に向上しています。

普通はコア数を増やすと消費電力(単位時間あたりの発熱量)の制約の観点からクロック周波数を引き下げるのが通例です。

例えば2018年発売に発売された2つのGPU、RTX2080(2,944コア、1,710MHz)とRTX2080Ti(4,352コア、1,545MHz)においてはRTX2080TiのCUDA Core数が大幅に多い一方でリファレンスモデルのブーストクロックは1,545MHz止まりとなり、RTX2080のブーストクロック1,710MHzより下がっています。RTX2080Tiオリジナルファンモデルの大型ヒートシンク搭載ZOTAC Amp ExtremeやMSI Lightning Zであってもファクトリーオーバークロック後のブーストクロック周波数1,815MHz止まりです。

しかしRTX2080Superではリファレンスモデルのブーストクロックでも1,815MHzを達成しています。さらにオリジナルファンモデルのZOTAC Amp Extremeではブーストクロック1,875MHzに届きます。

これはRTX2080を2018年にリリースしてから1年近くが経過し半導体製造における歩留まりが向上したことで、より低発熱(低消費電力)でクロック周波数が上昇する個体(チップ)を入手しやすくなったためです。

このようなCUDA Coreあたりのクロック周波数の向上は高画質設定時のフレームレート向上で有利です。CUDA Core数を増やすことは高解像度(4K,1440p)におけるフレームレート向上で有利ですが、逆に低解像度(1080p)ならCUDA Core(FP32演算器)数の多さよりもクロック周波数の高さが重要です。

つまりRTX2080Superでは、解像度をFullHD(1080p)から1440pや4Kまで上げたときのフレームレート性能の向上よりも、高画質設定にしたときのフレームレート性能向上が重視されていることになります。ゲームの結果を重視するなら解像度を1440pや4Kまで上昇させるニーズはほとんどありません。画質設定を高く設定してゲームをするのならRTX2080Superは非常に適しています。

またAMD Radeonとの比較においては、RTX2060Superにも勝てないRadeon RX 5700 XTでは当然RTX2080Superと全く勝負になりません。

そしてRTX2070Superにも勝てていないRadeon VIIも同様にRTX2080Superと全く勝負になりません。

RTX2070SuperとRTX2080を上回るこのRTX2080Super相手に、Radeon VIIやRadeon RX5700XTでは全く歯が立たないということです。つまりAMD RadeonシリーズはRTX2080Superの前では「戦力外」ということになります。RTX2080Superと比較するのはRTX2080TiかRTX2080です。

予算が許すなら簡易水冷版のRTX2080Tiが「価格と消費電力以外」のすべてにおいてRTX2080Superより優れています。簡易水冷版のRTX2080Tiなら120mmラジエータタイプでも1,900MHz弱を実現でき、240mmラジエータタイプなら2,000MHz超を50℃台ピークアウトで実現できます。つまりこの場合RTX2080TiがRTX2080SuperのCUDA Core数を上回りかつクロック周波数もRTX2080Superを上回ることになり完全に上位になります。ただし空冷版のRTX2080Tiになると最大クロック周波数がRTX2080Superと同等かそれ以下になり、「すべての場合においてRTX2080Tiの性能がRTX2080Superを上回るわけではない」ということになります。

RTX2080Super or RTX2080の比較では、空冷版であってもRTX2080SuperがCUDA Core数とクロック周波数両面においてRTX2080より優秀です。これは「高いけど高性能なRTX2080Super」か「安いけど低性能なRTX2080」という予算と性能のトレードオフでの比較になります。

NVIDIA GeForce RTX 2080 Superチップを搭載した各メーカーのグラボはこちらで比較しています。

16位: NVIDIA GeForce RTX 2080

メーカー・モデル名NVIDIA GeForce RTX 2080
CUDA Core数2,944
TDP215W
発売日2018年9月
単精度性能10.068 TFLOPS
倍精度性能0.31464 TFLOPS
Tensor Core性能80.54784 TFLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,515 MHz
ブーストクロック1,710 MHz
ピクセル・レート109.44 GPixel毎秒
テクスチャ・レート314.64 GTexel毎秒
メモリ容量8GB
メモリタイプGDDR6
メモリクロック14 GT毎秒
メモリバス幅256bit
メモリ帯域幅448 GB毎秒
L2共有キャッシュ4MB
接続規格PCIe 3.0
アーキテクチャTuring
コードネームTU104-400-A1
ファウンドリTSMC
プロセスルール12nm
トランジスタ密度25.0 MTr/mm²
トランジスタ数136億
ダイサイズ545mm²
SM数46
無効化SM数2
TMU数184
ROPユニット数64
Tensor Core数368
RayTracing Core数46
NVLink2-way対応
3DMark Port Royal(DX12)

CUDAコアを2,944コア搭載したTuring世代グラボです。RayTracingCoreやTensorCoreを搭載してしまったことにより、ゲーミング用に割り当てる演算回路のチップ上面積が減ってしまい、ゲーミング性能に関しては先代のGTX1080Tiと同程度に留まってしまいました。

とはいっても現在の価格は1080TiよりもRTX2080のほうが安いです。1080Tiは生産を終了し品薄になってしまったためであり現在は2080が主流です。

しかし1080Tiを使わず1080で済ませているプロゲーマーが多かったことから、RTX2080の性能は必要なくRTX2070で十分なケースもあります。

ゲームは画質設定を最低にしたほうが視認性がよくなるため、プロゲーマーでも1080を使い1080Tiを使わない人は多かったです。

TwitchやYoutubeでストリーマーとして配信するのなら見栄えにこだわるため高画質設定でもフレームレートが落ちにくい2080Tiや2080を買うのもありでしょうが、単にフレームレートを高くしゲームでの優位性だけを追求するのなら低画質設定でRTX2070でも十分です。

また各ゲームのフレームレートベンチマークでは、RTX2080TiよりもこのRTX2080無印のほうが上になることが多々あります。その理由はRTX2080無印はRTX2080TiよりもCUDA Core数が少ない一方で、動作クロックが高いためです。コア数を使いきれないゲームではコア数が多いRTX2080Tiではフレームレートが伸びません。そのかわり1コアあたりのクロックが高いRTX2080無印では計算すべきオブジェクト数が少ないゲームの場合、RTX2080Tiより高いフレームレートを叩き出します。

このようにしてみるとRTX2080Tiよりもフレームレートが高くなっているゲームがあることがわかると思います。例えばLoLです。LoLは明らかにハイエンドのグラボが不要なゲームですが、なぜハイエンドが不要かというと計算すべき対象のオブジェクト数が少ないからです。

NVIDIA GeForce RTX 2080チップを搭載した各メーカーのグラボはこちらで比較しています。

17位: NVIDIA GeForce GTX 1080 Ti

メーカー・モデル名NVIDIA GeForce GTX 1080 Ti
CUDA Core数3,584
TDP250W
発売日2017年3月
単精度性能11.3397 TFLOPS
倍精度性能0.3543 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,480 MHz
ブーストクロック1,582 MHz
ピクセル・レート139.2 GPixel毎秒
テクスチャ・レート354.3 GTexel毎秒
メモリ容量11GB
メモリタイプGDDR5X
メモリクロック11 GT毎秒
メモリバス幅352bit
メモリ帯域幅484 GB毎秒
L2共有キャッシュ2.75MB
接続規格PCIe 3.0
アーキテクチャPascal
コードネームGP102-350-K1-A1
ファウンドリTSMC
プロセスルール16nm
トランジスタ密度25.5 MTr/mm²
トランジスタ数120億
ダイサイズ471mm²
SM数28
無効化SM数2
TMU数224
ROPユニット数88
Tensor Core数0
RayTracing Core数0
NVLink4-waySLI対応
3DMark Port Royal(DX12)

1080Tiは2017年発売でもうかなり古いGPUですが、2018年発売のRTXシリーズが大コケしたため消去法的に価値あるグラボになってしまいました。

特に2018年発売Turing世代のRTX2080Tiは1080Tiに毛が生えた程度のベンチマーク性能しかなく、その後発売されたTuring世代のフラッグシップモデルTITAN RTXにいたってはオーバークロックしたRTX2080Tiにも負けてるということで、さらに1080Tiの価値が高まってしまいました。

残念ながら1080Tiは生産終了した上に正規品の新品は既に在庫が切れているため、高額な転売品を選ぶしか手がないので、それなら新品のRTX2080を正規で購入したほうがいいという状況です。本来ならこのレイトレーシング対応という大ミスをしたNvidiaの失策をチャンスとみてAMD Radeonが追撃するところですがRadeon VIIにはそれだけの力がなかったので、Turing世代の次がでる2020年4月までは2018年発売のRTX失敗作を選ぶしか無いのが現状です。

さすがにRTX2080無印には負けていますが、そこまで大きな差がついていません。特にApex Legendsではほぼ差がついていないので、既にGTX1080Tiを持っているのなら積極的にRTX2080無印に買い換える必要はないでしょう。

NVIDIA GeForce GTX 1080 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

18位: NVIDIA GeForce RTX 2070 Super

メーカー・モデル名NVIDIA GeForce RTX 2070 Super
CUDA Core数2,560
TDP215W
発売日2019年7月
単精度性能9.060 TFLOPS
倍精度性能0.2832 TFLOPS
Tensor Core性能72.49920 TFLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,605 MHz
ブーストクロック1,770 MHz
ピクセル・レート113.28 GPixel毎秒
テクスチャ・レート283.20 GTexel毎秒
メモリ容量8GB
メモリタイプGDDR6
メモリクロック14 GT毎秒
メモリバス幅256bit
メモリ帯域幅448 GB毎秒
L2共有キャッシュ4MB
接続規格PCIe 3.0
アーキテクチャTuring
コードネームTU104-410-A1
ファウンドリTSMC
プロセスルール12nm
トランジスタ密度24.7 MTr/mm²
トランジスタ数136億
ダイサイズ545mm²
SM数40
無効化SM数8
TMU数160
ROPユニット数64
Tensor Core数320
RayTracing Core数40
NVLink非対応
3DMark Port Royal(DX12)

NVIDIA GeForce RTX 2070 Superチップを搭載した各メーカーのグラボはこちらで比較しています。

19位: NVIDIA GeForce GTX Titan X

メーカー・モデル名NVIDIA TITAN X
CUDA Core数3,584
TDP250W
発売日2016年8月
単精度性能10.9742 TFLOPS
倍精度性能0.3429 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,417 MHz
ブーストクロック1,531 MHz
ピクセル・レート146.9 GPixel毎秒
テクスチャ・レート342.9 GTexel毎秒
メモリ容量12GB
メモリタイプGDDR5X
メモリクロック10 GT毎秒
メモリバス幅384bit
メモリ帯域幅480 GB毎秒
L2共有キャッシュ3MB
接続規格PCIe 3.0
アーキテクチャPascal
コードネームGP102-400-A1
ファウンドリTSMC
プロセスルール16nm
トランジスタ密度25.5 MTr/mm²
トランジスタ数120億
ダイサイズ471mm²
SM数28
無効化SM数2
TMU数224
ROPユニット数96
Tensor Core数0
RayTracing Core数0
NVLink4-waySLI対応
3DMark Port Royal(DX12)

2016年8月リリースの古いGPUでPascalアーキテクチャの中でも高額品です。メモリ容量が12GBなのがその理由です。このGPUは買うためのものではなく「性能の位置」を見るための参考値として重要です。

このTitanXは、Turingより1世代前のPascalアーキテクチャを採用した世代のNVIDIA製品の基本中の基本となっている根幹とも言える製品です。

GTX1080TiもQuadro GP100も全てこのTitanXの派生として簡単に導き出せます。

TITAN Xのコア数を3,584コアそのままで動作周波数を「引き上げた」のが1080Tiです。

そしてTITAN Xのコア数のままで倍精度浮動小数点演算能力に特化しつつ、動作周波数を「引き下げた」のがQuadro GP100です。

なぜ1080Tiでは動作周波数を引き上げたのかというと、ゲームを高速化するにはそれが一番手っ取り早いからです。

20位: NVIDIA GeForce RTX 2070

メーカー・モデル名NVIDIA GeForce RTX 2070
CUDA Core数2,304
TDP175W
発売日2018年10月
単精度性能7.46496 TFLOPS
倍精度性能0.23328 TFLOPS
Tensor Core性能59.71968 TFLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,410 MHz
ブーストクロック1,620 MHz
ピクセル・レート103.68 GPixel毎秒
テクスチャ・レート233.28 GTexel毎秒
メモリ容量8GB
メモリタイプGDDR6
メモリクロック14 GT毎秒
メモリバス幅256bit
メモリ帯域幅448 GB毎秒
L2共有キャッシュ4MB
接続規格PCIe 3.0
アーキテクチャTuring
コードネームTU106-400-A1
ファウンドリTSMC
プロセスルール12nm
トランジスタ密度24.3 MTr/mm²
トランジスタ数108億
ダイサイズ445mm²
SM数36
無効化SM数0
TMU数144
ROPユニット数64
Tensor Core数288
RayTracing Core数36
NVLink非対応
3DMark Port Royal(DX12)

RTX2070はGTX1080を上回る性能を有している上にそれなりに安いので人気のあるモデルです。全長16cm程度のヒートシンクとファン×1でも冷やし切れるため、全長170mm以内に抑えたMini ITXマザーボードからはみ出さないタイプのショートタイプグラボが存在するのもRTX2070のメリットです。

大多数のゲームにおいては下記のRadeon VIIよりもこちらのRTX2070のほうがフレームレートが高くなる上にこちらの2070のほうがRadeon VIIより安いため2070をおすすめします。

RTX2070における各ゲームのフレームレートベンチマークではRTX2080無印と比べると、PUBGのフレームレートが大きく減少しています。一方でApex Legendsはほとんど低下していません。PUBGをするならRTX2080を選んでおくのがおすすめです。

NVIDIA GeForce RTX 2070チップを搭載した各メーカーのグラボはこちらで比較しています。

21位: AMD Radeon VII

メーカー・モデル名AMD Radeon VII
SP数3,840
TDP300W
発売日2019年2月
単精度性能13.824 TFLOPS
倍精度性能3.4585 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,400 MHz
ブーストクロック1,750 MHz
ピクセル・レート112 GPixel毎秒
テクスチャ・レート420 GTexel毎秒
メモリ容量16GB
メモリタイプHBM2
メモリクロック2 GT毎秒
メモリバス幅4096bit
メモリ帯域幅1,028 GB毎秒
L2共有キャッシュ4MB
接続規格PCIe 3.0
アーキテクチャGCN 5th gen
コードネームVega 20
ファウンドリTSMC
プロセスルール7nm
トランジスタ密度39.9 MTr/mm²
トランジスタ数132億
ダイサイズ331mm²
Compute Unit数60
無効化CU数4
TMU数240
ROPユニット数64
Tensor Core数0
RayTracing Core数0
Multi GPU2-way対応
3DMark Port Royal(DX12)

Radeon VIIは2019年2月発売のGPUですが、2017年3月発売のGeForce GTX 1080Tiのゲーム性能を大幅に下回っています。2016年発売のGTX1080よりは性能は上です。しかしRadeon VIIは10万円近くするので、6万円程度だったGTX1080に比べたらコストパフォーマンスは圧倒的に悪いです。

Radeon VIIは2019年発売のGeForce RTX 2070と性能がほぼ互角です。ただしそれはレイトレーシング非対応ゲームに関してはほぼ互角というだけです。もしレイトレーシング対応ゲームで評価するとなると、Radeon VIIはRTX2070よりも大きく劣ります。

つまりRadeon VIIを買うなら1080TiかRTX2070を買ったほうがお得です。ただし1080Tiは既に品薄で手に入りづらく売っていても高値になってしまっているので、RTX2070が選択肢になります。RTX2070のほうがRadeon VIIより数万円程度安いので、合理的に判断するならばRadeon VIIよりもGeForce RTX2070のほうが得です。

それでも業界1位を嫌って業界第2位を応援したいユーザはこのRadeon VIIを選ぶようなので、合理的判断を抜きにして「AMDが好きだから」という判官びいきで買うのならRadeon VIIはおすすめだと思います。

Radeon VIIが評価できるのはRayTracing CoreやTensor Coreといったものを搭載せずに、シェーダ描画しているゲーム向けに純粋に特化したグラボに仕上がっていることです。

特にApexLegendsに関してはRTX2070を上回りRTX2080を少し下回る程度のフレームレートを叩き出しています。他のゲームだと微妙ですが、PUBGからApexへごっそり移動した現在ではPUBGのフレームレートは無視していいでしょうし、Apex重視ならこのRadeon VIIはおすすめできます。

AMD Radeon VIIチップを搭載した各メーカーのグラボはこちらで比較しています。

22位: NVIDIA GeForce GTX 1080

メーカー・モデル名NVIDIA GeForce GTX 1080
CUDA Core数2,560
TDP180W
発売日2017年4月
単精度性能8.8729 TFLOPS
倍精度性能0.2772 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,607 MHz
ブーストクロック1,733 MHz
ピクセル・レート110.9 GPixel毎秒
テクスチャ・レート277.2 GTexel毎秒
メモリ容量8GB
メモリタイプGDDR5X
メモリクロック11 GT毎秒
メモリバス幅256bit
メモリ帯域幅352 GB毎秒
L2共有キャッシュ2MB
接続規格PCIe 3.0
アーキテクチャPascal
コードネームGP104-410-A1
ファウンドリTSMC
プロセスルール16nm
トランジスタ密度22.9 MTr/mm²
トランジスタ数72億
ダイサイズ314mm²
SM数20
無効化SM数0
TMU数160
ROPユニット数64
Tensor Core数0
RayTracing Core数0
NVLink4-waySLI対応
3DMark Port Royal(DX12)

GTX1070の150Wよりも30W発熱量が多くなっています。GTX1080は事実上Pascal世代最高性能のGPUです。実は1080Tiよりも1080のほうが高性能になる(例えばゲームにおいてフレームレートが高くなる)ことが多々あります。その理由として1080はコア数こそ1080Tiより少ないものの、動作周波数は1080のほうが高いからです。

この1080は980Tiと比較してどうなのかという有名な論点があります。これについては答えが出ています。基本的にグラフィックボードはCUDA Coreと呼ばれる整数・浮動小数演算器のコア数が多ければ多いほど速くなります。1080はコア数が980tiよりも少ないことが、「1080よりも980tiの方が速い」と一部の人達から未だに言われている根拠です。しかし、1080はコア数を減らした上で動作周波数を上げたので980Tiより高速になっています。この動作周波数が上がったことが1080が980Tiより高速になった一つの理由です。現在流行りのマルチコア化は「周波数を下げる」ことと「コアを増やす」ことを同時にやることです。ですが1080では少し逆戻りし、「周波数を上げて」「コアを減らす」ということをやりました。なぜこのようなことをしたかと言えば、多すぎるコア数を使い切れるゲームがないからです。それならば余分なコアを削って、その余裕ができた分だけ動作周波数を上げたのが1080です。

動作周波数を上げると1クロックあたりに電気信号が進める長さが短くなってしまい技術的に難しいのですが、コア数を減らすことで1080は動作周波数を上げることに成功しました。

GTX1080が高速になったもう一つの理由は、「倍精度」浮動小数点演算のコアを削って、その分だけ「単精度」浮動小数点演算のコアを増やしたことです。ゲームというのは「単精度」浮動小数点演算が重要であり、「倍精度」はそこまで必要としません。科学技術計算が「倍精度」かそれ以上を要求するのとはゲームは違います。ゲームでは64ビット用いる倍精度浮動小数点演算よりも、32ビット単精度浮動小数点演算用の演算器に半導体チップ面積を大きく割り当てた方が速くなるので、1080ではそのような最適化をしました。つまりはゲーム用途に徹底的に最適化したものが1080です。

GeForce GTX 1080で実行した各ゲームのフレームレートベンチマークでは、Apex Legendsで121fpsを実現していることから十分なフレームレートを叩き出していますが、PUBGでは87fpsしかなく60Hzモニタでゲームをするレベルのフレームレートに留まっています。グラフィック描画処理が重いゲームをやるのなら最低でもRTX2070、できればRTX2080以上を選択しておきたいところです。

NVIDIA GeForce GTX 1080チップを搭載した各メーカーのグラボはこちらで比較しています。

23位: NVIDIA GeForce RTX 2060 Super

メーカー・モデル名NVIDIA GeForce RTX 2060 Super
CUDA Core数2,176
TDP175W
発売日2019年7月
単精度性能7.180 TFLOPS
倍精度性能0.224 TFLOPS
Tensor Core性能57.44640 TFLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,470 MHz
ブーストクロック1,650 MHz
ピクセル・レート105.60 GPixel毎秒
テクスチャ・レート224.40 GTexel毎秒
メモリ容量8GB
メモリタイプGDDR6
メモリクロック14 GT毎秒
メモリバス幅256bit
メモリ帯域幅448 GB毎秒
L2共有キャッシュ4MB
接続規格PCIe 3.0
アーキテクチャTuring
コードネームTU106-410-A1
ファウンドリTSMC
プロセスルール12nm
トランジスタ密度24.3 MTr/mm²
トランジスタ数108億
ダイサイズ445mm²
SM数34
無効化SM数2
TMU数136
ROPユニット数64
Tensor Core数272
RayTracing Core数34
NVLink非対応
3DMark Port Royal(DX12)

2019年7月発売。RTX2060SuperはRTX2070やRTX2060と同じTU106チップを用いていることから、RTX2060より上位でRTX2070より下位という位置づけです。しかし技術的に見れば、RTX2060の性能を引き上げたというよりも、RTX2070の性能を引き下げたという位置づけが妥当であり、RTX2060Superの性能はRTX2070に近いです。

まずTU106チップはStreaming Multiprocessorが全36コアあり、そのうち全て有効化し36コアにしたものがRTX2070、2つ無効化し34コアにしたものがRTX2060Super、6つ無効化し30コアにしたものがRTX2060です。つまりRTX2060から見たRTX2060Superのコア数は大幅に増えています。

コア数以外でも、RTX2060SuperがRTX2070により近い点があります。RTX2060のL2キャッシュサイズが3MBなのに対して、RTX2060SuperとRTX2070のL2キャッシュは両方とも4MBあります。

メモリの観点からもRTX2060SuperはRTX2070寄りです。RTX2060のメモリバス幅が192bitなのに対し、RTX2060SuperとRTX2070は256bitあります。これによりRTX2060SuperとRTX2070のメモリ帯域幅は448GB毎秒を達成しており、RTX2060の336MB毎秒を上回ります。

このように、RTX2060SuperのスペックはRTX2060よりもRTX2070により近くなっています。

それどころかRTX2070よりもRTX2060Superのほうが優れている点があります。それはクロック周波数です。コア数についてはRTX2070よりもRTX2060が少ないです。その代わりクロック周波数についてはRTX2060SuperがRTX2070を上回ります。リファレンスモデルにおけるRTX2060Superのベースクロック1,470MHz,ブーストクロック1,650MHzは、RTX2070のベースクロック1,410MHz,ブーストクロック1,620MHzを上回っています。

用途によってはコア数の多さよりもクロック周波数の高さが性能向上で有利になることがあります。ゲーム用途であってもPUBGのようにクロック周波数の高さがフレームレート向上に有利なゲームも存在します。主要用途を考慮してRTX2070かRTX2060Superどちらにするか選択するのがいいでしょう。

NVIDIA GeForce RTX 2060 Superチップを搭載した各メーカーのグラボはこちらで比較しています。

24位: NVIDIA GeForce RTX 2060

メーカー・モデル名NVIDIA GeForce RTX 2060
CUDA Core数1,920
TDP160W
発売日2019年1月
単精度性能6.4512 TFLOPS
倍精度性能0.2016 TFLOPS
Tensor Core性能51.60960 TFLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,365 MHz
ブーストクロック1,680 MHz
ピクセル・レート80.64 GPixel毎秒
テクスチャ・レート201.60 GTexel毎秒
メモリ容量6GB
メモリタイプGDDR6
メモリクロック14 GT毎秒
メモリバス幅192bit
メモリ帯域幅336 GB毎秒
L2共有キャッシュ3MB
接続規格PCIe 3.0
アーキテクチャTuring
コードネームTU106-200-KA-A1
ファウンドリTSMC
プロセスルール12nm
トランジスタ密度25.0 MTr/mm²
トランジスタ数136億
ダイサイズ445mm²
SM数30
無効化SM数6
TMU数120
ROPユニット数48
Tensor Core数240
RayTracing Core数30
NVLink非対応
3DMark Port Royal(DX12)

1世代前のGTX1070と同じCUDA Core数を持ちますが、性能がほとんど向上していません。しかもTDPを10W上乗せしてTDP160Wにしてこの性能ですから、事実上消費電力量をアップさせて達成した性能向上に見えます。

消費電力が増えたことで補助電源も8ピンになっています。GTX1070では補助電源は6ピン×1でした。6ピン補助電源は最大で75Wを供給すると規格化されています(実際はもっと多くの電力を取り出せますが規格で制限しています)。つまりマザーボードからの供給電力75Wと、6ピン補助電源の75Wでは150W止まりであり、RTX2060のTDP160Wの発熱量(消費電力はTDPより大きくなる)をまかないきれないためRTX2060では8ピン補助電源となりました。8ピン補助電源では最大150Wが規格化されているため、マザーボードからの75Wと合算して225Wもの電力供給があることになり、オーバークロックするとしたらかなり電力に余裕があります。

GTX1070と比較してほとんど性能向上していない理由は、RayTracingCoreやTensorCoreを搭載してしまったためゲーム用演算回路が1世代前からほぼ増加しなかったからです。ユーザーが求めていない機能をメーカーの独善で搭載してしまい失敗した典型例の一つになります。

GeForce RTX 2060で各ゲームを実行したフレームレートベンチマーク結果は非常に興味深い結果です。まずGTX1080よりもフレームレートで勝っているゲームもあれば、RTX2060が負けているゲームもあります。

GTX1080比でRTX2060のフレームレートが大きく下がったのがApex Legendsです。100fps割れしています。GTX1080では120fps超していたので大きな下落です。またApex LegendsにおいてはGTX1070TiのフレームレートよりもRTX2060が下です。

一方でGTX1080よりもフレームレート数が向上したのがPUBGです。RTX2060では102fpsになっており、GTX1080の87fpsから増加し100fps台に乗っています。

このような結果になったのはRTX2060はCUDA Core数がGTX1080よりも少ないものの、リファレンスモデルのクロックではGTX1080と同レベルを実現しているからです。さらに補助電源8ピン×1による225Wの電力供給に余裕があるためファクトリーオーバークロックされたオリジナルファンモデルのグラフィックボードだとコア数が少ないRTX2060がGTX1080より有利になります。1コアあたりの性能の高さがRTX2060でPUBGのフレームレートが伸びた要因です。

このようにRTX2060ではゲームによって大きく差がつくので、どのゲームをやるかでGPUを選択する必要があります。

NVIDIA GeForce RTX 2060チップを搭載した各メーカーのグラボはこちらで比較しています。

25位: AMD Radeon RX 5700 XT

メーカー・モデル名AMD Radeon RX 5700 XT
SP数2,560
TDP225W
発売日2019年7月
単精度性能9.754 TFLOPS
倍精度性能0.6096 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,605 MHz
ブーストクロック1,905 MHz
ピクセル・レート121.9 GPixel毎秒
テクスチャ・レート304.8 GTexel毎秒
メモリ容量8GB
メモリタイプGDDR6
メモリクロック14 GT毎秒
メモリバス幅256bit
メモリ帯域幅448 GB毎秒
L2共有キャッシュ4MB
接続規格PCIe 4.0
アーキテクチャRDNA 1.0
コードネームNavi 10 XT
ファウンドリTSMC
プロセスルール7nm
トランジスタ密度41.0 MTr/mm²
トランジスタ数103億
ダイサイズ251mm²
Compute Unit数40
無効化CU数0
TMU数160
ROPユニット数64
Tensor Core数0
RayTracing Core数0
Multi GPU2-way対応
3DMark Port Royal(DX12)

Radeon RX 5700XTはRadeon VIIより2ランク下のGPUとして投入されたAMD製GPUです。

RX5700XTは単精度32bit(FP32)演算器を2560コア搭載しています。2304コアのRTX2070より多く、2944コアのRTX2080より少ないです。

コア数だけ見ればRTX2070とRTX2080の中間にRadeon RX 5700XTが位置するように思えます。

しかし実際はGeForce RTX 2060より下のフレームレート性能です。

RX5700XTはGeForce RTX 2070のカウンターパートとなることを想定して投入されました。しかしAMD RadeonはNVIDIAよりも技術力で大きく劣っているため「対抗馬として想定しているGeForceモデルよりワンランク下のGPUに負ける」という傾向が続いており、RX5700XTも同じくRTX2060より下の性能になりました。

RX590でも勝てなかったGTX1070に勝てたのがRX5700XTの大きな進歩です。

そしてあまり注目されていないPCIe 4.0対応ですがこれには理由があります。GPUをコプロセッサとして使うGPGPU用途はPCIe 4.0の恩恵を大きく受けることができます。

一方でゲーム用途ではGPU1基ならPCIe3.0×8(64Gbps)の帯域があれば十分であることがわかっています。PCIe3.0×16(128Gbps)と×8(64Gbps)でどれほどフレームレート性能が変わるのか海外でもよく検証されていますが、結果はほぼ同じフレームレートで誤差の範囲内です。

ここでレーン数を更に少なくしてPCIe3.0×4(32Gbps)接続のGPUになると大きくフレームレートが落ちます。バスの帯域幅がボトルネックになっているためです。これは外付けのGPUをThunderbolt 3(40Gbps)で接続するとGPU本来の性能が出せずにフレームレートが下がるのと同じです。ゲーム用途のGPUではThunderbolt 3のような40Gbpsでは足りませんが64Gbpsもあれば十分です。つまりCPU管理のPCIe3.0×16の通信規格でSLI構成する場合は2-wayが限界です。

この点、PCIe4.0対応なら4-way SLIも可能になります。CPU管理のPCIe4.0のレーン数が16だと仮定してもPCIe4.0×4だけで64Gbpsもの帯域幅が得られるからです。4レーンでもフレームレートが落ちないとなれば4-way SLIも可能です。

ただゲームにおいて必要となるのはGPU×2くらいでせいぜい2-wayのSLI構成です。それならPCIe3.0×8の帯域幅でも十分だということでPCIe4.0接続のGPUはゲーマーにあまりアピールしにくい要素だったのでRadeon RX5700でもそれほど強調されていません。

しかしGPGPUとしての用途だったらPCIe4.0接続対応は大きなメリットがあるので積極的にPCIe4.0対応のGPUを採用する動機づけがあります。

AMD Radeon RX 5700 XTチップを搭載した各メーカーのグラボはこちらで比較しています。

派生モデル:AMD Radeon RX 5700 XT 50th Anniversary Edition

メーカー・モデル名AMD Radeon RX 5700 XT 50th Anniversary Edition
SP数2,560
TDP235W
発売日2019年7月
単精度性能10.138 TFLOPS
倍精度性能0.6336 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,680 MHz
ブーストクロック1,980 MHz
ピクセル・レート126.7 GPixel毎秒
テクスチャ・レート316.8 GTexel毎秒
メモリ容量8GB
メモリタイプGDDR6
メモリクロック14 GT毎秒
メモリバス幅256bit
メモリ帯域幅448 GB毎秒
L2共有キャッシュ4MB
接続規格PCIe 4.0
アーキテクチャRDNA 1.0
コードネームNavi 10 XTX
ファウンドリTSMC
プロセスルール7nm
トランジスタ密度41.0 MTr/mm²
トランジスタ数103億
ダイサイズ251mm²
Compute Unit数40
無効化CU数0
TMU数160
ROPユニット数64
Tensor Core数0
RayTracing Core数0
Multi GPU2-way対応
3DMark Port Royal(DX12)

RX5700XTから動作クロックを少し高めただけのGPUです。クロックを高めた分だけTDPが上昇しておりその他のスペックは全く同じです。クロックを引き上げても正常に動作するチップを選別しているので価格が少し高くなっています。

これはRX590とRX580の関係と非常に似ています。RX590はRX580のクロックを引き上げただけのモデルとして登場しました。コア数等他のスペックは同じでした。RX590とRX580どちらがメインストリームかといえば当然RX580です。

これはRX5700シリーズでも同じで、「RX5700XT」と「RX5700XT Anniversary Edition」のどちらがメインストリームかと言えば当然RX5700XTです。Compute Unitを増やして搭載するFP32演算器を増やしていればRX5700XTより大きく高性能になっていましたが、コア数は全く同じでクロックを引き上げただけなので「ほんの少しだけRX5700XTよりマシ」という出来に仕上がっています。

このAnniversary Editionは米国・カナダといった北米各国、英国を含んだドイツ・フランス等の欧州各国でのみ正規販売され日本国内では正規品として販売されません。

26位: NVIDIA GeForce GTX 1070 Ti

メーカー・モデル名NVIDIA GeForce GTX 1070 Ti
CUDA Core数2,432
TDP180W
発売日2017年11月
単精度性能8.1861 TFLOPS
倍精度性能0.2558 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,607 MHz
ブーストクロック1,683 MHz
ピクセル・レート107.7 GPixel毎秒
テクスチャ・レート256 GTexel毎秒
メモリ容量8GB
メモリタイプGDDR5
メモリクロック8 GT毎秒
メモリバス幅256bit
メモリ帯域幅256 GB毎秒
L2共有キャッシュ2MB
接続規格PCIe 3.0
アーキテクチャPascal
コードネームGP104-300-A1
ファウンドリTSMC
プロセスルール16nm
トランジスタ密度22.9 MTr/mm²
トランジスタ数72億
ダイサイズ314mm²
SM数19
無効化SM数1
TMU数152
ROPユニット数64
Tensor Core数0
RayTracing Core数0
NVLink非対応
3DMark Port Royal(DX12)

CUDA Cores:2,423、ベースクロック1,607MHz、ブーストクロック1,683MHz、TDP180W

GTX1070TiはPascal世代のGPUの中でも遅れてでてきたモデルです。

GTX1080と1070無印の間を埋めるという意味もありますが、GTX1070Tiの特徴は「1コアあたりの性能の高さ」にあります。

まずCUDA Core数はGTX1080より少ないです。その点はGTX1080より劣っています。しかしGTX1070Tiリファレンスモデルのベースクロックは1,607MHzでありGTX1080と同じです。リファレンスモデルのブーストクロックはGTX1070Tiが1,683MHzしかなく、GTX1080のリファレンスモデルブーストクロック1,733MHzより劣っていますが、ASUS等の各グラボメーカから発売されているオリジナルファンモデルならベースクロックもブーストクロックもファクトリーオーバークロックされているため、CUDA Core数が少ない分だけGTX1070Tiはオーバークロックで有利です。

そのため結果的にGTX1080とほぼ変わりないフレームレートベンチマーク結果となっています。

GeForce GTX 1070Tiで各ゲームを実行したフレームレートベンチマーク結果で着目すべき点はPUBGのフレームレート88fpsがGTX1080無印の87fpsと同レベルだということです。この1fpsは誤差の範囲でしょうがPUBGに限るならばGTX1070TiはGTX1080と同程度のフレームレートを叩き出します。PUBGは計算すべきオブジェクトの数が少ないのでコア数は少なくてもいいからクロックを高くしたほうが有利であり、動作クロックがGTX1080と同程度のGTX1070TiはGTX1080と同じレベルのフレームレートになります。

一方でApex LegendsはGTX1070TiではGTX1080と比較してマイナス20fps程度の103fpsとなっています。Apex Legendsではコア数の多さが重要なのでこのような結果になります。

27位: AMD Radeon RX 5700

メーカー・モデル名AMD Radeon RX 5700
SP数2,304
TDP180W
発売日2019年7月
単精度性能7.949 TFLOPS
倍精度性能0.4968 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,465 MHz
ブーストクロック1,725 MHz
ピクセル・レート110.4 GPixel毎秒
テクスチャ・レート248.4 GTexel毎秒
メモリ容量8GB
メモリタイプGDDR6
メモリクロック14 GT毎秒
メモリバス幅256bit
メモリ帯域幅448 GB毎秒
L2共有キャッシュ4MB
接続規格PCIe 4.0
アーキテクチャRDNA 1.0
コードネームNavi 10 XL
ファウンドリTSMC
プロセスルール7nm
トランジスタ密度41.0 MTr/mm²
トランジスタ数103億
ダイサイズ251mm²
Compute Unit数36
無効化CU数4
TMU数144
ROPユニット数64
Tensor Core数0
RayTracing Core数0
Multi GPU2-way対応
3DMark Port Royal(DX12)

Radeon VIIより3ランク下のグレードとして2019年5月に発表されたGPUです。

コア数はRadeon RX 590と同じです。つまりコア数を維持したままコア性能を引き上げたのがこのRX 5700です。RX580→RX590にかけてはコア数を維持したままクロックを引き上げただけでした。そして今回もRX590→RX5700にかけてコア数を維持したままクロックを引き上げたものになっています。

Radeon RX 5700のTDPはRadeon RX 590より低いTDP180Wです。Radeon RX 590がGeForce GTX 1660無印より下の性能だったことを鑑みると、RX5700がGeForce GTX1660無印より上の性能になったということは大きな前進です。

AMDとしてはRadeon VIIのカウンターパートはGeForce RTX2080無印、Radeon RX 5700XTのカウンターパートはGeForce RTX2070、Radeon RX 5700のカウンターパートはGeForce RTX 2060を想定しています。

しかし実際は、GeForce RTX 2080無印のカウンターパートとなることを意識して投入されたRadeon VIIはフレームレートベンチマークでRTX 2070未満のフレームレートしか出せていません。

このようにAMDのGPUは「本来カウンターパートとして想定しているGeForceモデルの1ランク下のモデルに負ける」ということが常態化しています。

つまりRadeon RX 5700を買うならGeForce RTX 2060のほうが得どころかGeForce GTX1070Tiでも十分です。

AMD Radeon RX 5700チップを搭載した各メーカーのグラボはこちらで比較しています。

28位: NVIDIA GeForce GTX 1070

メーカー・モデル名NVIDIA GeForce GTX 1070
CUDA Core数1,920
TDP150W
発売日2016年6月/2018年12月
単精度性能6.4627 TFLOPS
倍精度性能0.2019 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,506 MHz
ブーストクロック1,683 MHz
ピクセル・レート107.7 GPixel毎秒
テクスチャ・レート201.9 GTexel毎秒
メモリ容量8GB
メモリタイプGDDR5/GDDR5X
メモリクロック8 GT毎秒
メモリバス幅256bit
メモリ帯域幅256 GB毎秒
L2共有キャッシュ2MB
接続規格PCIe 3.0
アーキテクチャPascal
コードネームGP104-200-A1
ファウンドリTSMC
プロセスルール16nm
トランジスタ密度22.9 MTr/mm²
トランジスタ数72億
ダイサイズ314mm²
SM数15
無効化SM数5
TMU数120
ROPユニット数64
Tensor Core数0
RayTracing Core数0
NVLink4-waySLI対応
3DMark Port Royal(DX12)1,238

1,920コア 単精度5.783TFlops、倍精度0.181TFlops TDP150W

Displayport 4K対応。HDMI2.0対応。PCI Express 3.0 x 16。最大同時表示画面数4画面。

1070になるとTDPは150Wになり、1060より発熱量が30W上昇します。しかしこれはあまり大きな上昇幅ではありません。1050Tiの75Wから1060の120Wのほうが大きな上昇幅です。

GeForce GTX 1070を使った各ゲームでのフレームレートベンチマーク結果では最も重いゲームに属するPUBGでも80fpsを実現しています。60Hzモニタで使うなら十分な性能です。Apex LegendsはGTX1080では120fps近いフレームレートがありましたがGTX1070では91fpsまで落ちています。これらのゲームで120fps以上を求めるユーザだとGTX1070は少し役不足かもしれません。ただし、軽いことで有名なFortniteは120fps以上をキープしているのでゲームによってはGTX1070でも十分です。

NVIDIA GeForce GTX 1070チップを搭載した各メーカーのグラボはこちらで比較しています。

29位: NVIDIA GeForce GTX 1660 Ti

メーカー・モデル名NVIDIA GeForce GTX 1660 Ti
CUDA Core数1,536
TDP120W
発売日2019年2月
単精度性能5.43744 TFLOPS
倍精度性能0.16992 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,500 MHz
ブーストクロック1,770 MHz
ピクセル・レート72.00 GPixel毎秒
テクスチャ・レート144.00 GTexel毎秒
メモリ容量6GB
メモリタイプGDDR6
メモリクロック12 GT毎秒
メモリバス幅192bit
メモリ帯域幅288.0 GB毎秒
L2共有キャッシュ1.5MB
接続規格PCIe 3.0
アーキテクチャTuring
コードネームTU116-400-A1
ファウンドリTSMC
プロセスルール12nm
トランジスタ密度23.2 MTr/mm²
トランジスタ数66億
ダイサイズ284mm²
SM数24
無効化SM数0
TMU数96
ROPユニット数48
Tensor Core数0
RayTracing Core数0
NVLink非対応
3DMark Port Royal(DX12)

1,536コア 単精度5.437TFlops、倍精度0.1699TFlops TDP120W

2019年発売なのに2016年発売のGTX1070無印よりもゲーム性能が低い微妙なチップです。レイトレーシング専用の演算回路が非搭載である点は評価できますが、レイトレーシングコアを削った割には性能が伸びていません。RTX2080TiからRayTracingCoreやTensorCoreといった一般的なゲーマーに不要な演算回路を全面的に削り、その空いた面積をゲーム用の演算用回路に置き換えたチップがリリースされるまで待ったほうがいいくらいの出来です。

NVIDIA GeForce GTX 1660 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

30位: NVIDIA GeForce GTX 1660 Super

メーカー・モデル名NVIDIA GeForce GTX 1660 Super
CUDA Core数1,408
TDP125W
発売日2019年10月
単精度性能5.02700 TFLOPS
倍精度性能0.15708 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,530 MHz
ブーストクロック1,785 MHz
ピクセル・レート73.44 GPixel毎秒
テクスチャ・レート134.64 GTexel毎秒
メモリ容量6GB
メモリタイプGDDR6
メモリクロック14 GT毎秒
メモリバス幅192bit
メモリ帯域幅336.0 GB毎秒
L2共有キャッシュ1.5MB
接続規格PCIe 3.0
アーキテクチャTuring
コードネームTU116-300-A1
ファウンドリTSMC
プロセスルール12nm
トランジスタ密度23.2 MTr/mm²
トランジスタ数66億
ダイサイズ284mm²
SM数22
無効化SM数2
TMU数88
ROPユニット数48
Tensor Core数0
RayTracing Core数0
NVLink非対応
3DMark Port Royal(DX12)

1,408コア、ブーストクロック1,785MHz

このGeForce GTX 1660 Superは、GeForce GTX 1660とコア数も、リファレンスモデルのクロック周波数も一緒ですが、メモリ帯域がGTX1660より強化されています。たったそれだけの違いしかありません。

既にGeForce GTX 1660を持っている人が、このGeForce GTX 1660 Superに買い換える必要性は全くありません。これからGeForce GTX 1660を買うくらいなら、代わりにこのGeForce GTX 1660 Superを買ったほうがいいくらいの位置づけです。

NVIDIA GeForce GTX 1660 Superチップを搭載した各メーカーのグラボはこちらで比較しています。

31位: NVIDIA GeForce GTX 1660

メーカー・モデル名NVIDIA GeForce GTX 1660
CUDA Core数1,408
TDP120W
発売日2019年10月
単精度性能5.02700 TFLOPS
倍精度性能0.15708 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,530 MHz
ブーストクロック1,785 MHz
ピクセル・レート73.44 GPixel毎秒
テクスチャ・レート134.64 GTexel毎秒
メモリ容量6GB
メモリタイプGDDR5
メモリクロック8 GT毎秒
メモリバス幅128bit
メモリ帯域幅192.0 GB毎秒
L2共有キャッシュ1.5MB
接続規格PCIe 3.0
アーキテクチャTuring
コードネームTU116-300-A1
ファウンドリTSMC
プロセスルール12nm
トランジスタ密度23.2 MTr/mm²
トランジスタ数66億
ダイサイズ284mm²
SM数22
無効化SM数2
TMU数88
ROPユニット数48
Tensor Core数0
RayTracing Core数0
NVLink非対応
3DMark Port Royal(DX12)

1,408コア、OC無ブーストクロック1,785MHz、5.027TFlops、TDP120W

1世代前のGTX1060よりは高性能です。それも当然であり、1060では6ピンの補助電源×1が標準的でしたが、Turing世代のGTX1660では8ピン×1の補助電源が標準的になっています(ごく一部6ピン×1のモデルが存在する)。このグラボを買うなら1世代前の1070か、Turing世代の1660Tiをおすすめします。1660Tiは1660よりCUDAコア数を増やしているもののTDP値は同じであり補助電源も8ピン×1で変化ありません。TDP値が120W級で同じでしかも補助電源も同じなら、1660よりも1660Tiのほうが価格さえ気にしなければメリットが大きいです。

NVIDIA GeForce GTX 1660チップを搭載した各メーカーのグラボはこちらで比較しています。

32位: AMD Radeon RX 5600 XT

メーカー・モデル名AMD Radeon RX 5600 XT
SP数2,304
TDP150~160W
発売日2020年1月
単精度性能8.066 TFLOPS
倍精度性能0.504 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,375 MHz
ブーストクロック1,750 MHz
ピクセル・レート112 GPixel毎秒
テクスチャ・レート252 GTexel毎秒
メモリ容量6GB
メモリタイプGDDR6
メモリクロック14 GT毎秒
メモリバス幅192bit
メモリ帯域幅288~336 GB毎秒
L2共有キャッシュ3MB
接続規格PCIe 4.0
アーキテクチャRDNA 1.0
コードネームNavi 10 XLE
ファウンドリTSMC
プロセスルール7nm
トランジスタ密度41.0 MTr/mm²
トランジスタ数103億
ダイサイズ251mm²
Compute Unit数36
無効化CU数4
TMU数144
ROPユニット数64
Tensor Core数0
RayTracing Core数0
Multi GPU非対応
3DMark Port Royal(DX12)

このRadeon RX 5600 XTはRadeon RX 5700と同じ「Navi 10」チップを使っているため、Radeon RX 5700をダウングレードした位置づけになります。

Radeon RX 5600 XTのCompute Unite数(NVIDIAでいうところのStreaming Multiprocessor数)は36基であり、Radeon RX 5700と全く同じです。その結果、Stream Processor数(NVIDIAでいうところのCUDA Core数)が2304基となっており、これもRadeon RX 5700と全く同じです。つまりコア数としてはRadeon RX 5700もRadeon RX 5600XTも同じです。

AMD Radeon RX 5600 XTチップを搭載した各メーカーのグラボはこちらで比較しています。

33位: NVIDIA GeForce GTX 1650 Super

メーカー・モデル名NVIDIA GeForce GTX 1650 Super
CUDA Core数1,280
TDP100W
発売日2019年11月
単精度性能4.41600 TFLOPS
倍精度性能0.13800 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,530 MHz
ブーストクロック1,725 MHz
ピクセル・レート48.96 GPixel毎秒
テクスチャ・レート122.40 GTexel毎秒
メモリ容量4GB
メモリタイプGDDR6
メモリクロック12 GT毎秒
メモリバス幅128bit
メモリ帯域幅192.0 GB毎秒
L2共有キャッシュ1.5MB
接続規格PCIe 3.0
アーキテクチャTuring
コードネームTU116-250-KA-A1
ファウンドリTSMC
プロセスルール12nm
トランジスタ密度23.2 MTr/mm²
トランジスタ数66億
ダイサイズ284mm²
SM数20
無効化SM数4
TMU数80
ROPユニット数32
Tensor Core数0
RayTracing Core数0
NVLink非対応
3DMark Port Royal(DX12)

このGeForce GTX 1650 Superは、GeForce GTX 1650と比較し大幅に性能向上が図られています。

GeForce GTX 1660 SuperはGeForce GTX 1660に毛が生えた程度の差すらありませんでしたが、GeForce GTX 1650 SuperはGeForce GTX 1650と比較しCUDA Core数が+384増えており合計1,280コアです。

GeForce GTX 1650 SuperがGTX1650と比較して大幅に高性能になった理由は、GeForce GTX 1650 SuperのチップはTU116であり、GeForce GTX 1660,1660Super,1660Tiと同じものを採用しているからです。

つまりGeForce GTX 1650 SuperはGeForce GTX 1650のアップグレード版というよりも、GeForce GTX 1660をダウングレードし、性能を若干低くしたというのが正しい位置づけです。

34位: AMD Radeon RX 590

2,304コア、OC無ベースクロック1,469MHz、ブーストクロック1,545MHz、7.120TFlops、TDP225W

RX580と同じコア数のまま動作周波数を引き上げた焼き直し版として2018年末に発売されたGPUです。AMDにとって2018年末~2019年初頭時点での本命はRadeon VIIであり、このRX590は第5世代RXチップの在庫処分目的でリリースされました。

AMDの決算発表を見るとわかりますが、2017年の仮想通貨ブームでAMDはRadeon RXチップを大量生産しました。しかし2018年に仮想通貨が暴落しブームが終了したことでチップが在庫として大量に積み上がってしまいました。その在庫をさばくためにRX580の焼き直し品としてこのRX590が企画されたわけです。

そのおかげでAMDの2018年1月~12月の通年決算は純利益(最終利益)が赤字でした。2019年1月~3月に順調にRadeon RXのチップ在庫を解消したことで、2019年1月~3月決算は純利益1600万ドルで一応黒字になっているのでこの在庫処分の効果がでているようです(ちなみにIntelは同期間の純利益40億ドルの黒字)。

このRX590は明確なコンセプトがあって企画されたものではなく単に在庫品が損失に化けてしまうのを防止するのが目的でありビジョンが全くないので、ゲーミング性能は1660無印にも負けており微妙な出来です。しかしPUBGでは大差で1660無印に負けていても、Apex Legendsでは健闘しているのでApexをするなら悪くないグラボです。

Radeon RX 590で各ゲームを実行したときのフレームレートベンチマーク結果ではグラフィック処理が軽いと言われてるFortniteでも100fpsを超える程度で、Apex Legendsも95fpsなので悪くはない数字です。しかしPUBGではRX 590をもってしても75fpsなので、コア数をいくら増やしてもクロックを増やせないGPUの限界がここに現れています。

AMD Radeon RX 590チップを搭載した各メーカーのグラボはこちらで比較しています。

35位: NVIDIA GeForce GTX 1060

メーカー・モデル名NVIDIA GeForce GTX 1060
CUDA Core数1,280
TDP120W
発売日2017年4月
単精度性能4.372480TFLOPS
倍精度性能0.13664 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,506 MHz
ブーストクロック1,708 MHz
ピクセル・レート82.0 GPixel毎秒
テクスチャ・レート136.7 GTexel毎秒
メモリ容量6GB
メモリタイプGDDR5
メモリクロック9 GT毎秒
メモリバス幅192bit
メモリ帯域幅216.0 GB毎秒
L2共有キャッシュ1.5MB
接続規格PCIe 3.0
アーキテクチャPascal
コードネームGP106-410-A1
ファウンドリTSMC
プロセスルール16nm
トランジスタ密度22.0MTr/mm²
トランジスタ数44億
ダイサイズ200mm²
SM数10
無効化SM数
TMU数80
ROPユニット数48
Tensor Core数0
RayTracing Core数0
NVLink非対応
3DMark Port Royal(DX12)809

1,280コア 単精度3.855TFlops、倍精度0.120TFlops TDP120W

GTX1060は補助電源不要のGTX1050Tiと比較してだいぶ高性能になりますがTDPが一気に120Wまで増えます。GTX1050Tiが75Wであることと比較するとかなり大きい発熱量です。

1060のようにTDP120Wになるとグラボ単体でのファンレス化は難しく、ファンレスの1060グラボは売られていません。ただし1060をファンレスで冷やすためのPCケースは発売予定があります。オランダStreacom社のDB6という製品であり1060の熱をケース側面まで運びファンレスで冷やすことができます。2017年6月に発表されましたがケースは未発売です。

GTX1060はフレームレート60fps程度でゲームをするゲーマーにはぴったりのGPUです。

GeForce GTX 1060で各ゲームを実行したフレームレートベンチマーク結果ではCoD Bo4やPUBGでも60~70fps台あります。GTX1060まで来ると、動作が軽いと言われているFortniteでさえもさすがに120fpsを割ってしまいます。Fortniteでフレームレート120fps超が欲しい場合はGTX1070が必要です。

NVIDIA GeForce GTX 1060チップを搭載した各メーカーのグラボはこちらで比較しています。

36位: AMD Radeon RX 5500 XT

メーカー・モデル名AMD Radeon RX 5500 XT
SP数1,408
TDP130W
発売日2019年12月
単精度性能5.196 TFLOPS
倍精度性能0.3247 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,717 MHz
ブーストクロック1,845 MHz
ピクセル・レート59.04 GPixel毎秒
テクスチャ・レート162.4 GTexel毎秒
メモリ容量8GB/4GB
メモリタイプGDDR6
メモリクロック14 GT毎秒
メモリバス幅128bit
メモリ帯域幅224 GB毎秒
L2共有キャッシュ2MB
接続規格PCIe 4.0
アーキテクチャRDNA 1.0
コードネームNavi 14 XTX
ファウンドリTSMC
プロセスルール7nm
トランジスタ密度40.5 MTr/mm²
トランジスタ数64億
ダイサイズ158mm²
Compute Unit数22
無効化CU数2
TMU数88
ROPユニット数32
Tensor Core数0
RayTracing Core数0
Multi GPU非対応
3DMark Port Royal(DX12)

AMD Radeon RX 5500 XTチップを搭載した各メーカーのグラボはこちらで比較しています。

37位: AMD Radeon RX 580

2,304コア 単精度5,792TFlops、倍精度Flops値不明 TDP185W

2017年4月リリースのGPU。Radeon RX 580で各ゲームを実行したときのフレームレートベンチマーク結果ではFortniteのフレームレートはGTX1060に若干負けています。Apex Legendsでも78fps止まりとなっており、GTX1060の80fpsと誤差の範囲だと思いますがほぼ同等です。PUBGでも若干RX580が負けています。このように比較してみると、全体的にGTX1060より少しだけ性能が低いことがわかります。Radeon RTX 580はGTX1060と同等か少し下というのが結論です。

AMD Radeon RX 580チップを搭載した各メーカーのグラボはこちらで比較しています。

38位: NVIDIA GeForce GTX 1650

メーカー・モデル名NVIDIA GeForce GTX 1650
CUDA Core数896
TDP75W
発売日2020年4月
単精度性能2.84928 TFLOPS
倍精度性能0.08904 TFLOPS
Tensor Core性能0 FLOPS
Ray Tracing性能0 FLOPS
ベースクロック1,410 MHz
ブーストクロック1,590 MHz
ピクセル・レート45.12 GPixel毎秒
テクスチャ・レート78.96 GTexel毎秒
メモリ容量4GB
メモリタイプGDDR6
メモリクロック8 GT毎秒
メモリバス幅128bit
メモリ帯域幅192.0 GB毎秒
L2共有キャッシュ1MB
接続規格PCIe 3.0
アーキテクチャTuring
コードネームTU117
ファウンドリTSMC
プロセスルール12nm
トランジスタ密度23.5 MTr/mm²
トランジスタ数47億
ダイサイズ200mm²
SM数14
無効化SM数2
TMU数56
ROPユニット数32
Tensor Core数0
RayTracing Core数0
NVLink非対応
3DMark Port Royal(DX12)

単精度896コア、倍精度56コア ベースクロック1,485MHz、ブーストクロック1,665MHz、単精度浮動小数点演算性能2.984TFlops、倍精度浮動小数点演算性能0.09324TFlops、TDP75W

2019年4月にリリースされたGPUです。2017年にリリースされたGTX1050Tiの後継モデルになります。

コンセプトは「補助電源なしのTDP75Wの範囲内でどこまで性能を高めることができるか」です。これはGTX1050Tiも同じでありこのコンセプトは引き継がれています。

競合するモデルはRadeon RX 570です。コア数だけで比較するとRadeon RX 570の2,048コアはGTX1650の896コアを圧倒しています。しかし、Radeon RX 570はGTX1650よりも動作周波数が低い上に、浮動小数点演算器がNVIDIAよりもAMDのほうが劣っているため結果的に性能はほぼ互角になっています。

PUBGの性能は互角なのですが、描画すべきオブジェクトが少ない場所ではGTX1650のほうがフレームレートが伸びます。例えば屋内や市街地以外のエリアです。屋内のような場所だと視界の中で描画すべきオブジェクトが少なく、その限られたオブジェクトだけを描画すればいいのでコア数が少なく動作周波数が高いNVIDIA GeForce GTX1650がフレームレート性能で有利です。

しかしApexLegendsのようにオブジェクトが常時多く画面に表示されるようなゲームでは、それらのオブジェクトを並列して演算するためのコア数が多いRX570が有利です。

RX570は補助電源が最低でも6ピンが必要でオーバークロックモデルになると8ピンが必要になるほど高消費電力なので、少ないコア数でも高い性能を実現した1650をRX570より上位にしました。

NVIDIA GeForce GTX 1650チップを搭載した各メーカーのグラボはこちらで比較しています。

39位: AMD Radeon RX 570

2,048コア 単精度4.784TFlops、倍精度Flops値不明  TDP150W

2017年4月リリースのGPUです。Apex LegendsやPUBGのフレームレートベンチマークではGTX1060に負けています。このRX570を選ぶならGTX1060のほうが高性能で安いですが、GTX1060は品薄なのでGeForceGTX1660を選ぶことをおすすめします。

AMD Radeon RX 570チップを搭載した各メーカーのグラボはこちらで比較しています。

40位: NVIDIA GeForce GTX 1050 Ti

768コア 単精度1.981TFlops、倍精度0.062TFlops TDP75W

Displayport 4K対応。HDMI2.0 4K対応。最大同時表示画面数3画面。PCI Express 3.0 x 16

1050TiはTDPが75Wであり1060の120Wと比べてかなり低くなっており補助電源が不要です。そのため1050TiはファンレスGPUとして用いられることが多いです。

特殊なケースの力を借りずに、グラボ単体でファンレスにできてかつ最も高性能なものはこの1050Tiになります。

グラボ単体でのファンレスとしては台湾Palit社が製造し日本のドスパラが販売するKalmXシリーズが有名です。ドスパラから売られているNE5105T018G1-1070H (GeForce GTX1050Ti 4GB KalmX)は1050Ti搭載グラボの中でも特におすすめです。

また1050TiはオランダStreacom製のファンレスケースでも冷やすことができます。

例えばStreacomのMini ITXケースDB4が該当し、このケースはTDP75Wまでのグラボをファンレスで冷やすことができます。グラボの熱をヒートパイプでケース側面まで運び、ケース自体をヒートシンクとして冷却するタイプです。これが1050Tiでなく1060になってしまうとTDPが120Wと急増するため一気に難しくなります。

1050Tiは比較的容易にファンレス環境が作れる上に、PUBGレベルの重いゲームでも60fps前後で動作することからとても貴重なグラフィックボードです。

GeForce GTX 1050Tiを用いた各ゲームのフレームレートベンチマーク結果ではLoLについては問題なく120fpsの大台をクリアしています。Fortniteについては60Hzモニタでプレイするのであれば問題ない程度のフレームレート85fpsを達成しています。

しかしSiegeやApex Legendsをやるのにはたとえ60Hzモニタを前提としても役不足になります。PUBGだと52fpsであり60fpsの達成には程遠いです。

120fps以上を求めるのなら1050Tiは向きません。60fps程度あれば十分だというゲーマーかつ、それなりにグラフィック処理が軽いゲームに絞るのならGTX1050Tiでも十分です。

NVIDIA GeForce GTX 1050 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

41位: NVIDIA GeForce GTX 1050

640コア 単精度1.733TFlops、倍精度0.054TFlops、リファレンスモデルのブーストクロック1,455MHz、TDP75W

GTX1050は2016年発売です。これも1050Tiと同じくTDP75Wの低発熱かつ低消費電力がコンセプトですが、各メーカーがあまりこの1050無印チップに力を入れてないのもあって各メーカーからのラインナップが微妙です。

間違いやすいのがGTX1050には2GBのVRAMを搭載したもの(CUDA Core 640)と、3GBのVRAMを搭載したもの(CUDA Core 768)の2種類があるところです。一般的に出回っているのは2GB品なので、「GTX1050といったらVRAM2GB品でCUDA Core 640コア」と見ておけば間違いありません。

1050Tiより1050が優れている点は「価格の安さ」しかありません。他の部分は全て1050Tiが優れています。

GeForce GTX 1050で各ゲームを実行したフレームレートベンチマーク結果ではFortniteが82fpsである以外は、Apex LegendsもPUBGも低いフレームレートに落ち着いています。全体的に1050Tiのフレームレートを綺麗にそのままフレームレートを低くシフトさせた結果になっています。ここまでCUDA Coreが少ないモデル帯になると、1050Tiからコア数が減ってもApex Legendsだけのフレームレートが落ち込むということはなく、等しくPUBGのフレームレートも下がっています。1050Tiと同じく1050もゲーム用としては極一部のタイトルに限られそうです。

NVIDIA GeForce GTX 1050チップを搭載した各メーカーのグラボはこちらで比較しています。

42位: AMD Radeon RX 560

1,024コア 単精度2.406TFlops、倍精度Flops値不明 TDP60~80W

コア数やFlops性能でみればGTX1050やGTX1050Tiを上回っているのですが、実際のゲームフレームレートベンチマークではGTX1050TiどころかGTX1050も下回っているGPUです。Apex LegendsでもPUBGにおいてもGTX1050のフレームレートのほうが上です。

AMD Radeon RX 560チップを搭載した各メーカーのグラボはこちらで比較しています。

43位: AMD Radeon RX 550

640コア 単精度1.211TFlops、倍精度0.075TFlops TDP50W

ゲーミング性能ではApex LegendsだとNVIDIA GeForce GT1030より少し低いフレームレートです。PUBGだとGT1030より若干高いフレームレート性能です。 コア数は640で、GT1030の384コアより多いですが、1コアあたりの性能はGT1030のほうが優秀であるため性能面ではほぼ横並びになっています。

GT1030はTDP30Wしかないのでロープロファイルでありながらファンレスにしたり1スロット占有(ファン×1)にしたりできていますが、RX550はコア数を増やしているぶんだけ消費電力は大きく、ロープロファイルにしていてもファンが2つ付いていたり、ファンレスにできなかったり、1スロット占有にできなかったりと性能の割にグラボ本体が大型になってしまっています。総合的にみればGT1030のほうがおすすめです。

AMD Radeon RX 550チップを搭載した各メーカーのグラボはこちらで比較しています。

44位: NVIDIA GeForce GT 1030

384コア 単精度0.942TFlops、倍精度0.029TFlops TDP30W

Displayport4K対応。HDMI2.0対応。PCI Express 3.0 x 16(接続スロットはx16だが実際の動作はx4)。最大同時表示画面数2画面。

オンボードグラフィクス(内蔵グラフィクス)であるIntel UHD Graphicsが3画面4Kで表示できる中、このグラボは2画面までしかできないので物足りなく感じますが、内蔵グラフィクスよりもこのグラボのほうがFlops値は高いです。つまり描画能力が高いので高いフレームレートでYoutubeやTwitch再生ができます。ExcelやWordの描画も明らかに軽くなるので、ゲームをやらず事務作業をする人にはこのグラボで十分だと思いますが、2画面より3画面あると格段に作業効率がアップするので、できれば1050Tiを使ったほうがいいかもしれません。1050Tiにもロープロファイルモデルは存在します。

このGT1030は「ロープロファイルかつ(ファンレス or 1スロット占有)」を実現できているため、コンパクト製を優先するユーザから支持が大きいです。

GeForce GT 1030で各ゲームを実行したフレームレートベンチマーク結果ではLoLのようなゲームはGT1030でも十分なフレームレートを叩き出しています。しかし他のゲームではフレームレート60fpsを大きく割って30fps近くまでしか出ていません。「ゲーム用途であっても60fpsあれば十分」と主張するゲーマーも存在しますが、彼らでも「さすがに30fpsでは無理」という共通認識を持っています。GT1030でゲーム用途は一部の軽いゲームに限られます。

NVIDIA GeForce GT 1030チップを搭載した各メーカーのグラボはこちらで比較しています。

45位: Intel UHD Graphics 630

FMA演算器192コア、ベースクロック350MHz、ブーストクロック1,250MHz、単精度0.48TFlops

第7世代~第9世代のIntel Core i9,i7,i5,i3プロセッサやPentium Goldプロセッサに搭載されている内蔵グラフィクス(Integrated GPU)です。内蔵グラフィクスはWord/Excelの処理くらいなら十分ですがゲーム用途だと不十分なので、現在内蔵グラフィクスで済ませている人がゲーム用グラボを購入する際の指標としてフレームレートベンチマークを掲載しておきます。

PUBGではGT1030を超えていますが全体的にみればGT1030より下でGT710より上のフレームレートになっています。内蔵グラフィクスより上のグラボを買う場合は最低でもGT1030からになります。

46位: NVIDIA GeForce GT 710

192コア 単精度0.366TFlops、倍精度0.0153TFlops TDP19W

HDMI 1.4a対応。PCI Express 2.0×16~1(接続スロットが×16のモデルもあれば×1のモデルもある)。最大同時表示画面数3画面。

このGT710は「ロープロファイルかつファンレスかつ1スロット占有」を実現できている貴重なグラボです。これより1ランク上位のGT1030では「ファンレスかつ1スロット占有」を実現できないため、ファンレスと1スロット占有を両立したい場合はこのGT710一択になります。

このグラボにはゲーミング性能は期待できません。単精度浮動小数点数演算性能が0.366TFlopsしかなく、Intel Coreプロセッサに搭載されているオンボードグラフィックス(iGPU:内蔵グラフィックス)よりも低性能です。

このGT710は、Xeon-WやXeon Scalable Familyプロセッサのようにオンボードグラフィックスを搭載していないCPUを使う場合に「とりあえずディスプレイが映ればいい」用途でよく使われるGPUです。

GT1030では最大2画面表示まででしたが、GT710は3画面表示可能です(ただしそのうち1画面はアナログD-Sub接続になる)。描画性能はGT1030より大きく劣っているものの、同時接続画面数はGT710のほうが優れています。

NVIDIA GeForce GT 710チップを搭載した各メーカーのグラボはこちらで比較しています。

NVIDIA GeForceとAMD Radeonの違い

ゲーム用GPUは「NVIDIA GeForce」または「AMD Radeon」が選択肢になります。この両者のうちどちらがいいのかというのがGPUの選択における論点です。

この両者では決定的に異なる根幹の部分での違いと、細かい部分の枝葉の違いがあります。例えばNVIDIA製GPUでは「Ray Tracing Core」や「Tensor Core」を搭載していることでレイトレーシングや機械学習が高速化されていますが、こういったのはオマケ機能のようなもので些末の問題です。特にTensor Coreは深層学習(機械学習)の計算用途に使うユーザーにとっては恩恵が大きいですが、一般的なゲーマーにとっては殆ど恩恵がありません。

根幹となる違いは別のところにあります。

NVIDIA GeForceはアーキテクチャが優秀なため1コアあたりの性能が高い

NVIDIA製GeForceの特徴は1コアあたりの性能が高いことです。NVIDIA製GPUがすごいところは、動作クロックがさほど高くなくても、動作クロックが高いAMD製GPUに1コアあたりの性能で勝ててしまうことです。

例えばNVIDIA GeForce RTX 2060は1,920コアです。この1,920コアというコア数は、GeForce GTX1650(896コア)と性能が互角なAMD Radeon RX 570(2,048コア)よりも少ないです。

しかし、「GeForce RTX 2060」または「Radeon RX 570」どちらが高性能かと言えば大多数の人がRTX2060選ぶでしょう。ここで明らかなのが「コア数が多くても高性能とは限らない」ということです。

AMD Radeonはアーキテクチャが劣っているため1コアあたりの性能が低い

AMD Radeonはコア数だけは多いですが1コアあたりの性能が非常に低いのが特徴です。

例えばGeForce RTX 2070は2,304コア搭載していますが、Radeon RX 590も同じく2,304コアです。しかし1コアあたりの性能でAMD Radeon RX 590は非常に劣っています。

その結果、実際のゲームフレームレートではGeForce RTX 2070がRX 590に完勝するという結果になっています。

NVIDIAよりもAMDはアーキテクチャが劣っており、その劣勢を動作クロックを引き上げる力任せ法でカバーしているがそれでもAMDの負け

AMD製GPUは性能の割に消費電力が非常に高いです。同じ消費電力ならNVIDIA GeForceが圧倒的に高性能です。これは、同一コア数・同一動作クロックのNVIDIA GeForceとAMD Radeonで勝負をした場合、NVIDIA GeForceが勝つことを意味します。

AMD製GPUは、2020年にリリースされたNavi20でリファレンスモデルですら2,000MHzの動作クロックです。そのせいで、コア数はNVIDIAの半分にもかかわらず消費電力は同程度になってしまっています。

なぜここまで動作クロックをAMDが引き上げているかというと、アーキテクチャが劣っているため同一クロックだとNVIDIA GeForceに負けてしまうからです。そのアーキテクチャの劣りをカバーするために、動作クロックを引き上げて誤魔化しているのがAMD Radeonです。動作クロックを引き上げると、その引き上げ率の二乗に比例して消費電力が増えます。これがAMD Radeonが性能の割に消費電力が大きい理由です。

AMDはNVIDIAよりもアーキテクチャ技術で劣っているため、同じ動作クロックで勝負したら絶対にNVIDIAには勝てません。そこで、その技術力の差を動作クロックの引き上げでなんとか背伸びしている状況です。しかし背伸びしても全くNVIDIA GeForceに追いつけていないのが現状です。

AMD Radeonは本来カウンターパートとして想定しているNVIDIA GeForceから2グレードも下のNVIDIA GeForceに負けることが常態化

例えばRadeon RX 6800は、2グレード下のGeForce RTX 3070に敗北しており、Radeon RX 6800 XTになってようやくGeForce  RTX 3070と互角です。

同一メーカーのGPUで比較する場合、高い解像度でゲームをするならコア数が多い方が有利だが、低い解像度ならコア数が少ない方が有利

コア数を増やさず1コアあたりの性能の高さを優先するメリットは何でしょうか?

ここでは同一メーカー内のGPUラインナップで、どのGPUを選んだらいいかという観点で例を出します。例えばNVIDIA製GPUの中でどのGPUを選ぶべきかの指標です。AMD製GPUの中でどのGPUを選ぶべきかの場合も同様です。

まず、「2,000MHzの動作周波数を持った1,000コアのGPU」と、「1,000MHzの動作周波数を持った2,000コアのGPU」ではどちらが有利でしょうか。

理論性能では両者ともに単精度4TFlops(4,000GFlops)で同じです。しかし実際のゲーミング性能では前者のGPUが勝ちます。

GPUの仕事は、光源とオブジェクトと視点の座標(ベクトル)をCPUから受け取り、ディスプレイの各ピクセル(画素)の色(Red256通り×Green256通り×Blue256通り)を算出することです。1920×1080のフルHDディスプレイだったら、1920×1080=2,073,600ピクセル分の色を計算し終えたところで、1フレームの計算を終えたことになります。もしこの約200万ピクセル分の計算を0.01秒で終えることができるとフレームレート100fpsになります。計算に0.02秒かかるとフレームレートが50fpsになります。

例えば2,000コアのGPUが2,000コアをフルに稼働させて0.02秒で1フレーム分のピクセル数を計算できているとします。この場合フレームレートは50fpsです。

そうすると1,000コアのGPUは1,000コアをフルに稼働させて0.02秒で1フレーム分のピクセル数を計算できます。1,000コアは2,000コアの半分ですが、動作クロックが2倍の2,000MHzあるので、2,000コアのGPUと同じフレームレート50fpsを実現できるわけです。

しかしここで、CPUから送られてくるオブジェクトの数(計算対象の数)が少ない場合を考えます。そうなると2,000コアのようにいくらコア数があっても計算対象となるオブジェクト数が少ない以上、余ったコアは計算に使われずアイドリング状態(手持ち無沙汰)になってしまいます。つまり空回りです。

このようにオブジェクト数が少ない状態になると、2,000コアのGPUはそのうち1,000コアを稼働させて0.02秒で1フレーム分の計算を終えます。つまり先程の例と同じ50fpsです。しかし残り1,000コアは使われないまま放置状態になります。これが「コア数を使い切れない状態」になってしまう「コア数を増やす戦略の弱点」です。AMD Ryzenも同じ理由でコア数が使いきれず性能が伸びなくなっています。

一方で1,000コアのGPUは1,000コアをフルに使って計算をすることができます。もともとコア数が少ないのでコアが余ることがないからです。そして1,000コアのGPUでは2,000MHzの動作クロックがあるために、たった0.01秒で1フレーム分の計算が完了します。先程の例ではオブジェクトの数が多かったため0.02秒かかっていましたが、計算すべきオブジェクトの数が減ったため0.01秒で1フレームの計算を完了できます。そうすると1,000コアのGPUでは100fpsを実現できることになります。

これが「1コアあたりの性能が高い」GPUのメリットです。計算すべきオブジェクト数が多いときは2,000コアのGPUと差が付きませんが、オブジェクト数が少ないときは1コアあたりの性能が高い1,000コアのGPUの方が有利になります。

同一メーカーのGPUで比較する場合、フルHD解像度でゲームをするなら動作クロックが高いGPUが有利

ここでも同一メーカー内でのGPUの選び方を解説します。結論から言うと、同じNVIDIA内のGPUだったら動作クロックが高いGPUが有利です。

ゲームの入れ替わりは激しく、少し時間が経過しただけでそれまでビッグタイトルだったゲームも退場していきます。GPUは高価なPCパーツなので、多くの人は長く使える確かなものを選びたいと考えているはずです。

「今後どのようなゲームが登場しても高い性能を発揮できるGPU」を選ぶことが重要だと言えます。そのような場合には「1コアあたりの性能が高いGPU」が確かな選択です。

「1コアあたりの性能が高いGPU」は下図のうち「汎用」の青い線に該当します。一方で「1コアあたりの性能が低いGPU」は「特殊用途」の赤い線に該当します。横軸は各用途(ゲームの特性)です。

ここで重要なのは、青い線でも赤い線でも積分をすると面積は同じになるということです。

コア数が少なくても1コアあたりの性能が高いGPUでは「汎用性が高い」ため、どのようなゲームでも対応できるようになっています。

しかし、コア数は多いけど1コアあたりの性能が低いGPUでは、計算すべきオブジェクト数が多い一部のゲームでは高い性能を発揮できますが、計算すべきオブジェクト数が少ないゲームでは「1コアあたりの性能が高いGPU」よりも低い性能となってしまいます。

つまり「1コアあたりの性能が低いGPU」は汎用性を犠牲にするかわりに、計算すべきオブジェクト数が多く、多数のコアを使い切れるごく一部のゲームに特化することによってその場合には高い性能を発揮できるようにしているGPUです。4K解像度で主にゲームをする場合もこれに該当します。

一方で平均的に全体的にみれば、ほとんどのゲームで「1コアあたりの性能が高いGPU」の方がフレームレートが高くなっています。上図のように「1コアあたりの性能が低いGPU」の方が汎用性が高いためです。

もし「1コアあたりの性能が低いGPU」がマッチするごく一部のゲームしかやらないというのだったら「1コアあたりの性能が低いGPU」が最適な選択になります。しかし今後どのようなゲームをやることになっても手堅く性能を発揮したいというのなら「1コアあたりの性能が高いGPU」が良い選択です。

グラフィックボードの選び方

NVIDIAやAMDが提供するのはチップ(Processing Unit回路を搭載したダイ)のみであり、それを基板に搭載し冷却機構を用意、VRAMの搭載、補助電源回路の搭載といったことはASUS、MSI、ZOTAC等のグラボ製造各社が実施します。たとえ同じチップであってもこの部分で各グラフィックボードの差が付きます。以下、各社から大量にラインナップされているグラフィックボードの選び方を掲載します。

1. PCケースに収まる外形サイズを最優先する

まずは何はともあれ外形サイズが最も重要です。PCケースに搭載できない大きさのグラボを買っても意味がありません。

使用するPCケースが既に決定されている場合は簡単です。そのPCケースに合うサイズの外形のグラボを絞り込んでその中から選ぶだけです。

しかしまだPCケースが決まっていない場合は非常に大変な作業になります。

例えばFractal DesignのDefine Cには、GIGABYTEの簡易水冷一体型(240mmラジエータタイプ)グラボのラジエータをフロントに搭載すると、グラボ本体がサイズの制限で搭載できなくなります。全長が290mm台と長いのが搭載できない要因でありあと数mm足りず入り切らないようです。搭載するためにPCケースのネジ止め部分を4mm無理やり押し込んで曲げて搭載している人もいます。こういった改造(modification)をしてグラボを搭載することはあまりおすすめできません。

最もおすすめなのはPCケースとグラフィックボードを一体的に選択することです。PCケース側の問題としては、グラボの全長、厚み(占有スロット)、高さ(ロープロファイルかどうか)の対応状況が重要になります。またPCケースが334mmのグラボに対応していても、フロントに25mm厚ファンを搭載したり、水冷ラジエータ+ファンを搭載すると290mmのグラボすら搭載できないこともあります。このような部分を詳細に調べて選ぶことが最優先です。

2. 冷却性能を後から向上させるのは難しい 最初から冷却性能が高いグラボを選択する

消費電力が高いグラボは必然的に高発熱になりGPUの性能を悪化させます。貧弱な冷却機構はGPU本来の性能を引き出せない要因です。

例えば3スロット占有で全長324mmもある大型グラボの「MSI 2080Ti LIGHTNING Z(補助電源8ピン×3)」が、それよりも消費電力が低い「Inno3D 2080Ti iCHILL BLACK(補助電源8ピン×2)」に3D Markスコアで負けてしまっている事実があります。

空冷だと、空冷の雄とも言える「ZOTAC AMP Extreme(補助電源8ピン×2)」をもってしても温度は85℃まで上がってしまいます。空冷だとこれが限界です。3スロット占有かつ全長324mmでもこの程度ですから、CPUを簡易水冷化にする前にまずは発熱量と消費電力量が大きいグラボこそまず先に簡易水冷化を考えるべきです。

簡易水冷化する場合、簡易水冷ユニット+通常の空冷ファン(主にVRAMを冷却)のハイブリッド型と、簡易水冷のみでグラボ全体を冷却するタイプの2つがあります。

前者の場合は、「MSI SEA HAWKシリーズ」のような水冷+空冷ファンのハイブリッド型を購入するか、「NZXT」「EVGA」から発売されている簡易水冷化キットを使ってハイブリッドタイプの簡易水冷化を行います。

後者の場合は「GIGABYTE WATERFORCEシリーズ」か「Inno3D Ichill Blackシリーズ」を選択することになります。

3. 補助電源コネクタ搭載数は多いに越したことはない あとから最大電力を絞ることができる

PCIeの補助電源規格はCPU補助電源と比べて非常に冷遇されています。CPU補助電源は12Vの1ケーブルあたり7アンペア弱まで電流を流す仕様になっているマザーボードが多いです。実際は10Aも可能なのですが、あえて抑えています。それでも4ピンで160W程度、8ピンで320W程度も電力を取り出すことができ、8ピン+4ピンのCPU補助電源ではTDP480W級CPUも対応可能です。

一方でPCI Expressの電源規格では、6ピン補助電源が上限75W、8ピン補助電源が上限150Wと「規定」されています。これはコネクタやケーブルの物理的な電流の上限値による制約ではなく、単なる仕様上の上限です。これは非常に絞ってあります。たとえばPCIe補助電源では8ピンであっても実際に来ている12Vのピン数はたった3つです。残り5ピンは全てGNDです。CPU補助電源では8ピンで12Vが4ピン、GNDが4ピンなのに比べるとPCIe補助電源はこの時点で劣っています。

そうなると12V×7A(CPU補助電源と同水準の電流値)×3=252Wまで取り出せると思うかもしれませんが実際は150Wまでです。なぜかというと1ピンあたり4Aまでしか電流を流さない「仕様」になっているからです。

これはあくまでも仕様なので、グラボ側の電源回路でこれを遵守しなければ8ピンPCIeコネクタから12V×7A取り出すことは可能で、実際にそのようなグラボも過去にはありました。しかし最近は律儀に「150W規制」を守っているグラボがほとんどです。

グラボへ供給できる電力は、マザーボードから供給される75Wに加えて、8ピン150W+8ピン150Wの合計375Wが限界になっているものがほとんどです。PCIe電源規格を遵守するならさらに低く、マザーボードからの75W+8ピン150W+6ピン75Wで300Wが限界です。これではさすがに足りないということで、この規格を破って375Wグラボが大量にあるのが現実です。

しかしオーバークロックするとしたら375Wでも足りなくなることがあります。そこで8ピン×3の補助電源を搭載したグラボなら525Wまでグラボに電力供給できるようになります。空冷だとさすがに525Wは多すぎますが、多い分にはあとからツールで最大消費電力を絞って設定してあげればいいので、補助電源コネクタ数が多いに越したことはありません。残念なのは、2080Tiかつ消費電力375W運用で簡易水冷一体型だと最大温度が55℃止まりでさらにオーバークロックを狙えるのにもかかわらず、補助電源8ピン×2のみしか搭載されていないグラボが多いことです。8ピン×3のグラボが少ないのは、PCIe電源規格でコネクタ数は2つまでと規定されているため、堂々とコネクタ3つを搭載できないという事情があります。

4. ファクトリーオーバークロック値は目安 ツールで自由にオーバークロックできるため

NVIDIAが提供するリファレンスモデルは全くオーバークロックされていない基本的な動作クロックです。Founders Editionですらブーストクロックは若干オーバークロックされています。そしてASUS,MSI,ZOTAC各社のグラボはさらにオーバークロックされて出荷されておりこれを「ファクトリーオーバークロック」と呼んで区別しています。

実はファクトリーオーバークロックされていてもいなくても、各人で勝手に自由にオーバークロックできます。

ファクトリーオーバークロックだと、各自がツールでオーバークロック設定をする面倒がなく、購入してパソコンに搭載して電源を入れれば既にオーバークロックされた状態で動作するというメリットがあります。

そのためグラボのスペック表に書いてあるベースクロックの高低、ブーストクロックの高低はあまり気にする必要はありません。ファクトリーオーバークロック値が高すぎる(もっと低消費電力にしたい)場合はツールで動作クロックを落とすこともできます。実際にそのようにクロックを落としてTDP値を下げてファンレス運用しているユーザもいます。

逆にファクトリーオーバークロック値が低すぎる場合はツールでさらにオーバークロックすることもできます。ただしこの場合オーバークロックできる上限は、冷却性能と補助電源からの電力供給量によって制限されるので、冷却性能が高くかつ補助電源コネクタ数が充実しているグラボを選択することが重要です。

5. ファクトリーオーバークロック値は冷却性能の参考になる

「4」の項目でファクトリーオーバークロック値に関係なく各自で自由にオーバークロックできることを説明しました。ではファクトリーオーバークロック値は全く参考にならないかというとそうではありません。ファクトリーオーバークロック値はASUS,MSI,ZOTACといったグラボ製造元が「この程度のブーストクロックなら冷却し切れて正常に動作する」と太鼓判を押している値だからです。

メーカ側が用意した冷却機構で冷やしきれる範囲内でできるだけオーバークロックしようとするのが当然です。ブーストクロック値が大きければ大きいほど高性能なグラボだと消費者は考えるからです。そのためファクトリーオーバークロック値はそのグラボの冷却性能に追随して設定されているということです。メーカによってはギリギリのファクトリーオーバークロックをしたり、できるだけ余裕をもって低めのファクトリーオーバークロックに留めているという差があるので、ブーストクロック値が冷却性能をそのまま表すわけではないのですが参考値にはなります。実際、占有スロット数が大きい分厚いグラボや、全長が長いグラボほど高いファクトリーオーバークロック値が公称されているので一つの目安にはなります。