【2019年最新版】ゲーム用おすすめグラフィックボードの比較  RTX2080Ti,2080,2070, GTX1660Ti,1650のTuring世代から1080Ti,1080,1070,1060のPascal世代まで横断評価

グラフィックボードについては大半の人がゲーム用に関心があると思うので当然ゲーム用途を前提としたグラボ評価を行っていきます。

一方でグラフィックボードというのはメインのホストプロセッサ(core i9やXeonなど)の性能のみでは足りないときに、グラボを「コプロセッサ」として使う深層学習や金融分析などの科学技術計算分野でも重要視されています。ゲーム用途に比べたら遥かに少数派でしょうが、一応そのような科学技術計算の観点からの評価はこちらに分けて掲載しています。

インデックス:

NVIDIA GeForceとAMD Radeonの違いの本質

ゲーム用GPUは「NVIDIA GeForce」または「AMD Radeon」が選択肢になります。この両者のうちどちらがいいのかというのがGPUの選択における論点です。

この両者では決定的に異なる根幹の部分での違いと、細かい部分の枝葉の違いがあります。例えばNVIDIA製GPUでは「Ray Tracing Core」や「Tensor Core」を搭載していることでレイトレーシングや機械学習が高速化されていますが、こういったのはオマケ機能のようなもので些末の問題です。根幹となる違いは別のところにあります。

NVIDIA GeForceはコア数は少ないが1コアあたりの性能が高い

NVIDIA製GeForceの特徴はコア数が少なくそのかわり1コアあたりの性能が高いことです。

例えばNVIDIA GeForce RTX 2060は1,920コアです。この1,920コアというコア数は、GeForce GTX1650(896コア)と性能が互角なAMD Radeon RX 570(2,048コア)よりも少ないです。

しかし、「GeForce RTX 2060」または「Radeon RX 570」どちらが高性能かと言えば大多数の人がRTX2060選ぶでしょう。

ここで明らかなのが「コア数が多くても高性能とは限らない」ということです。

AMD Radeonはコア数は多いが1コアあたりの性能が低い

AMD Radeonはコア数だけは多いですが1コアあたりの性能が非常に低いのが特徴です。

例えばGeForce RTX 2070は2,304コア搭載していますが、Radeon RX 590も同じく2,304コアです。しかし動作クロックは違いがあります。

GeForce RTX 2070はオーバークロックモデルのブーストクロックで1860MHzを実現しています。

一方でRadeon RX 590はオーバークロックモデルでもブーストクロック1,576MHzが限界です。

その結果、実際のゲームフレームレートではGeForce RTX 2070がRX 590に完勝するという結果になっています。

動作クロックを引き上げるだけなら簡単だと思われるかもしれませんが、コア数を増やすよりも動作クロックを向上させるほうが設計上大変難しいことです。

実は動作クロックを上げることよりもコア数を増やすことのほうが簡単なのです。

動作クロックを向上させることは技術的に難しい

GPUは「AND、OR、NOT」の論理素子を組合せた論理回路です(実装ではNANDゲートが基本)。論理回路はbool代数上の理論的な回路なので、その論理回路を現実に実装するために半導体を使った電子回路として実装されています。

しかし、理論上の論理回路とは異なり、実際の電子回路では様々な問題に直面します。

論理回路(順序回路)では、クロック信号の立ち上がりや立ち下がりに合わせて同時に演算を開始するように「同期」をとっています。このクロック信号の立ち上がりのタイミングがずれてしまうと演算結果が誤ってしまう「ソフトエラー」が発生します。ここでいう「ソフト」とはコンピュータソフトウェアのことを指しているのではありません。GPU等のコンピュータハードウェアのハードウェアが断線しているといった「ハードエラー」に対して、回路は正しく電気的に接続されてるけれども信号の伝搬の不具合によって演算結果に誤りが発生してしまうことを「ソフトエラー」と呼びます。

実は動作周波数を上昇させればさせるほど、クロック信号の立ち上がりが鈍くなってしまいます。クロック信号のような矩形波をフーリエ変換してみるとわかりますが、クロック信号には高周波成分が含まれています。この高周波成分が欠けると丸みを帯びたクロック信号になってしまい、そうすると演算開始の同期が正確にとれずに演算結果の誤りが発生します。なぜクロック信号の高周波成分が減衰し丸みを帯びたクロック信号になってしまうかというと、高周波成分は回路の線路(導線)を通過すると大きく減衰してしまうからです。

このように、動作クロックを上昇させると様々な技術的困難に直面します。逆に言えば動作クロックを下げた状態なら高度な技術力は必要なく簡単に実現できてしまいます。

しかしこの技術的に難しいことをやりとげているのがNVIDIAのGPUです。CPU分野だとIntelがこのNVIDIAと同じことをやっています。NVIDIAは技術力が高いので、高い動作クロックを実現するGPUを開発できていますが、高度な技術力のないAMDは動作クロックの向上はあきらめてコア数を増やす方向性でGPUを展開しています。

NVIDIAがコア数を増やさず1コアあたりの性能にこだわる理由

NVIDIAはなぜコア数を増やさず1コアあたりの性能の高さにこだわるのでしょうか?

それはコア数を増やすのは技術的に簡単なので、技術的に劣っているAMDにも簡単に「コア数を増やす」を真似されてしまって市場で競合してしまうからです。AMDは安物路線なので、NVIDIAもそれに巻き込まれて価格低下の連鎖が避けられません。よって「コア数の多さで勝負」するといったAMDと同じ土俵に乗らずに、AMDが真似することが難しい「1コアあたりの性能を高くする」戦略をNVIDIAは採っています。

そして1コアあたりの性能が高いほうがユーザにとって好ましいという点もNVIDIAに有利になっています。

例えば「2,000MHzの動作周波数を持った1,000コアのNVIDIA GeForce」と、「1,000MHzの動作周波数を持った2,000コアのAMD Radeon」ではどちらが有利でしょうか?

理論性能では両者ともに単精度4TFlops(4,000GFlops)で同じです。しかし実際のゲーミング性能では前者のGPUが勝ちます。

GPUの仕事は、光源とオブジェクトと視点の座標(ベクトル)をCPUから受け取り、ディスプレイの各ピクセル(画素)の色(Red256通り×Green256通り×Blue256通り)を算出することです。1920×1080のフルHDディスプレイだったら、1920×1080=2,073,600ピクセル分の色を計算し終えたところで、1フレームの計算を終えたことになります。もしこの約200万ピクセル分の計算を0.01秒で終えることができるとフレームレート100fpsになります。計算に0.02秒かかるとフレームレートが50fpsになります。

例えば2,000コアのAMD Radeonが2,000コアをフルに稼働させて0.02秒で1フレーム分のピクセル数を計算できているとします。この場合フレームレートは50fpsです。

そうすると1,000コアのNVIDIA GeForceは1,000コアをフルに稼働させて0.02秒で1フレーム分のピクセル数を計算できます。1,000コアはAMD Radeonの半分ですが、動作クロックが2倍の2,000MHzあるので、2,000コアのAMD Radeonと同じフレームレート50fpsを実現できるわけです。

しかしここで、CPUから送られてくるオブジェクトの数(計算対象の数)が少ない場合を考えます。そうなると2,000コアのようにいくらコア数があっても計算対象となるオブジェクト数が少ない以上、余ったコアは計算に使われずアイドリング状態(手持ち無沙汰)になってしまいます。つまり空回りです。

このようにオブジェクト数が少ない状態になると、2,000コアのAMD Radeonはそのうち1,000コアを稼働させて0.02秒で1フレーム分の計算を終えます。つまり先程の例と同じ50fpsです。しかし残り1,000コアは使われないまま放置状態になります。これが「コア数を使い切れない状態」になってしまう「コア数を増やす戦略の弱点」です。AMD Ryzenも同じ理由でコア数が使いきれず性能が伸びなくなっています。

一方で1,000コアのNVIDIA GeForceは1,000コアをフルに使って計算をすることができます。もともとコア数が少ないのでコアが余ることがないからです。そしてNVIDIA GeForceでは2,000MHzの動作クロックがあるために、たった0.01秒で1フレーム分の計算が完了します。先程の例ではオブジェクトの数が多かったため0.02秒かかっていましたが、計算すべきオブジェクトの数が減ったため0.01秒で1フレームの計算を完了できます。そうするとNVIDIA GeForceでは100fpsを実現できることになります。

これがNVIDIA GeForceのような「1コアあたりの性能が高い」GPUのメリットです。計算すべきオブジェクト数が多いときはAMD Radeonと差が付きませんが、オブジェクト数が少ないときは1コアあたりの性能が高いNVIDIA GeForceのほうが有利になります。この恩恵を受けているのがPUBGやFF15です。

AMDはコア数は増やしても1コアあたりの性能が低い理由

AMDがコア数を増やすことができても、1コアあたりの性能を高くできないのは単に技術力で劣っているためです。AMDも本来なら1コアあたりの性能を高めたいと考えています。しかし半導体産業というのは投資額が全てであり、資本で劣っているAMDはNVIDIAの投資額に遠く及びません。

つまりAMDはNVIDIAと同じ土俵で勝負しようとしても絶対に勝てません。そこでAMDは1コアあたりの性能を低くするかわりにコア数を増やすという戦略を採っています。これはIntel CoreとAMD RyzenのCPUの構図と全く一緒です。

AMD Radeonのように動作周波数が低ければ高クロックに耐えられない不良品比率を下げることもでき、歩留まりを良くすることもできます。結果的に製造原価を安くすることができるわけです。そのためAMD Radeonは非常に安い価格で売られています。

AMDのマーケティングは「1コアあたりの性能を下げ動作クロックを低くし歩留まりを良くして価格を下げて安く提供する」というものです。

どのようなゲームでもまんべんなく対応したいならNVIDIA GeForceがAMD Radeonよりも優れている

ゲームの入れ替わりは激しく、少し時間が経過しただけでそれまでビッグタイトルだったゲームも退場していきます。GPUは高価なPCパーツなので、多くの人は長く使える確かなものを選びたいと考えているはずです。

「今後どのようなゲームが登場しても高い性能を発揮できるGPU」を選ぶことが重要だと言えます。そのような場合にはNVIDIA GeForceを選ぶのが確かな選択です。

NVIDIA GeForceは下図のうち「汎用」の青い線に該当します。一方でAMD Radeonは「特殊用途」の赤い線に該当します。横軸は各用途(ゲームの特性)です。

ここで重要なのは、青い線でも赤い線でも積分をすると面積は同じになるということです。

コア数が少なくても1コアあたりの性能が高いNVIDIA GeForceでは「汎用性が高い」ため、どのようなゲームでも対応できるようになっています。

しかしAMD Radeonのようにコア数は多いけど1コアあたりの性能が低いGPUでは、計算すべきオブジェクト数が多い一部のゲームでは高い性能を発揮できますが、計算すべきオブジェクト数が少ないゲームではNVIDIA GeForceよりも低い性能となってしまいます。

つまりAMD Radeonでは汎用性を犠牲にするかわりに、計算すべきオブジェクト数が多く、多数のコアを使い切れるごく一部のゲームに特化することによってその場合には高い性能を発揮できるようにしているGPUです。幸いにもApex Legendsはそのパターンにはまっているので、Radeon VIIはGeForce RTX 2080と互角なフレームレート性能を実現しています。

一方で平均的に全体的にみれば、ほとんどのゲームでNVIDIA GeForceのほうがフレームレートが高くなっているのは、上図のようにNVIDIA GeForceのほうが汎用性が高いためです。

もしAMD Radeonがマッチするごく一部のゲームしかやらないというのだったらAMD Radeonのほうが安いのでそれが最適な選択になります。しかし今後どのようなゲームをやることになっても手堅く性能を発揮したいというのならNVIDIA GeForceが良い選択です。

グラフィックボードの選び方

NVIDIAやAMDが提供するのはチップ(Processing Unit回路を搭載したダイ)のみであり、それを基板に搭載し冷却機構を用意、VRAMの搭載、補助電源回路の搭載といったことはASUS、MSI、ZOTAC等のグラボ製造各社が実施します。たとえ同じチップであってもこの部分で各グラフィックボードの差が付きます。以下、各社から大量にラインナップされているグラフィックボードの選び方を掲載します。

1. PCケースに収まる外形サイズを最優先する

まずは何はともあれ外形サイズが最も重要です。PCケースに搭載できない大きさのグラボを買っても意味がありません。

使用するPCケースが既に決定されている場合は簡単です。そのPCケースに合うサイズの外形のグラボを絞り込んでその中から選ぶだけです。

しかしまだPCケースが決まっていない場合は非常に大変な作業になります。

例えばFractal DesignのDefine Cには、GIGABYTEの簡易水冷一体型(240mmラジエータタイプ)グラボのラジエータをフロントに搭載すると、グラボ本体がサイズの制限で搭載できなくなります。全長が290mm台と長いのが搭載できない要因でありあと数mm足りず入り切らないようです。搭載するためにPCケースのネジ止め部分を4mm無理やり押し込んで曲げて搭載している人もいます。こういった改造(modification)をしてグラボを搭載することはあまりおすすめできません。

最もおすすめなのはPCケースとグラフィックボードを一体的に選択することです。PCケース側の問題としては、グラボの全長、厚み(占有スロット)、高さ(ロープロファイルかどうか)の対応状況が重要になります。またPCケースが334mmのグラボに対応していても、フロントに25mm厚ファンを搭載したり、水冷ラジエータ+ファンを搭載すると290mmのグラボすら搭載できないこともあります。このような部分を詳細に調べて選ぶことが最優先です。

2. 冷却性能を後から向上させるのは難しい 最初から冷却性能が高いグラボを選択する

消費電力が高いグラボは必然的に高発熱になりGPUの性能を悪化させます。貧弱な冷却機構はGPU本来の性能を引き出せない要因です。

例えば3スロット占有で全長324mmもある大型グラボの「MSI 2080Ti LIGHTNING Z(補助電源8ピン×3)」が、それよりも消費電力が低い「Inno3D 2080Ti iCHILL BLACK(補助電源8ピン×2)」に3D Markスコアで負けてしまっている事実があります。

空冷だと、空冷の雄とも言える「ZOTAC AMP Extreme(補助電源8ピン×2)」をもってしても温度は85℃まで上がってしまいます。空冷だとこれが限界です。3スロット占有かつ全長324mmでもこの程度ですから、CPUを簡易水冷化にする前にまずは発熱量と消費電力量が大きいグラボこそまず先に簡易水冷化を考えるべきです。

簡易水冷化する場合、簡易水冷ユニット+通常の空冷ファン(主にVRAMを冷却)のハイブリッド型と、簡易水冷のみでグラボ全体を冷却するタイプの2つがあります。

前者の場合は、「MSI SEA HAWKシリーズ」のような水冷+空冷ファンのハイブリッド型を購入するか、「NZXT」「EVGA」から発売されている簡易水冷化キットを使ってハイブリッドタイプの簡易水冷化を行います。

後者の場合は「GIGABYTE WATERFORCEシリーズ」か「Inno3D Ichill Blackシリーズ」を選択することになります。

3. 補助電源コネクタ搭載数は多いに越したことはない あとから最大電力を絞ることができる

PCIeの補助電源規格はCPU補助電源と比べて非常に冷遇されています。CPU補助電源は12Vの1ケーブルあたり7アンペア弱まで電流を流す仕様になっているマザーボードが多いです。実際は10Aも可能なのですが、あえて抑えています。それでも4ピンで160W程度、8ピンで320W程度も電力を取り出すことができ、8ピン+4ピンのCPU補助電源ではTDP480W級CPUも対応可能です。

一方でPCI Expressの電源規格では、6ピン補助電源が上限75W、8ピン補助電源が上限150Wと「規定」されています。これはコネクタやケーブルの物理的な電流の上限値による制約ではなく、単なる仕様上の上限です。これは非常に絞ってあります。たとえばPCIe補助電源では8ピンであっても実際に来ている12Vのピン数はたった3つです。残り5ピンは全てGNDです。CPU補助電源では8ピンで12Vが4ピン、GNDが4ピンなのに比べるとPCIe補助電源はこの時点で劣っています。

そうなると12V×7A(CPU補助電源と同水準の電流値)×3=252Wまで取り出せると思うかもしれませんが実際は150Wまでです。なぜかというと1ピンあたり4Aまでしか電流を流さない「仕様」になっているからです。

これはあくまでも仕様なので、グラボ側の電源回路でこれを遵守しなければ8ピンPCIeコネクタから12V×7A取り出すことは可能で、実際にそのようなグラボも過去にはありました。しかし最近は律儀に「150W規制」を守っているグラボがほとんどです。

グラボへ供給できる電力は、マザーボードから供給される75Wに加えて、8ピン150W+8ピン150Wの合計375Wが限界になっているものがほとんどです。PCIe電源規格を遵守するならさらに低く、マザーボードからの75W+8ピン150W+6ピン75Wで300Wが限界です。これではさすがに足りないということで、この規格を破って375Wグラボが大量にあるのが現実です。

しかしオーバークロックするとしたら375Wでも足りなくなることがあります。そこで8ピン×3の補助電源を搭載したグラボなら525Wまでグラボに電力供給できるようになります。空冷だとさすがに525Wは多すぎますが、多い分にはあとからツールで最大消費電力を絞って設定してあげればいいので、補助電源コネクタ数が多いに越したことはありません。残念なのは、2080Tiかつ消費電力375W運用で簡易水冷一体型だと最大温度が55℃止まりでさらにオーバークロックを狙えるのにもかかわらず、補助電源8ピン×2のみしか搭載されていないグラボが多いことです。8ピン×3のグラボが少ないのは、PCIe電源規格でコネクタ数は2つまでと規定されているため、堂々とコネクタ3つを搭載できないという事情があります。

4. ファクトリーオーバークロック値は目安 ツールで自由にオーバークロックできるため

NVIDIAが提供するリファレンスモデルは全くオーバークロックされていない基本的な動作クロックです。Founders Editionですらブーストクロックは若干オーバークロックされています。そしてASUS,MSI,ZOTAC各社のグラボはさらにオーバークロックされて出荷されておりこれを「ファクトリーオーバークロック」と呼んで区別しています。

実はファクトリーオーバークロックされていてもいなくても、各人で勝手に自由にオーバークロックできます。

ファクトリーオーバークロックだと、各自がツールでオーバークロック設定をする面倒がなく、購入してパソコンに搭載して電源を入れれば既にオーバークロックされた状態で動作するというメリットがあります。

そのためグラボのスペック表に書いてあるベースクロックの高低、ブーストクロックの高低はあまり気にする必要はありません。ファクトリーオーバークロック値が高すぎる(もっと低消費電力にしたい)場合はツールで動作クロックを落とすこともできます。実際にそのようにクロックを落としてTDP値を下げてファンレス運用しているユーザもいます。

逆にファクトリーオーバークロック値が低すぎる場合はツールでさらにオーバークロックすることもできます。ただしこの場合オーバークロックできる上限は、冷却性能と補助電源からの電力供給量によって制限されるので、冷却性能が高くかつ補助電源コネクタ数が充実しているグラボを選択することが重要です。

5. ファクトリーオーバークロック値は冷却性能の参考になる

「4」の項目でファクトリーオーバークロック値に関係なく各自で自由にオーバークロックできることを説明しました。ではファクトリーオーバークロック値は全く参考にならないかというとそうではありません。ファクトリーオーバークロック値はASUS,MSI,ZOTACといったグラボ製造元が「この程度のブーストクロックなら冷却し切れて正常に動作する」と太鼓判を押している値だからです。

メーカ側が用意した冷却機構で冷やしきれる範囲内でできるだけオーバークロックしようとするのが当然です。ブーストクロック値が大きければ大きいほど高性能なグラボだと消費者は考えるからです。そのためファクトリーオーバークロック値はそのグラボの冷却性能に追随して設定されているということです。メーカによってはギリギリのファクトリーオーバークロックをしたり、できるだけ余裕をもって低めのファクトリーオーバークロックに留めているという差があるので、ブーストクロック値が冷却性能をそのまま表すわけではないのですが参考値にはなります。実際、占有スロット数が大きい分厚いグラボや、全長が長いグラボほど高いファクトリーオーバークロック値が公称されているので一つの目安にはなります。

1位 NVIDIA TITAN RTX

4,608コア搭載しブーストクロック1,770MHzのグラボで、Turing世代ゲーム用GPUの中ではフラッグシップモデル。

使用されているダイ(チップ)はTU102でRTX2080Tiと同じです。よってダイ面積も754m㎡で同じです。

ではRTX2080TiとこのTitan RTXでは何が違うかと言うと、Titan RTXではダイ上のすべてのコアが有効化されています。つまりダイ上にエラーが許されないため歩留まりが悪く、それがこの価格の高さに直結しています。

リファレンスモデルしかないので日本国内では菱洋エレクトロ株式会社が代理店となり単一製品を各小売店が販売しています。

FLOPS性能ではブーストクロック1,770MHz時に16.312TFLOPSあるため、2080Tiの「ZOTAC AMP Extreme」が実現しているブーストクロック1,815MHz時の15.798TFLOPSを上回る性能です。

しかし、4,352コアの2080Tiで1,770MHzのブーストクロックを実現した「MSI LIGHTNING Z」は3スロット占有かつ全長328mmの冷却機構を備えています。同じ1,770MHzで4,608コアのTITAN RTXはそれよりも発熱量が大きいのは当然にもかかわらず冷却は2スロット占有267mm全長でファン×2。どうみてもTITAN RTXは1,770MHzのブーストクロックを出すのには適していません。各自で簡易水冷化するなどして冷却しないと本来の性能を引き出すのは難しいです。

TITAN RTXの基板規格はRTX2080Ti Founders Editionと同じであり、RTX2080Tiでも使える簡易水冷化キットが使用可能です。Titan RTXは簡易水冷化キット+CorsairやEVGA等の簡易水冷クーラーを組合せて使用しないと宝の持ち腐れになります。しかしこのTitan RTXは外形上の見た目が非常に良いので、簡易水冷化すると初期状態よりも見た目が悪くなるのは確実でありそこは非常にもったいない点です。

また、TITAN RTXの2080Tiより多いコア数がゲームでのフレームレート性能に直結するかといったらゲームによります。場合によってはコア数の多さよりも動作周波数の高さのほうがフレームレートの高さに貢献する場合があります。その場合は補助電源8ピン×3を搭載した「2080Ti MSI LIGHTNING Z」を限界までオーバークロックしたほうが有利です。

このTITAN RTXは十分に並列性が高い機械学習のコプロセッサとして使うには最適です。機械学習は応用分野によって単精度でいいか倍精度が必要か異なりますが、金融分析以外なら単精度で十分なので単精度浮動小数点演算能力に特化しているTITAN RTXは最適です。並列性が高く各コアを十分に使いきれるのなら補助電源8ピン×2で低い動作周波数であっても、オーバークロックした2080Tiより高いFlops性能が出ます。

難しいことを考えず単にゲーム用として使うことしか考えてないというのなら、2080Tiの「ZOTAC AMP Extreme」や「MSI LIGHTNING Z」を選んだほうが面倒がなくおすすめできます。

2位 NVIDIA GeForce RTX 2080 Ti

4,352コア 単精度13.4TFlops TDP250W

オーバークロックされていないリファレンスモデルのベースクロック1,350MHz、ブーストクロック1,545MHz

NVIDIA純正Founders Edition(ファウンダーズエディション)はブーストクロックのみオーバークロックされておりベースクロック1,350MHz、ブーストクロック1,635MHz

2018年発売のTuring(チューリング)世代ゲーム用グラボの中で上位に位置するモデルです。これより上にTITAN RTXがありますが、TITAN RTXはダイTU102のStreaming Multiprocessor72基全てを有効化しているため歩留まりが悪化し価格が非常に高くなってしまっています。そこで、このRTX2080TiではStreaiming Multiprocessorのうち4基を無効化し68基のみ有効化し歩留まりを改善し価格を安くしています。

Titan RTXでは4,608コア全てが有効化されていますが、RTX2080Tiではそのうち4,352コアが有効化されていることになります。

コア数を絞り1コアあたりの動作周波数を上げた「オーバークロック版の2080Ti」のほうがほとんどのゲームにおいてTITAN RTXよりもゲームのフレームレート(fps)が向上します。

「少ないコア数で高い動作周波数」と「多いコア数で低い動作周波数」なら、前者を達成するほうが後者を達成するよりも技術的に難易度が高いです。IntelもNVIDIAもできるだけ前者を目指していますが、それ以上どうしても動作周波数を上げられない場合はコア数を増やす水平展開をしています。それがTITAN RTXです。コア数を少なくして動作周波数の高さを追求してるのが2080Tiです。

AMDのグラボは動作周波数を高くする技術力がないためコア数の多さで勝負していますが、コア数が多いグラボを活かしきれるゲームが少ないため結果的に1コアの性能が高いNVIDIAのグラボのほうが有利です。

GeForce RTX 2080 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

3位 NVIDIA GeForce RTX 2080

2,944コア 単精度10.0TFlops TDP215W

CUDAコアを2,944コア搭載したTuring世代グラボです。レイトレーシングコアやテンサーコアを搭載してしまったことにより、ゲーミング用に割り当てる演算回路のチップ上面積が減ってしまい、ゲーミング性能に関しては先代のGTX1080Tiと同程度に留まってしまいました。

とはいっても現在の価格は1080TiよりもRTX2080のほうが安いです。1080Tiは生産を終了し品薄になってしまったためであり現在は2080が主流です。

しかし1080Tiを使わず1080で済ませているプロゲーマーが多かったことから、RTX2080の性能は必要なくRTX2070で十分なケースもあります。

ゲームは画質設定を最低にしたほうが視認性がよくなるため、プロゲーマーでも1080を使い1080Tiを使わない人は多かったです。

TwitchやYoutubeでストリーマーとして配信するのなら見栄えにこだわるため高画質設定でもフレームレートが落ちにくい2080Tiや2080を買うのもありでしょうが、単にフレームレートを高くしゲームでの優位性だけを追求するのなら低画質設定でRTX2070でも十分です。

GeForce RTX 2080チップを搭載した各メーカーのグラボはこちらで比較しています。

4位 NVIDIA GeForce GTX 1080 Ti

3,584コア単精度10.8TFlops、倍精度0.36TFlopsTDP250W

1080Tiは2017年発売でもうかなり古いグラボチップですが、2018年発売のRTXシリーズが大コケしたため消去法的に価値あるグラボになってしまいました。

特に2018年発売Turing世代のRTX2080Tiは1080Tiに毛が生えた程度のベンチマーク性能しかなく、その後発売されたTuring世代のフラッグシップモデルTITAN RTXにいたってはオーバークロックしたRTX2080Tiにも負けてるということで、さらに1080Tiの価値が高まってしまいました。

残念ながら1080Tiは生産終了した上に正規品の新品は既に在庫が切れているため、高額な転売品を選ぶしか手がないので、それなら新品のRTX2080Tiを正規で購入したほうがいいという状況です。本来ならこのレイトレーシング対応という大ミスをしたNvidiaの失策をチャンスとみてAMD Radeonが追撃するところですがRadeon VIIにはそれだけの力がなかったので、Turing世代の次がでる2020年4月までは2018年発売のRTX失敗作を選ぶしか無いのが現状です。

GeForce GTX 1080 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

5位 NVIDIA Titan X

3,584コア 単精度10.157TFlops、倍精度0.317TFlops TDP250W

2016年8月リリースの古いチップです。このGPUは現在のグラボの「性能の位置」を見るための参考値として重要です。

このTitanXは、Turingより1世代前のPascalアーキテクチャを採用した世代のNVIDIA製品の基本中の基本となっている根幹とも言える製品です。

GTX1080TiもQuadro GP100も全てこのTitanXの派生として簡単に導き出せます。

TITAN Xのコア数を3,584コアそのままで動作周波数を「引き上げた」のが1080Tiです。

そしてTITAN Xのコア数のままで倍精度浮動小数点演算能力に特化しつつ、動作周波数を「引き下げた」のがQuadro GP100です。

なぜ1080Tiでは動作周波数を引き上げたのかというと、ゲームを高速化するにはそれが一番手っ取り早いからです。

6位 NVIDIA GeForce RTX 2070

2,304コア 単精度7.465TFlops TDP175W

RTX2070はGTX1080を上回る性能を有している上にそれなりに安いので人気のあるモデルです。全長16cm程度のヒートシンクとファン×1でも冷やし切れるため、全長170mm以内に抑えたMini ITXマザーボードからはみ出さないタイプのショートタイプグラボが存在するのも2070のメリットです。

大多数のゲームにおいては下記のRadeon VIIよりもこちらのRTX2070のほうがフレームレートが高くなる上にこちらの2070のほうがRadeon VIIより安いため2070をおすすめします。

GeForce RTX2070チップを搭載した各メーカーのグラボはこちらで比較しています。

7位 AMD Radeon VII

Radeon VIIは2019年2月発売のGPUですが、2017年3月発売のGeForce GTX 1080Tiのゲーム性能を大幅に下回っています。2016年発売のGTX1080よりは性能は上です。しかしRadeon VIIは10万円近くするので、6万円程度だったGTX1080に比べたらコストパフォーマンスは圧倒的に悪いです。

Radeon VIIは2019年発売のGeForce RTX 2070と性能がほぼ互角です。ただしそれはレイトレーシング非対応ゲームに関してはほぼ互角というだけです。もしレイトレーシング対応ゲームで評価するとなると、Radeon VIIはRTX2070よりも大きく劣ります。

つまりRadeon VIIを買うなら1080TiかRTX2070を買ったほうがお得です。ただし1080Tiは既に品薄で手に入りづらく売っていても高値になってしまっているので、RTX2070が選択肢になります。RTX2070のほうがRadeon VIIより数万円程度安いので、合理的に判断するならばRadeon VIIよりもGeForce RTX2070のほうが得です。

それでも業界1位を嫌って業界第2位を応援したいユーザはこのRadeon VIIを選ぶようなので、合理的判断を抜きにして「AMDが好きだから」という判官びいきで買うのならRadeon VIIはおすすめだと思います。

Radeon VIIが評価できるのはレイトレーシングコアやテンサーコアといったものを搭載せずに、シェーダ描画しているゲーム向けに純粋に特化したグラボに仕上がっていることです。

特にApexLegendsに関してはRTX2080無印を上回るフレームレートを叩き出しています。他のゲームだと微妙ですが、PUBGからApexへごっそり移動した現在ではPUBGのフレームレートは無視していいでしょうし、Apex重視ならこのRadeon VIIはおすすめできます。

Radeon VIIチップを搭載した各メーカーのグラボはこちらで比較しています。

8位 NVIDIA GeForce GTX 1080

2,560コア 単精度8.228TFlops、倍精度0.257TFlops TDP180W

TDPが180Wあり、1070の150Wよりも30W発熱量が多くなっています。1080は事実上Pascal世代最高性能のグラフィックボードです。実は1080Tiよりも1080のほうが高性能になる(例えばゲームにおいてフレームレートが高くなる)ことが多々あります。その理由として1080はコア数こそ1080Tiより少ないものの、動作周波数は1080のほうが高いからです。

この1080は980Tiと比較してどうなのかという有名な論点があります。これについては答えが出ています。基本的にグラフィックボードはCUDA Coreと呼ばれる整数・浮動小数演算器のコア数が多ければ多いほど速くなります。1080はコア数が980tiよりも少ないことが、「1080よりも980tiの方が速い」と一部の人達から未だに言われている根拠です。しかし、1080はコア数を減らした上で動作周波数を上げたので980Tiより高速になっています。この動作周波数が上がったことが1080が980Tiより高速になった一つの理由です。現在流行りのマルチコア化は「周波数を下げる」ことと「コアを増やす」ことを同時にやることです。ですが1080では少し逆戻りし、「周波数を上げて」「コアを減らす」ということをやりました。なぜこのようなことをしたかと言えば、多すぎるコア数を使い切れるゲームがないからです。それならば余分なコアを削って、その余裕ができた分だけ動作周波数を上げたのが1080です。

動作周波数を上げると1クロックあたりに電気信号が進める長さが短くなってしまい技術的に難しいのですが、コア数を減らすことで1080は動作周波数を上げることに成功しました。

1080が高速になったもう一つの理由は、「倍精度」浮動小数点演算のコアを削って、その分だけ「単精度」浮動小数点演算のコアを増やしたことです。ゲームというのは「単精度」浮動小数点演算が重要であり、「倍精度」はそこまで必要としません。科学技術計算が「倍精度」かそれ以上を要求するのとはゲームは違うわけです。ゲームでは64ビット用いる倍精度浮動小数点演算よりも、32ビット単精度浮動小数点演算用の演算器に半導体チップ面積を大きく割り当てた方が速くなるので、1080ではそのような最適化をしました。

つまりはゲーム用途に徹底的に最適化したものが1080だと言えます。

GeForce GTX 1080チップを搭載した各メーカーのグラボはこちらで比較しています。

9位 NVIDIA GeForce RTX 2060

1,920コア 単精度6.451TFlops、倍精度0.202TFlops TDP160W

1世代前のGTX1070と同じCUDA Core数を持ちますが、性能がほとんど向上していません。しかもTDPを10W上乗せしてTDP160Wにしてこの性能ですから、事実上消費電力量をアップさせて達成した性能向上に見えます。

消費電力が増えたことで補助電源も8ピンになっています。GTX1070では補助電源は6ピン×1でした。6ピン補助電源は最大で75Wを供給すると規格化されています(実際はもっと多くの電力を取り出せますが規格で制限しています)。つまりマザーボードからの供給電力75Wと、6ピン補助電源の75Wでは150W止まりであり、RTX2060のTDP160Wの発熱量(消費電力はTDPより大きくなる)をまかないきれないためRTX2060では8ピン補助電源となりました。8ピン補助電源では最大150Wが規格化されているため、マザーボードからの75Wと合算して225Wもの電力供給があることになり、オーバークロックするとしてもかなり余裕があります。

GTX1070と比較してほとんど性能向上していない理由は、レイトレーシングコアやテンサーコアを搭載してしまったためゲーム用演算回路が1世代前からほぼ増加しなかったからです。ユーザーが求めていない機能をメーカーの独善で搭載してしまい失敗した典型例の一つになります。

GeForce RTX2060チップを搭載した各メーカーのグラボはこちらで比較しています。

10位 NVIDIA GeForce GTX 1070

1,920コア 単精度5.783TFlops、倍精度0.181TFlops TDP150W

Displayport 4K対応。HDMI2.0対応。PCI Express 3.0 x 16。最大同時表示画面数4画面。

1070になるとTDPは150Wになり、1060より発熱量が30W上昇します。しかしこれはあまり大きな上昇幅ではありません。1050Tiの75Wから1060の120Wのほうが大きな上昇幅です。

GeForce GTX 1070チップを搭載した各メーカーのグラボはこちらで比較しています。

11位 NVIDIA GeForce GTX 1660 Ti

1,536コア 単精度5.437TFlops、倍精度0.1699TFlops TDP120W

2019年発売なのに2016年発売のGTX1070無印よりもゲーム性能が低い微妙なチップです。レイトレーシング専用の演算回路が非搭載である点は評価できますが、レイトレーシングコアを削った割には性能が伸びていません。RTX2080Tiからレイトレーシングコアやテンサーコアといった一般的なゲーマーに不要な演算回路を全面的に削り、その空いた面積をゲーム用の演算用回路に置き換えたチップがリリースされるまで待ったほうがいいくらいの出来です。

GeForce GTX 1660 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

12位 NVIDIA GeForce GTX 1660

1,408コア、OC無ブーストクロック1,785MHz、5.027TFlops、TDP120W

1世代前のGTX1060よりは高性能です。それも当然であり、1060では6ピンの補助電源×1が標準的でしたが、Turing世代のGTX1660では8ピン×1の補助電源が標準的になっています(ごく一部6ピン×1のモデルが存在する)。このグラボを買うなら1世代前の1070か、Turing世代の1660Tiをおすすめします。1660Tiは1660よりCUDAコア数を増やしているもののTDP値は同じであり補助電源も8ピン×1で変化ありません。TDP値が120W級で同じでしかも補助電源も同じなら、1660よりも1660Tiのほうが価格さえ気にしなければメリットが大きいです。

GeForce GTX 1660チップを搭載した各メーカーのグラボはこちらで比較しています。

13位 AMD Radeon RX 590

2,304コア、OC無ベースクロック1,469MHz、ブーストクロック1,545MHz、7.120TFlops、TDP225W

RX580と同じコア数のまま動作周波数を引き上げた焼き直し版して2018年末に発売されたGPUです。AMDにとって2018年末~2019年初頭時点での本命はRadeon VIIであり、このRX590は第5世代RXチップの在庫処分目的でリリースされました。

AMDの決算発表を見るとわかりますが、2017年の仮想通貨ブームでAMDはRadeon RXチップを大量生産しました。しかし2018年に仮想通貨が暴落しブームが終了したことでチップが在庫として大量に積み上がってしまいました。その在庫をさばくためにRX580の焼き直し品としてこのRX590が規格されたわけです。

そのおかげでAMDの2018年1月~12月の通年決算は純利益(最終利益)が赤字でした。2019年1月~3月に順調にRadeon RXのチップ在庫を解消したことで、2019年1月~3月決算は純利益1600万ドルで一応黒字になっているのでこの在庫処分の効果がでているようです(ちなみにIntelは同期間の純利益40億ドルの黒字)。

このRX590は明確なコンセプトがあって企画されたものではなく単に在庫品が損失に化けてしまうのを防止するのが目的でありビジョンが全くないので、ゲーミング性能は1660無印にも負けており微妙な出来です。しかしPUBGでは大差で1660無印に負けていても、Apex Legendsでは健闘しているのでApexをするなら悪くないグラボです。

Radeon RX 590チップを搭載した各メーカーのグラボはこちらで比較しています。

14位 AMD Radeon RX 580

2,304コア 単精度5,792TFlops、倍精度Flops値不明 TDP185W

2017年4月リリースのGPU。PUBGのフレームレートベンチマークではGTX1060を超えており、Apex LegendsでもGTX1060を超える性能を叩きだしています。

しかし既に古いチップとなってしまっているため、新しいGTX1660や1660Tiのほうがおすすめです。

Radeon RX 580チップを搭載した各メーカーのグラボはこちらで比較しています。

15位 NVIDIA GeForce GTX 1060

1,280コア 単精度3.855TFlops、倍精度0.120TFlops TDP120W

1060は1050Tiと比較してだいぶ高性能になりますがTDPが一気に120Wまで増えます。1050Tiが75Wであることと比較するとかなり大きい発熱量です。

1060のようにTDP120Wになるとグラボ単体でのファンレス化は難しく、ファンレスの1060グラボは売られていません。ただし1060をファンレスで冷やすためのPCケースは発売予定があります。オランダStreacom社のDB6という製品であり1060の熱をケース側面まで運びファンレスで冷やすことができます。2017年6月に発表されましたがケースは未発売です。

無音のファンレスまでいかなくても、静音化にこだわるならElsaジャパン製のグラボがおすすめです。

GeForce GTX 1060チップを搭載した各メーカーのグラボはこちらで比較しています。

16位 NVIDIA GeForce GTX 1650

単精度896コア、倍精度56コア ベースクロック1,485MHz、ブーストクロック1,665MHz、単精度浮動小数点演算性能2.984TFlops、倍精度浮動小数点演算性能0.09324TFlops、TDP75W

2019年4月にリリースされたGPUです。2017年にリリースされたGTX1050Tiの後継モデルになります。

コンセプトは「補助電源なしのTDP75Wの範囲内でどこまで性能を高めることができるか」です。これはGTX1050Tiも同じでありこのコンセプトは引き継がれています。

競合するモデルはRadeon RX 570です。コア数だけで比較するとRadeon RX 570の2,048コアはGTX1650の896コアを圧倒しています。しかし、Radeon RX 570はGTX1650よりも動作周波数が低い上に、浮動小数点演算器がNVIDIAよりもAMDのほうが劣っているため結果的に性能はほぼ互角になっています。

PUBGの性能は互角なのですが、描画すべきオブジェクトが少ない場所ではGTX1650のほうがフレームレートが伸びます。例えば屋内や市街地以外のエリアです。屋内のような場所だと視界の中で描画すべきオブジェクトが少なく、その限られたオブジェクトだけを描画すればいいのでコア数が少なく動作周波数が高いNVIDIA GeForce GTX1650がフレームレート性能で有利です。

しかしApexLegendsのようにオブジェクトが常時多く画面に表示されるようなゲームでは、それらのオブジェクトを並列して演算するためのコア数が多いRX570が有利です。

RX570は補助電源が最低でも6ピンが必要でオーバークロックモデルになると8ピンが必要になるほど高消費電力なので、少ないコア数でも高い性能を実現した1650をRX570より上位にしました。

GeForce GTX 1650チップを搭載した各メーカーのグラボはこちらで比較しています。

17位 AMD Radeon RX 570

2,048コア 単精度4.784TFlops、倍精度Flops値不明  TDP150W

2017年4月リリースのGPUです。Apex LegendsやPUBGのフレームレートベンチマークではGTX1060に負けています。このGPUを選ぶならGeForceGTX1660を選んだほうが安い上に高性能です。

Radeon RX 570チップを搭載した各メーカーのグラボはこちらで比較しています。

18位 NVIDIA GeForce GTX 1050 Ti

768コア 単精度1.981TFlops、倍精度0.062TFlops TDP75W

Displayport 4K対応。HDMI2.0 4K対応。最大同時表示画面数3画面。PCI Express 3.0 x 16

1050TiはTDPが75Wであり1060の120Wと比べてかなり低くなっており補助電源が不要です。そのため1050TiはファンレスGPUとして用いられることが多いです。

特殊なケースの力を借りずに、グラボ単体でファンレスにできてかつ最も高性能なものはこの1050Tiになります。

グラボ単体でのファンレスとしては台湾Palit社が製造し日本のドスパラが販売するKalmXシリーズが有名です。ドスパラから売られているNE5105T018G1-1070H (GeForce GTX1050Ti 4GB KalmX)は1050Ti搭載グラボの中でも特におすすめです。

また1050TiはオランダStreacom製のファンレスケースでも冷やすことができます。

例えばStreacomのMini ITXケースDB4が該当し、このケースはTDP75Wまでのグラボをファンレスで冷やすことができます。グラボの熱をヒートパイプでケース側面まで運び、ケース自体をヒートシンクとして冷却するタイプです。これが1050Tiでなく1060になってしまうとTDPが120Wと急増するため一気に難しくなります。

1050Tiは比較的容易にファンレス環境が作れる上に、PUBGレベルの重いゲームでも60fps前後で動作することからとても貴重なグラフィックボードです。

GeForce GTX 1050 Tiチップを搭載した各メーカーのグラボはこちらで比較しています。

19位 NVIDIA GeForce GTX 1050

640コア 単精度1.733TFlops、倍精度0.054TFlops TDP75W

GTX1050は2016年発売です。これも1050Tiと同じくTDP75Wの低発熱かつ低消費電力がコンセプトですが、各メーカーがあまりこの1050無印チップに力を入れてないのもあって各メーカーからのラインナップが微妙です。

1050Tiより1050が優れている点は「価格の安さ」しかありません。他の部分は全て1050Tiが優れています。

GeForce GTX 1050チップを搭載した各メーカーのグラボはこちらで比較しています。

20位 AMD Radeon RX 560

1,024コア 単精度2.406TFlops、倍精度Flops値不明 TDP60~80W

コア数やFlops性能でみればGTX1050やGTX1050Tiを上回っているのですが、実際のゲームフレームレートベンチマークではGTX1050TiどころかGTX1050も下回っているGPUです。

Apex LegendsでもPUBGにおいてもGTX1050のフレームレートのほうが上です。

Radeon RX 560チップを搭載した各メーカーのグラボはこちらで比較しています。

21位 NVIDIA GeForce GT 1030

384コア 単精度0.942TFlops、倍精度0.029TFlops TDP30W

Displayport4K対応。HDMI2.0対応。PCI Express 3.0 x 16(接続スロットはx16だが実際の動作はx4)。最大同時表示画面数2画面。

オンボードグラフィクス(内蔵グラフィクス)であるIntel UHD Graphicsが3画面4Kで表示できる中、このグラボは2画面までしかできないので物足りなく感じますが、内蔵グラフィクスよりもこのグラボのほうがFlops値は高いです。つまり描画能力が高いので高いフレームレートでYoutubeやTwitch再生ができます。ExcelやWordの描画も明らかに軽くなるので、ゲームをやらず事務作業をする人にはこのグラボで十分だと思いますが、2画面より3画面あると格段に作業効率がアップするので、できれば1050Tiを使ったほうがいいかもしれません。1050Tiにもロープロファイルモデルは存在します。

GeForce GT 1030チップを搭載した各メーカーのグラボはこちらで比較しています。

このGT1030は「ロープロファイルかつ(ファンレス or 1スロット占有)」を実現できているため、コンパクト製を優先するユーザから支持が大きいです。

22位 AMD Radeon RX 550

640コア 単精度1.211TFlops、倍精度0.075TFlops TDP50W

ゲーミング性能ではApex LegendsならNVIDIA GeForce GT1030より少しだけ高いフレームレートを実現できます。PUBGだとGT1030より若干低いフレームレート性能です。

コア数は640で、GT1030の384コアより多いですが、1コアあたりの性能はGT1030のほうが優秀であるため性能面ではほぼ横並びになっています。

GT1030はTDP30Wしかないのでロープロファイルでありながらファンレスにしたり1スロット占有(ファン×1)にしたりできていますが、RX550はコア数を増やしているぶんだけ消費電力は大きく、ロープロファイルにしていてもファンが2つ付いていたり、ファンレスにできなかったり、1スロット占有にできなかったりと性能の割にグラボ本体が大型になってしまっています。総合的にみればGT1030のほうがおすすめです。

Radeon RX 550チップを搭載した各メーカーのグラボはこちらで比較しています。

23位 NVIDIA GeForce GT 710

192コア 単精度0.366TFlops、倍精度0.0153TFlops TDP19W

HDMI 1.4a対応。PCI Express 2.0×16~1(接続スロットが×16のモデルもあれば×1のモデルもある)。最大同時表示画面数3画面。

このGT710は「ロープロファイルかつファンレスかつ1スロット占有」を実現できている貴重なグラボです。これより1ランク上位のGT1030では「ファンレスかつ1スロット占有」を実現できないため、ファンレスと1スロット占有を両立したい場合はこのGT710一択になります。

このグラボにはゲーミング性能は期待できません。単精度浮動小数点数演算性能が0.366TFlopsしかなく、Intel Coreプロセッサに搭載されているオンボードグラフィックス(iGPU:内蔵グラフィックス)よりも低性能です。Xeon-WやXeon Scalable Familyプロセッサのようにオンボードグラフィックスを搭載していないCPUを使う場合に「とりあえずディスプレイが映ればいい」用途でよく使われるGPUです。

GT1030では最大2画面表示まででしたが、GT710は3画面表示可能です(ただしそのうち1画面はアナログD-Sub接続になる)。描画性能はGT1030より大きく劣っているものの、同時接続画面数はGT710のほうが優れています。

GeForce GT 710チップを搭載した各メーカーのグラボはこちらで比較しています。