« Vita版のサービス開始にあわせて | メイン | PS Vita アイス・シルバー+PSO2 スペシャルパッケージ »

2013年03月01日

GeForce GTX TITAN vs GTX 690 ~ ベンチマークスコアでは読み取れない体感性能 - はたしてゲーム向きはどちらなのか?

ヅネさんとお話ししていた話題でしたけど、興味ある方もいらっしゃると思うので記しておきますね。

(キャラクリ体験版Ver.2.0のお題はこちらへ)


GTX TITANでのストレステスト - 16xS Combined(外部再生はこちら)

アンチエイリアシングのお題を検証するために、購入してまいりました。・・・13万6800円はさすがに高すぎるのです。単体1枚でぱそ子さんが余裕で組めるこのグラフィックスカード、きっと羨望の眼差しとなること間違いなしな逸品といえるでしょう。そう、大々的に発表された「GeForce GTX TITAN」です。

凜然と輝くTITANの文字Titanの文字はご存じの方もいらっしゃると思いますが、アメリカのテネシー州にあるオークリッジ国立研究所、そちらに納品されたスーパーコンピューター・Top500の中でも1位を獲得した「TITAN」からとられたものとされています。

そのカードの心臓部となる計算装置・GPUには高価なワークステーションで用いられる「Tesla」に搭載される「K20X」チップを積んでおり、そのトランジスタ数は71億ととてつもない規模のものになっています。そのスーパーコンピューター向けのテクノロジをゲーム向けに・・・とおごったものがGTX TITANとなります。

一方、1枚のカードに2つのGPUを載せた「デュアルGPU」カードと呼ばれる品も存在し、本カードが出るまで常々「最高峰」と謳われていたのが・・・私が現在使用している「GeForce GTX 690」なるものがあります。こちらはTITANが出る前のシングルGPUの最高位、GTX 680に使われているチップを少しだけスピードを抑え、その代わり2基を1枚のカードに組み込んだものとなります。

カード単体での性能としては690が最高・・・といろいろなレビューサイトで取り上げられ、「う~ん、でもTITANが値段高いし、数も少ないし、実際は強いのでは?」といろいろ錯誤される方もいらっしゃると思います。

本来ならぱそ子さん向けの、自作ユーザー向けの話題でしょうけど、タイムリーなこともありますので、ここで簡単にではありますが取り上げておきますね。

∮ ∮ ∮


ゲームでの絶対性能は「SLI対応、かつ最適化されたタイトルにおいてGTX 690に軍配が上がる」


これが結論です。先日載せたGTX 690における各種ベンチマークですが、TITANで取り直したものがこちらとなります。

130301_2.jpg130301_2.jpg130301_2.jpg

いかがでしょうか。値だけを見たらなんとまあ。690が惜敗してしまっています。どちらも「999ドル」という破格のグラフィックスカードなわけですけど、両方に個性があって、どちらもいい品になっているのですよね。

きっとこの2枚をターゲットにされる方はご自身にリテラシーがおありの方だと思いますので詳細は省きますけど、TITANが貴重がられるのはワークステーションクラスのカード・・・K20Xを搭載したTeslaは50万円以上ともいわれ、一部制約を与えることで差別化をしていますが、13万円前後はとてつもない安さ、にあたるわけです。

ただ、ゲーマーさんの観点から見たら結局「ゲームに向いているのはどちらなの」となることでしょうから、そういった細かい背景などはすべて割愛しますね。


・・・で、値だけを見た場合、TITANが勝ってしまったわけです。それならGTX 690の意味はないのでは? 2GPU搭載モデルだのに負けてしまってはいないか、と思われるでしょう。しかし、ここで浮上してくるのが「値からは読み取れない、実際の『体感性能』はどうなのか」、となります。

ハードを厳しく見つめられる方は、いわゆる「最小FPS」と呼ばれるものに注目が集まります。そう、負荷が高まったとき フレームレート・・・FPS(Frames Per Second)・・・1秒間に何コマ表示できるか、ですけど、極端に落ち込むようではユーザー体験が下がりやすい、という贅沢な?お悩みを払拭できるか否かは最重要の課題となります。

よくゲームセンターなどの格闘ゲームで全く処理落ちが見受けられないのは、この最小FPSを「絶対60以上をキープできるように」作り込んでいるからなのですね。故にいつでもスムーズに動作する、と。ただ、あちらの場合はクリエイターさんが徹底的にゲームセンター向けの基板に最適化を図りますから、それが保証されるわけです。

ぱそ子さんの場合はそんなことしていられませんので・・・できるだけいい環境を用意できれば、となります。ただ、押さえておきたいのはその映像に対して『グラフィックスカードの性能が足りずFPSをあげられない』ケースと、『CPUの性能が足りずFPSがあがらない』ケースの2つに分かれます。

そして、今回のベンチマークの結果は・・・どちらに当たるのでしょう?


もうお気づきですよね。PSO2ベンチマークにおいては後者が、FF14/バイオ6においては前者、となるわけです。

負荷が高いのはよきことかな?PSO2ベンチマークはいわば「描画負荷が軽い」タイトルとなっており、そうなるとグラフィックスカードが「完全に描写しきれる」ため、「全体を司るCPUの性能が足りず」に、「グラフィックスカードのポテンシャルを最大に引き出しきれない」わけです。そのため、値がほぼ同じとなるのです。

それに対しFF14/バイオ6は「描画負荷が高い」ため、グラフィックスカードの性能を貪欲に要求してくる、と。これらもきっと、カードの性能がすばらしく向上していけば、きっとPSO2と同じ「頭打ち」の症状が出てくると思います。・・・まだ数年かかりそうですが。

ゆえに、強いグラフィックスカードを用意する際は「それらをしっかりと引き出せるCPU=中央演算処理装置が必要とされる」理由(ワケ)なのです。カードだけ良くても、だめなのですよね。ここがぱそ子さんの難しいところでもあり、おもしろいところでもあるのです。


上記でおおよそ2枚のカード、取り巻く状況が把握できたと思いますので、あとは実際にムービーをご覧いただければと思います。最初に用意してあるものがTITANで撮影した市街地エリアの様子です。

あれ、ジャギっている・・・?と思われた方はすみません。どうやら314.09 WHQLドライバーのバグみたいで、SSAAを有効にした画面でキャプチャーをする際、アンチエイリアシングが適用されないという致命的なものがありまして・・・それが残ったままみたいです。状況から、今回は画面の綺麗さではなく「コマ落ちしている箇所はどんなところか?」に注目していただければと思います。

おおよそですが「テクニックを至近距離で発動し、エフェクトが画面全体に覆い被さる」ようなシチュエーションで、少しもたつきを覚えますよね。それでも前回までに記してきたGTX 580GTX 670のデモと比べ、大分動くようになってきたと感じるでしょう。GPUがわずか2年の間でここまで進化してきたわけです。

GTX 690でのストレステスト - 16xS Combined(外部再生はこちら)

そして、こちらが・・・GTX 690ですが、いかがでしょう。見た目がそれなりに混雑した印象の遺跡エリアにて、4人パーティーでエフェクトが乱れ入り、さらには2012年12月のアップデート前まで「鬼門」とされてきた半透明オブジェクトの極地?ベイゼさんを交えたシーンですが・・・。ここまでよくなりました。すばらしいの一言です。

条件はどちらもCombinedプロファイルを適用した「16xS」モードとなります。実解像度はフルHDとなる1920*1080ですが、内部解像度は実に3840*2160という、途方もないものをこなしていることになります。言い換えれば「グラフィックスカードに極限のストレスを与えるモード」ともいえましょう。

各種媒体で結論づけている「このカードを使いこなしきれるか=どれだけ高負荷状態に遭遇できるか」というのは、それくらいに重たいシーンでないと、真価を発揮できることもないということに他ならないからです。言い換えれば「ごく一部の最新鋭タイトル以外、カードをもてあますことになるであろう」ということです。


私はその点に対し「SSAAモードで画面を極限まで美麗にしてみましょう」と提案しているだけなのですが、実際SSAA、16xSの画面をご覧いただければ「明らかに別格」だと感じ取っていただけることでしょう。実際に試された方ならわかるはずです。

そしてSSAAをフルHDでともなると、その解像度が4K2K・・・海外ではUltra HD(UHD)なんて呼ばれていますけど、UHDにも達するとグラフィックスカードの性能は不足といわざるを得ず・・・イノベーション=技術革新はまだまだ終わることのなき道をたどっていくのでしょうね。


ここまで読まれた方ならお気づきのハズですが、SSAAを生かすためには「演算した結果を迅速に描画できるか否か」にかかってきます。TITANと690の動画を比較しても「エフェクトが重なり合った際、もたつきが減っている」と感じ取れたでしょうけど、

演算器の数・・・CUDAコアよりも、効いてくると感じられるのはROP・・・Rendering Output Pipeline(またはRasterize OPeration)の数と、その処理したデータを書き込むメモリへつながる道の幅・・・帯域幅がものを言うわけです。そのあたりはこちらのページが詳しいと思います。

頂点/ピクセル/ジオメトリシェーダ/ROPユニットの役割


TITANは384bitバス、6008Mbps、288.38GB/s(比較表は上記TITANのプレスリリースのところでどうぞ)といったスペックですが、690は256*2bitバス、6008Mbps、192.26*2GB/sとなっています。

ここで押さえておきたいのはデュアルGPUやSLIの時、ビデオメモリは2倍3倍となるの?と思われがちですが、あくまで「1GPUあたりxGB」となるので、実際には合計容量の1/2や1/3、4基なら1/4となります。690はよく4096MBと記されるところに 2048*2 となっているものが多いわけですが、そのような理由のため2倍としてはみなされないようです。実際は2048MB=2GB分となります。

ただし、同一のデータを2つのGPUで描画することにはなりますので、メモリバス幅としては2倍で計算可能・・・といったところなのでしょう。そうして比較した場合、TITANが288.38GB/sなのに対し、690は384.52GB/sと大きな差が出ます。


加えて、そのデータを描画するためのROPの数もTITANは48基に対し、690は32*2=64基。ここでパワー差が確実に出てくるというわけです。この部分を考察されているサイトはあまりないのでは、とも思いますが・・・はて。

おそらくそうというよりは、ベンチマークプログラム・・・より砕いていえばシェーダープログラムの癖みたいなものがあるのでしょうね。演算しないと描画もできないわけで。複雑なシェーダーの場合、そちらの計算だけで手間取ってしまう、と。

(よく「660(Ti)と670とでかなりの差を感じる」という方がいらっしゃるようですが、それこそベンチマークの値よりも「メモリバンド幅、ROP数」が異なるため、実際に遊ばれるゲームはベンチマークプログラムとは異なりますので、体感差として大きく感じられるのでは)

ゆえ、ハイエンド系グラフィックスカードを無駄なく使い切りたい際は、「如何にして高負荷な状況を創り出せるか」にかかっているといえるでしょう。そのお手軽な例が「超高品位なアンチエイリアシング=SSAA/Combined系」となるわけなのです。

690のようなあのストレスをTITANで実現しようとするのは・・・無理でしょう。それこそTITANをSLIにして・・・といったことになってくるのでしょうね。もちろん、「どのくらいコマ落ちを許容できるか」にかかっているとはいえますけど、ここまで高いカードを用意するならコマ落ちなしでいたいところではあります。するくらいなら、もっと低価格なカードでいいわけですしね。設定さえ同じであれば、描画される絵は同じものなはずですので。昔と異なり、ここが大きなポイントでしょう(ユニファイドシェーダー化した恩恵)。


これで当面買いません!ベンチマークスコアで差が出ないのはあくまで演算した結果を数値化するだけ、と思われるため、実際にプレイヤーの体験として感じやすい最小FPSの部分においては、こういった比較が適正かとは思われます。今後は値だけに惑わされないよう、吟味したいものですね。高いカードを購入して、そこで引っかかりを覚えて満足度がそがれる・・・ようでは本末転倒ですので。その際はオプション設定を下げるしかないのですけどね。

今後は今回のような「ミドルレンジチップを2基重ねたハイエンド」と、「従来からの巨大な1GPU構成のハイエンド」といった2つの路線がとられていくことでしょうが、言い換えればご自身が遊ばれるタイトルで「SLIに対応していればデュアルGPUカード」「していなければシングルGPU最速のカード」を選択すれば、幸せになれるのではないでしょうか。

ただし、SLIには「最適化されているか否か」も重要な要素となるため、単に対応しているだけでは推し量れない部分があるのも難しいところです。NVIDIA社のドライバー開発のできばえ、ゲームタイトルでの積極的な最適化、両輪がそろって初めて真価を引き出せますので・・・。

もちろん通常のシングルGPUカードで高速化を図ってくれる方が、あらゆる状況下で性能を発揮はできますので、それが理想ではありますけどね。現在製造技術が飽和点に近づきつつあり、昔みたいに倍々に性能を伸ばすことが困難になってきています。そのためデュアルGPUといったカードも活躍するものと考えられますので、利用シーンに応じたチョイスができればいいと、私は思っています。


・・・今回のお題はよく家庭用ゲーム機でも論争になる「ピーク性能」対「持続性能」みたいなところがありますので。結局画面のリフレッシュレート以上に表示はできませんから、最大FPSも重要ですが、それ以上に必要なのは最小FPSの向上・・・リフレッシュレートを下回らないことが一番大切なのではないでしょうか、といったお題なのでした('-'*)

あと、注意しておきたいのはあくまで「私なりの観点での考察」なだけで、ベンチマークの意味がない、などと話しているわけではないことだけ、誤解なさらないようにお願いしますね。値は無論、高いに越したことはありませんし。「値には表れにくい部分を、実際に見てみましょう」というのが趣旨ですので・・・。

(某所から来られた方へ:結論は「設定次第でTITANであっても処理落ちはします」ということですので・・・。10万円以上もする全世界1万台限定のカードを無理に手にすることもないとは思います。GTX 580を現在も事情があって使っている人、VRAM 6GBに魅力を覚える方ならいい品となるでしょう)


※補足ですが、Combinedモードで影品質の4/5を実現できないのが VRAM容量が足りないからなのでは? と推察していましたけど、もう一つの考察で「画面解像度を下げた状態で行えば・・・」もありましたから、結果、できないんだろうなと思っていましたけど案の定でした。

ただ、必要VRAM量が確かめられ、16xSではなんと2080MBあまり、32xSに至っては信じられないようですが3800MBものメモリを消費しています。人の多いロビーでは6GBすべて使ってしまいかねません(@_@) ・・・これってPSO2クライアントがおかしいだけなのでは、とか思ったり思わなかったり。PSUの時にはこんなことありませんでしたしね(実際、使えていましたので)。

ヅネさんとも意見交換をしましたが、仮想フルスクリーン周りの実装がアヤしいような気がする・・・との答えにたどり着いたということで。あちらは結局ウィンドウモードなだけですし、その影響か垂直同期(Vsync)もとれていませんし。だから体験版でカードが焼損してしまうような事故も起こり・・・。

FPS制限なる項目を無理矢理つけたりですとか、何かトリッキーなことをしてはいないだろうか、と話していました。あとはもう、セガさんで何とかしてくださるほかないですので。リリース時よりは大分ましにはなっているものの、まだまだ最適化の余地は残されているように感じます。ベイゼさんが破裂するときのエフェクトも極端に重たいですしね・・・。


追記:ちなみにTITANの環境面周りですが・・・リファレンスクーラーはコストがかかっているだけあって優秀といえるでしょう。

確かにメーカー独自のオリジナルファンの静音性には劣るのでしょうが、従来のリファレンスファンにあったような「明らかにうるさい」と思われるようなチューニングにはなっておらず、比較的緩やかに回転数が上がるようになっています。

おもしろいのは「制限温度の上限を引き上げる」ことで、ファンの回転数特性をも変えられるということ。静けさにこだわる人は温度リミットを95度まで引き上げれば、それだけで静音カードの完成といえるでしょう。ただ、アイドル時に1200rpmほど回っていますので、それが気になる人は気になるのかも。

消費電力の低さも特筆すべきもので、GTX 680と同じ感覚で使用できます。もちろん高負荷時は電力量も増加しますけど、言い換えれば「必要とするシーンに最高性能を提供してくれる」優れたカードととらえておけたらいいでしょう。

ヴェイパーチャンバーを使用しているだけあって熱離れがよく、発熱してもすぐに排熱できるのは立派です。アルミダイカストの重厚なフレーム、かっこよく光るグリーンのロゴマーク、外排気方式であることなども含め実用性が高く、所有感に浸れる良いクーラーだと思います。普通の人ならこれで十分ではないでしょうか。


(3/16 9:10 追記分)

昨日ヅネさんがTITANの2枚差し、SLIにトライされましたが・・・Z9PE-D8 WS上で全く認識しないとのことからトラブルシュートにつきあい、何とか認識し動作成功しました。デュアルXeonマザーボードという希有な製品ですが、そのままではコンフリクトを起こすみたいで、オンボードVGAを無効にするのがポイントみたいですね。POSTの段階でCord62でストップする方は見直してみるといいのかもしれません。

SLI構成になったTITANは鬼神のごとくのパフォーマンスのようで、16xS、2560*1440を処理落ちなしでやってのけてしまったそうです。GPU/MCU稼働率も850MHz時で50%とそこそこの値、VRAM使用率は2.3GB程度とこれも予想通りの数値。

フレームレートも60fpsから微動だにせず、GTX 680 3Way SLIよりもかなり安定しているそうです。内部解像度は5120*2880という、途方もないものになっていますからね。4Gamerさんのレビューよりも負荷はかかっていることでしょう(あちらが1131万画素程度に対しこちらは1474万画素)。その画質は「別世界」とのことでした。

(ちなみにあちらのレビューで690においてフレームレートが計測不能になっている部分がありますけど、あれは単純にVRAMが足りていないだけの現象だと思われます。1000万画素オーバーの環境において、もはやVRAM 2GBでは役不足です)


3DMARK Fire Strike Extremeのスコアは実に7553と、現時点で破格の値だと思います。私の値が5348ですので、2000ポイントあまり差をつけられています。とはいえ、CPU環境がXeon E5-2690を2基という、現状「これ以上のない」、最高峰の環境と思われます。

ですので値の比較は難しいのかもしれません(16コア32スレッドですから・・・)。Quad TITANまで突撃される(準備はすでに整っている)そうですので、今後の進捗が楽しみなのです('-'*) でも、2枚でもはや十分そうとのお言葉でもありました。


このことから、改めて1920*1080以上で高品位なアンチエイリアシングオプションなどを活用される際は、TITAN SLIは魅力的な選択肢となり得ることでしょう。個人的に、384bitメモリインターフェースはそのためにあるものだと感じています。

また、引き出すためのCPU能力も貪欲に要求されるため(特にPCI-E 3.0の生レーン数でしょうか)、SLI構成はぜひよいCPUと組み合わせましょう。一般的ではないかもしれませんが、デュアルCPU構成はそのための最適解となり得るのかもしれません。

ただし、電気代・パーツ代などを含めたかなりのトータルコストがかかることもお忘れなく・・・。


なお、丁寧な記事をいつも提供してくださるXbit Laboratoriesさんに、TITANの詳しいレビューがありますので、興味ある方は見てみるといいでしょう。最小FPSもしっかりとまとめている、いいサイトです。

Nvidia GeForce GTX Titan 6 GB Graphics Card Review


『PHANTASY STAR ONLINE 2』公式サイト
http://pso2.jp/

From : lavendy | 14:30