2016_NVIDIA_Pascal_FINAL_published-page-031


スポンサードリンク




NVIDIA Pascal(GTX1080)の機能的な特徴に関するNVIDIAのプレスリリースに非同期演算(Asynchronous Compute)について興味深い文言が記載されています。
ソース:http://nvidianews.nvidia.com/news/a-quantum-leap-in-gaming:-nvidia-introduces-geforce-gtx-1080

Five Marvels of Pascal NVIDIA engineered the Pascal architecture to handle the massive computing demands of technologies like VR. It incorporates five transformational technologies: 
(中略)
  Superb Craftsmanship. Increases in bandwidth and power efficiency allow the GTX 1080 to run at clock  speeds never before possible -- over 1700 MHz -- while consuming only 180 watts of power. New asynchronous compute advances improve efficiency and gaming performance. And new GPU Boost™ 3 technology supports advanced overclocking functionality.  



ただしMaxwellの時同様に蓋を開ければ「プリエンプション(Pre-Emption)」だったという可能性もあります。

一方で非同期演算が重要になるVR用途ではPascalの新技術「サイマルテニアス マルチプロジェクション」による性能向上があり、DirectX12についてはゲーム開発側の調整が難しく性能向上も微妙とのことなので、仮に非対応だった場合に重大な問題があるのか?というと微妙なところです。
「サイマルテニアス マルチプロジェクション」とは? サラウンドや湾曲モニタで没入感が向上、VRでは描画効率の大幅上昇
非同期演算(Asynchronous Compute)によるHitman2016での性能向上はせいぜい5~10%であり、開発者曰く、”調整は非常に困難”。




「非同期演算(Asynchronous Compute)」とはなんぞや?という人はこちらのAMDによる簡易説明スライドをご覧ください。
3-635x357

このスライドでもわからない人は4gamersが日本語で簡単にまとめてくれています。
AMDが「Async Shaders」を猛烈にアピール。“とっくに実装済みの機能”が,DX12時代の切り札となる!?

上の記事から引用して非同期演算を簡単に説明すると、”「グラフィックスのタスクと計算(Compute,以下 コンピュート)のタスクをGPUで同時に実行できる機能」ということになるだろう。このとき,グラフィックスとコンピュートタスクを非同期 (Asynchronous)に並列動作させられるからAsync Shadersと命名したのだそうだ”ということになっています。

GPUでコンピュートタスクとグラフィックタスクを同時に行う方法としては、「マルチスレッド」(Multi-thread)や「プリエンプション」(Pre-Emption)といった手法が存在しますが、いずれもオーバーヘッド(余分な処理時間)が生まれてしまいます。
007008

しかしながら「非同期演算(Asynchronous Compute)」ならばそうしたオーバーヘッドなしで並列演算が可能になるということです。

ではこの非同期演算への対応の有無がどうして問題になるのかというと、2016年に入って数作の対応タイトルが出てきた次世代API「DirectX12」(あと「vulkan」とかも)の存在が挙げられます。
現在主流なAPIである「DirectX11」ではタスクキューを1つしか持ちませんが、「DirectX12」では複数のラスクキューを持ち(複数コア、多スレッドCPUで性能が上がると言われる理由)、DirectX12特有のパフォーマンス向上には非同期演算への対応が欠かせなくなっています。
009010

またこの機能はVR描画にも関係するようでOculusなども言及していたりしました。
そのため、去年の年末頃からAMDは「うちのGPUは非同期演算(Asynchronous Compute)にはとっくの昔に対応済みだよ!」と宣伝していたりします。

そして今回の「Nvidia 次世代GPU Pascalは非同期演算(Asynchronous Compute)に問題があるかも」という100%噂でありながら信憑性がありそうと思われる根拠となるのが、他でもない”去年の年末頃から取りざたされた”という事実になっています
現 実にNVIDIAの現行GPU Maxwell(とそれ以下)では非同期演算(Asynchronous Compute)に対応できておらず、ドライバレベルで仮にDirectX12ゲームが非同期演算を有効にしていても、これを無効化して「プリエンプショ ン」に頼っている状況です。
そういった背景から、NVIDIAがPascalアーキテクチャに非同期演算への対応を盛り込む時間的な余裕はなかったとの見方が強く、これが今回の噂に信憑性を持たせています

非同期演算(DX12対応)によるパフォーマンス向上はRise of the Tomb Raiderの先日のDX12対応でも公式に取り上げられています。
tumblr_inline_o3vsjaoaAk1qij4lt_1280
しかしながら管理人が同時期に執筆した記事で書いたように、必ずしもDX12に対応したからといってDX12よりもパフォーマンスが向上するという事実は全くないというのが現状です。

2016年3月26日現在でDX12に対応しているゲームは「Rise of the Tomb Raider」、「Hitman2016」、「Gears of WarUE」、「Ashes of Singularity」の4種が代表的です。(各リンクは当ブログでのDX12パフォーマンスまとめ記事) うちDX12の独占的対応となているのは「Gears of WarUE」のみでそれ以外は、DX11とDX12の両対応で比較が可能になっています。
管理人自身、サブ機のR9 NANOで試しており、海外での比較検証を眺めて、以下列挙。

Rise of the Tomb Raider」:DX12はDX11よりパフォーマンスが下がり、グラボ別のパフォーマンス序列にも変動はほぼなし

Hitman2016」:DX12とDX11でのパフォーマンスは上昇と下落の両結果が報告されており、管理人の環境ではパフォーマンスが下がった。DX11とDX12ともにAMDグラボ優勢。

Gears of WarUE」: 初期のAMDグラボ(特にFuryシリーズ)のランダムフリーズをはじめとしたバグが酷く、海外検証は今のところ当てに出来ない。ランダムフリーズは修正 されたが現在もFixを更新中。最新パッチの状態でもFuryX相当へOCしたR9 NANOによる980tiへの下克上は不可能だった。

Ashes of Singularity」:管理人は未検証。海外の比較検証ではDX12はDX11よりもかなり優位なパフォーマンスを示し、非同期演算によるAMDグラボでのパフォーマンス向上も確認できる(NVIDIAグラボでは強制OFFのため変化なし)
転載元:http://pclab.pl/art67995.html
aos_390_crazy
aos_gtx970_crazy

以上のように、ゲーム製作側の対応がかなり重要になっているっぽい。というかDX12がDX11に優位かつAMDグラボがNVIDIAグラボに勝ると言う結果を示しているのが現状で「Ashes of Singularity」しかないというのが現状になっています。
Pascalが非同期演算に対応しているのかどうか以前に、対応できてパフォーマンスの向上できるゲームが年内にどれだけ登場するのかも見守る必要がありそうです。





(注:記事内で参考のため記載された商品価格は記事執筆当時のものとなり変動している場合があります)



スポンサードリンク