Nvidia-Pascal-GTX-1080-GTX-1070-GTX-1060-GPUs-WCCFtech-635x373
 100%噂です。



スポンサードリンク




以下のソースやまとめ記事によるとNvidia 次世代GPU Pascalは非同期演算(Asynchronous Compute)への対応で問題があるかもしれないとの”噂”がまことしやかに囁かれています。

ソース:http://www.bitsandchips.it/52-english-news/6785-rumor-pascal-in-trouble-with-asyncronous-compute-code
英語まとめ記事:https://wccftech.com/nvidia-pascal-trouble-asynchronous-compute/

「非同期演算(Asynchronous Compute)」とはなんぞや?という人はこちらのAMDによる簡易説明スライドをご覧ください。
3-635x357

このスライドでもわからない人は4gamersが日本語で簡単にまとめてくれています。
AMDが「Async Shaders」を猛烈にアピール。“とっくに実装済みの機能”が,DX12時代の切り札となる!?

上の記事から引用して非同期演算を簡単に説明すると、”「グラフィックスのタスクと計算(Compute,以下 コンピュート)のタスクをGPUで同時に実行できる機能」ということになるだろう。このとき,グラフィックスとコンピュートタスクを非同期 (Asynchronous)に並列動作させられるからAsync Shadersと命名したのだそうだ”ということになっています。

GPUでコンピュートタスクとグラフィックタスクを同時に行う方法としては、「マルチスレッド」(Multi-thread)や「プリエンプション」(Pre-Emption)といった手法が存在しますが、いずれもオーバーヘッド(余分な処理時間)が生まれてしまいます。
007008

しかしながら「非同期演算(Asynchronous Compute)」ならばそうしたオーバーヘッドなしで並列演算が可能になるということです。

ではこの非同期演算への対応の有無がどうして問題になるのかというと、2016年に入って数作の対応タイトルが出てきた次世代API「DirectX12」(あと「vulkan」とかも)の存在が挙げられます。
現在主流なAPIである「DirectX11」ではタスクキューを1つしか持ちませんが、「DirectX12」では複数のラスクキューを持ち(複数コア、多スレッドCPUで性能が上がると言われる理由)、DirectX12特有のパフォーマンス向上には非同期演算への対応が欠かせなくなっています。
009010

またこの機能はVR描画にも関係するようでOculusなども言及していたりしました。
そのため、去年の年末頃からAMDは「うちのGPUは非同期演算(Asynchronous Compute)にはとっくの昔に対応済みだよ!」と宣伝していたりします。

そして今回の「Nvidia 次世代GPU Pascalは非同期演算(Asynchronous Compute)に問題があるかも」という100%噂でありながら信憑性がありそうと思われる根拠となるのが、他でもない”去年の年末頃から取りざたされた”という事実になっています
現実にNVIDIAの現行GPU Maxwell(とそれ以下)では非同期演算(Asynchronous Compute)に対応できておらず、ドライバレベルで仮にDirectX12ゲームが非同期演算を有効にしていても、これを無効化して「プリエンプション」に頼っている状況です。
そういった背景から、NVIDIAがPascalアーキテクチャに非同期演算への対応を盛り込む時間的な余裕はなかったとの見方が強く、これが今回の噂に信憑性を持たせています

非同期演算(DX12対応)によるパフォーマンス向上はRise of the Tomb Raiderの先日のDX12対応でも公式に取り上げられています。
tumblr_inline_o3vsjaoaAk1qij4lt_1280
しかしながら管理人が同時期に執筆した記事で書いたように、必ずしもDX12に対応したからといってDX12よりもパフォーマンスが向上するという事実は全くないというのが現状です。

2016年3月26日現在でDX12に対応しているゲームは「Rise of the Tomb Raider」、「Hitman2016」、「Gears of WarUE」、「Ashes of Singularity」の4種が代表的です。(各リンクは当ブログでのDX12パフォーマンスまとめ記事) うちDX12の独占的対応となているのは「Gears of WarUE」のみでそれ以外は、DX11とDX12の両対応で比較が可能になっています。
管理人自身、サブ機のR9 NANOで試しており、海外での比較検証を眺めて、以下列挙。

Rise of the Tomb Raider」:DX12はDX11よりパフォーマンスが下がり、グラボ別のパフォーマンス序列にも変動はほぼなし

Hitman2016」:DX12とDX11でのパフォーマンスは上昇と下落の両結果が報告されており、管理人の環境ではパフォーマンスが下がった。DX11とDX12ともにAMDグラボ優勢。

Gears of WarUE」:初期のAMDグラボ(特にFuryシリーズ)のランダムフリーズをはじめとしたバグが酷く、海外検証は今のところ当てに出来ない。ランダムフリーズは修正されたが現在もFixを更新中。最新パッチの状態でもFuryX相当へOCしたR9 NANOによる980tiへの下克上は不可能だった。

Ashes of Singularity」:管理人は未検証。海外の比較検証ではDX12はDX11よりもかなり優位なパフォーマンスを示し、非同期演算によるAMDグラボでのパフォーマンス向上も確認できる(NVIDIAグラボでは強制OFFのため変化なし)
転載元:http://pclab.pl/art67995.html
aos_390_crazy
aos_gtx970_crazy

以上のように、ゲーム製作側の対応がかなり重要になっているっぽい。というかDX12がDX11に優位かつAMDグラボがNVIDIAグラボに勝ると言う結果を示しているのが現状で「Ashes of Singularity」しかないというのが現状になっています。
Pascalが非同期演算に対応しているのかどうか以前に、対応できてパフォーマンスの向上できるゲームが年内にどれだけ登場するのかも見守る必要がありそうです。
直近では4月7日リリースの「Quantum Break」が「Gears of WarUE」同様にDirectX12独占タイトルなのでこちらのパフォーマンス比較が気になります。

追記――――――――――――
非同期演算は調整がかなり難しいようです。
非同期演算(Asynchronous Compute)によるHitman2016での性能向上はせいぜい5~10%であり、開発者曰く、”調整は非常に困難”。





(注:記事内で参考のため記載された商品価格は記事執筆当時のものとなり変動している場合があります)



スポンサードリンク