DirectStorage


スポンサードリンク




FORSPOKENやラチェット&クランク パラレル・トラブル(Ratchet & Clank: Rift Apart)などDirectX 12のPCゲーム向け高速ストレージアクセスAPI「DirectStorage」に対応したPCゲームが登場し始めたので、実際にこれらのPCゲームでロード性能を検証してみました。
NVMe M.2 SSDとSATA SSDでどれくらい差が出るのか、現在主流なPCIE4.0と旧世代のPCIE3.0や最新のPCIE5.0で差があるのか、TLC型/QLC型のNANDタイプやDRAMキャッシュの有無で差があるのか、DirectStorageに関して気になる検証結果を紹介します。



DirectStorageと従来のゲームロードについて

最初に補足として下記クリック展開でDirectStorage等のゲーム向け高速ストレージAPIを使用しない従来式のゲームにおける検証結果や傾向を説明しています。
2020年から2021年頃の検証結果ですが、現在でも概ね当てはまると思うのでSSD/HDDのゲーム性能の違いを参考までに。


続いて本題、DirectX 12のDirectStorageに代表されるPCゲーム向け高速ストレージアクセスAPIについてです。(この種のPC向けAPIは今のところDirectStorageしかないので、以下、まとめてDirectStorageと呼んでしまいます)

DirectStorageとは何か、かなり大雑把な表現をすると、最新コンソールゲーム機のPlayStation 5やXbox Series X|Sで採用されている高速ストレージアクセス機能のPC版です。(XboxではVelocity Architectureと呼ばれているもの)
PS5やXbox SXに前世代ゲーム機から乗り換えた人は、起動であれファストトラベルであれゲームのロード時間が大幅に短縮化されたことに驚いたと思います。
ストレージがHDDからSSDに変わった、SoC(CPU&GPU)が強力になったというのも1つの要因ではあるのですが、PS5やXbox SXの”瞬時に”とも表現できる高速ロードを実現している、特に大きな要因の1つがこの高速ストレージアクセス機能です。

従来のデータ読み出しと、DirectStorage的なデータ読み出しがどのように異なるかというと、従来ではストレージから読み出したゲームデータは一度、システムメモリに配置され、『CPUによって圧縮データが展開』されていました。
『CPUによって圧縮データが展開』と一言にまとめていますが、実際にはVRAMへの引き渡しに適した形に配置し直す等の複数のワークフロー(複数回のコピー)があり、これがオーバーヘッドになっていました。このボトルネックがHDDよりも大幅に高速なNVMe SSDを使用していても実際のロード速度の向上が2倍程度に収まっていた原因です。
DirectStorage_off
一方、DirectStorageではNVMe SSDからシステムメモリへコピーされたゲームの圧縮データをそのままグラフィックボードのVRAM上に再コピーし、圧縮データの展開はGPUによって行うので、前述のオーバーヘッドは解消されます。(PS5では専用コントローラで展開しますが、PCというかDirectStorageの場合はGPUを使用するので、GPU decompressionと呼ばれる)
DirectStorage_on

PC自体がDirectStorage対応に対応しているかどうかは、Windowsゲームバーの設定メニュー - ゲーム機能の項目から確認できます。
大前提として、DirectStorageに対応しているのはNVMe SSDのみとなっており、SATA SSDにゲームデータをインストールしていると使用できません。(SATAはハードウェア規格なのでAHCIが正確ですが)
あとWindows 10でもDirectStorageは使用できますが、Bypass I/OやIORing File APIといったWindows 11でしか使用できない機能があり、Windows 11はよりDirectStorageに最適化されています。
DirectStorage_gamebar
*2023年9月現在、ゲームバーにおいてOSが”DirectStorage最適化を非サポート”と表示されるのは、ゲームバーの表示バグのようなので無視してOKです。


GPUについては、NVIDIAのRTX IOのような形でアクセラレーション機能はアピールされていませんが、AMDやIntelのGPUもDirectStorageをサポートしています。
GPU側の要件についてはDirectX 12をサポートしていれば対応している、くらいの認識でOKです。ここ数年だとNVIDIA GeForce RTX20/GTX16、AMD Radeon RX 5000かそれより新しいものは確実に対応しています。

DirectStorageではデータ圧縮にGDeflateというGPUによる展開に最適化されていて、圧縮率も非常に高い技術が採用されています。当然ですが圧縮率が高ければ展開後が同じサイズのデータもより高速にコピーできます。
NVIDIAのRTX IO(DirectStorageをアクセラレーションするHW/SWの仕組み)のデモによるとPortal: Prelude RTXでは一般的な4Kテクスチャと比較して44%ものサイズダウンを達成しているとのこと。
nvidia-rtx-io-faster-texture-load-and-less-disk-space

DirectStorageでは高度に圧縮されたゲームデータをグラフィックボードのVRAMへ直接取り込んで、”GPUによって展開”するので、ロード時間はGPU性能やNVIDIA RTX IOのようなアクセラレーション機能の影響を受けます。
なので今回の検証ではSSDの理想的な性能を検証できるように、最新のウルトラハイエンドGPUを搭載したグラフィックボード「PNY GeForce RTX 4090 24GB XLR8 Gaming VERTO EPIC-X RGB OC 3FAN」を使用しています。




前置きが長くなりましたが次の章から、DirectStorageに対応した実際のPCゲームでDirectStorageをサポートするNVMe SSDと非サポートのSATA SSDの性能差や、NVMe SSDでもPCIE3.0/4.0/5.0の帯域によって違いがあるのか検証した結果を見ていきます。
ゲームについてはPortal: Prelude RTX、FORSPOKEN、ラチェット&クランク パラレル・トラブル(Ratchet & Clank: Rift Apart)の3つのタイトルを使用しています。いずれもグラフィック設定は4K解像度で最高画質、レイトレーシング表現も有効です。


Portal: Prelude RTXのロード時間比較

まずはPortal: Prelude RTXのロード時間比較を見ていきます。
検証方法はシンプルにスタートメニューから特定のセーブデータをロードし、『プレイアブルな状態になるまで』と『全てのテクスチャが適用されるまで』の2つのロード時間を確認しました。

プレイアブルな状態になるまでの時間はほぼ同じですが、4K解像度向けの高解像度テクスチャの適用にはDirectStorage対応の有無で大きな開きがあります。NVMe SSDは1秒前後なので、プレイアブルになってからほぼ”瞬時に”という感じですが、SATA SSDはしばらく待つ感じがあります。
PCIE帯域による違いについては、PCIE5.0とPCIE3.0でも0.3秒程度となっており、こういう条件(プレイシーン)だと実用的にあまり差はないと思います。ちなみにPCIE4.0はどちらかというとPCIE5.0の結果に近く、ちょうど1秒前後になりました。
Portal: Prelude RTXは実ゲームではあるものの、NVIDIA RTX IOのデモアプリ的な側面も強く、録画で比較するとPCIE3.0/4.0/5.0でコンマ秒程度の差が確認できますが、後述の他ゲームだとランダム要素の方が勝つ感じです。


Portal: Prelude RTXは確かにDirectStorage(その支援機能であるRTX IO)のデモアプリという側面はありますが、テクスチャの貼り遅れはFINAL FANTASY XVのような既存の一般PCゲームでも発生している現象です。
今後登場する新しいPCゲームについてはDirectStorage対応によってテクスチャの貼り遅れが解消できる、その一例と考えれば意味のある検証結果だと思います。




FORSPOKENのロード時間比較

続いてFORSPOKENのロード時間比較を見ていきます。一般PCゲームとしてはDirectStorageに初めて対応したタイトルです。
検証方法はスタートメニューから特定のセーブデータをロードしてプレイアブルになるまで、その後、ファストトラベルを3回繰り返して、各ロード時間を測定しています。なおFORSPOKENはスタートメニューにおいて最新セーブデータをバックグラウンドで読み出すので、それ以外のセーブデータを選んでいます。

デモアプリ的な側面の強いPortal: Prelude RTXはテクスチャ適用を確認できる、というかとりあえずプレイアブルにして随時テクスチャを適用する設計になっていましたが、FORSPOKENは一通りデータの読み込みが完了するまではプレイアブルにならないので、DirectStorageの対応の有無がプレイアブルになるまでのロード時間に直結しています。

従来式のPCゲームだとNVMe SSDとSATA SSDのロード時間の差は僅かでしたが、DirectStorageに対応するFORSPOKENではスタートメニューからのロードもファストトラベルもほぼ瞬時にプレイアブルになるのに対し、SATA SSDはそのまま従来のPCゲームのようなロード時間です。SATA SSDが遅いというよりもDirectStorageに対応するNVMe SSDが爆速という感じです。ブラインドテストでも間違いなく判別できます。
一方で、PCIE3.0/4.0/5.0の帯域によって差があるかというと、録画してみると帯域に応じてロードが速く済むというか、上下のブレ幅が小さい印象はあるものの、ブラインドで判別するのは困難な差です。




ラチェット&クランク パラレル・トラブルのロード時間比較

最後に、ラチェット&クランク パラレル・トラブル(Ratchet & Clank: Rift Apart)のロード時間比較を見ていきます。
ラチェット&クランクはいくつかのシーンについて検証しました。まずは比較検証で見かけることの多いプロローグのワープシーンです。ついでにスタートメニューからのロード時間の差も。
やはりDirectStorageに対応していないSATA SSDだとワープホールを潜る時に宙に浮いたまま読み出し待ちになったり、場面が切り替わった瞬間にスタッターが発生しますが、NVMe SSDはスムーズに切り替わります。


上のシーンは見栄えも良くて比較に使用されることも多いのですが、部分的に操作はできるものの、リアルタイムレンダリングなムービーシーンのようなものなので、もう少しプレイアブルなシーンについて見ていきます。
ブリザープライムでクリスタルを叩いて次元移動する時の読み出し時間についてです。
ファストトラベルと違ってプレイアブルな状態で自分の操作(アクション)によって画面が切り替わるので、より即応性が求められるシーンですが、DirectStorageに対応するNVMe SSDだと画面が白くなるフェードエフェクトとほぼ同期して次元が切り替わります。


上のような止まった状態(もしくはファストトラベル)だとNVMe SSDの0.5秒がSATA SSDで1.0秒に伸びるくらいの待ち時間があっても、それほど気にならないかもしれませんが、アクションシーンの中に次元移動が組み込まれている場合、0.5秒と1.0秒の差はかなり大きく感じます。実際のプレイでは動画で見るよりも、体感的な待ち時間というか、タイミングの違和感は強いと思います。




DirectStorage ロード速度比較検証のまとめ

最初に結論を言ってしまうと、
  • DirectStorageによってNVMe SSDとSATA SSDでは大幅な性能差がある
  • PCIE5.0、PCIE4.0だけでなく、PCIE3.0でも大きな差はない
  • TLC NANDとQLC NAND、DRAMキャッシュの有無による差もない
というのが検証結果です。
上の解説において、比較動画にPCIE5.0 SSD(12GB/s)とPCIE3.0 SSDとSATA SSDの3種類を選んだのもこれが理由です。

DirectStorageをサポートするNVMe SSDと非サポートのSATAには明確に差があります。
単純にロードが速いというだけでなく、ラチェット&クランク パラレル・トラブルのワープ表現のように新たなゲーム体験の創造に影響するような違いです。


一方で、Windows 11のDirectStorageではPCIE接続帯域としてPCIE4.0x4以上が推奨されていますが、今回検証した3タイトル、というか2023年9月現在、DirectStorageに対応している実ゲーム全てにおいて、下位規格であるPCIE3.0x4接続のSSDでも体感する性能差はほぼありませんでした。
厳密に解析すればないわけではありませんが、DirectStorageをサポートするNVMe SSDと非サポートのSATAのような大きな差はなく、ブラインドでは見分けが難しいレベルです。

DirectStorageでは高度に圧縮されたゲームデータを連続アクセス的に一気に読み出してGPUによって展開しています。
総容量が100GBのゲームだとしても一度のロードやファストトラベルで読み出すデータ量は大きく見積もって数GBなので、PCIE3.0x4帯域の3.5GB/s程度があれば1秒未満で完了します。
PCIE4.0やPCIE5.0になったとしても、時間差変化は反比例グラフの右側、ほぼ平らな部分のような非常に小さなものになるので、PCIEバージョン(帯域)によって”体感的に大きな差”と評価されるような、1秒を大きく超える差が出なかったことに違和感はありません。


またTLC型やQLC型といったNANDタイプの違いや、DRAMキャッシュの有無による性能差もやはりブラインドでは判別できない程度です。

性能差を確認しやすいIOベンチでも、TLC型やQLC型といったNANDタイプによる違いは主に書き込み性能やランダム読み出しであり(あとは書き込み耐久性)、DRAMキャッシュレスSSDの弱点は大きいサイズのデータからランダムに読み書きするアクセス(より影響が大きいのは書き込み)です。

消費電力の検証から、今回、DirectStorageのロード性能を検証したシーン(ロード、ファストトラベル、ワープ)は連続アクセス的なデータ読み出しが発生していると考えられます。
TLC型・QLC型のNANDタイプやDRAMキャッシュの有無といった違いは連続読み出し性能についてはIOベンチでも大きな差を見い出せないので、これらでDirectStorage対応ゲームのロード性能に差がなかったこともまた納得のいく結果です。
Crucial T700 2TB_Power_game




マイナーメーカーのそもそもSSD性能が怪しい製品とかになると保証もできませんが、Micron(Crucial)、Samsung、SK Hynix(Solidigm)、WD辺りの大手メーカー製品で、NVMe SSDであれば、DirectStorage対応ゲームのロード時間はほぼ同じになると思います。ブラインドで見分けられる差でないことは確かです。
DirectStorage対応タイトルはまだ少ないですが、これからゲーム用ストレージを購入するのであれば、PCIE4.0対応NVMe M.2 SSDが性能と容量単価のバランスも良く、ベストだと思います。
PCIE4.0対応NVMe M.2 SSDのレビュー記事一覧へ
PCIE4.0対応NVMe M.2 SSDのレビュー記事一覧へ



以上、『DirectStorageのロード速度を比較検証。PCIE4.0/5.0やSATAでどう変わる?』でした。
DirectStorage



記事が参考になったと思ったら、ツイートの共有(リツイートやいいね)をお願いします。






関連記事

おすすめSSDまとめ。QLC/TLC/MLCやNVMe/SATA3.0など最新SSD事情を解説
SSDレビュー記事の一覧へSATA SSD><NVMe SSD><M.2 SSD
SSDレビュー記事の一覧へ

【SATA SSD vs NVMe SSD vs HDD】 ゲームロード時間を比較
SSD vs HDD ゲームロード時間比較

PS5増設にオススメなM.2 SSDを解説。ヒートシンク搭載モデルも!
PS5増設にオススメなM.2 SSDを解説

「WD Blue SN580 NVMe SSD 1TB / 2TB」をレビュー
WD Blue SN580 1TB and 2TB

「WD_BLACK SN770 NVMe SSD 1TB」をレビュー
WD_BLACK SN770 NVMe SSD 1TB

「Crucial T700 2TB」をレビュー。PCIE5.0対応で連続性能の最速を更新!
Crucial T700

「Solidigm P44 Pro 1TB」をレビュー。完全版SK Hynix Platinum P41か!?
Solidigm P44 Pro 1TB

「Samsung SSD 990 PRO 1TB」をレビュー。性能も電力効率もトップクラス!
Samsung SSD 990 PRO 1TB

「WD_BLACK SN850X NVMe SSD 1TB / 2TB」をレビュー
WD_BLACK SN850X NVMe SSD 1TB

「Samsung SSD 980 1TB」をレビュー。堂々の最速更新
Samsung SSD 980 1TB

【4TBで5万円台】 Crucial P3 PlusでPS5のロード時間を比較してみた
Crucial P3 Plus SSD 4TB

【SSD増設】ADATA Premier SSDでPS5のロード時間を比較してみた
ADATA Premier SSD For Gamers

「Nextorage NE1N 1TB」をレビュー
Nextorage NE1N 1TB

「ASRock Blazing Quad M.2 Card」をレビュー。連続40GB/s越えなるか!?
ASRock Blazing Quad M.2 Card




(注:記事内で参考のため記載された商品価格は記事執筆当時のものとなり変動している場合があります)



スポンサードリンク