Nvidiaの次世代GPU「GeForce RTX 5090」が、DirectStorage対応ゲームにおけるGPU解凍処理でRTX 4090を上回る可能性があると報告された。YouTuberのCompusemble氏が『Ratchet and Clank: Rift Apart』および『Spider-Man 2』において実施した検証によれば、RTX 5090はGPU解凍とCPU解凍の間で性能差が小さく、特に高解像度下での一貫性が際立つという。

対照的に、RTX 4090では同条件下で大幅な性能低下が観察されており、RTX 5090のメモリ帯域幅やVRAMの強化が解凍処理時のボトルネック回避に寄与している可能性がある。DirectStorageの最適化における次世代GPUの優位性が、今後のゲーム体験を大きく左右することになり得る。

RTX 5090のDirectStorage対応性能はゲームタイトルで異なる傾向を示す

Compusemble氏の検証によれば、GeForce RTX 5090はDirectStorage APIによるGPU解凍処理において、ゲームタイトルごとに異なる挙動を示す。『Ratchet and Clank: Rift Apart』では、4K解像度でCPU解凍の方が1%低フレームレートで約10%高かったが、1440pおよび1080pではGPU解凍が優勢となった。

一方、『Spider-Man 2』では全解像度において一貫してCPU解凍が上回る結果が示されており、GPU解凍が必ずしも万能ではないことが明らかとなっている。これらの比較から、DirectStorageの実装によってはGPU側の負荷がパフォーマンスに負の影響を及ぼすケースが存在することが読み取れる。

とくに、ゲームエンジンのI/O構造やデータ圧縮アルゴリズムの設計により、GPU解凍の効果が変動する点は看過できない。したがって、DirectStorageの恩恵を最大化するには、タイトルごとの最適化の有無が鍵となる。

GPU解凍性能を支えるRTX 5090の帯域設計と計算能力

RTX 5090のDirectStorage処理における安定性は、スペック面の大幅な強化と密接に関係している。演算性能はFP32ベースで105 TFLOPSに達し、前世代のRTX 4090(83 TFLOPS)から大きく向上。加えて、メモリ帯域幅は1.8 TB/sと、RTX 4090の1.0 TB/sから78%の拡大を遂げている。

VRAM容量も33%増加し、512ビットのメモリバスと28 GbpsのGDDR7を採用する設計は、特にGPU解凍のようにメモリI/O負荷の高い処理において効果的である。Compusemble氏の指摘によると、RTX 4090ではGPUとCPUの解凍処理の切り替えで顕著な性能低下が見られたが、RTX 5090ではその差が縮小し、一貫性のある処理性能が確認された。

この傾向は、メモリ帯域と計算資源が処理のボトルネックを回避する設計に寄与していると考えられる。ただし、低解像度ではCPU側が律速となる場合もあるため、帯域の優位性が常に表面化するとは限らない。各種ゲームや解像度に応じた適応的なリソース活用が、今後の設計指針となろう。

Source:Tom’s Hardware