FPS 向上のための Nvidia の奇跡の武器について説明: DLSS 4 はパフォーマンスを 8 倍に向上

Sakiko

2025-01-09

マルチフレーム生成を含む Nvidia の DLSS 4 は、大幅なパフォーマンスの向上を約束します。 (画像出典: Nvidia)

Nvidia が最新世代のグラフィックスカードを使用して AI レンダリングに向けてさらに一歩を踏み出したことは、まったく驚くべきことではありませんが、この用語が正確に何を意味するかについては議論があるかもしれません。

さらに驚くべきは、次のような本格的な発表だ。。

当然のことながら、メーカーはここで可能な限り最高の数値を提供します。これが実際にどうなるかはまだ分からない。テストは新しいモデルの発売時に表示されます。

ただし、すでに明らかになっているのは、Nvidia がこの大幅なパフォーマンス向上をどのように達成したいのかということです。

魔法の言葉はマルチフレーム生成です

さて、言葉は 3 つあります – すみません！それで何もできない場合は、単純なフレーム生成が実際にどのようなものであるかを簡単に説明します。

基本的に、このテクノロジーは、グラフィックスカード上で従来計算されていた 2 つの画像の間に追加の画像を挿入するだけです。この中間画像の計算はAIによって行われます。

これは、いわゆるオプティカルフローアクセラレータ(OFA) あるフレームから次のフレームまでのピクセルの方向と速度を決定します。このデータはニューラルネットワークに流れ込み、最終的に追加の画像が生成されます。

フレーム生成の利点

GPU と CPU の計算量を 2 倍にすることなく、フレームレートが 2 倍になります。追加のコンピューティング負荷は、従来のシェーダーコンピューティングコアではなく、AI と前述の OFA に特化したテンソルコアによって負担されます。

フレーム生成のデメリット

画像アーティファクトやゴースト画像が発生する可能性があり、表示品質が低下します。同時に、2 つのフレーム全体がバッファリングされ出力されないため、システム遅延 (レイテンシ) が増加します。

60 FPS (フレームあたり 16.7 ミリ秒) では、約 33 ミリ秒になります。ただし、この影響は Nvidia の Reflex テクノロジーによって多少相殺されます。

単純明快:Reflex は、ビデオゲームで画像を作成する際の CPU と GPU 間の通信を最適化します。したがって、他の場所で時間が節約されます。

では、マルチフレーム生成とは何でしょうか?

名前が示すように、MFG は 1 つの追加イメージではなく、複数の追加イメージを作成します。正確には3つまでです。

ただし、これは OFA 経由では発生しなくなりました。この専用ハードウェアコンポーネントは、KI-Modell（AIオプティカルフロー）置き換えられます。これは、テンソルコアによって完全に計算されます。

上の画像によると、AI は 1 つのレンダリングされたフレームから 3 つの追加フレームを一度に生成できますが、おそらく 2 つのレンダリングされたフレームを使用します。

マルチフレーム生成の利点

前バージョンと同様に、CPU や GPU の従来のコンピューティング能力を必要としない、はるかに高いフレームレート。

さらに、画像の途切れを防ぐために、いわゆるフリップ測光を使用してフレームペーシング (画像の出力間の時間。できるだけ均等である必要があります) を改善する必要があります。

マルチフレーム生成を含む DLSS 4 を実際に比較すると次のようになります。

推奨される編集コンテンツ

この時点で、記事を補完する外部コンテンツが YouTube から見つかります。
ワンクリックで表示したり非表示にしたりできます。

YouTube のコンテンツが表示されることに同意します。

個人データはサードパーティのプラットフォームに送信される場合があります。詳細については、。

へのリンクYouTube コンテンツ

マルチフレーム生成のデメリット

マルチフレーム生成が画質の点でどの程度うまく機能するかは、独立したテストを通じて明らかにする必要があります。

基本的に、DLSS 4 (したがってフレーム生成も) を畳み込みニューラルネットワーク (CNN) から Transformer モデルに変更することで、Nvidia はより詳細なレベルの向上、アーチファクトやゴーストイメージの減少を約束します。

特に興味深いのは、レイテンシの観点から中間画像がどのように生成されるかです。単純なフレーム生成の場合のように、AI モデルが 2 つの画像ではなく 1 つの画像からのモーションデータのみを使用する場合、追加の遅延の少なくとも一部を排除する必要があります。

ただし、おそらく 2 つのフレームが使用され、両方ともバッファリングされ、そこから最大 3 つの中間画像が計算されます。

3 つの追加フレーム自体の作成にも遅延が発生します。これらは従来のようにレンダリングされません。つまり、プレーヤーは実際に入力を通じてシーケンスの最初の画像 (最大 5 つのうちの最初の画像) にのみ影響を与えます。ただし、Nvidia は Reflex 2 でこれを補いたいと考えています。

これがどのように機能するかについては、次の記事で詳しく説明します。ただし、RTX 5000 をテーマにしたビデオトークはすでにご覧いただけます。そこではReflex 2について説明されています。