FPS 向上のための Nvidia の奇跡の武器について説明: DLSS 4 はパフォーマンスを 8 倍に向上
Nvidia が最新世代のグラフィックス カードを使用して AI レンダリングに向けてさらに一歩を踏み出したことは、まったく驚くべきことではありませんが、この用語が正確に何を意味するかについては議論があるかもしれません。
さらに驚くべきは、次のような本格的な発表だ。。
当然のことながら、メーカーはここで可能な限り最高の数値を提供します。これが実際にどうなるかはまだ分からない。テストは新しいモデルの発売時に表示されます。
ただし、すでに明らかになっているのは、Nvidia がこの大幅なパフォーマンス向上をどのように達成したいのかということです。
魔法の言葉はマルチフレーム生成です
さて、言葉は 3 つあります – すみません!それで何もできない場合は、単純なフレーム生成が実際にどのようなものであるかを簡単に説明します。
基本的に、このテクノロジーは、グラフィックス カード上で従来計算されていた 2 つの画像の間に追加の画像を挿入するだけです。この中間画像の計算はAIによって行われます。
これは、いわゆるオプティカル フロー アクセラレータ
(OFA) あるフレームから次のフレームまでのピクセルの方向と速度を決定します。このデータはニューラル ネットワークに流れ込み、最終的に追加の画像が生成されます。
フレーム生成の利点
GPU と CPU の計算量を 2 倍にすることなく、フレーム レートが 2 倍になります。追加のコンピューティング負荷は、従来のシェーダー コンピューティング コアではなく、AI と前述の OFA に特化したテンソル コアによって負担されます。
フレーム生成のデメリット
画像アーティファクトやゴースト画像が発生する可能性があり、表示品質が低下します。同時に、2 つのフレーム全体がバッファリングされ出力されないため、システム遅延 (レイテンシ) が増加します。
60 FPS (フレームあたり 16.7 ミリ秒) では、約 33 ミリ秒になります。ただし、この影響は Nvidia の Reflex テクノロジーによって多少相殺されます。
単純明快:Reflex は、ビデオ ゲームで画像を作成する際の CPU と GPU 間の通信を最適化します。したがって、他の場所で時間が節約されます。
では、マルチフレーム生成とは何でしょうか?
名前が示すように、MFG は 1 つの追加イメージではなく、複数の追加イメージを作成します。正確には3つまでです。
ただし、これは OFA 経由では発生しなくなりました。この専用ハードウェア コンポーネントは、KI-Modell(AIオプティカルフロー)置き換えられます。これは、テンソル コアによって完全に計算されます。
上の画像によると、AI は 1 つのレンダリングされたフレームから 3 つの追加フレームを一度に生成できますが、おそらく 2 つのレンダリングされたフレームを使用します。
マルチフレーム生成の利点
前バージョンと同様に、CPU や GPU の従来のコンピューティング能力を必要としない、はるかに高いフレーム レート。
さらに、画像の途切れを防ぐために、いわゆるフリップ測光を使用してフレーム ペーシング (画像の出力間の時間。できるだけ均等である必要があります) を改善する必要があります。
マルチ フレーム生成を含む DLSS 4 を実際に比較すると次のようになります。
推奨される編集コンテンツ
この時点で、記事を補完する外部コンテンツが YouTube から見つかります。
ワンクリックで表示したり非表示にしたりできます。
YouTube のコンテンツが表示されることに同意します。
個人データはサードパーティのプラットフォームに送信される場合があります。詳細については、。
へのリンクYouTube コンテンツ
マルチフレーム生成のデメリット
マルチフレーム生成が画質の点でどの程度うまく機能するかは、独立したテストを通じて明らかにする必要があります。
基本的に、DLSS 4 (したがってフレーム生成も) を畳み込みニューラル ネットワーク (CNN) から Transformer モデルに変更することで、Nvidia はより詳細なレベルの向上、アーチファクトやゴースト イメージの減少を約束します。
特に興味深いのは、レイテンシの観点から中間画像がどのように生成されるかです。単純なフレーム生成の場合のように、AI モデルが 2 つの画像ではなく 1 つの画像からのモーション データのみを使用する場合、追加の遅延の少なくとも一部を排除する必要があります。
ただし、おそらく 2 つのフレームが使用され、両方ともバッファリングされ、そこから最大 3 つの中間画像が計算されます。
3 つの追加フレーム自体の作成にも遅延が発生します。これらは従来のようにレンダリングされません。つまり、プレーヤーは実際に入力を通じてシーケンスの最初の画像 (最大 5 つのうちの最初の画像) にのみ影響を与えます。ただし、Nvidia は Reflex 2 でこれを補いたいと考えています。
これがどのように機能するかについては、次の記事で詳しく説明します。ただし、RTX 5000 をテーマにしたビデオ トークはすでにご覧いただけます。そこではReflex 2について説明されています。
新しいテンソルコア
単純なフレーム生成と比較して非常に多くのイメージを生成できるようにするには、新しい Tensor コアの能力が必要です。
かなり強くなったと言われています。エヌビディアによると第 5 世代コア (RTX 5000) は、直接の前世代 (RTX 4000) に比べて最大 2.5 倍強力です。
この時点で、Nvidia の新しい戦闘用語が登場します。AIトップ
ゲームに。この単位は、テンソル コアの計算能力を示します。
係数 2.5 は、3,352 AI TOP を備えた RTX 5090 と 1,321 AI TOP を備えた RTX 4090 を比較する Nvidia の情報から得られます (3,352 / 1,312 = 2.5)。
ただし、ここでは注意が必要です。 2 つの値にどのような精度 (浮動小数点演算の場合。値が大きいほど、精度と計算能力が高くなります) が使用されたかが完全には明らかではないためです。
Nvidia自体が書いています生成 AI アプリケーションでの画像生成は、FP16 を搭載した RTX 4090 と比較して、FP4 を搭載した RTX 5090 の方が 2 倍高速です。これがゲームでどのように見えるか、同じ精度が使用されるかどうかはまだ明らかにする必要があります。
次のことも考慮してください。RTX 5090 には 680 個のテンソル コアがあり、RTX 4090 にはのみ
512以上。
DLSS 4 は Uspcaling を超えたものです
特に重要:マルチ フレーム生成は DLSS 4 の一部です。
Nvidia が示しているように、優れた表示品質と組み合わせた高いパフォーマンスの向上を実現するには、いくつかの DLSS 機能が連携する必要があります。
マルチ フレーム生成に加えて、アップスケーリング (超解像度)、レイ再構成 (レイ トレーシングまたはパス トレーシングが含まれる場合)、DLAA アンチエイリアシングもあります。
表示されている YouTube ビデオの場合、最初に 1 フレーム (または 2 フレーム) が低解像度でネイティブにレンダリングされます。これは、DLSS 超解像度 (アップスケーリング) を使用して、必要な高解像度にスケーリングされます。
レイ トレーシングまたはパス トレーシングが以前に使用されていた場合、レイ再構成はイメージからノイズを除去します。 DLAA はエッジを滑らかにします。
その後初めてマルチフレーム生成が開始されます1 つの画像 (または 2 つの画像) から最大 3 つの追加画像を生成します。
サブスクリプション
サイトの新着記事を購読し、新着投稿の通知をメールで受け取るには、メールアドレスを入力してください。