デジタルビデオ処理の分野では、ブロックマッチングアルゴリズム (BMA) が重要な役割を果たします。このアルゴリズムは主にビデオ フレーム シーケンス内の一致するマクロブロックを見つけるために使用され、その主な目的は動きの推定を実行することです。動きの予測では、ビデオ フレーム内のオブジェクトと背景が時間の経過とともに移動し、それによって後続のフレームに対応するオブジェクトが生成されると想定されます。
このプロセスにより、ビデオ シーケンス内の時間的な冗長性が明らかになり、フレーム間のビデオ圧縮がより効率的になります。
ブロック マッチング アルゴリズムを実装する場合、現在のフレームは複数のマクロブロックに分割され、各マクロブロックは前のフレームの対応するブロックとその隣接ブロックと比較されます。このようにして、マクロブロックのある位置から別の位置への動きを表す動きベクトルが生成されます。すべてのマクロブロックのモーション サマリーは、フレームのモーション推定です。
ビデオ圧縮プロセスでは、「検索パラメータ」p によって決定される適切な検索範囲を選択することが重要です。具体的には、p は前のフレームの対応するマクロブロックの周囲のピクセル数を表します。 p の値が大きいほど、変位が大きくなる可能性があり、適切な一致を見つけやすくなりますが、計算の複雑さも増加する可能性があります。一般的に、マクロブロックのサイズは 16 ピクセルで、検索領域の p 値は 7 ピクセルに設定されます。
動き推定プロセスでは、動きベクトルの計算によって、一方では 1 つの 2D 画像から別の 2D 画像への移行を記述でき、他方では、動き補償によって画像の変化を予測できます。この技術は、MPEG 1、2、4 などのビデオ圧縮規格の基礎となります。
ビデオ圧縮では、動き推定を使用することで、データ転送に必要なビット数を効果的に削減できます。これは、完全にコード化されたフレームを転送するよりも、コード化された差分画像を転送する方が効率的だからです。
しかし、圧縮プロセス全体の中で、動き推定は最も計算オーバーヘッドが大きい操作であるため、高速で計算が簡単な動き推定アルゴリズムを見つけることが、ビデオ圧縮技術の重要な要件となっています。
マクロブロックを別のマクロブロックと比較する場合、最も一般的に使用されるコスト関数は、平均絶対差 (MAD) と平均二乗誤差 (MSE) です。これらの指標は、アルゴリズムが一致の品質を評価するのに役立ちます。
MAD = 1/N^2 * ∑(i=0 から n-1) ∑(j=0 から n-1) |C(i,j) - R(i,j)|
MSE = 1/N^2 * ∑(i=0 から n-1) ∑(j=0 から n-1) (C(i,j) - R(i,j))^2翻訳する
ここで、N はマクロブロックのサイズを表し、C(i,j) と R(i,j) はそれぞれ現在のマクロブロックと参照マクロブロック内のピクセルです。
1980 年代以降、ブロック マッチング アルゴリズムの研究は大きく進歩し、さまざまな効率的なアルゴリズムが登場しました。以下に一般的なアルゴリズムをいくつか示します。
1. 徹底的な検索このアルゴリズムは、検索ウィンドウ内の各位置のコスト関数を計算し、参照フレーム内で最も一致するマクロブロックを見つけることができます。ただし、計算オーバーヘッドは大きく、すべてのブロック マッチング アルゴリズムの中で最も扱いにくいものです。
このアルゴリズムは、最適化された画像ピラミッドに基づいて、完全な検索プロセスを高速化し、効率を向上させます。
3. 3ステップ検索(TSS)TSS は初期の高速ブロック マッチング アルゴリズムの 1 つであり、複数の場所を検索して評価する必要があるマクロブロックの数を大幅に削減します。
TSS と比較すると、FSS は計算コストとピーク信号対雑音比 (PSNR) の点でパフォーマンスが優れており、中心バイアス検索方法も採用しています。
「ビデオ技術の進歩に伴い、ブロック マッチング アルゴリズムの開発は将来のビデオ圧縮技術の進化にどのような影響を与えるでしょうか?」
ビデオ圧縮の効率と品質は、動き推定の精度と計算効率に大きく依存し、これは選択されたブロック マッチング アルゴリズムと密接に関連しています。したがって、さまざまなアルゴリズムの長所と短所を理解することは、ビデオ技術の将来の発展に重要な影響を与えるでしょう。ブロック マッチング アルゴリズムは、デジタル ビデオ テクノロジーの将来の変化にどのような影響を与えるでしょうか?