在數位視頻壓縮的背景下,區塊匹配演算法(Block Matching Algorithm)成為了運動估計的核心技術。該演算法的基本假設是,在相鄰視頻幀中,相同物體及背景的模式會隨著時間而在幀內移動,構成新的對應物體。透過這種模式,演算法能夠抓取視頻序列中的時間冗餘,從而增加幀與幀之間壓縮的有效性。當前幀的區塊被分割成宏塊,然後與前一幀的相應區域進行比較,並利用差異尋找最佳匹配。
“通過將視頻中的運動向量進行預測,可以有效地減少所需的數據量,這對於視頻壓縮至關重要。”
區塊匹配演算法通常會將當前幀分割為16x16像素的宏塊,並將這些區塊與相鄰幀中的對應區域進行比較。這個比較的結果生成了一個描述宏塊從一個位置到另一個位置運動的向量。所有宏塊的運動向量組成了該幀的運動估計。匹配的搜索範圍由“搜索參數”決定,這個參數設定了要考慮的前一幀中相應宏塊的周圍像素數量。
運動估計的主要目的是為了獲取那些能夠有效表示從一個2D圖像到另一個圖像的運動向量,這些運動向量可能涉及整個圖像的全局運動估計或特定區域的運動,如矩形區塊或是任意形狀的區塊。此外,這些向量還能根據真實視頻攝像機的運動特徵,如旋轉或縮放,進行多種模型的匹配與描述。
“運動估計和運動補償的結合是當前多個視頻編碼標準,如MPEG及H.261的關鍵部分。”
不過,運動估計在整個視頻壓縮過程中卻是最耗費計算資源的,因此需要更快速且計算效率高的算法。例如,全面搜尋法能達到最佳的匹配效果,但其計算成本極高。而一些如優化階層區塊匹配(OHBM)及三步搜尋(TSS)等更為高效的演算法,則是為了解決這種運算需求而提出的。
在區塊匹配的過程中,對宏塊的匹配度進行評估是非常重要的,通常這是依據一個成本函數。例如,最流行的評估方式之一是平均絕對誤差(MAD),但還有均方誤差(MSE)等多種指標。
“這些成本函數不僅影響著算法的性能,還直接影響最終視頻質量的損失。”
自1980年代中期以來,許多區塊匹配算法已經被提出與發展。以下是一些流行的算法:
這是一種最簡單但計算量最大的算法,計算所有可能位置的成本函數以求得最佳匹配。雖然這種方法提供了最好的信號噪音比,但也需要極大的計算資源。
這是一種早期的快速區塊匹配算法,通過逐步縮小搜尋範圍,顯著降低了運算量。
使用鑽石搜尋模式的算法能以較低的計算成本找到全局最小匹配,並且能提供接近全面搜尋所達到的峰值信號噪音比。
隨著技術的進步,更高效的演算法如自適應根部模式搜尋(ARPS)也開始浮現,它能有效利用周圍宏塊的運動推斷當前宏塊的運動,從而減少了計算時間。
最終,區塊匹配演算法的發展已經成為視頻編碼技術的重要基石。這不僅提升了視頻壓縮的效率,還為未來的影像處理及傳輸技術鋪平了道路。因此,是否可以想像,如果區塊匹配技術持續進步,未來的視頻世界又會是怎樣的一番景象?