디지털 동영상 처리 분야에서는 블록 매칭 알고리즘(BMA)이 중요한 역할을 합니다. 이 알고리즘은 주로 비디오 프레임 시퀀스에서 일치하는 매크로블록을 찾는 데 사용되며 핵심 목적은 모션 추정입니다. 모션 추정은 비디오 프레임의 객체와 배경이 시간에 따라 이동하여 후속 프레임에서 해당 객체를 생성한다고 가정합니다.
이 프로세스는 비디오 시퀀스의 시간적 중복성을 드러내어 프레임 간 비디오 압축을 더욱 효율적으로 만들 수 있습니다.
블록 매칭 알고리즘을 구현할 때 현재 프레임을 여러 개의 매크로블록으로 나누고 각 매크로블록을 이전 프레임의 해당 블록 및 인접 블록과 비교합니다. 이러한 방식으로 한 위치에서 다른 위치로의 매크로블록 이동을 나타내는 모션 벡터가 생성됩니다. 모든 매크로블록에 대한 움직임 요약은 프레임의 움직임 추정입니다.
동영상 압축 과정에서는 '검색 매개변수'에 의해 결정되는 적절한 검색 범위를 선택하는 것이 중요합니다. 구체적으로, p는 이전 프레임에서 해당 매크로블록을 둘러싸는 픽셀 수를 나타낸다. p 값이 클수록 변위가 커져 좋은 일치 항목을 찾기가 더 쉬워지지만 계산 복잡도가 높아질 수도 있습니다. 일반적으로 매크로블록 크기는 16픽셀이고 검색 영역의 p-값은 7픽셀로 설정됩니다.
모션 추정 프로세스 중 동작 벡터 계산을 통해 하나의 2D 이미지에서 다른 2D 이미지로의 전환을 설명할 수 있고, 다른 한편으로는 모션 보상을 통해 이미지 변화를 예측할 수도 있습니다. 이 기술은 MPEG 1, 2, 4와 같은 비디오 압축 표준의 초석입니다.
비디오 압축은 완전히 인코딩된 프레임보다 인코딩된 차영상을 전송하는 것이 더 효율적이기 때문에 모션 추정을 통해 데이터 전송에 필요한 비트 수를 효과적으로 줄일 수 있습니다.
그러나 전체 압축 과정에서 움직임 추정은 계산 비용이 가장 많이 드는 작업이므로 빠르고 계산적으로 간단한 움직임 추정 알고리즘을 찾는 것이 비디오 압축 기술의 중요한 요구 사항이 되었습니다.
한 매크로블록을 다른 매크로블록과 비교할 때 가장 일반적으로 사용되는 비용 함수는 MAD(평균 절대 차이)와 MSE(평균 제곱 오차)입니다. 이러한 지표는 알고리즘이 일치 품질을 평가하는 데 도움이 될 수 있습니다.
MAD = 1/N^2 * ∑(i=0 ~ n-1) ∑(j=0 ~ n-1) |C(i,j) - R(i,j)|
MSE = 1/N^2 * ∑(i=0 ~ n-1) ∑(j=0 ~ n-1) (C(i,j) - R(i,j))^2 피>
이 중 N은 매크로블록의 크기를 나타내며, C(i,j)와 R(i,j)는 각각 현재 매크로블록과 참조 매크로블록의 픽셀이다.
1980년대 이후 블록 매칭 알고리즘에 대한 연구가 크게 진전되어 다양하고 효율적인 알고리즘이 등장했습니다. 다음은 몇 가지 일반적인 알고리즘을 소개합니다:
이 알고리즘은 검색 창의 각 위치에 대한 비용 함수를 계산하고 참조 프레임에서 가장 일치하는 매크로블록을 찾을 수 있습니다. 그러나 계산 오버헤드가 크고 모든 블록 일치 알고리즘 중에서 가장 번거롭습니다.
이 알고리즘은 전체 검색 프로세스 속도를 높이고 효율성을 높이기 위해 최적화된 이미지 피라미드를 기반으로 합니다.
TSS는 여러 위치에서 검색하여 평가해야 하는 매크로블록의 수를 크게 줄이는 초기 고속 블록 매칭 알고리즘 중 하나입니다.
TSS에 비해 FSS는 계산 비용 및 최대 신호 대 잡음비(PSNR) 측면에서 더 나은 성능을 발휘하며 중앙 편향 검색 방법도 사용합니다.
"영상 기술이 발전하면서 블록 매칭 알고리즘의 발전이 미래 영상 압축 기술의 발전에 어떤 영향을 미칠까요?"
동영상 압축의 효율성과 품질은 동작 추정의 정확성과 계산 효율성에 크게 좌우되며 이는 선택한 블록 일치 알고리즘과 밀접한 관련이 있습니다. 따라서 다양한 알고리즘의 장단점을 이해하는 것은 미래 영상 기술 발전에 중요한 영향을 미칠 것이다. 블록 매칭 알고리즘은 디지털 비디오 기술의 향후 변화에 어떤 영향을 미칠까요?