No campo do processamento de vídeo digital, o Block Matching Algorithm (BMA) desempenha um papel crucial. Este algoritmo é usado principalmente para localizar macroblocos correspondentes em sequências de quadros de vídeo e seu objetivo principal é a estimativa de movimento. A estimativa de movimento pressupõe que os objetos e fundos nos quadros de vídeo se movem ao longo do tempo, gerando assim objetos correspondentes nos quadros subsequentes.
Esse processo pode revelar redundância temporal na sequência de vídeo, tornando a compactação de vídeo entre quadros mais eficiente.
Ao implementar o algoritmo de correspondência de bloco, o quadro atual é dividido em vários macroblocos e cada macrobloco é comparado com o bloco correspondente no quadro anterior e seus blocos adjacentes. Desta forma, é gerado um vetor de movimento que representa o movimento de um macrobloco de uma posição para outra. O resumo do movimento para todos os macroblocos é a estimativa de movimento do quadro.
No processo de compressão de vídeo, é crucial escolher um intervalo de pesquisa apropriado, que é determinado pelo "parâmetro de pesquisa" p. Especificamente, p representa o número de pixels ao redor do macrobloco correspondente no quadro anterior. Se o valor de p for maior, significa que pode haver deslocamentos maiores, tornando mais fácil encontrar uma boa correspondência, mas isso também pode levar ao aumento da complexidade computacional. Geralmente, o tamanho do macrobloco é de 16 pixels e o valor p da área de pesquisa é definido como 7 pixels.
Durante o processo de estimativa de movimento, o cálculo dos vetores de ação pode, por um lado, descrever a transição de uma imagem 2D para outra e, por outro lado, também pode prever mudanças na imagem por meio da compensação de movimento. Esta tecnologia é a base dos padrões de compressão de vídeo como MPEG 1, 2 e 4.
A compressão de vídeo pode efetivamente reduzir o número de bits necessários para a transmissão de dados por meio da estimativa de movimento, uma vez que é mais eficiente transmitir imagens codificadas de diferenças do que quadros totalmente codificados.
No entanto, em todo o processo de compressão, a estimativa de movimento é a operação computacionalmente mais cara, portanto, buscar um algoritmo de estimativa de movimento rápido e computacionalmente simples tornou-se um requisito importante para a tecnologia de compressão de vídeo.
As funções de custo mais comumente usadas ao comparar um macrobloco com outro são Diferença Média Absoluta (MAD) e Erro Quadrático Médio (MSE). Esses indicadores podem ajudar o algoritmo a avaliar a qualidade da correspondência:
MAD = 1/N^2 * ∑(i=0 a n-1) ∑(j=0 a n-1) |C(i,j) - R(i,j)|
MSE = 1/N^2 * ∑(i=0 a n-1) ∑(j=0 a n-1) (C(i,j) - R(i,j))^2 p>
Entre eles, N representa o tamanho do macrobloco, e C(i,j) e R(i,j) são os pixels no macrobloco atual e no macrobloco de referência, respectivamente.
Desde a década de 1980, a pesquisa sobre algoritmos de correspondência de blocos fez progressos significativos e surgiu uma variedade de algoritmos eficientes. A seguir está uma introdução a vários algoritmos comuns:
Este algoritmo calcula a função de custo de cada posição na janela de pesquisa e pode encontrar o macrobloco mais correspondente no quadro de referência. No entanto, sua sobrecarga computacional é enorme e é o mais complicado de todos os algoritmos de correspondência de blocos.
Este algoritmo é baseado na pirâmide de imagens otimizada para acelerar todo o processo de pesquisa e melhorar a eficiência.
TSS é um dos primeiros algoritmos de correspondência rápida de blocos que reduz significativamente o número de macroblocos que precisam ser avaliados por meio de pesquisa em vários locais.
Comparado com o TSS, o FSS tem melhor desempenho em termos de custo computacional e relação sinal-ruído de pico (PSNR), e também usa um método de pesquisa com tendência central.
"Com o avanço da tecnologia de vídeo, como o desenvolvimento de algoritmos de correspondência de blocos afetará a evolução da futura tecnologia de compressão de vídeo?"
A eficiência e a qualidade da compressão de vídeo dependem fortemente da precisão e eficiência computacional da estimativa de movimento, que por sua vez estão intimamente relacionadas ao algoritmo de correspondência de blocos selecionado. Portanto, compreender os prós e os contras de vários algoritmos terá um impacto importante no desenvolvimento da futura tecnologia de vídeo. Como o algoritmo de correspondência de blocos afetará as mudanças futuras na tecnologia de vídeo digital?