Dans le domaine du traitement vidéo numérique, l'algorithme de correspondance de blocs (BMA) joue un rôle crucial. Cet algorithme est principalement utilisé pour localiser des macroblocs correspondants dans des séquences d'images vidéo, et son objectif principal est l'estimation de mouvement. L'estimation du mouvement suppose que les objets et les arrière-plans des images vidéo se déplacent au fil du temps, générant ainsi les objets correspondants dans les images suivantes.
Ce processus peut révéler une redondance temporelle dans la séquence vidéo, rendant ainsi la compression vidéo inter-images plus efficace.
Lors de la mise en œuvre de l'algorithme de correspondance de blocs, la trame actuelle est divisée en plusieurs macroblocs, et chaque macrobloc est comparé au bloc correspondant dans la trame précédente et à ses blocs adjacents. De cette manière, un vecteur de mouvement est généré et représente le mouvement d'un macrobloc d'une position à une autre. Le résumé du mouvement pour tous les macroblocs est l'estimation du mouvement de la trame.
Dans le processus de compression vidéo, il est crucial de choisir une plage de recherche appropriée, qui est déterminée par le « paramètre de recherche » p. Plus précisément, p représente le nombre de pixels entourant le macrobloc correspondant dans la trame précédente. Si la valeur de p est plus grande, cela signifie qu'il peut y avoir des déplacements plus importants, ce qui facilite la recherche d'une bonne correspondance, mais cela peut également conduire à une complexité de calcul accrue. Généralement, la taille du macrobloc est de 16 pixels et la valeur p de la zone de recherche est fixée à 7 pixels.
Lors du processus d'estimation de mouvement, le calcul des vecteurs d'action peut décrire la transition d'une image 2D à une autre d'une part, et d'autre part, il peut également prédire les changements d'image grâce à la compensation de mouvement. Cette technologie est la pierre angulaire des normes de compression vidéo telles que MPEG 1, 2 et 4.
La compression vidéo peut réduire efficacement le nombre de bits requis pour la transmission des données grâce à l'estimation du mouvement, car il est plus efficace de transmettre des images différentielles codées que des images entièrement codées.
Cependant, dans l'ensemble du processus de compression, l'estimation de mouvement est l'opération la plus coûteuse en termes de calcul. C'est pourquoi la recherche d'un algorithme d'estimation de mouvement rapide et simple en termes de calcul est devenue une exigence importante pour la technologie de compression vidéo.
Les fonctions de coût les plus couramment utilisées lors de la comparaison d'un macrobloc à un autre sont la différence absolue moyenne (MAD) et l'erreur quadratique moyenne (MSE). Ces indicateurs peuvent aider l'algorithme à évaluer la qualité du matching :
MAD = 1/N^2 * ∑(i=0 à n-1) ∑(j=0 à n-1) |C(i,j) - R(i,j)|
MSE = 1/N^2 * ∑(i=0 à n-1) ∑(j=0 à n-1) (C(i,j) - R(i,j))^2 p>
Parmi eux, N représente la taille du macrobloc, et C(i,j) et R(i,j) sont respectivement les pixels du macrobloc actuel et du macrobloc de référence.
Depuis les années 1980, la recherche sur les algorithmes de correspondance de blocs a fait des progrès significatifs et une variété d'algorithmes efficaces ont vu le jour. Ce qui suit est une introduction à plusieurs algorithmes courants :
Cet algorithme calcule la fonction de coût de chaque position dans la fenêtre de recherche et peut trouver le macrobloc le plus correspondant dans le cadre de référence. Cependant, sa charge de calcul est énorme et c'est le plus lourd de tous les algorithmes de correspondance de blocs.
Cet algorithme est basé sur la pyramide d'images optimisée pour accélérer le processus de recherche complet et améliorer l'efficacité.
TSS est l'un des premiers algorithmes de correspondance de blocs rapides qui réduit considérablement le nombre de macroblocs qui doivent être évalués en effectuant une recherche à plusieurs emplacements.
Par rapport au TSS, le FSS est plus performant en termes de coût de calcul et de rapport signal/bruit de crête (PSNR), et utilise également une méthode de recherche à polarisation centrale.
"Avec les progrès de la technologie vidéo, comment le développement d'algorithmes de correspondance de blocs affectera-t-il l'évolution de la future technologie de compression vidéo ?"
L'efficacité et la qualité de la compression vidéo dépendent fortement de la précision et de l'efficacité des calculs de l'estimation du mouvement, qui sont elles-mêmes étroitement liées à l'algorithme de correspondance de blocs sélectionné. Par conséquent, comprendre les avantages et les inconvénients de divers algorithmes aura un impact important sur le développement de la future technologie vidéo. Comment l’algorithme de correspondance de blocs affectera-t-il les futurs changements dans la technologie vidéo numérique ?