En vision par ordinateur, les techniques de détection de taches visent à identifier les régions des images numériques qui diffèrent en termes de propriétés (telles que la luminosité ou la couleur) des zones environnantes. En général, un blob est une région d'image où certaines propriétés sont à peu près constantes ; cela signifie que tous les points du blob sont similaires les uns aux autres dans un certain sens. Cet article explorera différentes techniques de détection de blobs, en particulier comment identifier automatiquement des blobs de différentes tailles grâce à une approche multi-échelle.
L’une des principales raisons d’étudier et de développer des détecteurs de blobs est de fournir des informations complémentaires qui ne peuvent pas être obtenues par des détecteurs de bords ou des détecteurs d’angle. La détection précoce des blobs est utilisée pour obtenir des régions d’intérêt pour un traitement ultérieur. Ces régions peuvent indiquer la présence d'objets ou de parties d'objets dans le domaine de l'image, et leurs applications incluent la reconnaissance d'objets et le suivi de cibles. Dans d’autres domaines tels que l’analyse d’histogrammes, les descripteurs de blob peuvent également être utilisés pour la détection de pics, ce qui est crucial pour la segmentation. Une autre utilisation courante des descripteurs de blob est de servir de base à l'analyse et à la reconnaissance de texture.
Des études récentes ont montré que les descripteurs de blob jouent un rôle de plus en plus important dans la reconnaissance d’objets basée sur l’apparence, qui repose sur des statistiques d’image locales.
Le Laplacien Gaussien (LoG) est l'une des méthodes de détection de blobs les plus anciennes et les plus courantes. Étant donné une image d’entrée, l’image est d’abord convoluée avec un noyau gaussien pour obtenir une représentation de l’espace d’échelle. Ensuite, le résultat après application de l’opérateur laplacien est calculé, ce qui donne généralement une forte réponse positive pour les blobs actifs à faible luminosité et une forte réponse négative pour les blobs à haute luminosité. Cependant, lors de l'application de cet opérateur à une seule échelle, la réponse est fortement affectée par la relation entre la taille de la structure du blob dans le domaine de l'image et la taille du noyau gaussien utilisé.
Par conséquent, la capture automatique de blobs de tailles variables (inconnues) dans le domaine de l’image nécessite une approche multi-échelle.
La méthode basée sur la différence gaussienne (DoG) est utilisée pour extraire les blobs de l'image éditée dans l'espace d'échelle. Il peut approximer les performances de l'opérateur laplacien et est largement discuté dans la plupart des publications sur la vision par ordinateur. La particularité de cette méthode est qu'elle peut être calculée par la différence entre deux images lissées gaussiennes, ce qui rend la détection des taches plus efficace.
En considérant le déterminant de la matrice hessienne normalisée à l'échelle, nous sommes en mesure d'obtenir une nouvelle façon de détecter les blobs. Cette méthode peut ensuite être utilisée pour la sélection automatique de l'échelle et fonctionne également bien en réponse aux points de selle. De plus, la méthode proposée est plus performante que l'opérateur laplacien traditionnel dans la sélection d'échelle sous des transformations affines non euclidiennes.
Dans l'étude de la détection de blobs, certaines personnes ont proposé un opérateur hybride de déterminant de Laplace et de Hess. Cette méthode combine les avantages de la sélection d’espace et de la sélection d’échelle et a été appliquée à de nombreux domaines tels que la correspondance d’images, la reconnaissance d’objets et l’analyse de texture.
Étant donné que l’image d’entrée peut être affectée par une distorsion de perspective, le développement d’un détecteur de blobs invariant aux transformations affines est naturellement devenu un point chaud de recherche. Le cœur de cette méthode est d’effectuer un ajustement de forme affine sur le descripteur de blob pour obtenir des blobs dans des environnements plus complexes. Ces versions adaptées affines de la méthode de Laplace, de la méthode DoG et du déterminant hessien fournissent des résultats de détection plus stables.
Il est important de noter que les opérateurs du déterminant hessien ont été étendus au domaine espace-temps. Une expression différentielle normalisée à l'échelle avancée offre de nouvelles possibilités de détection de blobs, rendant l'identification de blobs dans les processus dynamiques plus courante.
Parmi ces avancées, nous pouvons constater l’impact transformateur de la technologie de détection de blobs sur la vision par ordinateur. La détection de blobs d’aujourd’hui excelle non seulement dans les images statiques, mais devient également de plus en plus importante dans les vidéos et la capture de processus dynamiques avec l’émergence de l’analyse spatio-temporelle. Il reste cependant de nombreux défis à relever dans ce domaine à l’avenir. Comment mieux y faire face pourrait être notre prochain sujet important ?