Im Bereich Computer Vision besteht die Methode zur Erkennung von „Blobs“ hauptsächlich darin, die qualitativen Unterschiede von Bereichen in digitalen Bildern, wie Helligkeit oder Farbe, im Vergleich zu umgebenden Bereichen zu identifizieren. Inoffiziell ausgedrückt ist ein Blob ein Bereich in einem Bild, in dem eine Eigenschaft konstant oder in gewissem Sinne annähernd konstant ist; alle Punkte innerhalb des Blobs können als einander ähnlich betrachtet werden. Die Bedeutung dieser Erkennungstechnik besteht darin, dass sie ergänzende Informationen liefern kann, die sich von der Kantenerkennung oder Eckenerkennung unterscheiden.
„In früheren Studien wurde die Blob-Erkennung verwendet, um interessierende Bereiche für die weitere Verarbeitung zu ermitteln, die möglicherweise Objekte oder Teile von Objekten im Bildfeld sichtbar machen.“
Die Blob-Erkennung erfolgt normalerweise durch Faltungsmethoden. Forschungsergebnissen zufolge gibt es zwei Hauptkategorien von Blob-Detektoren: (i) Differentialmethoden, die auf Funktionsableitungen basieren, und (ii) auf lokalen Extremen basierende Methoden, die darauf abzielen, lokale Maxima und Minima einer Funktion zu finden. Diese Detektoren können auch als Interessenpunktoperatoren oder Interessenregionsoperatoren bezeichnet werden. Eine der Hauptmotivationen für das Verständnis und die Entwicklung dieser Detektoren besteht darin, ergänzende Informationen über Bereiche bereitzustellen, die nicht durch Kanten- oder Eckenerkennung gewonnen werden können.
Die Blob-Erkennung bietet ein breites Anwendungsspektrum. Zusätzlich zur Objekterkennung und -verfolgung kann sie auch zur Histogrammanalyse, Spitzenerkennung und Segmentierung verwendet werden. In den letzten Jahren sind Blob-Deskriptoren in Bereichen wie der Texturanalyse und -erkennung, Wide-Base-Stereo-Matching usw. immer beliebter geworden. Diese Deskriptoren können aussagekräftige Bildmerkmale anzeigen und eine erscheinungsbasierte Objekterkennung basierend auf lokalen Bildstatistiken durchführen.
„In der Computer-Vision-Literatur ist diese Methode als Differenz-Gauß-Methode (DoG) bekannt und wird hauptsächlich im Scale Invariant Feature Transform (SIFT)-Algorithmus verwendet.“
Die Gaußsche Methode von Laplace ist einer der frühesten und gebräuchlichsten Blob-Detektoren. Bei einem Eingabebild kann das Ergebnis der Anwendung des Laplace-Operators nach der Faltung mit einem Gaußschen Kernel dunkle und helle Flecken im Bild identifizieren. Dieser Ansatz leidet natürlich unter dem Problem der Abhängigkeit von der Beziehung zwischen der Größe der Blob-Struktur und der Größe des Gaußschen Kernels. Um dieses Problem zu lösen, muss ein mehrskaliger Ansatz gewählt werden, um Blobs unterschiedlicher (unbekannter) Größe in der Bilddomäne automatisch zu erfassen.
Durch höherstufige Techniken wie die Blob-Erkennung mithilfe hessischer Determinanten haben Forscher die Genauigkeit und Effizienz der Blob-Erkennung weiter verbessert. Diese Technik ermöglicht die Erkennung lokaler Maxima und weist mit dieser Methode das Vorhandensein stabförmiger und länglicher Objekte nach.
„Solche hybriden Laplace- und Hesse-Determinantenoperatoren wurden vorgeschlagen und häufig bei der Bildanpassung, Objekterkennung und Texturanalyse verwendet.“
Im Bildverarbeitungssystem unterliegt das Eingabebild nicht nur einer ebenen geometrischen Verformung, sondern auch einer affinen Transformation. Um Blob-Deskriptoren zu erhalten, die gegenüber affinen Transformationen robuster sind, werden daher viele neue Faltungsoperationen entwickelt, um sie besser an unterschiedliche Betrachtungswinkeländerungen anzupassen. Beispielsweise werden Laplace- und Gaußsche Differenzoperationen angepasst, um der lokalen Struktur um das Bild herum zu entsprechen.
Moderne räumlich-zeitliche Blob-Detektoren erweitern diese Konzepte und wenden sie auf die Erkennung gemeinsamer Merkmale in Zeit und Raum an, was für die Analyse der Eigenschaften von Objekten in Bewegung von entscheidender Bedeutung ist.
Durch kontinuierliche Weiterentwicklung und technische Erkundung haben wir ein tieferes Verständnis für den Mechanismus gewonnen, mit dem Blobs in Bildern gefunden werden. Welche neuen Bildfunktionen werden wir in diesem sich schnell entwickelnden Bereich der Computer Vision erforschen?