Nella visione artificiale, le tecniche di rilevamento delle macchie mirano a identificare regioni nelle immagini digitali che differiscono per proprietà (ad esempio luminosità o colore) dalle aree circostanti. In generale, un blob è una regione dell'immagine in cui alcune proprietà sono approssimativamente costanti; ciò significa che tutti i punti del blob sono simili tra loro in un certo senso. In questo articolo verranno esaminate diverse tecniche per il rilevamento di blob, in particolare come identificare automaticamente blob di diverse dimensioni tramite un approccio multiscala.
Uno dei motivi principali per cui vengono studiati e sviluppati i rilevatori di blob è quello di fornire informazioni complementari che non possono essere ottenute tramite i rilevatori di bordi o di angoli. Il lavoro di rilevamento precoce dei blob viene utilizzato per ottenere regioni di interesse per ulteriori elaborazioni. Queste regioni possono indicare la presenza di oggetti o parti di oggetti nel dominio dell'immagine e le loro applicazioni includono il riconoscimento di oggetti e il tracciamento di bersagli. In altri ambiti, come l'analisi degli istogrammi, i descrittori di blob possono essere utilizzati anche per il rilevamento dei picchi, il che è fondamentale per la segmentazione. Un altro uso comune dei descrittori blob è come base per l'analisi e il riconoscimento delle texture.
Studi recenti hanno dimostrato che i descrittori blob svolgono un ruolo sempre più importante nel riconoscimento degli oggetti basato sull'aspetto, che si basa sulle statistiche delle immagini locali.
Il laplaciano della gaussiana (LoG) è uno dei metodi più antichi e più comuni per il rilevamento delle macchie. Data un'immagine di input, l'immagine viene prima sottoposta a convoluzione con un kernel gaussiano per ottenere una rappresentazione dello spazio di scala. Successivamente, viene calcolato il risultato dopo l'applicazione dell'operatore laplaciano, che generalmente fornisce una forte risposta positiva per le macchie attive a bassa luminosità e una forte risposta negativa per le macchie ad alta luminosità. Tuttavia, quando si applica questo operatore a una singola scala, la risposta è fortemente influenzata dalla relazione tra la dimensione della struttura blob nel dominio dell'immagine e la dimensione del kernel gaussiano utilizzato.
Pertanto, l'acquisizione automatica di blob di dimensioni variabili (sconosciute) nel dominio dell'immagine richiede un approccio multiscala.
Il metodo basato sulla differenza gaussiana (DoG) viene utilizzato per estrarre macchie dall'immagine modificata nello spazio in scala. Può approssimare le prestazioni dell'operatore laplaciano ed è ampiamente discusso nella maggior parte della letteratura sulla visione artificiale. La particolarità di questo metodo è che può essere calcolato tramite la differenza tra due immagini gaussiane levigate, il che rende più efficace il rilevamento delle macchie.
Considerando il determinante della matrice hessiana normalizzata in base alla scala, siamo in grado di ottenere un nuovo metodo di rilevamento delle macchie. Questo metodo può quindi essere utilizzato per la selezione automatica della scala e funziona bene anche in risposta ai punti di sella. Inoltre, il metodo proposto funziona meglio dell'operatore laplaciano tradizionale nella selezione della scala in caso di trasformazioni affini non euclidee.
Nello studio del rilevamento di blob, alcuni hanno proposto un operatore ibrido di Laplace e determinante hessiano. Questo metodo combina i vantaggi della selezione dello spazio e della selezione della scala ed è stato applicato a molti campi, quali il confronto delle immagini, il riconoscimento degli oggetti e l'analisi delle texture.
Considerando che l'immagine di input può essere influenzata dalla distorsione prospettica, lo sviluppo di un rilevatore di blob che sia invariante alle trasformazioni affini è naturalmente diventato un punto caldo della ricerca. Il fulcro di questo metodo è eseguire una regolazione affine della forma sul descrittore del blob per ottenere blob in ambienti più complessi. Queste versioni adattate in modo affine del metodo di Laplace, del metodo DoG e del determinante hessiano forniscono risultati di rilevamento più stabili.
È importante notare che gli operatori del determinante hessiano sono stati estesi al dominio spazio-tempo. Un'espressione differenziale avanzata normalizzata in base alla scala offre nuove possibilità per il rilevamento di blob, rendendo più comune l'identificazione di blob nei processi dinamici.
Tra questi progressi, possiamo osservare l'impatto trasformativo della tecnologia di rilevamento dei blob sulla visione artificiale. Oggi, l'individuazione di blob non solo eccelle nelle immagini statiche, ma sta diventando sempre più importante anche nei video e nella cattura di processi dinamici con l'avvento dell'analisi spaziotemporale. Tuttavia, ci sono ancora molte sfide da risolvere in questo campo in futuro. Come affrontare al meglio queste sfide potrebbe essere il nostro prossimo argomento importante?