In una strada trafficata, una persona si trova di fronte a diversi stimoli visivi e deve interpretare rapidamente le scene circostanti in pochi secondi. Questo processo è chiamato percezione della scena naturale. La percezione della scena naturale si riferisce al processo attraverso il quale un agente (come un essere umano) riceve visivamente e interpreta una scena in un modo naturale di funzionare. Dalle strade trafficate ai prati aperti agli accoglienti soggiorni, queste scene sfidano la nostra attenzione. Questo articolo esplora il modo in cui il cervello esegue l'elaborazione visiva in ambienti rumorosi e rivela il delicato equilibrio tra distrazione e concentrazione.
Il processo di percezione della scena naturale coinvolge una varietà di teorie. Alcune teorie enfatizzano la concentrazione dell'attenzione, mentre altre ritengono che la concentrazione non sia necessaria.
Due principali disaccordi teorici riguardo alla percezione della scena naturale riguardano il ruolo dell'attenzione. Alcuni dei primi modelli consideravano l’attenzione focalizzata e questi modelli tipicamente includevano due fasi di elaborazione visiva. Secondo questi modelli, il primo stadio è privo di attenzione e registra caratteristiche di basso livello come gradienti di luce e buio, movimento e orientamento in modo parallelo. La seconda fase richiede attenzione concentrata e viene utilizzata principalmente per registrare descrizioni di oggetti di alto livello. Questa fase ha una capacità limitata ed è serializzata. Questi modelli sono supportati empiricamente da fenomeni come la cecità da alterazione, la cecità da disattenzione e l’ammiccamento attentivo, che indicano che cambiamenti significativi nell’ambiente vengono spesso trascurati quando l’attenzione visiva è focalizzata su un compito.
Sebbene i primi modelli siano stati ampiamente accettati, con il progredire della ricerca è gradualmente emersa l'ipotesi che richiede attenzione. Questa ipotesi mette in discussione i primi modelli perché le caratteristiche visive di base degli oggetti emergono automaticamente e rapidamente durante la ricerca visiva. Ulteriori esperimenti hanno supportato questa idea, dimostrando che il cervello umano è in grado di classificare in modo rapido e accurato scene naturali che lampeggiano rapidamente.
Il nostro studio rileva che gli esseri umani possono interpretare e classificare accuratamente le immagini naturali anche con tempi di esposizione estremamente brevi, suggerendo che la nostra elaborazione visiva potrebbe non basarsi sull'attenzione focalizzata.
Tuttavia, la ricerca degli ultimi anni ha rimesso in discussione la validità delle prove secondo cui l'attenzione non è necessaria. Ad esempio, uno studio del 2011 di Cohen, Alvarez e Nakayama ha mostrato che i partecipanti hanno sperimentato cecità disattenta durante l'esecuzione di compiti di tracciamento di più oggetti e di presentazione visiva in sequenza rapida. Hanno scoperto che quando il compito principale era sufficientemente impegnativo, la percezione delle scene naturali da parte dei partecipanti era significativamente compromessa. Ciò suggerisce che i compiti utilizzati negli studi precedenti potrebbero non essere sufficienti per catturare completamente l’attenzione.
Per la percezione della scena naturale, gli studiosi hanno proposto molti modelli. Tra questi, l'ipotesi proposta da Evans e Treisman nel 2005 afferma che gli esseri umani sono in grado di rilevare rapidamente caratteristiche non legate delle categorie target in modo parallelo. Questa prima fase del processo di percezione della scena naturale forma una rappresentazione globale della scena e può selezionarla continuamente rivisitare i livelli precedenti per un'analisi più dettagliata.
Nella prima fase, il sistema forma una rappresentazione globale della scena, compresi i confini globali e la disposizione dei potenziali oggetti.
Un altro modello importante è la classificazione visiva ultraveloce, che propone un meccanismo di feed-forward automatico in grado di formare rappresentazioni di oggetti di alto livello senza attenzione focalizzata. Questo modello supporta l’idea che molti neuroni mostrano già un alto grado di selettività all’inizio delle risposte visive, suggerendo che i meccanismi di feedback potrebbero non essere necessari per aumentare la selettività della risposta.
La teoria del profilo neurale degli oggetti propone che in una scena affollata, l'occhio umano seleziona inizialmente un numero fisso di oggetti (circa quattro), individua gli oggetti in base alle loro informazioni spaziali e quindi codifica le informazioni dettagliate di questi oggetti. Questa teoria è unica in quanto distingue tra il processo di individuazione degli oggetti e il processo di riconoscimento di questi oggetti e suggerisce che parti del sistema di elaborazione non richiedono attenzione.
Le rappresentazioni di questi oggetti possono essere ampliate nel tempo in base alle caratteristiche e all'identità dell'oggetto.
In che modo il nostro cervello riesce a bilanciare l'attenzione all'ambiente con le sfide della distrazione nelle strade trafficate della vita quotidiana? Forse questo è un problema che dobbiamo esplorare ulteriormente?