Dans une rue très fréquentée, une personne est confrontée à divers stimuli visuels et doit interpréter rapidement les scènes environnantes en quelques secondes. Ce processus est appelé perception naturelle de la scène. La perception d'une scène naturelle fait référence au processus par lequel un agent (tel qu'un humain) reçoit visuellement et interprète une scène de manière naturelle. Des rues animées aux prairies ouvertes en passant par les salons confortables, ces scènes interpellent notre attention. Cet article explore la manière dont le cerveau traite la vision dans des environnements bruyants et révèle l’équilibre délicat entre distraction et concentration.
Le processus de perception d'une scène naturelle implique diverses théories. Certaines théories mettent l'accent sur la concentration de l'attention, tandis que d'autres pensent que la concentration n'est pas nécessaire.
Deux désaccords théoriques majeurs concernant la perception des scènes naturelles concernent le rôle de l'attention. Certains premiers modèles considéraient que l'attention était concentrée et ces modèles comprenaient généralement deux étapes de traitement visuel. Selon ces modèles, la première étape est sans attention et enregistre de manière parallèle des caractéristiques de bas niveau telles que les dégradés de lumière et d’obscurité, le mouvement et l’orientation. La deuxième étape nécessite une attention concentrée et est principalement utilisée pour enregistrer des descriptions d'objets de haut niveau. Cette étape a une capacité limitée et est sérialisée. Ces modèles sont étayés empiriquement par des phénomènes tels que la cécité d'altération, la cécité d'inattention et le clignement des yeux, qui indiquent que des changements importants dans l'environnement sont souvent négligés lorsque l'attention visuelle est concentrée sur une tâche.
Bien que les premiers modèles aient été largement acceptés, à mesure que la recherche progressait, l'hypothèse de l'attention requise a progressivement émergé. Cette hypothèse remet en question les premiers modèles car les caractéristiques visuelles de base des objets émergent automatiquement et rapidement lors de la recherche visuelle. D’autres expériences ont soutenu cette idée, montrant que le cerveau humain est capable de catégoriser rapidement et avec précision les scènes naturelles qui clignotent rapidement.
Notre étude révèle que les humains peuvent interpréter et classer avec précision des images naturelles même avec des temps d'exposition extrêmement courts, ce qui suggère que notre traitement visuel ne repose peut-être pas sur une attention ciblée.
Cependant, les recherches menées ces dernières années ont remis en question la validité des preuves selon lesquelles une attention particulière n'est pas requise. Par exemple, une étude réalisée en 2011 par Cohen, Alvarez et Nakayama a montré que les participants souffraient de cécité inattentionnelle lors de l'exécution de plusieurs tâches de suivi d'objets et de présentation visuelle en séquence rapide. Ils ont constaté que lorsque la tâche principale était suffisamment difficile, la perception des scènes naturelles par les participants était considérablement altérée. Cela suggère que les tâches utilisées dans les études précédentes pourraient ne pas être suffisantes pour capter pleinement l’attention.
Pour la perception des scènes naturelles, les chercheurs ont proposé de nombreux modèles. Parmi elles, l'hypothèse proposée par Evans et Treisman en 2005 affirme que les humains sont capables de détecter rapidement des caractéristiques non liées de catégories cibles de manière parallèle. Cette première étape du processus de perception naturelle de la scène forme une représentation globale de la scène et peut sélectionner de manière continue. revisitez les niveaux précédents pour une analyse plus détaillée.
Dans la première phase, le système forme une représentation globale de la scène, comprenant les limites globales et la disposition des objets potentiels.
Un autre modèle important est la classification visuelle ultra-rapide, qui propose un mécanisme de rétroaction automatique capable de former des représentations d'objets de haut niveau sans attention focalisée. Ce modèle soutient l'idée selon laquelle de nombreux neurones affichent déjà un degré élevé de sélectivité au début des réponses visuelles, ce qui suggère que des mécanismes de rétroaction pourraient ne pas être nécessaires pour augmenter la sélectivité des réponses.
La théorie du profil d'objet neuronal propose que dans une scène bondée, l'œil humain sélectionne initialement un nombre fixe d'objets (environ quatre), individualise les objets en fonction de leurs informations spatiales, puis code les informations détaillées de ces objets. Cette théorie est unique en ce sens qu'elle fait la distinction entre le processus d'individuation des objets et le processus de reconnaissance de ces objets, et suggère que certaines parties du système de traitement ne nécessitent pas d'attention.
Les représentations de ces objets peuvent être étendues au fil du temps en fonction des caractéristiques et de l'identité de l'objet.
Comment notre cerveau parvient-il à équilibrer l'attention portée à l'environnement et les défis de distraction dans les rues animées de la vie quotidienne ? C’est peut-être une question que nous devons approfondir davantage ?