Depuis sa première introduction en 2020, les champs de rayonnement neuronal (NeRF), en tant que méthode basée sur l'apprentissage profond, sont progressivement devenus une technologie clé pour la reconstruction de scènes 3D. Il peut récupérer une représentation de scène tridimensionnelle à partir d'images 2D et montre un grand potentiel dans des domaines tels que l'infographie et la création de contenu. NeRF n'est pas seulement adapté à la synthèse de nouvelles perspectives, mais peut également reconstruire la géométrie de la scène et obtenir les propriétés réfléchissantes de la scène. Bien que cette technologie comporte ses défis, les innovations qu’elle permet sont sans aucun doute passionnantes.
Le cœur de l’algorithme NeRF est de représenter la scène comme un champ de rayonnement paramétré par un réseau neuronal profond. Ce réseau prédit la densité volumique et la luminosité dépendante de la vue en fonction des coordonnées spatiales (x, y, z) et des angles de vision (θ, Φ). Les techniques traditionnelles de rendu de volume génèrent des images grâce à de multiples échantillonnages le long des rayons de la caméra.
Pour entraîner un modèle NeRF, vous devez d’abord collecter des images de la scène sous différents angles et les poses de caméra correspondantes. Ces images ne nécessitent pas d’équipement photographique spécialisé ; n’importe quel appareil photo peut générer un ensemble de données à condition que les paramètres et les méthodes de capture répondent aux exigences de Structure from Motion (SfM). Les chercheurs évaluent souvent NeRF et les techniques associées à l’aide de données synthétiques qui reproduisent avec précision les images et les poses de caméra.
À chaque point de vue clairsemé (image et pose de la caméra), un rayon de caméra est parcouru à travers la scène, générant un ensemble de points 3D avec une direction rayonnante spécifique. Ensuite, pour ces points, un perceptron multicouche (MLP) est utilisé pour prédire la densité volumique et le rayonnement. Ce processus entièrement différentiable permet de minimiser l’erreur entre les images prédites et originales via la descente de gradient, permettant au MLP de développer un modèle cohérent de la scène.
Les premières versions de NeRF étaient lentes à optimiser et nécessitaient que toutes les vues d'entrée soient prises dans les mêmes conditions d'éclairage. Depuis 2020, de nombreuses améliorations ont été appliquées à l'algorithme NeRF pour l'adapter à des scénarios d'utilisation spécifiques. Cela inclut l’introduction de cartes de caractéristiques de Fourier, qui accélèrent la formation et améliorent la précision de l’image.
Les cartes propres de Fourier peuvent rapidement converger vers des fonctions haute fréquence, améliorant ainsi considérablement les détails de l'image.
En raison de la dépendance de NeRF à des poses de caméra précises, les imperfections introduites lors de sa formation affecteront les résultats finaux. À cette fin, la technologie Bundle-Adjusting Neural Radiance Field (BARF) a été développée pour optimiser la fonction de pose et de volume de la caméra et améliorer la qualité du rendu. De plus, grâce à une variété de nouvelles techniques, telles que la représentation multi-échelle et l’initialisation de l’apprentissage, les chercheurs continuent de surmonter les défis de NeRF dans la représentation détaillée.
À mesure que la technologie NeRF devient plus populaire, son champ d’application s’élargit également. De la création de contenu à l’imagerie médicale, NeRF a montré son potentiel dans de nombreux secteurs. Dans le domaine de la création de contenu, l’utilisation de la technologie NeRF permet à toute personne disposant d’un équipement photographique de créer des environnements tridimensionnels réalistes, réduisant considérablement le seuil d’entrée.
Le développement de NeRF ne se limite pas au niveau technique. À l'avenir, il pourrait être intégré dans davantage de scénarios d'application pour offrir une expérience visuelle de meilleure qualité. Et avec le développement de cette architecture d’apprentissage profond, il y aura de plus en plus de changements et de défis à surmonter. NeRF peut-il mener une nouvelle vague de révolution visuelle ?