La fusion de données est le processus d’intégration de plusieurs sources de données pour produire des informations plus cohérentes, plus précises et plus utiles que celles que n’importe quelle source unique peut fournir. Avec les progrès de la technologie de fusion de données, son champ d’application s’est élargi des domaines traditionnels aux systèmes d’information géographique (SIG) et est devenu un outil important pour l’exploration scientifique.
Le processus de fusion des données est généralement classé comme de niveau faible, moyen ou élevé, selon l'étape de traitement à laquelle la fusion se produit.
La fusion de données de bas niveau combine plusieurs sources de données brutes pour générer de nouvelles données brutes. Dans ce processus, les données fusionnées devraient fournir des résultats plus informatifs que les données d’origine. Par exemple, la fusion de capteurs est un sous-ensemble de la fusion de données, similaire à la façon dont les humains et les animaux intègrent les informations provenant de plusieurs sens pour améliorer leur capacité de survie.
De toute évidence, les modèles de fusion de données précédents ne peuvent plus répondre aux besoins d’information complexes actuels. Au milieu des années 1980, le Joint Laboratory Directors Group a créé un groupe de fusion de données. Avec l'essor d'Internet, la fusion de données ne se limite plus à l'intégration des données des capteurs, mais inclut également la fusion d'informations. Le modèle JDL/DFIG divise les différents processus de traitement de données en plusieurs niveaux afin de comprendre plus clairement l’effet de la fusion des données.
Bien que ces modèles aient une certaine valeur d’application dans la visualisation de la fusion de données et favorisent la discussion et le consensus, ils sont toujours critiqués, en particulier dans le traitement de l’interaction homme-ordinateur.Actuellement, le modèle Data Fusion Information Group (DFIG) est divisé en six niveaux : prétraitement de la source, évaluation de l’objet, évaluation de la situation, évaluation de l’impact, affinement du processus et affinement de l’utilisateur.
Dans le domaine des SIG, la fusion de données est souvent synonyme d’intégration de données. Dans ces applications, il est très important de combiner différents ensembles de données divers en un ensemble de données unifié contenant tous les points de données et tous les pas de temps. Un ensemble de données fusionné est différent d'une simple collection car les points de données fusionnés ont des attributs et des métadonnées qui peuvent ne pas être inclus dans l'ensemble de données d'origine. Par exemple, grâce à la fusion de données, les chercheurs peuvent combiner les données de suivi des animaux avec les données sur l’habitat marin pour explorer l’interaction entre le comportement animal et les facteurs environnementaux.
Au large des côtes de Tasmanie, un logiciel de fusion de données a été utilisé pour combiner les données de suivi des langoustes du sud avec des données environnementales afin de créer une image en quatre dimensions du comportement des langoustes.
Grâce à ce processus, les scientifiques sont en mesure d’identifier les emplacements et les moments clés de l’environnement et d’acquérir une compréhension plus approfondie de l’écosystème.
En dehors des SIG, les concepts d’intégration et de fusion de données sont légèrement différents. Dans des domaines tels que la veille économique, l’intégration de données est souvent utilisée pour décrire la combinaison de données, tandis que la fusion de données fait référence à la réduction ou à la substitution qui se produit après l’intégration. L’intégration de données peut être considérée comme la combinaison d’ensembles, tandis que la fusion est une technique visant à améliorer l’efficacité.
Dans la technologie de détection du trafic, les données provenant de différentes technologies de détection peuvent être combinées pour déterminer avec précision l'état du trafic. Les méthodes de fusion de données utilisant des données acoustiques, d’images et de capteurs collectées le long de la route ont montré leur efficacité, en tirant parti des points forts de chaque méthode individuelle.
De plus, dans certains cas, les capteurs répartis géographiquement sont soumis à des contraintes de puissance et de bande passante. Il en résulte que les données brutes sont souvent transmises en quelques bits seulement, et dans ce cas, le centre de fusion de décisions est chargé d'intégrer les décisions binaires envoyées par les capteurs pour améliorer les performances de classification.
Dans le domaine de la fusion de données, de nouvelles méthodes statistiques telles que le processus gaussien autorégressif bayésien et l’estimation semi-paramétrique ont également été développées, ce qui favorise le développement de la fusion de données.
Ces méthodes permettent d’estimer efficacement les résultats de plusieurs sources de données, fournissant ainsi une base de données plus solide pour l’exploration scientifique.
Dans le monde actuel axé sur les données, la fusion de données dans les SIG fournit non seulement des informations essentielles sur l'environnement, mais favorise également de nouvelles découvertes et compréhensions scientifiques. Pouvons-nous trouver de nouvelles façons de résoudre les défis futurs dans l’évolution continue de la technologie de fusion de données ?