Unter Datenfusion versteht man den Prozess der Integration mehrerer Datenquellen, um konsistentere, genauere und nützlichere Informationen zu erzeugen, als eine einzelne Quelle liefern kann. Mit der Weiterentwicklung der Datenfusionstechnologie hat sich ihr Anwendungsbereich von traditionellen Bereichen auf geografische Informationssysteme (GIS) ausgeweitet und sie ist zu einem wichtigen Werkzeug für die wissenschaftliche Erforschung geworden.
Der Datenfusionsprozess wird üblicherweise als niedrig-, mittel- oder hochstufig klassifiziert, abhängig von der Verarbeitungsphase, in der die Fusion stattfindet.
Bei der Low-Level-Datenfusion werden mehrere Rohdatenquellen kombiniert, um neue Rohdaten zu erzeugen. Dabei wird erwartet, dass die fusionierten Daten aussagekräftigere Ergebnisse liefern als die ursprünglichen Eingabedaten. Beispielsweise ist die Sensorfusion ein Teilbereich der Datenfusion, ähnlich der Art und Weise, wie Menschen und Tiere Informationen aus mehreren Sinnen integrieren, um ihre Überlebenschancen zu verbessern.
Offensichtlich können die bisherigen Datenfusionsmodelle den aktuellen komplexen Informationsanforderungen nicht mehr gerecht werden. Mitte der 1980er Jahre gründete die Joint Laboratory Directors Group eine Datenfusionsgruppe. Mit dem Aufkommen des Internets beschränkt sich die Datenfusion nicht mehr auf die Integration von Sensordaten, sondern umfasst auch die Informationsfusion. Das JDL/DFIG-Modell unterteilt verschiedene Datenverarbeitungsprozesse in mehrere Ebenen, um die Wirkung der Datenfusion klarer zu verstehen.
Obwohl diese Modelle einen gewissen Anwendungswert in der Datenfusionsvisualisierung haben und Diskussionen und Konsens fördern, werden sie weiterhin kritisiert, insbesondere im Umgang mit der Mensch-Computer-Interaktion.Derzeit ist das Modell der Data Fusion Information Group (DFIG) in sechs Ebenen unterteilt: Quellenvorverarbeitung, Objektbewertung, Situationsbewertung, Auswirkungsbewertung, Prozessverfeinerung und Benutzerverfeinerung.
Im GIS-Bereich wird Datenfusion oft synonym mit Datenintegration verwendet. Bei diesen Anwendungen ist es sehr wichtig, verschiedene Datensätze zu einem einheitlichen Datensatz zu kombinieren, der alle Datenpunkte und Zeitschritte enthält. Ein fusionierter Datensatz unterscheidet sich von einer einfachen Sammlung, da die fusionierten Datenpunkte Attribute und Metadaten aufweisen, die im ursprünglichen Datensatz möglicherweise nicht enthalten sind. Durch die Datenfusion können Forscher beispielsweise Daten zur Tierverfolgung mit Daten zum Meereslebensraum kombinieren, um die Wechselwirkung zwischen Tierverhalten und Umweltfaktoren zu erforschen.
Vor der Küste Tasmaniens wurde eine Datenfusionssoftware eingesetzt, um Trackingdaten des Südlichen Langusten mit Umweltdaten zu kombinieren und so ein vierdimensionales Bild des Verhaltens der Langusten zu erstellen.
Durch diesen Prozess sind Wissenschaftler in der Lage, wichtige Orte und Zeiten in der Umwelt zu identifizieren und ein tieferes Verständnis des Ökosystems zu erlangen.
Außerhalb von GIS unterscheiden sich die Konzepte der Datenintegration und Datenfusion leicht. In Bereichen wie Business Intelligence wird der Begriff „Datenintegration“ häufig verwendet, um die Kombination von Daten zu beschreiben, während sich „Datenfusion“ auf die Reduzierung oder Substitution bezieht, die nach der Integration erfolgt. Datenintegration kann als Kombination von Mengen betrachtet werden, während Fusion eine Technik zur Verbesserung der Effizienz ist.
In der Verkehrssensorik können Daten aus verschiedenen Sensortechnologien kombiniert werden, um die Verkehrslage präzise zu bestimmen. Methoden zur Datenfusion von entlang der Straße erfassten Akustik-, Bild- und Sensordaten haben sich als effektiv erwiesen, da sie die Stärken jeder einzelnen Methode optimal nutzen.
In manchen Fällen unterliegen geografisch verteilte Sensoren zudem Leistungs- und Bandbreitenbeschränkungen. Dies führt dazu, dass Rohdaten oft in nur wenigen Bits übertragen werden. In diesem Fall ist das Entscheidungsfusionszentrum für die Integration der von den Sensoren gesendeten binären Entscheidungen verantwortlich, um die Klassifizierungsleistung zu verbessern.
Bei der Datenfusion wurden auch neue statistische Methoden wie der Bayessche autoregressive Gauß-Prozess und die semiparametrische Schätzung entwickelt, die die Entwicklung der Datenfusion fördern.
Diese Methoden ermöglichen eine effiziente Schätzung der Ergebnisse über mehrere Datenquellen hinweg und bieten so eine solidere Datengrundlage für wissenschaftliche Untersuchungen.
In der heutigen datengesteuerten Welt bietet die Datenfusion in GIS nicht nur wichtige Erkenntnisse über die Umwelt, sondern fördert auch weitere wissenschaftliche Entdeckungen und Erkenntnisse. Können wir in der kontinuierlichen Weiterentwicklung der Datenfusionstechnologie neue Wege zur Lösung zukünftiger Herausforderungen finden?