La fusione dei dati è il processo di integrazione di più fonti di dati per produrre informazioni più coerenti, accurate e utili di quelle che una singola fonte può fornire. Con il progresso della tecnologia di fusione dei dati, il suo campo di applicazione si è esteso dai campi tradizionali ai sistemi informativi geografici (GIS), diventando uno strumento importante per l'esplorazione scientifica.
Il processo di fusione dei dati è solitamente classificato come di basso, medio o alto livello, a seconda della fase di elaborazione in cui avviene la fusione.
La fusione di dati di basso livello combina diverse fonti di dati grezzi per generare nuovi dati grezzi. In questo processo, ci si aspetta che i dati fusi forniscano risultati più informativi rispetto all'input originale. Ad esempio, la fusione dei sensori è un sottoinsieme della fusione dei dati, simile al modo in cui esseri umani e animali integrano le informazioni provenienti da più sensi per migliorare la sopravvivenza.
Ovviamente, i precedenti modelli di fusione dei dati non sono più in grado di soddisfare le attuali complesse esigenze informative. A metà degli anni '80, il Joint Laboratory Directors Group ha fondato un gruppo di fusione dati. Con l'avvento di Internet, la fusione dati non si limita all'integrazione dei dati dei sensori, ma include anche la fusione delle informazioni. Il modello JDL/DFIG suddivide i diversi processi di elaborazione dei dati in più livelli per comprendere più chiaramente l'effetto della fusione dei dati.
Sebbene questi modelli abbiano un certo valore applicativo nella visualizzazione della fusione dei dati e promuovano la discussione e il consenso, sono ancora criticati, soprattutto quando riguardano l'interazione uomo-computer.Attualmente, il modello Data Fusion Information Group (DFIG) è suddiviso in sei livelli: pre-elaborazione della fonte, valutazione dell'oggetto, valutazione della situazione, valutazione dell'impatto, perfezionamento del processo e perfezionamento dell'utente.
Nel campo dei GIS, la fusione dei dati è spesso sinonimo di integrazione dei dati. In queste applicazioni è molto importante combinare vari set di dati diversi in un set di dati unificato che contenga tutti i punti dati e gli intervalli temporali. Un set di dati fuso è diverso da una semplice raccolta perché i punti dati fusi hanno attributi e metadati che potrebbero non essere inclusi nel set di dati originale. Ad esempio, attraverso la fusione dei dati, i ricercatori possono combinare i dati sul monitoraggio degli animali con i dati sull'habitat marino per esplorare l'interazione tra il comportamento degli animali e i fattori ambientali.
Al largo della costa della Tasmania, è stato utilizzato un software di fusione dati per combinare i dati di tracciamento dell'aragosta di roccia meridionale con i dati ambientali, allo scopo di creare un'immagine quadridimensionale del comportamento di questa specie.
Attraverso questo processo, gli scienziati sono in grado di identificare luoghi e momenti chiave nell'ambiente e di acquisire una comprensione più approfondita dell'ecosistema.
Al di fuori del GIS, i concetti di integrazione e fusione dei dati sono leggermente diversi. In campi come la business intelligence, il termine integrazione dei dati viene spesso utilizzato per descrivere la combinazione di dati, mentre la fusione dei dati si riferisce alla riduzione o alla sostituzione che si verifica dopo l'integrazione. L'integrazione dei dati può essere vista come la combinazione di insiemi, mentre la fusione è una tecnica per migliorare l'efficienza.
Nella tecnologia di rilevamento del traffico, i dati provenienti da diverse tecnologie di rilevamento possono essere combinati per determinare con precisione lo stato del traffico. I metodi di fusione dei dati che utilizzano dati acustici, di immagini e di sensori raccolti lungo la strada hanno dimostrato la loro efficacia, sfruttando i punti di forza di ogni singolo metodo.
Inoltre, in alcuni casi, i sensori distribuiti geograficamente sono soggetti a limitazioni di potenza e larghezza di banda. Ciò comporta che spesso i dati grezzi vengono trasmessi in pochi bit e, in questo caso, il centro di fusione decisionale è responsabile dell'integrazione delle decisioni binarie inviate dai sensori per migliorare le prestazioni di classificazione.
Nella fusione dei dati sono stati sviluppati anche nuovi metodi statistici, come il processo gaussiano autoregressivo bayesiano e la stima semiparametrica, che promuovono lo sviluppo della fusione dei dati.
Questi metodi consentono di stimare in modo efficiente i risultati provenienti da più fonti di dati, fornendo una base di dati più solida per l'esplorazione scientifica.
Nel mondo odierno basato sui dati, la fusione dei dati nei GIS non solo fornisce informazioni fondamentali sull'ambiente, ma stimola anche ulteriori scoperte e comprensioni scientifiche. Possiamo trovare nuovi modi per risolvere le sfide future nella continua evoluzione della tecnologia di fusione dei dati?