Объединение данных — это процесс интеграции нескольких источников данных для получения более последовательной, точной и полезной информации, чем может предоставить любой отдельный источник. С развитием технологии слияния данных сфера ее применения расширилась от традиционных областей до географических информационных систем (ГИС) и стала важным инструментом научных исследований. р>
Процесс слияния данных обычно классифицируется как низкий, средний или высокий уровень в зависимости от этапа обработки, на котором происходит слияние. р>
Низкоуровневое слияние данных объединяет несколько источников необработанных данных для генерации новых необработанных данных. Ожидается, что в этом процессе объединенные данные дадут более информативные результаты, чем исходные входные данные. Например, слияние датчиков — это подмножество слияния данных, аналогичное тому, как люди и животные интегрируют информацию от нескольких органов чувств для повышения выживаемости. р>
Очевидно, что предыдущие модели слияния данных больше не могут удовлетворить текущие сложные информационные потребности. В середине 1980-х годов Joint Laboratory Directors Group создала группу по слиянию данных. С развитием Интернета слияние данных не ограничивается интеграцией данных датчиков, но также включает в себя слияние информации. Модель JDL/DFIG разделяет различные процессы обработки данных на несколько уровней, чтобы более четко понять эффект объединения данных. р>
Хотя эти модели имеют определенную прикладную ценность для визуализации слияния данных и способствуют обсуждению и достижению консенсуса, они по-прежнему подвергаются критике, особенно применительно к взаимодействию человека и компьютера. р>В настоящее время модель Data Fusion Information Group (DFIG) разделена на шесть уровней: предварительная обработка источника, оценка объекта, оценка ситуации, оценка воздействия, уточнение процесса и уточнение пользователя. р>
В области ГИС слияние данных часто является синонимом интеграции данных. В этих приложениях очень важно объединить различные разнородные наборы данных в единый набор данных, содержащий все точки данных и временные шаги. Объединенный набор данных отличается от простой коллекции, поскольку объединенные точки данных имеют атрибуты и метаданные, которые могут не быть включены в исходный набор данных. Например, с помощью слияния данных исследователи могут объединять данные о слежении за животными с данными о морской среде обитания, чтобы изучать взаимодействие между поведением животных и факторами окружающей среды. р>
У берегов Тасмании программное обеспечение для слияния данных использовалось для объединения данных отслеживания южного лангуста с данными об окружающей среде с целью создания четырехмерного изображения поведения лангуста. р>
Благодаря этому процессу ученые могут определить ключевые места и периоды в окружающей среде и получить более глубокое понимание экосистемы. р>
За пределами ГИС концепции интеграции данных и слияния данных немного отличаются. В таких областях, как бизнес-аналитика, интеграция данных часто используется для описания объединения данных, в то время как слияние данных относится к сокращению или замене, которые происходят после интеграции. Интеграцию данных можно рассматривать как объединение наборов, тогда как слияние — это метод повышения эффективности. р>
В технологии отслеживания дорожного движения данные с разных сенсорных технологий можно объединять для точного определения состояния дорожного движения. Методы слияния данных с использованием акустических, визуальных и сенсорных данных, собранных вдоль дороги, показали свою эффективность, используя сильные стороны каждого отдельного метода. р>
Кроме того, в некоторых случаях географически распределенные датчики подвержены ограничениям по мощности и полосе пропускания. Это приводит к тому, что необработанные данные часто передаются всего несколькими битами, и в этом случае центр обработки решений отвечает за интеграцию двоичных решений, отправляемых датчиками, для повышения эффективности классификации. р>
В области слияния данных также были разработаны новые статистические методы, такие как байесовский авторегрессионный гауссовский процесс и полупараметрическая оценка, что способствует развитию слияния данных. р>
Эти методы позволяют эффективно оценивать результаты, полученные из нескольких источников данных, обеспечивая более надежную основу для научных исследований. р>
В современном мире, где все основано на данных, объединение данных в ГИС не только обеспечивает критически важную информацию об окружающей среде, но и стимулирует дальнейшие научные открытия и понимание. Сможем ли мы найти новые способы решения будущих задач в ходе непрерывного развития технологии слияния данных?