В мире цифровой обработки изображений точное определение особенностей изображений, несомненно, является привлекательной задачей.
В компьютерном зрении методы обнаружения пятен на изображениях направлены на обнаружение областей, которые отличаются по свойствам (например, яркости или цвету) от окружающих областей. Эти пятна представляют собой области изображения, определенные свойства которых примерно постоянны, и все точки в этих областях можно считать в некотором смысле похожими друг на друга. Самый распространенный метод обнаружения пятен использует методы свертки. В зависимости от рассматриваемых характеристик основные детекторы спеклов можно разделить на две категории: разностные методы, основанные на производных, и методы, основанные на локальных экстремумах.
Одной из основных мотиваций исследований и разработок детекторов капель является предоставление дополнительной информации об областях, которую невозможно получить с помощью детекторов краев или углов. В прошлых исследованиях обнаружение капель использовалось для получения областей интереса, необходимых для дальнейшей обработки, которые можно использовать для распознавания объектов или отслеживания объектов. В последнее время дескрипторы больших двоичных объектов также все чаще используются для широкомасштабного стереосопоставления и распознавания объектов внешнего вида на основе статистики изображений.
Наличие пятен не только указывает на существование объекта, но и способствует более глубокому пониманию содержания изображения.
Одним из самых ранних и наиболее распространенных детекторов капель является Лапласиан Гаусса (LoG). Свертывая изображение с помощью ядра Гаусса в определенном масштабе, мы можем получить представление изображения в масштабном пространстве. Затем для дальнейшей обработки изображения применяется оператор Лапласа. Этот процесс обычно вызывает сильную реакцию, когда темные пятна (темные области) имеют высокое качество, и сильную отрицательную реакцию, когда яркие пятна (светлые области) имеют высокое качество.
Когда этот оператор применяется в одном масштабе, ответ сильно зависит от размера структуры blob в изображении и размера ядра Гаусса, используемого для предварительного сглаживания. Поэтому для автоматического захвата на изображении пятен разных (неизвестных) размеров становится необходимым многомасштабный подход. Рассматривая нормированный по масштабу оператор Лапласа, мы можем обнаруживать максимумы и минимумы в масштабном пространстве, тем самым эффективно обнаруживая пятна.
Эти технологии не только используются в текущих исследованиях в области распознавания объектов, но также играют важную роль в анализе текстур и сопоставлении изображений.
Помимо метода Лапласа, в настоящее время широко используется аналогичный метод разности Гаусса (DoG). Этот метод основан на разнице между двумя сглаженными по Гауссу изображениями, тем самым аппроксимируя оператор Лапласа. Эта технология широко используется в алгоритме SIFT (масштабно-инвариантное преобразование признаков) и стала эффективным инструментом обнаружения пятен.
Поведение масштабной регуляризации оператора Гессе также получило широкое внимание. Расширив матрицу Гессиана, мы можем получить новый детектор капель, который лучше справляется с неоднородными аффинными преобразованиями. По сравнению с оператором Лапласа, оператор Гессе имеет превосходные свойства выбора масштаба и может достичь лучших результатов при сопоставлении изображений.
Развитие этих технологий показывает важность обнаружения пятен в современной обработке изображений и напоминает нам о необходимости продолжать изучать более совершенные методы.
В совокупности сочетание лапласова, гауссова и других связанных методов демонстрирует значительный прогресс в обнаружении пятен в компьютерном зрении. В области обработки изображений обнаружение скрытых особенностей в непредсказуемой визуальной информации всегда является темой, заслуживающей углубленного рассмотрения.