Trong lĩnh vực thị giác máy tính, phương pháp phát hiện "đốm màu" chủ yếu là xác định sự khác biệt về chất của các vùng trong ảnh kỹ thuật số, chẳng hạn như độ sáng hoặc màu sắc, so với các vùng xung quanh. Nói một cách không chính thức, blob là một vùng trong ảnh trong đó một số tính chất là không đổi hoặc gần như không đổi, theo một nghĩa nào đó, tất cả các điểm trong blob có thể được coi là tương tự nhau; Tầm quan trọng của kỹ thuật phát hiện này là nó có thể cung cấp thông tin bổ sung khác với phát hiện cạnh hoặc phát hiện góc.
"Trong các nghiên cứu trước đây, tính năng phát hiện blob được sử dụng để thu được các vùng quan tâm để xử lý tiếp, điều này có thể tiết lộ các đối tượng hoặc các bộ phận của đối tượng trong trường hình ảnh."
Việc phát hiện đốm màu thường được thực hiện thông qua các phương pháp tích chập. Theo nghiên cứu, có hai loại máy dò blob chính: (i) phương pháp vi phân dựa trên đạo hàm và (ii) phương pháp dựa trên cực trị cục bộ, nhằm tìm cực đại và cực tiểu cục bộ của hàm. Những bộ dò tìm này cũng có thể được gọi là toán tử điểm quan tâm hoặc toán tử vùng quan tâm. Một trong những động lực chính để hiểu và phát triển các máy dò này là cung cấp thông tin bổ sung về các vùng không thể thu được thông qua phát hiện cạnh hoặc góc.
Tính năng phát hiện đốm màu có nhiều ứng dụng, ngoài nhận dạng và theo dõi đối tượng, nó còn có thể được sử dụng để phân tích biểu đồ, phát hiện và phân đoạn đỉnh. Trong những năm gần đây, bộ mô tả blob ngày càng trở nên phổ biến trong các lĩnh vực như phân tích và nhận dạng kết cấu, kết hợp âm thanh nổi cơ sở rộng, v.v. Những bộ mô tả này có thể hiển thị các đặc điểm hình ảnh có ý nghĩa và thực hiện nhận dạng đối tượng dựa trên diện mạo dựa trên thống kê hình ảnh cục bộ.
"Trong tài liệu về thị giác máy tính, phương pháp này được gọi là phương pháp khác biệt của Gaussians (DoG) và chủ yếu được sử dụng trong thuật toán Chuyển đổi tính năng bất biến tỷ lệ (SIFT)."
Phương pháp Gaussian của Laplace là một trong những phương pháp phát hiện đốm màu sớm nhất và phổ biến nhất. Đối với hình ảnh đầu vào, kết quả của việc áp dụng toán tử Laplacian sau khi tích chập với nhân Gaussian có thể xác định được các đốm màu tối và sáng trong ảnh. Tất nhiên, cách tiếp cận này gặp phải vấn đề phụ thuộc vào mối quan hệ giữa kích thước của cấu trúc blob và kích thước của nhân Gaussian. Để giải quyết vấn đề này, phải thực hiện một cách tiếp cận đa quy mô để tự động chụp các đốm màu có kích thước khác nhau (không xác định) trong miền hình ảnh.
Thông qua các kỹ thuật cấp cao hơn, chẳng hạn như phát hiện đốm màu bằng cách sử dụng định thức Hessian, các nhà nghiên cứu đã cải thiện hơn nữa độ chính xác và hiệu quả của việc phát hiện đốm màu. Kỹ thuật này cho phép phát hiện cực đại cục bộ và chứng minh sự hiện diện của các vật thể dài và giống hình que bằng phương pháp này.
"Các toán tử xác định Laplace và Hessian lai như vậy đã được đề xuất và sử dụng rộng rãi trong việc so khớp hình ảnh, nhận dạng đối tượng và phân tích kết cấu."
Trong các hệ thống xử lý ảnh, ảnh đầu vào không chỉ chịu biến dạng hình học phẳng mà còn bị ảnh hưởng bởi phép biến đổi affine. Do đó, để có được các bộ mô tả blob mạnh mẽ hơn đối với các phép biến đổi affine, nhiều phép toán tích chập mới được phát triển để làm cho chúng thích ứng hơn với các thay đổi góc nhìn khác nhau. Ví dụ: các phép toán sai phân Laplacian và Gaussian được điều chỉnh để phù hợp với cấu trúc cục bộ xung quanh hình ảnh.
Các máy dò blob không gian-thời gian hiện đại mở rộng các khái niệm này hơn nữa, áp dụng chúng để phát hiện các đặc điểm chung theo thời gian và không gian, điều này rất quan trọng để phân tích các đặc điểm của vật thể đang chuyển động.
Thông qua việc liên tục phát triển và khám phá kỹ thuật, chúng tôi hiểu sâu hơn về cơ chế tìm kiếm các đốm màu trong hình ảnh. Trong lĩnh vực thị giác máy tính đang phát triển nhanh chóng này, công nghệ phát hiện blob trong tương lai sẽ đưa chúng ta khám phá những tính năng hình ảnh mới nào?