在计算机视觉领域中,检测“blob”的方法主要是为了辨识数位图像中区域的性质差异,比如亮度或颜色,与周围区域的对比。以非正式的方式来说,blob 是图像中的一个区域,在这个区域内某些性质是恒定或近似恒定的;在某种意义上,blob 内的所有点可以被视为彼此相似。这种检测技术的重要性在于它可以提供不同于边缘检测或角落检测的补充信息。
“早期的研究中,blob 检测被用来获取进一步处理的兴趣区域,这些区域可能显示图像领域中的物体或物体部分。”
Blob 检测通常透过卷积方法进行。根据研究,主要有两种 blob 检测器类别:(i)基于函数导数的微分方法和(ii)基于局部极值的方法,旨在寻找函数的局部最大最小值。这些检测器也可以称为兴趣点操作符,或兴趣区域操作符。了解和发展这些检测器的主要动机之一是,提供关于区域的补充信息,这些信息无法通过边缘或角落检测获得。
blob 检测的应用范围相当广泛,除了物体识别和追踪外,还可以用于直方图分析,进行峰值检测和分段。近年来,blob 描述子在纹理分析和识别、宽基准立体匹配等领域中日益受到青睐,这些描述子可以显示有意义的图像特征,基于当地图像统计进行外观基于的物体辨识。
“在计算机视觉文献中,这种方法被称为差异高斯(DoG)方法,主要用于比例不变特征转换(SIFT)算法。”
Laplace 的高斯方法是最早且最常见的 blob 检测器之一。对于一个输入图像,通过高斯核心进行卷积后,应用 Laplacian 操作符的结果能够辨识图像中的暗色与明亮 blob。当然,这种方法存在着依赖于 blob 结构大小与高斯核大小之间关系的问题。为了解决这一问题,必须采取多尺度的方法,从而自动捕捉图像领域中不同(未知)大小的 blobs。
透过更高阶的技术,例如使用 Hessian 行列式的 blob 检测,研究者进一步提高了 blob 检测的准确度与效率。这种技术可以对局部最大值进行检测,并展示了在使用本方法时,杆状和延长物体的存在。
“这种混合的 Laplace 和 Hessian 行列式操作符已被提出,并广泛应用于图像匹配、物体识别和纹理分析。”
在影像处理系统中,输入的图像不仅遭受平面几何变形,还受到仿射变换的影响。因此,为了获得对仿射变换更具鲁棒性的 blob 描述子,开发了许多新的卷积运算,使其更能适应不同的视角变化。例如,对 Laplacian 和高斯差异运算进行调整,以匹配图像周围的局部结构。
现代的 spatio-temporal blob 检测器则进一步扩展了这些概念,将其应用于时间和空间的联合特征检测,这对于分析运动中的物体特征至关重要。
透过不断地发展与技术探索,我们对于如何在影像中寻找 blob 的机制有了更深的理解。在这个快速发展的计算机视觉领域,未来的 blob 检测技术又将引领我们探索何种新图像特征呢?