大卫·马尔(David Marr)是一位在视觉处理领域具有重大影响力的英国神经科学家。他提出的视觉系统运作理论不仅改变了我们对视觉的理解,也为计算神经科学的兴起奠定了基础。在马尔看来,理解视觉需要经历三个明确且互补的分析层次,即计算层次、算法层次和实现层次。
马尔曾指出,最重要的设计系统层次是计算层次,因为它关注系统所需解决的问题及其解决方案。
马尔将视觉描述为一个处理系统,从二维的视网膜图像到三维世界的完整描绘。他的三个视觉处理阶段包括根据场景的特征组成进行的初步草图、包含纹理的2.5D草图及最终的三维模型。在初步草图阶段,我们提取场景的基本元素,例如边缘和区域,这类似于艺术家迅速绘制的素描。
2.5D草图阶段则论及物体的深度和纹理,这反映了人类视觉系统如何透过立体视觉、视觉运动和聚焦来构建对环境的理解。
最终,马尔的三维模型将资讯结合成一个连续的三维地图,让我们能够全面把握环境。这些阶段有助于帮助我们理解如何从最基础的视觉数据生成更复杂的空间认知。
然而,马尔所提出的视觉处理模型在某种程度上无法完全描述视觉注意力的核心阶段。最近的研究则提出了一个新的视觉处理模型,认为视觉过程可被划分为编码、选择和解码三个阶段。编码阶段是将视觉输入(例如视网膜的神经活动)进行采样和表征;选择阶段是选出少量重要的输入信息,以便进一步处理;解码阶段则是识别选定的输入信号,例如判断面前的人脸。
马尔的这些理论在视觉科学和神经科学的研究中继续产生深远影响,并且对算法视觉及人工智能的发展起到了催化作用。这也再次证明了他的一个观点:理解大脑的运作需要对其面临的问题及其找到的解决方案进行深入研究。
他强调,理解神经系统的运作至关重要,而这也是他在研究中所推崇的观点之一。
马尔的研究展示了跨学科的强大力量,他在心理学、人工智能以及神经生理学中的成果,融合创新的模型得以解释视觉处理的过程。这一切的成就最终集中在他的著作《视觉:人类视觉信息的计算研究》中,该书于1982年出版,对计算神经科学的快速成长起到了重要的推动作用。
随着他在重视特定问题的探讨中作出的贡献,马尔的思维方式对现今的科学研究仍然具有启发性和指导意义。未来我们是否能充分理解三维世界中的视觉处理过程,并将此应用于更广泛的人工智慧领域?