论文部分内容阅读
视觉心理学与计算机视觉交叉融合是近年来一个非常活跃的研究方向,其基本思路是借鉴人类视觉系统的感知规律来解决计算机视觉问题。迄今为止,大多数研究成果仅是应用视觉心理学某方面的结论来对计算机视觉的具体问题进行研究,而对两者交叉融合缺少理论性与规律性探讨。所以本文从整体上对视觉心理学在计算机视觉中的应用进行系统研究,主要工作归纳如下:
首先,对视觉心理学各学派的观点进行了梳理,找出了有利于解决计算机视觉问题的视觉心理学结论。这是整个研究工作的基础。
其次,提出了基于视觉心理学的图像语义模型。重新界定了图像语义的含义,定义了图像语言的基元与语法、总结了人类视觉系统的推理机制及其特点,并提出了语义提取算法的主要步骤。实例表明此模型是可行的、有效的。
第三,对大小恒常性进行了定量计算研究,提出了图像物体大小恒常性变换的计算方法,实验表明这个方法是有效的。这项工作是应用视觉心理学理论指导计算机视觉问题研究的完整实例,它涉及心理学框架提取、定性问题定量化描述、算法设计、程序实现等过程。
第四,在视觉心理学的启示下,从几何光学出发,提出了单幅二维图像深度计算模型,推导出了各像点深度的计算公式。实验表明这个模型与计算公式是有效的。这项工作是大小恒常性计算的关键。
第五,在图像深度计算模型的基础上,提出了单幅二维图像三维重建模型,并从几何光学出发,推导出了各像点对应场景点的三维坐标计算公式。这是对人类视觉系统单幅二维图像三维重建机制的模拟。
第六,通过分析计算机视觉算法评价的特点与难点,提出了基于视觉心理学的计算机视觉算法定性评价原则及它的具体使用步骤。对一些典型计算机视觉算法,与实验评价结果相比较,演示了该原则的可行性与有效性。
最后,在理论分析与实证研究的基础上,结合他人在这方面的研究成果,对视觉心理学在计算机视觉中应用的主要理论问题进行了初步探讨。