视觉心理学在计算机视觉中的应用研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:jianglihongnj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉心理学与计算机视觉交叉融合是近年来一个非常活跃的研究方向,其基本思路是借鉴人类视觉系统的感知规律来解决计算机视觉问题。迄今为止,大多数研究成果仅是应用视觉心理学某方面的结论来对计算机视觉的具体问题进行研究,而对两者交叉融合缺少理论性与规律性探讨。所以本文从整体上对视觉心理学在计算机视觉中的应用进行系统研究,主要工作归纳如下: 首先,对视觉心理学各学派的观点进行了梳理,找出了有利于解决计算机视觉问题的视觉心理学结论。这是整个研究工作的基础。 其次,提出了基于视觉心理学的图像语义模型。重新界定了图像语义的含义,定义了图像语言的基元与语法、总结了人类视觉系统的推理机制及其特点,并提出了语义提取算法的主要步骤。实例表明此模型是可行的、有效的。 第三,对大小恒常性进行了定量计算研究,提出了图像物体大小恒常性变换的计算方法,实验表明这个方法是有效的。这项工作是应用视觉心理学理论指导计算机视觉问题研究的完整实例,它涉及心理学框架提取、定性问题定量化描述、算法设计、程序实现等过程。 第四,在视觉心理学的启示下,从几何光学出发,提出了单幅二维图像深度计算模型,推导出了各像点深度的计算公式。实验表明这个模型与计算公式是有效的。这项工作是大小恒常性计算的关键。 第五,在图像深度计算模型的基础上,提出了单幅二维图像三维重建模型,并从几何光学出发,推导出了各像点对应场景点的三维坐标计算公式。这是对人类视觉系统单幅二维图像三维重建机制的模拟。 第六,通过分析计算机视觉算法评价的特点与难点,提出了基于视觉心理学的计算机视觉算法定性评价原则及它的具体使用步骤。对一些典型计算机视觉算法,与实验评价结果相比较,演示了该原则的可行性与有效性。 最后,在理论分析与实证研究的基础上,结合他人在这方面的研究成果,对视觉心理学在计算机视觉中应用的主要理论问题进行了初步探讨。
其他文献
当前,我们处在一个瞬息万变的互联网时代。近几年来,以SNS、微博、微信等为代表的新型网络社交工具迅速崛起,各自拥有了数量巨大的用户群体。微博凭借着实时性强,内容简练(14
随着流媒体技术的发展,人们对路由的服务质量(QoS,Quality of Service)提出了更为严格的要求,其中包含对诸如带宽、延迟、延迟抖动、代价等综合因素的考虑。如何在满足QoS要
海量数据聚集算法是在线联机分析处理(Online Analytical Processing,简称OLAP)的核心问题。OLAP旨在处理涉及到商业智能的数据,这是一类非常重要而又异常复杂的问题。OLAP利
P2P技术在文件共享、分布式计算和存储等方面取得了巨大成功,已经成为当前网络应用的热门技术。P2P网络节点间一般通过私有消息格式实现通信,使得P2P软件间互通性和兼容性很
随着现代制造业和虚拟样机工程的发展,工程的复杂性在不断增加。任务层次复杂,参与人员众多,各种资源的种类、数目也更加繁多。而面向虚拟样机工程的项目管理技术通过控制进度、
随着网络的日益普及和网络黑客与病毒的泛滥,网络安全问题日益突出。入侵检测技术是目前计算机安全领域的一个研究热点,而基于免疫原理的入侵检测技术是其发展的新方向,提供
网格的发展和广泛应用使得各种计算资源得到了更大程度的利用,结合成都理工大学计算资源的现状以及学校科研、教学对高性能计算的迫切需要,本文依据建设校园网格及其管理的需求
二十世纪九十年代以来,网格计算(Grid Computing)作为分布式计算的新兴研究方向,从无到有,由弱到强,现在已经成为分布式计算领域中的一个重要分支,它将在未来的社会中将发挥
SM2是使用椭圆曲线加密(ECC)的一种密码学标准,而ECC是1985年提出的一种公钥密码算法。与主流加密算法如RSA算法相比,ECC算法具有安全性能高、计算量小、处理速度快等特点。
P2P数据库系统有着较高的可靠性,适于地域分散的集团、机关、银行等机构和部门,有着广泛的用途和应用前景。P2P数据库系统没有中心服务器,各数据库节点具有对等性,相应的,其