一种综合先验信息的从自然图像中提取感兴趣物体的新方法

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:cecil666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
感兴趣的物体检测和分割(统称为感兴趣物体的提取)一直是计算机视觉、图像理解和模式识别等研究领域的重要关注点之一。它在物体识别、基于内容的检索、基于内容的图像和视频编码与压缩以及视频监控等等领域有重要的应用。传统的感兴趣物体提取方法常常将感兴趣物体假设为在自然图像正中央的物体,或者是图像中比较显著的物体,这种弱假设往往忽略了感兴趣物体具有主观性的性质,所以适用的范围不大。受人脑处理这一问题所采用的策略的启发,我们提出了基于样本学习的方法定义感兴趣物体,从而避免了原来弱假设所带来的目标模式不清晰的问题,也引出了本文的主要方法。本文提出了一种新颖的从自然图像中提取感兴趣物体的框架。本框架包含两个主要的阶段:(1)学习阶段。此阶段通过样本学习的方法定义感兴趣物体并提取与之相关的先验知识(包括物体形状信息以及物体表观信息)。在此阶段,我们从大致对齐的感兴趣物体的正样本中,学习一个关于此类物体的活动基模型和对应的形状草图模板,同时对物体的表观信息进行统计,获得感兴趣物体的形状和表观先验信息。(2)提取阶段。此阶段将感兴趣物体的先验知识应用到统计推理机制中,综合检测和分割进行感兴趣物体的提取。在此阶段,用学习得到的活动基模型作初步检测以确定候选区域。然后,我们对候选区域进行基于统计马尔科夫链蒙特卡洛推理方法的图像分割,并通过选取具有最大后验概率比的分割结果作为最佳输出结果。本方法中的两个阶段有机的结合在一起,构成了一个整体:在学习阶段获得的先验知识可以使目标模式(感兴趣的物体)更明确,并能指导提取阶段的统计推理过程。因此,该方法能较精确的提取感兴趣的物体。在公共数据集上测试的结果也表明了我们提出的方法表现比当前最好的算法所得到的结果还要好。作为总结,本文的主要创新之处如下:1、提出了一个新的关于感兴趣物体提取问题的框架性解决方案。与传统的依赖弱假设对感兴趣物体位置初始化的方法不同,我们引入了感兴趣物体的先验知识的学习机制,从而清晰的定义了目标模式,提高了感兴趣物体的定位准确度,同时更加符合人脑搜索感兴趣物体的机制。2、提出了一个新颖的用离散草图约束连续区域边界的方法,使近似的衡量基于离散Gabor小波表示的活动基模板与连续的区域边缘轮廓之间的相似性成为可能。3、创造性的将感兴趣物体学习得到的先验知识嵌入先验和似然模型,从而大大提高了基于统计推理的感兴趣物体提取的精确度和计算效率。
其他文献
近年来,随着网络规模的飞速发展,传统的IP网络仅提供“尽力而为”(BestEffort)的服务,对IP包传递的可靠性和时延不提供任何保证,这对只要求准确率而对时延没有严格要求的数据业务
高通量实验产生了大量的蛋白质相互作用数据。相互作用已知的蛋白质相互作用网络能为模体对的预测提供参考信息。但是,从蛋白质相互作用网络寻找模体对仍是一个挑战性问题。高
企业信息系统管理对企业的信息化起着至关重要的作用。但是由于系统受管资源往往源于多个厂商,兼容性得不到保证;企业的业务在其发展过程中也会日趋复杂:同时企业在发展的过
近年来,随着终端智能化和云计算的迅猛发展,移动云计算迎来了它发展的一个契机。在移动云计算环境下,如何实现把用户在一个终端尚未完成的任务或该终端不能完成的任务,高效迅
中文命名实体识别是中文信息处理任务的前提和基础,其中机构名占有相当大的比重,而且是最难识别的一部分,其识别精度还远远达不到实际应用的需要。本文详细研究了中文机构名的识
随着互联网应用的不断深入,电子邮件、电子商务、电子投票等电子通信方式已经广泛深入社会生活的各个领域,为保护用户身份信息的安全与隐私,许多匿名电子系统都把匿名作为系
学位
近几年来,随着移动通信网络的发展,数据传输速率的提高以及带宽的增加,人们对无线视频应用的需求日益增长。但是视频数据经过高压缩后,尽量多的去除了象素之间冗余,并且由于无线信
随着Internet技术的发展和广泛应用,人们获取信息的方式也从传统的书本渐渐转移到了网络,造成网络信息飞速增长,网页数量不断增加,人们查找自己真正需要的信息难度也相应增加
CSCW(Computer System Cooperation Work,CSCW)的核心是构建支持不同协同工作目标的应用系统,如工作流运作系统、办公自动化系统、协同设计系统、跨域业务流程集成等。支持企