基于目标区域的图像检索技术研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:wcj_lp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经过二十多年的发展,解决图像视觉特征与语义特征之间的差异问题已成为基于内容图像检索的研究热点。本文认为获取图像中不同目标的类别和相对位置信息是构建图像“语义特征”的重要基础。为此,深入研究了图像分类和图像多目标区域提取这两个“打好基础”的关键技术,主要研究工作包括:  1、从颜色、纹理、形状和伪语义信息四个方面研究了图像的低层特征。通过在Corel-1k图像库上的分类实验,分析、讨论了各种低层特征对不同类型图像的描述能力,为特征融合和图像分类积累丰富的先验知识。  2、设计实现了三种特征融合方法。其中前两种是“对症下药”的特征级融合方法,该类方法针对图像类型或者图像不同部分的特点选取适合的图像低层特征,再拼接这些特征作为融合特征。第三种是“机器学习”的决策级融合方法。该方法是在图像分类前,选择多种图像低层特征和对应的SVM核函数,然后利用SVM多重核函数学习方法不断调整各种特征的权重以训练出分类效果最优的分类器。本文分别使用三种方法对Corel-1k图像库进行了分类实验,结果表明根据图像特点选择互补性好的特征进行融合可以获得比单一特征更优的图像分类效果。  3、提取图像中多个目标区域。本文首先采用改进的光谱残差法、边缘检测和滑动窗口这三种方法分别提取出图像中候选目标区域,然后利用颜色对比度模型剔除非目标的候选区域,再利用一种新的超像素块模型构造目标区域的评价函数,最后选取评价值较高的候选区域作为最终的目标区域。在Corel-1k图像库上将本文的目标区域提取效果与目前几种先进的算法作了效果对比,并在MSRC-v2图像库上根据手工标注的目标区域进一步测试了本文算法的性能,结果表明本文方法可以有效提取图像中不同尺度的多个目标区域,但是仍有一些不足需要改进。最后,提出了一个三层的图像多目标区域提取框架。前两层结构可以不断融入新方法来提高目标区域提取能力,最后一层结构可自行定义以提取出满足特定需求的目标区域,为构建语义信息打下坚实基础。  本文使用C++,OpenCV,Matlab和SQLServer数据库构建了以上述算法为基础的图像检索系统。
其他文献
随着我国国民生活水平的提高,对于猪肉品质的要求也在不断的提高。影响猪肉品质的因素有很多,在实际检测过程中存在各种各样条件的限制。如何实现对生猪肉质低成本、快速、可靠
软件保护技术是保护软件版权信息的一种技术,它可以增加软件被盗取的难度,识别软件是否被非法复制。软件特征是从软件本身提取出软件的特有属性,作为识别该软件的唯一标记。
随着互联网技术的飞速发展,网络中蕴藏的有价值信息愈来愈多。但各站点提供的信息在数量及质量上都存在巨大的差异。这给人们选取高质量信息带来了困难。搜索引擎技术可以对
云计算所面向的用户群体越来越广泛,需要处理的任务量和数据量非常庞大,使系统时刻处于海量任务处理的忙碌状态,因此如何进行合理的任务调度成为云计算研究领域的核心问题。云计
现代汉语中词语主要分为实词和虚词两大类,其中虚词包含副词、介词、连词、语气词、方位词、助词等。虚词不能充当句法成分,但用法比较复杂多样。同一个虚词在不同的上下文中
视频动态目标检测技术,旨在提取出视频序列中的运动目标,是计算机视觉领域的基础。快速而精确的提取出运动目标,是进行后续研究的前提,比如目标分类、视频跟踪、行为识别等。
随着嵌入式计算、网络通信、海量数据处理等技术的高速发展,感控、计算和通信能力深度嵌入到物理设备中,从而产生了信息物理融合系统(Cyber-PhysicalSystems, CPS)。由于CPS的应
随着计算机科学的广泛应用和互联网技术的快速发展,互联网给我们的生活带来方便的同时,其暴露出来的安全问题也给人们造成了巨大的损失。传统的安全防御技术已无法驾驭复杂多
由于Web应用程序有着诸如系统开发、维护和升级的经济性、提供一致的用户界面、很强的开放性、结构易于扩展性、很强的信息系统集成性和灵活的信息交流与信息发布服务等优点,
前馈神经网络是目前应用最广泛的一种神经网络模型,模糊感知器和Ridge Polynomial神经网络就是这样的两类前馈神经网络。本文对这两类神经网络的学习算法进行研究,分析各自算法