论文部分内容阅读
当前成像技术的快速发展,使数码相机、可拍照手机等设备日益普及,图像数量飞速增长。同时,互联网的诞生与发展极大地促进了人们之间的信息交流,也使图像传播变得更加方便快捷。事实上,网络的发展也一定程度上促使用户上传更多的网络图像,包括新闻、娱乐等图像。越来越丰富的图像资源使用户难以在浩如烟海的图像数据中找到其真正需要的信息,从而,各类图像检索技术得到了广泛的关注。
基于视觉内容的图像检索在许多领域具有非常重要的作用,如指纹检索、医学图像检索、生物信息检索等等。这类检索的一个关键问题是如何利用用户反馈信息改进检索的结果。由于图像具有巨大的数据量,一般表示为高维空间中的矢量,其索引和检索变得十分困难。所以这类检索的另一重要问题就是如何实现快速有效的相似性比较。当需要处理的图像数目达到上百万甚至上亿张时,快速搜索近似图像将成为非常具有挑战性的任务。
然而,现有的商业化的图像检索系统主要依赖于图像对应的标注信息,随着图像数量的快速增加,手工进行图像标注方法由于消耗太高,已经不能满足人们的需要。所以,自动图像标注方法近些年来已成为了研究热点。目前研究中遇到的问题主要是“语义鸿沟”问题以及巨大的图像数量带来的效率问题等。
本文主要针对图像检索中的自动图像标注以及相关反馈等方面进行研究,主要研究内容和创新之处为:
1.对基于内容的图像检索中的相关反馈技术进行了介绍,重点讨论了基于概念点移动、基于机器学习、基于概率模型三类方法。针对基于概念点移动类方法,改进了原有的一种区域权重学习算法。区域权重在基于区域图像检索系统中很关键。本文通过分析样本空间的分散度,提出了一种新的区域权重学习算法,改进了基于区域图像检索的相关反馈技术。该算法在利用正例样本的同时,有效地利用负例样本去除部分不相关图像,提高了检索性能。实验结果表明该算法可以更好的克服不精确分割问题,鲁棒性更好。
2.针对基于机器学习的反馈技术,将基于多示例学习(Multi-InstanceLearning MIL)的相关反馈(Relevance Feedback RF)技术应用到图像检索系统中去,通过不断的学习用户的查询概念,逐步地提高检索精度。使用有重叠分割方法分割大图像得到子图像区域,将由纹理特征描述的子图像区域作为包中示例,并将大图像作为多示例包。反馈阶段,用户对返回的大图进行是否相关的标注,生成正负包,使用改进的多样密度算法(Diverse Density DD)学习用户的查询概念。试验结果表明改进的多样密度算法可以有效地避免局部最小值,同时还可以降低计算复杂度。
3.传统的自动图像标注统计模型孤立地预测每个语义概念的概率,而没有考虑到各个语义概念之间的联系性。本文提出了一种新的概率方法,该方法将语义概念和视觉特征之间的联系以及语义概念之间的联系很好地结合起来。使用条件概率度量语义概念之间的两种联系,运用CMRM模型计算语义概念和视觉特征之间的联系。在标准Corel图像库上的测试说明了该方法的有效性。
4.本文认为同一幅图像标注中的不同的语义概念存在不同的语义显著性。然而现有大部分自动标注方法及评价策略都平等的看待每个语义概念。我们认为在一幅图像的标注结果中,最显著的语义概念对应的关键词应该是最重要的,在标注和评价中应该重点对待。基于这样的想法,本文介绍了一种区分显著性的评价策略,设计了更加直观的评价参数,并讨论了区分显著性的自动标注方法。