论文部分内容阅读
互联网技术、机器视觉技术和计算机技术近年来发展迅猛,人们生活的方方面面都涌现着数字图像,对其检索、识别和分类也日趋完善。常见的数字图像分类技术是基于文本的,其缺点是效率较低,且无法规范化,人们迫切需要新的数字图像检索和分类技术。最近十几年中,研究人员掌握了大量基于内容的图像检索识别技术,即把对图像的理解转换为通过图像的底层特征来描述两幅甚至多幅图像的相似度。但是,计算机所能理解的图像底层特征完全不同于人类识别图像时所使用的高层特征,传统的基于文本或内容的图像检索识别技术,未将图像的底层特征与高层特征联系起来。因此,为解决“语义鸿沟”,人们逐渐把目光转向基于高层语义特征的图像检索识别技术。本人通过大量的文献阅读和详细的学术调研,提出了本文——“基于高层语义特征的图像检索关键技术研究”。主要研究如下几个方面:1.研究和分析传统的图像语义提取方法和图像语义层次模型,比较其利弊;2.详细研究基于颜色、纹理和形状等底层特征和机器学习方法的图像语义提取算法;3.研究基于改进的特征选择的图像语义检索算法,探索最优特征子集的选择,及与其时空效率的关系;4.研究不同特征子集下SVM的分类性能,并进一步研究增量SVM算法中小样本的选择及其分类效果;5.在以上基础上选择并研究适合于本文的基于高层语义的图像检索关键技术。具体来说,本文阐述了以下内容:第1章:绪论。本章首先介绍了图像检索的研究背景和意义,简要说明了标识、分类、检测和匹配的相似点和区别,然后指出了图像检索的研究现状,给出了基于内容的图像检索系统的流程图,接着介绍了国内外研究图像检索的主要高校、科研院所和主要期刊会议,之后给出了本文最主要的工作和创新点,最后给出了本文的详细组织结构和本章小结。第2章:图像分类和识别。本章首先简要介绍了非监督学习方法的主要思想和关注问题,然后详细说明了其中的概率潜在语义分析方法,包括其概念和步骤。接着本章详细介绍了SVM的原理和步骤以阐述机器学习方法在图像分类和识别中的作用,最后给出了本章小结。第3章:图像检索技术。本章首先简要介绍了三种常见的图像检索技术,即基于文本的图像检索方法、基于内容的图像检索方法和基于语义的图像检索方法,介绍了它们的概念、目的、流程、优缺点及相应的产品。在其中还简要说明了图像文本标注的两个标准:都柏林核心元数据集和MPEG-7。然后详细说明了图像高层语义的层次化表示,给出了图像高层语义层次模型。之后,本章简单介绍了图像语义的两种常用的表示方法:基于信息处理的文本表示和基于人工智能的知识表示,包括其概念、优缺点和主要应用。接着,本章简单介绍了图像高层语义提取的流程、难点和三种常用方法,即基于知识学习的图像语义提取方法、基于人工参与的图像语义提取方法和基于外部知识的图像语义提取方法。在基于知识学习的方法中又详细介绍了有监督的图像分类方法和无监督的图像聚类方法,包括其概念、发展、相互区别和主要应用;在基于人工参与的方法中又简要说明了移动查询点方法和权重调整方法。最后给出本章小结。第4章:基于改进的特征选择和SVM的高层语义图像检索。本章首先指出了特征选择和SVM学习方法在图像检索中的重要性和必要性,接着简要介绍了本章算法所使用的训练库、测试库、相关的实验条件、实验要求、参数和评价指标,然后详细说明了本章选择基于径向核函数的非线性可分SVM学习方法的必要性,并通过相关实验确定了分类器识别效果最优时径向核函数的γ值以及惩罚系数的C值,接着将本章所提出的算法与图像检索常见的传统的SFFS算法在不同维度特征集合(全特征集合、15维、20维、25维、30维、35维和40维特征集合)下训练和检测的SVM分类效果进行比较,通过丰富的实验对比与分析,得到了四点有关特征子集维数、分类器识别效果和训练测试库的重要结论。之后,将本章算法中的SVM学习方法与经典的2D MHMM学习方法在30维特征集合下进行平均识别率的比较,其实验结果显示在Corel图像集中,本章算法整体上优于在2D MHMM方法。以上两个实验证明了本文基于改进的特征选择和SVM的高层语义图像检索算法的有效性和优越性,最后给出了本章小结。第5章:总结与展望。对本文四点主要工作和创新进行总结,并展望了四点本文下一步的研究内容和方向。