论文部分内容阅读
随着多媒体的推广和应用,以及信息和网络技术的发展,产生了大量的各式各样的视觉内容。图像是这些视觉内容中的一个重要的组成部分。它能够直接形象的表达信息。但如何从海量的图像中检索出自己感兴趣的内容成为当前人们面临的一个重要问题。因为传统的基于文本的检索已不能满足人们的需求。基于内容的图像检索正是解决此类问题的一个行之有效的方法。而本文所作的研究正是围绕基于内容的图像检索相关方法的探讨和实验。通过学习器学习训练样本的特性。在测试阶段用学习器对待测数据进行分类。在基于内容的图像检索中,图像的低层特征与高层语义之间一直存在“语义鸿沟”问题,这是一个比较困难的问题。用支持向量机解决语义关联问题是目前研究的热点,支持向量机被认为是统计学理论中一种最具优势的模式识别方法。用支持向量机进行图像分类具有十分优秀的分类性能。然而传统的SVM是一种有监督的学习方法。利用已标记的样本训练分类器,对未知样本进行分类。人们更多的想有效利用大量的未标样本。半监督学习算法的直推向量机(TSVM)正是基于以上的想法设计的。并且本文将主动学习隔入其中,选择对于学习过程中最为有用的样本进行标注,这些样本能够最大程度减少分类误差。本文所作的主要工作如下:1.对基于内容的图像检索进行概述。研究了图像的各种特征以及提取方法。2.关于SVM解决多类分类问题,将“一对多”方法进行改进。提出适合本文实验的多类分类方法。3.运用SVM解决图像中低层特征与高层语义之间的语义关联问题,如何选取核函数,来提高语义关联的性能。并对其中的多特征融合的技术进行实验。实验说明基于多特征的语义分类优于单一特征。4.介绍一种较新颖的半监督学习方法直推式支持向量机(TSVM),本文对半监督学习中引入主动学习的方法进行探索,提出一种基于TSVM与主动学习相融合的算法,并将其应用到小样本图像检索中,对进行相关实验。5.设计了一个基于内容的图像检索的框架,用于对本文所涉及的相关算法进行实验。