论文部分内容阅读
随着世界网络化和数字化的快速发展,搜索引擎成为网络用户不可缺少的一部分。基于内容的图像检索由于语义鸿沟,检索出来的图像并不能满足用户的需求。无论使用哪一种特征(颜色、形状、纹理等),运用何种方法进行距离测量,最终两幅图像是否相似由用户决定,为此引入了SVM算法对图像的检索结果进行反馈分类。传统的基于SVM的图像检索方法存在的问题有:将图像样本单纯地分为两类,SVM在分类过程中随意选取核函数,将正样本集和负样本集同等对待,SVM在分类图像之前对存储空间、冗余数据以及算法复杂度等没有进行相应的处理。这势必会给检索结果带来一定地影响,为此针对这些问题提出了两种改进算法。 本文首先提出了第一种改进算法:KRSVM(Support Vector Machine based on K-means and Relief)算法,该算法一方面根据“距离越大,两图像越不相似”的原理来确定初始聚类中心,对颜色矩、颜色直方图、灰度共生矩阵和Hu矩进行K-means聚类,并运用阈值法进行多次聚类,确定聚类个数,从而进一步提高K-means算法的聚合效果,选择冗余少且最具代表性特征信息的图像样本进行检索。另一方面对聚类后的图像检索结果进行SVM分类,用Relief算法给相关图像样本集和不相关图像样本集赋予不同的权重,并将SVM常用的几种核函数结合起来分配权重。运用改进后的SVM方法对图像进行反馈、标记、分类更新,将人机交互反馈特性融入到检索系统中。通过实验结果仿真表明,KRSVM算法对提高图像的检索精度和用户满意度起到积极影响作用。 针对多语义图像在用户图像检索反馈过程中带来的困扰,SVM在图像多分类过程中分类器同等对待等问题,本文提出了第二种改进算法:基于K-means和SVM一对一多分类的图像反馈检索优化算法KWOVOSVM(Weighted One-Versus-One Support Vector Machine based on K-means)。该算法首先运用K-means算法对图像特征进行多次聚类,选取最具代表性特征信息的图像样本供用户反馈,同时在用户反馈过程中,KWOVOSVM算法对其图像样本进行多分类训练时,通过欧式距离计算对每个分类器分配的相对权重,使用户反馈次数减少,图像检索结果不断逼近用户需求。实验仿真表明,KWOVOSVM算法在查准率和满意度上有一定提高。