论文部分内容阅读
多示例图像检索技术是近十年来模式识别在图像检索中的一个新兴应用研究课题,近年来多示例图像检索系统已经可以较为准确的在某些限定的条件下对图像进行识别,随着应用范围的不断扩展,受到越来越多企业和单位的重视。现在,多示例图像检索技术已经在图像预处理、区域级图像标注、标准图像库检索、人脸识别等领域显现了巨大的应用价值。随着多示例图像检索技术的应用越来越广泛,人们对于该技术实用性的要求则变得越来越严格。虽然现今的大多数算法已经可以在较为固定的环境下对图像进行较为正确的处理,但实际使用过程中,由于受到种种因素的影响,图像处理的精度仍然不能满足实际的要求。本文针对上述问题进行深入研究,并取得了如下成果:1、通过Html标签影响因子,有效提升了Web图像检索效率Web图像处于不同html标签对中心思想具有不同影响,如果能推导出标签对内容的影响,并将影响因子代入到图像检索算法中,将能提升算法效率。基于这种考虑,本文提出了ttf(标引词标签频率)和itf(逆标签频率)等定义,构造出文挡的矩阵表示,并抽取每个文档的特定行(代表某个html标签)构成新的向量集,根据这个新集合中各个行向量到质心的平均距离,就能得出标签的影响因子。我们把这种辅助技术应用到VSM算法中,建立起需求和待检索目标的关联,实验表明影响因子可有效标定图片的关联程度,对提升图像检索的查准率有较好的效果。2、利用多示例技术,将关键字有效标注在图像分割区域上普通标注只将关键字标注在图像(包)上,而多示例技术需要在图像区域上给予明确的关键字标注。此外,区域(示例)上关键字的唯一性对识别准确而言也尤为重要,剔除近义词的干扰成为一个迫切的需求。为了解决这些问题,在模糊支持向量机算法的基础上提出了自适应模糊支持向量机多示例学习算法(AFSVM-MIL)。该方法利用AFSVM-MIL对训练集进行分类,结合包之间的相似性度量进行集合运算,可以有效的将关键字下沉到示例上,从而达到减少人工标注量的目的。实验表明,算法自适应能力强,标注准确性高,关键词标注和区域(示例)一一对应。3、对基于Hausdorff距离的多示例图像检索技术进行了深入研究和改进Hausdorff距离没有考虑示例向量的权值;已有基于Hausdorff距离的多示例图像检索算法要么对孤立点很敏感,要么只考虑到包间距离最近的2个示例的极端情况。故对此做出改进,提出了两种获得示例权值的方法,并依此设计了据权值调整距离的混合Hausdorff算法,将其应用在k均值算法中。实验证明,该模型比使用最小、最大Hausdorff距离的k均值算法,在对图像的查准率上有了显著提升。4、提出了融合快速EMD-MIL框架,将多示例应用到人脸识别领域,提升了识别效率人脸识别的难点之一是光照、角度及缺少整体性考虑等情况;传统EMD比较适合多示例图像检索,但距离寻优路径较长。为解决上述问题,提出了基于EMD距离的快速融合特征多示例人脸识别算法:引入融合多示例技术及距离阈值,减少异常示例的产生并对超过阈值的示例予以平滑处理;将人脸五官之三结合整体示例为模版构建四示例的一一匹配,提出了融合快速EMD-MIL框架,缩短了寻优遍历路径。比对实验表明,该算法执行效率和分类准确性优于其他同类算法,是多示例技术在人脸识别中的创新性应用。5、用示例股权的方式解决了传统多示例在人脸识别中的应用困境,并提出局部及整体股权的优选方法,解决了全局和局部特征配比,提升了人脸识别效率多示例的一票通过制在人脸识别中易导致误判,因为单独的五官之一相似并不代表两幅人脸相似。而传统的局部整体融合方式,其比例选择方式亟待优化。为此改进了传统框架,首先根据样本特性提出了示例股权的概念和计算方式,不同示例的二值属性按股权配比后,可以形成包的类别概率;其次引入了整体特性作为特殊示例,提出了整体和局部股权的优选方式,并引入了阈值控制配比,控制异常点产生,提升识别率。比对实验表明,该算法分类准确性优于传统算法。