论文部分内容阅读
随着计算机和互联网技术的快速发展,在日常生活和科研工作中往往需要处理越来越繁多的图像信息,如图像检索、人脸识别、自然场景检测等。如何快速有效的找出图像的信息,提取图像的特征,提高图像的匹配精度成为了目前研究的重点。另一方面,标记学习的相关研究在近年来也取得了很大的进展,在图像识别方面有着广泛的应用。通过标记图像来定义图像信息,然后选择合适的机器学习的方法对图像进行检索,识别和分类。基于此,本文主要做了以下方面的一些研究。在标记学习方面主要研究的是标记分布学习的知识。作为一种新型的学习范式,标记分布学习能反映出样本中相关标记对于整个样本的重要程度,相对于传统标记学习更具广泛适用性。由于目前标记分布数据集的样本特征数目较少,导致了一些标记学习算法准确度不高。针对这一问题,提出了一种基于Gradient Boost Decision Tree(简称GBDT)的标记分布学习算法(GBDT-LDL)。该算法主要过程是利用GBDT对样本特征进行学习与变换,将变换后得到的新特征与原始特征归一化处理,将混合的特征建立GBDT-LDL模型对未知标记分布进行预测。为检验该算法的预测能力,利用六项标记分布学习的评价指标对比现有经典的标记分布学习算法,实验结果表明GBDT-LDL算法更加理想,并通过统计假设检验的方法,进一步来说明该算法具有良好的预测效果。在图像匹配方面用HOG来提取图像特征,详细介绍了HOG提取图像信息的步骤和优势,并提出了两种提高匹配效果的方法。一种是利用GBDT构建分类器对图像训练预测,另一种是将标记分布运用于余弦相似度度量上来提高预测准确性。通过实验对比了决策树、支持向量机和K近邻来验证两种方法的优势,实验结果反映出标记分布优化余弦相似度的方法效果最好。因此主要对优化余弦相似度的方法的实验方案进行详细的描述与展示,采用ORL人脸数据集来做图像匹配的应用实验,展现该方法的实际应用效果,然后对实验结果的示例图片进行详细的分析,说明标记分布学习能够有效的运用在图像匹配中。