论文部分内容阅读
图像分类技术是计算机视觉领域最为重要的研究课题之一。随着数字成像设备的广泛应用,图像分类技术在日常生活、医疗、商业、安防和军事中已经扮演着不可或缺的角色。由于成像角度、成像环境的变化以及目标运动和噪声等因素的影响,同类图像之间的变化非常大而不同类图像之间的差异往往又不明显。这使图像分类问题具有非常高的挑战性。本文首先提出了Log-Euclidean黎曼框架下的图像局部特征提取方法。该方法在图像的每一个像素点上计算一个协方差矩阵,并通过矩阵对数运算将其映射到欧氏空间,然后利用传统欧氏空间的方法对提出的局部特征进行统计建模。本文提出基于Log-Euclidean的核函数方法,将协方差矩阵空间映射到可再生核希尔伯特空间,以解决协方差矩阵的稀疏表达和字典学习问题。图像匹配在图像分类中扮演着重要的角色,本文提出一种新颖的EMD方法用于基于混合高斯模型的图像匹配。论文利用稀疏表达Earth Mover’s Distance(SR-EMD)比较混合高斯模型,并开发了一种有效的测度学习方法进一步提升EMD方法的性能。最后,为了克服传统基于成对约束的测度学习算法使用固定边界约束的局限性,提出一种收缩扩张自适应约束用于基于成对约束测度学习算法中。论文使用了10多个图像数据库评价所提出的图像分类方法的性能,总图像数超过了200000幅。同时将提出的方法应用到了多种图像分类任务,例如纹理分类、场景分类、人脸验证以及与图像分类密切相关的图像检索。与同类方法相比本文提出的方法具有更好的性能。