论文部分内容阅读
物体识别和视觉跟踪是当今模式识别和计算机视觉领域中相当活跃的研究方向,其主要研究目的是如何代替人对目标进行自动识别和跟踪。在实际应用中,由于目标的外观多样性、几何变换、光照的变化、遮挡、低分辨率以及噪声等问题所带来的困难,使得物体识别和视觉跟踪任务变得非常具有挑战性,存在很多理论与技术问题需要解决。
当前,统计机器学习算法成功地应用于物体识别和视觉跟踪领域,例如高斯过程模型和核机器等,这些新颖的统计学习技术具有很大的潜力,能够进一步为物体识别和视觉跟踪领域的发展作出贡献。本文主要围绕高斯过程模型从三个方面针对物体识别和视觉跟踪问题进行探讨:
●判别式方法广泛地应用于物体类识别问题,但这些方法通常是非概率的,不能直接对类标的预测提供一种不确定性估计,进而对有限训练数据缺少泛化能力。高斯过程作为一种倍受关注的统计机器学习方法,为核函数的学习提供一种既具有理论基础、又可用于实践的概率模型,可方便地对不确定性进行建模,并在模型的选择、学习和预测方面提供了一个完整的理论框架,其优良的分类性能可广泛地应用于物体类识别问题;
●在监督学习中,高斯过程后验概率不受未标记数据的影响,使得未标记数据并不能影响决策边界的位置。因而针对高斯过程的诸多特性,本文考虑如何把这种监督学习方法有效地扩展到半监督学习框架中去,结合未标记数据信息构建性能更好的分类器,用于物体识别问题:
●跟踪算法通常分为确定性方法和随机性方法。确定性方法虽然快速、效率高,但是其对遮挡问题非常敏感,使得跟踪算法不能够从一个暂时的错误中恢复过来;而随机性方法通过在状态空间中设定假设并对跟踪目标进行概率估计,其更具鲁棒性,具有从暂时错误中恢复的能力。因此,本文考虑把随机性跟踪算法融入到高斯过程模型中,以获取更加鲁棒的视觉跟踪算法。
本文针对物体识别和视觉跟踪问题进行了深入的研究,涉及到监督学习、半监督学习、图谱分解、概率模型的选择和学习、核校准、凸最优化以及非线性回归等关键技术,主要工作和贡献如下:
●提出一种基于高斯过程模型的概率判别式方法,以一种尺度不变的方式,来学习和识别未分割场景中的物体类。首先,采用多尺度的算法选择图像中的显著性区域;再通过PCA-SIFT方法以一种紧凑的方式来描述这些特征点;对每一物体类,区域特征的概率模型通过高斯过程来描述。该算法的主要特点是采用基于显著性和尺度不变性的方法描述物体,并通过高斯过程模型的核函数有效地对数据的不确定性进行建模。实验结果显示了所提出算法的有效性以及高斯过程模型优良的分类性能。
●提出了一种半监督算法用于学习高斯过程分类器,其通过结合非参数的半监督核向分类器提供未标记数据信息。该算法主要包括以下几个方面:(1)通过图拉普拉斯的谱分解获得核矩阵,其联合了标记数据和未标记数据信息;(2)采用凸最优化方法学习核矩阵特征向量的最优权值,构建非参数的半监督核;(3)把半监督核整合到高斯过程模型中,构建所提出的半监督学习算法。该算法的主要特点是把基于整个数据集的非参数半监督核应用于高斯过程模型,该模型有着明确的概率描述,可以方便地对数据之间的不确定性进行建模,并能够解决复杂的推论问题。通过实验结果表明,该算法与其他相关方法相比具有更高的可靠性。
●粒子滤波作为随机性跟踪方法中比较具有代表性算法之一,能够方便地解决多维变量和非线性问题,但阻碍其发展的最大缺陷在于粒子退化问题。重采样技术的引进能够减轻粒子退化问题的影响,但这一过程容易导致粒子多样性的缺失。更加有效地消除粒子退化问题的方法是在采样过程中选取一个较好的建议分布(ProposalDistribution),其决定如何去采样粒子,进而对跟踪算法的性能有着重要的影响。本文提出了一种新颖的跟踪算法,把高斯过程回归模型和重采样技术与粒子滤波相结合。该算法的最大特点是选取高斯过程回归模型作为粒子滤波的建议分布,不仅可以整合任意的特征到协方差矩阵中,用于对复杂数据的不确定性进行建模,还可采用最优化算法为粒子滤波器选取具有最大似然概率的粒子集,进而有效地减少退化问题的影响,提高跟踪算法的鲁棒性。