论文部分内容阅读
大数据时代的到来,使得噪声污染下的数据分类问题变得更加突出。以此为背景,模式识别和机器学习的相关理论和算法得到了积极推动。其中,伴随着压缩感知理论的研究热潮,稀疏表示分类器因其在进行测试样本重构恢复时所固有的稀疏性或协作性具有天然的抗噪能力而受到越来越多的关注。然而,在实际非受控环境下,其性能往往因噪声类型的不同而有很大差别。因此,非常有必要设计出更具灵活性、适应性和鲁棒性的稀疏表示分类算法。这对于压缩感知理论的后续研究、复杂图像的分类任务,河流流速的视频监测等有着重要的理论意义和现实意义。本文从现有稀疏表示分类算法所存在的问题出发,探索新算法、新约束、新应用,主要工作如下:1.针对经典稀疏表示算法存在的范数归一化和优化问题次优解等问题,提出一种基于结构及非凸约束的核组稀疏表示分类算法(KGSRSN)。KGSRSN通过将训练样本映射到高维核空间来缓解范数归一化问题。此外,该算法在核特征空间中引入组稀疏性和保局性,然后利用非凸惩罚函数得到表示系数。同时,为了不以牺牲解的唯一性和凸优化的鲁棒性为代价来提升算法的稀疏性,KGSRSN给定了惩罚函数内参数的值的区间范围。最后,采用交替方向乘子法(ADMM)和优化最小化方法(MM)求解优化问题以得到全局最优解。实验选取AR、PIE和MNIST三个数据集验证所提算法,结果表明KGSRSN能获得更具鉴别力的稀疏系数,且在识别率和运行效率方面均优于一般经典算法;2.针对一般算法以向量形式存储误差矩阵且假定其服从于独立同分布而忽视了图像数据内部结构信息的问题,提出一种基于矩阵变量分布的非光滑稀疏表示分类算法(NSRMVD)。该算法强调误差矩阵中各个像素间的依赖性并假定误差矩阵作为一个随机矩阵变量服从于矩阵多变量椭圆分布;之后,引入辅助变量光滑目标函数,使得模型易于获得全局最优解;最后,采用迭代加权最小二乘法优化求解模型。在AR、ExYaleB和PubFig三个数据集中的实验验证了所提算法具有鲁棒的鉴别力;3.针对大多数基于向量的算法(如所提KGSRSN)以及基于矩阵的算法(如所提NSRMVD)无法有效处理混合噪声(连续噪声+非连续噪声)的问题,提出一种加权混合范数回归算法(WMNR)。通过对分类算法统一框架的构建,该算法给出了包含损失函数、低秩约束和系数正则化项的通用公式。给定通用公式中的特定损失函数,WMNR可找到一种适合于非连续噪声的分布。而对于连续噪声,算法对其进行低秩约束,且低秩约束可通过一般非凸函数和加权奇异值进行量化。此外,由于所提WMNR算法的目标函数是混合范数最优化问题,故提出一种新的加权ADMM优化策略对模型进行迭代求解。该策略将原始优化问题分为若干个子问题,以并行方式进行计算来提升算法效率。经过上述操作,WMNR能实现有效处理混合噪声的目标。实验验证了所提算法相较于其他算法在处理不同表情变化、像素污损、块状遮挡、真实伪装和混合噪声时所表现出的更好的识别性能以及更高的运行效率;4.针对传统的河流流速测量方法对于天然河流复杂的紊动特性以及河流周边复杂的现场环境的局限性,提出一种基于稀疏表示分类算法的新型非接触式河流表面流速估计方法。该方法以水流图像的特征识别为基本原理,通过图像采集和预处理、对应类别标签与流速关系映射表的建立以及数据分析等技术方法的集成,建立一套河流表面流速估计方案。选择位于湖北省通山县境内九宫梯级水电站所在的宝石河二级支流——界牌河作为实验对象,利用所提稀疏表示分类算法进行数据分析得到表面流速范围。实验验证了压缩感知图像分析方法用于河流表面流速估计的可行性,且通过实验结果可得出所提各算法在面对不同噪声类型的水流图像时均有用武之地。综上所述,本文主要研究压缩感知理论中的稀疏表示分类算法,并将所提算法应用于水流图像的分类识别以实现对河流表面流速的估计,且各算法都具有得天独厚的优势,能满足不同噪声类型的图像。