约束低秩表示算法及其应用研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:z196651j
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机和互联网技术的快速发展,人们可以很容易地获取海量的数据。这些数据往往是高维的、复杂的,并且包含了大量的噪声和冗余信息。因此,如何实现高维数据的低维表示并探索其本质结构,是十分具有挑战性的问题。低秩表示(LRR)算法作为模式识别、机器学习、计算机视觉等领域的重点研究课题,能够有效地发现高维数据的低维子空间结构和数据中噪声的结构特点,目前已被广泛应用于子空间聚类、半监督学习、目标跟踪等多种应用场景。
  低秩表示算法的基本思想是将数据矩阵表示成在字典矩阵下的线性组合,并通过求解秩最小化问题使得该线性组合的系数矩阵是最低秩的。其中,约束低秩表示算法通过对系数矩阵设计不同的约束项,可以进一步揭示数据的结构信息,是目前的研究重点。现有的约束低秩表示算法从其定义、发展过程以及具体的应用方向上考虑,可分为基本约束LRR、稀疏约束LRR和流形约束LRR。但无论哪一类方法,由于不同应用场景的数据复杂多变、低秩结构信息挖掘不准确、其他结构信息利用不全面以及不确定数据噪声的干扰,其揭示数据本质结构的能力有待改善,在各种量化性能评价指标上的表现都需要进一步提升。本文正是基于这一目标,在对国内外一些具有代表性的约束LRR方法深入研究的基础上,提出了几种改进的约束LRR方法。论文的研究成果主要体现在以下几个方面:
  (1)提出一种基于加权Schatten-p范数和Lq范数的鲁棒低秩表示(RLRR)算法,并应用于子空间聚类问题。为了更好地估计秩函数和描述不同的噪声,RLRR算法在LRR算法的基础上引入加权Schatten-p范数和Lq范数以实现性能提升。一方面,将LRR算法中的核范数推广到Schatten-p范数并对系数矩阵的奇异值分配不同的权重,从而更准确地估计秩函数。另一方面,使用Lq范数代替LRR算法中的L2,1范数来描述噪声,进一步提升算法鲁棒性。最后,采用非精确的增广拉格朗日乘子方法(IALM)求解所提出的目标函数。该方法与几种具有代表性的子空间聚类算法相比,鲁棒性更好,聚类指标得到提升,在受光照变化、高斯噪声、块状遮挡干扰下的Extend Yale B数据集上的平均聚类错误率均低于SPN算法,分别低出2.42%、5.10%和4.30%。
  (2)提出一种基于L2,p范数的快速低秩表示(FLRR)算法,并应用于子空间聚类问题。针对LRR算法在求解过程中需要计算多次奇异值分解(SVD),计算效率低的缺陷,提出一种改进的算法,旨在保证算法准确率和鲁棒性的同时,提高算法的计算效率。具体来讲,分别使用Schatten-p范数和L2,p范数代替LRR算法中的核范数和L2,1范数,从而使模型更具一般性和鲁棒性。然后对数据矩阵进行QR分解,将原问题转化为小尺度的L2,p范数最小化问题。在该问题的求解过程中不需要计算SVD,从而降低了计算成本。在人工数据集、公共图像数据集和运动分割数据集上的实验结果表明,本文提出的FLRR算法的聚类错误率和算法运行时间指标优于其它几种具有代表性的对比方法,特别是在公共图像数据集上,FLRR算法的运行时间比LRR算法快2~4倍。
  (3)提出一种基于平滑秩估计和加权稀疏约束的半监督低秩表示(SSLRR)算法,并应用于半监督学习问题。SSLRR算法分别对非负低秩稀疏图(NNLRS)算法的低秩项和稀疏项进行改进,从而准确地描述数据的全局子空间结构和局部线性结构。在构建目标函数时,使用对数函数代替核范数平滑地估计秩函数,同时利用形状交互信息和有标签样本的类别信息构造加权稀疏约束正则项。然后通过带有自适应惩罚的线性交替方向法(LADMAP)求解目标函数并重构数据的图结构,最后利用基于局部和全局一致性(LGC)的半监督分类框架完成学习任务。当有标签样本的数量为10%时,SSLRR算法在ORL、Extend Yale B、PIE和USPS数据集上的分类准确率分别达到82.94%、93.50%、83.97%和92.99%,超过12种具有代表性的基于低秩表示和经典图的半监督学习算法,验证了算法的有效性。
  (4)提出一种融合矩阵低秩表示和稀疏流形约束的目标跟踪(LRSMT)算法。为了挖掘基于粒子滤波的目标跟踪算法中粒子样本问的全局和局部结构信息,LRSMT算法将粒子样本用字典模板表示,并对表示系数加以低秩、稀疏和流形约束。具体来讲,对系数矩阵的奇异值进行弹性网正则化来捕获粒子样本间的低秩结构,并构造一个拉普拉斯图来捕获粒子样本间的流形结构。同时,利用时间一致性自适应的裁剪和选择候选粒子,并动态地更新字典模板以进一步提高算法性能。最后,在粒子滤波框架下利用LADMAP方法对算法进行优化。在OTB目标跟踪数据集的50个具有挑战性的视频序列上同14种有代表性的跟踪方法进行定性和定量比较,LRSMT算法的AUC值和准确率指标分别达到53.8%和71.7%,均高于其他比较方法。表明所提算法的跟踪性能更好。
  综上所述,本文的第一项研究成果是针对约束LRR算法中基本的低秩约束情况,通过准确地挖掘数据的低秩结构信息和处理不同的噪声,提高了子空间聚类算法的鲁棒性;第二项研究成果是在保证算法鲁棒性的同时,进一步提高了算法的计算效率;第三项研究成果是探讨了算法的低秩和稀疏约束,通过同时利用数据的全局子空间结构信息和局部线性结构信息,提高了半监督学习算法的性能;第四项研究成果是将基于低秩、稀疏和流形约束的LRR算法应用于目标跟踪领域,提高了传统算法的跟踪效果。从模型的复杂程度考虑,四项研究成果的模型从简单到复杂,呈现出一种递进关系。从模型的实用角度考虑,前三项研究成果偏重于算法研究,第四项研究成果偏重于实际应用,实现从理论到应用的过渡。
其他文献
填充词的使用在口译中十分常见。适当使用填充词是一种积极的口译实践策略,但译语填充词使用过多则会使译语质量大打折扣,使译语冗余,且有损听众对信息的接收和理解,亦会打击译员自信。译界学者以往的研究多将填充词涵盖于口译产出的非流利现象或冗余现象中,鲜少对口译产出中的填充词有独立的深入分析。本文借鉴口语分析中的话语标记理论和口译中副语言信息理论的填充标记概念,及结合其在口译研究和口译质量评估中的应用,首先
目的染色体数目异常是一类极为常见的遗传疾病,是导致自然流产、出生缺陷、男性不育等病征的重要因素。目前,染色体数目异常的检测主要依赖于经典的核型分析。然而核型分析步骤繁琐,影响因素多,实验周期长(2~3周)。特别在流产物检测方面,核型分析的培养成功率较低,仅为60%左右。上述特点决定了核型分析将无法满足日益增长的检测需求。长期以来,出现了许多方法作为核型分
采用传统的陶瓷工艺制备了CaCu3Ti4O12(CCTO)陶瓷,研究了烧结气氛和掺杂对CCTO陶瓷相组成和阻抗谱特征的影响。与空气中烧结的陶瓷相比,在约0.1Mpa的氧气中烧结的CCTO陶瓷,畴电阻率从70O.cm增加到120O.cm,数量级上没有明显的增加,表明CCTO晶粒或畴的n型半导不应该是由失氧引起的。掺铝CCTO陶瓷的晶粒和晶界电阻率随着掺杂含量的增加先增大后减小,低掺杂浓度时,A13+
目的:调查中国城市人群对紫外线的认知和防护情况。方法:在北京和上海两城市共完成1171份问卷调查。调查的内容包括:紫外线的基本特性、紫外线对人类健康的影响、防护紫外线的措施、防晒化妆品的认知和使用情况以及获得紫外线和防护知识的渠道。结果:只有少部分被访者掌握了紫外线的基本特性;关于紫外线对人健康的影响,大部分被访者知道紫外线可以引起皮肤晒伤、老化和皮肤肿瘤,但只有少部分(35%)知道紫外线与白内障
随着全球能源需求的增长和环境污染问题的加剧,光伏发电已经成为新能源利用的主要方式。光伏并网逆变器作为连接光伏阵列与交流电网的关键环节,其工作的稳定性和可靠性直接影响着光伏发电效率和电网安全运行。严苛复杂的工况、频繁的通断切换导致光伏逆变器主电路中的功率器件成为故障高发部件。当电路出现异常工作状态时,根据故障信息及时判断出故障位置并启动保护和容错运行机制,对于提高系统效率和减少经济损失具有重要意义。
期刊
目的探讨孕早期焦虑和抑郁对妊娠期糖尿病(gestational diabetes mellitus,GDM)的影响。方法采用前瞻性研究,于2017年通过立意抽样方法选取四川省妇幼保健院产前门诊1426名孕8~14周单胎健康孕妇为研究对象,年龄为(28.6±4.0)岁。通过问卷调查收集其年龄、孕前体重、产次、孕次等基本信息,分别采用焦虑自评量表(self-rating anxiety scale,S
停顿是口译活动中十分常见的现象,并非所有的停顿都应该去除。适当停顿可以吸引听众的注意力,有利于沟通,而不当停顿则会影响口译的流畅效果和信息的传递效果,并且造成了时间上的延误,同时影响听众的理解,甚至影响听众对译语以及译员的信任度,因此应当尽可能避免与克服。本文以“伊恩·牛顿教授全球难民问题座谈会”模拟会议的口译为例,对源语和译语进行转写,同时参考相关文献,通过分析对不当停顿的现象进行分类,并研究其
研究表明,关键蛋白质的识别不仅有助于理解细胞的生长调控过程,也有助于进行疾病研究和药物设计。但是通过生物医学实验的方法成本高、效率低。随着高通量技术的发展,可以获得越来越多的蛋白质相互作用数据,这让我们能够从网络水平上识别关键蛋白质。目前为止,越来越多的基于网络水平的方法被提出,但是由于蛋白质相互作用网络中包含了大量的假阴性和假阳性数据,它们的识别准确度依然需要提高。针对这些问题,本文开展的主要工
本论文以高维数据压缩与恢复为研究背景,通过阐述香农采样理论到稀疏表示和压缩感知理论再到低秩矩阵恢复理论的发展历程,引出与低秩矩阵相关的的近似函数及分解形式、数学模型和优化算法,并用于解决计算机视觉和机器学习中的图像分类、矩阵补全和子空间学习等问题。注意到核范数是秩函数最紧致的凸近似,在某些特定条件下能以较大概率恢复出低秩矩阵来。但不幸的是,这些方法会因矩阵的秩较大而得到有偏的低秩解,也会因奇异值分
学位