基于稀疏表示的高维数据无监督挖掘研究

被引量 : 3次 | 上传用户:xinmo2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是协助管理决策的重要工具之一,随着数据挖掘的应用范围不断扩大,数据挖掘所处理的数据逐渐呈现出高维和未标记的主要特点,即高维未标记数据。对该类数据的挖掘可以称为高维数据无监督挖掘,其中缺失数据填补、数据学习建模尤其大规模在线学习建模属于其中的主要内容。本文针对高维数据无监督挖掘的这些问题,研究基于稀疏表示的高维数据无监督挖掘方法,具体研究包括以下内容。(1)针对高维数据无监督挖掘的缺失数据填补问题,研究基于局部约束稀疏表示的缺失数据无监督填补方法。提出局部约束稀疏表示(Locality Constrained Sparse Representation, LCSR)的优化目标,给出优化求解方法,其引入距离加权l1范数和l2范数正则化项,在自动选择相似数据对象的同时,保留局部结构特征并避免过拟合;提出基于LCSR的高维缺失数据无监督填补方法,并设计了三种字典构造方法;利用真实高维基因和图像数据的实验验证了该方法的有效性及参数选择的低敏感性。(2)针对高维数据无监督挖掘的学习建模问题,研究基于近邻加权稀疏表示的无监督图学习方法。提出近邻加权稀疏表示(NEighborhood Weighted Sparse Representation, NESR)的优化目标及相应的高维数据无监督图构造方法,其利用稀疏约束和近邻距离加权能同时保持高维数据的稀疏性和局部结构特征,并能降低传统的基于稀疏表示方法的时间复杂度;将提出的图构造方法融合到谱聚类、子空间学习及标签繁殖等高维数据挖掘任务;在真实高维图像和语音识别数据集上的实验验证了该算法在效果及计算效率上的优势。(3)针对大规模在线高维数据无监督挖掘的学习建模问题,研究基于多重超图约束稀疏编码的无监督字典学习方法。提出多重超图约束稀疏编码(Multiple Hypergraph Consistent Sparse Coding, MultiHC_SC)的优化目标及交替优化求解方法,其利用能有效描述高维数据多元流形关系的超图模型及超图拉普拉斯正则化约束,扩展超图矩阵对稀疏求解系数的一致性约束,增加字典学习的无监督判别能力,并通过多重集成约束项实现最优超图的自动选择:通过实验验证了提出方法]MultiHC_SC同时在静态图像聚类和在线图像聚类挖掘任务上的效果提高。
其他文献
实验模态分析对于结构动力学特性分析、故障诊断、在线健康监测等方面有着非常重要的价值,经过多年的发展已经在多方面取得了很大的成功。其中一个非常引入注目的领域是环境
实验实训教学设施作为提高高职学生职业与就业能力的重要平台,近年来受到高职院校的普遍重视,提高职业技术院校实训教学和管理水平是高职教育内涵建设的重要目标。高职院校实训
农业发展银行作为国家政策和改革的中介机构、执行机构和监督机构,在严格执行国家政策的前提下,一方面贷款支持粮食企业搞好粮食生产和流通,另一方面监督粮食企业在粮食生产和流
综述了新型含铝、镁抗酸剂的研究概况,合成了三种新型抗酸剂:铝镁加(almagate)、铝碳酸镁(hydrotalcite)、铝镁西特(almagcit),开发了铝镁加的分散片,并对铝镁加的药效学进行了初步的研
目的 接触过敏(Contact Hypersensitivity,CH)是对接触致敏原发生的主要由Th细胞介导的迟发型变态反应(DTH)。Th细胞根据其产生的细胞因子不同,又可分为Th1细胞和Th2细胞。在经典接
腐败被称为“政治之癌”,不管古代近代还是当代、不管中国还是外国、社会主义制度还是资本主义制度,腐败都是一个难以克服的顽疾。当前腐败已经成为全球性的普遍问题,腐败与
随着改革开放的深入进行,社会主义市场经济的发展,集体主义是否仍然是社会主义市场经济条件下道德建设的基本原则引起了激烈的争论。本文紧扣“集体主义与社会主义市场经济”这
基于我国的水、能源及环境的现状,在可持续发展的基础上,本文提出并较为详细的对城市污水低位能源的开发利用进行了如下几方面的研究:①选择设计适合于城市污水水源环境中运行的
摘要城市广场是以人为中心的,城市只存在于搏动的街道和广场的生活之美中。一个成功的城市广场的基础不仅在于其良好的物质景观,还在于空间内生气勃勃的人的活动。城市广场美的
1 前言新型和轻质高效保温材料的发展,推动着我国传统实心粘土砖墙体向着空心砖或多孔砖复合墙体方向转变.这种以粘土原料为主空心砖或多孔砖,不仅节能省土,而且具有良好的建