基于回归与流形学习的特征选择和特征提取

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：bigdoglsm

【摘要】

：

信息时代，各行各业都产生了海量规模的数据样本，并往往伴随着极高的维度。这些数据本身来源复杂，结构各异，类型繁多，而其中有价值的信息通常又隐藏在大量的不相关信息中。这些特点

【作者】

：

刘驰旸

【机构】

：

西安电子科技大学

【出处】

：

西安电子科技大学

【发表日期】

：

2017年期

【关键词】

：

流形学习正则约束特征选择非负矩阵分解特征提取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

信息时代，各行各业都产生了海量规模的数据样本，并往往伴随着极高的维度。这些数据本身来源复杂，结构各异，类型繁多，而其中有价值的信息通常又隐藏在大量的不相关信息中。这些特点给其处理和解析带来了很多困难。数据降维是解决上述问题的一个有效途径。把机器学习方法应用于数据降维，让机器自主发现数据中的内在联系，能够极大减少人工成本，是数据降维方法的一个研究热点。经过数十年的努力，基于机器学习的降维方法成绩斐然，但仍然有很多局限需要克服，比如对数据本身的内在信息利用不充分，对数据流形描述不够准确，有些方法不能自主控制降维维度等。为此，在前人的工作基础上，本文有针对性地提出了一些改进和扩展，以克服现有模型的局限性。主要工作如下：　　（1）针对现有无监督方法不能同时充分挖掘数据的判别信息和流形信息，降维后数据质量不够高导致的聚类分类不够准确的问题，本文使用核方法得到数据的全局判别模型，把流形学习技术融入判别模型中，结合回归学习和l2,1-范数构建了一个基于核判别分析和回归学习的无监督特征选择模型（KFDRL），使降维后的数据集充分保留原始数据的内在信息。实验结果表明KFDRL得到的数据集能够实现更好的聚类和分类效果。　　（2）针对核方法处理非线性数据时相对较高的计算复杂度，以及无监督算法不能充分利用数据先验信息的局限，本文提出了一个基于秩正则和标签约束的非负矩阵分解方法（ NMFRC）来解决上述问题。为了更好地描述数据流形， NMFRC还使用测地距离来度量数据相似性。结合秩约束方法，NMFRC在保留数据稀疏性的基础上没有破坏流形的平滑性。NMFRC把部分标签信息加入模型中，使算法成为半监督的。在半监督对比算法实验中，NMFRC得到的数据集聚类效果更好。　　（3）相比KFDRL等特征选择方法，NMFRC等基于局部思想的非负矩阵分解类方法不能自由选择降维维度，不能充分利用数据的自表示性和相似性，为此本文提出了一个新的非负矩阵分解框架下的自表示特征选择方法（SRFS-NMF），在非负矩阵分解框架中加入自表示方法得到低维拟合的回归模型，并结合范数约束进行特征选择，既利用了基于局部的思想和数据的自表示特性，又实现了特征个数的自由选择。对比实验表明，SRFS-NMF比非负矩阵分解类方法和基于范数正则的特征选择方法得到的数据集的聚类效果都更好。

其他文献

新时期初中班主任德育管理策略研究

在初中阶段,为了不断提高学生综合素质,要重视有效的开展班主任德育工作,本文结合工作实践,分析了德育教育管理意义,阐述了具体管理策略.在德育管理工作开展过程,要重视结合

期刊

班主任德育策略

小学语文写作教学分段训练模式分析

写作能力的培养向来是小学阶段语文教学的一个关键重点,掌握了良好的写作能力,这对学生日后学习和发展是十分关键的.而小学阶段学生受限于知识基础、思维能力、生活阅历等的

期刊

小学语文写作教学分段训练

疫情期间江汉大学学生主要活方式调查研究

大学生业余生活方式是其在思想观念、行为方式上的反映.本论文采用文献资料法、问卷调查法等研究方法,对江汉大学142名大学生疫情期间的主要生活方式进行了研究,旨在了解疫情

期刊

大学生生活方式研究

浅论小学语文创新教学

现阶段,我国小学语文教学首要的任务就是转变传统教学思路,必须将“填鸭式”教学转变为学生的自主学习.新课改制度就是要将教学模式从“我学”变为“我要学”,而传统的语文教

期刊

小学语文创新教学重要性问题对策

加强信息反馈提高语文课堂效率

【摘要】教学过程是一个信息传输过程。教师在调控信息传输的过程中，必须掌握和利用教学的反馈信息，使教学处于最佳状态，以提高课堂效率。在课堂教学中，不管什么“式”，什么“法”的教学，都应通过各种反馈信息来评估，什么样的教学改革也应受反馈信息的制约。　　【关键词】信息反馈因势利导　　【中图分类号】G622 【文献标识码】A 【文章编号】2095-3089（2015）06-0160-02　　为研究如何

期刊

信息反馈因势利导

浅析初中数学教学中生活化教学的应用

在初中教学的所有科目当中,数学的逻辑性和抽象性都要更强一些,所以初中数学教师想要提高数学学科的教学效率,就要构建知识教学和应用的实际联系,总结初中数学课堂教学容易出

期刊

生活化教学初中数学教学教学策略

小学作文教学存在的问题及改善策略

写作源于生活的需要,生活的需要永远是写作的“第一推动力.”改善作文教学的第一条策略是带领学生走进真实的生活,写出真情实感.在此基础上开展第二条策略:开展丰富多彩的读

期刊

真情实感积累素材创设情景

基于语音增强的语音活动检测算法研究

传统语音活动检测算法在动态（非平稳）低信噪比背景噪声环境下的效果很不理想，这主要是因为传统方法中提取的能量与过零率等检测特征针对的是平稳噪声，对信噪比的变化很敏感。而本

学位

语音增强噪声估计语音活动检测基频提取语音信号周期分解

商事信托受托人信义义务的法律分析

信托制度被称为法律领域的伟大设计,它是一种极具社会经济效率的财产管理制度。商事信托继承并发扬信托制度的传统优势,使其具有了独特的制度价值,并在社会财富形态发生巨大

期刊

商事信托信义义务信托制度信托财产忠实义务财产管理谨慎义务谨慎投资人规则信托法受益人

小学数学教学应用多媒体技术的利与弊

【摘要】科学技术的迅猛发展，多媒体技术已经得到了广泛应用。就小学数学而言，多媒体技术的应用解决了一些传统教学中解决不了或不能很好解决的问题。教师必须正确、合理地选择和恰当运用多媒体技术，最大限度地发掘学生的潜在积极性，其优势是显而易见的。然而，任何事物都有其两面性，有积极的一面，也有消极的一面，本文阐述了小学数学教学应用多媒体技术的利与弊。　　【关键词】小学数学教学应用多媒体技术利与弊　　【

期刊

小学数学教学应用多媒体技术利与弊

基于回归与流形学习的特征选择和特征提取

与本文相关的学术论文