基于自适应学习的多视图无监督特征选择方法研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:jazz988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,各行各业涌现出海量的高维数据。高维数据中存在的许多不相关或冗余的特征使其在处理过程中需要更高的计算成本和存储要求,甚至还会带来维度灾难。特征选择是对高维数据进行降维的有效解决方法。特征选择是指从原始高维数据特征集中选取低维相关特征子集并删除冗余特征以提高后续数据处理任务性能的过程。多视图学习的一个重要特点是利用了不同视图提供的兼容和互补信息,使得视图之间起到相互促进和增强的作用,因此多视图特征选择比单视图特征选择有更好的性能。在实际应用中,获取数据标签困难且代价昂贵,无监督特征选择更加实用。当前,对多视图无标签数据进行特征选择已经成为数据挖掘领域的一个重要问题。现有的多视图无监督特征选择方法大多数存在以下问题:一是很难得到可靠的相似矩阵和适当的近邻分配,这使得其不能有效刻画数据间的真实结构。二是样本间的相似度矩阵、不同视图的权重向量和特征的权重向量往往是预先定义的,不能动态评估不同视图和特征的重要性,进而导致不能选出有用的特征。为了克服上述问题,本文提出了一种新的基于自适应学习的多视图无监督特征选择方法(Adaptive Learning-based Multi-view Unsupervised Feature Selection,ALMUFS)。ALMUFS算法充分利用原始数据中包含的样本结构相似性、聚类结构、视图间信息的相关性和互补性等几种重要信息,在聚类过程中同时实现特征选择。首先,由于不同视图和同一视图下不同特征的重要性都有所差异,本文设计了两种加权方案,自适应学习视图权重和特征权重对不同视图和同一视图下不同特征的贡献进行动态评估。其次,在拉普拉斯秩约束下自适应学习样本的相似度矩阵,使相似矩阵中连通分量个数与簇数目相等,得到恰当的近邻分配,从而有效刻画数据间的真实结构。然后,通过自适应学习统一的模糊隶属度矩阵作为各视图共用的伪标签指示矩阵,使得视图间信息能有效融合,实现多视图数据的兼容和互补。接下来,我们使用带有特征权重向量l2范数的正则化项使特征权重稀疏且防止过拟合,最终实现特征选择这一目标。为了求解ALMUFS的目标函数中的变量,我们设计了一种交替迭代优化的方法来求解模型,在9个公开的真实数据集上进行实验同时与几种先进的多视图无监督特征选择方法进行比较。实验结果表明我们的方法在ACC和F-measure这两个指标下优于其他方法。
其他文献
不管是在实际生产中还是在日常生活中,设备发生故障将对生产秩序产生影响,导致巨大的损失甚至对社会和人生安全造成重大危害。运用可靠性理论延长现代设备的寿命并进行维修,能够取得显著的经济效益并且提高社会效益。本文以具有两种故障模式的单元件系统为研究对象,并且考虑了在生产过程中因原材料不足等因素而随机出现的生产等待。本文所研究的两种故障模式分别为:软故障和硬故障。软故障又称为故障模式1,利用了延迟时间概念
学位
<正>10月11日,北仑区人民法院的微信公众号发布了一起离婚案,值得一看。北仑一名丈夫长期不回家并且重婚,在他起诉离婚后,其妻向其提出了15万元的离婚损害赔偿和20万元经济补偿。考虑妻子对家庭付出较多、承担子女抚育义务较多,最后法院判决丈夫补偿妻子15万元,赔偿5万元。
期刊
目的 分析慢性应激诱导的焦虑障碍模型小鼠杏仁核miRNA表达情况,探索在焦虑障碍中发挥作用的关键miRNA及其可能的作用靶点。方法 选取24只8周龄C57BL/6雄性小鼠(体质量为18~22 g),采用区组随机法按照体质量分为焦虑障碍组(n=12)和对照组(n=12)。焦虑障碍组采用连续10 d的狭小空间约束方法(每天2 h)用于制造焦虑障碍小鼠模型,对照组无应激。造模完成后采用高架十字迷宫实验、
期刊
当今全球经济一体化,发达国家的产业部门把生产制造过程中的边缘环节转移到发展中国家,来更合理的配置资源,从而降低生产成本,不断细化国际分工。在目前这种发展中国家处于国际低端环节,国内产业被限制的情况下,如何提升中国的国际竞争力,保持经济增长是十分重要的。为了研究国际间竞争与合作力对产业结构变化的影响,本文选取了WIOD2000-2014年的数据建立了相关模型来分析全球价值链下国际产业部门之间的竞争与
学位
距离1999年7月战略投资者这一概念的首次提出,已经过去了20多年的时间,中国作为一个经济处于快速发展的大国,最早因为国企改制而引入了大量的战略投资者,由于全球经济一体化,市场经济环境竞争愈发激烈,战略投资者在上市公司中的比例也逐渐提高,上市公司希望战略投资者可以加入到本公司的经营与管理之中,进而提升本公司的绩效水平。然而公司绩效水平的提升是否与战略投资者的引入有着密切的相关性,假如有,战略投资者
学位
2019—2020年,通过在内陆海水养殖中心利用养殖尾水培植红花美人蕉,研究其在6 h滞留期内对海水养殖尾水中氨态氮、硝酸盐氮和亚硝酸盐氮的去除效果。结果表明:美人蕉在pH值为8.1~8.3、盐度为2.9%~3.0%的海水中能够存活,并且对氨态氮、硝酸盐氮和亚硝酸盐氮均具有较好的去除效果。
期刊
报纸
报纸
<正>近年来,国网枞阳县供电公司结合地方发展的用能需求,围绕乡村振兴总体规划、重点工程、重大项目,提前布局电网建设项目,通过建立齐抓共管的“联动”机制、搭建面对面的“对话”平台、打造精准合理的“订制”方案,对接县域总体规划和城镇建设规划;以供电所为单位开展配电网规划与管理,在各供电所搭建平台,电网建设规划实施“一村一规划”,开展“主网—配网—村网”梯次规划研究,有效提升了电网投资利用率和精准性。
期刊
政府通过制定和调节经济政策来达到对经济的干预,在这过程中,政策的频率变化、以及指向和力度不明确都会加剧经济政策不确定性。中国的经济政策比西方发达国家更加具有不确定性。商业银行是金融系统的枢纽,负责配置经济资源并将其投入社会再生产之中,其经营过程既面临本身存在的固有经营风险,也会受到经济环境和经济政策的影响,银行风险承担行为是影响经济稳定的关键因素。在此背景下,研究经济政策不确定性对商业银行风险承担
学位