融合非负矩阵分解和极限学习机的多标签学习方法研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:a24287490
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的发展产生了大量高维、多样和结构复杂的数据,其中包括大量单个实例对应多个标签的多标签数据。传统的监督学习算法大多用于处理单标签数据,无法很好的挖掘多标签数据的内部信息,因此多标签学习受到了广大学者的关注和研究。多标签学习同样面临维度灾难的问题,为了避免维度过高带来的过拟合和精度下降的问题,本文引入非负矩阵分解(Non-negative Matrix Factorization,NMF)和极限学习机(Extreme Learning Machine,ELM)构建多标签学习模型。本文首先针对传统的NMF算法进行研究,并在此基础上提出了分解维度自适应的图正则化非负矩阵分解算法,随后优化多标签径向基神经网络(Mutil-label Learning Algorithm Based on Radial Basis Neural Network,ML-RBF)算法的隐层节点个数、隐层RBF函数中心和输出权重计算方式提出了基于拉普拉斯极限学习机和径向基神经网络的多标签学习模型,最后结合两种改进算法提出一种融合非负矩阵分解和极限学习机的多标签学习算法,并通过实验验证了算法的有效性。本文主要研究内容如下:(1)研究基于分解维度自适应的图正则化非负矩阵分解算法。针对NMF分解维度需要人为依据先验知识确定的缺点,使用近邻传播(Affinity Propagation,AP)聚类算法优化分解维度,并将原始数据投影到非负特征空间,提出了分解维度自适应的非负矩阵分解(Factorization Dimension Adaptive Non-negative Matrix Factorization,FDANMF)算法。使用K近邻(K nearest neighbor,KNN)和ELM对低维数据进行分类,验证算法的有效性。为了进一步提高低维表示数据的鲁棒性,结合FDANMF和图正则化非负矩阵分解(Graph Regularized Non-negative Matrix Factorization,GNMF)的思想提出了分解维度自适应的图正则化非负矩阵分解算法(Factorization Dimension Adaptive GNMF,FDAGNMF),并通过实验验证了FDAGNMF算法结合ELM和KNN分类算法的分类准确率高于FDANMF的分类准确率。(2)研究基于极限学习机和径向基神经网络的多标签学习算法。首先分析传统的ML-RBF算法在进行多标签学习时存在的缺点与不足,ML-RBF隐层节点的个数是通过对每个标签所包含的样本分别进行均值聚类得到的,而值是通过每类样本的比例确定的,并不能反应样本真实信息。因此使用近邻传播聚类算法确定隐层节点的个数,并使用正则化极限学习机(Regularized Extreme Learning Machine,RELM)计算输出权重,提出基于正则化极限学习机和径向基神经网络的多标签学习算法(Muti-lable Learning Model Based on Radial Basis Neural Network and Regularized Extreme Learning Machine,ML-AP-RBF-RELM)。通过在三个多标签数据集上与其它五种多标签学习算法进行对比,并使用五种评价标准进行度量验证提出算法的有效性。进一步分析ML-AP-RBF-RELM中存在的问题,使用近邻传播聚类算法同时确定隐层节点的个数和隐层RBF函数的中心,并利用Lap-El M计算输出权重,提出基于拉普拉斯极限学习机和径向基神经网络的多标签学习算法(Multi-label Learning Model Based on Radial Basis Neural Network and Laplacian Extreme Learning Machine,ML-AP-RBF-Lap-ELM),并与ML-AP-RBF-RELM进行对比验证算法有效性。(3)研究融合非负矩阵分解和极限学习机的多标签学习算法。本文结合FDAGNMF和ML-AP-RBF-Lap-ELM算法,提出了一种融合非负矩阵分解和极限学习机的多标签学习算法(Muti-lable Learning Model Based on Non-negative Matrix Factorization and Extreme Learning Machine,ML-NMF-RBF-Lap-ELM)。首先使用FDAGNMF算法对数据进行降维,然后使用ML-AP-RBF-Lap-ELM算法对低维数据进行分类。最后,与多标签学习算法ML-AP-RBF-RELM在四个多标签数据集上进行对比,通过实验验证融合算法的有效性。
其他文献
分析了2001年至2002年间129例第二产程延长的病例,其新生儿窒息的发病率为31.8%,其发病原因与胎儿宫内窘迫、孕妇身高、新生儿体重密切相关(P<0.05),而与脐带异常、新生儿性别
阐述中药炮制学理论教学与实验教学中重视理论与实践相结合,培养学生学习兴趣,提高综合能力和素质;注重继承传统中药炮制方法的同时,不断引入现代科学技术及中药炮制研究新成果;增
555定时器是一种中规模集成电路,只要在外部配上适当阻容元件,就可以方便地构成各种脉冲产生和整形电路,例如多谐振荡器、施密特触发器和单稳态触发器等。主要介绍555定时器
教师的心理健康状况与师德建设是相辅相成的。从心理健康的角度来探讨师德建设是进一步加强和改进高校师德建设的有效途径之一。改善高校教师心理健康状况的途径与方法是:教师
审美学习是指在教师的引导下,学生通过自己的情感体验与内在感受,不断丰富情感、陶冶情操、净化心灵,提高自身审美素质,获得身心自由发展的过程,具有情感性、形象性和超越性等特点
在国防军队改革和大学建设不断发展的背景下,结合军队院校青年教员培养实际,探讨青年教员培养存在的问题,尝试把职业认同、发展、能力三者凝为一体,建立青年教员职业化培养理
中国共产党领导是中国特色社会主义最本质的特征,也是中国特色社会主义制度的最大优势。如同我们曾经战胜无数风险挑战和艰难险阻一样,坚持党的集中统一领导,依然是打赢疫情防控
报纸
介绍了都市农业的涵义及研究现状,指出了侯寨乡樱桃沟的都市农业开发中存在整体开发层次较低,项目规模小,管理混乱,产业化开发力度不够,未形成品牌,基础设施不完善等问题,提
某制药企业的信息化建设迫在眉睫,对外要面对全球范围内的信息化大潮、日新月异的现代生物工程技术、日益激烈的制药市场的竞争。对内要面对初期的信息化管理系统的遗留弊端,各部门各自为政,信息无法及时有效的共享,导致“信息孤岛”的存在;未从根本上解决生产、管理等环节的落后性,导致该企业资源浪费,市场竞争力无法提升。ERP在1990年被Gartner Group提出,它可以提供系统化的管理思想,在充分利用计算
探讨采用普通数控车床,利用钻孔攻丝的方法加工缓速器花键轴中心内螺纹的方法,拓宽工艺加工方法选择的思路,灵活运用现有生产设备。问题提出花键轴作为缓速器部件之一,如图1