多标签学习的特征降维方法

来源 :闽南师范大学 | 被引量 : 0次 | 上传用户:lynneselina
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多标签学习中,多标签数据的每个样本含有多个标签,标签与标签之间也不是独立存在的。多标签数据的维数较高,增加了数据挖掘的复杂度和难度。近些年来如何高效地处理多标签数据,成为研究者们研究的一个热点问题。特征降维能降低多标签数据的维度、缩小数据规模,提高多标签学习的性能。本论文提出了两种多标签学习特征降维算法:(1)基于主成分分析的多标签学习特征降维算法(MLFR-PCA)。首先该算法利用PCA原理将原始数据投影到低维空间,对数据进行密集和去噪处理。其次算法将数据的所有标签作为一个整体,在标签与特征之间引入稀疏回归,建立起标签空间与特征空间的联系,以此构造数据降维的目标函数。然后结合2,1l范数对算法进行优化处理,最终实现降低多标签数据维数的目的。(2)基于非负矩阵分解的多标签学习特征降维算法(MLFR-NMF)。首先该算法用特征矩阵与非负矩阵的乘积构建特征空间的相似矩阵。其次将数据的所有标签作为一个整体,利用已有方法构造标签空间的相似矩阵。然后在特征空间的相似矩阵与标签空间的相似矩阵之间引入最小二乘法,建立起标签空间与特征空间的联系,以此构造数据降维的目标函数。最后结合2l范数对算法进行优化处理,以实现降低多标签数据维数的目的。以上两种特征降维算法可以直接对多标签数据进行降维,不需要转化多标签数据为单标签数据,这样不仅减少了转化过程引起的工作量增大问题,也避免了因转化不准确带来的后续问题。此外,算法将数据的所有标签作为一个整体参与目标函数构造,这样可以在不破坏标签结构的情况下,有效利用标签信息实现降维。通过在真实数据集上的实验,表明了两种算法效果良好。
其他文献
本文研究了几类半群上的模糊性质。首先用模糊同余三元组刻画了完全单半群上的模糊同余,并且找到了模糊同余格上每个K-类中的极大元和极小元。其次,分别研究了完全正则半群、序
几个月前,就在泰伯庙重修落成之际,吴门书道馆正式对外开放。这对于苏州人来说是一件百年盛事。记得吴门书道馆筹备之初,著名书法家华人德曾说过一句话,要把它办成苏州书法的
本文主要研究了ρ次抛物星形映照的系数估计与增长掩盖定理.全文共分三章。   在第一章,我们概括介绍了多复变数几何函数论的发展背景,本文所用到的一些记号、定义及主要结
信号重建可以归结为在频域上从信号采样中把原信号恢复出来。而最初的信号重建,信号采样受到香农采样定理的限制,压缩传感理论的提出突破了香农采样定理的瓶颈,使得高分辨率
压缩传感是2006年Candes提出的一种新的信号处理方式,它突破了传统信号处理方式对采样率的要求,能够从低维样本空间重构出高质量的高维信号,大量节约了采样成本,可应用在磁核
以蜂窝网、无线局域网、ad hoc网以及无线传感器网络为代表的无线通信网络近年来得到迅速发展,拥有其广阔的市场空间。协同通信将成为新一代无线网络重要的增强技术,它具有提高
金融系统的同步控制是当前混沌理论及应用研究中的热点问题,也是经济学理论与方法研究的一个重要问题,而超混沌在金融系统的应用上具有更广泛的价值.本文围绕非线性超混沌金
随着信息时代的来临和互联网产业的高速发展,互联网已经普及到千家万户,并在人们的生活中扮演着越来越重要的角色。互联网中蕴含的巨大的商业价值也一直备受各界的广泛关注。随