基于多标签数据的度量学习算法研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:flash021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息技术的发展,多标签数据广泛存在于现实世界中,因此多标签学习成为了当前人工智能的主要研究热点,在影像分类、多媒体图像标注以及文本分类中得到广泛应用。不同于传统的每个样本只和一个标签有关的单标签学习,多标签学习每个样本可能与多个类别信息有关,其中每个实例可以和一组标签对应。通常多标签数据含有大量的特征,这些特征可能包含冗余和噪声,导致在学习过程中出现维度灾难问题。使得多标签学习问题相较于单标签学习问题更加困难。如何从多标签数据中提取有效特征,增强分类性能,具有重要的研究意义。同时,随着数据规模的增大,获取数据的标签信息需要很大的代价。如何利用数据的几何结构以及部分的标签信息提升分类性能,也是一个需要研究的问题。本文将围绕以上两个问题展开深入分析以及研究,并提出一些新的模型和解决方案。本文的研究内容主要从以下三个方面展开:(1)传统的度量学习算法LMNN(Large Margin Nearest Neighbor)只能用于学习单标签数据的度量矩阵。针对此问题,本文提出一种加权LMNN算法,将其应用于多标签数据的度量矩阵学习。此外,作为一种线性度量学习方法,LMNN所学习的度量矩阵无法反映数据的局部几何结构。对此,本文基于流形学习算法的思想构造正则项,并引入加权LMNN模型。本文提出的基于多标签数据的加权LMNN算法,继承了LMNN算法的优点,在保证类内距离更小,使类间距离尽可能的大,同时能尽可能保持数据的局部几何机构,提高了算法在标注数据不充分时的鲁棒性。(2)在现实世界中,样本数据之间通常具有非线性关系,流形学习算法作为一种非线性特征提取算法得到广泛应用。传统的半监督流形学习方法的提出大多针对单标签数据,并不适用于多标签数据分类。对此,本文提出一种基于多标签数据的半监督流形学习算法。在局部切空间排列算法(Local Tangent Space Alignment,LTSA)的基础上,根据标注数据标签信息的相关性进行局部距离矩阵的重构,增加异类数据的局部距离。同时,借鉴半监督流形学习的思想,将高维数据直接投影到标签空间,无需与分类器算法结合即可获取未标注数据的标签信息。(3)传统的流形学习算法如稀疏流形聚类嵌入(Sparse Manifold Cluster And Embedding,SMCE)采用单个的局部重构权构造样本的局部几何关系。对于多标签数据,采用单个权难以反映样本真正的局部几何结构。针对此问题,本文提出一种基于多标签数据的半监督多重权保持嵌入算法。对于具有c个标签的样本数据,在每个样本点的局部邻域,构造c组权以反映样本的局部几何结构,每组权反映样本点在某一个标签上的局部几何结构。通过在低维空间保持样本的局部多重权,构造算法的全局优化模型。最后,结合半监督流形算法思想,直接获取未标注数据的标签信息。在多个数据集上的实验结果验证了本文算法的有效性。
其他文献
“5·12汶川特大地震纪念馆”种植屋面普通防水层采用SBS改性沥青防水卷材,耐根穿刺防水层采用SBS改性沥青耐根穿刺防水卷材,构造层次传统可靠。本文介绍了种植屋面的防水构
摘要:据调查,每年暑假各大高校都会清理校园内各处的“僵尸车”,这些车被丢弃在校园各处,大多数都是毕业学生丢弃,而学校在清理这些“僵尸车”的过程中又会耗用大量的人力物力。针对这个问题,我们调查分析高校学生废旧自行车的现状,并分析出现大量废旧自行车的原因,对此提出对策建议。  关键词:废旧自行车;可回收;再利用  一、高校校园出现大量废旧自行车的现状分析  随着经济的发展,人们生活水平的提高,人们对生
基于大量野外调查和室内研究,对层状岩体的岩性组合特征,软弱夹层、裂隙的分布规律以及岩体结构特征进行分析、研究、分区分类并建立相应的样本单元。提出了用数值分析方法模拟
神经官能症病人均有不同程度的紧张、焦虑、忧郁和造成心理状态欠佳,影响心身健康甚至引起自身疾病.此病药物疗效差,采用心理疏导配合相应的药物治疗,可获得较好的疗效.
自美国哥伦比亚号航天飞机失事后,俄罗斯的联盟号飞船独挑天地之间载人往返运输的大梁,虽然联盟号以其高可靠性、高稳定性著称,但也日益显现出不能满足飞行需求的迹象。所以在20
摘要:宏观经济统计分析自出现以来一直处于不断发展和深化的历程中,目前,其在我国政府统计领域中发挥着十分重要的作用。而在社会经济发展新形势下,如何推动宏观经济统计分析的进一步发展是需要重点研究的问题。本文将就现阶段我国宏观经济统计分析发展的基本问题进行研究,希望可以为我国宏观经济统计分析科学、快速的发展提供一定的参考。  关键词:宏观经济;统计分析;基本问题  在现如今世界经济发展的过程中,宏观经济
目的探讨支架置入加放射治疗晚期食管癌的价值.方法常规食管支架置入术后第2d,采用6w直线加速器照射,每天180~200CGR,每周照射5d,共5~6周.结果支架放置成功率100%,半年存活率96