基于多标签数据的度量学习算法研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户：flash021

【摘要】

：

近年来,随着信息技术的发展,多标签数据广泛存在于现实世界中,因此多标签学习成为了当前人工智能的主要研究热点,在影像分类、多媒体图像标注以及文本分类中得到广泛应用。不

【作者】

：

杨定康

【出处】

：

华侨大学

【发表日期】

：

2020年01期

【关键词】

：

多标签学习度量学习半监督流形学习多重权

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着信息技术的发展,多标签数据广泛存在于现实世界中,因此多标签学习成为了当前人工智能的主要研究热点,在影像分类、多媒体图像标注以及文本分类中得到广泛应用。不同于传统的每个样本只和一个标签有关的单标签学习,多标签学习每个样本可能与多个类别信息有关,其中每个实例可以和一组标签对应。通常多标签数据含有大量的特征,这些特征可能包含冗余和噪声,导致在学习过程中出现维度灾难问题。使得多标签学习问题相较于单标签学习问题更加困难。如何从多标签数据中提取有效特征,增强分类性能,具有重要的研究意义。同时,随着数据规模的增大,获取数据的标签信息需要很大的代价。如何利用数据的几何结构以及部分的标签信息提升分类性能,也是一个需要研究的问题。本文将围绕以上两个问题展开深入分析以及研究,并提出一些新的模型和解决方案。本文的研究内容主要从以下三个方面展开:(1)传统的度量学习算法LMNN(Large Margin Nearest Neighbor)只能用于学习单标签数据的度量矩阵。针对此问题,本文提出一种加权LMNN算法,将其应用于多标签数据的度量矩阵学习。此外,作为一种线性度量学习方法,LMNN所学习的度量矩阵无法反映数据的局部几何结构。对此,本文基于流形学习算法的思想构造正则项,并引入加权LMNN模型。本文提出的基于多标签数据的加权LMNN算法,继承了LMNN算法的优点,在保证类内距离更小,使类间距离尽可能的大,同时能尽可能保持数据的局部几何机构,提高了算法在标注数据不充分时的鲁棒性。(2)在现实世界中,样本数据之间通常具有非线性关系,流形学习算法作为一种非线性特征提取算法得到广泛应用。传统的半监督流形学习方法的提出大多针对单标签数据,并不适用于多标签数据分类。对此,本文提出一种基于多标签数据的半监督流形学习算法。在局部切空间排列算法(Local Tangent Space Alignment,LTSA)的基础上,根据标注数据标签信息的相关性进行局部距离矩阵的重构,增加异类数据的局部距离。同时,借鉴半监督流形学习的思想,将高维数据直接投影到标签空间,无需与分类器算法结合即可获取未标注数据的标签信息。(3)传统的流形学习算法如稀疏流形聚类嵌入(Sparse Manifold Cluster And Embedding,SMCE)采用单个的局部重构权构造样本的局部几何关系。对于多标签数据,采用单个权难以反映样本真正的局部几何结构。针对此问题,本文提出一种基于多标签数据的半监督多重权保持嵌入算法。对于具有c个标签的样本数据,在每个样本点的局部邻域,构造c组权以反映样本的局部几何结构,每组权反映样本点在某一个标签上的局部几何结构。通过在低维空间保持样本的局部多重权,构造算法的全局优化模型。最后,结合半监督流形算法思想,直接获取未标注数据的标签信息。在多个数据集上的实验结果验证了本文算法的有效性。

其他文献

5·12汶川特大地震纪念馆种植屋面防水施工技术

“5·12汶川特大地震纪念馆”种植屋面普通防水层采用SBS改性沥青防水卷材,耐根穿刺防水层采用SBS改性沥青耐根穿刺防水卷材,构造层次传统可靠。本文介绍了种植屋面的防水构

期刊

种植屋面SBS改性沥青防水卷材耐根穿刺防水卷材细部节点

浅析高校校园出现废旧自行车的现状、原因及对策

摘要：据调查，每年暑假各大高校都会清理校园内各处的“僵尸车”，这些车被丢弃在校园各处，大多数都是毕业学生丢弃，而学校在清理这些“僵尸车”的过程中又会耗用大量的人力物力。针对这个问题，我们调查分析高校学生废旧自行车的现状，并分析出现大量废旧自行车的原因，对此提出对策建议。　　关键词：废旧自行车;可回收;再利用　　一、高校校园出现大量废旧自行车的现状分析　　随着经济的发展，人们生活水平的提高，人们对生

期刊

废旧自行车可回收再利用

样本单元法及层状含裂隙岩体力学参数的确定

基于大量野外调查和室内研究，对层状岩体的岩性组合特征，软弱夹层、裂隙的分布规律以及岩体结构特征进行分析、研究、分区分类并建立相应的样本单元。提出了用数值分析方法模拟

期刊

层状岩体岩性组合软弱夹层层间裂隙样本单元非线性有限元

心理疗法治疗神经官能症

神经官能症病人均有不同程度的紧张、焦虑、忧郁和造成心理状态欠佳,影响心身健康甚至引起自身疾病.此病药物疗效差,采用心理疏导配合相应的药物治疗,可获得较好的疗效.

期刊

神经官能症心理疗法焦虑忧郁

俄罗斯新型载人飞船新鲜出炉

自美国哥伦比亚号航天飞机失事后，俄罗斯的联盟号飞船独挑天地之间载人往返运输的大梁，虽然联盟号以其高可靠性、高稳定性著称，但也日益显现出不能满足飞行需求的迹象。所以在20

期刊

联盟号飞船载人飞船哥伦比亚号航天飞机航天器失事飞行大梁俄罗斯需求计划

宏观经济统计分析发展的基本问题

摘要：宏观经济统计分析自出现以来一直处于不断发展和深化的历程中，目前，其在我国政府统计领域中发挥着十分重要的作用。而在社会经济发展新形势下，如何推动宏观经济统计分析的进一步发展是需要重点研究的问题。本文将就现阶段我国宏观经济统计分析发展的基本问题进行研究，希望可以为我国宏观经济统计分析科学、快速的发展提供一定的参考。　　关键词：宏观经济;统计分析;基本问题　　在现如今世界经济发展的过程中，宏观经济

期刊

宏观经济统计分析基本问题

支架置入加放射治疗晚期食管癌

目的探讨支架置入加放射治疗晚期食管癌的价值.方法常规食管支架置入术后第2d,采用6w直线加速器照射,每天180～200CGR,每周照射5d,共5～6周.结果支架放置成功率100%,半年存活率96

期刊

晚期食管癌支架置入术放射治疗Late esophagus cancer Inserting cage in esophagus Radiations

基于多标签数据的度量学习算法研究

其他学术论文