基于标记信息拓展的多标记学习算法研究

来源 :东南大学 | 被引量 : 2次 | 上传用户:y1271
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标记学习框架解决现实世界对象多义性问题,每个训练对象由一个示例(属性向量)描述,同时关联多个类别标记,其学习系统的任务是从训练对象中学习一个能将所有适合的标记赋予未见示例的预测模型。在过去的十多年里,多标记学习吸引了众多研究者的关注,并已出现许多预测效果不错的专门算法。现有算法通常基于多标记对象的原始标记信息构建预测模型,无法充分刻画对象蕴含的丰富语义。本文围绕基于标记信息拓展的多标记学习开展研究,主要做了两方面工作:一方面,现有多标记模型中大多假设标记重要度相等,但一个样本的多个相关标记对该样本而言重要度是具有差异的,该信息也无法直接从训练样本中直接获取。本文利用隐式的相对标记重要度辅助多标记学习系统性能提升,提出Reliab(RElative LabelingImportance Aware multi-laBel learning)算法。该算法通过迭代的标记传播和k近邻两种技术,分别从全局和局部角度学习隐含的标记重要度。基于此,将多标记学习问题转变为一个多项式分布学习问题,并采用基于K-L距离和多标记经验损失正则项的预测模型求解该问题。大量实验结果表明,利用标记重要度信息对于高效的多标记学习具有非常积极的作用。另一方面,多标记学习算法一般采用带有明确标记的多标记训练对象,即训练示例具有完全相关或完全无关的类别标记。本文提出一种利用特征空间结构拓展标记信息的新型多标记学习算法Mlfe(Multi-label Learning with Feature-induced labeling information enrichment)。特征空间的底层结构通过训练对象的稀疏重构进行描述,然后将重构信息由特征空间传递到标记空间,使原始二值标记拓展为数值标记。最后,使用带有拓展标记信息的多标记训练对象生成多标记预测模型。大量实验结果表明,基于稀疏重构的标记信息拓展可有效提升多标记预测模型的泛化性能。本文共分为五章。第一章主要介绍多标记学习的背景、现状以及有待解决的问题;第二章主要介绍多标记学习概念及相关算法;第三章介绍基于相对标记重要度的标记信息拓展算法Reliab;第四章介绍基于稀疏重构的标记信息拓展算法Mlfe。第五章总结全文并做进一步的展望。
其他文献
风华正茂的许灵均被打成右派,临被流放到大西北敕勒川农场时,同为“天涯沦落人”的谢老师安慰他:“你还年轻,我们这些下去劳动的,要好好改造自己,我想最多也不过两三年吧!我
与实体中心说所导致的程序工具价值论相反,程序中心说导致了实质正义被贬低的弊端。将公正的程序置于中心地位,只是为了平衡对实体权利的不适当的强调,而不是要放逐实体。程序必
通过对甘肃省8个地市的体育运动学校、业余体校和体育传统项目学校的调查,发现影响甘肃省竞技体育后备人才培养的主要因素有资金投入、设备条件、生源质量、运动员就业、管理
背景颅脑损伤(Traumatic brain injury,TBI)是一种神经外科常见的多发病,且随着社会经济水平不断提高,高速交通工具的普及应用,建筑业快速发展,以及各种激烈的体育运动项目,使得颅脑损伤的发生率呈现持续升高的趋势。颅脑损伤是由于外力作用于头部所造成的脑组织器质性损伤。而认知功能障碍则是颅脑损伤后最常见的后遗症之一。目前对颅脑损伤后伴发认知功能障碍的治疗多以药物治疗为主并辅助认知功
研究目的:胃癌是全球最常见的恶性肿瘤之一,是癌症患者死亡的主要原因之一。在我国胃癌是发病率和死亡率均居第二位的恶性肿瘤。虽然近年来胃癌的诊断和治疗方法取得了一些进
<正>颈椎病是中老年人常见的颈椎退行性病变,临床上采用手术对颈椎病患者进行治疗的风险过大,因此常用中医治疗方法对患者进行干预,目前使用最多的是针灸与推拿[1-2],但罕见
针对当今的信息安全问题和数字图像的特点,提出了一种基于图像信息摘要和RSA公钥密码体制的图像加密技术,利用图像信息摘要(IMD)构造图像像素置乱矩阵并对图像像素矩阵进行置乱后
"吉林气象"微信为农服务平台是吉林省公益性气象平台,作为吉林省气象局的官方微信平台,为农服务提供了新的渠道,本文描述了"吉林气象"微信为农服务平台的发展现状,并详细介绍了微
<正> 山西省长治市城区有一条回民街,聚居着一万五千多回族穆斯林。这条回民街叫三道营,位于太行山南麓,漳河岸边、古老的上党郡皇城西侧;是由南头街、铜锅街、营口街三条街
硒是人与动物所必需的微量元素之一,适量的硒能促进动物生长,为此,综述硒的抗氧化和毒害作用以及硒对动物生长、繁殖、机体免疫等的影响。