论文部分内容阅读
多标记学习框架解决现实世界对象多义性问题,每个训练对象由一个示例(属性向量)描述,同时关联多个类别标记,其学习系统的任务是从训练对象中学习一个能将所有适合的标记赋予未见示例的预测模型。在过去的十多年里,多标记学习吸引了众多研究者的关注,并已出现许多预测效果不错的专门算法。现有算法通常基于多标记对象的原始标记信息构建预测模型,无法充分刻画对象蕴含的丰富语义。本文围绕基于标记信息拓展的多标记学习开展研究,主要做了两方面工作:一方面,现有多标记模型中大多假设标记重要度相等,但一个样本的多个相关标记对该样本而言重要度是具有差异的,该信息也无法直接从训练样本中直接获取。本文利用隐式的相对标记重要度辅助多标记学习系统性能提升,提出Reliab(RElative LabelingImportance Aware multi-laBel learning)算法。该算法通过迭代的标记传播和k近邻两种技术,分别从全局和局部角度学习隐含的标记重要度。基于此,将多标记学习问题转变为一个多项式分布学习问题,并采用基于K-L距离和多标记经验损失正则项的预测模型求解该问题。大量实验结果表明,利用标记重要度信息对于高效的多标记学习具有非常积极的作用。另一方面,多标记学习算法一般采用带有明确标记的多标记训练对象,即训练示例具有完全相关或完全无关的类别标记。本文提出一种利用特征空间结构拓展标记信息的新型多标记学习算法Mlfe(Multi-label Learning with Feature-induced labeling information enrichment)。特征空间的底层结构通过训练对象的稀疏重构进行描述,然后将重构信息由特征空间传递到标记空间,使原始二值标记拓展为数值标记。最后,使用带有拓展标记信息的多标记训练对象生成多标记预测模型。大量实验结果表明,基于稀疏重构的标记信息拓展可有效提升多标记预测模型的泛化性能。本文共分为五章。第一章主要介绍多标记学习的背景、现状以及有待解决的问题;第二章主要介绍多标记学习概念及相关算法;第三章介绍基于相对标记重要度的标记信息拓展算法Reliab;第四章介绍基于稀疏重构的标记信息拓展算法Mlfe。第五章总结全文并做进一步的展望。