多标记学习中标记关系利用的研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:hdf2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在传统机器学习研究中,学习对象仅由一个类别标记来描述其语义概念。而在许多实际应用中,学习对象往往同时与多个语义概念相关联。多标记学习是研究此类任务的一种学习框架,并已成功应用于许多领域。值得注意的是,如果独立地对每个标记进行学习,则对应的输出空间随着标记个数增加而指数级膨胀,每个标记的区分难度和所需的训练样本也急剧增加,这会导致巨大的存储和时间开销,且在一些样本较少的标记上难以获得好的泛化性能。因此,如何有效地对标记关系进行利用,是多标记学习中的核心研究内容。本文对此进行研究,主要工作包括:1.提出一种不需事先获得标记关系就能有效学习,还能产生标记关系估计结果的多标记学习方法MAHR。以往多标记学习方法通常要先获得标记关系再学习,在缺乏外界知识源时易导致过拟合。本文提出MAHR方法,通过自动重用不同标记的分类模型,不仅可产生强泛化能力的多标记学习器,还能对标记关系进行估计。理论分析和实验验证显示出MAHR的有效性。2.提出一种可对标记关系进行自适应局部化利用的多标记学习方法ML-LOC。以往多标记学习方法在利用标记关系时常假设其对所有样本均适用,然而现实任务中标记关系往往各有其适用范围。本文提出ML-LOC方法,通过自适应构造局部关系编码来约束标记关系的影响强度。实验结果显示出ML-LOC比全局化利用标记关系的方法有更强的泛化性能。3.提出一种可利用标记关系的快速多示例多标记学习方法MIMLfast。以往多示例多标记学习方法通常仅能处理小规模问题。本文提出MIMLfast方法,通过将复杂的原始空间自动映射到低维的共享子空间,快速优化标记之间的相对排序。理论分析和实验验证显示出MIMLfast在保证强泛化性能的同时,能显著提高学习效率。4.提出可通过利用标记关系减少人工标注样本数的多标记主动学习方法AUDI和QUIRE。以往多标记主动学习方法常忽略标记关系,在选择样本查询时仅考虑单一因素。本文提出AUDI方法和QUIRE方法,间接/直接地利用标记关系,综合考虑信息量和代表性这两个重要因素。实验结果显示出AUDI和QUIRE能有效降低标注样本数。
其他文献
针对Ad-Hoc网络没有管理中心,资源受限等特点,解决了Ad-Hoc网络面临的新的安全问题,使Ad-Hoc网络得到更广泛的应用.结合基于身份加密和门限秘密共享两个基本理论,提出了一个适用于
在对多年《会计基础》进行教学的过程中我发现,学生在学习会计基础知识时总认为会计核算中的“结转”很高深、很复杂,难以学明白。经过多年的分析,我认为学生之所以不理解,其
企业人力资源管理外包作为公司管理中的一项新兴内容,正日益显示出高速的成长性和市场潜力。本文拟就企业人力资源管理外包的风险及其规避机制建立进行探讨。
据Ship&Bunker报道,中国台湾中油股份有限公司近期首次发布了最大含硫量为0.5%的燃料指标,其价格为489美元/t,比台中、高雄和基隆的180 cSt HSFO(高硫燃油)高出100美元,比花
期刊
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
研究背景临床路径是一种先进的质量效益型医疗质量管理模式。它在不降低临床医疗效果的基础上,可以缩短平均住院天数、减少医疗成本、规范诊疗流程、促进医疗资源的合理利用,对
厂用电的安全可靠关系到发电厂乃至整个电力系统的安全稳定运行。快切装置作为保障发电厂正常生产的重要技术措施,是实现发电厂厂用母线电源快速切换的关键设备。在厂用电源
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
从高血压病的整个发展过程看,早期及中期病人以血压升高为主要体征,并伴随头痛、眩晕、急躁易怒、失眠、肢体麻木抽动等症;后期出现靶器官损伤的心、脑、肾脏病变.中医将其分
目的:分析体外受精-胚胎移植(IVF-ET)后妊娠并发结核的临床特点。方法:回顾性分析2007年1月~2011年12月在兰州大学第一医院生殖中心IVF-ET后妊娠并发结核的10例临床资料。结