多任务聚类研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:liuya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统聚类方法只能对一个任务中的数据进行划分。但是在很多情况下,单一任务中的数据是有限的,这不足以获得很好的聚类性能。在现实生活中,很多任务是相关的,多任务聚类通过在任务之间迁移相关知识来提高所有任务的聚类性能。利用类标签的监督多任务学习方法已经研究得比较成熟,而不利用类标签的多任务聚类方法还有很多问题亟待研究。多任务聚类要处理的数据分为三种类型:同域数据、多域数据和多视角数据。本文分别针对这三种数据设计了多任务聚类方法。(1)同域数据的多任务聚类:同域数据指多个任务中的数据来自于同一领域。针对现有多任务布雷格曼聚类方法存在的缺陷,本文提出了三个改进方法。①智能多任务布雷格曼聚类:该方法引入损失函数作为判断条件,从而解决了多任务布雷格曼聚类带来的质心偏移问题。②多任务核聚类:该方法将数据映射到再生核希尔伯特空间,从而解决了多任务布雷格曼聚类不能很好聚类非线性可分数据的问题,但它依然会导致质心偏移。③智能多任务核聚类:该方法通过引入损失函数并将数据映射到再生核希尔伯特空间,从而既解决了质心偏移问题,又解决了非线性可分数据的聚类问题。(2)多域数据的多任务聚类:多域数据指多个任务中的数据来自于不同领域。首先,针对现有部分相关多任务聚类方法过少且具有限制条件的问题,本文提出了两个泛化能力更强的方法:①自适应多任务聚类只在任务之间相关簇构建的子任务中,通过共享最近邻相似度迁移实例知识;②多任务模型相关性学习聚类通过学习任务之间簇线性回归模型参数的相关性来迁移模型参数知识。其次,针对现有多任务聚类方法只能迁移特征、实例和模型参数中的一种知识,而不能充分利用任务间相关知识的问题,本文提出了三个同时迁移特征和实例知识的方法:①基于特征和实例迁移的多任务聚类适用于完全相关任务;②流形正则化编码多任务聚类适用于部分相关任务;③基于特征和实例迁移的加权多任务聚类对完全相关任务和部分相关任务都很适用。(3)多视角数据的多任务聚类:多视角数据指每个任务中的数据包含来自不同视角的特征。目前还没有针对此类问题的方法被提出。本文首先提出了一个基于联合聚类的多任务多视角聚类框架,它包含三部分:单任务单视角聚类、多视角关系学习和多任务关系学习。然后本文基于这一框架提出了两个方法:①基于二分图的多任务多视角聚类采用二分图联合聚类,它只能处理带有非负特征的数据;②基于半非负矩阵三分解的多任务多视角聚类采用半非负矩阵三分解联合聚类,它也能处理带有负数特征的数据。
其他文献
公安边防部队执法风险相对于其它风险,不同点在于,它强调风险的领域与环节是在办理治安和刑事案件过程当中,所造成的损失是由于违反办案规律或者因自身失误所遭受的不利后果,
报纸
自上世纪20年代初期,鲁迅将西方文艺理论中的“典型”概念引入中国后,典型开始作为一种重要的文学观念进入了我国的文艺理论与批评领域。对于典型的研究,经历了30年代中期胡
本文首先以水飞蓟素为原料,对水飞蓟宾的精制与纯化方法进行研究。应用超声波辅助手段对传统的重结晶方法进行了改进,并与柱层析精制水飞蓟宾的方法进行比较,考虑到产率、毒
本研究以凡纳滨对虾(Litopenaeus vannamei)为试验动物,以浸提豆粕、浸提花生粕、浸提棉粕和浸提菜粕为研究对象。设计了两种试验饲料,一是分别以27%豆粕、24%花生粕、24%棉
目的:从抑菌、抗炎及对免疫功能的影响三个方面阐述痤疮颗粒治疗痤疮的作用及作用机理。方法:以痤疮丙酸杆菌(P.acne)、表皮葡萄球菌、金黄色葡萄球菌、柠檬葡萄球菌为实验菌,比
随着国家素质教育的不断发展, 2004年3月,教育部颁布了具有全新课改理念的《普通高中思想政治课程标准(实验)》,教师教学方式的转变已成为必然的要求。我感到新课标,突出的变
数据仓库能使企业的决策者对企业的前进方向进行预测和分析,越来越得到广泛的应用,在很多的领域也取得了成功。但纵观目前数据仓库的构建状况,其中绝大多数的数据仓库是失败的。
区域竞争力是当代区域经济学研究的重要课题之一,它从提升区域竞争力的方位切入,将研究对象(区域)置于一个更大的范畴,运用管理学、区域经济学、比较经济学等原理进行比较分析,判
段玉裁是清代著名的小学家。他在文字学、音韵学、训诂学上的成就,集中表现在他的代表作《说文解字注》(简称《段注》)中。书后所附《六书音韵表》是段氏古音学的代表作,全书集
丹参是我国传统重要中药,具有活血化淤、理气止痛之功效,其各种制剂被广泛用于心脑血管病的治疗。丹参的主要功能成分为脂溶性的丹参酮和水溶性的原儿茶醛、丹参素。丹参酮又包