迁移学习框架下不平衡分类问题研究

来源 :安徽工业大学 | 被引量 : 0次 | 上传用户:liongliong589
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
迁移学习是机器学习领域中新兴的框架,放宽了传统机器学习的两个基本假设,近年来受到了广泛关注。现有的关于迁移学习框架下不平衡分类问题的相关工作,主要集中于单源迁移研究方面,存在的潜在问题是可迁移信息较少,甚至可能会产生“负迁移”。针对已有迁移学习框架下不平衡分类问题相关研究存在的不足,本文通过引入多源迁移机制,展开了基于多源的迁移学习非均衡分类研究。首先,针对目标领域和源领域数据分布相似且正负样本不平衡的二分类迁移学习问题,论文提出一种基于多源数据的集成迁移学习非均衡样本分类算法MSTUSC。该方法引入多个源领域数据以避免“负迁移”,采用新的样本初始权重和样本权重更新策略来解决不均衡样本分类问题,并采用冗余样本淘汰机制,适时淘汰多源域中冗余数据,有效降低算法的时空开销。在UCI标准数据上进行实验,采用F1值和AUC值作为评价指标。实验结果表明,本文所提的MSTUSC算法在不平衡数据上的分类性能优于其它几种对比迁移算法。其次,为了改善MSTUSC算法的时间效率,还提出了面向分布式的多源数据的集成迁移学习非均衡样本分类算法DMSTUSC。引入分布式系统,将每个源领域划分到分布式系统的一个节点上,在单个节点上进行单源非均衡样本分类的集成迁移学习算法训练,得到分类模型,最终将每个节点训练得到的分类模型进行集成,得到多源数据的集成迁移学习非均衡样本分类算法。通过实验分析可知,同MSTUSC算法相比,DMSTUSC算法的时间效率明显提高。
其他文献
目的以弓形虫ME-49感染人T白血病细胞株Jurkat T细胞和Molt-4 T细胞为模型,以NF-κB及其相关调控蛋白为研究对象,分析NF-κB信号通路中调控蛋白A20在弓形虫诱导人白血病T细胞
随着生产型企业竞争力的加剧和人们环保意识的加强,企业的逆向物流逐渐受到人们的重视,有效降低企业逆向物流成本也成为企业取得竞争优势的重要途径.基于价值链分析方法,分别
民间信仰空间是闽南传统村落中重要的社区性公共空间,是社区历史文化及社区关系的重要载体。改革开放以来,农村社区面临快速的城市化,拆迁安置是其中最剧烈的转变,而民间信仰空间的特殊性使其成为转变中的焦点。本文以厦门市海沧区温厝社区作为研究对象,从“社会—空间”视角即国家与地方以及地方内部两个视角,来解析拆迁安置过程中民间信仰空间及其背后社区关系及组织制度的重构。民间信仰在国家法律中的模糊认定以及拆迁安置
油井出水是油田开发过程中不可避免的问题,影响油井产量,堵水技术是控水稳油的关键。泡沫流体因其具有遇水稳定、遇油消泡、对渗透层具有良好的选择封堵性、对地层伤害小等特
背景及目的环氧合酶-2(cyclooxygenase-2,COX-2)不仅可参与细胞的增殖及分化,而且在肿瘤的浸润、转移及血管生成等过程中起重要作用,从而促进肿瘤的发生及发展,已成为肿瘤防
近年来,我国部分地区大气污染问题日益严峻,雾霾天气多次爆发,造成雾霾最直接的原因是大气中超标的悬浮颗粒物。监测显示,因建筑施工现场产生的扬尘污染,已经成为造成雾霾天气的首要因素,有效控制施工扬尘污染是改善空气质量的重要环节。据统计,国内外研究的抑尘剂主要是针对煤尘、矿尘、道路尘的,适用于建筑施工现场扬尘的抑尘剂比较少,尤其是适用于建筑施工现场扬尘的复合型抑尘剂更少。因此,对于建筑施工现场复合型抑尘
近十年多来,我国核桃产业得到快速发展,核桃栽培面积迅速扩大。林下生草栽培是一种生态经济的果园经营模式,其不仅对生态友好,而且能有效地抑制杂草滋生,达到整洁园地和减少
颗粒细胞瘤少见,特点是自然病程长,临床明显治愈后数年(平均初始治疗后6年)复发倾向。手术治疗为主,但手术范围未统一。完全切除后辅助治疗的作用有待确定。晚期病例以顺铂、
<正>幼儿时期是孩子成长的关键时期,作为一名幼儿教师,要重视对幼儿的培养,做好幼儿的教育工作。笔者在幼儿培养和教育方面进行了探究和实践,下面,笔者结合自己多年的教学实
会议
运用中医脏象、经络学说及痰、火、气、血理论,对108例在心理病房住院及精神科门诊的患者进行临床辨证,从中发现以忧郁、焦虑等情绪障碍为主的一类疾病中,肝气郁结为主的42例,以加味逍