【摘 要】
:
随着科学技术的快速发展,如何在大量数据中得到有价值的信息逐渐成为机器学习研究的热点问题。迁移学习的提出,突破了传统的机器学习的两个限制条件:训练数据与测试数据必须
论文部分内容阅读
随着科学技术的快速发展,如何在大量数据中得到有价值的信息逐渐成为机器学习研究的热点问题。迁移学习的提出,突破了传统的机器学习的两个限制条件:训练数据与测试数据必须服从相同的分布规律,而且要有足够数量的训练数据。迁移学习可以利用以前获得的知识更快更有效地解决新的但是要相类似的问题。与传统的机器学习方法相比,迁移学习利用容易获取的源领域中的大量训练数据辅助少量的目标领域的训练数据进行预测模型的训练,从而克服了传统机器学习的缺陷,提高了预测模型的泛化能力,大大的扩展了机器学习可以解决的问题的范围。为了改善现有的迁移学习方法的性能,以更好的处理现实中的知识迁移问题,本文重点研究迁移学习中实例迁移这一领域的相关算法,并针对该领域经典的TrAdaBoost算法存在的问题,包括:源领域权重下降过快;迭代加深后源领域权重过低;基分类器之间差异度较小导致最后集成模型分类效果不理想等问题,做出了四项改进。改进的内容包括:(1)提出了一种基于差分进化的特征选择算法DEFSS,该算法根据训练数据每轮迭代权重分布不同的特点,可以为每个基分类器生成不同的特征子集,在不同的特征子集上训练基分类器可以增加基分类器之间的差异度;(2)为了进一步提高基分类器之间的差异度,为TrAdaBoost引入异构基分类器技术,使用多种分类算法训练基分类器;(3)根据基分类器在源领域的分类误差,为源领域引入权重回补因子以减缓源领域权重下降速度;(4)设置新的初始权重,防止在迭代加深后源领域权重过低。为了验证我们对TrAdaBoost的各项改进是有效的,我们将基于各项改进的算法分别命名为DEFSS-ATrA,DEFSS-HeteroTrA。在标准数据集20Newsgroups和Reuters-21578 上将 DEFSS-ATrA,DEFSS-HeteroTrA 与 TrAdaBoost,DTrA,ATrA进行了对比实验,以验证本文提出的算法DEFSS-ATrA和DEFSS-HeteroTrA的可行性和有效性。实验结果表明,在验证数据集上,改进后的算法DEFSS-HeteroTrA取得了比DEFSS-ATrA,TrAdaBoost,DTrA,ATrA更好的分类准确率,这表明本文对TrAdaBoost的改进是有效的。
其他文献
目的:探讨肌电生物反馈疗法联合神经肌肉电刺激(NMES)对脑卒中吞咽障碍患者吞咽功能及营养状况的影响。方法:60例脑卒中吞咽障碍患者随机分为常规组、NMES组、综合组各20例,
人们往往以“诗的国度”来赞誉和强调诗歌在中国古代文学中的重要地位,实际上,散文这种文学样式在中国古代文学中的地位一点也不亚于诗歌。较之诗歌而言,其产生时间更早,使用范围
目的了解不同职业者的经济收入与医药费用情况;有助于社会安定团结及提高人群生活质量.方法取某矿区工人及居民男性500人,随机抽样问卷填表式,用SPSS10.0软件包分析.结果问卷
研究了鳙鱼鱼片的脱腥调理和脆化工艺。比较了不同的脱腥剂对鱼片的脱腥效果,结果表明,以“2.0%红茶+0.75%NaCl”作为脱腥剂效果最好。在此基础上,采用正交试验优化了脱腥剂
轨迹数据是连续轨迹点的集合,轨迹点通常是具有时间和空间属性的空间点对象。在互联网、GPS定位等技术迅速发展的背景下,轨迹数据的种类、规模及其产生速度都在迅速增加。海量的轨迹数据必然蕴含了诸多有用的信息,通过不同的技术与方法对这些信息进行挖掘分析,对空间数据的研究与应用有着重要意义。数据的查询与统计是数据挖掘分析的必要条件,也是互联网产品日常使用过程中的基本需求;高效的数据查询与统计速度不仅能保障数
深空探测器由于任务持续时间长、飞行距离远,一旦出现系统或部件故障很难进行在轨维修。为了提高深空探测器控制系统的安全性和可靠性,本文以探测器姿态控制系统执行机构部件
我国因自身的地形地貌和气候条件等因素的影响,导致我国成为世界上滑坡灾害发生最为频繁的国家之一。我国每年因滑坡造成了巨大的人员伤亡和经济损失。而滑坡发生前的形变监测和分析能为滑坡灾害预警提供重要的参考和决策依据。2008年5月12日于中国四川省阿坝藏族羌族自治州汶川县发生了里氏震级8.0 Ms的特大地震,此次地震不仅造成了巨大的人员伤亡、建筑物的损毁和财产损失,也对当地的生态环境和地质构造造成了很大
在中国传统文化中,月亮不仅仅是光照人寰的一个客观星体,而且是通脱淡泊的一种文化象征。本文试结合中等职业教育课程改革国家规划新教材《语文》(基础模块)下册中"月亮"意象
发生在电极表面的电催化反应往往伴随着一些物种的吸附,这些物种包括水分子、溶液当中的阴、阳离子,反应物或者溶液当中其它物种本身或其分解的产物。这些吸附物种会不同程度
随着通信网络的普及,手机成了大众出行必不可少的物件,作为手机使用的主流群体,大学生在享受手机带来的便捷和娱乐的同时,出现了对手机过度依赖的现象。采用问卷调查的形式,