基于集成学习的在线迁移学习算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:zoook
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
迁移学习(Transfer Learning)是研究如何利用其他相关领域已有经验和知识来帮助学习目标任务的方法。大多数现有的研究都是在离线数据之上进行的。而实际应用中常常需要面对在线场景下的学习任务,在这些问题中的训练样本均按一定顺序依次到来,通常无法直接获取或需要付出高昂的代价。因此进行有效的在线迁移学习算法研究具有重要的现实意义。但是,现有的在线迁移学习方法仅简单实现了将在线学习方法引入到迁移学习的问题中,并未充分考虑所选的在线学习策略是否适合当前的迁移挑战,以及由此带来的新的性能问题。包括模型无法捕获样本中更复杂和更丰富的关联结构信息问题,权重漂移问题,误分类数据的过度拟合问题以及源和目标数据失衡问题。因此本文旨在结合集成学习和迁移学习来构建三个全新的在线迁移学习算法来解决上述存在的问题,改善算法的分类性能表现。论文中提出的第一种算法是基于动态权重补偿的在线集成迁移学习算法DCOTB。利用集成学习Boosting方法来构建基础分类器,并创新性的引入动态权重补偿策略,解决在线迁移集成中存在的权重漂移问题。论文工作的第二种算法是在线迁移套袋算法OTBag。该算法结合集成学习中的在线Bagging思想,对样本采用引导采样来替换权重调整,避免对错误分类的过度拟合以及权重漂移问题的出现。算法通过OTBag-SDMV和OTBag-JDSMV两种过滤策略,来提高算法应对负迁移的能力。论文的最后一项工作是提出基于MultiBoosting的在线迁移学习算法OTMB。该算法借鉴了 Bagging与AdaBoost在减少偏差和方差上的表现,并通过它们的组合来保留这种优势,实现有效抑制单一 Boost模型下容易对错误数据过度拟合的问题,以及单一套袋方法所导致的样本损失和源数据和目标数据的不平衡采样问题。论文通过数据集上的实验结果依次验证了三种算法的有效性。
其他文献
主客体化学是二十世纪七十年代由超分子化学衍生出的一门分支学科,经过五十多年的迅速发展,已经成为联系有机化学、生物化学、高分子化学以及新型材料科学的重要纽带,并且在医学、影像学、仿生学等领域有着广阔的应用前景。基于主体、客体之间的主客体组装,客体分子的选择多为平面的多环芳烃,而巴基碗并不是一类常见的客体分子。巴基碗作为富勒烯的片段分子,是一类碗形的芳香烃化合物,主要分为心环烯(Corannulene
学位
立体视觉对象的表示与识别在工业制造与智能交通中扮演着重要的角色,因此吸引了学术界的广泛关注。立体视觉对象常见的表示形式有:点云、视图、体素、网格等。对于立体视觉对象,不同的表示形式有着完全不同的数据组织结构,因此使得立体视觉对象的学习任务难度大增。特别是在多模态的联合表示学习上,不仅要解决单一模态的学习问题,还要提出合适的框架去融合不同模态的数据表示,从而达到对立体视觉对象更加精准的多模态联合刻画
学位
谣言的广泛传播对社会的危害性极大,轻则侵犯公民或社会组织的个体权利,重则造成社会恐慌,摧毁社会信任体系,甚至危害国家安全。很多学者研究了辟谣的相关方法,然而目前的辟谣工作仍然需要大量的人工干预,存在着工作内容繁琐、辟谣时效性滞后等问题。辟谣文本生技术能够极大降低辟谣工作的人工成本和时间成本,是及时抑制谣言传播、有效降低谣言社会危害性的关键技术。然而,目前关于辟谣文本生的方法还鲜有学者研究。辟谣文本
学位
从目前已经发布的政府文件中的有关监管要求归纳分析当下NFT交易平台合规经营的去金融化路径。就本身的属性而言,NFT与FT的核心区别在于它的稀缺性、不可分性。从近期国内政府发布的一系列公告、通知或文件来看,数字藏品的去金融化工作则属于平台是否能存续运营的关隘所在。
会议
作为燃料电池(FC)的关键组件,离子交换膜对于其性能有着至关重要的影响。相较于质子交换膜燃料电池(PEMFC),碱性阴离子燃料电池(AEMFCs)现已展现出诸多优势,然而其主要短板依旧存在于离子交换膜。目前,阴离子交换膜(AEM)研究与商业化生产存在的主要问题包括离子电导率较低、碱稳定性较差、合成成本过高等。当前研究人员普遍认可的提升AEMs碱稳定性的方法有选用碱稳定性较高的离子交换基团,减少膜内
学位
随着深度神经网络在视频内容理解与分析任务上取得卓越的效果,基于深度学习的自动视频描述已经广泛的部署在现实应用中。视频自动描述的主要挑战是从大量的帧中捕获关键视觉信息,比如物体、动作和时空关系,并用语法正确的句子进行整体的描述。现有的视频描述方法大多集中于利用注意力机制,捕获全局视频中的关键帧或帧中的关键区域来对视频的语义信息进行建模,而忽略了视频本身的层次结构。视频内在的这种由粗粒度到细粒度的层次
学位
基于语义标签图的图像生成(语义图像生成),是指根据输入的像素级别的标签(语义标签图),去生成与真实图片接近的“伪真实图”。该任务可用于图像编辑、图像渲染等场景。语义图像生成任务一般用生成对抗网络(Generative Adversarial Networks,GAN)来训练,其往往需要大量的参数和计算力。在GAN模型结构与参数量足够大的情况下,其生成图像的质量尚且可观。但是,当应用场景的硬件条件比
学位
手语(Sign Language,SL)作为一种特殊的视觉自然语言,依靠手动特征和非手动特征等多通道信息传达语言信息。近年来,手语翻译(Sign Language Translation,SLT)作为弥合聋人和听人之间沟通鸿沟的重要应用,已引起学界的广泛关注。其中,基于神经机器翻译框架的SLT是伴随着人工智能领域发展而新兴的研究领域。我们发现基于目前的研究框架,很难通过弱监督的形式深度挖掘手语作为
学位
析氧反应(OER)和氧还原反应(ORR)是可再生能源转换和存储技术中重要的两个电极反应,开发价格低廉、高效稳定的电催化剂是实现能源转化技术产业化的关键。从微观层面认识催化剂晶体结构、电子结构与催化活性之间的内在关联对设计高活性电催化剂具有重要意义。本文以结构可调控、价态丰富的Mn基钙钛矿氧化物为研究载体,通过元素掺杂、外加磁场等策略有效调控催化剂的电子结构和电子自旋态,结合同步辐射光源的X射线光电
学位
报纸