【摘 要】
:
大数据背景下,机器学习研究依赖于大量拥有精确标注的高质量数据。然而,获取精确的数据标注需要耗费大量的人工成本,研究怎样在缺乏数据标注的情况下进行有效的机器学习实验成为了一大研究热点。由此,迁移学习应运而生。本文的研究内容属于迁移学习的一个分支:域适应。域适应的目的是通过从源域迁移知识到目标任务上来减少对目标域的标注工作,以实现降低标注成本的作用。本文主要研究带有标签噪声的源域数据的有监督域适应问题
论文部分内容阅读
大数据背景下,机器学习研究依赖于大量拥有精确标注的高质量数据。然而,获取精确的数据标注需要耗费大量的人工成本,研究怎样在缺乏数据标注的情况下进行有效的机器学习实验成为了一大研究热点。由此,迁移学习应运而生。本文的研究内容属于迁移学习的一个分支:域适应。域适应的目的是通过从源域迁移知识到目标任务上来减少对目标域的标注工作,以实现降低标注成本的作用。本文主要研究带有标签噪声的源域数据的有监督域适应问题。为了减弱标签噪声带来的负影响以及解决不同域之间分布不同的问题,本文提出了使用采样于源域和目标域且类标签相同的域混合图像组来进行学习。为此本文通过注意力机制来生成每个图像组的表示,并以此来训练分类器。通过注意力机制所获得的权重可以减弱噪声样本在训练过程中带来的负影响,由于同时兼顾了源域样本和目标域样本,图像组的表示就能够成为填补源域和目标域的域间空隙的可迁移特征。为了进一步提升模型的域适应能力,本文使用了基于对抗学习的方法来生成域不变特征,在域混合图像组的基础上进一步改进了模型。本文提出的域混合图像组方法,不仅考虑了源域数据中存在噪声的情况,还将实验场景拓展到小样本背景下,并且利用对抗学习的方法进一步提升了模型的域适应能力。本文所采用的实验模型是基于深度学习的神经网络模型,并在不同数据集上进行了验证分析。最后得到的结论如下:(1)为噪声样本分配一个更小的权重可以在一定程度上解决噪声带来的负影响。(2)基于域混合图像组来训练分类器可以解决域间分布不一致的问题,而且可以防止出现过拟合现象。(3)基于域混合图像组的域适应模型对不同噪声等级下的训练数据都具备鲁棒性。(4)增加了对抗学习之后,模型的分类性能和抗噪性能进一步提高。
其他文献
随着金融研究的深入,越来越多的金融学者已经认识到披露的信息处理成本会对信息纳入股票价格产生显著影响,但是却一直缺少实证上的证明,究其原因,可能是因为信息处理成本难以测量。因此,本文首先提出了信息处理成本的测量指标——年报文件大小,为了保证年报文件大小衡量信息处理成本的有效性,本文对影响年报文件大小的因素进行了实证分析。实证结果证明了年报文件大小与公司业务复杂程度,例如公司规模、高级管理者数量、子公
项目投资过程中存在着大量风险因素,如何尽早识别出项目风险,是实现项目目标的关键步骤,也是项目风险管理工作的基础。在证券市场上,股价的异常波动,尤其是股价暴跌导致的股价崩盘现象,历来都是投资者高度警惕的,希望能通过尽早识别出股价崩盘风险,合理安排投资,降低风险事件发生的可能性。与此同时,环境、社会责任和公司治理(Environmental,social and governance)投资策略以可持续
为更好地规范行业管理,本文对近年来上海市农村生活污水治理前、治理后的水质及水量进行统计梳理和归纳分析,重点研究上海市各阶段出水水质执行标准,总结设施出水水质监管情况,并对下阶段农村生活污水治理提高出水水质工作提出对策和建议,可为农村生活污水治理工作提供参考。
针对当前我国高水平科技自立自强和科技创新提质增效的迫切需求,如何充分盘活高校科技成果、调动科研人员转化积极性,是实施创新驱动发展战略和加快创新型国家建设的必然选项。目前,科技成果转移转化仍是我国高校科技创新工作亟待强化的环节,科技成果和社会经济之间的鸿沟尚未完全弥合,整体转移转化水平较低。文章分析了我国高校科技成果转移转化现状和存在问题,在总结典型经验的基础上,为如何有效提升新时代我国高校科技成果
农村商业银行信用卡业务的经营、发展模式及管理方式能否与时俱进至关重要,在一定程度上,影响到我国最基层群众的切身利益。农商银行的客户群体在收入水平、教育程度等方面有一定的限制,这些因素让农商银行信用卡业务面临更大的挑战。农商银行的信用卡违约风险的评价规则并没有很好的反应客户真实的违约风险。而互联网金融公司中,已经开始采用数据挖掘等方式进行违约风险的预测,并获得了一定的成效。因此,本文参考国内外先进金
2018年3月26日,上海期货交易所原油期货(SC原油期货)正式上市。这是中国金融市场对外开放和人民币国际化进程的一个重要里程碑,对国家原油战略安全的维护和我国国际原油市场定价权的提高有重大意义。上市三年来,SC原油期货市场平稳运行,获得了市场的逐步认可,一跃成为全球第三大原油期货品种。由于SC原油期货在为我国金融机构提供资产配置工具、为产业机构提供套期保值工具等方面发挥着重要的作用,对于其价格的
心律失常发病率高,其发生会降低患者生活质量,严重时甚至会威胁患者生命。大量研究证实自主神经具有调控心律失常的作用,心脏自主神经活动异常会增加心律失常概率。通过对自主神经关键靶点进行调控,实现自主神经再平衡,可有效减少心律失常的发生。随着研究技术的发展,不同自主神经关键靶点被陆续发现,投放于心律失常的临床治疗中,且具有良好的治疗效果。本文将从心律失常自主神经调控机制和自主神经相关心律失常防治策略两个
计算机软件经历了数十年的发展,其规模越发的庞大,复杂性也不断的提高。在功能不断完善的同时,这种背景下产出的软件系统也会暴露处一些问题。其一是由于庞大的代码量带来的学习、迭代和维护成本低的陡然上升,其二是软件系统面临的宕机和安全漏洞等风险也不可避免的升高。而随着复杂网络和软件网络理论的诞生和发展,这些问题有了一定程度上被解决的可能。复杂网络由于存在小世界效应和无标度特性,其节点呈现“不均匀”的分布,
近十几年,银行卡、网上支付、数字货币等各类非现金支付工具在祖国大地生根发芽,快速发展,已成为除现金之外的一类重要支付工具。我国非现金支付工具的交易总量和交易总额呈现连年递增趋势,非现金支付工具的快速普及应用对现金的使用产生了冲击。本文从支付工具选择视角出发,运用定性分析和实证分析方法,探究了非现金支付工具对用户货币需求结构的影响,并分析了该影响在不同特征用户群体间的异质性。本文首先就国内外有关货币
国家非常重视高校科技成果转化管理机构建设,教育部于2019—2020年公布两批高等学校科技成果转化和技术转移基地名单,共包含71所高校。尽管这些高校都建立了科技成果转化管理机构,但这些管理机构的管理模式存在较大差异。文章选取其中41所高校作为样本,收集高校科技成果转化管理办法以及相关管理机构网站的信息,通过文本分析发现,高校科技成果转化管理机构存在单一管理模式和多头管理模式,并细分为5种类型,即高