【摘 要】
:
传统机器学习中,通常假设训练数据与测试数据的分布具有一致性,而且训练数据是基本充足的。随着机器学习的广泛应用,遇到的很多问题中训练数据与测试数据分布不同,或者可用的
论文部分内容阅读
传统机器学习中,通常假设训练数据与测试数据的分布具有一致性,而且训练数据是基本充足的。随着机器学习的广泛应用,遇到的很多问题中训练数据与测试数据分布不同,或者可用的训练数据不足以训练一个好的分类器。迁移学习是解决这类问题的方法之一,该领域的研究具有较高的学术价值。迁移学习算法因为显著提高了学习效果而被广泛研究和使用。但是研究发现算法的权值更新策略会导致训练样本整体上的权值漂移问题,而且算法对源域和目标域样本分布相似性要求较高。论文改进了权值更新策略,在每一轮训练中,同时利用每一轮源域和目标域样本上的误差来更新训练样本的权值,再进行下一轮迭代训练。迭代完成之后,再用集成学习的方法得到一个较好的分类器。给出的新方法改善了迁移学习算法的权值漂移问题,而且减弱了源域和目标域相似性较高的约束。在很多实际问题中,可以用多个不同的方法或从不同的角度对同一事物进行描述,这些不同描述就构成了事物的多个不同视图。研究视图间的关系来帮助迁移学习具有一定的理论意义。论文利用典型相关分析处理训练数据,利用特征融合方法组成新的视图,再进行迁移学习。给出的算法利用了多视图数据间的关系,改善了迁移学习效果。协同训练是多视图问题中的经典方法,协同训练和迁移学习的结合具有研究价值。论文利用协同训练的思想,在迁移学习每一轮的训练过程中,在两个视图上进行协同更新训练样本权值,再进行下一轮迭代训练,最后用集成的方法得到一个较好的分类器。给出的基于协同训练思想的多视图迁移学习算法较好的利用了协同训练的思想,改善了权值更新效果,提升了整体上的分类器性能。
其他文献
随着网络技术的飞速发展,以电子政务、电子商务为代表的基于Internet的各种应用正广泛兴起,网络的开放性与信息的安全性之间的矛盾日益变得突出。人们需要在网络中通过信任与
无线通讯技术与Internet技术的迅猛发展推动了无线数据业务的发展。越来越多的移动用户开始通过无线终端访问Internet,使用基于分组域的无线数据业务。为了抢占无线数据业务
视图发布是数据交换的主要手段,但目前视图的维护基本上仍采用手工操作,即当源模式发生变化时,这些变化由相关人员找出,然后决定如何对发布的视图进行相应的更新。因此,视图
高分辨合成孔径雷达(Synthetic Aperture Radar,SAR)突破了外界条件影响的局限,是一种能产生高分辨率遥感图像的相干系统,具有全天候、全天时、多波段、多极化工作方式、可变
图像分割技术的应用领域涉及人类生活的方方面面,涵盖计算机视觉、生理学、认知学与计算机科学等多个学科,是一门结合理论与应用为一体的图像处理与识别技术。而彩色地图图像
边缘是图像最核心的属性,包含了很多有用的数据。边缘检测技术利用图像的边缘信息对图像进行分割获得目标图像,它是图像进行其它处理的基础。因此,被广泛的应用在图像分割、
随着人们生活水平的提高和科学技术的发展,嵌入式系统的应用越来越多,嵌入式系统几乎包括了人们日常生活中的所有电器设备,如掌上PDA、移动计算设备、电视机顶盒、手机上网、
随着Internet的迅猛发展和网络社会化的到来,互联网面向商业用户和普通公众开放,网络通信和业务量以滚雪球式增长。同时,由于Internet本身安全方面的缺陷,黑客网络攻击与入侵行为
随着数字医疗设备和计算机网络的普及,越来越多的人开始关注医院PACS系统的建立。其主要涉及医学图像的格式和压缩:在格式方面,国际放射学会发布了DICOM标准,使得DICOM的浏览
随着计算机网络和功能强大的多媒体工具的快速发展,数字媒体的完整性及安全性越来越受到重视。数字水印被广泛地应用于数字图像的保护,它通过嵌入算法将具有特殊作用的水印信息