【摘 要】
:
近年来,动态增长的数据量和数据类别,对大规模数据分类研究提出了新的挑战。因此,利用全部数据训练一个新的模型变得不再可行,加之,增量数据的产生包括有标签数据和无监督数
论文部分内容阅读
近年来,动态增长的数据量和数据类别,对大规模数据分类研究提出了新的挑战。因此,利用全部数据训练一个新的模型变得不再可行,加之,增量数据的产生包括有标签数据和无监督数据,为模型的局部修改带来了阻碍。于是,我们提出了有监督的增量学习方法和无监督的增量学习方法。针对有监督的增量学习方法,随着数据及其类别数目增加,大多数传统的方法很难平衡精度和计算开销。比如,一些现有的方法精度不高,一部分方法耗时太久。在本文中,我们提出了一种增量式学习方法,即混合增量最近类平均随机森林(hi-RF)来处理这个问题。hi-RF方法对随机森林中一部分树进行替换,另一部分树更新其叶子节点的概率,使得新的任务出现以后,在较短的训练时间内,获得较高的分类精度。最终的实验结果说明,hi-RF在较少的时间开销下(约为批处理的1/3~1/2),获得较低的精度损失(不超过2.5%)。针对无监督的增量学习方法,传统的方法仅仅能在无监督数据分类上面起作用,但是面对增量学习便无能为力,尤其是无监督增量学习更是一个尚未被涉及的方向。为了填补这一空白,我们提出增量自动编码器(Incremental AutoEncoder,IAE)方法,以自动编码器作为基本模型,将原始任务的分类卷积神经网络作为分类器,加上相应的约束,使其能够增强对新的无监督任务的分类能力,保持对原始任务的分类能力。实验证明,IAE分类结果比聚类方法会好,而且实现了模型端到端的训练。
其他文献
随着共享经济的不断发展,我国共享出行行业兴起并发展壮大。从有桩公共自行车到共享单车、共享助力车,再到近年的共享汽车、网约车,共享出行行业的交通方式不断丰富。共享出行行业的壮大有利于智能交通的进一步发展,改善城市交通状况;也有利于提高资源的利用效率,培养人们绿色出行的理念。但是,由于共享出行行业中不同交通方式有其各自的特点,且该行业目前市场环境复杂、存在诸多不稳定因素,共享出行企业面临着巨大的财务风
背景:随着信息技术及信息产业的迅猛发展,人们的信息利用与信息检索需求不断提高,在当今以网络化、信息化为特征的时代,信息检索能力的高低影响着个人的社会竞争力,较强的信
图像分类与目标跟踪一直是计算机视觉领域中的核心问题。近些年来卷积神经网络(CNN)与TLD算法分别在这两个领域取得了瞩目的成果。与此同时,随着手机等移动设备的计算性能不
民族精神是一个民族的心理特征、文化传统、思想情感等综合反映。中华民族精神不仅是中华民族赖以生存发展的精神支柱,也是推动中国特色社会主义社会乃至整个人类社会发展的强
随着计算机技术的发展和国家的需要,超大跨度桥梁混合梁斜拉桥也发展迅速,越来越多的宽幅箱梁在混合梁斜拉桥被应用,但是由于宽幅箱梁整体宽度较大,并且超大跨度桥梁在世界上存量较少,更别说是混合梁斜拉桥,相对应的湿接缝相关研究还不是很多。因此,本文以实际工程为背景,对宽幅箱梁的湿接缝早起裂缝形成的原因进行分析研究。探究各种不同参数对宽幅箱梁湿接缝的早期裂缝的影响,并提出相应的裂缝预防和处理措施,为今后的同
随着云计算的快速发展,在开放环境下共享与处理数据显得尤为重要,数据所有者在上传数据时不仅要制订灵活的访问控制方案,而且还要保证与用户之间通信过程中的数据的机密性。
随着居民收入的增长和医疗技术的进步,医疗费用急剧上涨,医疗质量却没有因此得到大幅提升,过度医疗情况广泛存在。规范化诊疗流程的临床路径应运而生。但是纸质临床路径包含
在计算机视觉领域,行人重识别占有越来越重要的地位,因为它在刑侦、智能视频监控等方面应用的高效性,使得行人重识别具有很高的研究价值。给定一张行人图片,行人重识别旨在在不重叠的摄像头视域中查找指定行人的图片。近年来,尽管行人重识别的识别率已经有了较大的提升,但当行人重识别应用到多个数据集时,在一个数据集上训练的行人重识别的模型到了另一个数据集上往往表现较差。为了解决行人重识别中多个数据集之间的区域间隔
上世纪70年代以来,新古典主义经济学开出的金融自由化方案被很多国家采纳。但是,这一方案在实践过程中带来了金融脱实向虚、金融风险失控、金融危机等各种无效率、反效率问题