基于半监督自步学习的跨任务深度网络应用于图像分类

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wei370210524
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类一直是计算机视觉领域备受关注的核心问题,是视觉语义理解的基础。但在信息爆炸式发展的今天,传统的机器学习范式,如监督学习和无监督学习,已经无法高效得解决大数据的问题。具体地,监督学习伴随着昂贵的人工标注成本,而无监督学习仍然不是很有效。因此,许多研究者逐渐将目光投向半监督学习,一种能同时利用标注数据和未标注数据进行学习的学习范式。半监督学习的研究始于上个世纪七十年代,尽管从理论、算法和实践等方面,半监督学习都有了很大的进展,如何有效利用未标注样本仍然是半监督学习的一个核心问题。传统的半监督学习算法基于不同的假设和方法已经有了各种各样的算法实现。然而,传统的半监督学习算法由于模型本身表达能力有限、计算存储开销大、优化推理复杂度高等原因,已经越来越无法满足大数据时代的发展需求。基于此,本文提出了基于深度学习的自步学习跨任务深度网络应用于图像分类。在半监督的场景中,直接在部分标注的数据上训练一个深度判别模型往往会遇到过拟合的问题,从而导致模型性能不佳。这是因为只有一小部分的标注样本可以参与训练,而标签传播很多情况下会带来错误。在本文中,我们引入了一个辅助聚类任务以探索图像数据的结构,并且合理得对未标注数据加权以减少模糊数据在模型训练时的影响。为此,我们提出了一个跨任务深度网络,同时学习分类和聚类这两个任务。基于模型的预测,大量的成对约束可以从未标注数据中生成,并且作为聚类任务的输入。因为成对约束编码的是弱监督信息,聚类任务对于标注中的错误容忍度更高。因此,根据未标注数据到发现的聚类簇的距离对未标注数据进行加权,应用加权的交叉熵损失函数可以训练一个更好的判别模型。此外,我们还采用了自步学习范式,逐步地从简单样本到困难样本,训练我们的深度模型。在常用的图像分类数据集和行人检测数据集上的实验证明了本文方法的有效性和优越性。
其他文献
供应链收益分配问题是供应链研究的一个重要方面。文章通过建立一个供应链的信息协同管理机构,实现供应链信息共享,使收益分配透明化,更好地实现供应链收益分配的公平和合理;
废弃采石场的再利用问题是近年来城市可持续发展的一个重要课题。位于城区或近郊的废弃采石场地用来进行开发建设是解决其再利用问题的有效途径之一。采石场由于人工开采而形
ABC(ATP-Binding Cassette)转运蛋白家族是目前已知最大、功能最广泛的蛋白家族,能利用水解ATP的能量来参与生物体内多种物质的转运,这一基因家族成员在哺乳动物和微生物中已广
1.耳朵听力的磨炼是最重要的。尽量及时地去辨别调式调性。敲钟的声音,拉动百叶窗的声音,布谷鸟的叫声——努力弄清楚发出的这些声音是何种调式调性。2.你一定要勤奋地练习音
随着教学方法与教学理念的转变,学生的学习方法也会发生变化。在教学中要重视教学方法,使学生对探究性学习产生兴趣,并掌握探究性学习的方法,积极参与教学实践活动,进行自主
目的:探讨优质护理服务在骨科护理工作中的应用效果。方法:2011年12月我科实行护士按层级分组固定分管患者,全面负责患者病情观察,治疗、护理、检查、病历书写、健康宣教、功能
并购可以看作是企业控制权运动过程中的一种权利让渡行为,成功的并购往往能够给企业的发展创造出新的机遇和条件,而一次成功的并购是离不开较为准确的价值评估的。文章介绍了
养心殿藏书——《宛委别藏》世人皆知纪晓岚所编《四库全书》,而对阮元所编《宛委别藏》则知之甚少。该书收辑《四库全书》未收之善本古籍,价值极为珍贵。书名为嘉庆皇帝亲赐
作为中国国际茶文化研究会会长的周国富委员今年带来了两份关于茶的提案,一份是“关于将陆羽茶文化申报世界非物质文化遗产”的建议,一份是“关于加快整合制定茶叶安全国家标准
报纸
目的:观察心可舒片对高血脂的影响。方法:采用患者自身重复对照法。观察心可舒片对原发性高脂血症患者血清胆固醇(TC)、甘油三酯(TG)、低密度脂蛋白(LDL)和高密度脂蛋白(HDL)的影响。结