深度学习在弱监督多标号图像分类中的研究与应用

来源 :南京航空航天大学 | 被引量 : 1次 | 上传用户：kuibugo

【摘要】

：

网络通信的发展,使得大数据的收集成为可能,如何高效处理并利用这些数据成为首要问题。数据量的增加以及计算能力的发展,使得深度学习成为机器学习领域中的一大主流方法,而目

【作者】

：

张文

【出处】

：

南京航空航天大学

【发表日期】

：

2018年01期

【关键词】

：

深度学习注意力机制弱监督学习多标号学习属性识别多任务学习图像分类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

网络通信的发展,使得大数据的收集成为可能,如何高效处理并利用这些数据成为首要问题。数据量的增加以及计算能力的发展,使得深度学习成为机器学习领域中的一大主流方法,而目前很成功的方法都是基于强监督的,这意味着大量数据需要人工标注,但随着任务的复杂,数据量的增加,所消耗的人力也是巨大的。更一般化的弱监督多标号问题,即一张图片中所包含的多种物体,但不包含位置信息,该问题更具有一般性,场景更贴近现实生活,更具有实际的应用价值,而这些图片来源于自然场景下,由于背景、关照、变形等问题,且对应着多标号,问题复杂度也是呈指数变化。传统主流方法是通过人工特征结合多示例方法学习弱监督表示,随着深度学习的兴起,逐渐有相关工作关注该问题。本文主要是关注于深度学习在弱监督多标号图像分类中的研究与应用,主要贡献如以下,第一,深度学习与常用多标号方法相结合形成端到端的结构。传统多标号方法分特征抽取和分类器两个步骤,本文将深度模型与常用多标号损失相结合形成可导结构,并在公开数据集上验证其有效性;其次,提出了基于注意力机制的弱监督多标号图像分类框架。在该框架中,本文结合了卷积神经网络与递归神经网络,利用LSTM的序列学习能力,并首次加入注意力机制,使得模型在学习时能关注图片的局部,整个框架是端到端的,利用梯度下降法学习,自动调整关注区域,和传统的基于深度学习的方法相比,本文的算法在性能上有所提升,更重要的是,相对于其他方法具有更强的可解释性。最后,提出了基于多任务的类别不平衡的多任务人脸属性识别。本文在具体人脸属性识别任务上,针对多标号中常见问题,类别不平衡和人脸属性相关性,按照属性相关性进行分组并且使用了一种再平衡策略,设计了一个多任务人脸属性识别框架,在一定程度上缓解了不平衡问题,且该网络参数少,计算效率更高,且在公开的大规模人脸属性数据集CelebA和LFWA上获得最好的性能。

其他文献

南北车合并的案例分析

基于“一带一路”的战略构想以及中国的高铁外交,南北车的合并会加速中国企业的国际化,增加其协同性。本文财务角度以及非财务研发支出,纳税情况,资本结构三个角度进行了分析

期刊

中国南北车中国中车经济后果

Graves甲亢131I治疗后血清TGAb、TPOAb的临床研究

目的研究Graves甲亢131I治疗后血清TGAb、TPOAb的临床意义。方法通过Graves甲亢131I治疗后血清TGAb、TPOAb的检测,分析Graves甲亢经131I治疗后病情转归与血清TGAb、TPOAb的关

期刊

GRAVES甲亢131ITGABTPOAB131ITGAbTPOAbGraves hyperthyroidism131ITGAbTPOAb

转型社会中闽南节日庆典文化的实证调查

　　从社会学的视角探讨闽南地区节日庆典活动的现状。通过不同农村、郊区及市区三种类型的社区居民对闽南节日庆典的态度的调查，横向剖析这些节日庆典受性别、社区、年龄、文

会议

闽南地区社会转型节日庆典文化习俗

多排螺旋CT血管成像对左肾静脉压迫综合征的诊断价值

<正>目的:探讨多排螺旋CT血管成像对左肾静脉压迫综合征的诊断价值方法:回顾性分析我院手术证实且行多排螺旋CT血管成像诊断为左肾静脉压迫综合征患者8例,均为男性,平均年龄

会议

视网膜中央动脉阻塞的护理体会

目的探讨视网膜中央动脉阻塞的抢救时机与医护配合的体会。方法:对12例视网膜中央动脉阻塞的患者采取扩张血管、吸氧、降眼压、溶栓、营养视神经等治疗,提供及时有效的护理配

会议

视网膜中央动脉阻塞急救护理

铜仁市全域旅游发展模式选择

　　全域旅游是指将特定区域作为完整旅游目的地进行整体规划布局、综合统筹管理、一体化营销推广，促进旅游业全区域、全要素、全产业链发展，实现旅游业全域共建、全域共融、全

会议

全域旅游发展模式铜仁市梵净山

深度学习在弱监督多标号图像分类中的研究与应用

其他学术论文