【摘 要】
:
随着深度学习在计算机视觉任务的应用越来越广泛,当下深度神经网络模型在图像分类、目标检测、语义分割等任务中表现优异,但是监督学习式的模型训练需要大量人工标注信息,这些标注信息,尤其是位置相关的标注,往往会耗费大量的人力物力,因此对标注信息依赖更低的弱监督学习方法成为了研究热点。弱监督学习是机器学习的一种方式,区别于监督学习模型要求标注与模型输出一一对应,弱监督学习依赖的标注信息仅需要部分层级标注,故
论文部分内容阅读
随着深度学习在计算机视觉任务的应用越来越广泛,当下深度神经网络模型在图像分类、目标检测、语义分割等任务中表现优异,但是监督学习式的模型训练需要大量人工标注信息,这些标注信息,尤其是位置相关的标注,往往会耗费大量的人力物力,因此对标注信息依赖更低的弱监督学习方法成为了研究热点。弱监督学习是机器学习的一种方式,区别于监督学习模型要求标注与模型输出一一对应,弱监督学习依赖的标注信息仅需要部分层级标注,故弱监督学习在实际计算机视觉任务中具有良好的应用前景与实际意义。本文以此作为出发点开展弱监督学习在计算机视觉中的应用研究。通过多示例学习的方式训练网络模型是一种弱监督模型构建思路,在模型完成分类任务的同时输出表示目标位置的热力图信息,从而依靠模型输出的类别热力图完成相关视觉任务。但是现实场景图像中的目标特征呈现多样性,如何构建模型提取多样性的目标特征从而生成质量更好的热力图是本文的重点研究内容,本文依据构建的模型实现了具体的计算机视觉任务。本文的主要工作如下:(1)利用深度卷积网络不同深度特征提取语义层级不同的特点,构建了基于多尺度特征图的网络模型,提出了相应的多尺度全局池化方法和生成类别热力图的方法,并提出了一种约束性损失函数使热力图对目标的包围更加紧致,从多语义层级的角度实现特征多样性的提取;(2)通过调研卷积操作的变种,结合可变形卷积操作,利用不同膨胀率对卷积采样感受野不同的特点,提出了基于多膨胀率可变形卷积的网络模型,此模型使用类别激活响应方法和融合手段生成类别热力图,从变换卷积感受野的角度实现特征多样性的提取;(3)采用多示例学习方式训练上述模型,并实现了多分类任务、目标定位和目标检测任务,其中在目标检测任务中,提出构建了一种基于类别热力图的检测框架。通过实验对比了模型在这些任务中的性能,并采取可视化分析评估了模型的优点与短板。本文的模型训练仅依赖于全局图像分类标注,最终完成了目标定位、目标检测等针对位置的视觉任务,实验结果证明了本文提出的模型和改进是有效的,实现了弱监督学习在视觉问题上的应用。
其他文献
《美国医学会杂志》研究表明,睡眠不足7小时,感冒几率增加3倍。
在处理含氮废水上,厌氧氨氧化(Anaerobic Ammonium Oxidation,简称ANAMMOX)比传统的硝化—反硝化工艺更经济高效。其最大的特点是,将氨氮(NH4+-N)和亚硝氮(NO2--N)转变为氮气(N2),而不需
本文通过对歌剧大师贾科莫·普契尼(Giacomo Puccini)的歌剧作品《艺术家生涯》中男高音经典唱段《冰凉的小手》的写作背景与作品分析的研究,论述普契尼怎样运用戏剧、音乐的
<正>曾经"得餐饮者得天下",如今做餐饮渠道找死,不做餐饮渠道等死,餐饮成为酒类品牌的鸡肋渠道,白酒在新环境下如何把握餐饮的渠道价值?重新认识餐饮渠道15年前,"得餐饮者得
"立德树人"作为高职学生艺术教育的根本任务,它不仅是一种教学形式,也是艺术形式的具体体现。作为高校的教育工作人员,培养学生不能只关注理论知识的传授,也要重视学生的全面发
设计了一种基于TMS320LF2812的无刷直流电机(BLDCM)数字控制系统。介绍了系统的工作原理及软硬件设计过程。采用霍尔传感器获取转子位置,利用PID算法实现高精度控制,可有效地产
<正>糖尿病(DM)已成为临床常见病、多发病。糖尿病视网膜病变(DR)是DM最常见的微血管并发症之一,其发生率为30%~60%。在发达国家,其致盲率是工作年龄人群致盲疾病的第1位[1]
目的探讨分期针刺配合面肌功能训练治疗面神经炎的疗效。方法64例面神经炎患者随机分为治疗组和对照组各32例,两组均采用超短波治疗及面肌功能训练治疗,治疗组加用分期针刺治
目的探讨桂枝茯苓胶囊在慢性盆腔炎临床治疗中的应用效果。方法选取2017年10月~2018年5月来院就诊的172例慢性盆腔炎患者进行临床研究,采用就诊序列号单双分组法将患者分入对
<正> 福清话的韵母有紧音和鬆音之分。除了[N (?)]两个韵母,其他所有韵母都是紧音与鬆音一一配对。就每一对韵母主要元音的音值来说,紧音的舌位相对较高或较前,鬆音则相对较