基于深度学习的大规模图像自动标注方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:codeandme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像自动标注是计算机视觉领域最重要的挑战任务之一,好的图像自动标注技术对于实际研究与应用大有裨益。考虑到传统方法对大规模数据处理能力弱的特点,其在多数情况下并不能满足大数据的处理现实,而深度学习模型则对大规模数据处理具有得天独厚的优势,因此国内外众多研究人员趋向于采用深度学习模型来解决大规模图像的自动标注问题,并且适应各种不同处理环境的多种深度学习模型被相继提出。但是它仍然存在一些问题,主要存在与模型的构建以及标签的确定等方面。本文针对大规模图像的自动标注问题,详细分析和深入研究多种深度学习模型,提出基于这些模型和自己设计模型的图像自动标注方法,并通过实验验证其有效性和效率。全文主要研究内容如下:1.阐述了图像自动标注技术的研究背景和现状。针对深度学习及其在图像标注领域的应用进行了深入的研究分析,包括其中的重要理论与关键技术。详细描述了图像自动标注现有若干经典算法,包括传统方法和基于深度学习的方法,并分析了这些算法的利弊。2.针对现有的图像数据尤其是网络图像,其本身含有的标签多数是错误的或者是不准确的,本文提出一种多任务投票方法(Multitask Voting,MV)。该方法可以一定程度上提高标注的准确性,从而提高网络模型的训练效果。其次,现有的绝大多数标注方法产生的标注词都是固定的,本文的MV方法亦可做到标注词汇的自适应,实现标签随机化(top-random)。再者,本文通过修改CaffeNet模型,构造了一个基于卷积神经网络的大规模图像标注模型MVAIACNN。最后,通过在MIRFlickr25K以及NUS-WIDE两个数据集上进行试验,并与其它方法进行比较,结果表明本文方法的有效性。3.针对单个模型学习能力欠缺以及无法充分考虑标签之间的关联性问题,本文提出了一种基于双深度学习模型的图像自动标注方法。首先,为了充分发挥双模型的有效性,我们选取FasterR-CNN作为其中一个模型,因为它是基于深度学习区域系列目标检测最好的方法。另外,由于本课题组在图像自动标注模型研究方面的积累,并且前期提出的AIACNN模型取得的不错的效果,故将其作为合作训练的另一模型。其次,受协同训练启发,提出合作训练算法,充分利用标签之间的关联性。最后,通过实验对比验证,本文方法取得了较好的结果。
其他文献
马斯卡尼是意大利真实主义歌剧的代表人物,其歌剧《乡村骑士》至今在世界歌剧舞台上久演不衰。《妈妈,这些烈酒》是《乡村骑士》中图里杜的一首咏叹调,是一首较有难度的戏剧
有关北宋官窑的研究,目前最为紧要的课题是证明北宋官窑的所在地。对此,大体上有两种说法:一种说法是北宋官窑位于北宋时期的京都汴京,这种说法从北宋官窑研究初期开始就成为
为提升移动支付交易安全性和质量,该文致力于设计一种能够在移动终端上搭载的面向第三方支付平台的安全交易协议模型STPT。该协议保留了SET协议及MSET协议双重签名的特性,用
以330kV延榆线工程为例,对航测技术在线路测量中应用进行了阐述。着重研究了解析摄影测量技术在线路测量中的应用。
通过对铸造过程进行数值模拟,得出浇铸过程中的温度场变化规律以及冷却速度在铸件上的分布规律,预测了铸件的微观组织和铸造缺陷。 通过金相组织显微分析试验,研究了铸造钛合
本文叙述的是已获中国发明专利的家庭用水净水器,本净水器所产生的水除用来饮用外,还可以提供具有杀菌消毒功能的清洁用水,用于清洗餐具和瓜果蔬菜,以及衣物;用本净水器处理
基于开放式、模块化设计思想,借助于计算机技术及数控技术的最新成果,建立数控车床计算机数控系统结构。介绍交流伺服数控车床CA6163插补功能模块的基本原理,硬件结构及软件开发
背景:虽然经前路椎体融合应用于颈椎退行性疾病的治疗超过50年,但至今对其技术的标准化仍然存在争议.单独使用椎间融合器最主要的缺点是即时稳定性欠佳和融合器下沉;椎间融合
腹腔开放疗法是治疗腹部战创伤与腹腔感染的突破性进展,是治疗腹部战创伤与严重腹腔感染有效的治疗措施。但肠破裂、肠空气瘘是腹腔开放疗法的严重并发症,是阻碍腹腔开放疗法