基于生成式对抗网络的图像标注方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:gengfu123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展以及智能移动设备的快速普及,每天都会产生数以亿计的图像数据并且被各个用户上传到互联网,这些图像数据在大多杂乱无序的同时又包含着海量有用信息。为了对这些图像数据进行有效管理并高效利用其包含的有用信息,图像语义自动标注技术应运而生。目前,图像自动标注技术大多通过传统机器学习或者深度学习的方法构建标注模型实现对未知图像的自动标注。但是,这些标注方法大多都存在一个问题,即输出层的神经元(分类器)数目与数据集标注词汇量成比例,这将导致2个问题:1.模型实用性较差,当数据集词汇量较大时,过大的输出层数目将会急剧增加模型的设计和训练难度;2.模型结构稳定性差,模型结构会随词汇量变化而改变。针对上述问题,本文将生成式对抗网络与Word2vec词向量模型相结合,设计并实现了一种新的标注模型。首先,通过Word2vec模型将标注词汇映射为一个维数固定且可选择的多维词向量;其次,利用生成式对抗网络构建一个神经网络模型(GAN-W),使模型生成器的输出层神经元数目与多维词向量维数相等,生成器将生成与词向量同维度的向量,使模型输出层神经元数目与标注词汇量解绑;最后,对模型多次输出结果进行排序,通过排序结果来决定图像对应的最终标注。本文模型分别在Corel 5K和IAPRTC-12图像标注数据集上进行了实验:1.通过Word2vec模型输出向量维度对模型性能影响的实验证明了本文模型能够解决上述问题,模型的输出神经元数目可以在一个很大范围内自由选择。2.通过与其他模型的性能对比实验得出本文模型的准确率P和F1值均高于其它模型,同时召回率R仅次于CNN-MLSU模型,模型的标注性能具有较大的提升。3.通过模型的实际标注结果展示出了本文模型对每幅图像标注的标签数目自适应,更加符合实际标注情况。总而言之,本文模型在解决输出层神经元数目与数据集标注词汇量成比例问题的同时模型相较于其它标注模型标注在标注性能上有一定提高,在实际标注结果中同样具有优势。
其他文献
复发性晕厥是临床医生常见的一个棘手的问题.美国的调查资料表明,复发性晕厥占每年住院病人总数的6%,占所有急诊观察病人的3%.尽管使用了心电图、Holter监测、头部CT、糖耐量
大脑是心理的主要器官,但不是唯一器官。确切地说,身体的各个部分都是心理的器官。大脑提供人类心理发展的可能性,但心理的发展,还必须通过社会生活的实践活动。儿童的心理机
在实施新课程之初.听过一节美术新课程教学研讨课。这是一堂设计应用课——《纸立体构成》。教师一开始从生活中的立体构成实例导入.组织学生展开关于纸立体造型相关内容的讨论
用博弈论研究环境税收制度优化问题,分析环境税中各个参与方的利益格局及其博弈过程,对于设计合理、高效的税收制度具有重要的现实意义。在环境税收制度涉及的相关利益主体中
世界很多国家的法律中确立了社区矫正制度,社区矫正制度对于保障人权,促进犯罪分子重新回归社会都具有积极的意义。我国刑法中也确立了社区矫正制度。然而,从实践中来看,我国
<正> 农历腊月中旬,我在遵化县城参加县委为动员全面大跃进而召开的三级干部大会。抽空在大集上看了看年画,并访问了卖年画的摊贩。年画摊上人挤得很厉害,从早上开市直到下午
本文分析了测井仪器的工作概况及其液压动力系统的工作原理,并分析了液压动力系统耐高温高压性能的必要性。针对液压动力系统耐高温高压设计要求,设计了试验装置,对液压动力系统
三个月前,云南省第一条高等级公路——石安公路就已全线停止收费。作为现存仅有的连接昆明和安宁两座城市的两条通道之一,同时也作为滇中产业新区路网建设不可或缺的一部分,
复发性晕厥是临床内科医生最常遇见且具挑战意味的问题之一.据估计它占美国每年住院病人总数的1/6,急诊病人的1/3.然而,有40%以上的患者,虽经大量广泛的检查,仍找不到其晕厥
中共中央2017年一号文件指出,要进一步加强农业供给侧结构性改革,提升农业发展的质量和效率。作为农业大省的河南,肩负着国家农业生产和粮食安全的重要责任,目前河南省农业结