基于深度学习的图像分类标注研究

来源 :西安科技大学 | 被引量 : 2次 | 上传用户:heheaixixi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多媒体技术和互联网的迅猛发展使得图像数据量呈爆炸式增长,这为图像检索带来巨大的挑战。传统基于文本的图像检索算法虽然准确率高,但需要人工标注图像耗时耗力,且无法满足海量图像的检索需求。自动图像标注算法虽然快速提高图像的检索效率,但标注准确率有待提升。ML-GCN(Multi-Label Graph Convolutional Networks,多标签图卷积网络)具有强大的建模能力和对非欧氏距离计算能力,可以有效的对多标签关联关系做运算,鉴于此,本文基于ML-GCN模型,将图像自动标注问题转化为图像多标签分类问题。本文的主要研究工作如下:针对图像单标签分类中存在信息丢失问题以及注意力机制仅使用图像区域之间的局部相关性问题,本文基于ML-GCN网络模型,利用多标签之间的依赖性,提出了改进ML-GCN的图像自动标注算法。该算法主要包括两个步骤,第一步将每个标签节点用词嵌入向量表示,使用标签相关矩阵构造的有向图为标签间依赖性建模,利用映射函数将类别标记映射为对应类别的分类器;第二步将卷积神经网络提取的图像特征应用于类别分类器,获得图像标签。与Resnet网络模型相比,Resnext网络计算量少、需要调节较少超参数。与ReLU激活函数相比,mish激活函数具有训练稳定性好、平均准确率高、峰值准确率高等优点。鉴于此,本文使用Resnext101残差网络提取图像特征,mish作为激活函数提出了改进的ML-GCN图像标注算法,在Voc2007数据集和coco数据集的实验结果表明,与ML-GCN、CNN-RNN、RLSD、DenseNet121、HCP等方法相比,本文算法有效提高了平均准确率。针对训练样本不平衡导致低频词标注准确率降低的问题,本文引入低频特征提取通道,提出了基于双通道的改进ML-GCN标注算法。该算法融合低频提取特征与图像全局特征,提高低频词在样本中的比例,将融合后的特征应用于改进的ML-GCN标签分类器中。在voc2012数据集的实验结果表明,与改进的ML-GCN方法相比,本文算法有效提高了平均准确率及低频词的标注准确率。
其他文献
本文通过贵阳筑城广场的设计实例对城市广场"7C"理念进行了分析和探讨,其目的在于通过整合城市广场的特征,努力建设公众喜爱的城市公共空间。
金黄色葡萄球菌(Staphylococcus aureus,S.aureus)是一类重要的人类病原菌,随着S.aureus对抗生素耐药性的日益加剧,对新型(新结构和新机制)抗感染药物的需求急剧增加。在S.au
以碳黑(Vulcan XC 72)为载体,氯铱酸(H2IrCl6.6H2O)和氯铂酸(H2PtCl6.6H2O)为前驱体,聚乙烯基吡咯烷酮(PVP,polyvinylpyrrolidone)为保护剂,首次采用高压氢还原方法制备出PtIr/C合金
为研究高层建筑桩基施工及后期沉降对其相邻建筑物产生的影响,根据现有研究理论建立简化的群桩周围土体位移场的计算公式,并依托工程实例通过简化计算公式计算出古建筑物的沉
如何在企业竞争中取胜,是企业界关注的焦点话题。孙子兵家管理思想在管理学界受到广泛重视并运用于企业实战。其战略战术思想、"五事七计"的内容都体现了其思想的精髓。企业竞
<正>近年来,国家教委提出"应试教育"向"素质教育"转轨的要求,并把艺术教育作为实现素质教育的重要途径之一。作为军队,音乐活动是基层连队文化活动中最主要的内容之一,它的形
<正>从熬夜险到之前的雾霾险、恋爱险、贴条险……奇葩险每隔一段时间就会花样翻新,但昙花一现的吸睛效应,明显多于消费者能获得的实质性保障。最近,某保险公司推出的熬夜险
本文从宏观地貌格局入手,结合地史时期的古地理环境、地形、地质构造、水化学特征和气候特征,综合系统分析了宁夏咸苦水和高氟潜水相伴生的分布规律与成因机制。
利用中国东部地区315个台站1963~2012年月平均地面观测资料,揭示了东部地区冬季和夏季地面比湿(SH)和相对湿度(RH)多年平均值及其变率的空间分布特征,并分析和比较了地理因素