基于卷积神经网络的图像标注算法研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:wangruiqiangkang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机、家用电脑等数码设备的普及和通信技术的发展,图像等可视化数据在互联网的共享平台上随处可见,为了对其进行有效的管理和使用,研究者们提出了图像检索技术。但由于技术限制和用户的习惯,搜索引擎都提供基于关键词的图像检索,这种检索方式需要提前使用关键词对图像进行标注,但仅依靠手工的方式进行标注时间成本和人工成本是难以想象的,因此图像自动标注技术迅速发展起来。传统的图像自动标注算法由于模型复杂且泛化性能差,存在标注结果准确率低等缺点,为此,本文提出了两种基于卷积神经网络的图像自动标注算法。主要工作如下:(1)针对图像中小尺度目标标注准确率低和标注的类别不均衡的问题,提出了融合多尺度特征和代价敏感学习的图像标注方法。该方法对VGG16的网络结构进行了调整,添加了特征融合模块。特征融合模块分为多尺度特征提取和特征融合。多尺度特征提取模块从卷积特征提取多尺度特征,特征融合模块在网络学习过程中自适应的融合特征,并在多标签损失函数的基础上提出了代价敏感的多标签损失函数。实验表明,融合多尺度特征和代价敏感学习的图像标注算法能够在保证高频标签标注性能的同时,提升对低频标签的标注性能。(2)针对图像标注数据集存在的训练样本不充足和标注的类别不均衡的问题,设计了基于双卷积神经网络的图像标注方法。首先提出了基于生成对抗网络的图像扩充方法,与传统图像扩充方法相结合解决训练样本不充足问题;其次改进卷积神经网络结构,引入可形变卷积和滤波池化来加强对不同尺度对象的标注能力;最后对数据集进行划分,划分为全部数据集和低频标签数据集,分别独立训练两个卷积神经网络模型,并设计标注结果融合模块对两个模型标注结果进行融合,低频数据集训练出来的模型更适用于标注低频标签,降低了类别不平衡对低频标签的影响。实验表明,基于双卷积神经网络模型的图像标注算法能够提升图像标注的准确率。
其他文献
目标跟踪技术广泛应用在安防监控、自动驾驶、军事制导等领域。当前主流的目标跟踪算法分为基于相关滤波的跟踪算法和基于孪生网络的跟踪算法两大类。相关滤波目标跟踪算法以其高效的运算速度和良好的跟踪精度备受关注,但是对于尺度变化、快速运动等情况容易造成跟踪失败;孪生网络目标跟踪算法借助表征能力强大的深度特征获得更优的跟踪精度和鲁棒性,但对于严重形变、背景复杂等情况容易跟踪失败。通过分析核相关滤波跟踪算法和孪
采空区地面塌陷是煤矿企业常见的地质灾害之一,它破坏范围广、影响大、持续时间长,为了降低采空区冒落、失稳造成的重大经济损失和人员伤亡,研究煤矿采空区地面塌陷危险性评价,对煤矿企业安全生产尤为重要。本文将深度学习应用到煤矿采空区地面塌陷危险性评价中,并将其结果进行三维可视化。具体研究工作如下:(1)首先分析了采空区地面塌陷发生机理,通过对煤矿的地质勘探钻孔数据、水文数据等进行提取、分析,用分位图法进行
文本情感分类是利用计算机技术对含有情感特征的数据进行处理,它能够识别和提取文本中的主观信息。由于基于传统方法的文本情感分类对特征信息提取的不够充分,而基于深度学习的文本情感分类方法可以改善这一问题,因此,深度学习成为了文本情感分类的主要研究方法。论文为了提取更多的特征信息,提高分类准确率,提出了非静态的FastText词向量模型和Attention-CNN的融合模型。论文的主要研究内容如下:(1)
Brinkman-Forchheimer方程作为一种重要的流体动力学方程,描述了流体在饱和型多孔介质中的流动现象,在偏微分方程中占有十分重要的位置.尽管在数值求解和应用方面,Brinkman-Forchheimer方程取得了重要的进展,但在理论方面,其解的衰减性,稳定性及无界区域中全局吸引子的存在性等许多问题还有待研究.因此,本文从无穷维动力系统角度出发,对三维无界区域上Brinkman-Forc
随着智能监控系统在煤矿安全生产中发挥的作用越来越大,对监控视频中井下胶带运输机的运动状态监测已成为主要研究方向之一。对胶带运输机状态的智能化监测,不仅可以为井下视频监控工作提供更有价值的信息,也能从中预警异常事故的发生,为安全生产提供保障。因此,准确地对胶带运输机的状态实现实时监测尤为重要。本文结合煤矿井下监控视频特征,研究了基于深度学习的胶带运输机运动状态监测方法。(1)为更准确和实时的检测煤块
随机偏微分方程作为随机分析的一个分支,广泛应用于物理学、力学、光学、数学、化学、通讯等许多领域,在人口统计、经济、金融等应用方面也发挥着重要作用.本文主要通过构造Lyapunov泛函,利用比较方法和Kaplan特征值法对两类随机偏微分方程的不变测度及爆破性进行研究.主要研究内容如下:首先考虑了一类乘法噪声驱动下具有二阶记忆项的随机粘弹性波动方程.通过Lyapunov泛函技巧,获得了方程解的弱紧致性
煤矿掘进工作面的超前预报是保障煤矿安全生产的一项重要工作,矿井直流电法超前预报以抗电磁干扰能力强而得到广泛应用。论文基于不同位置地质异常体及巷道的影响,对矿井直流电法超前探测进行有限元正演数值模拟。求解了多点源供电情况下不同地电模型,对全空间无巷道电场的分布电场分布有了一定认识;并在此基础上建立巷道存在的模型,通过改变多点电流源的在巷道中的位置,供电电极的个数和供电电极极距建立不同模型,分析了不同
基于董东煤矿开采地质条件,以50107工作面运输巷道为研究背景,采用理论分析,数值模拟,物理模拟和工程实例等研究方法,对不同采高及煤岩强度下的无煤柱开采展开了系统的研究,分别对顶板覆岩破坏的结构特征、巷道顶板稳定性、矿压显现规律、沿空留巷动力失稳机制及切顶卸压自动成巷技术的现场应用进行了研究分析,研究成果主要如下:(1)通过对沿空留巷数值模拟分析可得,顶板下沉量距离煤壁越远下沉量越大。随着切顶高度
频率纠缠源由于具有强的频率关联和时间关联特性,被广泛应用于量子精密测量领域,如量子时间同步、量子定位等。目前,随着国内量子时间同步等领域的发展,进行相关领域的实验研究时需考虑频率纠缠源在长距离传输链路中的损耗及在户外试验的便携性等问题。这对频率纠缠源提出了新的要求,即需要有一款能够产生高单光子数、高符合计数且便携可搬运的纠缠源。然而,国内已有的频率纠缠源在这些方面仍然无法满足现代量子时间同步等实验
脉诊的客观化研究是国际学术界的研究热点。不同的脉搏信号处理算法将得到不同的诊病效果。本文主要研究脉搏信号的处理和尘肺病的脉诊算法。在脉搏信号预处理方面,针对目前脉搏信号区间选择阈值参数多、异常点检测不全的问题,提出了改进的脉搏信号区间选择方法,利用信号的峰谷差和一阶导数检测异常点,能更准确地检测脉搏信号的异常并获取有效的信号段;针对脉搏信号周期起始点与脉图不符的问题,提出了改进的去基线漂移与周期分