基于改进卷积神经网络模型的图像自动标注方法研究

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:JINGRUOFEIYUN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展以及多媒体设备的日益普及,网络上的数据资源正在突飞猛进地增长。其中,图像作为信息传播的核心,可以传递更为丰富的语义,极大地丰富人民的工作和生活。人们可以通过检索关键字的方式搜索到他们需要的图像数据,然而大量的无标签图像限制了用户对它们的利用。在这种情况下,图像自动标注技术顺应时代而生。目前,在图像自动标注领域主要是利用传统的机器学习方法和深度学习方法来搭建标注模型。然而,传统的机器学习模型需要人工选择特征,这种方式会导致信息提取不完善。而基于深度学习方法的标注模型,在现有的被标注图像有限的情况下容易出现过拟合的现象。其次,无论是传统的机器学习方法还是深度学习方法,在标签决策部分,大多采用固定阈值的方式对标签进行预测,这样会导致当部分图像的标签预测概率均小于固定阈值时,预测标签集为空的情况。为解决上述问题,本文提出了以下模型:(1)针对标签数据集不足易导致的过拟合问题,本文提出了迁移学习下标签定位策略的图像自动标注模型。首先,搭建一个基于迁移学习的卷积神经网络模型,由于图像的底层特征大体一致,使用大型公开图像数据集对卷积神经网络进行预学习,加载已经成熟的权重文件,可以学习到很好的一般特征,之后再通过目标数据集对网络进行细微调整,使模型可以学习到目标数据集的高级特征。使用在大型数据集ImageNet上预先学习好的InceptionV3网络对目标数据集进行特征提取,可以解决目前的因标签数据集不足而导致的过拟合问题,其中,在网络模型部分引入SE模块,通过Squeeze、Excitation和Reweight三步操作给卷积层所提取的不同特征分配不同的权重,从而加强有用的特征信息,抑制无用的特征信息,实现特征的重标定。通过把预训练模型提取的特征加载到分类器中,训练适合该数据集的分类器,再利用冻结手段整体微调网络,得到最优模型。(2)针对固定阈值方式会导致预测标签集为空的情况,本文提出了融合阈值寻优卷积神经网络的图像自动标注模型。该模型由卷积神经网络和阈值寻优构成,首先,通过卷积神经网络训练模型,利用该模型对图片进行预测,得到预测概率,其中在卷积神经网络中增加了批处理层(BN)有效地加快了收敛速度。其次,利用该模型对测试集图片的预测概率进行阈值寻优,经过阈值寻优过程为每类标签得到一个最佳阈值,从而得到一组最佳阈值,只有当该类标签的预测概率大于等于该类标签的最佳阈值时,才会给图片标注该标签。在标注过程中通过载入卷积神经网络模型和一组最佳阈值可以实现对所需标注的图像更加灵活地标注,解决了固定阈值方式带来的问题。本文围绕图像自动标注技术展开研究,在深度学习的大背景下,研究了标签数据集不足和固定阈值方式带来的问题,针对这些问题,进行了深刻地分析和研究。理论上,对国内外关于图像自动标注的研究现状进行了深入的分析,同时对本文所使用的公共数据集的标签情况进行了研究,实践上,搭建了实验平台对实验结果进行了验证和分析,结果表明本文提出的图像自动标注模型可以有效地标注标签。
其他文献
近年来,我国新时代社会主义市场经济的日益完善,我国调味品行业迅速崛起,产品销量不断增长,为调味品企业带来了发展的契机,大企业逐步扩张,中小企业缓慢崛起,然而,在市场经济的机遇下,调味品行业也逐渐暴露其在内部经营管理上的问题,不少企业出现舞弊案例和破产现象,企业想要在如此残酷的市场竞争下得到长期持续的发展,不仅需要提升自身的产品质量和生产工艺,而且应该建立有效的财务风险管理程序,以保证企业能够随时对
学位
随着国家“节能减排”、“矿山复垦”等政策的实施,以及露天开采输送设备向巨型化、绿色化、智能化方向的发展,排岩机已经成为连续或半连续高效开采工艺中不可缺少的装备。而国内在大型排岩机结构理论设计方面还不够完善,对整机关键结构的轻量化研究亟待展开。本文对排岩机进行了载荷工况分析,采用拓扑优化方法对受料臂架、排料臂架及塔架等关键结构进行轻量化设计,并建立优化后的整机虚拟样机以验证轻量化的合理性。首先,以某
学位
学位
优化问题广泛存在于工农业生产、交通运输、国防、通信和科学等领域。随着问题的复杂化,有些问题需要优化若干互相冲突的目标函数。进化算法由于能够同时提供若干解,因此其在多目标优化问题中获得了很好的应用。然而,随着优化目标数量的增多,个体的选择压力减小,导致算法的收敛性能较差。本文基于分解策略将多个目标转换成一系列单目标问题同时进行优化,提出了新的繁殖策略和新的环境选择策略,其主要研究内容概括如下:(1)
随着各种网约车平台的蓬勃兴起,网约车犯罪率显著增加,而其行车轨迹往往表现出异常现象。针对此类问题,本文从道路消耗的角度出发,对基于轨迹压缩和路网划分的异常轨迹检测及增量式检测算法进行了深入的分析和研究。其主要研究内容如下:(1)本文提出了一种基于路网划分的车辆异常轨迹检测算法(Vehicle Anomalous Detection Based on Road Network Partition,R
脱除煤中硫对提高煤炭资源利用率和环境保护具有重大意义。由于传统脱硫技术存在脱硫效果差、加热效率低和存在污染等缺点,而微波加热具有加热效率高、易控性、能量利用率高和无污染的优点,所以将微波加热技术应用到脱硫过程成为研究热点。但微波加热过程中也存在着热点或热失控等问题。随着数值计算方法的不断发展和对煤炭脱硫机理的深入分析,为了实现高效可靠的微波脱硫技术研究,本文通过多物理场耦合计算方法对微波脱硫过程进
由于元启发式优化算法不要求优化目标连续可微,因此其在实际工程优化问题中获得了广泛的关注,特别是在那些目标函数无法显式给出的优化问题中获得了更好的应用。然而,作为一种基于种群迭代的随机搜索算法,在获得一个满意的优化解之前需要大量的目标函数评价,因此限制了其在某些优化目标评价费时的优化问题中的应用。代理模型辅助的元启发式优化算法近几年受到了学者们越来越多的关注,然而,训练什么样的代理模型以及选择哪些个
人类文明的探索离不开考古,古书籍更是占据重要地位,其文物的破损原因纷杂,依靠人工识别文字信息,工作量巨大,且时间长,效率低。随着计算机应用在考古研究中的不断深入,其研究方法愈加向智能化,信息化,综合化发展。在实际研究中,古书籍文物文字信息的破损可视为古汉字图像与遮挡图像的混合,即仅一张混合图像为可研究对象,没有混合方式的先验知识,而单通道盲源分离(single-channel blind sour