基于合成数据的自然场景商标检测

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户：jc622

【摘要】

：

【作者】

：

甘蓓

【出处】

：

北京邮电大学

【发表日期】

：

2019年01期

【关键词】

：

商标检测合成数据小目标物体检测泛化能力

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在计算机视觉领域,商标检测是一个备受关注的问题,在版权监控、广告投放、精准营销等领域有广泛应用。如果能精准高效的识别商标,则能开发出许多有商业价值的相关应用。但是目前的商标检测需要大量的标注数据,而人工标注数据成本高昂、标注难度大;而且自然场景图片背景复杂,商标通常只占图片的一小部分且形状多变,检测难度高。本文针对图书图像,识别图书中的商标,为图书的版权监控提供依据,并围绕以下两方面提升商标检测的精度:1、提出了合成包含特定标志物数据的方法,并在计算机合成时自动生成标注文件,实现了大量标注数据的快速获取。使用Canny算子获取图像局部区域亮度变化显著的部分,将图片前景背景分离获取商标样本;得到样本后对商标进行仿射变换,通过矩阵乘法呈现线性映射,用向量加法表示平移,实现了对原始数据中商标扭曲、形变等情况的模拟;接着需要在图片中嵌入处理好的商标样本,使用双线性插值从像素级别在空间中的两个方向分别进行线性插值,完成了商标与图书图片自然的融合,最后加入椒盐噪声和高斯模糊,在图像中随机增加多余的干扰信息,减少了合成数据分布与原始数据分布之间的差异。合成数据使原始数据集的平均准确率提高1.6%,合成数据集的平均准确率提高26.1%,解决了目前商标图片难以获取并且图片标注成本高的缺陷。2、研究了基于多策略融合的商标检测方法提升自然场景图像中的小物体检测精度。首先通过上采样和像素值相加,将图像底层纹理特征与高层语义特征结合,减少了小物体多次采样后位置信息的严重缺失;接着使用RoIAlign取消量化操作,用双线性插值更精确的计算像素值,提升了小目标物体特征映射的准确性;最后对错分但是置信度大的难样本进行挖掘,把熵作为样本的难易反馈整合到损失中,让难样本对模型的贡献得以增加,提升了模型对小物体等难样本的判断力。将多种优化方法结合后,模型平均准确率提高了74.7%,减缓了小目标物体检测困难的问题。优化后在原始图书图片集上mAP从0.3586提升至0.6366,在合成图书图片集上mAP从0.2975提升至0.6069,说明模型有很强的泛化能力,合成数据效果接近真实数据。最后将商标检测框架集成到数字图片商标检测及监控系统中,可以根据用户需求进行图片商标的自动检测识别、图书商标在电子商务平台的监控,已在经济财经出版社201 8年初级会计职称考试教材版权监控中投入使用且效果达到预期,具有很高的学术价值和使用价值。

其他文献

基于Logistic模型的A市农合行小微企业贷款风险管理研究

小微企业在增加税收收入、创造就业岗位、稳定社会秩序、促进科技进步和推动经济发展等方面起着不可忽视的作用。国家十分重视并积极扶持小微企业的发展。为提升小微企业的创新创业能力,国家在税收等方面给予小微企业众多优惠政策,支持各类群体创办小型微型企业,帮助企业开拓市场。在经济新常态的大背景下,国内金融体制改革的不断推进,利率逐渐市场化,国内银行整体面临着前所未有的巨大压力,且行业竞争的趋势日益严重,目前农

学位

Logistic模型小微企业贷款业务风险管理

心先安治疗病态窦房结综合征临床分析

目的评价心先安治疗病窦综合征的疗效及治疗价值.方法将80例病窦综合征患者分成治疗组和对照组,两组分别静脉滴注心先安、阿托品,比较两组临床症状、动态心电图和食道电生理

期刊

心先安病态窦房结综合征Meglumine cyclic adenylate Sick Sinus Syndrome

中电电机“高送转”股利政策研究

股利政策是上市公司的重要财务决策之一,直接影响投资者权益,对公司未来发展有着长远意义,对建造井然有序的资本市场也能添砖加瓦。上市公司的成长离不开股利政策的实施,资本市场的健康发展也不能缺少规范合理的股利分配。留存收益和股利分配如何合理安排,是上市公司管理者十分重视的一个问题。近年来,我国上市公司“滥送转”情况屡见不鲜,“高送转”不再像实施之初,只是经营状况良好的公司选择的股利政策。中电电机是一家上

学位

股利政策高送转财务影响

基于合成数据的自然场景商标检测

其他学术论文