论文部分内容阅读
在计算机视觉领域,商标检测是一个备受关注的问题,在版权监控、广告投放、精准营销等领域有广泛应用。如果能精准高效的识别商标,则能开发出许多有商业价值的相关应用。但是目前的商标检测需要大量的标注数据,而人工标注数据成本高昂、标注难度大;而且自然场景图片背景复杂,商标通常只占图片的一小部分且形状多变,检测难度高。本文针对图书图像,识别图书中的商标,为图书的版权监控提供依据,并围绕以下两方面提升商标检测的精度:1、提出了合成包含特定标志物数据的方法,并在计算机合成时自动生成标注文件,实现了大量标注数据的快速获取。使用Canny算子获取图像局部区域亮度变化显著的部分,将图片前景背景分离获取商标样本;得到样本后对商标进行仿射变换,通过矩阵乘法呈现线性映射,用向量加法表示平移,实现了对原始数据中商标扭曲、形变等情况的模拟;接着需要在图片中嵌入处理好的商标样本,使用双线性插值从像素级别在空间中的两个方向分别进行线性插值,完成了商标与图书图片自然的融合,最后加入椒盐噪声和高斯模糊,在图像中随机增加多余的干扰信息,减少了合成数据分布与原始数据分布之间的差异。合成数据使原始数据集的平均准确率提高1.6%,合成数据集的平均准确率提高26.1%,解决了目前商标图片难以获取并且图片标注成本高的缺陷。2、研究了基于多策略融合的商标检测方法提升自然场景图像中的小物体检测精度。首先通过上采样和像素值相加,将图像底层纹理特征与高层语义特征结合,减少了小物体多次采样后位置信息的严重缺失;接着使用RoIAlign取消量化操作,用双线性插值更精确的计算像素值,提升了小目标物体特征映射的准确性;最后对错分但是置信度大的难样本进行挖掘,把熵作为样本的难易反馈整合到损失中,让难样本对模型的贡献得以增加,提升了模型对小物体等难样本的判断力。将多种优化方法结合后,模型平均准确率提高了74.7%,减缓了小目标物体检测困难的问题。优化后在原始图书图片集上mAP从0.3586提升至0.6366,在合成图书图片集上mAP从0.2975提升至0.6069,说明模型有很强的泛化能力,合成数据效果接近真实数据。最后将商标检测框架集成到数字图片商标检测及监控系统中,可以根据用户需求进行图片商标的自动检测识别、图书商标在电子商务平台的监控,已在经济财经出版社201 8年初级会计职称考试教材版权监控中投入使用且效果达到预期,具有很高的学术价值和使用价值。