超分辨率重建在低质量文本图像识别上的应用

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:thirdpine98
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像是人们从客观世界获取信息的重要来源。然而,受环境以及成像设备的影响,获取的图像经常存在遮挡、扭曲、光照不均、边缘模糊等问题,导致图像中有效信息不能充分利用。这些低质量图像会给后续图像的处理,譬如图像中文本的定位与识别,带来很大的困难。目前基于深度学习算法的文本定位与识别算法在处理高质量图像时较传统的文档文本定位与识别技术有显著优势,但是在处理低质量的图像时,定位与识别效果仍然不理想。
  本文针对提高低质量图像的方法进行研究,通过超分辨率技术增大低质量文本的分辨率,以提高图像质量,为后续图像中文本定位与识别打好基础,使得文本定位更加准确,从而提高字符识别率。论文主要研究内容如下:
  (1)对比现有定位方法如EAST、CTPN等场景文本定位算法的优劣,选择CTPN作为文本定位方法,指出低质量图像识别任务中影响文本定位的原因并引入超分辨率重建算法。对比了超分辨率重建中VDSR(Very Deep Convolution Networks for Image Super-Resolution)、LapSRN(Deep Laplacian Pyramid Networks for Fast and Accurate Super-Resolution)等多种常用网络模型结构,选取LapSRN模型作为本文的超分辨率重建模型。
  (2)为使LapSRN模型重点关注低质量图像的细节和边缘信息,采用空洞卷积和普通卷积级联的方式增大感受野,引入卷积块注意力机制,把不同层次的图像特征进行特征融合,充分提取低质量图像的特征信息,优化后的模型能够提高图像的主观视觉效果及峰值信噪比。
  (3)采用CRNN网络对低质量道路交通标识牌图像和低质量票据图像进行文本行端到端的字符识别。为了使方案具有更广泛的适用性,探究改进的超分辨率重建方法应用在四组不同识别率的纯英文文本图像上的识别效果。通过实验分析,该超分辨率算法可以应用在不同种类的、不同条件下产生的低质量图像上,具有广泛的应用性。
其他文献
随着智能手机、平板电脑等移动设备以及移动互联网的迅速发展,人们从移动设备中获取的信息逐渐增多。屏幕作为人机交互的主要媒介也随着这股浪潮迅速发展。AMOLED(ActiveMatrixOrganicLightEmittingDiode,有源矩阵有机发光二极管)屏幕相比于LCD(LiquidCrystalDisplay,液晶显示)屏幕具有自发光、功耗低、可视角度广等优点,逐渐成为多数移动设备选择的显示
反射面天线以其结构简单且稳定、功率容量大、性能优良等众多优点,成为卫星通信使用最多的天线种类之一。从最初简单的正馈单反射面天线,逐渐发展为多反射面天线、偏置反射面天线和赋形反射面天线等,宽带化、小型化和一体化是反射面天线一直以来最主要的发展趋势。反射面天线的整体性能很大程度上取决于其关键组成部分——馈源的性能。本文将反射面天线的馈源系统作为研究对象,主要工作包括以下几个部分:  1、反射面天线的发
单脉冲天线在工作时通过一个回波脉冲可以获得目标的位置信息,它的性能在一定程度上决定着雷达系统的追踪精度。近年来随着单脉冲天线在通信领域的发展,在一些场景下除了定位的准确性,还需要满足高速的信息传输速率,提高抗干扰性能,并降低其剖面高度。  本文设计了两款宽带低剖面单脉冲阵列天线,一个是等功分单脉冲阵列天线,另一个是在E面和H面均采用切比雪夫综合法所设计的低副瓣单脉冲阵列天线,并将人工磁导体应用于阵
在这个科学技术不断发展和进步的时代,人们已经不满足于现有的通信速率和通信质量。满足上述要求的多输入多输出(multiple-input multiple-output,MIMO)技术得到了快速发展,其通过在收发端分别配置多根天线来对信息进行发送和接收,使得整个通信系统的传输速率大大增加。但在MIMO系统中,多天线收发会使系统性能受信道间干扰(inter-channel interference,I
学位
滚动轴承是旋转机械设备中关键零部件之一,在不同工业领域中应用广泛。但在实际工作中轴承工况不断变化导致大量有标签数据获取困难,同时传统寿命预测方法存在健康指标难以构建及寿命预测误差大的不足。因此,能够准确预测滚动轴承的剩余使用寿命对工业生产具有重大意义。本文针对不同工况滚动轴承剩余使用寿命预测提出一种方法,该方法分为状态识别与寿命预测两部分。状态识别方面:提出基于深度模型迁移的滚动轴承状态识别方法。
学位