粘连字符识别技术在手写票据中的应用研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:hao999999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光学字符识别是计算机视觉领域的一个热门研究方向,尤其是近年来随着深度学习的不断发展,场景文本识别的研究被推至高潮。银行票据作为一种特殊的场景,它的广泛使用使得字符识别技术在票据中的应用具有非常重要的研究意义,能够大大提高工作效率。票据中分为手写体和印刷体两种,前者一般手写不规范,字符的大小、间隔等差异也较大,而且有时伴随噪声的干扰,这些因素都会增加识别的难度。本文主要针对票据中的手写字符进行识别,根据汉字和数字的特点以及实际票据中遇到的困难分别采取不同的解决方法。本文的主要研究内容和成果如下:(1)针对基于过分割-识别方法中的集束搜索模块在字符失真票据中容易受到模糊字符干扰的缺点,提出了一种基于CNN图像识别和Bi-gram语义的可靠性优先的路径搜索算法RFBS(Reliable First Beam Search),通过优先搜索可靠性更高的区间提高了手写公司名识别的准确率。此外,根据公司名的结构特点提出了一种前后缀推断策略,有效解决了前后缀识别错误的问题。最后,利用结巴中文分词和字符位置信息检查识别结果中的错误字符,并在传统的字形相似度基础上引入了汉字部件相似度,再结合LSTM语言模型进行纠错。实验结果表明,结合RFBS算法和纠错方法的公司名的字符识别准确率达到了93.08%,相比传统的集束搜索算法提升效果显著。而且,通过消融实验也验证了加入汉字部件相似度对纠错效果的有效性。(2)针对现有方法在识别票据中较长的手写数字串图像存在的局限性,提出了一种基于预分割的端到端手写数字串识别方法。分割阶段使用Mask差值匀光法去除图像背景后,根据连通区分割、组合得到的坐标在原始RGB图像上分割出多个子图像。识别阶段采用以Res Net、Bi-LSTM、CTC为核心搭建的模型,具有很强的特征表示和学习能力。另外,为了训练端到端识别模型,通过提取实际票据的背景和字体颜色,再结合多种数据增强技术合成了大量不同长度的模拟票据数字串图像。实验结果表明,所提出的方法能够将识别结果与真实标签的平均编辑距离降低至0.088,其效果优于分割-识别方法和一般的端到端识别方法。
其他文献
基于高德地图POI(point of interest)开放性数据,以长沙市为研究区域,利用ArcGIS10.4的核密度、空间主成分等空间分析工机具,分析城市公共服务设施的布局特点,并对市域生活便
历朝历代祭祀孔子的庙宇,可分为两类——文庙和孔氏家庙。其中,文庙又被称为"夫子庙",曾是各级官员祭祀孔子、举行纪念性活动的场所,也是官办的高等学府及文教中心。自唐贞观
伴随科技的发展,人们对精神层次的需求也日益增大,各大视频网站为了更好的满足大众对内容需求,都在研发各自的产品,例如短视频。近几年虚拟现实(VR)和增强现实(AR)的热度持续
自1998年以来,中国正式进入了房地产市场化,房地产行业开始快速发展并且占中国经济中的分量越来越重。随着这些年来房价的大幅波动,人们越来越关注会导致房价波动的一些重大
自1990年以来,美国劳伦斯利弗莫尔实验室C.T.Walters等人开始对热容型激光器进行研究以后,热容激光器就逐渐广泛使用于医疗,工业,军事等方面,在未来发展中,有望使用在载人航
中国境内分布有三种狐属动物,藏狐(Vulpes ferrilata)、赤狐(Vulpes vulpes)和沙狐(Vulpes corsac)。藏狐在我国广泛分布于青藏高原,是资源较为丰富的物种之一。沙狐分布在与青
烟草花叶病毒(Tobacco mosaic virus,TMV)是为害最严重的植物病毒之一。近年来,利用纳米技术在控制植物病原体侵染方面显示出较好应用前景。纳米氧化锌(ZnONPs)和纳米二氧化硅(SiO
汉字作为信息传播的重要媒介之一,是世界上四分之一的人口持续使用数千年的文字,对人们日常工作、生活、学习、交流、工业化生产等均起到了不可磨灭的重要作用。使用信息化技术处理汉字信息已经成为模式识别领域的重要研究分支,它涉及了汉字生成技术、字体转换问题以及深度神经网络等,是一项十分综合性的研究课题。与英文字库的26个字母不同,汉字常用字符集GB2312共由6763个字符组成,数目庞大且笔划部首种类多样。
一、佛像盲谈佛像艺术,对不少人来说是一个相当遥远而陌生的题目。对我自己,也曾是如此,所以我将追述一下个人的经验,从我的幼年说起,从我尚未与佛像结缘时说起。我出生在五
会议
光学文字识别(Optical Character Recognition,简称OCR)是计算机视觉领域的基础课题之一。自然场景下的汉字识别至今仍然存在着一定的提升空间,尤其在不平衡、稀缺训练集上的