基于图像处理技术的商业银行表单识别的设计与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:tm7749
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
银行为了扩大信用卡业务,每天会产生大量的关于申请信用卡的纸质银行表单。为了实现银行的信息化,需要将纸质银行表单上的信息录入系统。目前的手动输入的模型工作效率低且劳动强度大,设计了一种能够实现自动地将纸质银行表单中的文字信息导入到计算机中的系统是摆在人们面前亟需解决的问题。本文以某银行的信用卡申请表单为例,设计出了一种基于图像处理技术进行银行表单自动识别的方法。本文首先对获取的图像进行了一系列的预处理,包括图像校正、图像去噪、二值化处理以及基于投影法的版面分析等操作。具体地,通过表单坐标以及标准模型得到扫描图像的倾斜角度,反转倾斜角实现校正;利用中值滤波去除扫描图像参杂着的“椒盐”噪声;设计了一种基于迭代Otsu方法对去噪后的图像进行二值化处理;基于投影法对二值化的图像进行版面分析。基于边缘检测法设计出一种图像形态学处理、轮廓检测、外接矩形以及模板匹配相结合的定位方法,该方法符合银行表单中文本定位的需求。在文本定位结果上,结合CRNN(Convolutional Recurrent Neural Network)算法,搭建了一个基于深度学习的文本自动识别系统。为了让最终的检测结果更加准确,在银行表单自动识别结束后加入后处理过程以校准自动识别结果。最后,对系统的整体实现进行了描述。为了证明了本系统的可靠性,进行了一些列测试实验,详细进行了文字区域定位和文字自动识别测试实验,测试结果表明,本文设计的方法具有很好的效果,能达到系统设计的预期目标。
其他文献
近年来,随着自动语音识别(ASR)技术水平的提高,从ASR系统输出得到的口语转录文本的处理研究,也随之受到了广泛的关注。由于口语转录文本并不是书面化的文本,从而会带来一系列严重的问题。一方面,口语转录文本是由ASR系统输出生成的一串字符流组成的,缺少标点符号和句子边界信息。这就是导致了读者在阅读转录文本时,很难找到一个句子的起点和终点,从而大大增加了句子语义的理解难度。另一方面,口语转录文本包含了
高压可以通过改变物质内部的化学键,将机械能以相变的方式储存在物质内部,并在适当的外界条件下将能量释放出来,通过高压的方式来合成高能密度材料是含能材料研究的一个重要思路。聚合氮是高压合成高能量密度材料的代表,但是聚合氮生成条件十分严苛,产物也不易保持到常规条件。一氧化碳与氮气具有相同的分子量和核外电子数以及相似的结构,而且实验已经验证其在高压下可以聚合,探索聚合一氧化碳压制聚合的热力学路径,产物主要
近年来,气候变化对于全球影响加剧,气候变暖问题愈发受全球各界的关注,找到气候变化的影响控制因素,揭示气候演化的规律,预测气候变化趋势已经成为当前气候研究学者们的共同理想与终极目标。帝汶海位于印度-太平洋暖池区南部,地处西太平洋暖池区西南部,印度尼西亚穿越流贯穿其中,沟通印度洋与太平洋,调节着两大洋之间的水体和热量输送,同时,暖池区气候变化也会间接或直接地对高纬地区乃至全球的气候变化产生重要影响。本
InSb是一种窄带隙材料,它具有大的朗德g因子,高室温迁移率和大的自旋轨道相互作用。鉴于其优越的材料特性,InSb体材料以及InSb量子阱器件在新电子器件[1][2]和磁阻器件[3][4]的研发以及自旋电子学[5]研究中都引起了人们的广泛关注。通常半导体异质结结构的自旋轨道耦合效应来自于两种不同的反演不对称性:结构反演不对称性和体反演不对称性。体反演不对称性是由于两种不同元素组成的闪锌矿结构化合物
数学表达式特有的多种数学符号排列组合而成的空间层次结构,成为其区别于普通文本的重要标志,使数学表达式检索成为信息检索领域的难点,亟待研发能够良好适应数学表达式特征的检索理论与方法。通过对数学表达式特征的分析与归纳,对数学表达式检索模型的特征提取、索引构建以及匹配和排序等关键问题展开研究,设计了一种基于运算符特征的数学表达式检索方法,并对其加以扩展,利用犹豫模糊集在解决多属性、多隶属度分类问题上的优
水稻作为我国最主要的粮食作物,在国家的粮食生产安全上具有重要意义。氮素营养不仅对水稻的整个生长过程有显著影响,而且还会对水稻产量以及品质的形成具有影响,在水稻整个
本文采用高温高压合成方法,通过在TiO_2中添加一定比例的Al粉和Ti粉,制备了Al掺杂非化学计量比氧化钛基热电材料,研究了不同合成压力以及不同Al、Ti掺杂比例对合成后样品的微观形貌,电输运性能以及热输运性能等方面的影响规律,具体研究内容及研究结果如下:(1)在3.0 GPa5.0 GPa压力范围内,采用不同合成压力通过高温高压方法合成了Ti Al0.02O1.78样品。利用扫描电子显微镜对制备
二硫化钼和二硒化钼是典型的过渡金属二硫族化合物(TMDCs),具有层状结构。在常温条件下,TMDCs通常以六方相结构稳定存在,过渡金属原子和硫族原子交替形成与石墨烯类似的六角蜂窝状结构,过渡金属原子夹在两层硫族原子之间,通过离子共价键的作用形成一个单元层。TMDCs的能带结构明显依赖于其层数,带隙随着层数的减小而逐渐增大,当层数减为单层时,带隙达到最大,并由间接带隙转变为直接带隙,同时应变力、缺陷
对于以硅片为基底的光伏电池来说,晶体硅原料和切割成本在电池总制造成本中占据了最大的部分。电火花线切割加工是利用放电产生的电腐蚀现象去除材料,其可加工性与材料的硬度、脆性等力学性能无关,只与材料的热学性能有关,非常适合加工脆硬的半导体材料。其加工过程非常复杂,涉及电场、磁场、流场、温度场以及应力场等多个物理场,期间伴随着热量传递、质量传递和动量传递。通过实验直接测量各物理场的相关数据十分困难,在这种
酞菁(Pc)是一类具有18π电子结构的分子染料,具有长的吸收波长、高消光系数和优异的光化学特性等优势,但是不良的水溶性和易聚集在很大程度限制了其在生物医学中的应用。纳米材料因其可控的尺寸和形貌深受研究者喜爱。通过向酞菁的中心环引入离子,这样改变周围的取代基团来对酞菁进行修饰或组装而获得纳米结构理应更适合于生物医学应用。光热疗法(PTT)和光动力疗法(PDT)是一种微创、高效、不良反应低的新型癌症治