【摘 要】
:
OCR字符辨识是使用计算机对纸质材料或其他材料上的文字进行识别并电子信息流化的过程。由以往的研究表明,字符辨识系统的识别效果,与文本图像的预处理,如二值化处理、平滑处
论文部分内容阅读
OCR字符辨识是使用计算机对纸质材料或其他材料上的文字进行识别并电子信息流化的过程。由以往的研究表明,字符辨识系统的识别效果,与文本图像的预处理,如二值化处理、平滑处理,及文字分割处理都密切相关。错误的二值化或者分割将直接导致错误的字符辨识。因此,近年来,二值化方法以及文字的分割方法,成为了OCR领域中最大热点之一。本文首先介绍了图像的二值化方面的内容,对现今的较为常用的二值化方法,按全局Threshold化法与局部Threshold化方法的分类进行了分析和比较。之后介绍了字符分割的常用算法,从以往的传统分割方法到较前沿的识别类分割方法,进行了分析和比较。本文还重点介绍了在字符分割领域应用较多的Drop-fall算法等热门算法,在Gray-scale Image的基础上,对Drop-fall算法进行了优化,提出了基于此优化算法的字符分割算法。此改进方法是先将灰度的文本图像进行基于灰度的Segment化,再根据Segment Connected domain的概念把这个对象拟合为树的结构,然后确定主节点层,根据已有的算法在若干节点上进行更多的后期处理,最终得到最优化的分割结果。对于该方法中所使用的各类处理方法,文中都进行了较为详实的介绍,并给出了仿真结果的演示。在最后的仿真结果表明,该方法对Image质量较差(例如混合文本、图像模糊有断裂字等)的文本图像,有着比常规算法更加优质的结果。
其他文献
正交频分复用(OFDM,Orthogonal Frequency-Division Multiplexing)以其高的频谱利用率和强的抗多径衰落能力,已经被欧洲数字广播系统及IEEE802.11a、HiperLAN/2和IEEE802.16
信道编码技术是未来宽带无线通信系统中关键技术之一,而低密度奇偶校验码(LDPC)由于具有逼近香农限的性能,成为信道编码研究领域的一个热点。在简单回顾了信道编码的发展背景
在辐射环境下工作的电子系统,因受到辐射产生辐射效应,导致系统不能正常工作。不同器件生产工艺对不同辐射源敏感程度不同,模数转换器(Analog-to-Digital Converter)是由混合工
随着通信技术、计算机网络技术和信号处理技术的发展,在当前越来越复杂的电磁环境中,传统的单一电子对抗的设备已经不是主流发展方向了,比如在雷达电子对抗领域,雷达组网首先
S盒是分组密码中的唯一非线性部件,它的密码强度了决定整个分组密码的安全强度。一般使用传统的数学方法构造出性能优异的S盒是非常困难和复杂的,近年来仿生智能优化算法已在
随着社会生活节奏加快、人口逐渐老龄化,心血管疾病已经成为严重威胁人类健康和生命的主要疾病,而且此类疾病往往具有突发性,如果不能及时发现并进行治疗将会产生非常严重的
信道是发射端和接收端之间传播媒体的总称,它是通信系统重要的组成部分。建立无线信道模型对于移动通信系统性能分析和工程应用都有重要意义。本课题从属于与某研究所的合作
甲状腺功能亢进症(简称甲亢),是常见的内分泌疾病,根据其典型的高代谢症候群、甲状腺肿及眼症,结合实验室检查,诊断并不困难,但老年甲亢起病较隐匿,临床表现常不典型,故易漏
LTE作为现代通信系统新一代的标准,已经被各大运营商和研究机构所接受。为了获得更高的通信速率、更大的覆盖范围和系统容量,LTE引入了OFDM和MIMO等关键技术,支持FDD和TDD两
MIMO(多输入多输出)技术可以在不增加系统带宽的情况下成倍地提高系统容量和频谱利用率,它已成为下一代移动通信系统关键技术之一。作为MIMO技术关键环节的MIMO检测算法正吸