论文部分内容阅读
字符识别是模式识别的一个分支,它能大大提高信息的采集录入速度,减轻人们的工作强度。随着计算机技术的飞速发展,字符识别技术多年来不断改进和完善,现在已经广泛应用于各个领域,使大量的文档资料能快速、方便、省时省力和及时地自动输入计算机,实现信息处理的电子化。到目前为止,尽管人们在字符识别的研究中已取得很多可喜成就,但还不能满足我们日常的需求。研究字符识别技术,提高字符识别率具有非常重要的意义。本文针对字符识别的相关方法进行研究,主要工作包括:1.进行字符识别前,先要进行图像预处理,本文对图像预处理的一些方法进行了研究,像灰度化、二值化、噪声处理、特征值提取等。对灰度化和二值化的各种方法进行了性能比较,针对光照不均匀的车牌图像二值化效果不好的问题,给出了一种改进的局部阈值法的二值化方法,使用这种改进的方法能够有效的得到二值化图像。2.图像预处理阶段,重点分析了图像边缘检测方法,边缘检测对字符轮廓的提取、车牌定位、字符特征值提取等都非常重要。本文在深入研究传统Canny算子的基础上,对双阈值为极值点给予了证明,并给出了一种改进的Canny算子,通过对添加了椒盐噪声的图像进行大量实验,证明了本文给出的方法性能好于传统Canny方法。3.形状上下文(Shape Context)是一种形状描述方法,本文给出了一种改进的形状上下文方法用于字符粘连的复杂验证码识别。传统的逐个像素点特征提取和模板匹配的方法,只能对简单验证码进行识别,而字符粘连的复杂验证码还无有效的识别方法。针对字符粘连不能有效的提取单个字符特征的问题,本文给出了改进的形状上下文方法进行特征提取,并采用字符整体识别的方法,实现了对复杂验证码的识别。4.BP神经网络作为一种应用最为广泛的神经网络学习算法,在车牌识别中得到了广泛应用。针对BP算法存在的收敛速度慢、易陷入局部极小等缺点,本文引入动量因子和自适应学习速率、改进激励函数以及使用LM算法对其进行改进。通过大量的车牌识别实验,本文将各种改进的BP算法性能进行了比较,并将本文方法与传统模板匹配方法进行性能比较,证明了本文给出的算法性能优于传统模版匹配方法。