论文部分内容阅读
传真文件收件人姓名自动识别系统属于专用OCR系统开发范畴。专用OCR系统的开发,将在很大程度上拓宽OCR技术的应用领域,提高相关应用领域的自动化程度。同时,由于系统所要处理的对象是特定的,在系统的实现过程中所遇到的一些新问题和所采用的新方法,对于OCR技术的研究具有一定的理论价值。在专用OCR系统中,传真收件人姓名字符的识别技术具有较好的应用前景及实用价值。本文针对传真收件人姓名字符的识别技术进行了研究与应用。在字符图像预处理方面,除对传统方法的研究外,根据传真收件人姓名字符图像的特殊性,经过多次实验,选取了适合于传真字符图像的二值化、噪声过滤、倾斜校正、字符大小归一化及细化等方法;针对传真收件人姓名字符可能存在书写线的特点,对书写线的检测和去除方法进行了分析,使用了一种基于数学形态学的书写线去除方法;在字符切分上,对于规格比较统一、字符分离清晰的字符区域使用最常用的基于投影分析的波峰-波谷法对字符图像进行切分,以便进行字符识别,针对投影法无法切分的粘连字符块,采用了一种根据字符笔画信息,寻找合适的分割点和分割路径的分割方法。在文字识别方面,本文基于不同的网络模型有其自身特点,利用多神经网络集成技术,建立了一种利用多特征的多级混合神经网络的识别系统来处理字符识别问题,并提高其识别率。识别系统的分类器由字符粗分类和细分类两级组成,本文的自组织聚类网络可以很好地给出模式在多维空间的概率分布估计,结合字符的笔划复杂性指数、四边码、粗外围轮廓等特征可以较好估计出字符的粗分类结果。BP网络有着优秀的非线性映射特征和对输入矢量的分类能力,使用BP网络和字符的轮廓特征、笔划穿越密度特征构建字符的二级细分类器可以分析相似字符的细微差别。实验结果表明,使用混合神经网络的传真收件人姓名字符识别方法对大字符集样本的识别率达到了91%左右,比使用单一神经网络提高了8%。在字符识别方面,本文还着重研究了支持向量机。支持向量机是属于高维数小样本的学习识别机器,这样在给出了更多特征维数后,可以由少量的样本,就可以达到很高的识别率。结合特征提取方法,我们提取了多达几百维的特征,用支持向量机识别,取得了较高的识别率。文中对四种常用的核函数分别进行了实