论文部分内容阅读
20世纪80年代,随着图像处理和模式识别技术的发展,数字、字符识别研究越来越引起人们的重视.字符识别特别是小语种数字、字符识别有其自身的特点:字符的种类繁多;字符形态复杂、多样;研究起步较晚;应用需求日益上升.为了满足实际应用的要求,深入研究小语种数字、字符的识别具有学术意义和应用价值.字符识别一般包括预处理,特征提取和分类器设计.本文的创新工作有:图像预处理:改进的Bernsen算法,采用线扫描的Bernsen算法结合Gaussian滤波能有效的去除非均匀光照图像中的阴影干扰。由于不同字符有其自身的特点,对不同的字符集采用不同的特征提取方法:1.基于Kirsch算子提取的方向特征法.提取字符的水平、垂直、左对角和右对角四个方向的特征,把原图向量结合起来共同映射为一个新的特征向量,对该特征空间进行PCA降维得到新的特征.2.基于主成分分析图像重建的特征提取方法,对字符进行识别.提出图像主成分分析特征提取方法,该方法能保持特征稳定的情况下比二维主成分分析提取图像特征系数少.3.加权线性判别分析方法.线性判别分析并不确保对分类准确性最优,有可能使得已经分开的邻近类引起不必要的重迭.为了克服这类问题,本文对线性判别分析进行加权处理,找到最优子空间.分类器的设计是字符识别的关键,本文的研究有:1.提出了基于阈值的贝叶斯判别函数结合核方法的分类器,分析了核与高斯过程的关系,采用阈值替代的方法解决特征矩阵求逆的问题,该分类器对数字、字符进行识别研究.2.研究了标准化多项式核的支持向量机.在保持识别性能的前提下,有效避免核函数参数的选择问题.本文的数字、字符识别的应用研究包括手写孟加拉数字识别,日文平假名识别,日文地址字符识别,英文字母识别,阿拉伯数字识别.本文研究的两个应用是孟加拉手写信函识别和日文车牌识别.通过预处理、特征提取和分类器的研究获得满意和实用的识别结果.