论文部分内容阅读
脱机手写体汉字识别被认为是模式识别领域中最具有挑战性的难题之一。由于汉字种类繁多且书写风格因人而异,使得脱机手写体汉字的识别效果一直难以令人满意。本文采用仿生模式识别理论,构建了一种由双权值神经网络组合实现的具有对每一类汉字分类“认识”功能的脱机手写体汉字识别方法,这对促进属于超多类模式识别的手写体汉字识别发展具有一定的理论意义。
本文主要研究工作如下:
1.建立了具有容错表征方式的脱机手写体汉字图像的拓扑结构图形。通过模仿人类对汉字的认知方式,将手写体汉字图像转化为由横、竖、撇、捺基本笔划在不同位置组成的图形,将基本笔划图形组合得到折笔划以及笔划相合相交拓扑结构图形。可将对汉字图像的研究转化为对具有容错表征方式的汉字笔划图形的研究。
2.构建了脱机手写体汉字笔划特征提取的仿生神经网络。采用仿生模式识别方法,建立基本(横、竖、撇、捺)笔划、折笔划和笔划相合相交拓扑结构提取与合成的仿生神经网络模型。将对汉字笔划图形的研究转化为对双权值组合神经元网络的研究。
3.给出了一种脱机手写体汉字的容错匹配识别方法。模仿人类归纳的汉字形码输入法,将对汉字特征的表征转化为手写体汉字的笔划类型容错特征、笔划数量特征、笔划位置信息特征和相合相交拓扑结构特征,构建脱机手写体汉字多维特征知识数据结构表。可对脱机手写体汉字进行容错匹配识别。
选取SCUT-IRAC HCCLIB手写体汉字图像样本数据库中的汉字样本对系统进行了仿真实验验证。实验结果表明,为该识别方法的有效性可行的,具有接近人类识别汉字的容错性和准确性。