论文部分内容阅读
人类用眼睛和大脑识别各种文字和图像,而且能排除各种干扰和变形影响。因此,研究机器模仿人类的认识汉字的过程不论对汉字识别,乃至对人工智能模式识别都具有重要的理论意义和实用价值。 本文针对汉字本身的结构特征和笔划特征,综合运用了小波分析和数学形态学,从仿人认字的过程出发,对视频图像进行了字符分割,针对机器识别汉字结构的特点,提出了仿人汉字识别思路和方法,力图使计算机具有模仿人类的视觉感知过程。 论文的研究工作如下: 1)图像分割预处理。提出了利用小波变换的字符图像定位方法,结合数学形态学定位分割出字符区域。字符图像通常具有一定的方向信息,二维小波变换能够提取图像各方向上的边缘细节,字符图像具有一定的连通性,数学形态学能够定位分割出字符区域。 2)汉字编码方法。提出一种仿人汉字识别系统十码编码方法。研究了人类识字的汉字编码方案,借鉴五笔码、四角号码、太极码等众多字元选取与取码规则的基础上,结合仿人汉字识别系统中机器识别汉字结构的特点,提出一种十码汉字编码机器识别方法。 3)识别算法。给出了十码汉字编码法的识别码提取算法。在对汉字笔划分解的基础上,根据运用的字符特征给出了识别码的提取算法。 本文研究表明:视频图像字符分割算法能够有效地提取出图像中的字符部分,尤其是能够很好的将图像中的游离字符定位出来,对于有一定倾斜角度的字符图像也可以被定位分割。编码识别方法能够按照字符特征提取的汉字识别码对汉字十码编码,能很好的区分识别汉字字符。 总结了本文中仿人汉字识别编码方法的优点与不足,提出了研究中的几点思考与展望。