论文部分内容阅读
脱机手写体汉字识别是当前模式识别领域中的研究热点和难点之一,具有广泛的应用前景。用单一的特征提取方法很难全面的表征手写体汉字,而手写体汉字特征的完备程度对识别效果有很大影响。本文采用粗糙集理论和粒度原理方法,以汉字样本的真实属性指导训练过程,在多特征融合表示脱机手写体汉字的条件下,探索基于变精度粗糙集和粒度原理的脱机手写体汉字识别方法。
本课题主要完成了以下研究工作:
1、构建了一种脱机手写体汉字识别决策信息系统。根据粗糙集理论,以脱机手写体汉字特征属性作为条件属性,以汉字样本真实属性作为决策属性,建立以先验知识指导训练过程的脱机手写体汉字识别决策信息系统。
2、建立了一套脱机手写体汉字识别决策信息系统性能评价体系。基于变精度粗糙集和粒度原理,在变精度粗糙集模型中引入粒度变量,定义了脱机手写体汉字识别决策信息系统中手写体汉字特征属性知识粒度熵、决策属性知识粒度熵、特征属性集相对于汉字真实属性集的相对粒度熵、特征属性相对重要度四个性能指标,并给出了具体的计算方法,在知识粒度空间下指导手写体汉字特征约简。
3、提出了一种脱机手写体汉字多特征融合约简优化算法。根据特征属性相对重要度以及脱机手写体汉字识别决策信息系统性能指标的定义,给出了基于手写体汉字相对粒度熵的变精度粗糙集脱机手写体汉字识别决策信息系统多特征融合属性约简算法,在完备的评价体系下获得简约、优化的脱机手写体汉字识别决策信息系统。
4、设计了一种脱机手写体汉字多分类反馈迭代识别机制。针对识别规则匹配过程中存在的不确定性,设计了由基于Mahalanobis距离的最小距离分类器、贝叶斯后验概率分类器和加权后验概率均值分类器组成的三层分类器组,制定了基于粗糙集模型多次反馈迭代的识别机制,有效抑制误识率、拒识率和重码率,提高系统识别精度。
本文从SCUT-IRAC HCCLIB手写体汉字图像样本数据库中选取30类共1200个手写体汉字图像作为实验样本,并在MATLAB7.3软件中编写相关程序,对本文提出的脱机手写体汉字识别方法进行验证。实验结果表明,该方法是有效可行的。