论文部分内容阅读
汉字识别是模式识别和人工智能领域的一个重要课题,脱机手写体汉字识别则一直是汉字识别中一个极具有挑战性的难题,而细化算法是脱机手写体汉字识别的重要一步,细化算法的优劣将直接决定汉字识别的识别率。本文探讨的主要内容是脱机手写体汉字识别中的细化算法研究。
评价细化算法优劣的标准主要有:(1)细化迭代次数要少,速度要快;(2)骨架图像应尽可能接近原图像的中心线;(3)骨架应保持连通性,不应产生断点;(4)应尽量保持原图像拓扑结构和几何特征,不应产生严重畸变,尤其是“T”形变“Y”形畸变;(5)尽量细化为只有一个象素宽的图像。对经典算法比较后发现快速并行细化算法(FPA)是比较好的一种算法,其基本能满足以上几点。
实验研究发现,FPA算法的致命缺陷在于对于一些特定的笔画,FPA算法会将其删除殆尽,直到只剩下最后一个象素点为止。针对以上缺陷,本文提出了基于模板保留的快速并行细化算法(FPA-RT)。实验结果表明,FPA-RT 算法克服了FPA算法的固有缺陷,且运行速度快,对手写体汉字能很好地得到中心骨架,没有断点,较好地保持了原图像的拓扑结构,细化为只有一个象素宽的图像。
最后本文用一种特征提取方法——基于顶点和方向向量的特征提取算法(FESOV)对所有细化算法进行验证,从细化结果和汉字特征两方面证明了FPA-RT算法的有效性。