论文部分内容阅读
针对表格中常用的印刷体汉字提出了一种识别方法,并设计与实现了基于该方法的印刷体汉字识别系统。该系统首先对输入的汉字图像预处理,得到格化的汉字图像;然后利用汉字图像的面积进行第1级中心提取粗分类;再利用人工神经网络技术进行第2级粗分类,以减少候选字个数,提高识别速度;最后,利用汉字的笔划特征作最终细判识别,并给出识别结果汉字。该系统的正确识别率达98%以上,识别速度为3字/s。该方法中结合了传统模式识别技术和神经网络技术,克服了不稳定性和不准确性,故适应性较强。