论文部分内容阅读
目前多数汉字识别系统仍基于单个汉字的逐个识别 ,因此对字符进行有效的切分 ,是离线汉字识别的一项重要工作 .根据汉字手写体的特点 ,在方差最小原理基础下 ,提出多步切分算法 (粗分 -细分 -合并 )和穿越算法 .首先根据字段间间隔 ,用最小距离聚类的方法 ,得到 5组粗分结果 .从中选出最接近理想的一种 ,用改变类间距离和穿越算法 ,对较宽的字段进行细分 ,最后将过细的分割部件合并成一个完整的字 .对现场采集的 30 0 0封信函进行切分 ,单字正确率可达 90 .8% .