论文部分内容阅读
该文结合实际的应用背景,针结文体图象中字符的切分和识别问题进行研究.人们对 孤立字符的离线识别作了大量的研究工作,而走向实用化进展不快.除了单字识别率不理想外,从文本图象切分出单个答符也是一个主要难题,因为字符的识别离不开正确切分.该文提出了一种基于汉字结构特征的手写汉字字符切分算法.对粘连手写体汉字的二值图名进行了细化处理,检测端点、叉点、角点等特征点并提取笔段;根据汉字的结构特征找出粘连点,进行粘连字符的分割;通过对背景图象进行细化处理,确定适当的切割 路径,将两个粘连汉字完全分隔开来.字符切分过程中有效检测和去除书写线十分必要.该文采用快速的Hough变换检测信封上的书写线,从图象中抽取少量特征点,将其分成两处子集.每次从两个 子集中各取一个点计算变换空间内的对应参数,Hough变换的速度大大加快,具有很强的实 用价值.针对谪业信函上印刷体邮政编码数字的识别,提出了一种基于左右轮廊特征识别印刷体数字的新方法.多分类器组合是改善系统识别性能的有效手段,为了提高多分类器组合的效果,该文提出了一种改进的投票表决规则.在书写人笔迹鉴别算法中,采用双边定界法对输入的笔迹图象进行尺度规范化.提取笔迹分布密度特征、笔道方向特征和投影矩特征,分别作为三个多层神经网络的输入,以人工神经网络的输出进行组合得到鉴别结果.通过背景彩色分量估计,将彩色图转为灰度图.以字符笔道象素在图象中所占比例作为先验知识,确定合理的分割阈值,对灰度图象进行了二值化处理.该文创新之处:1.提出了基于汉字结构特征的手写体汉字字符切分算法;2.提出了利用汉字画特征的粘连汉字字符切割算法;3.提出了一种快速Hough变换的书写线检测算法;4.提出了基于图象彩色矢量估计的彩色图象 字符切分方法;5.提出了基于左右轮廓特征的数字识别新方法;6.提出了一种改进的多分类器组合投票表决规则;7.提出了一种基于多神经网络组合的书写人笔迹鉴别方法;8.研究了信函自动分拣和集装箱号码识别中的字符切分与识别算法.