论文部分内容阅读
基于运动图像的手写汉字识别是在传统手写汉字识别基础上的一种新发展,它兼具有脱机和联机方法的特点,但却对所涉及的各个环节提出了更高要求。围绕这一问题,本论文主要对特征提取、分类器设计及特征压缩、基于运动图像的手写汉字提取及识别系统三个方面进行了研究,主要内容包括: 1. 提出了一种基于笔画的手写汉字方向分解方法。考虑到笔画象素点及其邻域的象素分布特征反映了该象素点的所属笔画方向属性,该方法定义了笔画象素点的方向特征数,并在此基础上设计了笔画的方向分解算法。与已有方向分解方法不同,它无需提取汉字的轮廓或者骨架,因而既可以一定程度上避免基于轮廓的方法敏感于不同手写汉字笔画宽度与书写变形的不足,又能改善基于细化的方法中所导致的模糊笔画以及低分辨率手写汉字笔画信息的丢失。2. 提出了一种基于笔画密度的弹性网格特征提取方法。该方法将非线性归一化中的笔画密度概念引入弹性网格的划分,构造了手写汉字的密度网格,并将之应用到汉字特征提取,这样既兼顾了笔画密度对不同的笔画不规则变形的适应能力,又避免了非线性归一化产生的笔画宽度粗细不均匀。与非线性归一化的方法相比,该方法的计算量也相对减少。3. 将弹性网格引入到Gabor 特征中,提出了一种改进的手写汉字Gabor 特征提取方法。如何选择采样点是影响Gabor 特征识别性能的一个重要问题,该方法根据笔画分布将手写汉字划分为弹性网格,并取弹性网格中心作为采样点。与采样点均匀分布相比,该方法能够更好地适应手写汉字的笔画变形。4. 根据支持向量机的特点,提出了一种解决大类别手写汉字识别问题的支持向量机方法。作为一种新的机器学习方法,由于其建立在结构风险最小化准则之上,而不是仅仅使经验风险达到最小,从而使得支持向量机分类器具有较好的推广能力。但是,对于大类别的模式识别问题,无论训练或者识别阶段,存储与计算量都比较大,为此,本文采用基于支持向量机的两级手写汉字分类模型,即通过最小距离分类器的预分类,将支持向量机的训练和识别对象限制在候选字集合中,这样,在保证支持向量机分类能力的情况下,每个两类支持向量机分类器的训练样本数、训练次数以及支持向量个数都相对减少,同时也提高了汉字的识别速度。在此基础上,本文提出了加权分类策略,识别率也具有明显的提高。5. 研究了基于PCA&LDA 的手写汉字特征压缩问题,并在此工作的基础上,提出了一种基于多通道PCA 模型的手写汉字识别方法。经过特征压缩,在保持汉字识别率的情况下,特征矢量维数可以大大降低,而且基于LDA 的方法对于一