论文部分内容阅读
一直以来,笔迹都是身份验证的重要手段。随着生物特征识别技术的不断发展,笔迹验证成为模式识别领域研究的热点。迄今为止,离线笔迹验证的研究已经比较成熟,验证结果较好。随着信息化时代的来临,手写采集设备的日益普及,无纸化办公、无纸化交易的应用使书写者逐渐摒弃传统的纸笔模式转而在线的书写笔迹。在线笔迹是未来发展的趋势,但在线笔迹验证仍有不少问题亟待解决。本文总结在线中文手写笔迹的特点,针对汉字特征提取不稳定,验证效果不高的问题,着眼于文本相关的在线笔迹验证,改进了特征提取的方法,提取了笔迹的结构特征,提出了基于结构特征的在线笔迹验证方法。论文的主要工作包括:(1)提出了基于统计特征和结构特征的二级匹配框架。在特征提取阶段,提取了两类特征:统计特征和结构特征。共提取了7种统计特征,通过多数投票法对统计特征进行分类,作为一级匹配,对笔迹进行粗分类;将结构特征作为二级匹配,对笔迹进行细分类,减少匹配时间,提高验证效率。(2)结构特征提取阶段,本文分析了汉字的主要结构,并选取了笔段特征作为结构特征。总结了传统的笔段提取算法,采用基于角度的多边形逼近算法。该算法通过内角衡量笔画的变化性,并进行迭代运算找到所有的拐点,连接所有拐点获得近似笔段,对近似笔段进行合并,得到笔段特征。(3)在对结构特征的匹配算法选取上,使用了Hausdorff距离作为相似度的度量。分析了Hausdorff距离及其常见的几种改进算法,提出了一种新的改进算法:部分Hausdorff距离和基于平均值的Hausdorff距离相结合的Hausdorff距离。该算法将单向Hausdorff距离中的最大值和最小值剔除,然后求平均值作为改进后的单向Hausdorff距离。实验数据证明,该算法提高了在线笔迹验证的准确率。(4)在笔段进行匹配的过程中,改进了笔段匹配方法。通过对匹配的笔段进行对齐,减小笔段间的距离;通过检测笔迹的多余笔段并删去该笔段,避免发生误匹配;通过对笔段进行动态匹配,提高匹配的准确度;通过对待测笔段进行删点处理,防止发生匹配右移现象。(5)笔迹验证实验在自制的WHUT-13DZ笔迹数据库中进行,该数据库包括30人的笔迹,每人写下了一段包括12个汉字的笔迹,共重复6遍。实验获得了1.1%的误拒率和1.2%的误纳率。