论文部分内容阅读
书写人识别是生物特征识别和手写文档分析的研究热点之一,在金融、保险、公安、司法等诸多领域有广泛的应用需求,受到学术界和工业界的持续关注。文本无关书写人识别,是在不限定书写内容的情况下,通过计算机自动分析自然书写笔迹的书写风格来确认书写人的身份。尽管其相关研究已有二十多年的历史,但由于应用场景十分复杂,已有的文本无关书写人识别方法的性能尚不够理想,有待进一步研究。本文聚焦离线文本无关书写识别技术,研究文本无关笔迹特征提取、特征融合、字对相似度测量等关键问题,提出基于边缘共生特征的文本无关书写人识别方法,并针对中文高频词可能导致查询笔迹和参考笔迹中存在文本内容相同的字对,提出充分利用字对的辅助作用提高中文文本无关书写人识别性能的方法,通过实验验证了方法的有效性。本文的主要贡献和创新成果如下:1.提出一种蕴含笔画边缘方向和结构信息的边缘共生特征用于表达笔迹的书写风格。边缘共生特征以边缘像素为中心的一定尺寸的窗口作为处理区域,通过统计窗口内共生边缘像素对的出现频率来生成特征向量。该特征在多个公共数据库和竞赛数据集上都取得良好的识别准确率,特别是其在中文公共数据库上取得了优于已有方法的识别性能,表明本文所提出的边缘共生特征能够有效反映中文笔迹的书写风格差异。2.提出一种边缘共生特征与SIFT描述子直方图特征结合的文本无关书写人识别方法。SIFT描述子直方图从多尺度高斯差分图像中提取的关键点入手,记录关键点周围不同尺度下的纹理分布,并利用SIFT描述子码本计算笔迹图像中的SIFT描述子的分布直方图。与边缘共生特征相比,SIFT描述子直方图从更宏观的角度描述笔迹的书写风格,两者具有一定互补性,通过结合可以获得更好的性能。实验表明该方法对中英文书写人识别都有不错的效果,特别是面对多文种书写人识别问题时,在两个竞赛数据集上的实验均取得优于已有方法的结果。3.提出一种基于查询笔迹和参考笔迹中文本内容相同字对的笔迹相似度辅助下的中文书写人识别方法。在对查询笔迹图像和参考笔迹图像分别进行字符识别的基础上,对来自两幅笔迹的文本内容相同的字对图像,利用SIFT描述子计算其相似程度,并将其与基于边缘共生特征的文本无关书写识别方法相结合,在中文书写人识别中起辅助作用。在两个公共数据库上的实验表明字对辅助能有效提高中文书写人识别的准确率。4.提出一种基于位移场的字对相似度计算方法及其辅助下的中文书写人识别方法。从位移场的角度计算相似度,不依赖字符识别的结果可以直接检测内容相同的字对图像,并将这种基于位移场的字对相似度计算方法用于辅助基于边缘共生特征,应用于中文书写人识别。该方法在两个中文公共数据库上的实验都取得优于已有方法的结果,在英文公共数据库上的识别率也得到有效提高。本文提出的算法经过实验环境下的测试,并已在相关领域得到应用,例如基于边缘共生特征的文本无关书写人识别方法已经应用到作者所在实验室与公安部某研究所合作承担的国家科技支撑计划“基于**的抽拣器材研制”中,该项目获得了公安部科学技术三等奖。