论文部分内容阅读
随着人工智能(AI,Artificial Intelligence)技术渗透到科研与日常生活的各个领域,相关技术方法也给法庭科学领域带来了新的探索方向。特别是近来活跃于语音识别、图像处理、自然语言处理等方面等深度学习(DL,Deep Learning)神经网络技术,给笔迹鉴定领域中相当长时间处于瓶颈的离线签名笔迹自动鉴别带来了可尝试突破的可能,从而为签名笔迹鉴定提供了重要的辅助作用。笔迹自动识别技术和系统的开发已经有了比较长的发展历程,特别是在线笔迹识别在金融、安全、司法等领域已经有了很广泛且成熟的应用。但在司法鉴定文件检验实务中占很大比重的笔迹鉴定方面,很难有效利用。目前有研制成型的离线笔迹自动识别系统,长时间停留在传统的模式识别技术,虽然从常规图像处理技术进步到基于人工神经网络(ANN,Artificial Neural Network)建模,但仍然存在特征选取与特征价值量两方面的主要问题,一方面,对于离线笔迹,特别是摹仿签名笔迹的有效识别率较低;另一方面,人工预设部分的工作也导致并不能完全实现机器自动识别,存在主观局限与干扰。参考目前比较成熟的手写识别技术和人工智能技术的应用可以发现,运用深度学习算法或框架的深度神经网络(DNN)作为分类器,较传统神经网络有着良好的效果与优势。与笔迹鉴别关系密切的手写识别已有成熟的商业化产品,其识别目的虽与笔迹鉴别有所不同,但可借鉴其对深度神经网络的应用。活跃于语音、图像、自然语言等方面的深度学习算法针对离线笔迹鉴别一直存在的特征选取与价值量问题能够提供新的解决路径。本文尝试从理论和实验两个方面阐述改进神经网络在离线签名笔迹自动识别中的应用。结合传统模式识别原理和实践效果,提出笔迹自动识别对笔迹特征的需求与要求不仅限于人工笔迹鉴定时特征选取种类,也不仅限于传统自动识别笔迹形态学上的特征点,例如长宽比、字间距、笔画粗细、折笔角度、笔画之间的尺寸关系等。相应的,特征价值量问题也改为自适应模式,根据机器对个案特征的学习来匹配价值权重,不需要人为在选取特征时赋值。由此,从理论上阐明深度学习神经网络在笔迹特征问题上与鉴定原理的相适应性和理论优势,改变只有定量而缺乏定性的自动识别模式。本文实验部分主要借助的是百度在2016年发布的PaddlePaddle深度学习架构及基础的开源代码,将训练数据(样本笔迹)输入Paddle,训练深度神经网络模型,即卷积神经网络(CNN),通过迭代训练降低鉴别错误率,再用检验数据(检材笔迹)进行检验预测,实现离线笔迹鉴别目的,并尝试进行摹仿签名笔迹的识别。最后,通过真实的笔迹鉴定案例,验证本文方法在笔迹鉴定实务中起到自动识别的辅助作用。从理论到实验充分阐明与验证基于深度学习算法的深度神经网络可以实现离线签名笔迹的自动识别,以及一定程度上的摹仿签名识别并提出改进方向;同时能够解决传统方法中存在的特征提取与价值量问题,优化机器自动鉴别路径,提升机器自动鉴别原理的严谨性和科学性,以及自动化程度,将离线笔迹自动鉴别真正向人工智能方向发展。