论文部分内容阅读
手写是人类的基本社交能力,随着移动终端近年来的逐步普及,手写识别在现实生活中的意义也越来越明显。手写体文字识别的研究已进行了很长的一段时间,虽然技术十分成熟,但只局限在识别一维空间的序列上,其识别技术不适合处理二维空间上分布的数据,尤其是手写数学公式的识别。因为数学公式不仅包括复杂多样的符号信息,还包括符号间不同空间的结构关系。故本文针对联机手写数学公式的符号,使用隐性分割的模型对数学公式符号进行处理及识别,即对样本不进行字符级别的精确分割步骤,有很强的优越性。本文的主要工作及贡献有:1.基于双向长短时记忆递归神经网络模型(Bidirectional Long Short Term Memory)设计联机手写数学公式符号识别的系统,该系统不需要将输入数据进行符号级别的分割。并使用时域连接模型(Connectionist Temporal Classification,CTC)标签输出的无分割公式序列。2.对联机手写数学公式的输入数据的进行预处理及提取特征,预处理包括重采样与归一化。针对无分割的数学公式符号识别进行根据笔划的公式大小归一化。3.提出联机手写数学公式符号识别的整体识别方法,在训练过程中将多部件构成的复杂符号根据ASCII码表转化成单字符标签,减少了识别标签的不确定性,并由此将其他复杂符号也转化成单字符标签,统一标签类型。4.改进现有的基于编辑距离的标签错误率及归一化标签错误率计算方法,使评价标准更符合客观事实。本文设计的联机手写数学公式符号识别系统对于公式的符号识别有着良好的识别效果,不需要对公式进行切分处理,减少了一般公式识别方法中的工作量。实验验证多部件复杂符号整体识别的方法有效,比单独识别的准确率高很多。