论文部分内容阅读
手写字符识别技术在模式识别、人工智能、信息安全和人机交互中有着非常重要的作用及广阔的发展前景。到目前为止,手写字符识别技术主要用在邮件自动分拣、统计报表录入、银行票据处理、账号密码识别和人机交互等,大部分领域对手写字符识别技术的正确率要求比较高。作为3D空间手写字符识别中的重要步骤,维数约简是简化识别过程和降低计算成本的关键,因此对它的研究变得尤为重要。首先,本文对手写字符识别技术等相关内容进行全面的分析与研究,并且对比较常用的维数约简算法(主成分分析、线性判别分析、局部线性嵌入、局部保留投影)进行介绍,通过全方位的对比,总结其所存在的缺点和不足。可以发现经过现有保持全局结构的维数约简算法处理后的2D字符方向会随机发生翻转,需要方向调整后进行图像识别,以降低2D图像的误识别率。然后,为了改善以上算法存在的缺点和不足,本文提出了一种全新的算法:基于最长轨迹投影的维数约简算法。该算法不仅可以简化识别过程,而且可以提高手写字符的识别率。该算法步骤如下:首先,获取运动指尖的3D坐标,依次连接坐标点生成3D运动轨迹;接下来,将3D轨迹上所有的点分别投影到XOY平面、XOZ平面和YOZ平面形成2D轨迹;最后,分别计算三个平面内的2D轨迹上相邻点的长度和,选择长度和最大的平面作为最佳投影平面。通过对该算法进行实验和分析,可以发现该算法原理简单、步骤简洁,算法处理后得到的2D图像不仅保留了原始数据的全局结构信息,而且具有固定的方向和较好的视觉效果。另外,本文使用所提维数约简算法和基于主成分分析的维数约简算法对3D空间手写字符进行维数约简,通过对比实验结果发现,所提维数约简算法具有较好的视觉处理效果和比较稳定的结果,并且字符图像不会随机发生翻转;而基于主成分分析的维数约简算法处理后的2D字符图像方向会随机发生翻转,这会严重影响到后续的特征提取和最终的识别效果。所提维数约简算法比基于主成分分析的维数约简算法更加适合本文所研究的3D空间手写字符识别中的维数约简。最后,为了进一步验证基于最长轨迹投影的维数约简算法的可行性和有效性,对基于最长轨迹投影的维数约简算法和基于PCA的维数约简算法处理得到的2D字符图像分别进行识别,并比较识别结果。识别结果表明所提维数约简算法处理得到字符图像的平均识别率大于基于PCA的维数约简算法处理得到字符图像的平均识别率。并且本文提出的维数约简算法处理得到的字符图像不会随机发生翻转,不需要方向调整算法就能够使3D空间手写字符的识别率达到96.5%。