论文部分内容阅读
盲文作为视障人群文字交流的工具,使数千万盲人的书写和阅读成为可能,盲文自动识别研究对盲人学校教师、盲文古籍管理人员和盲人监护人等具有十分重要的意义。目前已有的盲文识别方法需要严格的图像采集环境和仪器设备,实用性较差,而且识别过程需要一定的人工预处理操作,无法实现盲文自动识别。针对以上问题,本文对已有的研究工作进行总结,结合灰度投影积分法和深度学习方法对盲文图像的自动校正、自动分割和盲文识别几个部分分别进行了实验研究,构建基于深度学习的盲文自动识别系统。本文主要研究内容如下:首先,根据盲文字符中同一行或同一列盲方几何对正这一特点,本文提出一种基于灰度投影积分图的盲文校正方法,根据盲文灰度投影积分图与盲文偏转角度之间的规律,确定盲文偏转角度予以校正。实验表明,此方法成功实现盲文的偏转校正。其次,针对盲文所有盲点互不连通而无法使用一般文字分割方法这一问题,本文通过灰度投影积分图确定盲点位置,以灰度柱的固定规律寻找相邻盲方的中线做分割线,横竖分割线共同作用将所有盲文字符相互分离。使用此方法对大篇幅盲文字符进行分割时,取得了十分出色的效果。最后,针对传统盲文识别研究中手工定义特征点、识别率低等缺陷,结合在图像识别领域发挥巨大威力的深度学习技术,进行了基于深度神经网络的盲文识别研究。实验中利用caffe框架改进构建了多种不同结构的卷积神经网络,采用稀疏表示更强的PRe LU激活函数代替Re LU激活函数以避免网络训练时神经元“死亡”和梯度消失等问题;以Dropconnect代替一般Dropout,在防止训练过拟合的同时增强了网络的特征学习能力。用针对特征提取层、全连接层和数据集图像尺寸等因素设置了对比实验,通过各网络模型的识别准确率和运算速度对比,确定最佳网络模型。在实验数据集的制作中,充分考虑盲文识别的实际使用情况,在多种实际环境中采集盲文图像并进行噪声添加处理,以提高盲文识别系统的鲁棒性。实验结果表明,本文方法对盲文识别准确率超过99%,极大的提高了盲文识别系统的精度和实用性,对于相关仪器的研究和开发具有一定意义。