论文部分内容阅读
图像分析和深度学习在字符识别领域已经取得了许多重大的成就。然而针对特殊具体的字符数据集样本仍然有很大的研究空间和价值。本文主要研究工业上点阵字符数据集,相比较其他字符数据集,工业上点阵字符数据集有以下特点:第一点阵字符相对于连续字符来说,字符信息量少,字符点阵的排列容易受到噪声干扰;第二现实工业上点阵字符数据集,每一类字符数据分布不均衡。针对点阵字符的特点和难点,本文对其做了一定的探索和研究,主要工作和创新如下:(1)针对本文的字符数据集,对卷积神经网络优化器,卷积核,激活函数进行调整,改进传统字符识别Le-Net神经网络,构建了适合本文研究对象的卷积神经网络。改进的神经网络对本文字符识别准确率从93.27%提高到99.88%,收敛速度提高了 20个epoch。(2)针对点阵字符信息量少,容易受到噪声干扰的问题。本文提出了基于膨胀的神经网络字符识别方法,具体方法是先对点阵字符做膨胀处理,补充点阵字符信息量,再进行神经网络训练和识别,分析并比较了相同神经网络结构,不同膨胀核系数处理后样本的字符识别准确率和时间效率。(3)针对字符数据集每一类样本分布不均衡的特点,本文提出了基于字符编码信息的神经网络字符识别方法,具体方法是将原先40分类的网络,通过字符编码信息,分成24类大写字母,6类小写字母,10类数字的三大类网络,进行字符识别,并且与传统方法和数据增广法在准确率,时间效率,便捷性方面做了详细比较。结合膨胀和字符编码信息方法,在识别时间相差不大的情况下,字符识别准确率从99.88%提高到99.95%,在16000张测试集中,识别错误个数下降了 11个。