论文部分内容阅读
随着全球信息化进程加速,提高信息处理的效率已成为当务之急。伴随Android操作系统的普及和光学字符识别技术(Optical Character Recognition,简称OCR)的研究,如何利用智能移动设备高效地录入文档信息己成为一个的热门问题。本文分析了手机成像的特点,研究了光学字符识别技术中的字符预处理、特征提取和分类识别算法。在字符预处理中依次对原图像进行了压缩、灰度处理、二值化处理、方向矫正、字符分割和归一化处理。对原图片使用双线性插值算法成比例压缩;采用OpenCV开放库的灰度权值进行灰度化;在二值化处理中对传统方法进行比较研究,针对不同图像设计了不同的二值化处理方法,并对传统Bernsen算法进行改进,对原图片和高斯滤波后的图片分别用Bernsen算法计算,用求得的两个阀值重新计算新的阀值。采用平滑游程算法和细化处理对倾斜图片进行校正;利用水平投影和垂直投影方法分割图片字符;最后采用双线性插值法将每个字符图片归一为24*36px。对结构特征和统计特征的两类提取方法进行研究,确立了本文的特征提取方案:提取54个粗网格特征向量和20个穿透特征向量,并合并写入特征文件。采用三层BP神经网络算法识别字符。为了提高算法效率,本文对网络节点数的选取办法进行改进,最后在Matlab软件中对神经网络进行仿真实验,读取特征文件并分类识别,通过实验结果验证了该算法的可行性。结合对手机光学字符识别的研究和中小学英语单词听写的需求,本文在Android环境下设计实现了中小学生单词听写软件。软件主要分为图像识别、单词听写和系统功能三部分,听写可以选择手机听写和纸张听写。该应用通过OCR技术实现从手机图片到文本的转换,利用语音合成技术实现从文本到语音的转换。单词听写软件能够直接从图片中识别英文单词并朗读听写,使用起来方便快捷,能够达到辅助教学、帮助听写的目的。