论文部分内容阅读
据统计全球约有1.67%的人群由于存在视觉和听觉方面的障碍而难以进行正常的工作和学习,图像文字识别和发音朗读技术的实现再造了视听障碍患者的耳目,然而,已有的图像文字识别和朗读技术主要是基于PC机客户端的,基于移动通信设备(例如:安卓手机)客户端的图像文字识别和发音朗读方面相融合的技术还并不成熟,而且文字识别过程中的所需要的系统开销较高。随着智能手机操作系统的产生与发展,安卓手机的应用越来越广泛,如何实现基于Android手机客户端的图像文字识别与朗读技术,是所有视听障碍患者所渴望实现的梦想,也是广大研究者所面临的共同问题。基于以上问题,本文实现了一种基于安卓手机平台的图像文字识别及朗读技术,该技术将中文图像文字识别技术和英文图像文字识别技术融合在一起,实现了中英文双语文字识别功能,并在文字识别过程中通过使用迭代法提高了文字识别速度,同时,实现了语音同步朗读功能。实现该技术的主要流程为:首先,对待识别的图像进行预处理,包括:图像的裁剪、图像的灰度化处理和图像的二值化处理;之后,为了节省文字识别过程中的系统开销,本文基于NDK机制并使用tesseract-two工具对图像中的文字进行识别;最后,本文通过语音合成技术实现了基于Android手机客户端的同步发音朗读功能,该功能具有较好的可扩展性,在实现同步朗读时本文通过调用系统提供的接口使用Pico引擎,不但可以实现对中文的语音合成也可以实现对其他语言的语音合成。此外,本文还实现了图像来源选择功能模块,图像选取预览功能模块和显图像转换结果功能模块。通过对该系统各功能模块进行测试,以及对核心算法的性能测试结果表明:本文实现的基于安卓平台的图像文字识别和朗读技术对文字的识别速度更快,准确率更高,该技术的综合性能较好,具有一定的研究意义和实用价值。