论文部分内容阅读
利用OCR技术可以便捷地将文本图像处理成结构化的文本信息。传统电脑上的OCR软件的弱便捷性决定了PC端无法便捷地处理日常生活中的文本图像信息。由于移动端Android平台的开源特性,Android在移动端领域占据了大部分的市场份额,同时近几年移动硬件发展快速,移动端的处理能力日益增强,可以完成PC端的大部分工作,而移动端平台对于录入文本信息不受时间地域的限制,是开发OCR应用的最佳平台,因此基于Android平台开发应用具有广阔前景。本文基于这个研究背景,在实习基地某研究院校外导师和校内导师的指导下完成软件开发任务,软件开发目标是利用Android移动端平台的便捷性和日益强大的计算能力,实现服务于日常生活的OCR应用。基于Android平台的OCR软件解决了PC端字符识别的弱便捷性缺点,解决了以前手动录入文本信息的不便捷性,录入字符信息更方便了。通过系统测试,本OCR软件各项功能正常运行,对文本图像的识别准确率和图像处理性能基本上能达到主流OCR应用需求,能够高效处理文本图像识别,系统的UI界面体验效果也较好。论文主要完成了以下工作:(1)结合OCR应用实际情况对基于Android平台的OCR软件进行详细的需求分析。通过对OCR应用软件的需求以及目前市场上移动端字符识别软件进行调研,确定了系统需要解决的实际问题,设计了系统的体系架构和功能模块。(2)设计并实现了基于Android平台的字符识别算法。考虑到Android移动端计算资源有限,需要最优化利用计算资源的特点,设计并实现了适合移动端的图像预处理较优算法;同时研究Tesseract字符识别原理,本文最终基于Tesseract完成了Android平台的字符识别算法实现。(3)实现基于Android平台的OCR功能。系统基于Material Design的设计风格设计了一套视觉效果良好的UI界面,在Android,OpenCV,Tesseract技术架构的基础上采用了Android编程技术、图像预处理技术、字符识别技术,实现了包括源文本图像获取、文本图像ROI裁剪、图像预处理、识别历史显示和文本后处理等功能模块的基于安卓平台的OCR应用。(4)搭建测试环境,对基于Android平台的光学字符识别系统进行测试。通过测试字符识别准确率,字符识别速度,软件UI的便捷操作等指标对软件系统进行综合评价。