论文部分内容阅读
近年来,随着各种信息技术的快速发展,通过手机或电脑等设备获取信息逐渐成为各行各业的主流趋势,在这种趋势带动下,教育行业中的教育科技化使得信息技术被广泛运用。目前,教育信息的基本形式主要是文本,纸质形式是文本保留的传统方式。这种传统方式在存储、查找、整理上都存在一定的困难。而信息技术的融合让传统文本逐渐数字化,电脑和手持终端等设备在教育行业中的地位逐渐上升。教育信息的基本形式让文本信息在背景下不断的输出和输入,产生的信息数量庞大,而当前的教育教学还是依靠手写和键盘输入为主要方式,该方式一定程度限制了教育信息的流动速度。而随着计算机应用技术的不断发展,光学字符识别技术逐渐成熟,通过光学字符识别技术可将印刷文字和手写文字转化为可处理的文本,极大的提高文本录入的速度,减轻教育中的工作强度和学习负担,从而提高教学效率。然而,目前对光学字符识别技在教育场景中的应用研究有限,特别是对教育场景中数量庞大的文字识别算法不太成熟,需要进一步的补充和探索。本文基于深度学习的方法对教育场景文字识别算法进行研究,在深度分析这部分研究现状的基础上,运用光学字符深度学习算法,以教育场景为背景设计光学文字识别系统。利用云服务器,搭建高速并发并行平台,基本满足了使用者对文本的识别、录入和编辑的需求。本文在研究过程中,首先基于YOLOv3目标检测算法对文本框进行识别。YOLOv3算法采用卷积神经网络框架,以行为单位对文本文字进行精准检测和提取。该算法速度快并且识别准确率高,在实际应用中,可以达到无损检测的水平,这就保证在教育场景中文组的检测和提取处于高效高速的状态,是教育场景文字识别算法构建的基本保证。其次,基于卷积循环神经网络对提取的文本框中的文字进行识别。循环神经网络考虑到了文本的上下文,与卷积神经网络结合,可以处理不定长度的文本输入。该算法可以灵活的识别文字序列,并且具有高准确率,对于无严重噪声的图片,可达到完全正确的水平。最后,基于CPU和GPU云服务器搭建识别系统,采用多GPU分布式框架,独立CPU管理和分配部署,已经达到了高并发实时响应的效果。该系统可以投入到真实教学场景中使用,实现随时随地文本获取和编辑,达到推动教育信息化的目的。