基于深度学习的教育场景文字识别算法研究

来源 :沈阳师范大学 | 被引量 : 0次 | 上传用户:pathos_boy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着各种信息技术的快速发展,通过手机或电脑等设备获取信息逐渐成为各行各业的主流趋势,在这种趋势带动下,教育行业中的教育科技化使得信息技术被广泛运用。目前,教育信息的基本形式主要是文本,纸质形式是文本保留的传统方式。这种传统方式在存储、查找、整理上都存在一定的困难。而信息技术的融合让传统文本逐渐数字化,电脑和手持终端等设备在教育行业中的地位逐渐上升。教育信息的基本形式让文本信息在背景下不断的输出和输入,产生的信息数量庞大,而当前的教育教学还是依靠手写和键盘输入为主要方式,该方式一定程度限制了教育信息的流动速度。而随着计算机应用技术的不断发展,光学字符识别技术逐渐成熟,通过光学字符识别技术可将印刷文字和手写文字转化为可处理的文本,极大的提高文本录入的速度,减轻教育中的工作强度和学习负担,从而提高教学效率。然而,目前对光学字符识别技在教育场景中的应用研究有限,特别是对教育场景中数量庞大的文字识别算法不太成熟,需要进一步的补充和探索。本文基于深度学习的方法对教育场景文字识别算法进行研究,在深度分析这部分研究现状的基础上,运用光学字符深度学习算法,以教育场景为背景设计光学文字识别系统。利用云服务器,搭建高速并发并行平台,基本满足了使用者对文本的识别、录入和编辑的需求。本文在研究过程中,首先基于YOLOv3目标检测算法对文本框进行识别。YOLOv3算法采用卷积神经网络框架,以行为单位对文本文字进行精准检测和提取。该算法速度快并且识别准确率高,在实际应用中,可以达到无损检测的水平,这就保证在教育场景中文组的检测和提取处于高效高速的状态,是教育场景文字识别算法构建的基本保证。其次,基于卷积循环神经网络对提取的文本框中的文字进行识别。循环神经网络考虑到了文本的上下文,与卷积神经网络结合,可以处理不定长度的文本输入。该算法可以灵活的识别文字序列,并且具有高准确率,对于无严重噪声的图片,可达到完全正确的水平。最后,基于CPU和GPU云服务器搭建识别系统,采用多GPU分布式框架,独立CPU管理和分配部署,已经达到了高并发实时响应的效果。该系统可以投入到真实教学场景中使用,实现随时随地文本获取和编辑,达到推动教育信息化的目的。
其他文献
我国上市公司的融资方式主要分为股权融资和债权融资两大类,定向增发从属于股权融资方式,并且是目前最为常用的一种。通过定向增发募集的资金体量巨大,同时定向增发也是在公司金融领域内非常热点的研究课题。本文梳理了诸多关于定向增发的研究文献之后,发现上市公司的定向增发普遍存在着向大股东输送利益的问题,利益输送的形式可以是高定增折价率,也可以是增发后立即进行现金红利发放等形式。其中高定增折价率是非常重要的一种
2012年5月15日,2012涂料工业——荣格技术创新奖颁奖典礼在上海举行,包括梅特勒一托利多、巴斯夫、拜耳材料、纽碧莱、默克化工、空气化工、阿克苏诺贝尔等公司的近两百余位获
伴随着全球经济一体化的快速发展和科学技术水平的进一步提高,以人才资源为重要载体的知识经济时代已经到来。人才资源中,最重要的部分就是专业技术人才队伍,其规模大小、素质高低对于一个国家或地区的经济发展水平和社会进步速度来说,有着至关重要的作用。培养建设一支优秀的专业技术人才队伍对于加快科学技术水平的进步、自主创新能力的提升、经济发展方式的转型、产业结构的升级,有着十分重要的意义。本文以L市专业技术人才
通过对脑血管意外的康复护理实践,总结制定合适的康复护理程序,用于指导护理实践,检查评定康复护理的效果,总结经验,并使康复护理与功能锻炼有机结合起来,无并发症发生,总有