自然场景下的文本检测与识别方法研究

来源 :东北电力大学 | 被引量 : 3次 | 上传用户:hayyangxiong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为计算机视觉应用的重要分支,自然场景中的文本阅读一直以来都是基于深度学习的计算机视觉领域内最受欢迎的热门研究领域之一,在最近十年被广泛的进行了研究。由许多现实世界的应用所驱动,对于助盲系统、智慧交通系统、无人驾驶导航系统等方向均具有实际应用的现实意义由于场景文本的多样性及背景的复杂性,场景文本检测识别目前面临着很多挑战。在自然场景中阅读文本分为文本检测和文本识别两个过程。其与光学字符识别(OCR)并不完全相似,在检测难度、识别精度需求上还存在很大的差别。尤其是在无人驾驶导航的路标信息提取中,对识别精准度要求极高,OCR技术难以实现高准度识别。目前的场景文本检测及识别方法多为基于深度学习的方法,在面对复杂场景时深度学习具有传统方法不可比拟的泛化能力。本文对自然场景的文本检测与识别进行了深入研究,提出了基于YOLOv3的多向文本检测算法,以及基于CRNN的不定长字符识别方法。本文具体研究内容如下:(1)本文提出了一种场景文本图像预处理方法,同时提出了一个长文本子数据集用于长文本检测,以及一个大规模合成中文字符数据集用于中文字符识别。本文使用了 PCA对图片进行了降维,并提出了改进的中值滤波去噪方法。基于RCTW-17数据集提出了一个长文本子数据集,同时模仿自然场景的背景提出了一个合成的中文字符数据集用于文本识别训练。(2)针对场景文本的多方向性,本文基于YOLOv3目标检测算法提出了一种改进的场景文本检测算法。本文根据YOLOv3重新设计了网络结构,增加了长卷积核卷积后的特征融合,以适应文本区域的形状特点进行特征提取。然后引入旋转滤波器替代普通滤波器,提取特征图的旋转信息。同时重新设计了先验框尺寸适应长文本检测。最后并通过坐标补偿进行文本框回归,实现了多向文本检测。(3)本文提出了一种基于卷积递归神经网络的中英文不定长字符识别方法。本文在CRNN的基础上对中文字符特点进行了特征提取网络的改进,通过将池化层替换为步长为2的卷积层实现下采样。并采用双层LSTM模型对文本序列进行预测,提取更为细致的中文字符特征图,同时引入注意力机制实现了局部特征到全局特征的提取。最后引入CTC方法对预测的字符进行转录,实现中英文字符的混合预测。算法分别在公开数据集及本文提出的合成数据集上进行了实验,并对实验的结果及算法的优缺点进行了分析。
其他文献
目的建立直接多肽结合试验改良法,用于检测复杂体系的皮肤致敏性,并对80种植物提取物进行皮肤致敏性检测。方法将已知致敏性的20种化合物配制成10 mg·mL-1,50 mg·mL-1和100
摘 要:当前,我国学界和司法实践界对传播传染病侵权责任的界定和认识尚不完善。传播传染病侵权责任本质上是一种过失侵权,产生于对注意义务的违反。在归责原则上,应结合其特殊性采用过错推定原则;在举证过程中,受害者应充分利用现代技术手段确定感染者和搜集证据。同时,也要进一步加强对受害者的救济。  关键词:公共卫生;传播传染病侵权责任;归责原则;传染病防控  中图分类号:D922.16 文献识别码:A
航空发动机的温度场反映了发动机的工作状态,也可用于发动机红外辐射特性的研究,具有非常重要的意义。通过某型发动机台架红外辐射特性测试试验,获取了发动机典型状态下的不
随着基础教育新课程的不断改革,对于教师的综合素质要求也逐渐提高,教师专业化发展更是强调教师应当在本专业上不断提升自我。在我国,面向基础教育阶段所进行的职前教师教育主要代指系统的师范生教育,职前教师教育课程则直接影响到师范生的培养质量。近年来,随着国家政策相关文件的出台,“实践取向”的教师教育逐渐成为职前教师教育课程改革的必然和合理价值导向。因此深入了解师范院校职前教师培养现状,基于实践取向视域下对
随着海涂围垦在沿海地区的广泛开展,大量的新近吹填淤泥需要真空预压处理后才能被开发利用。由于新近吹填淤泥土颗粒极细,传统真空预压法在处理吹填淤泥时会导致排水板淤堵,
近几年来,传统死记硬背式的应试教育思维对学生而言,比较难适应。笔者根据一些教育工作实践以及所观所感发现,偏远地区的学校实行小组合作学习,但其成效不理想。因此,本研究
陕西彬长矿区是我国典型的冲击矿压易发矿区,其冲击矿压灾害发生普遍具有出现时间晚、爆发时间短、灾害严重、灾害矿井集中等主要特点。雅店煤矿位于彬长矿区,其ZF1417工作面为厚煤层综放工作面,煤层采出厚度8m,且4煤层上方85.7m处存在一层387m厚的中粒砂岩,采动覆岩运动相对剧烈,易引起工作面强矿压显现。考虑到煤层及顶板具有弱冲击倾向性,有必要对ZF1417综放开采的冲击矿压危险性开展研究。为此,
课题组前期的试验研究和有限元模拟分析已证实节点域箱形加强式工字形柱弱轴连接是一种延性好、承载力高的连接形式。为进一步拓展该连接的应用,本文对箱形节点域工字形柱双
随着人们对化合物结构研究的不断深入,对化合物应用的不断探索,形成了规模巨大的化合物的数据库,而大量的化合物也可能具有类似的应用特性。以药物应用为例,我们已知某类药物
使用有限元软件SAP2000,建立钢框架结构、钢框架-RC剪力墙结构、钢框架-RC核心筒结构模型,对结构进行模态分析,反应谱分析和时程分析,结果表明:(1)加入剪力墙和核心筒构件后