【摘 要】
:
图像作为当今重要的载体承载了大量的信息,对其中的文字信息提取能推动对图像的理解。相比特定场景的文字信息提取问题,自然场景下文字定位的难度较大。同时由于文档、报纸和
论文部分内容阅读
图像作为当今重要的载体承载了大量的信息,对其中的文字信息提取能推动对图像的理解。相比特定场景的文字信息提取问题,自然场景下文字定位的难度较大。同时由于文档、报纸和票据存在的折叠卷曲现象,增加了拍摄得到的图像在后期文字检测与识别上的难度。针对这些问题,本文基于深度学习提出了一种扭曲文档图像矫正的模型和一个文本检测与识别模型,具体的工作包含以下内容:1、提出了Stacked-EAST模型用于矫正扭曲的文档图像。该模型针对扭曲文档图像的每个像素预测偏移数据从而矫正图像,并且训练数据可从平展文档图像自行生成,易于理解且适用范围较广;2、提出了一种适用于自然场景下的文字检测与识别模型。在文本检测方面本文将二阶段的目标检测与图像分割思想结合,并针对长文本难以定位的问题进行了改进,提出了最大合并的非极大值抑制算法,提高了票据等文档环境下的文本检测的效果;在文本识别方面,本文结合了领域内广泛使用的CRNN模型对已经检测到的文本区域内的文字进行识别。本文提出的文字检测与识别模型在多个数据集上取得了较为优秀的效果,并取得了天池ICPR MTWI 2018网络图像的端到端文本检测和识别挑战赛的第十名,证明了其有效性。
其他文献
电力线载波通信(Power Line Communication,PLC)是指利用现有的电力线网络作为传输介质进行数据传输的通信技术,电力线是世界范围内覆盖最广的一种通信介质,因此近几十年来研
动物传染病尤其是人畜共患传染病给社会公共安全带来的危害越来越严重,不仅对我国甚至世界的经济和生态造成破坏,而且更重要的是对人类的生存造成巨大的威胁。因此,传染病的
先天性心脏病(CHD)是在胚胎发育期由于心脏及大血管的形成障碍或发育异常引起的,或出生后应自动关闭的通道未能闭合所造成的解剖结构异常。在胚胎发育过程中,左右不对称的建
共享经济快速发展的核心是提倡整合线下的闲散物品、劳动力、教育医疗等资源,使资源供给方与需求方依托第三方平台(共享平台)各自以不同的方式付出和受益,以实现社会资源全民
电子行业是个新产品快速迭代的行业,这决定了创新是该行业中各企业的求生之道。而创新离不开设计,设计离不开“设计文件的管理制度”。SJ/T 207标准(简称“SJ207”)就是我国
随着通信技术的发展,5G时代即将来临。作为5G技术中的关键技术之一,多用户多输入多输出系统(Multiuser Multiple Input Multiple Output,MU-MIMO)在提高系统吞吐量的同时还会
现代信息技术有着快、便捷、突破时空限制,直观动感,易激发兴趣等优势。本文在新型冠状疫情背景下思考如何将"停课不停学"的精神落实,如何利用现代信息技术手段的优势将科学
反射面天线由于波束覆盖范围广、增益高、结构简单等优点常用在卫星通信中。本文主要研究了基于反射面天线的波束赋形,包括反射面天线形面优化和反射面天线馈源阵列优化两种
蛋白质或者多肽在某些条件下可产生淀粉样变性形成纤维,沉积于机体组织,造成器官及其功能损害。蛋白质淀粉样沉积是很多人类疾病的重要特征之一,大约有20多种疾病与相关的蛋
大容量火电机组的协调系统具有强非线性、大延迟等特点,传统控制算法在机组大工况范围内运行时的控制效果不理想,需要以精确表征机组运行动态特性的模型为基础,设计先进的控制器。本文以某超超临界机组协调系统为研究对象,对系统建模以及控制仿真进行了研究,主要的研究成果包括以下几个方面:1.针对传统粒子群优化算法,对惯性权重、学习因子等参数变化策略进行改进,并引入界限划分及粒子变异的思想,提出一种界限划分变异粒