基于深度学习的自然场景文本检测识别

来源 :青岛大学 | 被引量 : 0次 | 上传用户:xincqu923
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景下的文本检测识别技术,在无人驾驶、智慧交通等领域有广泛应用,相较传统文档识别,自然场景下的文本背景复杂、分布散乱,检测难度更高。为进一步提高检测识别的精确性和速度,本文提出了一种基于深度学习算法的端到端的文本检测识别方法,采用卷积神经网络和双向循环神经网络的组合结构作为特征提取网络,充分提取文本序列特征。通过共享特征提取网络及联合训练损失函数,将检测与识别模块紧密结合,进而在输出端直接获取文本的定位与类别信息。本文的研究内容分为文本检测和文本识别两部分:(1)文本检测采用基于候选框思想的方法,结合文本的分布特征,对比分析几种常规目标检测算法的性能,最终选择在YOLOv3的基础上进行改进。对网络结构进行改进,并调整损失函数,在训练过程中添加文本框的角度信息,实现了对任意角度文本的检测。候选框的筛选采用面积交并比和重合度的组合判断方法,进一步提高文本区域边界框回归的精确度。(2)文本识别采用基于序列的方法,网络采用融合注意力机制的编-解码结构,弥补编-解码结构对于长文本序列识别效果较差的缺陷,从而能够更好地利用文本序列的上下文信息。编码网络共享检测部分的特征提取网络,解码网络采用常规的LSTM网络结构。在多个标准数据集进行训练,调整网络参数,最终实验结果表明本文改进的算法网络在多个评价标准上性能优秀。检测速度可达16帧每秒,最高识别准确率为86.47%。与相关经典方法的结果数据对比,进一步说明本文改进的算法网络更具合理性和有效性。
其他文献
在过去的二十年里,传统的硅太阳能电池一直是光伏市场的主流产品。随着科技的发展,具有成本低、材料来源广泛、制备工艺简单灵活等优点的有机太阳能电池得到了业界广泛的关注
中国乒乓球队的长盛不衰是乒乓球作为我国国球传承至今的重要因素。为保持中国乒乓球队的高竞技水平,根据比赛视频以及训练视频进行复盘分析是技战术分析的重要手段。随着计
基于电压源型换流器的高压直流输电(Voltage Source Converter based High Voltage Direct Current Transmission,VSC-HVDC)技术是一种新型的直流输电技术,该技术具有可向无
随着区域空间整合趋势的加快,依据国家、陕西省及渭南市新型城镇化战略对城镇发展的新要求,以及潼关县城镇快速发展的迫切需要,研究新时代背景下潼关县城镇体系布局是未来潼
随着道路交通量的日益增多,传统的半刚性基层道路结构的使用寿命已明显不能适应重载交通的需求,会不可避免的产生路面裂缝等病害。近些年,人们发现级配碎石材料具有非线性的
近年来,自锚式悬索桥的结构类型在城市桥梁工程中被广泛选用。现代的悬索桥是从索桥演变而来,并且凭借着大跨度、抗震性能好、外形美观等诸多优势受到了许多桥梁工程师的青睐
《逃离》是当代短篇小说大师、诺贝尔文学奖得主爱丽斯·门罗的第十一部短篇小说集,荣获加拿大吉勒文学奖及布克国际奖,并入选《纽约时报》的年度最佳图书。《逃离》由八个故事构成,讲述六个女性的日常生活。自2004年出版以来,受到国内外作家和评论家的关注。国内外学者对《逃离》的研究多聚焦于主题探讨、叙事策略、女性主义、文学伦理批评等方面。到目前为止,有关《逃离》异化的研究甚少,国内仅有1篇论文涉猎,缺乏全面
钢管结构由于其出色的力学性能以及简洁美观的造型被广泛应用于海洋工程、建筑工程等诸多领域当中。钢管结构所经常采用的连接形式之一是相贯节点的形式,其中各个钢管构件之
永磁同步电机(Permanent magnet synchronous motor,PMSM)具有效率高、调速范围广以及结构简单等优点,是高效、高精度运动控制系统的理想驱动电机。高性能PMSM控制系统的设计
波浪滑翔机是一种用于海洋环境观测的无人自主航行器,其独特的双体机构可以将波浪起伏转化为航行动力,具有超长续航、自主导航定位、人工智能识别等特点。波浪滑翔机可以根据