基于深度神经网络的自然场景文本检测研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:bbq2004_83
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景下的文本检测是计算机视觉的重要组成部分,也给我们带来了方便,像对证件照的识别、无人驾驶技术、智能机器人技术等等。作为计算机视觉中的重要组成部分,现在的印刷体文字检测识别技术已经相当的成熟,并且广泛的应在在我们的生活中。然而随着现在对手机、计算机的普及,对多媒体技术应用更加的广泛,图像的背景也更加的复杂。所以在自然场景的复杂性和文字本身的特点下,使用深度学习可以更加精确,快速的检测出图像中的文本行,从而达到文本检测的目的。如何设计一个算法,在对文本检测的时候,可以应对各种环境的挑战,是本文要解决的问题。本文主要基于深度学习网络框架,旨在设计出一个高效、快速的文本检测算法。本文主要研究内容如下:1.在EAST的改进过程中,本文基于空洞卷积算法,将ASPP结构加入EAST网络中,提升检测视野,来实现对长文本,多角度的文本检测,提高检测效果。考虑到上下文信息对特征融合有着较大的影响,在特征融合层后,使用BLSTM算法,将序列特征输出其中,利用上下文信息之间的关联性去估计文本区域,提高文本检测效果。然后对于EAST样本正负权重不合理的问题,将平衡交叉熵损失函数换成Dice Loss与Focal Loss两个函数相加。通过在ICDAR2015数据集上实验,结果表明:该改进策略在准确度上比标准的EAST高6个百分点,召回率上高5.2个百分点,F值高5.7个百分点。和其他的实验算法相比,整体性能都有所提高。2.本文采用轻量型神经网络Mobile Net V2为主干网络。大型网络进行特征提取可以得到丰富的特征,但是,由于在提取过程中可能会导致模型过大,所以本文利用轻型网络替换大型网络,解决参数过大的问题,还能够降低应用时延。3.直接将EAST网络特征提取层中的大型网络替换成轻量型网络,其检测的效果会大大折扣,因此本文在特征融合层,增加空洞卷积模块,通过将两个部分的特征进行融合,利用通道注意力机制对特征进行融合筛选,提高网络中特征的使用效率。最后采用公开的ICDAR2015数据集进行实验对比,验证了本章改进策略的有效性。最后进行了与EAST模型整体性能对比,进一步验证了本文改进网络的合理性与有效性。
其他文献
2021年,面对复杂多变的国内外形势和各种风险挑战,我国印染企业积极调整发展战略,印染布产量保持了良好增长态势,主要产品出口规模较疫情前进一步扩大,主要经济指标持续修复,企业盈利水平明显改善,行业表现出强大的发展韧性,实现了"十四五"良好开局。但也要看到,当前全球疫情仍未得到有效控制,大宗商品价格虽有回落但仍处于高位,纺织产业链供应链衔接仍不够顺畅,行业实现全面复苏的基础仍需进一步巩固。
期刊
由于蛋白质结构与功能、进化研究的密切关系,蛋白质结构比对成为生物信息学领域一个基本而重要的问题。蛋白质结构比对方法的研究对丰富和发展蛋白质结构分析的理论基础,解释蛋白质结构与其功能、进化的内在蕴含,促进蛋白质结构预测、药物分子设计等有着重要的科学和现实意义。本文围绕蛋白质结构比对问题进行了研究,主要内容如下:(1)在广泛阅读国内外有关蛋白质结构比对文献基础之上,对已有结构比对方法进行总结。依据蛋白
更快、更好的卷积神经网络(Convolutional Neural Networks,CNNs)架构一直是研究的热点。不管CNNs架构如何变化,激活函数都是必不可少的。修正线性单元(Rectified Linear Unit,Re LU)被广泛应用在绝大多数CNNs中。过去这些年,许多单调激活函数被提出,尝试取代Re LU。然而,这些单调激活函数在不同数据集和CNNs上表现得不稳定。Softmax
目标跟踪作为计算机视觉领域热门的研究方向在日常的工作和生活场景中有广泛的应用,而车辆跟踪是目标跟踪具体化的应用场景之一。车辆运动场景复杂多变,车身形变模糊、道路光照发生变化等情况会给车辆跟踪带来一定的技术难点。随着深度学习技术的快速发展,将深度特征结合相关滤波方法进行目标跟踪已经成为重要的研究方向之一。本文针对车辆跟踪的技术难点,提出应用多层深度特征构建相关滤波器并联合二元SVM分类器进行车辆长时
手机3D玻璃盖板作为手机屏幕最外层的玻璃,它有着硬度强、透光性好的特点。然后,手机3D玻璃盖板在生产过程中,很容易造成一些缺陷,比如划伤、凹凸点、异色、白边等等。任何一种缺陷,都会对屏幕的显示造成一定的影响。故手机3D玻璃盖板的缺陷检测,是生产过程中必不可少的一环。由于手机3D玻璃盖板的生产量大,普通的人工检测不管是在检测效率上还是检测精度上都已经无法满足生产的需求。而机器视觉技术,它不仅可以做到
在以往的几年里,随着移动互联网的普及,由成本较低、目标明确等特点,使的DDoS攻击变得越来越普遍。对于DDoS攻击,通常大部分企业会使用增加企业带宽、CDN、增加服务器数量等手段去稀释攻击流量,通过硬抗的办法来应对攻击。这种方法对于小流量的攻击确实有一定的效果,但是却浪费了大量的资源和金钱,而且对于大流量的DDoS攻击,这种方法收效甚微。根据绿盟科技的数据显示,目前许多传统的安全设备在设计时并没有
人脸检测技术因其应用领域广泛,具有较高的使用价值,因此作为计算机视觉研究领域中的热点一直备受关注。然而在实际复杂场景的使用中,人脸检测容易受到与成像设备距离远近、成像角度、外部环境光线明暗变化以及不同程度遮挡等因素的影响,造成检测精度无法达到标准。同时,人脸检测应用还需具备较快的检测速度才能满足实际应用需求。YOLOv4网络检测方法兼具较好的检测精度和较快的检测速度,是目前公认的通用目标检测算法之
随着互联网的急速发展,IT行业日新月异,系统架构的发展也在与时俱进,当用户量以几何指数飞速增长,曾经流行很久的单体架构已经很难应对和处理日益增长的软件复杂性。传统的单体架构也很难支撑如今庞大的数据量,当同时访问人数达到一定数额,服务器就会出现响应缓慢,交互失败等问题,甚至可能会出现服务器宕机等情况。基于这种现状,微服务架构风格应运而生,微服务架构核心是面向服务,重点是模块划分,服务之间正确高效调用