基于深度学习的曲面文本识别算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:zhiyuanxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,场景文本检测与识别逐渐成为计算机视觉领域的研究热点,广泛应用于智能交通、无人驾驶、机器人导航和工业自动化等领域。众多学者不断提升场景文本识别模型的性能,但仍存在自然条件干扰、背景复杂以及文本的表现形式多样等难点。曲面文本作为场景文本的一种,其空间特殊性给检测与识别带来了挑战。本文针对当前曲面文本检测与识别算法存在的不足进行分析,主要的研究工作如下:1.考虑到现有基于对抗学习的弱监督曲面文本(Text Mask Network,TMN)检测算法在光照不均匀场景下存在漏检率、误检率较高的问题,引入视觉显著性检测图正则化(Graph Regularized,GR)模型,提出一种基于GR和TMN的曲面文本检测算法。将GR模型得到的显著图与TMN检测算法得到的文本候选区域进行特征融合,利用两者关注重点目标不同的特性,使融合的候选区域包含更全面的文本信息,提高算法的检测准确率。同时,为了进一步滤除特征融合后的文本候选区域中的背景部分,使用卷积神经网络(Convolutional Neural Network,CNN)进行特征过滤分类,得到最终的文本区域。实验结果表明,改进后的TMN算法在不损失较大检测速度的情况下,降低了文本的漏检率和误检率,在提升检测精度的基础上克服了光照不均匀对文本检测的影响。2.当前基于柱面-平面投影(Cylinder-Plane Projection,CPP)变换的识别算法CPP-CRNN在识别缺乏全局信息的低质量图像时,容易出现漏识别、误识别的情况。本文在基于注意力机制的编解码框架中引入全局与局部语义信息的思想,语义模块预测的全局语义信息初始化解码器,同时使用卷积滤波器提取局部语义信息引导解码器输出预测结果。Fast Text模型生成的词嵌入向量,作为卷积滤波器的输入提取局部语义信息,并监督全局语义信息的生成。实验结果表明,优化后的算法在识别速率相近的情况下,提升了文本识别的准确率,取得了较好的识别效果。
其他文献
面部表情是人类最重要的非语言情感表达方式,人脸表情识别一直是研究的热点。目前人脸表情识别的研究已经取得了很大突破,但距离真实环境下实时、准确的检测识别还存在一定差距。目前研究重点从实验室环境下受控人脸表情转移到真实环境下非受控人脸表情。非受控人脸表情具有光照不统一、头部姿态多样化、局部遮挡以及个性化差异的问题,造成卷积神经网络难以提取具备表情鉴别力的深度特征。本文以提高卷积神经网络的表情特征学习能
学位
自由空间光通信(Free Space Optics Communication,FSOC)系统是地面与卫星通信的一种可行的解决方案。然而,其以大气作为传输介质的特性使得光信号必然会受到湍流效应的影响,产生不同程度的波前畸变,导致通信性能下降。无波前传感自适应光学(Wavefront Sensor-less Adaptive Optics,WFS-less AO)技术是一种能实时探测并补偿光束波前畸
学位
<正>由麻省理工学院(MIT)的研究小组开发的E-Te CS(电子纺织品合体套件)是一款通过在衣服内编织传感器来测量诸如温度,呼吸和心率等生命体征的衬衫。该原型机实现了30个温度传感器和加速度计。使用功能强大的材料,例如压缩衬衫(在身体上施加轻微压力的运动衬衫),以便在锻炼过程中穿着。从外面看不到传感器,它的编织方式很自然,与普通衬衫没有区别。可以在安装了传感器的情况下对其进行清洗,也可以卸下传感
期刊
<正> 沙蜥属Phrynocephalus是Kaup于1825年建立的新属,属模为Phrynocephalusguttatus(Gmelin)本属系鬣蜥科AGAMIDAE中的古北界类群,也是蜥蜴目较为原始的类型。关于沙蜥的研究,Boulenger(1885),Bedriaga(1907-1909),Nikolskii(1915)等曾有过比较详细的叙述,特别是Bedriaga在《普热瓦尔斯基中亚旅行
期刊
用自然语言进行对话是人与人交流的基本方式之一。由于计算机成为一种强大的工具,与人类有着密切的联系,人们希望使用自然语言下达命令,与计算机进行简单、直接的对话。对话系统近年来取得了很大进展,能够与人类进行连贯且有吸引力的对话,但当前对话模式仍处于被动回应的初级阶段,如何满足智能人机对话系统的需求,建立一个具有主动回复能力的对话系统依旧是一个巨大的挑战。为使对话系统具备主动对话的能力,该文分别从主动对
学位
未来智慧城市中,同时体现车主间社交关系和车辆拓扑结构的车载社交网络(Vehicular Social Network,VSN)能够为智能网联汽车提供多样的个性化数据服务。然而,车载社交网络数据共享过程中存在着交易不可信、隐私泄露等安全问题,安全的网络架构亟待提出。同时,针对车辆的高速移动性和数据转发的自私性,社交车辆的分簇算法和激励机制设计成为了当前值得研究的问题。本文的主要工作如下:第一,针对车
学位
<正>加拿大魁北克市拉瓦尔大学研究人员设计了一种新的智能T恤,可以监测穿着者的呼吸,这项研究将可能在医疗和运动等方面有广泛的用途。该研究成果2021年12月28日发表在《IEEE传感器杂志》上。研究团队设计的智能衬衫涉及一个嵌入布中的、薄的螺旋状天线网络,
期刊
随着各种无线网络技术的发展,出现了多种不同制式的无线网络,各种无线网络在信号覆盖范围、业务的支持性等方面存在较大差异,这些网络长期共存逐渐形成了异构无线网络。与此同时,随着移动用户终端数量的剧增,用户终端密集区域内同时发起垂直切换请求的几率大大增加,即群组切换现象越来越普遍。因此,如何将处于异构无线网络环境中的群组用户合理地分配至多个网络进行切换,是目前异构无线网络的研究热点。本文所研究的群组切换
学位
随着新兴业务的不断增长,业务需求的种类趋向多样化,单芯光纤弹性光网络已经不能满足人们对流量的需求,而多芯光纤由于其突出的扩容能力被广泛研究和使用。使用多芯光纤的空分复用弹性光网络虽然能够为业务提供充足的带宽,但也会引入新的问题。首先,在弹性光网络中,业务的传输需要满足三个频谱约束条件,由于这些约束,网络中的频谱资源不能被有效利用,造成资源的浪费,从而使网络的频谱利用率降低。其次,多芯光纤的各个纤芯
学位
边缘计算和算力网络技术是当前的研究热点,而服务功能链(Service Funtion Chain,SFC)是支持算力网络提供定制化服务的一项关键技术。在算力网络中,服务节点同时具有任务转发和计算功能。边缘计算和网络传输间的协同资源管理是实现SFC并提升网络性能的关键之一。因此,本文针对SFC的任务处理和资源分配问题展开研究,主要工作如下:1.服务节点的网内计算功能会引起SFC各服务阶段的资源需求变
学位