【摘 要】
:
自然场景图像中的文本包含非常丰富的高级语义信息,对于场景的理解有着至关重要的作用。由于自然场景极具多样性,场景文本的检测与识别充满挑战,尽管在深度学习的推动下,其性能较传统方法已经有了显著的提升,但仍存在许多亟待解决的问题,是计算机视觉领域的一个热点问题。本文主要包含以下四个工作:(1)本文将文本检测视为一项密集回归任务,结合非局部神经网络嵌入了全局信息来扩大感受野,使其能够更好地应用于多方向文本
论文部分内容阅读
自然场景图像中的文本包含非常丰富的高级语义信息,对于场景的理解有着至关重要的作用。由于自然场景极具多样性,场景文本的检测与识别充满挑战,尽管在深度学习的推动下,其性能较传统方法已经有了显著的提升,但仍存在许多亟待解决的问题,是计算机视觉领域的一个热点问题。本文主要包含以下四个工作:(1)本文将文本检测视为一项密集回归任务,结合非局部神经网络嵌入了全局信息来扩大感受野,使其能够更好地应用于多方向文本中,并在多方向文本数据集上验证了其有效性。(2)本文从实例分割的角度出发处理文本检测,提出了特征融合文本实例分割网络,该网络可以高效且精准地检测出图像中任意形状的文本,同时本文针对文本的特性,改进了非极大值抑制后处理方法,使其更适用于文本,在多方向文本以及曲线文本数据集上均取得了优越的性能。(3)本文在当前主流的文本识别算法框架上进行改进,提出了结合注意力机制的深度监督文本识别算法,在推理阶段基本不引入参数量及计算量的情况下,在训练阶段为其添加了深度监督模块,使得模型能够学得更好的特征表示,同时进一步结合了注意力机制,自适应地抑制冗余杂乱信息、关注重要的文字区域,在多个文本识别数据集上验证了该方法的有效性。(4)本文提出了一种可以端到端识别自然场景中任意形状文本的网络,将检测与识别整合在了同一个网络中,使得两项任务可以共享部分参数,降低了模型整体的参数量和计算量,同时二者可以受益于彼此的监督信号,使模型更加鲁棒,在水平文本和曲线文本上进行了实验验证,结果符合预期。
其他文献
《一到冬天就下雪》这个故事讲述的是一个住在天上的白巫婆想要变出花园,她做了三千年的实验这个梦想都没实现。见不到阳光也没有空气流通,没有温暖没有爱,只有无限的期待和各种激进的实验,这样当然不能开出美丽的花。作者传达的是“无心插柳柳成荫”,“柳暗花明又一村”。执着的人是可爱的,但有时候退一步海阔天空,放下紧张和焦虑,敞开自己就能迎接更多的可能性。
随着“互联网+教育”的教育新环境逐渐形成,针对成人高校的办学模式与成人学生的学习特点,结合混合式教学模式的开展需求,从技术实现和经济效益等方面考虑,设计实现一个面向成人高校、符合成人教育规律、能够有效结合现有实际情况的自适应学习系统是具有一定价值与现实意义的。本文论述了面向我国直辖市独立设置的成人高校学历教育自适应学习系统的建设研究过程。通过对主要的适应性学习技术及主流的自适应系统进行对比研究,确
基于30个省份2009—2018年的面板数据,利用空间计量经济模型实证考察了不同类型绿色技术创新对CO2排放的空间异质性影响效应。实证研究结果表明:我国区域CO2排放存在显著的正向空间溢出效应;发明型绿色技术创新和改进型绿色技术创新对CO2排放均存在显著的抑制作用,前者比后者对本地区CO2的抑制作用小于对其他地区的抑制作用;不同类型的绿色技术创新对CO2排放的影响效应存在明显的区域差异特征,其中发
区块链作为一个去中心化的分布式账本,具有天然的信息公示和监管的作用。投票作为其处理不同意见的一个有效工具,需要具有其公开性、公平性、安全性和有效性。由于区块链的不可更改性和透明性,将区块链作为其公开平台作用于投票系统上能够有效的减少投票过程中的舞弊操作,保证其公开性和公平性,有效满足加强我国的民主化建设需求。安全的投票系统还需保证其选票的隐私性和匿名性,这与区块链自身的公开透明性相矛盾。如何在确保
“一带一路”倡议是我国为加强国际间合作,促进各国可持续发展,携手共建人类命运共同体而提出的,得到了国际社会的广泛认可并取得重大成果。本文在现有研究文献基础上,采用文献计量统计和归纳总结分析方法,系统梳理“一带一路”倡议对沿线国家、沿线省份的影响及空间效应的研究现状。研究发现:国内外学者更倾向于研究“一带一路”倡议对沿线国家的影响,研究主题聚焦经济贸易、金融发展和基础设施建设等领域,大部分学者认为“
近年来,随着网络加密技术的普及,越来越多的网站和应用使用该技术保护通信过程中的个人隐私。然而,使用网络加密技术的恶意攻击事件也在逐年增长,依赖于数据包内容的传统检测方法如今已经无法有效应对隐藏在加密流量中的恶意软件攻击,因此给基于流量的恶意软件检测方法带来了严峻的考验。据研究统计,目前超过60%的网络流量是通过TLS/SSL加密的,其中由恶意软件产生的流量占10%以上。而在网络加密协议中使用频率最
比特币是一种去中心化的虚拟加密数字货币,其安全性与匿名性是比特币崛起的一个重要原因。混币协议是为了解决比特币的伪匿名性问题所提出的,旨在隐藏交易输入与输出地址之间关系的一种隐私保护手段。然而,现今的混币协议主要存在两大问题。第一,混币协议仅关注对地址信息的混淆,对于交易金额没有相应的保护手段;第二,中心化混币协议大都基于对第三方的完全信任,其所有交易信息对第三方完全暴露,存在安全隐患。本文基于这两
某市地铁18号线是快速轨道交通,设计时速是140km/h。本设计结合该工程的地质资料与线路资料,进行相应的盾构隧道结构设计。首先,通过对相关采用盾构法施工的工程类比分析,进行隧道的初步设计,确定围岩类型、拟定了盾构管片的尺寸大小,然后按照该线隧道线路的上覆土层厚度和地下水位的不同,选取了3个不同的具有代表性的横断面进行分析,其中包括这些过程:荷载计算、内力的计算、进行管片配筋设计、管片的抗震验算。
近年来,基于人体生物特征的用户身份识别和认证受到越来越多的关注。除了人脸、指纹和虹膜外,嘴唇同样是一项具有高鉴别力的生物特征。相比于其他生物特征,嘴唇特征包含静态和动态两个方面。研究表明,嘴唇序列的静态和动态特征包含大量与用户身份相关的信息,可作为一种新型的生物特征识别用户的身份,而如何从嘴唇序列中提取出最具有鉴别力的子片段仍是一个难点。同时,由于嘴唇特征的大量应用场景是在自然环境下,这种复杂场景
为了解决准确检测纤维成分含量难度大,以及现有纺织产品纤维成分含量定性与定量分析标准中对不同织物结构、花型颜色的纺织产品的取样方法缺少具体规定的问题,根据多年从事纺织产品分析的经验和相关标准要求,归纳总结了不同织物结构、花型、颜色的纺织产品以及袜子等特殊产品中纤维成分含量的定性与定量分析取样方法。