【摘 要】
:
自然场景文本检测是从场景图像中获取文本信息的重要手段,但是仍旧面临背景复杂、文字种类丰富、排列方向多样、文本行组成复杂等因素的严峻挑战。研究检测精度高、通用性强、稳健性好的自然场景文本检测方法是目前计算机视觉领域的热点问题之一。并且,基于深度卷积网络的自然场景文本检测方法逐渐成为主流。因此,从自然场景文本检测技术的研究背景及主要挑战切入,根据骨干网络的不同将现有方法划分为基于VGG网络的文本检测方
【基金项目】
:
国家社科基金冷门绝学研究专项项目(19VJX112)资助; 教育部人文社会科学研究一般项目(21YJAZH075)资助; 辽宁省社会科学规划基金资助项目(L19BYY005)资助; 复旦大学“古文字与中华文明传承发展工程”规划项目(G3020)资助;
论文部分内容阅读
自然场景文本检测是从场景图像中获取文本信息的重要手段,但是仍旧面临背景复杂、文字种类丰富、排列方向多样、文本行组成复杂等因素的严峻挑战。研究检测精度高、通用性强、稳健性好的自然场景文本检测方法是目前计算机视觉领域的热点问题之一。并且,基于深度卷积网络的自然场景文本检测方法逐渐成为主流。因此,从自然场景文本检测技术的研究背景及主要挑战切入,根据骨干网络的不同将现有方法划分为基于VGG网络的文本检测方法、基于残差网络的文本检测方法和基于特征金字塔网络的文本检测方法,重点阐述各类方法的核心思想、技术优势及其不足;然后,总结自然场景文本检测的公共数据集,对代表性方法的检测性能进行客观比较;最后,梳理和总结自然场景文本检测技术的难点并展望其未来发展趋势。
其他文献
<正>当前,肥胖已成为儿童青少年一个主要的健康问题[1]。随着儿童青少年肥胖患病率的增加,儿童青少年代谢综合征(Metabolic syndrome)的患病率也逐渐升高[2-4],儿童青少年代谢综合征会给成年后带来罹患心血管疾病巨大风险[5]。过多摄入游离糖与代谢综合征密切相关[6-7]。游离糖摄入过多会造成高血糖负荷,但产生的饱腹感较低,不能满足食欲,进而导致过度的体重增加、代谢综合征和胰岛素抵
<正>【阅读导航】中国现代文学史上有两篇比较有名的《落花生》。1922年许地山先生在《小说月报》上发表了他的散文名篇《落花生》。13年后,1935年老舍也写了篇《落花生》,载入同年1月2日的《漫画生活》,现收录《老舍文集》十四卷。许地山是老舍最早结识的现代著名作家,同时也是第一个鼓
<正> 本文论述了静态混合器应用于塑料粉料直接挤出成型的可行性,介绍了静态混合器的工作原理、设计要点及使用。利用这种装置,可以提高塑料挤出成型制品的质量。一、前言在塑料挤出成型中,一般仅仅依靠螺杆来塑炼和混合,但在实际的成型加工中,由于各种组分的分散不良或塑化不均,致使物料流动性不一,发生颜色不均或表面光洁度不良等问题。特别是对于异型材的挤出或粉料直接成型,为了提高混炼程度,通常要提高物料温度,致
<正>2010年暑假,带着对优质学校进一步发展定位的困惑,厦门市思明区教育局张越局长带领厦门市思明区教师进修学校及部分区属中小学领导走访了东北师范大学邬志辉教授。交流中,内生型学校特色文化发展的行动研究成为双方对教育的共同期待。于是,邬志辉教授
<正>中蓝晨光化工研究设计院有限公司于2020年夏季发布一款导热系数6.0 W/(m·K)的高导热凝胶GM X-TG-6。它是一款可手动操作、亦可自动化点胶操作的有机硅高导热材料,产品为单组分包装,使用方便,具有挤出速率高、绝缘耐压性好、阻燃性好、超低内应力、及可修复可擦除等优点。
为了实现增强现实头戴显示系统全色显示功能,建立了多层全息平板波导显示系统,并对该系统所采用的衍射原理、光栅常数及对应衍射波长等技术参数进行了研究。首先,根据光栅方程及全反射理论,介绍了全息平板波导入耦合光栅常数与传输光波长之间的限制关系。其次,为了实现光瞳扩展,介绍了转折光栅、出耦合光栅与入耦合光栅之间的限制关系。在此基础上,以550 nm绿光为例仿真设计了单层全息平板波导显示结构。然后,以单层全
由于文本信息比较复杂,字体大小不一,具有的像素信息较少,导致在特征提取阶段得到的特征图表达不充分,文本检测的准确率不高。针对以上问题,提出一种改进的Faster-RCNN文本检测方法。首先构建特征提取模块,用ResNet-101代替传统的VGG16网络提取图像特征;再融合特征金字塔的多尺度文本特征提取网络,在此基础上加入特征金字塔注意力模块;最后输入RPN层进行分类与边框回归。实验结果表明,改进后