【摘 要】
:
随着智能设备的普及,智能设备拍摄的场景图像中包含的高级语义信息越来越受研究人员的关注。传统的光学字符识别技术往往无法很好地应用于场景图像文本的提取和识别,因为场景
论文部分内容阅读
随着智能设备的普及,智能设备拍摄的场景图像中包含的高级语义信息越来越受研究人员的关注。传统的光学字符识别技术往往无法很好地应用于场景图像文本的提取和识别,因为场景图像具有扫描图像所不具备的特性。造成识别困难的原因一方面是由于场景图像本身背景复杂,且拍摄场景图像时往往条件不可控,使得场景图像存在分辨率低、光照不均、模糊等问题;另一方面,由于场景图像中的字符往往在字体、大小和颜色等方面各有差异。因此,针对场景图像的文本识别问题需要新的解决方法。本文的工作是基于这样的背景开展的。本文主要工作包括:(1)深入研究和分析了当前自然场景文本识别领域的相关技术和现状;(2)基于深度学习中的卷积神经网络,实现了一个端到端的场景文本识别系统——MatE2E系统。该系统利用卷积神经网络学习字符特征,训练了两个分类器,分别用于字符的判定和识别。MatE2E系统的主要模块有两个。第一个主要模块是文本检测模块,该模块利用字符判断分类器和滑动窗口扫描场景图像来检测可能的文本区域,之后根据图像中不同位置的文本置信度过滤非文本区域。第二个主要模块是文本识别模块,该模块结合字符识别分类器和滑动窗口扫描文本区域图像并识别其中的文字,之后利用词典更正文本识别结果;(3)使用ICDAR2011数据集、ICDAR2015数据集和街景数据集验证了系统的准确率。实验结果表明,本文提出的系统具有较好的识别效果。本文在实验数据集上的验证结果表明MatE2E系统在实际应用中具有一定的参考价值。不过,MatE2E系统还有局限性,例如:只能识别英文字母和数字;另外还需在识别速度、倾斜文本检测等方面进行改进等。
其他文献
超声粉体压制技术适合众多种类的粉体材料以及较难加工的高分子材料等,不但制得的压坯密度和均匀度能有效提高,而且压制过程环保、安全。国内外开展了金属粉末、无机物中的陶
目的应用血肌钙蛋白T(cTnT)、类胰岛素生长因子1(IGF-1)、氨末端脑利钠肽前体(NT-proBNP)水平的变化,评价左西孟旦治疗慢性心力衰竭临床疗效及其安全性。方法采用随机、平行
脑氧饱和度监测是目前一种新型无创监测脑氧供需平衡的监测方法。脑氧饱和度的降低与术后神经并发症的发生有关。老年患者由于自身的储备能量下降,脑氧平衡更容易被打破,脑氧
<正>湘西电业局调度班现有人员10人,平均年龄28岁,这是一支年富力强、技术过硬、业务精湛、朝气蓬勃的队伍。在湘西电网调度中心18楼的楼梯间,调度班"创建全国青年文明号"的
<正>2006年,陈名超从华北电力大学电力系统及其自动化专业毕业,11年后的今天,他任职玉林供电局系统运行部运行方式专责,是广西电网公司助理级技术专家、"电力行业技术能手""
文章从经济学的角度对如何增加我国旅游产品国际吸引力进行分析,通过增大国外游客对我国旅游产品的需求和研制出不可替代的旅游产品供给两个角度出发,得出了增强我国旅游产品
自动化的生产环境已经不再是什么新鲜事了。控制系统和信息技术降低了人工参与的需要,这个事实已经存在了几十年。而整合计量设备则是自动化范例中相对较新的概念。通过将质量
公务员聘任制是适应公共管理理论和实践发展提出的新课题。通过对国内外聘任制公务员的实践探索和理论研究现状进行分析发现,聘任制公务员合同管理方面存在性质认识分野、制
<正>人们常用玉来比喻美好、高尚的人或物,如冰清玉洁、琼楼玉宇。古人说:"君子比德于玉",将人们的品德与光洁温润的玉联系在一起。可见古人看重的是玉的品质,玉所具有的美好
通过剖析高职院校艺术教育的现状:观念错位、机制失效、师资脆弱。结合高职教育的特点和艺术教育的功能,探索建构具有高职特色的艺术教育新模式。