标牌图像文本检测技术研究

来源 :江苏海洋大学 | 被引量 : 0次 | 上传用户:azhu0919
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本检测作为计算机视觉领域中的一个重要研究方向存在着广泛的应用,如自动驾驶、视频分析、工业检测和智慧城市建设等。标牌图像主要由奖牌、门牌、标志牌和警示牌组成,具有如时间、地点、荣誉、祝福等丰富的语义信息,因此准确地检测出自然场景中标牌图像的文本信息可以极大地便利人们的日常生活和国内外交流。此外,与常见自然场景文本如门店牌匾、交通标志牌、广告牌和宣传栏不同,标牌图像的背景颜色和样式多变,许多背景极易产生噪声;同时其不同位置文本的大小、颜色、样式、字符间距差异较大,具有一定的检测难度。因此研究标牌图像文本检测有助于推动其在工业、教育、智慧城市建设领域的快速发展,具有较大的研究意义和实用价值。但目前并未有公开的标牌图像数据集,同时自然场景下的文本检测还面临诸多难点,如文本颜色、字体和排列千变万化、背景复杂多变、图像失真等。因此,本文主要研究工作为标牌图像数据集的构造和自然场景下标牌图像文本检测算法,其主要内容如下:(1)构造了标牌图像数据集。本文构造了含有600幅图像和2359行文本的水平标牌图像数据集与含有1600幅图像和7083行文本的多方向标牌图像数据集。数据集的语言为中英文混合。在数据集构建阶段,首先对公共数据集的构造和图像文本特点进行分析,然后采集、拍摄自然场景下的标牌图像并对图像进行标注,标注方式为文本行级的四点标注。最后,对标牌图像数据集进行多角度分析与统计,帮助后来者增强对数据集的理解并为其自建数据集提供经验。(2)提出了一个基于MSER和SWT的标牌图像文本检测算法(MS)。针对水平标牌图像数据集文本特点,本方法首先通过MSER和SWT对输入图像进行候选文本区域的提取与优化;之后,通过启发性规则和一系列筛选规则去除非文本区域;最后,将候选文本区域聚合并根据文本行形态特征过滤非文本对象,得到最终的检测结果。实验对比结果显示,本文算法的P、R和F值均高于对比算法,可以有效地检测水平标牌图像的文本信息。(3)提出了一个基于注意力机制与SPP的标牌图像文本检测模型(CS-DBNet)。首先,改进DBNet检测模型的特征提取模块,将FPN提取的高层特征输入引入的CBAM注意力模块中,之后将优化后的特征图与低层特征图融合得到FPN路径融合特征图。此外,本方法还引入SPP特征提取通道,将CBAM优化后的特征图进行融合,之后再通过SPP模块进行多尺度融合得到SPP路径融合特征图。最后,将FPN路径融合特征图与SPP路径融合特征图一起输入CONCAT层,从而得到蕴含更多文本信息的融合特征。三个数据集的实验对比表明,本文改进方法可以有效地提高检测模型性能并且具有较强的竞争力。该论文有图40幅,表8个,参考文献59篇。
其他文献
近年来,随着工业的发展,越来越多的工业废水被排放到水体中,这些废水中如果含有高毒性的铬(Cr(VI))和有机染料等,将对环境生态系统产生毁灭性的影响,同时也将影响人类健康。因此,在工业废水排放之前,其中的染料和重金属离子必须有效去除,这已成为一个重要课题。在众多的处理方法中,光催化法直接利用太阳能实现净化废水的目的,该方法更有效、成本更低且不产生二次污染物。光催化剂的开发是光催化污水净化的关键。尽
学位
随着柔性可穿戴电子器件的快速发展,具有快速充放电倍率、长循环寿命和良好柔韧性的超级电容器近年来成为研究热点。超级电容器按照储能机制的不同分为双电层超级电容器和法拉第超级电容器。其中导电聚合物聚苯胺具备较大的法拉第赝电容,而且生产成本低,制备工序简便,被广泛用于制备超级电容器电极材料。但是聚苯胺存在机械稳定性和导电性较差的缺陷,在充放电过程的快速法拉第反应中会造成材料形变及体积变化,严重削弱了电极材
学位
超级电容器由于其独特的充放电性质受到广泛关注,但其较低的能量密度限制了应用,而电极材料的选择是解决这一问题的关键。针对这一问题,本文以聚苯胺为核心,研究了聚苯胺及其衍生材料形貌调控的影响因素及其与电化学性能之间的关系。首先探究了聚苯胺纳米材料的形貌调控,然后将廉价的聚苯胺作为前驱体进行碳化,所得到的高导电性的聚苯胺基碳进行表面改性后作为基底负载二氧化锰,从而得到成本廉价、性能良好的超级电容器电极材
学位
集约化的养殖模式在我国的水产养殖中已经得到了广泛的应用,然而这种养殖模式的建立产生了一系列的问题,其中比较突出的是由水产致病菌所引起的疾病屡次发生。副溶血弧菌不仅是食源性致病菌而且是导致水产品发生病害的元凶之一。海产品感染了副溶血弧菌等水产致病菌后会产生各种症状,人类如果食用了这些海产品会对人类健康造成一定程度上的威胁。副溶血弧菌类疾病不仅破坏了我国水产养殖业绿色健康发展的模式,而且对我国的经济在
学位
磺胺类抗生素(SAs)具有抗菌谱广、疗效显著、性质稳定、价格低廉等优点,被广泛用于人类和动物。SAs生产和使用量非常庞大,是环境中检出率较高的一类抗生素,而大部分残留在环境中的抗生素会汇入近岸海域,造成环境污染,甚至威胁人体健康。目前,SAs的环境行为及其危害已经引起了社会的广泛关注,成为了当前国际研究的热点领域,研究SAs的降解机制对生态环境保护具有重要意义。间接光降解是SAs的主要转化途径之一
学位
为了探究莱州湾海域光合浮游生物种群结构及其时空分布特征,本研究在2020年5月至2021年3月对本海域进行了5个航次的调查和研究,包括春季(2020年5月15日~5月19日)、夏季(2020年8月3日~8月13日)、秋季(2020年10月25日~10月29日)、冬季(2021年1月17日~1月25日)、初春(2021年3月19日~3月28日)。本文基于rbc L功能基因,从分子角度解析莱州湾海域光
学位
全无机钙钛矿材料作为太阳电池的新型吸光材料受到广泛关注。经过不到10年的时间,各组分(Cs Pb I3,Cs Pb I2Br,Cs Pb IBr2,Cs Pb Br3)的全无机钙钛矿太阳电池已经取得了飞速的发展,其中Cs Pb IBr2钙钛矿材料因其合适的带隙、良好的热稳定性成为新的研究热点。由于钙钛矿太阳电池是多层结构,层与层之间的电荷传输受到界面的影响,界面缺陷和能级不匹配会导致非辐射复合增加
学位
贵金属纳米粒子由于独特的物理化学性质和在光学、传感和催化等方面的功能性质而引起广泛关注。然而,纳米粒子表面能高,极易发生团聚,稳定性较差。另一方面,二维层状材料具有结构简单、柔韧、各向异性,优异的稳定性,独特的光学和电子特性等,剥离后的纳米片厚度约为1 nm,形成了一种新型无机大分子结构,其物理化学性质与其三维块状大分子有明显的不同。它们可以作为多用途的构筑单元构建多层膜、多孔复合材料和层状纳米复
学位
1,3,5-三嗪和喹啉衍生物都具有良好的广谱生物学活性,包括抗菌、抗肿瘤、抗HIV、抗阿尔茨海默症等。本课题选择氰尿酰氯和4,7-二氯喹啉为原料,通过各种氨进行连接,设计合成了5个系列1,3,5-三嗪-喹啉衍生物,并对合成化合物进行了胆碱酯酶抑制活性研究和哈氏弧菌抑制活性研究,为之后1,3,5-三嗪-喹啉衍生物的研究提供了理论基础和数据支持。本课题以氰尿酰氯为原料,在四氢呋喃体系中加入胺严格控制0
学位
目前,传统的化石燃料开采殆尽,其带来的环境问题也日益严重,人们对清洁能源的需求日益增大。因此,具有极大发展潜力的光伏产业在近几年得到了巨大的发展。硅太阳电池作为其中的核心技术,其转换效率的提高是降本的重点之一。如今,接触处的复合是限制其效率提高的关键问题。载流子选择性接触(CSCs)成为解决该问题的重要途径。其中,宽带隙材料由于其与硅能带匹配,免掺杂(无需利用杂质在硅内扩散,形成p或n型掺杂),制
学位