自然场景下文本检测方法研究与智能设备设计应用

来源 :江苏大学 | 被引量 : 0次 | 上传用户:hua3287226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景图像文本检测识别在智能设备中应用广泛,是设备与外界的重要交互方法,设备需要获取精确的文本识别信息,而对文本识别的第一步则是对文本进行精确的检测定位。在传统候选框检测定位的方法中,对水平和倾斜文本检测已达到很高的检测精度,但是方法被应用到包含曲向文本的图像中时表现欠佳。曲向文本在文本字符连接、标记准则等方面与水平、倾斜文本存在很大差异,致使候选框的设计与边框回归难度提升,基于候选框的方法已经不能很好的检测定位这些复杂的曲向文本。而基于像素分割的方法再配以自适应文本框标注的方法则能很好的解决这个问题,首先通过像素分割的方法精确的将文本区域检测分割出来,再通过自适应文本框方法对其进行精确的定位,能够有效的检测定位复杂的曲向文本。本文基于像素分割和自适应文本框标定的学习方法对自然场景下的文本检测定位进行研究,最后将方法应用至设计的智能设备平台中,具体研究内容如下:(1)提出一种改进的文本检测方法,引入特征通道注意力机制,对自然场景中的文本进行精确检测。主要解决PixelLink方法对整体文本检测精度不足问题,关注特征通道间的权重关系,提高有效特征通道的权重系数,抑制低效或无效特征通道的权重,进而提升整体文本检测定位的鲁棒性。在公开数据集ICDAR2015、MSRA-TD500数据集上的实验表明,所提方法相比于原有PixelLink方法在文本整体检测精度上,即综合指标上分别提升1.2%、3.5%。因此所提方法能够有效引入特征通道注意力机制以提升原有方法的检测性能。(2)提出改变公开数据集的标注形式与自适应文本框定位方法。将坐标点排列为带有方向信息的序列形式,使用LSTM模型对文本行进行自适应式多边形框的学习框定。最后对生成的定位结果依据多边形框上端点连线的倾斜角度进行旋转等后续处理,将完成精确定位的结果传入文本识别系统接口中获取具体字符内容。在公开数据集CTW1500曲向文本检测定位中与同类型领先算法TextSnake相比,所提方法在精确度和综合指标上分别领先12.1%和2.6%。因此,所提出的更改数据集标注形式与自适应文本框定位方法能够有效对曲向文本进行定位,并且达到一个领先位置。(3)设计并实现交互式阅读导盲陪护机器犬设备。包含完整的结构、硬件方案与技术功能实现方案。绘制打印结构外形,选择相关处理芯片,组合安装后通过已有语音接口、导航接口与使用者进行信息交互,增加盲人与外界沟通渠道。其中本文所提已改进的文本检测定位方法应用于设备中,并建立测试数据集,在自然场景下的室内外场景进行测试,完成交互阅读陪护功能。通过实际使用场景测试可以直观的展示和验证所提方法的可靠性与有效性,能够辅助盲人在自然场景下获取文字信息,提高陪护性能。最终设计并验证交互式阅读导盲陪护机器犬的其他基础功能,提高出行保障,形成功能完整的设备平台。
其他文献
随着经济、文化的飞速发展,当今社会已进入体验经济时代,人们对精神文化生活的追求愈加强烈,用户的感性需求也得到了前所未有的关注。在产品设计领域,单一感觉的产品已经不能满足用户的情感需求,而能够与用户进行互动,满足用户情感需求的产品设计越来越受到用户的喜爱以及设计领域的重视。通感设计是结合人的五官感受,并经过大脑的联想,将生活中的感官体验凝聚到产品设计中,在用户和产品之间建立起一条情感“交流”的纽带,
新型环境污染物(Emerging Contaminants,Ecs)是指目前确已存在,但尚无环保法律法规予以规定或规定不完善的,危害生活和生态环境的所有在生产建设或者其他活动中产生的污染物,该类污染物通常是由于发现其新的生物毒性或者分析技术的提高,在近期被检出而成为环境化学领域的研究热点。磺胺类抗生素(Sulfanilamides,SAs)与四溴双酚 A(Tetrabromobisphenol A
Overhauser磁力仪在弱磁场测量领域发挥着重要作用,它是一种依据Overhauser效应制成的精密仪器,涉及了传感器技术、电磁测量原理、原子物理与信息处理等相关知识,广泛应用于地质勘探、考古、空间探测与军事领域。本设计主要针对于传统质子磁力仪功耗高、精度低等问题,根据自由基动态核极化相关原理制作Overhauser效应磁场传感器,仪器具有极化程度高、抗干扰能力强等特点,多用于野外作业。论文给
重金属作为主要的持久性环境污染物之一,由于其具有强毒性以及可以在生物体内积累、在食物网中富集等特点,对水环境质量的影响巨大,尤其是毒害性较大的铅(Pb)、铬(Cr)、镉(Cd)、锌(Zn)、铜(Cu)等元素,成为影响淡水生态系统的最严重的污染物之一,已经成为全球性的棘手问题而备受关注。近几十年,伴随着城市化、工业化以及农业的迅速发展,以及人口数量增加和人类活动的增强,淡水生态系统中重金属含量急剧增
在教育信息化高速发展的今天,不断丰富的网上教育资源,为各类学习者提供全面的教学教育服务。如何追踪学习者的知识状态,选择合适的资源推荐给学习者,是未来网上教育的研究重点。目前深度知识追踪在习题推荐应用方面,已取得了不错的应用效果,但是还存在以下两个主要问题:1)基于深度学习的深度知识追踪(DKT)模型,由于学习者的实际答题时间存在个体化差异,无法进行学习状态的采集,导致预测的准确率不高。2)在习题推
我国以纯电动汽车、插电式混合动力汽车、燃料电池汽车为“三纵”的研发布局,是“十四五”汽车产业规划战略,其中以机电耦合低碳化作为节能汽车的发展重点。插电式混合动力汽车(PHEV)解决了纯电驱动“里程焦虑”问题,又能兼顾高效节能,但PHEV多能源动力系统集成是亟需解决的关键技术。尤其是以集成双电机多模动力总成为代表的PHEV,在提升经济性与动力性的同时,带来了能量管理策略复杂、模式切换频繁等诸多问题,
ε-聚赖氨酸(ε-poly-L-lysine,ε-PL)是由L-赖氨酸(L-Lys)单体通过α-COOH和ε-NH2脱水缩合而成的天然聚氨基酸,具有良好的水溶性、抗菌性,安全环保,可用作食品防腐剂。然而天然菌株产生ε-PL的能力低,因此可以通过选育高产菌株和提高发酵效率以促进ε-PL的生产。本研究采用常压室温等离子体(Atmospheric and Room Temperature Plasma,
全球经济一体化和社会科技的进步,带动了一系列差旅业务和旅游业的蓬勃发展,异地的短期停留使酒店入住服务发挥着重要作用。这种短暂的体验对消费者的旅途起到举足轻重的作用,关系到整个过程的质量和后续的持续价值。随着酒店逐步迈入智能服务时代,用户在接受入住服务过程中不仅受物理环境、人际交流影响,与各种终端、软件的交互质量也会影响整体体验,需要重新进行整合和设计。本文以提升酒店入住服务质量为目的,在服务设计理
MicroRNA(miRNA)是一类长度约22核苷酸(Nucleo Tide,NT)的内源非编码RNA。miRNA在细胞增殖、分化以及细胞衰老、死亡等众多生物生理过程中占有很重要的地位,并且与多种人类疾病的发生发展密切相关。准确识别miRNA并研究miRNA与疾病的关联,有助于从后转录水平探索疾病的致病机理、为疾病的预防和治疗提供新的思路。本文以miRNA相关数据为对象进行研究,对于当前miRNA
喷雾施药是当前果园防治病虫害的主要方式。传统作业方式往往造成农药利用率低、带来土壤中农药残留量超标等问题,不仅污染环境,而且威胁果农生命安全。为了有效减少农药使用量,提高药液利用率,本文研究了基于Kinect传感器的履带式果园变量喷雾控制系统。系统将对靶喷雾与变量喷雾有机结合,根据靶标有无以及靶标面积的大小,实施对靶变量喷雾,主要研究内容如下:(1)分析了对靶变量喷雾技术优势,提出了控制系统设计任