复杂场景下端到端车牌识别方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:zhoushuoqd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
车牌识别是计算机视觉领域的重要研究方向之一,许多车牌识别方法和识别系统已在停车场、高速收费站等场景中得到广泛应用。现有车牌识别方法和系统中的相机主要部署在固定角度和位置,采集到的车牌图像相对固定。但是在诸如安全驾驶、移动警务、道路安全等实际需求中,相机位置并不固定,导致所采集到的车牌具有背景复杂、大小不一的情况,且存在错切、旋转等变化,给现有车牌识别方法带来了困难。此外,随着经济发展和社会进步,实际应用中还出现了新能源车牌、军警车牌、双行车牌等诸多特殊类型车牌,其中双行车牌的多行布局特性使得现有单行车牌识别方法难以适用、汉字位置不固定的车牌难以准确识别等问题,给车牌识别方法带来了新的挑战。针对上述问题,本文对复杂场景下的端到端车牌识别方法进行了深入研究,具体工作如下:1.针对现有车牌识别方法不能处理视角变化和识别类型单一的问题,本文提出了面向复杂场景的端到端单行车牌识别网络,在一个网络中同时实现车牌检测和车牌识别。首先用共享卷积提取输入图像的特征,然后接入两个网络分支分别对应检测和识别两个任务,并设计了一个特征提取矫正模块把两个分支连接起来。其中,车牌检测采用了像素级分割的方法,能够从复杂场景的图像中精确检测出各种形状的车牌。车牌识别采用了双向长短时记忆网络,能够应对汉字位置不固定和车牌字符变长的问题。特征提取矫正模块对车牌区域特征进行变换,得到水平排列的矩形特征,让梯度在反向传播时可以流经整个网络,从而实现端到端的训练和推理。端到端网络利用了检测任务和识别任务的相关性,提高了车牌识别率;并且,两个任务在提取特征时使用了共享卷积,从而缩短了运行时间。在公开数据集AOLP上,本文方法比目前最好方法的车牌识别率提高了0.86%。在SSIG等四个公开数据集上,本文方法的识别速度和车牌识别率也达到了领先水平。2.针对现有车牌识别方法无法识别多行布局车牌的问题,本文进一步对单行车牌识别网络进行扩充,提出了基于特征重组的端到端多行车牌识别网络。首先,在网络上嵌入一个浅层分类模块,用来区分不同行数车牌的特征。然后,通过切分、池化和拼接的方式,把不同行数车牌的特征组合起来,实现了多行布局车牌的特征重组。最后用双向长短时记忆网络进行识别。由于不需要在图像的车牌区域上进行分割,包括分割出每一行和对一行的字符分割,简化了多行车牌的识别过程。为了解决多行车牌训练数据不足的问题,本文用生成图像进行数据扩充。实验表明,特征重组的方式比用车牌分割的方式车牌识别率提高了7.85%,并且端到端多行车牌识别网络在含有多行车牌的真实数据上能够达到98.29%的整牌识别率。本文还从多个方面对网络的推理速度进行了优化,优化后的推理速度比优化前提高了约130%。
其他文献
数据的爆炸式增长为人类社会带来巨大的机遇与挑战,如何有效挖掘数据的潜在价值已成为一项重要的研究课题。分类作为一种常见的数据分析方式,能够实现对数据内在规律的细致洞
脑胶质瘤是一种起源于脑神经胶质细胞的原发性颅内肿瘤,严重影响人类健康和生活质量。提高胶质瘤的分割精确度有助于提高诊断的准确性,降低误诊率,胶质瘤的多样性和复杂性造
随着通信业的迅速发展,频谱资源日渐紧张,太赫兹频段作为频率发展间隙获得了越来越高的关注度。近十年来,在国家的大力支持下,太赫兹的发展取得了巨大的进步。太赫兹波在安检
开放域问答(Open-domain Question Answering)在计算机科学领域指的是给定广泛领域的任意自然语言问题,自动给出答案的任务。开放域问答是信息检索和自然语言处理的核心问题
颗粒流指的是颗粒物质在外部作用和内部应力状态变化时发生的类似于流体的运动状态。在工业上,多孔漏斗流在颗粒材料输运、混合分离等方面具有广泛的应用。在实验研究上,二维
随着互联网时代的迅猛发展,“信息孤岛”已成为各级政府及企业信息化建设的后遗症之一。面向服务的架构(Service-Oriented Architecture,SOA)针对不同业务研发的不同平台、不
目前,随着我国显示技术的快速发展与提升,我国液晶显示(TFT-LCD)行业已经占据举足轻重的地位。TFT-LCD在人们的日常生活和工业领域中已得到广泛的应用,如电子手表、手机、电
对机械系统润滑油中的金属磨粒的监测可以帮助制定维修计划,设计可靠的预防性维修措施。然而对于油液传感器输出信号的信号处理以及有效信息的提取存在一定的困难。为了解决这一问题,首先基于电磁原理分析研究了磨粒传感器的磁场分布以及变化,建立了磨粒尺寸半径与传感器输出信号电压成三次方的数学模型,分析研究了传感器的输出电压特性,得到了基于输出的电信号的峰值、相位等特征求解磨粒尺寸、数量、磁性等信息的方法。然后分
中国是世界上植物资源最为丰富的国家之一,约有30000余种植物,仅次于世界植物最丰富的马来西亚和巴西,居世界第三位,其中蕨类植物、种子植物分别占世界已知种类的22%、36.7%;裸子植物总数占26.7%,被誉为“裸子植物的故乡”;而被子植物占总数的10%,位于世界前列。北半球寒、温、热各带植被的主要植物,在中国几乎都可以看到。种类数量众多的植物在中国悠久的历史中孕育出了独一无二的植物文化。而在中国
智慧课堂是互联网、大数据、云计算、人工智能等新一代信息技术与课堂教学深度融合的产物,创造了个性化、智能化和数字化的学习环境,具有教学决策科学化、教学评价实时化、师