论文部分内容阅读
摘 要:随着21世纪经济全球化的到来,高速度、高效率的生活节奏,使车辆普及成为必然的趋势,交通管理自动化越来越成为亟待解决的问题。现代智能交通系统 (Intelligent Transportation System,ITS)中,车辆牌照识别( License Plate Recognition,LPR)技术是计算机视觉与模式识别技术在交通领域应用的重要研究课题之一,是实现交通管理能够智能化的重要环节,其任务是分析、处理汽车图像,自动识别汽车牌号。LPR系统可以广泛应用于电子收费、出入控制、公路流量监控、失窃车辆查询和停车场车辆管理等需要车牌认证的场合;尤其在高速公路收费系统中,实现不停车收费提高公路系统的运行效率,LPR系统更具有不可替代的作用因而从事LPR技术的研究具有极其重要的现实意义和巨大的经济价值。本文对车辆视频分析系统的主要算法进行了简要的介绍和梳理,并对车辆视频分析系统进行了测试。
关键词:车牌分析系统
引言
LPR系统中的两个关键子系统是车牌定位系统和车牌字符识别系统。关于车牌定位系统的研究,国内外学者已经做了大量的工作,但实际效果并不是很理想,比如车牌图像的倾斜、车牌表面的污秽和磨损、光线的干扰等都是影响定位准确度的潜在因素。为此,近年来不少学者针对车牌本身的特点、车辆拍摄的不良现象及背景复杂状况,先后提出了许多有针对性的定位方法,使车牌定位在技术和方法上都有了很大的改善。然而现代化交通系统不断提高的快节奏,将对车牌定位的准确率和实时性提出更高的要求,因而进一步加深车牌定位的研究是非常有必要的。车牌字符识别是在车牌准确定位的基础上,对车牌上的汉字、字母、数字进行有效确认的过程,其中汉字识别是一个难点,许多国外的LPR系统也往往是因为汉字难识别而无法打入中国市场。车牌定位与识别方法,总体来说是图像处理技术与车牌本身特点的有机结合,当然也包括模式识别、神经网络、数学形态学、小波分析、模糊理论等知识的有效运用。一个车牌定位与识别系统基本包括:图像预处理、车牌搜索、车牌定位、车牌校正、车牌字符切分和字符识别结果的输出,现今人力成本的增加,在小区停车管理中需要耗费大量的人力物力,并且所起到的效果并非十分突出,对小区内进出的车辆合理的管理、降低成本的意愿逐日增强,因此本项目具有很大的技术和市场的空间。
需求分析
小区进出入车辆管理系统,不仅仅为管理人员提供了方便,更为用户缩短了宝贵时间,降低了用户等候记录、等候收费等时间,提高了效率,节约了成本。
目前牌照自动识别技术尚未达到很完美的程度,但是在国外由于高速公路和收费停车场發展较早,己经成功地开发了一些类似的自动系统。日本等国家早就开始试验在智能交通监控系统中应用这项技术,目的也是为了推动这项技术的发展。虽然,国外汽车牌照识别系统研究工作己有一定进展,但并不适合我国车牌特征,这主要是因为以下五个方面的原因:1.我国标准汽车牌照是由汉字、英文字母和阿拉伯数字组成,汉字的识别与字母和数字的识别有很大的不同,从而增加了识别的难度;2.国外许多国家汽车牌照的底色和字符颜色通常只有对比度较强的两种颜色(例 如韩国,其车牌底色为红色,车牌上的字符为白色),而我国汽车牌照仅底色就有蓝、黄、黑、白等多种颜色,字符颜色也有黑、红、白等若千种颜色;3. 其他国家的汽车牌照格式(如汽车牌照的尺寸大小,牌照上字符的排列等)通常只有一种,而我国则根据不同车辆、车型、用途,规定了多种牌照格式(例如分为军车、警车、普通车等);4.我国汽车牌照的规范悬挂位置不统一;
在这里,通过投影梯度法对字符进行提取,通过reshape将字符变形成为字库中字符图形的大小,之后我们通过1NN算法对字符进行识别,其中第一个字与汉字库进行匹配,剩余的字用数字字母库进行匹配并进行输出。
目前摄像头的跟踪主要利用camshift算法,介绍如下:camshift利用目标的颜色直方图模型将图像转换为颜色概率分布图,初始化一个搜索窗的大小和位置,并根据上一帧得到的结果自适应调整搜索窗口的位置和大小,从而定位出当前图像中目标的中心位置。分为以下三个部分:1--色彩投影图(反向投影):
(1).RGB颜色空间对光照亮度变化较为敏感,为了减少此变化对跟踪效果的影响,首先将图像从RGB空间转换到HSV空间。(2).然后对其中的H分量作直方图,在直方图中代表了不同H分量值出现的概率或者像素个数,就是说可以查找出H分量大小为h的概率或者像素个数,即得到了颜色概率查找表。(3).将图像中每个像素的值用其颜色出现的概率对替换,就得到了颜色概率分布图。这个过程就叫反向投影,颜色概率分布图是一个灰度图像。2—meanshiftmeanshift算法是一种密度函数梯度估计的非参数方法,通过迭代寻优找到概率分布的极值来定位目标。
算法过程为:(1).在颜色概率分布图中选取搜索窗W
(2).计算零阶距:
(3).调整搜索窗大小
(4).移动搜索窗的中心到质心,如果移动距离大于预设的固定阈值,则重复2)3)4),直到搜索窗的中心与质心间的移动距离小于预设的固定阈值,或者循环运算的次数达到某一最大值,停止计算。关于meanshift的收敛性证明可以google相关文献。
3—camshift
将meanshift算法扩展到连续图像序列,就是camshift算法。它将视频的所有帧做meanshift运算,并将上一帧的结果,即搜索窗的大小和中心,作为下一帧meanshift算法搜索窗的初始值。如此迭代下去,就可以实现对目标的跟踪。
算法过程为:
(1).初始化搜索窗
(2).计算搜索窗的颜色概率分布(反向投影)
(3).运行meanshift算法,获得搜索窗新的大小和位置。 (4).在下一帧视频图像中用(3)中的值重新初始化搜索窗的大小和位置,再跳转到(2)继续进行。
camshift能有效解决目标变形和遮挡的问题,对系统资源要求不高,时间复杂度低,在简单背景下能够取得良好的跟踪效果。但当背景较为复杂,或者有许多与目标颜色相似像素干扰的情况下,会导致跟踪失败。因为它单纯的考虑颜色直方图,忽略了目标的空间分布特性,所以这种情况下需加入对跟踪目标的预测算法。
然后通过在视频窗内触发左键点击事件获取所要跟踪的物体,通过对跟踪物体属性的提取,算法大致可以分解成3 部分:
a)Back Projection 计算:计算被跟踪目标的色彩直方图。在各种色彩空间中,只有HSI 空间中的H 分量可以表示颜色信息。所以在具体的计算过程中,首先将其他的色彩空间的值转化到HSI 空间,然后对其中的H 分量做1D 直方图计算,根据获得的色彩直方图将原始图像转化成色彩概率分布图像。
b)加载目标质心坐标信息:根据公式(7)计算所得到的运动目标的质心坐标,把相应的x,y方向坐标读取出来,作为Camshift 算法所需要的目标质心。
c)Meanshift 算法:利用经典的“Mean Shift”算法,不断平移调整窗口中心到与目标质心重合;并将上一帧的窗口大小和中心,作为下一帧MeanShift 算法搜索窗口的初始值,在下一帧中继续Mean Shift 运算。通过改进的Camshift 算法,可以有效的标定运动目标并进行跟踪,能够达到比较好的准确度。
通过本文方法,基本实验了物体的跟踪功能,并且实现了对于字符的识别功能,同时可以有效的利用到如小区管理系统,高速公路收费系统等等,具有一定的应用前景。
参考文献
[1] 荆人杰等。计算机图像处理。浙江大学出版社.
[2] 杨枝灵、王开等。数字图像获取处理及实践应用 人民邮电出版壮2003.
[3] 李介谷等。计算机模式识别技术。上海交通大学出版社.
[4]边肇棋、张学工等,模式识别 清华大学出版社,2000.
[5] 何斌、马天予等。Visual C++数字图像处理。人民邮电出版社2001.
[6] 向世明。Visual C++數字图像与图形处理电子工业出版社。2002.
[7] 张忻中。汉字识别技术。清华大学出版社.1992.
[8] 章毓晋。图象处理和分析基础。高等教育出版社.2002.
[9] 章毓晋、图像分割。科学出版社。2001.
[10] 谭浩强。C程序设计。清华大学出版社。1996.
[11] 钱能。C++程序设计教程。清华大学出版社1999.
关键词:车牌分析系统
引言
LPR系统中的两个关键子系统是车牌定位系统和车牌字符识别系统。关于车牌定位系统的研究,国内外学者已经做了大量的工作,但实际效果并不是很理想,比如车牌图像的倾斜、车牌表面的污秽和磨损、光线的干扰等都是影响定位准确度的潜在因素。为此,近年来不少学者针对车牌本身的特点、车辆拍摄的不良现象及背景复杂状况,先后提出了许多有针对性的定位方法,使车牌定位在技术和方法上都有了很大的改善。然而现代化交通系统不断提高的快节奏,将对车牌定位的准确率和实时性提出更高的要求,因而进一步加深车牌定位的研究是非常有必要的。车牌字符识别是在车牌准确定位的基础上,对车牌上的汉字、字母、数字进行有效确认的过程,其中汉字识别是一个难点,许多国外的LPR系统也往往是因为汉字难识别而无法打入中国市场。车牌定位与识别方法,总体来说是图像处理技术与车牌本身特点的有机结合,当然也包括模式识别、神经网络、数学形态学、小波分析、模糊理论等知识的有效运用。一个车牌定位与识别系统基本包括:图像预处理、车牌搜索、车牌定位、车牌校正、车牌字符切分和字符识别结果的输出,现今人力成本的增加,在小区停车管理中需要耗费大量的人力物力,并且所起到的效果并非十分突出,对小区内进出的车辆合理的管理、降低成本的意愿逐日增强,因此本项目具有很大的技术和市场的空间。
需求分析
小区进出入车辆管理系统,不仅仅为管理人员提供了方便,更为用户缩短了宝贵时间,降低了用户等候记录、等候收费等时间,提高了效率,节约了成本。
目前牌照自动识别技术尚未达到很完美的程度,但是在国外由于高速公路和收费停车场發展较早,己经成功地开发了一些类似的自动系统。日本等国家早就开始试验在智能交通监控系统中应用这项技术,目的也是为了推动这项技术的发展。虽然,国外汽车牌照识别系统研究工作己有一定进展,但并不适合我国车牌特征,这主要是因为以下五个方面的原因:1.我国标准汽车牌照是由汉字、英文字母和阿拉伯数字组成,汉字的识别与字母和数字的识别有很大的不同,从而增加了识别的难度;2.国外许多国家汽车牌照的底色和字符颜色通常只有对比度较强的两种颜色(例 如韩国,其车牌底色为红色,车牌上的字符为白色),而我国汽车牌照仅底色就有蓝、黄、黑、白等多种颜色,字符颜色也有黑、红、白等若千种颜色;3. 其他国家的汽车牌照格式(如汽车牌照的尺寸大小,牌照上字符的排列等)通常只有一种,而我国则根据不同车辆、车型、用途,规定了多种牌照格式(例如分为军车、警车、普通车等);4.我国汽车牌照的规范悬挂位置不统一;
在这里,通过投影梯度法对字符进行提取,通过reshape将字符变形成为字库中字符图形的大小,之后我们通过1NN算法对字符进行识别,其中第一个字与汉字库进行匹配,剩余的字用数字字母库进行匹配并进行输出。
目前摄像头的跟踪主要利用camshift算法,介绍如下:camshift利用目标的颜色直方图模型将图像转换为颜色概率分布图,初始化一个搜索窗的大小和位置,并根据上一帧得到的结果自适应调整搜索窗口的位置和大小,从而定位出当前图像中目标的中心位置。分为以下三个部分:1--色彩投影图(反向投影):
(1).RGB颜色空间对光照亮度变化较为敏感,为了减少此变化对跟踪效果的影响,首先将图像从RGB空间转换到HSV空间。(2).然后对其中的H分量作直方图,在直方图中代表了不同H分量值出现的概率或者像素个数,就是说可以查找出H分量大小为h的概率或者像素个数,即得到了颜色概率查找表。(3).将图像中每个像素的值用其颜色出现的概率对替换,就得到了颜色概率分布图。这个过程就叫反向投影,颜色概率分布图是一个灰度图像。2—meanshiftmeanshift算法是一种密度函数梯度估计的非参数方法,通过迭代寻优找到概率分布的极值来定位目标。
算法过程为:(1).在颜色概率分布图中选取搜索窗W
(2).计算零阶距:
(3).调整搜索窗大小
(4).移动搜索窗的中心到质心,如果移动距离大于预设的固定阈值,则重复2)3)4),直到搜索窗的中心与质心间的移动距离小于预设的固定阈值,或者循环运算的次数达到某一最大值,停止计算。关于meanshift的收敛性证明可以google相关文献。
3—camshift
将meanshift算法扩展到连续图像序列,就是camshift算法。它将视频的所有帧做meanshift运算,并将上一帧的结果,即搜索窗的大小和中心,作为下一帧meanshift算法搜索窗的初始值。如此迭代下去,就可以实现对目标的跟踪。
算法过程为:
(1).初始化搜索窗
(2).计算搜索窗的颜色概率分布(反向投影)
(3).运行meanshift算法,获得搜索窗新的大小和位置。 (4).在下一帧视频图像中用(3)中的值重新初始化搜索窗的大小和位置,再跳转到(2)继续进行。
camshift能有效解决目标变形和遮挡的问题,对系统资源要求不高,时间复杂度低,在简单背景下能够取得良好的跟踪效果。但当背景较为复杂,或者有许多与目标颜色相似像素干扰的情况下,会导致跟踪失败。因为它单纯的考虑颜色直方图,忽略了目标的空间分布特性,所以这种情况下需加入对跟踪目标的预测算法。
然后通过在视频窗内触发左键点击事件获取所要跟踪的物体,通过对跟踪物体属性的提取,算法大致可以分解成3 部分:
a)Back Projection 计算:计算被跟踪目标的色彩直方图。在各种色彩空间中,只有HSI 空间中的H 分量可以表示颜色信息。所以在具体的计算过程中,首先将其他的色彩空间的值转化到HSI 空间,然后对其中的H 分量做1D 直方图计算,根据获得的色彩直方图将原始图像转化成色彩概率分布图像。
b)加载目标质心坐标信息:根据公式(7)计算所得到的运动目标的质心坐标,把相应的x,y方向坐标读取出来,作为Camshift 算法所需要的目标质心。
c)Meanshift 算法:利用经典的“Mean Shift”算法,不断平移调整窗口中心到与目标质心重合;并将上一帧的窗口大小和中心,作为下一帧MeanShift 算法搜索窗口的初始值,在下一帧中继续Mean Shift 运算。通过改进的Camshift 算法,可以有效的标定运动目标并进行跟踪,能够达到比较好的准确度。
通过本文方法,基本实验了物体的跟踪功能,并且实现了对于字符的识别功能,同时可以有效的利用到如小区管理系统,高速公路收费系统等等,具有一定的应用前景。
参考文献
[1] 荆人杰等。计算机图像处理。浙江大学出版社.
[2] 杨枝灵、王开等。数字图像获取处理及实践应用 人民邮电出版壮2003.
[3] 李介谷等。计算机模式识别技术。上海交通大学出版社.
[4]边肇棋、张学工等,模式识别 清华大学出版社,2000.
[5] 何斌、马天予等。Visual C++数字图像处理。人民邮电出版社2001.
[6] 向世明。Visual C++數字图像与图形处理电子工业出版社。2002.
[7] 张忻中。汉字识别技术。清华大学出版社.1992.
[8] 章毓晋。图象处理和分析基础。高等教育出版社.2002.
[9] 章毓晋、图像分割。科学出版社。2001.
[10] 谭浩强。C程序设计。清华大学出版社。1996.
[11] 钱能。C++程序设计教程。清华大学出版社1999.