论文部分内容阅读
摘要:车牌图像二值化是车辆牌照识别中的关键技术。由于光照不均、曝光不足、动态范围太窄和车牌被污染等原因,车牌图像的质量往往不佳,严重影响了牌照图像二值化效果。该文对一种车牌图像二值化算法--CASDA算法做了改进,能更好地适应不同质量的车牌图像。实验证明了该算法的有效性。
关键词:二值化;CASDA算法;全局阈值;牌照识别
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2015)05-0188-02
An Improved Binarization Method based on Maximum Variance between Clusters
BU Fei-yu, ZHU Qin, WANG Tao
(Institute of Information Science and Engineering, Hunan City University, Hunan YiYang 413000)
Abstract: Vehicle license plate binarization algorithms comprise a critical technology in VLPR (Vehicle license plate recognition). Because of the deficiency in illumination, exposure, dynamic range and license plate pollution, the quality of license plate image is always very poor, that makes the poor quality of binarization image. After analyzing the shortcomings of CASDA algorithm(Cluster Algorithm Based on Spatial Distribution Analysis), this paper proposes an improved binarization algorithm. The improved approach is robust to poor image. The experiment results have proved the advantages of the proposed algorithm.
Key words: binarization; CASDA algorithm; Global threshold; License-plate Recognition;
车牌识别系统中,从汽车彩色图像输入到最终车牌号码的获取大致经过如下几个过程:预处理、车牌定位、二值化、字符切分、字符识别[1]。二值化是车牌识别中仅次于车牌定位的重要步骤,其效果直接影响到后面的切分和识别。二值化后的车牌要能再现原字符图像,基本不出现笔画断裂和粘连现象,尽量不丢失原字符的特征。
各种原因使得拍摄的车牌图像效果不理想,如车牌上光照不均;车牌污损造成字符笔画不清或粘连;汽车行驶较快使拍得的车牌模糊;所拍图像中存在噪声干扰。以上原因极大地影响了车牌图像二值化效果。为此,须对车牌图像二值化算法做深入细致的研究。
1 车牌图像二值化算法概述
车牌图像二值化可采用全局阈值方法或局部阈值方法,常用的方法有下述几种:
1)Otsu二值化算法[2]
Otsu算法基本思想:取一个阈值T,将图像像素按灰度分为大于等于T和小于T两类,求出两类像素的类间方差[σ2B]和类内方差[σ2A],使[σ2Bσ2A]最大的T即为最佳二值化阈值。Otsu算法具有算法简单、自适用性较强,基于图像的整体特性,可推广到多阈值等优点,但也有缺点:①运算量较大;②以灰度分布为特征,判决函数S(k)= [σ2Bσ2A]可能呈双峰,即全局最大值不能保证是正确的阈值; ③图像光照不均时往往无法找到合适的单一阈值。
为了解决Otsu算法的不足,文献[3]提出了CASDA算法--基于空间分布的最大类间方差牌照图像二值化算法。该算法先利用全局特征(字符像元比例、均值、方差)将阈值T确定在全局极值点附近,再在区间[T-10,T 10]中采用最大类间方差判别准则函数[σ2Bσ2A]对粗阈值T进行微调,得到最终的二值化阈值。该算法计算量小,且阈值T在全局极值点附近,所以能取得比较稳定的效果。但是由于它利用全局阈值,仍存在以下不足:①当图像光照不均匀时,无法找到合适的单一阈值。②忽略了字符细节特征。
2)Kamel-Zhao算法[4]
Kamel-Zhao算法是一种基于笔划特征的文本图像二值化方法,它需事先提供两个参数:笔划宽度W和阈值Tk 。在车牌图像中,笔划宽度W可根据实际提取出来的牌照和标准牌照图像之间比例关系来确定,但参数Tk较难选择。参数Tk选择不当,会对算法效果影响较大。
为了较好的确定参数Tk ,文献[5]提出了一种基于字符笔划特征的车牌二值化方法。该方法利用文献[3]算法所得到的二值化阈值T,算出牌照图像中字符像素较准确的比例;对Tk先给出一个初值,再根据字符像素比例在一定范围调整Tk 。利用迭代方法,通过Kamel-Zhao算法判断字符像素的原理计算上次迭代后阈值条件下字符像素比例,找到最优比例对应的阈值Tk作为Kamel-Zhao二值化时参数Tk的取值。
3)Bernsen算法[6]
设W为估计出的最大笔画宽度,Bernsen算法考察以(x,y)点为中心的(2W 1)*(2W 1)窗口,以窗口内像素点的最大灰度值和最小灰度值二者的均值作为考察点(x,y)处的二值化阈值。与Kamel-Zhao算法相比,Bernsen算法的阈值由考察点邻域的灰度决定,不存在预定阈值,所以更具有实用价值。但Bernsen算法运算量大,且容易出现伪影现象和笔画断裂现象。针对此问题,文献[7]引入一个简单的整体阈值进行辅助判断,对算法得到的阈值曲面进行光滑处理并对局部窗口的极大、极小值进行考察,从而较好地避免了伪影及笔画断裂。
文献[5]中,针对Otsu算法、Bernsen算法、LEVBB算法、文献[3]的CASDA算法和文献[5]改进后的Kamel-Zhao算法等五种算法做了对比试验。从对比试验可以看出,上述几种方法中,CASDA算法和改进的Kamel-Zhao算法都有较好的二值化效果。
由于交通的发展,车牌识别的重要性更加突显。为改善车牌识别系统的性能,不少研究者仍在对车牌二值化算法做进一步研究。如文献[8]将遥感图像处理的方法引入车牌图像处理中,提出了一种限定阈值二值化改进算法。文献[9]提出了一种融合多级光照处理的二值化算法,能较好地克服不均匀光照对车牌图像二值化的干扰,使二值化图像字符更清晰。
本文将对CASDA(Cluster Algorithm Based on Spatial Distribution Analysis)算法再作进一步改进,使其能更好地适应光照不均、曝光不足、动态范围太窄和被污染的车牌图像,从而得到更好的二值化效果。
关键词:二值化;CASDA算法;全局阈值;牌照识别
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2015)05-0188-02
An Improved Binarization Method based on Maximum Variance between Clusters
BU Fei-yu, ZHU Qin, WANG Tao
(Institute of Information Science and Engineering, Hunan City University, Hunan YiYang 413000)
Abstract: Vehicle license plate binarization algorithms comprise a critical technology in VLPR (Vehicle license plate recognition). Because of the deficiency in illumination, exposure, dynamic range and license plate pollution, the quality of license plate image is always very poor, that makes the poor quality of binarization image. After analyzing the shortcomings of CASDA algorithm(Cluster Algorithm Based on Spatial Distribution Analysis), this paper proposes an improved binarization algorithm. The improved approach is robust to poor image. The experiment results have proved the advantages of the proposed algorithm.
Key words: binarization; CASDA algorithm; Global threshold; License-plate Recognition;
车牌识别系统中,从汽车彩色图像输入到最终车牌号码的获取大致经过如下几个过程:预处理、车牌定位、二值化、字符切分、字符识别[1]。二值化是车牌识别中仅次于车牌定位的重要步骤,其效果直接影响到后面的切分和识别。二值化后的车牌要能再现原字符图像,基本不出现笔画断裂和粘连现象,尽量不丢失原字符的特征。
各种原因使得拍摄的车牌图像效果不理想,如车牌上光照不均;车牌污损造成字符笔画不清或粘连;汽车行驶较快使拍得的车牌模糊;所拍图像中存在噪声干扰。以上原因极大地影响了车牌图像二值化效果。为此,须对车牌图像二值化算法做深入细致的研究。
1 车牌图像二值化算法概述
车牌图像二值化可采用全局阈值方法或局部阈值方法,常用的方法有下述几种:
1)Otsu二值化算法[2]
Otsu算法基本思想:取一个阈值T,将图像像素按灰度分为大于等于T和小于T两类,求出两类像素的类间方差[σ2B]和类内方差[σ2A],使[σ2Bσ2A]最大的T即为最佳二值化阈值。Otsu算法具有算法简单、自适用性较强,基于图像的整体特性,可推广到多阈值等优点,但也有缺点:①运算量较大;②以灰度分布为特征,判决函数S(k)= [σ2Bσ2A]可能呈双峰,即全局最大值不能保证是正确的阈值; ③图像光照不均时往往无法找到合适的单一阈值。
为了解决Otsu算法的不足,文献[3]提出了CASDA算法--基于空间分布的最大类间方差牌照图像二值化算法。该算法先利用全局特征(字符像元比例、均值、方差)将阈值T确定在全局极值点附近,再在区间[T-10,T 10]中采用最大类间方差判别准则函数[σ2Bσ2A]对粗阈值T进行微调,得到最终的二值化阈值。该算法计算量小,且阈值T在全局极值点附近,所以能取得比较稳定的效果。但是由于它利用全局阈值,仍存在以下不足:①当图像光照不均匀时,无法找到合适的单一阈值。②忽略了字符细节特征。
2)Kamel-Zhao算法[4]
Kamel-Zhao算法是一种基于笔划特征的文本图像二值化方法,它需事先提供两个参数:笔划宽度W和阈值Tk 。在车牌图像中,笔划宽度W可根据实际提取出来的牌照和标准牌照图像之间比例关系来确定,但参数Tk较难选择。参数Tk选择不当,会对算法效果影响较大。
为了较好的确定参数Tk ,文献[5]提出了一种基于字符笔划特征的车牌二值化方法。该方法利用文献[3]算法所得到的二值化阈值T,算出牌照图像中字符像素较准确的比例;对Tk先给出一个初值,再根据字符像素比例在一定范围调整Tk 。利用迭代方法,通过Kamel-Zhao算法判断字符像素的原理计算上次迭代后阈值条件下字符像素比例,找到最优比例对应的阈值Tk作为Kamel-Zhao二值化时参数Tk的取值。
3)Bernsen算法[6]
设W为估计出的最大笔画宽度,Bernsen算法考察以(x,y)点为中心的(2W 1)*(2W 1)窗口,以窗口内像素点的最大灰度值和最小灰度值二者的均值作为考察点(x,y)处的二值化阈值。与Kamel-Zhao算法相比,Bernsen算法的阈值由考察点邻域的灰度决定,不存在预定阈值,所以更具有实用价值。但Bernsen算法运算量大,且容易出现伪影现象和笔画断裂现象。针对此问题,文献[7]引入一个简单的整体阈值进行辅助判断,对算法得到的阈值曲面进行光滑处理并对局部窗口的极大、极小值进行考察,从而较好地避免了伪影及笔画断裂。
文献[5]中,针对Otsu算法、Bernsen算法、LEVBB算法、文献[3]的CASDA算法和文献[5]改进后的Kamel-Zhao算法等五种算法做了对比试验。从对比试验可以看出,上述几种方法中,CASDA算法和改进的Kamel-Zhao算法都有较好的二值化效果。
由于交通的发展,车牌识别的重要性更加突显。为改善车牌识别系统的性能,不少研究者仍在对车牌二值化算法做进一步研究。如文献[8]将遥感图像处理的方法引入车牌图像处理中,提出了一种限定阈值二值化改进算法。文献[9]提出了一种融合多级光照处理的二值化算法,能较好地克服不均匀光照对车牌图像二值化的干扰,使二值化图像字符更清晰。
本文将对CASDA(Cluster Algorithm Based on Spatial Distribution Analysis)算法再作进一步改进,使其能更好地适应光照不均、曝光不足、动态范围太窄和被污染的车牌图像,从而得到更好的二值化效果。