论文部分内容阅读
目标检测,作为计算机视觉研究中的一项基础而又富有挑战性的工作,其研究目的主要是从视频或是静态图像中定位并检测出预先设定好的某一类或某几类目标物体。如今,目标检测方法已被广泛应用在智能监控系统、军事侦察及医学导航手术等各大领域,并有着广阔的发展前景。本文重点研究了一种基于通用对象估计(Objectness)的目标检测技术,通过对二值化赋范梯度算法(Binarized Normed Gradients,BING)及区域卷积神经网络(Region-based Convolution Nueral Networks,R-CNN)的研究分析,提出了一种基于改进后BING算法并结合R-CNN的目标检测框架。另外,本文还针对一类特殊的目标——模糊车牌的识别问题进行了研究,并提出了一种基于字典对学习(Dictionary Pair Learning,DPL)的模糊车牌识别及打分系统。本文的主要工作及研究成果包括以下三方面:(1)提出一种改进的基于BING算法的通用对象估计方法:DGB-BING方法(Difference of Gaussians and Boosting based Binarized Normed Gradients)。该方法对BING算法的改进主要体现在两方面:特征和模型。在特征上,采用高斯差分算子对样本图像进行增强,提高物体边缘轮廓的可见性,从而改善原始算法中梯度特征存在判别能力不足的问题。在模型上,根据提升思想,组合不同的特征学习模型,最终形成一个强分类器。(2)提出一种基于改进的DGB-BING方法和R-CNN的目标检测框架。在该框架中,主要包含两点贡献:1)在以DGB-BING算法为框架基础的候选窗口生成阶段,利用卷积神经网络自动学习卷积核参数,提取图像特征,从而解决了DGB-BING算法中高斯差分参数选择困难的问题;2)提出一种基于加权热点图的候选窗口弥补办法,进一步改善了候选窗口的物体定位能力。(3)实现一个基于DPL算法的模糊车牌识别及打分系统。该系统具有三个特点:首先,在字符分割阶段,提出一种平均分割加偏移的策略,获得单个字符的多个待识别位置;其次,针对各个待识别位置利用DPL算法进行字符识别后,对单个字符的一系列识别字符进行可靠性衡量,定义其置信度及平均偏移量;最后,对车牌中所有字符的各识别结果进行联合打分,根据“偏移一致性”原则,得到车牌的最终识别结果及各字符的置信度。