论文部分内容阅读
近年来,我国处于经济社会高速发展期,国内安全形势严峻。国家投入大量资金打造平安城市视频监控工程,建立了较为完善的视频监控体系。车牌是监控视频中较为有价值的观测目标,由于监控摄像头摄距较远和监控视频的压缩处理,导致监控视频画质变差,无法直接通过肉眼看清车牌。针对该问题使用超分辨率和识别技术提升压缩监控视频中车牌的清晰度并识别出车牌中的有效信息,该技术可以应用于刑事侦查和交通肇事等领域。论文阐述了压缩监控视频中车牌超分辨率和识别技术的研究背景和意义,总结了相关技术的研究现状,并介绍了解决压缩监控视频中车牌超分辨率和识别技术所需采用的重要技术和方法。当目标运动幅度过大时直接使用光流法对压缩监控视频中车牌进行配准会使得配准精度低;针对该问题提出了基于深度学习的车脸检测、跟踪算法及配准算法,逐步由粗到精地提取配准车牌;针对车脸检测制作了相配套的训练库,使用Faster R-CNN检测车脸区域,通过利用颜色特征对车牌兴趣点检测,并使用轨迹拟合和Kalman滤波等算法优化车牌兴趣点坐标,利用光流法进行配准并使用颜色特征精细化提取车牌区域;结合实验结果对算法有效性与鲁棒性进行了分析,实验结果证明了该算法确实有效而且配准速度比直接使用光流法要快得多。论文分析了经典超分辨率、去量化失真卷积神经网络模型,提出了超分辨率、去量化失真统一处理卷积神经网络模型,使用该模型解决压缩监控视频中车牌的超分辨率和去量化失真问题。制作了相配套的字符训练库,使用提出的统一处理卷积神经网络模型进行训练。为了提升模型深度使用了深度残差网络,为了利用字符的先验信息引入了梯度先验。实验证明本文提出的超分辨率、去量化失真统一网络确实有助于字符的复原,效果上比其他该领域较为先进的算法要好,所提出的梯度先验确实有利于字符的重建;考虑到压缩率较高时无法通过超分辨率、去量化失真手段对字符进行复原的情况,本文提出了基于生成对抗网络的多帧压缩降质车牌重建、识别算法,将字符重建和识别统一到同一网络,弥补了高压缩率下字符无法很好复原重建的缺点。该算法使用第三章提出的超分辨率网络模型做为生成网络,还提出了适用于该算法的判别网络;考虑到字符的特征较少、类别较少对VGG网络进行修改,提出了适用于字符识别的识别网络。实验证明该算法确实能够在一定程度上成功重建容易混淆的字符,视觉效果上优于超分辨率、去量化失真模型统一处理算法。而字符识别确实弥补了高压缩情况下字符重建效果差的缺点,实验证实了该识别手段确实具有一定的作用而且能正确识别实际高压缩车牌中一定位数的字符。