论文部分内容阅读
随着大数据时代的到来与计算能力的提升,深度学习算法如虎添翼。其通过建立一种模拟人脑神经结构的模型并经历海量训练数据来学习到更有用的特征,从而得到优秀的算法结果。在传统机器学习算法中,大多数处理更依赖于人工的特征提取,针对特定简单任务时会有效但并不能通用。而深度学习算法以其学习能力强,适应性强且上限高的特点更受青睐。近年来随着汽车数量的日益增多,交通压力骤然增大,完善车牌识别系统迫在眉睫。但是汽车总是处于运动的状态,运动模糊是必然存在的,它的产生会影响后续一系列操作,且车牌定位在整个车牌识别系统中占据着重要的地位。因此围绕上述问题,本文使用深度学习算法作为手段,具体研究内容如下:1.首先针对去除运动模糊进行了研究。对汽车进行拍照时发生运动模糊是不可避免的,而运动模糊属于典型的图像退化问题,严重影响了图像的质量,如何有效去除运动模糊是一个具有实际意义的问题。在传统算法中,受限制于特定的场景且实施起来难度较大。因为生成对抗网络在图像生成任务中的优秀能力,所以本文设计了一种基于生成对抗网络的多尺度盲去除运动模糊算法。该算法利用了多尺度特征模块,增强了每个网络层的感受野范围,并以更细粒度的水平上整合多尺度特征,增强了网络的感知能力。此外算法为得到更好的结构与细节特征,采用了多种损失函数结合的方式,感知损失和MSE损失技术的加入使得算法有效的提高了图像的恢复质量。最后该算法采用了Wasserstein距离来测量数据的分布来提高整个系统的稳定性,有效的解决了生成对抗网络训练不易收敛的问题。本文采用了Gopro数据集作为验证,该算法不仅在评价指标上有较大提升,在主观视觉效果上也有很好的体现。2.其次本文针对车牌定位进行了研究。随着社会的发展,车辆的增多使得交通的压力骤然增大,因此一个优秀的车牌定位系统将会有效减轻这个压力。现在的车牌检测系统虽然已经普及,但大多数传统算法仅在特定环境的强假设条件下进行检测,所以一个适应性更广且高效的算法更能适应现实的环境。为此本文提出了一种基于yolov3的车牌定位算法。本文算法首先使用了K-means算法对车牌数据进行聚类,其目的是为了获得更准确地候选框大小。其次针对现阶段各类图像尺寸较大的问题,算法更改了原始yolov3的网络结构,增加了卷积层使得输入的尺寸扩大了一倍并且在最后预测中加入了更多尺度融合的方法,使得预测结果得到提升。在实验中,针对中国车牌的数据集几乎没有且开源的较少的情况,本文采用了自己收集的数据集,其中包含有6668张含有车牌的图片。此数据集含有倾斜、过亮、过暗、雨雪天气、模糊等多种情况下的车牌。数据集的多样性保证了本文所提出系统对不同情况下车牌定位的稳定性。在本文数据集的实验中,提出的算法比原始模型得到了更好的评价指标。但是在针对难以识别的车牌检测时,网络的性能并不好,主要是因为在训练时难以识别的车牌数据较少,导致网络只能学习到一些普通车牌的检测,基于此本文采取了Faster-Rcnn算法进行了难以识别的车牌检测。重新从数据集中挑选了200张难以识别的车牌数据,并将算法特征提取网络改为了Resnet50,实现了对难以识别的车牌检测。本文所提出算法,在网络结构和训练算法上进行了研究与改进,针对数据不足的问题也创建了自己的数据集,并将其应用到实验中,为以后的算法研究与发展提供了一定的思路与方向。