论文部分内容阅读
图像是人类日常生活中接收和传递信息不可或缺的重要载体之一。具体成像时,由于多种因素的影响可能会造成图像质量下降,生成模糊图像。本文研究的图像去模糊技术的任务就是从模糊图像中恢复清晰图像。目前,该技术广泛应用于军事、安全监控、交通、天文等领域。本文以文本类模糊图像作为研究对象,在最大后验概率估计和神经网络的理论框架下,提出了全新的文本类图像盲去模糊算法。主要工作和成果如下:1、针对实验发现的文本类图像特殊先验,本文在边缘感知理论指导下,结合图像梯度L0范数稀疏模型和相对总变分(RTV,Relative Total Variation)模型,提出新的图像盲去模糊算法—L0-RTV。该模型在L0范数提取显著性图像边缘的同时,利用RTV项对纹理和边缘的精确区分防止弱边缘的丢失,从而提高模糊核估计的精度,使得去模糊图像更加真实、自然。为了评价本文的算法性能,将本文提出的L0-RTV模型与当前最具有代表性的几类盲去模糊算法分别在合成和真实的文本类图像实验集上进行比较。实验结果表明,本文所提模型能够估计出精确的模糊核,恢复的文本图像自然,且该算法鲁棒性好。2、本文在尝试利用现有深度学习网络模型处理模糊文本类图像时总结发现了更适用于本文实验对象的卷积神经网络模型—Deblur-ResNext模型,实现文本和车牌图像盲去模糊。该模型特点是在卷积层中引入改进的残差网络ResNext模块,并根据实验过程中具体需求,对残差模块结构与网络参数进行优化改进,实现加速模型训练的同时减少模型参数量。在合成的模糊实验数据集和真实模糊图像上,对本文提出的网络模型与当前两种代表性神经网络模型进行详细性能对比,证明本文所提Deblur-ResNext网络在文本和车牌类图像上具有优秀的去模糊能力,且模型收敛速度快。3、当前大多数基于深度学习的图像盲去模糊算法实现原理是利用网络学习训练集中图像分布规律,对测试集中模糊图像进行估计实现去模糊,因此训练集的样本量和数据分布对模型具有重要影响。本文的实验对象包含车牌和文本两类图像,同时获取对应清晰图像和模糊图像比较困难,因此本文在开始模型训练前通过人工合成模糊图像的方法实现数据增强,提升模型精度。合成模糊图像可分成三步:拍摄清晰图像;随机生成模糊核;卷积生成对应的模糊图像。实验时用于训练的车牌数据集分成两类,一部分源于现有的比赛数据库,另一部分是根据图像退化模型合成得到。