论文部分内容阅读
视觉是人类获取信息的主要手段,机器视觉检测模拟人类视觉对感兴趣目标进行感知识别。随着基于深度学习的视觉感知研究进入新的智能阶段,模拟人类脑智能的视觉识别是研究新方向。记忆学习是人类认知的高级功能,本文将研究模拟人类记忆学习的视觉感知模型完成运动的目标识别。动态目标图像的识别一直是研究的难点,本文将针对感知器高速运动时采集的图像及目标识别进行研究。研究表明图像的清晰是确保深度学习方法进行目标识别成功的关键,因此,图像尤其是动态图像在目标识别前进行去模糊很重要。本文首先从光学感知和图像生成的原理出发,分析运动感知模糊成因,构建高速运动成像模型;接着研究带记忆的深度学习方法识别复杂因素导致的图像模糊类型;再针对实际高速采集的图像进行去模糊;最后研究融合记忆的深度学习模型进行目标识别。具体研究工作依次从以下几个方面展开:1、分析高速成像模糊机理,构建图像感知器的运动成像模型及仿真系统。由于拍摄特定轨迹运动过程中,在曝光时间内感光传感器与被测物影像发生相对运动将导致图像模糊,尤其是在感知器高速运动采集时,这种运动模糊更为明显。因此在图像去模糊前分析模糊的成因是非常有必要的,通过模拟目标运动和相机运动成像轨迹的分析,将相机运动分解为平行于像平面和沿相机主光轴两个方向的运动,由此构建运动成像模型及运动图像仿真系统。2、提出一种带记忆的深度卷积网络(Deep Convolutional Neural Network,DCNN)模型进行图像模糊类型和参数的识别。CNN网络能提取空间特征信息,但存在梯度消失的问题;长短期记忆网络(Long Short Term Memory,LSTM)能解决递归网络训练过程中梯度消失问题,建模出感兴趣区域的上下文依赖关系,即时序信息。实验表明,DCNN的空间信息融合LSTM时序下的不同信息,比单纯采用其中一种网络的模糊类型识别准确率高。由此模拟人类带记忆学习的功能,构建出融合DCNN+LSTM的模糊类型及参数识别模型。3、提出一种基于图像列灰度概率一致性(Column Grayscale Probability Consistency,CGPC)的高速运动图像去模糊方法。首先通过两次傅立叶变换及信号累积变换求得准确的运动模糊核函数,然后进行反卷积运算,由于反卷积的病态问题,因此根据自然图像相邻列灰度具有概率一致性的特征,引入?置信目标优化对反卷积后的图像进行优化复原,最后针对图像边界信息导致的振铃现象提出预测边界块的方法。实验表明本方法处理高速运动图像的去模糊问题比现有方法的图像复原效果更佳。4、提出一种通过无参图像质量评价(Blind Image Spatial Quality Evaluator,BRISQUE)和优化去模糊图像的方法。现有图像去模糊方法的复原质量的评价大都基于有参考图像的质量评价指标,而实际的模糊图像是没有清晰的原图像,因此本文将基于无参考的图像质量评价指标再进行复原图像的优化,直到图像复原质量指标最优,则停止迭代,最后通过BRISQUE指标评价并优化获得最优复原图像。5、改进Faster R-CNN的方法进行高速运动目标图像的检测。实验表明,在针对高速运动目标检测时,Faster R-CNN的方法由于评分阈值单一会漏检一些小的目标,因此本文改进评分阈值标准,通过LSTM记忆网络对识别重复或漏检的目标进行再次的筛选,以获得准确的目标检测结果。实验结果表明,通过融合记忆网络的运动目标检测结果比现有目标检测方法较好的Faster R-CNN方法识别率更高。最后将理论研究结果应用到实际的图像目标识别中,分别应用在高速轨道缺陷检测系统及无人机巡检系统,评估结果表明即使在高速的运动下本算法也能识别出目标。本文构建的模型与提出的方法具有通用性,对未来更大范围的运动图像清晰化及运动目标识别研究具有积极的指导意义。