论文部分内容阅读
在大脑信息处理整合机制和多任务协同、注意、记忆机制的作用下,视觉系统具有超强的信息处理能力。受此启发,本文借鉴视觉皮层的信息加工方式,尝试对其模拟建模并应用于图像处理。首先,考虑到腹侧视通路的精细视觉与局部和整体视觉感知的脑机制,从局部和整体分离的角度出发,构建多路径卷积神经网络的轮廓感知模型;其次,模拟初级视皮层和高级视皮层之间信息处理特性,构建低级特征编码和高级语义编码分离的分级特征编码模型;最后,将分级特征编码模型应用于图像去雾和小样本识别任务。本文主要研究工作和成果如下:(1)提出一种多路径卷积神经网络的轮廓感知新方法。首先,利用高斯金字塔尺度分解获得表征视觉整体信息的低分辨率子图,通过2维高斯导函数获得描述细节特征的边界响应子图;其次,构建具有稀疏编码特性的子网络(Sparse-Net)实现对整体轮廓的快速检测,构建具有冗余度增强编码特性的子网络(Redundancy-Net)实现对局部细节特征提取;最后,通过像素对比度关系实现轮廓响应的整体感知和局部检测的融合,获取轮廓的精细化感知结果。以BSDS500图库为实验对象,在GTX1080Ti环境下,单独Sparse-Net对整体轮廓的检测速度达到42幅/s;Sparse-Net和Redundancy-Net融合后的检测指标数据集尺度上最优(ODS)、图片尺度上最优(OIS)、平均精度(AP)分别为0.806、0.824、0.846,优于其他对比方法。(2)提出一种轮廓特征和颜色特征融合编码的图像去雾新方法。首先,构建轮廓特征提取器,提取图像轮廓特征;其次,构建低级特征编码器,提取低级特征同时融入轮廓特征;然后,构建高级语义编码器,实现反向传播过程语义信息的深度解析;最后,融合低级特征编码与高级语义编码的输出,实现图像去雾。选用合成和自然的有雾图像作为实验对象,在合成图像的峰值信噪比(PSNR/d B)、结构相似度(SSIM)指标上,分别比暗通道先验(DCP)提高45.13%、1.91%;在自然图像中的平均梯度(AG)、信息熵(EY)指标上,分别比DCP提高了7.22%、12.70%。本文算法相较于其它去雾效果突出、鲁棒性强,且改善了颜色失真和光晕等问题。(3)将低级特征编码和高级语义编码模型应用于小样本识别。首先,利用分级编码模型做特征提取;然后,通过余弦距离度量模块计算测试样本和支持样本的相识度;最后,通过Top K机制筛选掉余弦相似矩阵的信息冗余。通过可视化方式,展现本文模型在识别任务中,各卷积核的具体作用,便于更加清晰的理解识别过程。在Mini Image Net数据集上和前人的算法做对比分析,5-way 1-shot、5-shot、10-shot的识别率分别为60.04%±0.97%、76.92%±0.55%、79.19%±0.33%,均优于其他算法。