论文部分内容阅读
图像目标识别是图像理解和计算机视觉领域的重要研究内容,以其广泛的应用需求,受到学者们的广泛关注。近年来,受到人类视觉系统研究的启示,人们提出了深度学习技术,并迅速成为热点。深度学习模型具有多层网络结构,可以有限克服传统图像目标识别方法存在的缺点,但是由于深度学习所学习出的特征是纯数据特征,不具有物理意义,所以深度学习普遍具有模型抽象,难以理解的特点。HMAX模型是一种四层次深度网络,可以实现对特定类的分类。它的结构与卷积神经网络相同,又因为Gabor函数的特性和人类视觉神经元细胞的感受野相似,所以被认为是一种加入了人类视觉系统先验信息的深度学习方法。本文主要研究深度学习技术,并具体对深度学习的HMAX模型进行研究改进。论文的主要工作和研究成果有:1、针对HMAX模型存在的生成卷积层耗时问题,研究了Gabor滤波器的方向特性,并提出了基于切向方向场的卷积层稀疏化方法。Gabor函数是具有方向选择性的,当图像边缘的切线方向与滤波器朝向平行时,滤波器将输出最大响应。基于此,在产生卷积层时,使滤波器只与切线方向与其朝向相同的像素滤波。实验证明,这样的操作在产生采样层时并不会丢失图像信息,而且能事半功倍。2、针对HMAX模型存在的采样层特征块冗余情况明显问题,研究了点特征提取技术,并提出了一种基于梯度场的可去冗余的SIFT特征点提取方法。HMAX模型的采样层特征块提取问题可以归结为特征点提取问题。根据SIFT伪特征点的特性,本文基于梯度场生成了一种周边掩膜,旨在剔除这些伪特征点。实验证明,该法提取得到的特征点更多的处在目标区域中,冗余比较小。3、针对HMAX模型输出特征矢量庞大的问题,研究了特征选择技术,并提出了一种基于Relief算法和SVM-RFE算法的特征选择新算法。其中,Relief算法和SVM-RFE算法是特征选择算法中常用的两种方法,算法的目的是为了能消去原有特征矢量中可能存在的冗余特征、不相关特征和噪声特征。实验证明,新算法有助于提高分类器的准确率,且比Relief算法和SVM-RFE算法更优秀。4、用改进前后的深度学习模型分别对Caltech101数据库进行识别,实验结果表明改进后的深度学习模型具有更佳效果。