论文部分内容阅读
随着多媒体技术、网络技术以及存储技术的快速发展,各个行业对图像资料的运用越来越多,人们接触到的数字图像来源不断扩大,因此如何从大规模的图集中选取有用的图像已经成为当今一个亟需解决的课题。传统的图像分类方式大致包含两个步骤:特征提取和分类算法。提取图像特征是图像分类识别的重要基础,图像特征的表示也在某种程度上影响图像分类的效果。在提取图像特征之后,需要用分类算法对其进行分类。目前不断涌现出新的图像处理技术和分类方法,如深度学习。卷积神经网络(Convolutional Neural Networks,CNN)是深度学习中的新型神经网络,已经被广泛应用到多种图像处理任务中。CNN在一些图像分类任务中取得了很好的效果,但仍存在模型分类能力不强、训练样本较少时准确率不高和收敛较慢等问题。针对这些问题,本文提出以下两种改进的卷积神经网络算法模型。具体研究内容如下:(1)提出了一种改进激活函数的卷积神经网络。主要改进是将LReLU函数和Softplus函数结合,提出新的LReLU-Softplus激活函数。LReLU函数缺乏光滑性,导致模型的平均性能较差;Softplus函数具有输出偏移问题,这会影响网络的收敛性。改进后的激活函数在小于0的部分继承了 LReLU函数的优点,解决了数值偏移和神经元死亡问题;在大于0的部分继承了 Softplus函数的光滑性。因此,本文提出改进的LReLU-Softplus激活函数,使新的激活函数具有LReLU和Softplus的优点,同时避免了两者的缺点。从而提高模型的分类能力。(2)提出一种改进Fisher准则的卷积神经网络模型。主要改进是使用新的类间散布矩阵,将其定义为两类样本经投影后的平方均值之差的绝对值,以此改进Fisher准则,再利用改进后的Fisher准则来改进CNN的代价函数。Fisher准则的思想是寻找一个最优投影轴,使两种类别的样本在该轴的投影区间距离最大,因此能够获得最优的分类效果。然而Fisher准则存在一个缺点是“秩限制”问题,它所获得的判别信息的个数受到类别个数的限制,这影响了识别的性能。本文通过对Fisher准则的改进来缓解“秩限制”问题,并通过对CNN代价函数的修改,构建基于改进Fisher准则的卷积神经网络模型,从而达到训练样本较少时提高CNN的分类识别率和使模型快速收敛的目的。(3)本文所提的两个方法分别在女装商品图像库、Mnist手写数字库、ImageNet图像库以及Oxford flowers图像库上进行了实验验证。在实验中,改进的LReLU-Softplus激活函数分别与Sigrmoid、Tanh、ReLU、LReLU以及Softplus函数进行验证对比;基于改进Fisher准则的CNN算法(IFCNN)分别与CNN、SAE、FCNN算法进行验证对比。实验结果表明,改进后的方法是有效的和可行的。