论文部分内容阅读
卷积神经网络(Convolutional Neural Network,CNN)是深度学习中一个非常重要的方法,解决了很多复杂的模式识别难题。在图像识别,语音识别和自然语言处理方面取得了丰硕的成果。卷积神经网络相比传统模式识别方法的优点是它可以直接对输入图片像素作卷积操作,自动提取图像的特征,此方法与大脑的视觉系统处理机制类似。另外,相比传统神经网络,卷积神经网络中卷积的权值共享和稀疏连接以及池化操作极大地减少了训练参数数量,缩小了特征图大小,简化网络模型,提高训练效率。这篇论文详细介绍了卷积神经网络中卷积操作、池化操作、softmax分类器和网络优化算法。然后分别在手写数字集和人脸数据集上做了图像识别实验的研究。最后论文提出了局部二值模式和卷积神经网络相结合的方法作人脸识别的研究。具体的内容如下:1、根据手写数字集MNIST常用的LeNet-5网络结构,构造了不同结构的其他5个网络结构,分别研究卷积核数量、卷积核大小、dropout策略以及网络深度对实验结果的影响。通过实验发现,卷积核数量越多,识别效果越好。使用5 ×5的卷积核比使用3 × 3的卷积核识别效果好。全连接层后使用dropout策略比不使用dropout要好。结构越深的网络结构识别效果越好。2、由于人脸图片比较复杂,因此我们使用了更复杂的网络结构做实验。文中以centerloss这篇论文中提出的网络结构为基础,构造了不同的网络结构,分别研究了卷积核数量和特征提取维度对实验结果的影响。通过实验发现,卷积核数量越多,人脸识别率越高。特征维度越大,人脸识别率越高。3、因为卷积神经网络在提取人脸特征时忽略了人脸的局部结构特征,而提取人脸图像的局部二值模式恰好是局部特征,因此本文提出一种基于局部二值模式(LBP)和卷积神经网络的人脸识别方法。首先,提取人脸图片的LBP特征图像,然后把LBP图像与原RGB图像结合作为卷积神经网络的输入数据,接着使用梯度下降法训练网络参数,最后用训练得到的网络模型对人脸图片进行识别。通过实验可以发现,在卷积神经网络中加入LBP图像信息可以提高人脸识别的准确率。