论文部分内容阅读
近年来,深度学习在计算机视觉领域的快速发展,以及人工智能技术的进步,使得深度学习成为人工智能领域的热点方向。其中,卷积神经网络是深度学习模型算法中最成功的算法之一,它具有权值共享,稀疏连接,网络结构更类似于生物神经网络等优点。本文通过对卷积神经网络算法在图像分类上的应用研究,对模型进行优化和改进,在深度学习框架(Caffe、Keras)上构建卷积神经网络模型,并在相关公开数据集上验证其方法的有效性。论文主要从参数优化和模型改进两个方面对卷积神经网络进行相关研究。(1)参数优化针对卷积神经网络的卷积核大小、池化方式和大小、卷积层数等优化策略,本文在深度学习框架Caffe中构造Brief-Net模型。该模型同AelxNet,CaffeNet相比采用较小的首层卷积核,并且结构更加精简,在相关图像数据集上的实验结果表明,本文优化的Brief-Net具有更高的图像分类正确率。除此之外,本文还通过实验验证Brief-Net模型的首层卷积核最优大小为9。(2)模型改进传统的卷积神经网络(CNN)通常会丢弃负值特征信息,针对CNN更好地学习图像特征的问题,对传统的CNN模型进行改进,提出Supplement CNN模型,该模型将卷积层取反之后同原卷积层一起作用Leaky ReLU激活函数,然后传递至下一层,增加前向传播的特征信息,影响反向传播算法的权值更新,以有利于图像的分类,同传统的卷积神经网络实验比较,该模型是有效的。在Cifar-10、Cats vs dogs和Flower dataset数据集上的实验结果表明,本文提出的Supplement CNN的正确率均高于Classical CNN和2x Classical CNN。此外,本文分析了卷积层数变化对于模型正确率的影响,在Cifar-10、Cats vs dogs两个数据集上的实验结果表明,本文提出的Supplement CNN相比Classical CNN稳定性更好,并随卷积层的增加,最大正确率和平均正确率依次递增。