论文部分内容阅读
2018年,中国电子学会把胶囊网络列为人工智能的十大成长性技术之一。胶囊网络是一种全新的深度学习方法,由“深度学习之父”—Geoffrey Hinton于2017年10月提出。胶囊网络,这种新型神经网络结构的提出在机器学习领域引起了广泛的关注,未来有可能会对人工智能技术有革命性意义。胶囊网络中的胶囊由一组神经元组成,即把一组神经元向量化,用向量的长度表示一个实体或实体的一部分存在的概率,用向量的方向代表他们的各种实例化参数,比如位置、方向、大小、形变、速率、颜色等。向量能更好地表示出图像细节以及实体的空间相对关系,而这正是卷积神经网络所缺少的。不过由于这种新型网络在不同任务上的效果有待验证,目前胶囊网络的发展仍处于初级阶段。所以本文围绕胶囊网络,针对它的结构、识别速度、网络参数和图像识别等应用展开探讨。此外还借鉴了卷积神经网络的一些优化方法,综合改进了胶囊网络现存的一些不足,使其更为方便地运用在相关领域。具体研究有以下几个方面:1)胶囊网络的创新之一在于提出了矢量化的胶囊,它比传统神经网络的标量更能表达物体的姿态信息,能学习到更鲁棒的表征。本文通过可视化实验研究了胶囊内部的向量是如何影响实体的姿态的,证明了它是一个有发展潜力的方向。2)纵然胶囊网络在MNIST数据集已经达到了当前识别的最佳精度,但是在时尚服装图像数据集上表现不佳。本文针对胶囊网络的这一不足进行改进,讨论了它对较为复杂数据识别不准的原因,并且通过对特征提取和训练方法的改进,具体是借鉴Inception模块的思想并在重构层中引入批标准化。本文在服装类数据集测试得到了比原始模型更好的识别精度。另外为证明我们实验的有效性,我们亦在CIFAR10数据集进行验证,结果表明在参数量少于原始网络的情况下,其优于MNIST基线网络,而且比原始胶囊模型的准确率提高了大约10%。3)由于胶囊网络在彩色图像上的识别性能并不理想,并且大量的参数使其难以在实践中应用。基于这些观察,本文设计了识别效果更精确的胶囊网络,我们将其称为PdCaps。该网络由三个子网络组成。第一个是特征提取网络,本文设计了两个不同卷积核大小的卷积层。第二个是并行卷积与动态路由网络,我们将原始路由机制进行改进,提出了一种效率更高的网络。此外,并行卷积由两个不同尺寸卷积核执行以获得PrimaryCaps层。第三个是解码网络,解码层是为了起到正则化作用,避免胶囊网络过拟合。本文添加了转置卷积层,以减少该部分的参数,而不会影响模型的整体性能。然后,将PdCaps用于CIFAR10数据集的识别,不仅将准确率提高了12%以上,而且模型中的参数数量亦少于原始模型,识别速度得到提升。本文为设计更接近实际应用的胶囊网络提供了新的方向。本文对胶囊网络的网络模型、训练算法及其在图像识别的应用等方面进行了研究及改进,为胶囊网络在实际应用场景中的运用奠定了基础,同时也为胶囊网络以后的研究与发展提供了参考方向。