论文部分内容阅读
本文主要研究的是深度学习中高度非凸非线性损失函数的优化问题,介绍了平滑网络并将其应用到如今非常火热的人脸识别技术中。平滑网络通过给网络加入噪声的方法来训练非凸的损失函数,继承了延拓法和退火法的主要思想,先训练较简单的凸的目标函数,再渐渐增加目标函数的复杂度直到最后训练原始的高度非凸非线性的目标函数。 本文首先介绍了平滑网络的构成,阐述了平滑子、弱梯度的概念以及通过加入噪声来对函数进行平滑的训练方法,随后引出了用于人脸识别的Siamese网络的对比损失函数,其通过距离来描述图像间的相似性。本文将平滑网络优化法用于对比损失函数的优化问题中,利用MUCT面部数据库中的人脸图片进行实证分析,通过交叉验证的方法对数据进行训练和测试,并将平滑网络方法与传统的Siamese网络的优化方法在损失函数、分类准确率以及ROC曲线这三个方面进行了学习效果对比,最终发现平滑网络优化法在高度非凸非线性损失函数的优化问题中更加高效可行,并且拥有更高的分类准确率。