论文部分内容阅读
近年来,深度学习在人工智能和机器学习的基础上得到进一步的发展壮大,逐渐成为国内外众多知名学者和公司的研究热点和重点,并已经在学术研究和实际应用的多个领域中取得令人满意的结果。其中,深层神经网络的结构设计是深度学习中模型设计的基础问题,也是深层神经网络能否有效拟合复杂函数的重要影响因素。快速而有效地确定深层神经网络的结构对于深层模型的训练学习和泛化能力都起到了举足轻重的作用。然而,传统的结构设计方法存在很大的不足,容易造成网络规模过大或过小。目前对于如何确定深层神经网络结构的问题还没有得到很好的解决,还需要更加行之有效的方法完成结构设计的重要课题。针对现有网络结构设计方法的缺陷和不足,本文提出了逐层主成分分析方法、增长式逐层主成分分析方法和逐层主成分分析框架,用来解决深层感知器、深层自动编码器、深层信念网络和深层玻耳兹曼机的网络结构设计问题。本文的主要研究结果如下:1.提出了一种逐层主成分分析方法。在隐含层层数预先确定的情况下,该方法能够有效设计深层感知器的网络结构。在给定训练样本集、隐含层层数和累计贡献率的阈值时,逐层主成分分析方法可以根据不同训练样本的分布特点依次确定各层神经元的个数。其中具体设计过程为:首先,输入神经元个数等于训练数据的维数;然后,在适当控制信息损失的条件下,对训练样本进行主成分分析,保留的数据维度作为第一个隐含层神经元个数;其次,在确定其他隐含层神经元个数时,将上一次降维后的样本集经过非线性激活函数作用后,再进行主成分分析,根据保留的维度自适应地确定下一个隐含层神经元个数,逐层重复该操作直至预定的隐含层层数;最后,输出神经元个数等于训练数据的类别数目。2.提出了一种增长式逐层主成分分析方法。在隐含层层数预先未知的情况下,该方法能够有效设计深层感知器的网络结构。结合结构设计中增长法的思想,在某一范围内逐步调整隐含层层数(一般?10),然后利用逐层主成分分析方法确定不同层数下的网络结构。不同结构的网络经过充分的学习、训练后,利用验证集验证网络结构的优越性,输出实验结果较好的网络结构和训练参数。3.提出了一种逐层主成分分析框架。该框架能够根据不同数据集的分布特点和不同深层神经网络模型的结构特点,在有效控制信息损失的条件下,针对性地确定多种深层模型的网络结构,主要包括深层感知器、深层自动编码器、深层信念网络和深层玻耳兹曼机。实验结果表明,本文提出的方法和框架能够根据不同训练集的分布特点,快速而有效地确定深层模型的网络结构,大大减少深层模型的神经元个数和训练参数个数,很大程度上节约了网络的计算时间和收敛时间,明显降低了网络的训练难度。重要的是能够增强深层神经网络的特征提取能力、表达能力和泛化能力,为深层神经网络的进一步广泛应用打下坚实的基础。