深层神经网络的结构设计方法研究

来源 :北京工业大学 | 被引量 : 7次 | 上传用户:kissface
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习在人工智能和机器学习的基础上得到进一步的发展壮大,逐渐成为国内外众多知名学者和公司的研究热点和重点,并已经在学术研究和实际应用的多个领域中取得令人满意的结果。其中,深层神经网络的结构设计是深度学习中模型设计的基础问题,也是深层神经网络能否有效拟合复杂函数的重要影响因素。快速而有效地确定深层神经网络的结构对于深层模型的训练学习和泛化能力都起到了举足轻重的作用。然而,传统的结构设计方法存在很大的不足,容易造成网络规模过大或过小。目前对于如何确定深层神经网络结构的问题还没有得到很好的解决,还需要更加行之有效的方法完成结构设计的重要课题。针对现有网络结构设计方法的缺陷和不足,本文提出了逐层主成分分析方法、增长式逐层主成分分析方法和逐层主成分分析框架,用来解决深层感知器、深层自动编码器、深层信念网络和深层玻耳兹曼机的网络结构设计问题。本文的主要研究结果如下:1.提出了一种逐层主成分分析方法。在隐含层层数预先确定的情况下,该方法能够有效设计深层感知器的网络结构。在给定训练样本集、隐含层层数和累计贡献率的阈值时,逐层主成分分析方法可以根据不同训练样本的分布特点依次确定各层神经元的个数。其中具体设计过程为:首先,输入神经元个数等于训练数据的维数;然后,在适当控制信息损失的条件下,对训练样本进行主成分分析,保留的数据维度作为第一个隐含层神经元个数;其次,在确定其他隐含层神经元个数时,将上一次降维后的样本集经过非线性激活函数作用后,再进行主成分分析,根据保留的维度自适应地确定下一个隐含层神经元个数,逐层重复该操作直至预定的隐含层层数;最后,输出神经元个数等于训练数据的类别数目。2.提出了一种增长式逐层主成分分析方法。在隐含层层数预先未知的情况下,该方法能够有效设计深层感知器的网络结构。结合结构设计中增长法的思想,在某一范围内逐步调整隐含层层数(一般?10),然后利用逐层主成分分析方法确定不同层数下的网络结构。不同结构的网络经过充分的学习、训练后,利用验证集验证网络结构的优越性,输出实验结果较好的网络结构和训练参数。3.提出了一种逐层主成分分析框架。该框架能够根据不同数据集的分布特点和不同深层神经网络模型的结构特点,在有效控制信息损失的条件下,针对性地确定多种深层模型的网络结构,主要包括深层感知器、深层自动编码器、深层信念网络和深层玻耳兹曼机。实验结果表明,本文提出的方法和框架能够根据不同训练集的分布特点,快速而有效地确定深层模型的网络结构,大大减少深层模型的神经元个数和训练参数个数,很大程度上节约了网络的计算时间和收敛时间,明显降低了网络的训练难度。重要的是能够增强深层神经网络的特征提取能力、表达能力和泛化能力,为深层神经网络的进一步广泛应用打下坚实的基础。
其他文献
设计出一种输出电流为300 mA且具有微功耗超低压差低噪声性能的单片CMOS线性稳压器,对其电路结构及工作原理进行了分析并给出各子电路模块的设计.该稳压器具有过流过热保护,
双打防守战术的运用是我方运动员处于被动情况下,行的一种有组织有目的的战术行动。
工程量清单报价是国际上普遍采用的工程招投标方式,建设工程全面实行工程量清单报价已是大势所趋。本文系统的介绍了工程量清单报价的组成及作用;详细的论述了进一步做好工程
<达洛维夫人>是弗吉尼亚&#183;伍尔夫实验各种独特的写作技巧的首次成功尝试.伍尔夫运用生花妙笔向人们展示了时间、存在与心灵的交互关系,正是她独具匠心的艺术构思给予了<
为了提高插胃管的成功率,本人查阅了有关资料并结合临床经验,对胃管插管方法进行总结,现综述如下.
因"键盘依赖症"而导致的"提笔忘字"成了普遍现象,倘如此下去,国人的书写能力很容易退化,这是滋生"新文盲"的渊薮。对此我们应有一种文化忧患意识,用智慧和行动去激活文化遗产
宋代的进奏院报又称朝报、邸报,是由进奏院发布的。学界对宋代的进奏院报和邸报是否是同一事物存在争议,实际上二者就是同一事物,只是称呼有所不同。
将配方优化设计的方法应用到生产用透明熔块和用熔块釉的配方设计和配方调整上,关键在于杜绝或减少釉中的液相分相现象,研究了一些氧化物对熔块和熔块釉的透明度,光泽度和熔融温
本文针对20多年来我国关于公众科学素质的测定和科学普及的目标设定所涉及的有关问题,结合国内外的相关调查和理论观点进行了讨论分析。指出国内科学素质测定标准本身存在的问
企业网络组织是一种介于企业与市场之间的中间性经济组织,其表现形式多种多样。但是,它在稳定性、合作范围和对外部干扰的适应性这几个方面都与威廉姆森所谓的“三方规制”和“