深层学习的研究及应用

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:waterhunter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深层神经网络是一种高变度的函数(highly-varying function),与许多经典的浅层结构算法相比,以深层神经网络为代表的深层结构有很多优点,近年来引起了极大的关注,并且在逐步在分类问题、回归问题以及降维等问题上得到了成功的应用。但深层结构的训练是一个非常困难的问题,一直没有很好的解决方案。之前的研究是用随机的初始化和基于梯度的优化方法进行训练,这种训练方法对于含有较少隐含层的神经网络效果比较好,但是对于含有更多隐含层的神经网络结果很差。直到2006年,多伦多大学的Hinton等人提出了深层信念网络(DeepBelief Networks,DBN),为深层结构训练难题提供了一个很好的解决方案。  DBN是以受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)为训练组成模块的,而对于RBM的训练,我们又会用到对比发散算法(Contrastive Divergence,CD-n)。对比发散算法是一种基于随机梯度下降的算法。对于DBN的研究目前仍有许多细节问题,如构建深层结构时需要构建几层网络合适,每个隐含层内单元数的确定等等问题,需要我们进一步了解和应用,确定这些参数取什么值合适,以及它们的取值对实验结果的影响。  本文的具体工作如下:  (1)目前研究DBN算法,它的训练策略是贪婪逐层无监督算法,把它每一层当作一个RBM来做训练,即RBM是DBN的组成模块,而对于每个RBM的训练过程,又是基于梯度下降算法,目前主要是CD-n算法,我们要做的是确定这个n值的选取。  (2)深层神经网络包含两层或两层以上的隐含层,这些隐含层的数目的选取是我们要研究的一个问题。这个值的选取怎样对深层神经网络的训练和分类等问题有利,是我们要获取的重要信息。  (3)除了上面两个主要问题,我们还考虑了在训练过程中,其他参数值的选取问题,比如说学习率的选取、每层内单元数选取对训练的影响等等。
其他文献
学位
传统的信息安全系统主要防止外部的入侵攻击,与现在信息安全主要来自内部的威胁的实际不相符。随着信息安全系统的发展,产生了可信计算。可信计算是为了从根源上防止各种安全隐
信息化是当今世界发展的大趋势,是推动经济社会变革的重要力量,以信息科学为指导,以信息技术为工具,实现了农业信息化的快速发展。全面推进农业信息服务,是繁荣农村经济、加快现代
如何在互联网的海量信息中找到自己所需要的信息已经成为困扰人们的主要问题。元搜索引擎可以综合多个搜索引擎的查询结果,因而提高了搜索的覆盖率,但同时也带来了一些问题。元
全过程计算机辅助动画自动生成技术是将人工智能理论引入到动画制作领域而产生的技术,20世纪90年代由中科院陆汝钤院士提出。全过程计算机辅助手机3D动画自动生成系统(简称手
随着PaaS逐步兴起,以及DevOps和自动化运维的快速发展,基于Docker的容器虚拟化环境成为业务系统的主流部署运行环境之一。Docker生态体系仍然面临着诸多挑战,其中容器镜像的构建
近年来,互联网和移动通信技术得到快速发展与广泛普及,越来越多的虚拟社会形态相继出现,比如以Facebook,Twitter,新浪微博等为代表的大型在线社交网络网站,通过手机通信、电子邮件
当前临床医生进行疾病诊治的主要方法是依靠自身的专业知识和诊疗经验,并借助医学检查器械进行辅助检查,缺少有效的辅助方法。一名专业的临床医生往往要经过长时间的知识储备和
随着信息技术的不断发展和计算机网络的广泛普及,使得人们对信息安全的重视越来越高。而目前针对信息的保护主要基于系统的安全和网络的安全。本文主要是针对系统设计的安全进
为了解决传统BIOS所面临的问题,Intel推出了统一可扩展固件接口(UEFI)的规范标准,定义了操作系统与平台固件之间的可扩展接口。目前,UEFI BIOS凭借自身的模块化、易扩展、预启动