基于受限玻尔兹曼机的深度学习模型及其应用

来源 :电子科技大学 | 被引量 : 42次 | 上传用户:qncy1235p
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习是一种新式的多层神经网络模型,拥有强大的表示能力,用途广泛,引起了机器学习界普遍的关注。受限玻尔兹曼机(Restricted Boltzmann Machines,RBM)是一类基于概率的随机神经网络模型,具备两层结构,满足层间全连接,层内无连接,可以有效地提取特征,也可以用来预训练传统的前馈神经网络,明显地提高网络的判别能力,如果堆叠多个RBM形成的深度置信网络(Deep Belief Network,DBN),则能抽取到更抽象的特征。鉴于RBM的优势,本文基于RBM的基本模型,从公式推导、算法、参数设置以及收敛性理论等基本内容展开,重点研究的工作包括以下几个方面:1.在RBM模型的基础上,研究了两种不同的稀疏RBM模型:Sp RBM与Log Sum RBM,并结合Polyak Averaging在随机梯度下降时加速收敛的优势,对稀疏RBM模型的学习算法作了改进,从平均重构误差和算法复杂度方面分析了算法改进之后模型求解结果之间的差异与优势。2.借鉴RBM的两种评估策略(重构误差法和退火式重要性采样法),将其应用到Sp RBM与Log Sum RBM模型的评估中,实验详细验证了评估的可行性与效率,从评估的角度表明了Log Sum RBM模型比Sp RBM模型更优。3.研究了DBN网络的层数对模型性能的影响,确定了模型达到最优时的层数(4层),依次构建了4层与5层非线性深度网络,使用基于RBM的不同深度网络模型3DBN、3Sp DBN、3Log Sum DBN以及4DBN、4Sp DBN、4Log Sum DBN分别作为4层网络与5层网络的预训练,并在MNIST和UCI数据集上进行了分类、识别,经过实验对比,表明了基于Polyak Averaging策略求解的Log Sum DBN模型是最优的模型,具有更好的稀疏特征表征能力和判别能力。这与上述评估结果不谋而合。
其他文献
目的观察过表达CXCR型驱化因子受体4(CXCR4)基因对大鼠脂肪源性干细胞(ADSCs)归巢修复压力性尿失禁的影响。方法30只产后清洁级雌性大鼠行阴道球囊扩张后进行双侧卵巢切除术
文章根据辽中城市群空间结构特征,对城市群空间结构演化的产业机理进行分析,认为产业的关联效应、转移效应和集聚效应催生了辽中城市群空间格局。
采用碱催化法裂解热硫化硅橡胶生胶生产中的废胶并对裂解料进行二次精馏 ,去除高、低沸物杂质 ,使回收的混合环体可再次用于合成热硫化硅橡胶。
如何能够让分包商满足主承包商的施工需求、施工进度,这就需要主承包商运用一套行之有效的管理体系去指导、监控分包商,这其中就包括了经济因素、法律因素、施工技术等各个方面
目的探讨不同剂量阿司匹林对大鼠股骨钛合金种植体早期骨整合的影响,为临床使用阿司匹林患者的牙种植提供参考。方法48只8周龄SD雄性大鼠随机分为对照组和实验组(A、B、C组),