面向序列数据建模的多尺度循环神经网络

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ZCHHZCHH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
循环神经网络(Recurrent Neural Networks,RNNs)是用于序列数据建模的著名模型,但学习序列数据中的多尺度依赖以及长期依赖对于循环神经网络来说是具有挑战性的。本文基于长短期记忆网络以及回声状态网络,提出了两种新型的多尺度循环神经网络,用于学习序列数据中的多尺度依赖以及长期依赖。1)一种新型的层次化多尺度循环神经网络——时间金字塔循环神经网络(Temporal Pyramid Recurrent Neural Networks,TP-RNNs):该模型的每一层内由多条时间上的跳跃连接串连起来的金字塔群结构可以高效地聚合输入序列的信息,并提供许多的梯度反向传播的短路径,从而有效地缓解了梯度消失问题,降低了模型学习长期依赖的难度。而层次化的网络结构则通过多个这样的层内金字塔群结构堆叠而成,其堆叠方式为将低层的层内金字塔群结构中产生的多尺度聚合状态序列作为高层的输入序列。通过这种方式,该模型不仅可以显式地学习多尺度依赖,还因为缩短了输入序列和梯度反向传播路径的长度而可以有效地学习长期依赖。实验结果证明TP-RNNs模型比起现有的RNNs模型可以更有效地学习序列数据中的多尺度依赖和长期依赖,并在多种序列数据分类任务上取得更好的表现。2)一种新型的结合卷积网络的多尺度回声状态网络——卷积多尺度回声状态网络(Convolutional Multiscale Echo State Networks,ConvMESNs):模型的多尺度记忆编码器由多个具有不同长度跳跃连接的储备池组成,可以有效地捕获序列数据中的多尺度动态,并产生一种多尺度回声状态表示。随后的卷积记忆学习器则由一层卷积层和一层全连接层构成,用于对多尺度回声状态表示中的多尺度特征进行学习和融合,应用于序列分类。此外,免训练的记忆编码器和浅层的记忆学习器使得该模型具有计算高效性。实验结果证明ConvMESNs模型相比现有的序列分类方法可以在多个序列分类任务上取得更好的表现,并能高效地学习序列数据中的多尺度依赖。
其他文献
从"五体痹"理论对颈椎病辨证分型,按"邪之所处"分为皮痹、肉痹、筋痹、骨痹、脉痹5种类型,并提出"皮痹宜宣散皮络以通经""肉痹宜疏通肌肉以止痛""筋痹宜松解经筋以解痉""骨痹宜正骨整脊
为了解决我国中西部地区农村生活污水粗放型排放问题,本文将传统化粪池技术植入到ABR技术中,为西北地区农村污水治理改造出一套处理工艺——新型ABR化粪池系统。为增强系统的
以四甲基铵硅酸盐为柱化剂,考察了超声作用对MCM-36分子筛合成的影响.结果表明,超声处理显著缩短了柱化剂进入已撑开的MCM-22(P)层间的插层过程的时间.通过控制插层过程的超
本文通过优化后的Hummers法制备氧化石墨,通过水热法和水浴法分别制备了MoS2/GO等复合物,以MoS2/GO等复合物为载体,加入微量Pt,研究了析氢性能,发现其性能良好,这主要是因为M
期刊
<正>习近平总书记在中央党校(国家行政学院)中青年干部培训班开班式上发表重要讲话强调:"我们面临的各种斗争不是短期的而是长期的,至少要伴随我们实现第二个百年奋斗目标全
普通电子秤在我们日常生产和生活中已普及,然而,它不方便视弱人群使用。为解决普通电子秤带来的不便问题,设计了语音电子秤。该电子秤主要由THGWM51单片机来控制,使用称重传
利用水平喷出的细水柱可直观地显示平抛运动轨迹,实验简单,可操作性强.现有的模拟实验通常忽略了空气阻力和粘滞力对水柱模拟平抛运动中的影响.在分析空气阻力和粘滞力理论的
我国南方喀斯特地貌分区是世界上喀斯特地貌分布最集中的区域之一,广西更是以喀斯特地貌风景而闻名,对于南亚热带喀斯特植物的研究对于喀斯特地区的水土流失、石漠化防治研究
校园文化是学校在长期发展过程中逐渐形成的、为学校所特有的精神环境和文化形态。临沂大学立足于临沂红色资源优势,构建具有沂蒙红色文化特色的校园文化,努力培养具有沂蒙精