浅析循环神经网络的研究进展

来源 :科学导报·科学工程与电力 | 被引量 : 0次 | 上传用户:qvwen2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘  要】现如今循环神经网络(recurrent neural network,RNN)已经成为一种动态处理时间序列数据的高效的神经网络工具。循环神经网络(RNNs)能够从时间序列数据中学习特征和长期依赖关系。循环神经网络几乎可以对任何动态系统进行建模,但是训练过程中极易出现长程依赖的问题。本文介绍了循环神经网络在深度学习领域的基本原理和最新进展,并且分析了今后的研究挑战。
  【关键词】循环神经网络;动态系统;深度学习;
  RNN的提出与发展
  人工神经网络(ANNs)是由被称为人工神经元的连接单元层构成的,其中浅层网络是指一个输入层,一个输出层,最多一个隐含层,没有重复连接的人工神经网络。随着层数的增加,网络的复杂度也随之增加,更多的层数或重复连接通常会增加网络的深度,并使其能够提供不同层次的数据表示和特征提取,这称为深度学习。由于各层的非线性组成所造成的优化困难,在2006年之前,深度网络体系结构方面的工作并不多[1]。而具有循环连接的神经网络被称为循环神经网络(RNNs),它能够对序列数据建模以进行序列识别和预测[2]。RNNs使用隐藏状态在时间维度上对数据信息进行保存和更新,这种结构使RNNs能够长时间存储、记忆和处理过去的复杂信息。基于RNNs的文献中已经发表了大量的论文,从架构涉及到应用发展。表1汇总了RNNs随着时间发展的主要研究进展。
  梯度下降算法的发展给RNNs的研究提供了助力,但是RNNs的模型结构导致梯度消失或者爆炸的问题无法避免。为了解决上述问题,带有特殊门控机制的LSTM网络于1997年被提出[3]。到目前为止,已经有超过1000篇关于LSTM和其变体的研究论文发表,其中,900篇是在2015年后发表的。
  RNN和其主要变体
  循环神经网络(RNN)
  RNN是前馈神经网络的一种,它通过包含跨越相邻时间步的有向边来增强单元计算,从而在模型中加入了时间的概念。在时刻t,模型的输入为xt,前一个时刻的隐藏状态为ht-1
  则RNN的公式可以定义为:
  ht = tanh(Whht-1 + Wxxt + b)
  其中WhWx和b是可训练的权重参数,可通过BPTT(backpropagation through time)算法进行更新。
  长短时记忆网络(LSTM)
  LSTM是一种带有三个门控函数的特殊RNN变体,成功的解决了RNN的梯度消失爆炸问题,并且在传统的机器学习深度学习领域广泛应用。LSTM定义如下:
  it =        sigmoid(Wxixt + Whiht-1 + bi
  ft =        sigmoid(Wxfxt + Whfht-1 + bf
  ot =        sigmoid(Wxoxt + Whoht-1 + bo
  ct= tanh(Wxgxt + Whght-1 + bg
  ct = ftΘct-1 + itΘct
  ht = otΘtanh(ct
  RNN应用方向
  RNN主要应用于自然语言处理领域中,比如语言模型任务。LSTM的提出改进了用于语言建模的RNN模型,因为LSTM能够更好地学習序列中的长期依赖关系,而不是简单的隐藏状态。RNN还被应用如生成文学作品如诗词,歌词等。此外,RNN还在文档分类中表现优秀,如GRU被用来进行文档级情绪分析,RCNNs被用于多个数据集的文本分类。在这种方法中,通常将单词映射到一个特征向量,然后将特征向量序列作为输入传递给RNN模型。
  在语音信号识别领域中,语音和音频信号会随着时间不断变化,音频信号固有的时序性和时变特性使RNNs成为该领域学习特征的理想模型。在图像识别领域中,虽然CNN在计算机视觉和图像处理方面的应用占主导地位,但RNNs在图像标记、图像建模和手写识别等方面也显示出良好的前景。
  参考文献:
  [1]Bengio Y,Boulanger-Lewandowski N,Pascanu R.Advances in optimizing recurrent networks[C]//2013 IEEE International Conference on Acoustics,Speech and Signal Processing.IEEE,2013:8624-8628.
  [2] Bengio Y,Simard P,Frasconi P.Learning long-term dependencies with gradient descent is difficult[J].IEEE transactions on neural networks,1994,5(2):157-166.
  [3] Hochreiter S,Schmidhuber J.Long short-term memory[J].Neural computation,1997,9(8):1735-1780.
  作者简介:
  刘昌健(1994-),河北沧州人,宁夏大学硕士研究生在读,主要研究深度学习、自然语言处理方向。
  (作者单位:宁夏大学信息工程学院)
其他文献
【摘 要】在汽机负荷0~100%Pn范围内,除氧器水位要求维持在水箱中心线以上300mm。由两个凝结水流量调节阀CEX026VL与CEX025VL进行控制。除氧器的压力随汽轮机的功率升高而增大,采取滑压运行的方式进行压力控制。在低负荷下,除氧器接收的来自高压加热器的疏水、APG再生式热交换器回流水、二回路给水、汽轮机抽汽等各类工质,汽机低负荷工况下,这些工质引入的热量会对除氧器的压力和温度造成影响
期刊
【摘 要】结合实例介绍了C++11中模板的语法规则,包括函数模板、类模板以及函数和类模板的特化,随后对模板在元编程领域进行了讨论,并总结了元编程的优缺点。  【关键词】C++;元编程;程序设计;  引言  C++模板是支持参数化多态的工具,标准库中如std::vector,std::list等都是模板,可以支持多种类型,用来实现代码的复用。C++中模板分为两类:函数(function)模板和类(c
期刊
【摘要】在科学技术迅猛发展的时代下,社会对电能的需求无论是在质方面还是量方面都在逐步增加,因此我国电网的建设工作越来越复杂。在实际工作中为做好用电计量和电能管理工作,在必要的时候需要借助远程监控技术来提高电网的质量和安全。因此,本文对电力营销中远程用电检查技术现状做一下简要的分析,并对远程用电关键技术的设计和应用进行相关的阐述,希望本文能为电力营销管理提供一定的帮助。  【关键词】电力营销;远程;
期刊
【摘要】随着社会经济的快速发展,工业化、城市化进程的不断加快;高层建筑物在各大城市的普及,其质量的问题尤为重要,熟悉掌握高层建筑物的特征,以及掌握设计的方法与施工的要点对工程从业人员也尤为重要。本文结合具体的工程实例,详细论述了高层建筑主体结构施工中模板工程的施工、质量控制要点,以及混凝土工程的施工,布料、浇筑,同时阐述 钢筋工程的施工要点。  【关键词】建筑工程;高层建筑;技术  高层建筑具有层
期刊
【摘 要】近年来,经济的发展促进我国科技水平的提升。随着我国科技水平的不断提升,人们对生活水平以及质量的要求也渐渐的提升,对电气自动控制系统的需求也不断的增大。为有效保证设备运行的可靠性与安全性,就要基于电气工程的全面发展,落实电气自动控制系统在电力发展当中的有效运行。本文就电气自动控制系统的功能和监控展开探讨。  【关键词】电气自动控制体系;监控;功能;自动化  引言  电气工程应用于化工业、航
期刊
【摘 要】在我国经济高速的发展过程中,工业是经济发展的重要部分,现代工业发展需要先进科技支持,电气自动化控制技术是电气类、机械类等工业中的重要技术,电气自动化控制技术的更新对现代工业的发展起到基本保障作用。人工智能技术在电气自动化控制中的应用,对电气自动化控制技术的更新起到技术支持作用,人工智能技术与电气自动化控制技术的结合对提高电气自动化相关企业的工作效率,提高产品的质量都起到重要作用,是现代电
期刊
【摘 要】随着我国信息技术的不断发展,集成电路产业也得到了空前的发展,根据我国目前集成电路的发展现状来看,集成电路是我国信息产业发展的基本保障,在竞争愈发激烈的经济市场,集成电路的产生与发展对我国社会与企业等有着十分重要的影响。基于此,本文研究集成电路的现状以及发展趋势具有十分重要的意义。  【关键词】集成电路;发展趋势;电力  结合我国当前的社会的发展趋势来看,集成电路是当前信息社会经济发展的基
期刊
【摘 要】面对现代电力事业发展带来的挑战,推动电力系统配电网自动化发展,引进前沿技术和手段,可以降低人工劳动强度和生产成本,降低设备故障几率,保证配电网稳定运行。通过自动化技术应用,推动配电网自动化和智能化发展,可以有效提升电力事业生产效率和效益。基于此,本文主要分析了电力系统配电网自动化实现技术。  【关键词】电力系统;配电网;自动化技术;实现技术  引言  在电力系统建设的过程中,建立配电网自
期刊
【摘要】近些年来,随着信息科学技术的迅猛发展,大数据在智能配电网中得到了广泛的应用,那么,大数据在智能电网中的应用现状和前景如何呢?本文针对智能配电网大数据的应用和前景做了具体的分析,希望能为相关工作人员提供一些帮助。  【关键词】智能配电网;大数据;应用技术;前景  随着信息科学技术的迅猛发展,大数据在全球范围内的各个行业都得到了广泛的应用。各行业力求充分挖掘大数据的价值以提高自身的市场竞争力。
期刊
【摘要】安全阀是一种非常重要的保护用阀门,广泛地用在各种压力容器和管道系统上,当受压系统中的压力超过规定值时,它能自动打开,把过剩的介质排放到大气中去,以保证压力容器和管道系统安全运行,防止事故的发生,而当系统内压力回降到工作压力或略低于工作压力时又能自动关闭。安全阀工作的可靠与否直接关系到设备及人身的安全,所以必须给予重视。为此,本文分析了锅炉安全阀阀门漏泄、阀体结合面渗漏、冲量安全阀动作后主安
期刊