支持视频语义分析的异构分布式LSTM研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:xieqinghang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
循环神经网络(Recurrent Neural Networks,RNNs)通过隐藏层神经元间的反馈连接使得网络具有记忆数据历史信息的能力,适合于序列数据的分析与建模,已经成为自然语言处理、语音识别、机器翻译、视频分析等领域研究的热点。视频作为一种特殊序列数据,可以使用RNN学习、挖掘视频内容间复杂的关联关系,进行视频语义信息的分析和理解。但现有的RNN对视频序列建模时,忽略了视频段动作语义的时间属性,导致在各时间步神经元均需进行大量复杂、耗时的矩阵计算。此外,随着模型规模和深度的扩大,以及视频数据量的指数级增加,训练时间开销急剧增长。RNN的训练涉及大量矩阵计算,具有复杂度高、时间开销大、对硬件要求高等特点,现有神经网络加速方法难以有效提高RNN的训练效率。本文在一种特殊的RNN模型—长短时记忆网络(Long Short-term Memory,LSTM)的基础上,针对应用到视频语义分析时存在的问题,研究了支持视频语义分析的异构分布式LSTM。本文主要研究内容如下:(1)首先分析用于视频语义分析RNN/LSTM的相关研究,针对目前RNN/LSTM模型无法有效利用视频序列自身特点及模型训练效率低、时间开销大等问题,提出异构分布式LSTM系统的结构,为高效训练支持视频语义分析的LSTM提供支撑。(2)针对现有LSTM对视频序列数据建模时存在的局限性,提出支持视频语义分析的分布式LSTM模型。首先改进现有的LSTM单元结构,设计时长敏感LSTM(Duration-aware LSTM,D-LSTM),使LSTM单元能够感知并记忆视频段动作语义的持续时间,自适应地更新神经元记忆信息,避免神经元状态更新时的冗余计算。在此基础上,提出了基于分布式神经元的D-LSTM模型,模拟生物神经系统中神经元并行运作机理,以D-LSTM单元为核心,将训练中复杂的矩阵运算分解到多个分布式神经元节点,利用其并行计算能力提高D-LSTM模型的训练效率。在Spark集群上实现了原型系统,使用Charades与COIN两个数据集进行了测试与分析,相比于分布式LSTM模型,分布式D-LSTM模型训练效率最高提升了22.7%、收敛速度最高提升了8.7%,相比GPU加速方式,训练效率最高提升了79.3%,而准确率仅与传统的LSTM模型相差1%左右。(3)在分布式D-LSTM的基础上,提出基于异构C/S的分布式训练方法。在分析神经元交互节点与分布式神经元节点中各计算任务特点的基础上,首先设计基于C/S的GPU与CPU协作策略,合理分解和分配计算任务,将分布计算通信代价大的复杂矩阵运算集中起来由GPU服务器集中完成,其他的计算任务由CPU集群完成,发挥CPU与GPU各自的计算优势。在此基础上给提出基于GPU/CPU的异构分布式D-LSTM训练方法,在神经元交互节点中增加GPU完成复杂的矩阵运算,复杂度较低的神经元交互节点中其他计算任务和分布式神经元节点中计算任务仍然使用CPU完成。实现了原型系统,使用Charades数据集与COIN数据集进行了测试与分析,实验结果表明相比分布式D-LSTM,在准确率不变的情况下,训练速度最高可以提升17.6%,收敛速度最高可以提升13%。
其他文献
抗日战争给近代中国造成的影响既深且巨,就社会层面而言,战时后方城市出现了普遍严重的住房紧缺问题,当时称之为“房荒”,而重庆住房形势尤其不容乐观。在此背景下,政府出台
这篇文章,我们研究如下具有时间衰减耗散系数的半线性波方程柯西问题:(?)其中t ∈[0,∞),α1。本文主要考虑小初值解的全局存在性。在证明过程中,我们利用Dehumal定理写出上
成功提取记忆信息需要记忆痕迹中的内容与提取环境中的信息相匹配。神经计算模型认为,记忆能够被成功回忆或提取,是因为在记忆提取阶段发生了编码过程中神经活动模式的恢复,
图结构因其能较为准确地表示现实世界中实体间的关系,而被广泛应用于社交网络、生物信息网络、智能交通网等众多领域。随着信息技术的飞速发展,图数据规模日益增大,分布式并
在本文中,我们研究了如下具特殊扩散过程的反应扩散方程的初边值问题其中Ω是RN(N≥3)中的光滑有界区域,0 ∈ Ω,1 <p<(?)并且uo(x)∈(Ω).本文的结构如下:第一章简要概述了所
在中学化学教学中,学科交叉强调化学教学内容应倾向综合化、多样化趋势,提倡实现多领域、多学科素养的相互融合。本研究将学科交叉理念融入电化学实验教学中,设计出试剂用量
抗日战争时期,侵华日军对中国实施了大规模的战略轰炸。美英两国在华机构及人员作为特殊性质的非军事目标也遭到了普遍的轰炸。侵华日军对美英两国在华机构及人员的轰炸,是违
奥氮平作为非典型的抗精神病药,在临床上使用非常广泛,主要用于治疗精神分裂症、双相障碍等精神疾病。前临床的研究表明,急性奥氮平会选择性地抑制啮齿类动物的条件躲避反应,而奥氮平的重复用药,会导致这种抑制效应逐渐加强,即产生敏化。条件躲避反应范式是测量抗精神病药的抗精神病效应的有效行为范式,本研究使用条件躲避反应范式来研究奥氮平的敏化的机制。药物敏化测试分为诱导阶段和随后的表达阶段。在诱导阶段,经过条件
本文研究了一类具对数型非线性项的四阶抛物型方程初边值问题(?)其中Ω是有界光滑区域,u0∈H01(Ω)∩H2(Ω)本文共分为四章.在第一章,我们首先概述本文所研究问题的背景及国
近年来不乏对民国语文教材的研究,清末民初是语文课程的萌芽期,回溯语文教材最初的建设历程,能为现代语文教材编写提供有益参考。1930年北新书局出版、赵景深编写的《初级中