基于数据并行的神经语言模型多卡训练分析

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：lcmeng

【摘要】

：

数据并行训练神经语言模型,旨在不改变网络结构的同时,大幅度降低训练所带来的时间消耗。但由于多设备之间频繁的数据传输,使得整体加速效果并不理想。该文通过实验对比All-R

【作者】

：

李垠桥阿敏巴雅尔肖桐薄乐朱靖波张俐

【机构】

：

东北大学自然语言处理实验室

【出处】

：

中文信息学报

【发表日期】

：

2018年7期

【关键词】

：

数据并行神经语言模型 All-Reduce 采样 data parallelism neural language model All-Reduce samp

【基金项目】

：

国家自然科学基金（61672138）,国家自然科学基金（61432013）, 中央高校基本科研业务费

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数据并行训练神经语言模型,旨在不改变网络结构的同时,大幅度降低训练所带来的时间消耗。但由于多设备之间频繁的数据传输,使得整体加速效果并不理想。该文通过实验对比All-Reduce算法和基于采样的梯度更新策略在数据传输上的加速效果,使用了四块NVIDIA TITAN X（Pascal）GPU设备在循环神经语言模型上进行训练,两种方法分别可获得约25%和41%的速度提升。同时,该文还针对数据并行方法的适用性以及不同的硬件设备连接方式对传输速度的影响进行了讨论。

其他文献

改革背景下的政府投资基金：特点、问题与对策

<正>党的十八届五中全会通过《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》指出"发挥财政资金撬动功能,创新融资方式,带动社会资本参与投资"。在中国经济进

期刊

政府投资基金政府投融资基金评估投融资模式问题与对策

建立房地产的长效机制释放了什么信号

2016年12月16日闭幕的中央经济工作会议强调：房子是用来住的、不是用来炒的,综合运用金融、土地、财税、投资、立法等手段,加快研究建立符合国情、适应市场规律的基础性制度和

期刊

基础性制度房地产泡沫支柱产业地位家庭租赁家庭购买万科我国房价首付比例其他收入中低收入阶层

基于熵加权属性子空间的目标社区发现

该文提出一种基于熵加权属性子空间的目标社区发现方法,挖掘与用户偏好相关的社区。首先,从属性和结构两个方面综合考虑节点间的相似度,利用用户给定的样例节点及其邻居扩展

期刊

熵属性权重社区发现用户偏好entropyattribute weightcommunity detectionuser preferences

打造内地与香港经贸合作的新优势

当前,香港传统优势相对减弱,新的经济增长点尚未形成,住房等民生问题比较突出。解决这些问题,香港不仅要充分利用好《关于建立更紧密经贸关系的安排》（CEPA）等机制,积极参与＂一

期刊

经贸合作发展经济增长产业转型升级医疗服务需求广东河源沿边开放生态资源节点城市物流园区建设购物天堂

基于数据并行的神经语言模型多卡训练分析

其他学术论文