基于数据并行的神经语言模型多卡训练分析

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:lcmeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据并行训练神经语言模型,旨在不改变网络结构的同时,大幅度降低训练所带来的时间消耗。但由于多设备之间频繁的数据传输,使得整体加速效果并不理想。该文通过实验对比All-Reduce算法和基于采样的梯度更新策略在数据传输上的加速效果,使用了四块NVIDIA TITAN X(Pascal)GPU设备在循环神经语言模型上进行训练,两种方法分别可获得约25%和41%的速度提升。同时,该文还针对数据并行方法的适用性以及不同的硬件设备连接方式对传输速度的影响进行了讨论。
其他文献
<正>党的十八届五中全会通过《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》指出"发挥财政资金撬动功能,创新融资方式,带动社会资本参与投资"。在中国经济进
2016年12月16日闭幕的中央经济工作会议强调:房子是用来住的、不是用来炒的,综合运用金融、土地、财税、投资、立法等手段,加快研究建立符合国情、适应市场规律的基础性制度和
该文提出一种基于熵加权属性子空间的目标社区发现方法,挖掘与用户偏好相关的社区。首先,从属性和结构两个方面综合考虑节点间的相似度,利用用户给定的样例节点及其邻居扩展
当前,香港传统优势相对减弱,新的经济增长点尚未形成,住房等民生问题比较突出。解决这些问题,香港不仅要充分利用好《关于建立更紧密经贸关系的安排》(CEPA)等机制,积极参与"一