【摘 要】
:
机器学习作为人工智能领域内的一个重要方向已经在今天发挥出了越来越重要的作用,随着机器学习相关算法解决了越来越多的问题的同时,人们也面临着一些新的因为数据量大、模型
论文部分内容阅读
机器学习作为人工智能领域内的一个重要方向已经在今天发挥出了越来越重要的作用,随着机器学习相关算法解决了越来越多的问题的同时,人们也面临着一些新的因为数据量大、模型大、计算量大从而单机无法解决的问题。正是由于这些问题在单台机器上的不可行,人们自然而然的就想到使用多台高性能计算机去加速模型的训练。然而,在大多数的情况下并不是直接使用多台机器去训练就可以直接得到相应的提升的。从机器学习理论的角度来讲,大多数的算法可以形式化为求一个由损失函数和正则化项所组成的目标函数的条件最值的问题。而求解这一问题最常用的方式就是用优化函数求解。对于一阶函数而言,最常用的优化算法就是随机梯度下降算法。所以我们认为,首先在随机梯度下降算法上研究算法的并行化问题可以有较为显著的收益。主成份分析(PCA)算法和奇异值分解(SVD)广泛应用于机器学习的各个领域之中。在实际应用中,在整个问题中求解一个PCA子问题所占用的时间开销往往是巨大的。我们基于方差递减的随机梯度下降的方法提出了一种快速分布式主成份分析算法。使用随机采样更新目标,并采用延迟同步作为我们的同步机制。近年来,由于深度神经网络在不同方面的出色表现,深度神经网络作为机器学习的一个分支得到了人们的广泛关注。在分布式深度学习中,一个通常的做法是在CPU和GPU异构集群上,通过使用分布式训练的方式使得海量数据得以在多机多卡间并行处理,以大幅提升收敛速度。通过详细分析后可以发现,在分布式深度学习任务中跨机器的通讯往往是瓶颈,是需要优化的部分。一方面我们从算法研究的角度详细分析了现有的算法瓶颈,提出了基于两步归约的通信策略去减小不同机器间聚合梯度的时间。进一步的,我们提出了一种基于两步归约的分布式梯度下降方法。另一方面,我们从工程应用的角度分析了远程内存直接存取技术(Remote Direct Memory Access,RDMA)和InfiniBand与以太网和TCP/IP的区别与联系,以及基于Socket的通信方式的不足之处。我们基于InfiniBand的原生标准库设计并实现了一个面向分布式深度学习的高效通信接口。我们的通信接口实现了高吞吐量和低CPU开销,并且我们基于异步方式实现从而最大化RDMA的性能优势。
其他文献
射频识别(RFID)是一种以非接触的方式使用无线射频信号实现物品识别的技术,其中超轻量级标签,价格低廉,非常适合大规模应用,受到人们越来越广泛的关注。用户通过购买云数据库服务的方式来搭建RFID系统,不仅可以减少数据库维护成本,还可以使系统更加灵活成为未来发展方向。然而在RFID系统中,阅读器与标签之间采用无线链路通信,极易受到攻击,同时云服务提供商也可能会窃取和泄露用户隐私,因此用户数据也必须加
MCMC算法产生于19世纪50年代早期,Metropolis将马尔可夫链引入蒙特卡罗方法中,后经Hastings对其推广,使其更具一般性。其中,使用最广泛的就是M-H算法和Gibbs抽样。MCMC算法主要依赖于马氏链模拟的收敛性,即它所构造的马氏链是否收敛,收敛速度的快慢。因此,对马氏链收敛速率的定性分析和定量分析尤为重要。近几十年来,众多学者在相关条件下研究马氏链收敛的量化边界,并将其用在众多算
良好的学位论文选题是撰写高质量论文的前提。体育硕士学位论文选题作为论文写作的开端,一定程度上能够体现体育硕士学位论文的总体质量及其人才培养质量,其重要性不言而喻。
近年来,随着量子计算的快速发展,量子安全多方求和作为量子计算的研究分支受到广泛的关注。量子安全多方求和源于经典安全多方求和思想,都是研究多个参与者协同完成求和任务
莱州崖角藤Rhaphidophora laichouensis Gagn.属于天南星科龟背芋亚科崖角藤属。相比天南星亚科植物的花序(肉穗花序由单性小花构成,具明显空间结构分化,通常有附属器),龟背芋亚科植物的肉穗花序由两性小花构成,无明显空间结构,缺附属器。过去对天南星亚科植物及其访花昆虫(特别是芋果蝇)的研究发现,这些植物的花序具有特殊的佛焰苞结构,开花过程中花序有生热作用,而生热对促进花序合成
苏格兰向来以其优质的教育闻名于世,本文结合笔者在苏格兰北伯威克中学进行的历史课堂教学观摩情况,从苏格兰公立中学历史课程设置、历史教学评价、课堂教学等角度,对苏格兰
本文研究的主题是以股权转让形式转让土地使用权的商事交易行为的法律效力及其治理,研究视角是从法律规避视角对其加以学理分析,认为该商事交易是一种典型的法律规避行为。不
刑事缺席审判程序是经2018年《刑事诉讼法修正案》确立的一项新的特别审判程序,该程序的设立不仅对于完善我国刑事诉讼法体制具有重要意义,也对解决我国于境外追逃、追赃腐败
近年来,随着云存储的推广普及与飞速发展,越来越多的企业和个人将数据外包到云端进行存储,并通过网络访问、处理和分享存储在云端的数据。然而,云存储服务在给用户带来按需存
本研究的研究对象为初中数学教师,以心理学、人力资源管理学、组织行为学等学科范围内的经典理论为基础,结合工作分析法、行为事件访谈法(BEI)和调查问卷法等不同的研究方法,