【摘 要】
:
数据量的增长和模型大小的增大推动了大规模机器学习的显著进步。对于数据特征维度特别高的模型,即使是简单的线性模型也存在参数量过大的问题。同时,为了适应多种任务,许多
论文部分内容阅读
数据量的增长和模型大小的增大推动了大规模机器学习的显著进步。对于数据特征维度特别高的模型,即使是简单的线性模型也存在参数量过大的问题。同时,为了适应多种任务,许多复杂的深度神经网络被设计出来。这使得大规模机器学习具有计算复杂度高,模型参数量大的特点。为了同时解决模型训练耗时以及模型存储空间有限的问题,主要有两方面困难。一方面,分布式训练常被用来加速模型训练,但不同计算结点之间交换信息(如随机梯度)的通信成本成为训练效率的关键瓶颈。另一方面,参数量非常大的模型,往往难以直接应用到内存和计算资源受限的设备上。为了便于存储,通常需要一个稀疏模型。如何在分布式框架中平衡模型的稀疏性、性能和通信成本仍然是一个悬而未决的问题。为了同时克服这两个困难,我们提出了用于分布式训练的量化复合镜像自适应次梯度(Quantized cmd adagrad)和量化正则对偶平均自适应次梯度(Quantized rda adagrad)。具体来说,我们探索了如何利用梯度量化来降低分布式训练中每次迭代的通信成本,并构造了一个基于量化梯度的自适应学习率矩阵,以便在通信成本、准确性和模型稀疏性之间取得平衡。此外,本文还从理论上证明较大的量化误差会带来额外的噪声,从而影响模型的收敛性和稀疏性。因此,在量化复合镜像自适应次梯度和量化正则对偶平均自适应次梯度中采用量化误差相对较小的门限量化策略,以提高信噪比,保持模型的稀疏性。理论分析表明所提算法的收敛速度为(?)。充分的理论分析和大量的实验结果都证明了所提算法的有效性。
其他文献
移动机器人是目前机器人研究的热点方向,路径规划是移动机器人的执行任务的前提,避障算法是路径规划的关键,在复杂环境中很多传统避障算法会达不到理想的效果。本文先对传统
食品行业不仅关系到人们的健康安全,而且对国民经济的发展至关重要。随着人民生活水平的提高,人们对于食品的安全和质量日益重视。21世纪以来,食品安全事件的频发不仅对产业
国家出版基金项目是我国在图书出版领域设立的一个重大项目,项目出版规格高、出版时间紧、出版难度大,出版过程中项目图书的出版进度是否得到合理计划和控制,成为影响项目管
碳化钨(WC)因其具有类铂催化活性和良好的抗CO、H_2S等中毒能力,而引起了人们的广泛关注。但是,其催化活性与铂相比还有较大差距,如何提高WC的催化活性是近年来研究的热点。蒙脱石(MMT)是一种天然纳米层状结构的矿物,具有表面电负性强、比表面积大及吸附性强等特点。本文以剥离后的蒙脱石为载体,采用浸渍法和原位还原碳化技术相结合的方法,制备出具有良好分散性和较大比表面积的WC/MMT复合材料,进一步
垃圾焚烧是解决当今垃圾问题的主要处理方式,但是焚烧过程会产生大量的酸性气体、重金属、颗粒物以及挥发性有机物等污染物质,其中具有“三致”效应的多环芳烃(polycyclic ar
工业反应釜液面分离是根据釜内不同的液体状态实现液体分离,然后将分离后的液体用于工业产品的生产。目前实现液面分离的方式主要是通过人工手动操作,由于该方法效率较低且生
随着国际贸易的拓展,经济发展进入新常态.各国开始关注自然环境与经济和谐发展,对资源和生活环境提出建议,践行“既要绿水青山又要金山银山,绿水青山就是金山银山”的绿色经
近年来国家综合国力的增强对学术型人才与高校教育质量提出更高要求,学术图书肩负传播学术的重要功能,介乎学术研究界和出版界之间,既是出版业的重要组成部分,同时也是学术活
导电聚合物在电刺激作用下可以促进细胞的粘附、增殖和成骨分化,在骨再生应用中具有良好前景。此外,导电聚合物是抗氧化剂,可以用来保护细胞和组织免受过度活性氧(ROS)的损害。然而,纯导电聚合物由于缺乏细胞亲和力和骨诱导性,且易于过氧化而失去抗氧化性,使得其在实际应用中不能达到良好的骨再生效果。因此,开发一种具有良好的细胞亲和力,骨诱导性,长效抗氧化性的电活性复合材料是十分必要的。在这里,我们通过脉冲电
水下被动声目标定位是指传感器被动地接收水下目标发射的声信号,并通过获得的目标声信号信息来对目标的运动参数进行估计的一种定位方法。这种定位方法被广泛用于水下机器人