稀疏神经网络和稀疏神经网络加速器的研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:houhao88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络已经在图像识别、目标检测、语音识别和自然语言处理等诸多领域受到广泛应用,并逐渐成为主导算法。然而,随着神经网络模型的拓扑结构朝着规模不断扩大,层数不断加深的方向发展,庞大的数据和计算量给传统计算平台带来巨大的挑战。虽然采用稀疏技术(包括神经元和权值稀疏)能够有效减少神经网络的参数,从而减少数据访问和计算量,但是它同时会将稠密网络规则的拓扑结构转化为稀疏不规则的形式,从而阻碍处理平台(包括CPU、GPU和专用加速器)充分利用神经网络稀疏特性获得性能的提升。在本文中,我们提出了一种软硬件结合的方法来有效处理稀疏神经网络不规则的问题。首先,基于大量的实验,我们观察到了局部收敛的现象,即在训练过程中,权值的分布并不是随机的,较大的权重往往会聚集成簇。基于这个关键的观察,我们提出粗粒度剪枝大幅降低稀疏神经网络的不规则性。我们提出的粗粒度剪枝将多个突触作为一个整体进行裁剪,而不是裁剪单个突触。我们首先将突触分为多个块,当某个块满足特定条件时,该块中的所有突触将从网络拓扑中永久剪除。我们对经过粗粒度剪枝的神经网络进行重训练来保证网络的精度。值得注意的是,我们对神经网络迭代使用粗粒度剪枝和重训练,从而获得理想的稀疏度和精度。粗粒度剪枝可以将稀疏神经网络的不规则度平均减少20.13倍。同时我们提出了一种新的神经网络压缩算法,该算法包括粗粒度剪枝,局部量化和熵编码三个步骤,在AlexNet和VGG16上分别获得了 79倍和98倍的压缩比,远高于现有的两个最先进的神经网络压缩方法,即Deep Compression(35倍和49倍)和CNNPack(39倍和46倍)。我们进一步设计了一个新型硬件加速器,Cambricon-S,用于有效处理剩余的稀疏神经元和突触的不规则性。新型加速器中最重要的特征是其中枢神经元选择模块(NSM)能够有效处理粗粒度突触稀疏。同时,加速器中的突触选择器模块(SSM),Encoder和权值解码模块(WDM)能够分别利用神经元稀疏,动态压缩神经元和局部量化。与最先进的稀疏的神经网络加速器Cambricon-X相比,我们的加速器能够获得1.71倍的性能提升,同时减少1.75倍能耗。为了减轻程序员的编程负担,我们还提出一个基于库的编程框架。编程框架中的编译器能够应用循环分块(looptiling)和数据重用(datareuse)策略生成高效的加速器指令。
其他文献
目的:探究对因PICC置管导致出现局部皮肤过敏症状的临床治疗和护理方法,并总结其临床效果。方法:选择应用PICC置管治疗且穿刺位置的局部皮肤出现过敏症状的肿瘤患者共40例,对
本文测度各省四部门乘数及其差异。研究表明,各省乘数效应较小,存在“东部弱,中西部强”的区域特征;不同方法计算的乘数分布具有一致性。各区域存在不同的乘数发挥作用的阻塞因素
融资租赁自产生以来,在各西方主要发达国家受到了告诉的重视,其自身带有的集融资与融物与一体的特点,能够有效解决需要大量资金的企业的资金需求。尤其在金融危机期间,银行信
编辑手段的现代化是编辑出版工作现代化的重要标志和前提,编辑手段现代化的标志之一就是计算机和互联网技术在学术期刊编辑出版中的广泛应用.编辑手段的现代化可以从编辑工作
通过对全球氘代药物领域的发明专利申请进行统计分析,重点关注并剖析美国和中国申请人的申请现状与发展趋势以及重点氘代药物的专利申请前景。同时通过讨论氘代专利申请的撰
禽流感对食品安全的影响是巨大的,是影响肉食品安全的重要风险因素。论文从禽流感对家禽养殖业发展的影响、通过食品链条对人类健康造成危害、重大食品安全事故影响国际贸易
在RS和GIS软件的支持下,通过人机交互目视解译获得厦门城市边缘区——同安区2000年和2010年土地利用数据,从结构变化、数量变化和类型转移3个方面分析了同安区2000-2010年的
大学新生入学后,有一个从高中阶段到大学校园的心理适应过程。本文重点探讨这个心理适应过程,并对其作客观的分析评价,同时提出调适方案。
随着土地流转在全国范围内的深入推广,原来以农户为单位进行耕种的方式已经发生改变,将原本进行分散生产的土地资源集中进行农业生产,促进了现代化农业发展。促使农业生产区
2003年11月15日上午11时,我得到一个信息,说是湖田窑遗址发掘到许多元代黑釉瓷残件。下午1时,便兴冲冲赶到该窑址博物馆。$$ 在博物馆里已摆放了很多刚出土的黑釉瓷残件,大部
报纸