深度学习网络的快速计算关键技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:niitliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度神经网络近年来普遍应用在图像分类、物体检测、目标跟踪等计算机视觉任务中,已逐步成为研究热点。不过因为参数数目巨大、存储空间有限和计算资源代价高昂的限制,在移动设备上的存储和计算已经阻碍了深度学习的发展。为此,本论文开展了深度学习网络的快速计算技术研究,主要工作如下:论文首先分析了目前主流的几种深度学习网络的快速计算技术,包括参数修剪与共享、低秩分解、紧性卷积核的设计以及知识蒸馏等等。在参数修剪与共享的基础上,寻找并消除网络中存在的冗余,但会因为精度的损失而造成准确率的降低;在低秩分解的基础上,利用向量分解对卷积网络里信息量大的参数进行估计,但是低秩方法真正实施起来特别困难,涉及到计算成本昂贵的分解操作;在紧性卷积核的基础上,使用特殊滤波器对网络参数进行估计,设计特殊的卷积模块结构,能大大改善网络性能;知识蒸馏提炼出一个小模型来再现大型网络的输出,虽然能减少计算成本但是适用范围比较局限。然后,论文提出了基于激活函数的快速计算算法,即设计了基于SELUs的自归一化分段线性激活函数SPeLUs。该激活函数的实现流程如下:用分段线性函数PeLUs去拟合ELUs;用参数λ与PeLUs相乘得到SPeLUs;由不动点(0,1)得出λ0 1和α01;计算Jacobian矩阵,验证谱范数小于1,即SPeLUs具有自归一化特性,最终得到具有归一化特性的分段线性激活函数SPeLUs。论文提出的SPeLUs,用分段线性函数取代SELUs的指数部分,解决了SELUs的计算密集型问题,从而加速了神经网络的训练,同时保持自归一化特性而不需要BN,在MNIST、CIFAR-10和CIFAR-100等经典数据集上能达到和SELUs相似的结果。最后,论文研究了参数修剪和共享中的量化算法,在三值量化的基础上提出一种简化的二值量化算法。相比于三值量化算法,所提出的二值量化只使用了一个全精度比例因子,保证正权值和负权值的绝对值相等。实验证明,虽然改进算法的准确率有些许下降,但是实现了计算量和参数量的减少,显著降低收敛时间,从而加速了神经网络的训练。论文在Ubuntu14.04下基于Tensorflow的深度学习平台进行实验验证。实验证明,论文提出的深度学习网络的快速计算算法简易有效,在准确率略有下降的情况下能大幅度减少计算量,提高了移植到移动端的可能性。
其他文献
摘 要:戏剧文化作为我国非物质传统文化的重要组成部分,与人民群众的社会生活关联密切。声韵美融合了戏曲声乐独特的美学特性,本文主要对戏曲的韵味美进行初步分析,在角色各异、流派林立的唱腔声韵美中,要求传统戏剧唱腔以字为根,追求腔圆曲折的声韵美学效果,这也是戏剧家共同追寻的美学理想与标准。  关键词:传统戏剧;唱腔;声韵美  一、引言  传统戏剧作为重要的非物质文化遗产,在国务院公布的首批518项国家级
自诞生以来就深受现代人文主义教育理念影响的新疆电影是中国当代电影史上的一束奇葩,它通过引人入胜的区域题材选择、内涵深刻的生活故事文本和手法多样的感性表达方式,创设
本文通过对职业院校应用化工专业项目化课改的探析,结合教学过程中的实践和反思,对项目化课改进行全面的论述。
语言表达和思维能力紧密联系,有效的英语思维能力训练可以提高英语口语能力。教学中教师注重学生英语词汇教学、中西的文化差异性和课堂问题的设置,让学生养成使用英语思维的
随着中国经济的迅猛发展,社会对于成年人的素质教育和学历水平提出了更高的要求。近年来,我国成人高等教育在迅速发展的同时,其存在的问题也逐渐显现出来,主要集中在成人高等
在信息化时代背景下, 社会科技不断进步, 对企业的人力资源管理工作也提出了相应挑战.如何提高企业人力资源管理质量和效率, 促进企业人力资源的合理利用, 提升企业的市场竞