论文部分内容阅读
伴随着神经网络实际效果的不断提升,网络的参数规模和计算量越来越大,这为神经网络的部署带来了较大的困难。文中提出了一种基于动态映射的网络量化方法,通过重新设计一些常见的神经网络计算单元,可以将网络中的参数量化到指定位数的定点数;同时在特定约束条件下,理论上支持在指定位数定点数下对该神经网络进行微调训练。文中通过相关实验证明了此量化方法和重训练方法是简洁有效的,并且优于现有的开源方法。