【摘 要】
:
随着卷积神经网络在图像视频识别等领域的广泛应用,海量的卷积神经网络计算任务需要得到高效的处理。传统的处理器架构,例如CPU和GPU,由于其结构的局限性无法很好地适应神经网络的计算特点。尽管许多相关工作提出了基于近存储计算的深度神经网络专用加速器,但在冯诺依曼架构下,无法从本质上解决存储墙对深度神经网络加速器性能的影响。因此,研究者们提出基于内存计算的深度神经网络加速器来缓解大量数据访存带来的存储墙
论文部分内容阅读
随着卷积神经网络在图像视频识别等领域的广泛应用,海量的卷积神经网络计算任务需要得到高效的处理。传统的处理器架构,例如CPU和GPU,由于其结构的局限性无法很好地适应神经网络的计算特点。尽管许多相关工作提出了基于近存储计算的深度神经网络专用加速器,但在冯诺依曼架构下,无法从本质上解决存储墙对深度神经网络加速器性能的影响。因此,研究者们提出基于内存计算的深度神经网络加速器来缓解大量数据访存带来的存储墙问题。现在大多数研究工作提出的加速器架构都以尺寸固定,相互独立的阵列计算单元作为基础。这样设计的优势是在于可通过拆分矩阵的方式来适应输入输出大小不同的各类矩阵乘法。但是,由于阵列内以模拟信号的形式进行计算而模拟信号无法存储,故需要进行大量数字信号与模拟信号互相转换的操作,从而产生大量的时耗和能耗。在上述背景下,论文设计了一种基于内存计算的卷积神经网络加速器。论文的主要工作包括:分析了经典卷积神经网络的结构特点,深度神经网络加速器的研究现状以及基于内存计算的深度神经网络加速器的不足之处。提出了基于ReRAM的卷积神经网络加速器体系结构(RFSM),并详细阐述了RFSM中包含的关键技术。为了提高推理任务的处理效率,利用相邻层之间输入输出数据的关系,提出了基于感受野的卷积计算策略和阵列计算单元动态连接技术。基于感受野的卷积计算策略指导阵列计算单元按照计算的输入输出需求完成动态连接,使得阵列计算单元内可进行无信号转换操作的多卷积计算。本文还提出了单图像推理任务M分技术,该技术划分后的推理任务可相互独立地并行处理。在CACTI 6.5上模拟得到片上存储器等的能耗和面积。根据已有研究提出的能耗和面积模型来计算基于ReRAM阵列计算单元,数字模拟信号转换器和模拟数字信号转换器的能耗和面积。实验结果表明,本文提出的基于内存计算的卷积神经网络加速器相比于已有研究工作ISAAC,能提高约6.5倍的计算速度,降低约7.1倍的能量消耗。
其他文献
随着我国互联网和移动通信设施的快速建设,使得以互联网技术和移动通信技术为基础的移动互联网的迅速普及,并带来了在移动互联网上运营的社交媒体应用的繁荣。繁荣的社交媒体应用促进了进入互联网应用的门槛的降低,更多的人成为互联网信息的创作中心,丰富了互联网的内容。但是,互联网上丰富多彩的内容对在快速的生产生活节奏下的人们高效获取信息造成了障碍。通过高质量的文本摘要可以提升人们在选择和获取信息时的效率。随着计
中文文本的自动校对技术是自然语言处理的重要应用技术之一。当前使用深度学习的方法进行中文文本校对或者使用深度学习和传统方法结合已经成为主流。然而使用深度学习方法最重要的挑战之一是没有足够多的标记数据用于模型的训练。为解决校对数据不足的问题,本文提出自动生成中文文本校对语料库的方法。鉴于当前中文校对数据分为两类,即中文文本拼写校对和中文文本语法校对,因此本文的主要工作有两点:一是自动生成中文拼写校对语
随着软件安全性的重要性日益增长,在设计阶段发现问题以规避后续修复问题的成本变得越来越重要,使用模型驱动的方法进行软件开发也因此越来越受到重视,这同样也对嵌入式系统的软件安全性分析提出了更高的要求,在这种趋势下危害演化链应运而生,危害演化链具有演绎性分析、集成多方面信息、分析结果更全面更系统等优势。此外,对于软件系统尤其是嵌入式软件系统,安全性问题发现的阶段越早,后续修改的成本越低。而相比于对静态模
超分辨率重建(Super Resolution,SR)是图像处理领域的重要组成部分,也是当今科学研究的热点问题。本文的研究对象是在静电悬浮结合垂直真空落管实验设备上采集的低分辨率(Low Resolution,LR)材料熔滴图像。针对现有的SR方法应用在熔滴图像上往往会出现边缘模糊、纹理细节信息不足等问题,本文以卷积神经网络(Convolutional Neural Networks,CNN)为主
随着物联网技术和众多新科技成果的结合与发展,产生了诸多便利生活的设备,这些设备在使用期间,产生了大量隐私、敏感数据,与此同时,私人数据的收集、泄露已经越来越隐蔽、普遍,因此物联网资源安全访问控制就变成了一个亟待解决的问题。访问控制技术常常被用来解决物联网在信息通信和访问中的安全性问题,但是传统的访问控制系统容易单点故障,且在不可信的环境中进行访问控制操作容易发生数据泄露。区块链和访问控制技术结合,
随着人工智能技术的快速发展,以及人们对新兴技术的迫切需求,催生了数量众多的智能创新与应用,以智能汽车为代表的智能交通建设已成为国内外一个极具研究价值的重要课题。激光雷达(LiDAR)传感器依据先进的激光测距原理,获取的环境点云数据精确度高,测量的范围广,不易受天气、光照、物体表面纹理等影响,已被广泛应用到各种智能移动设备的环境监测、自主导航、路径规划中,是智能汽车实现环境感知的核心设备。然而,Li
近两年,受疫情的影响,人们进出公共场合需进行登记与身份验证。目前普遍采用的人脸识别系统易受口罩遮挡的影响。本文从虹膜识别领域出发探索一种面向移动端的虹膜识别方法。与传统虹膜识别方法相比,基于神经网络的虹膜识别方法精度更高、系统鲁棒性更强,但其参数量庞大,对运算、存储需求较高,难以部署在硬件有限的移动端设备上。为解决上述问题,本文提出一种将轻量化网络结构与模型量化技术相结合的轻量化神经网络用于移动端
移动边缘计算是在物联网背景下的一种分布式计算模式,可以将计算、存储以及小型云中心的处理能力转移到网络边缘。本文从移动边缘计算的架构、特性优势,对邻近性与位置获取进行阐述,对几种新兴的应用场景做了分析,进一步讨论了移动边缘计算在未来的发展以及可能遇到的挑战。本文以节点的移动性预测与计算卸载方法两方面开展研究,主要内容如下:设计了基于移动边缘计算的预测服务框架,利用岭回归优化回声状态网络,对移动节点出
图像风格迁移是近年来十分活跃的研究方向,该研究因其迁移结果的多样性,及其特征提取的思想在其他计算机视觉应用中具有通用性,从而具有一定的应用价值和学术价值。水墨画作为我国重要的文化遗产,具有极强的艺术风格特性,是传播中华文化的重要代表。科技和艺术的融合研究是近年的学术热点,为了更好地弘扬民族文化,本文将风格迁移与中国水墨艺术画相结合,基于循环式生成对抗网络(Cycle GAN)提出了一种新的水墨风格
近几年来,随着大数据的热潮,数据分析处理愈发复杂,传统的一些机器学习技术已越来越不能够适用于当前的大部分数据分析任务。纷繁复杂的现象往往需要多变量数据来描述,而这些数据维数高、样本量大,通过降维技术从这些数据中分析出隐含的数据信息,了解数据的本质特征,有助于更好的提供各领域的信息服务。本文通过对高维数据降维以及预测的相关理论和技术展开系统研究,对相关算法分别对比探究。选用传统主成分分析算法(PCA