【摘 要】
:
近年来随着生活水平的显着提高,人们对移动式电子设备的性能提出了更高的要求。作为芯片的核心单元,中央处理器(Central Processing Unit,简称CPU)变得越来越重要。但是,一方面由于MOS晶体管达到了物理极限,另一方面由于以ARM等公司为代表的CPU厂商收取越来越高的专利费,CPU的发展进入了瓶颈期。RISC-V(Reduced Instruction Set Computer f
论文部分内容阅读
近年来随着生活水平的显着提高,人们对移动式电子设备的性能提出了更高的要求。作为芯片的核心单元,中央处理器(Central Processing Unit,简称CPU)变得越来越重要。但是,一方面由于MOS晶体管达到了物理极限,另一方面由于以ARM等公司为代表的CPU厂商收取越来越高的专利费,CPU的发展进入了瓶颈期。RISC-V(Reduced Instruction Set Computer fifth edition,第五代精简指令集)是2014年由D.Patterson领导的团队推出的一种指令系统,它具有短小精悍,便于扩展,易于实现,且完全开放等特点。因此随着人工智能行业的蓬勃发展,人们开始研究基于RISC-V的CPU加神经网络加速器的架构来提高处理器的算力。然而由于用ASIC实现神经网络,每个版本都需要根据需要进行定制,导致其设计的成本高,又由于用FPGA实现神经网络,在板子烧完后整体电路就确定了,导致灵活度低且价格昂贵,因此使用RISC-V内核加上可以实现神经网络指令的协处理加速器的架构无疑是最佳的选择。本文致力于设计一款基于RISC-V的神经网络加速器。本文首先介绍了RISC-V的架构和指令的扩展原理以及方法。然后在蜂鸟E203内核的基础上扩展了具有卷积神经网络功能的加速器,加速了指令的运行。其中,加速器改变了传统CPU的数据移动形式,使用了脉动阵列、数据复用等方法,提高了数据的并行度,减少了数据流在处理单元与内存之间的反复移动。为了实现数据复用,本文还使用了权值复用的方法降低了加速器对内存的访问。最后在Vivado平台下,对加速器的每个模块及整个系统都进行了仿真与验证,同时分析了系统使用到的硬件资源并生成了版图。结果显示对于卷积计算,使用加速器的架构比未使用加速器的架构快4.1倍。对于激活和池化计算,使用加速器的架构比未使用加速器的架构快1.3倍。同时资源消耗表显示加速器约占整体系统的40%。功耗表还显示系统的动态功耗占65%,为0.142W,其中MMCM(混合模式时钟管理器)和BRAM(块随机存取存储器)占用了大部分功耗,分别为0.119W和0.011W,而静态功耗则使用了剩下的35%的功耗,为0.076W。
其他文献
最优传输的理论和方法日益渗透进深度学习等许多工程领域,其Figalli正则性定理揭示了生成模型存在模式崩溃和模式混合的本质原因是传输映射在奇异集处不连续。此外根据对抗样本生成机理的流形假说,奇异集中存在对抗样本,因此计算和研究最优传输映射奇异集变得更加重要。本文主要研究两个问题:一是计算最优传输映射的奇异集,二是利用奇异集生成对抗样本。为了解决上述问题,本文首先基于几何变分方法设计并实现最优传输映
深度学习技术的快速发展使得DNN驱动的自动驾驶技术的研究和部署有了质的突破。然而,虽然自动驾驶汽车已在无人操作的情况下路测行驶数百亿公里,其自动驾驶行为的安全性并不能得到保证——转向角度、安全距离、加速度及制动等因素的微小偏差都可能对安全操纵造成难以预计的结果。因此,自动驾驶汽车的安全性验证技术逐渐成为当前的研究热点和难点。本文以摄像头传感器采集的图像数据作为输入,以正确的转向角度作为输出,研究D
时间序列是大数据的一种重要存在形式,对其利用的方式之一就是通过聚类或分类来挖掘其中的类别信息。时间序列分类(Time series classification,TSC)任务是一项普遍且具有重要意义的课题,常见于工业、金融和医学等领域。然而,时间序列数据存在维度过高和在时间上不对齐的缺点,难以从中获取到对分类任务有益的特征信息。深度学习模型对输入数据具有一定的容错性并能够自动提取特征,在TSC问题
三维重建是包括机器人导航、目标识别、场景理解、动画制作、工业控制、医疗诊断和自动驾驶在内诸多领域所需的核心技术,而深度和光流信息是重建真实三维场景的必备条件。早期方法针对深度或光流进行单独估计,近年陆续出现联合估计深度与光流的不同方法。但联合估计方法依然在泛化性、准确性、完整性等方面存在不足,严重制约该领域进一步发展。因此,为了得到更高精度的深度信息与光流信息,本文提出了一种新的双目深度与光流联合
交通事故是全世界最严重的危害之一,其造成了巨大的财产损失和人员伤亡,其中约95%的事故是由驾驶员不当行为造成的。检测公交车驾驶员异常行为能够对驾驶员的不当行为进行预警,从而保障交通安全。在2019年末爆发的COVID-19中,驾驶员作为公交车上与流动性人员接触最频繁的人,对其佩戴口罩行为进行检测,能够有效降低感染风险,保障其自身和广大乘客的健康安全。实时监测公交车驾驶员,对其不当行为进行及时提醒,
我国制造业正处于向“智造业”转型关键时期,这其中缺陷检测环节必不可少,因此应用现代化机器视觉技术替代耗时耗力的人力工作,是一个重要研究内容。而今在机器视觉领域,深度学习逐渐在一些应用中取代传统视觉算法。但是,根据目前深度学习的发展现状,大量的有效数据是具体应用的必要前提,也是由于这个原因,少样本学习问题是很多场景中面临的最现实的问题。本文的研究课题来源于江西一家生产轴承滚子的企业,针对该企业生产产
近年来元学习问题及其相关应用逐渐成为国内外关注的研究课题,它通过训练模型“学会学习”来提高数据效率、迁移先验知识、节约计算资源等,在少样本学习、强化学习等问题上都有良好的应用前景。当前有诸多不同类型、设计思路的面向元学习的计算策略不断提出,因而如何对元学习问题进行系统的建模以及方法的归纳显得尤为重要。本论文通过引入动态系统以及最佳响应理论,帮助重新建模元学习问题的数学模型,提出一个通用的双层优化统
由于心血管疾病的高致病率和高死亡率特性,它已成为危害人类健康和生命的“头号杀手”。对心血管疾病进行有效诊断和预防尤为重要。近些年,随着深度学习理论和技术的快速发展,借助深度学习对心电图进行特征分析以及病症分类已成为智能医疗健康领域研究的热点问题。但是针对于临床应用,依然存在很多实际问题需要解决:如心电图采集和传输过程中出现各种噪音干扰、缺失;大多数研究都是针对于单导联或是双导联心电图信号进行分类,
近年来,三维深度学习的研究已成为热点,它在自动驾驶、机器人等领域中都得到了广泛的应用。现阶段研究中三维模型数据集样本数量有限,规模无法与二维数据集相比,这也是困扰绝大多数研究者的问题。深度学习任务中数据集的匮乏会直接导致模型的性能出现瓶颈,数据增强技术就是为了应对这个问题而被提出的。在三维点云深度学习领域中,对于数据增强技术的研究还不多,本文主要研究三维点云数据的数据增强算法,提出的方法可以从源头
随着机器学习和人工智能等学科的发展,越来越突显出数据的重要性。个人或企业每天会产出或者收集大量的数据,数据的抓取越来越便捷,但是数据质量也逐渐引起人们的重视。其中数据缺失问题常常发生,甚至难以回避。实现算法或提供可靠的决策分析等都依赖于高质量的数据,因此数据填补是一项重要研究内容。本文首先基于自联想神经网络(Auto-Associative Neural Network,AANN)对不完整数据进行