基于神经网络模型的硬件加速器设计空间探索及系统实现

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:su9989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统通用处理器在运行专用算法时,如神经网络等算法,存在功耗高、性能差、效率低等问题,为此许多研究者提出,采用硬件加速器来加速这些专用的算法。但随着应用需求的提高,硬件加速器也面临着设计成本越来越高、缺乏系统层级的设计探索框架、人工进行设计探索耗时长等问题。面对这些问题,本文提出了一种基于神经网络模型的硬件加速器设计空间探索方法,用训练好的神经网络模型评价硬件加速器,可以达到毫秒级的相应速度,使得设计人员能够及时对硬件加速器的成本以及性能开销进行合理评估,进而降低设计复杂度和时间成本。本文还设计了一种脉动阵列生成器,作为硬件加速器的实例,能够根据参数生成特定脉动阵列结构,将其与神经网络模型、相关自动化脚本组成一个系统框架,可以实现对硬件加速器设计空间的自动化探索,缓解人工设计耗时长的问题。最后,我们在Nexys4 DDR FPGA上构建了整个系统,实验结果表明,在面积功耗的预测效果上,我们设计的神经网络模型对面积的预测精度达到了89.2%,对功耗的预测精度达到了91.7%,对性能的预测精度达到了88.9%,并且在验证集的loss为0.0092,mae为0.0731,采用该神经网络模型探索得到的相对最优脉动阵列设计,较以往的工作,功耗开销降低75%,面积开销降低34%。
其他文献
Web应用程序凭借其轻量级、可扩展并且能够提供多样化服务的特点,已成为用户和应用服务之间最重要的通信方式之一。然而,web应用程序中的安全漏洞却并不少见,它们可能导致非常严重的后果,直接导致配置有web应用的设备遭受安全威胁。虽然将模糊测试技术应用到web应用上可以帮助安全研究人员快速又准确的对web应用的安全性进行评估。但是当前针对web应用的模糊测试技术中存在以下三大挑战:(1)Web客户端和
学位
在许多科学和工程应用当中,矩阵计算是一种重要的线性代数运算模式,具有基础性特点和广泛应用,许多高层次问题最终都要直接或间接转换为矩阵计算形式,同时,现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)在矩阵计算加速方面具有很大的优势。然而,当前矩阵计算的研究面临着计算模式单一、计算精度单一等挑战,并且随着工艺水平的提高,需要将矩阵计算硬件结构的资源消耗、存储
学位
由于SRv6技术具有流量控制能力强、可编程性高的优点,当前正在被广泛的使用到进行网络管理、实现流量工程中。随着IETF标准化进程的推进,SRv6技术的功能也越来越丰富和完善,可以预见,SRv6转发是未来的发展趋势。为了与快速发展的SRv6新技术匹配,目前通常采用软件实现SRv6转发,保证对新扩展的转发行为的支持。然而SRv6转发过程中存在多次的查表、匹配、修改报文头等操作,基于软件实现SRv6转发
学位
为促进设计过程中技术信息的有效传递,减少不同设计阶段的重复建模工作,对一体化设计模式在船舶与海洋工程领域的应用进行介绍,重点分析一体化设计的主要挑战以及实施要点。结果表明:一体化设计方法可有效加强设计阶段之间与设计专业间的信息沟通,进而提高设计效率,降低设计错误发生的概率。研究成果可为一体化设计模式在船舶与海洋工程设计工作中的应用提供一定参考。
期刊
分布式存储系统作为大数据存储的基础平台,在保证数据可靠性和可用性等方面发挥至关重要的作用。在某些服务器故障的情况下,为了保证数据中心存储的数据依然可用,分布式存储系统通常采用一定的容错机制,这其中主要包括基于副本的容错方法和基于纠删码的容错方法。然而,存储的容错主要通过增加数据的冗余来实现,这给数据中心带来较大的负担。虽然基于纠删码的存储方法可以获得比基于副本的方法更低的存储空间开销,但是其修复失
学位
随着全球信息产业迈向5G和大数据的兴起,边缘计算从概念已经逐步推动到了早期部署阶段。推动边缘计算发展的适用场景也逐渐产生,如超低延迟应用(通常小于10毫秒的往返时间)、实时计算、渲染和分析的实时处理、大容量数据传输等。另外,安全和数据保护也是推动边缘计算的关键因素。在众多推动边缘计算的应用中,自动驾驶技术、智能制造、在线游戏等正在引领主要潮流。尽管边缘计算已经兴起,但边缘计算的可持续发展以及面临未
学位
网络边界作为网络的架构边缘,是访问与服务提供的必经通道,边界的安全是保护整个网络安全的重要基础,其中VPN作为一种重要的网络边界防护技术,它存在的安全性问题引起各方极大关注。尤其是对广泛应用的IPSec VPN脆弱性问题进行研究在网络突防两个方面都具有重要现实意义。论文首先在分析当前流量识别技术的特点和存在的问题,对IPSec VPN流量识别问题进行了研究,提出基于有效负载特征识别技术与基于流特征
学位
作为自然科学和工程应用领域的重要模型和研究热点之一,非线性系统的预测问题一直广受关注。然而,由于其混沌性、不确定性等困难,使得非线性系统预测的研究进展一直较为缓慢。非线性系统预报预测技术的研究在气象、海洋、地震和金融等领域存在巨大需求,本文主要采用深度学习方法分别成功求解了El Nino3.4指数预测问题和偏微分方程数值解问题,数值试验结果表明:机器学习方法针对非线性系统预报预测取得了良好效果和较
学位
—近年来,数据中心主动型信用预约协议因为其快速收敛,低缓存占用和低延迟的特性,引起了业界广泛关注。然而,由于信用预约协议需要一个额外的RTT才能为新流分配理想的发送速率,因此存在资源浪费问题。为弥补带宽损失,一些工作(例如p Host,Homa)选择在第一个RTT内以线速率发送投机数据包,这将导致严重的网络拥塞。为了解决队列过长的问题,当拥塞发生时,Aeolus直接丢弃投机包。但是本文的实验数据表
学位
DNS重绑定是一种基于DNS协议脆弱性的攻击方式,能够有效绕过浏览器同源策略及防火墙的限制,提高恶意Java Script软件侵入私有网络的能力,窃取敏感信息,控制内网设备,危害巨大,因此亟需一种针对DNS重绑定攻击的有效检测方法。本课题以DNS重绑定攻击行为检测为研究目标,依据DNS重绑定攻击的实现步骤,从相关恶意域名检测、攻击流量检测、实网攻击载荷检测三个方面展开研究,以实现对此类攻击的有效检
学位