基于FPGA的卷积神经网络及椭圆曲线算法的硬件加速研究

来源 :广东工业大学 | 被引量 : 2次 | 上传用户:lrh791020
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着摩尔定律的逐渐失效,软件加速方案对性能的提升遇到了瓶颈。特别是对于具有计算密集型和数据密集型特点的新兴应用,用中央处理器(CPU)实现的软件方案已经无法满足新兴应用的需求。而硬件加速技术可以解决新兴应用的需求,因为硬件加速方案可以提供足够的计算资源,并且对控制流的支持较少。本文的研究重心是硬件加速,而椭圆曲线密码(ECC)算法和卷积神经网络(CNN)都有计算量大和复杂度高的特点,特别适合作为硬件加速的研究对象。并且椭圆曲线算法的模运算和点运算的操作数数据长度大,通常为256-bit,属于高数据长度的计算任务,具有计算密集型的特点;卷积神经网络的卷积计算是由大量重复的乘法和加法组成,属于重复运算量大的计算任务,具有数据密集型的特点。椭圆曲线算法和卷积神经网络作为两种不同类型的计算任务,是作为硬件加速研究对象的最佳选择。在信息安全和深度学习两大新兴应用中,椭圆曲线密码算法ECC和卷积神经网络CNN作为运用较多、较热门的密码算法和网络类型,研究他们的硬件加速技术具有重要的研究意义和应用价值。本文针对椭圆曲线算法和卷积神经网络的硬件加速方案的几个关键问题进行研究。本文的主要研究工作和创新点如下。(1)以低功耗为设计目标,分析归纳现有研究中的椭圆曲线算法硬件架构的优缺点,并以此为基础提出了基于加法器的低功耗架构。减少硬件资源的消耗可以降低功耗,在低功耗架构中,减少加法器的使用可以降低功耗。首先,在保证性能不变的前提下,优化交错模乘算法使得加法器从三个减少到两个,优化二进制模逆算法使得加法器从四个减少到两个。然后,通过硬件复用技术使得模运算仅使用两个加法器,模运算包括模加、模减、模乘、模逆。最后,为了充分利用加法器,使用流水线技术优化点加运算和倍点运算算法,优化其中的模运算算子调度顺序,提高点乘运算的效率。为了使得本文提出的低功耗架构具备更高的安全性能,使用抗简单功耗分析攻击(SPA)的点乘算法。该架构在Xilinx Virtex-4上实现,与其他架构相比,本文的低功耗架构节省了 17.58%-74.80%Slices资源。(2)以高性能为设计目标,研究和分析现有的椭圆曲线算法硬件架构的优缺点,提出基于半字乘法器的高性能架构。首先,因为模逆是较复杂和耗时的一种运算,点加和倍点运算选择在仿射-雅克比坐标下实现以避免模逆运算。为了高效地实现特定素域下的模乘运算,采用乘法和快速模约减相结合的方法。乘法运算采用Karatsuba-Ofman算法来实现,并且提出基于一个半字(half-word)乘法器的乘法结构。该乘法结构只需要消耗三个时钟周期就可以实现全字(full-word)乘法操作,而传统的乘法结构则需要消耗六个时钟周期。在国密算法SM2中,针对特定素数SCA-256提出了两阶快速模约减算法。该算法使得约减后的中间值为0≤Z<2p,而不是传统算法的0≤Z<14p,避免了为了得到0≤Z<p的迭代减法运算。采用流水线设计,优化点加运算和点乘运算的算子调度顺序,充分利用乘法器,提高点乘运算的效率。为了进行性能验证和对比,该架构在Xilinx Virtex-6,Virtex-5和Virtex-4上实现。实验表明,本文的高性能架构的性能是其他架构的性能的3.18-7.58倍。(3)分析归纳现有研究工作中的卷积神经网络硬件架构的优缺点,提出可重构卷积神经网络硬件加速架构,并且提出基于roofline model的设计空间探索方法以充分发挥该架构的性能。现有的基于FPGA的卷积神经网络硬件加速研究工作有许多不足之处,例如他们的架构的可重构/可配置性不强和没有提出有效的方法来充分发挥加速器的性能。首先,本文设计了基于处理单元(PE)阵列的可重构四层卷积加速引擎,充分地利用了 FPGA提供的DSP计算资源。然后,研究卷积神经网络的计算划分和循环展开,并且进一步研究不同循环展开下的数据存储模式和数据传输方式,提出混合固定的数据存储模式。最后,给出该架构的rooflinemodel,并提出设计空间探索两步法以获得更好的卷积性能和更低的数据传输功耗。该加速器在Xilinx Zynq-7000 SoC ZC706评估板上实现。实验结果表明,本文的卷积神经网络硬件加速架构在可重构、性能、功耗、DSP利用率等方面的整体性能远大于其他的加速器。
其他文献
【正】 近10年来,我国的辞书出版事业呈现空前繁荣的景象,各类词典质量高、数量大,品种丰富,门类齐全,辞书的编纂出版正逐步向系列化的目标发展。作为整个辞书事业的一个组成
【正】 5月25日,本刊编辑部假中国社会科学院语言研究所会议室,举行北京地区作者座谈会,征询继续办好《辞书研究》的意见,并为论文集《辞书编纂经验荟萃》组稿。出席会议的有
脾虚证本质的研究是中医现代化研究的重要内容之一。随着研究的深入,人们发现脾虚证的致病机理涉及消化系统、免疫系统、内分泌系统、神经系统、血液系统、肠道菌群和能量代
无论是2003年令人恐慌的非典,还是2020年来势汹汹的新型冠状肺炎,惊人相似的历史事实再次向我们强调健康的重要。身为医者,在经历了与病毒几个月的激烈鏖战后,我真诚地向全国
【正】 1 英语里的Lexicography,或俄语里的,一般译作“词典学”、“词典编纂法”,这意思似乎很明确,没有什么疑问。但是,如果查阅几本西方和苏联出版的不同工具书,就会发现
左旋多巴(Levodopa,L-DOPA)主要用于治疗帕金森综合症。虽然左旋多巴化学合成工艺已经发展得十分成熟,但是反应需要铅、汞等重金属造成环境污染。生物法合成左旋多巴具有反应条
【正】 自《说文解字》纂成算起,中国的字典编纂已有1800多年历史,编成的字典汗牛充栋。这些传统字书,基本是从形、音、义三方面来诠释汉字的。随着信息社会的到来,作为信息
<正> 绿脓杆菌是一种条件致病菌,在医院内感染所占比例中大幅度增加,它能引起继发性感染或混合感染的慢性炎症,也可引起肺炎、脑膜炎、败血症等严重的急性感染。据报道老年人
龙门加工中心数控系统的运行主要依靠机电综合技术,具有高效、高精准度的特点。目前必须结合制造业的使用需求对龙门加工中心数控系统进行国产化改造,以进一步提高龙门加工中
Polysulfone(PSF)has received growing attention in membrane fabrication,for the treatment of water and wastewater due to its good physical-chemical properties upon