基于FPGA的MD结构杂凑算法加速器的设计与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:gyf2033
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
杂凑算法作为密码学三类基础算法之一,在现代密码学中起着重要作用,被广泛应用于数据完整性校验、身份认证等场景。由于杂凑算法软件实现速度慢,安全性差,因此对高吞吐和低延时的杂凑算法硬件实现的需求也越来越强烈。由于杂凑算法的多样性,在不同场景下,人们对算法的需求也不同,因此本文实现了一种基于MD结构的通用算法加速器,以SM3和SHA256为例,在兼容两种算法的同时,优化了硬件资源利用率并提高了加速器性能。本文首先对两种杂凑算法进行了分析,将加速器分为硬件实现部分和软件实现部分,通过对比各种硬件实现方式的优劣,选用了 Xilinx公司推出的ZYNQUltraScale+MPSOC系列开发套件完成加速器实现,并提出了加速器硬件部分实现方案。其次,介绍了加速器硬件电路部分的设计与优化过程。为了实现通用加速器的设计,加速器根据算法结构被划分为多个模块:控制模块、扩展模块、压缩模块和存储模块。扩展模块设计时,首先对算法分析得到了算法的最大并行因子,用于设计并行电路,其次设计了一组高数据复用率的寄存器组以支持并行电路的高效工作。压缩模块设计时,逐个分析了每一条关键路径,优化算法路径以减少计算次数,对关键路径中由于加法计算的高延时点使用保留进位加法器和超前进位加法器进行替换,并将不同算法中的相同逻辑函数使用共享电路实现。存储模块根据扩展模块和压缩模块的需求,将位宽和深度与之匹配,在使用最少RAM资源的同时,减少数据读写的延时。在模块设计完成后,站在模块级的角度,设计了粗粒度的流水线,使扩展与压缩模块流水线工作,进一步提高加速器吞吐率。最后,将加速器部署在ZCU104开发板上,并通过实验对加速器的性能与资源占用等数据进行了对比与分析。实验结果表明,加速器能够在节省了一定资源的情况下完成对多种算法的兼容,并且提供较高的吞吐率,并随着消息组数的增加吞吐率也不断提高,在250MHz时钟频率下,吞吐率上限为1907.35Mbps,为杂凑算法加速器的设计提供了新的思路。
其他文献
等值线图作为数据可视化的传统手段,在石油勘探、采矿、地球物理和气象预报等诸多领域中应用广泛。地质研究表明,从复杂地质中准确计算断层区域对发现石油与天然气等资源有重要的指导作用。本文旨在研究在存在断层的情况下如何追踪地层内部的等值线,辅助定位油气资源的聚集区域。使用等值线图提取地层结构是地质结构研究的重要手段,但当断层相交、断层类型不一致等复杂地层出现时,传统的等值线计算结果很难满足实际需求。本文针
学位
三维形状的结构分析是三维视觉领域内的重要研究内容,在机器人抓取和场景理解等方面具有非常重要的应用。随着激光雷达等设备的逐步成熟和点云扫描技术的不断发展,点云数据也得到了越来越广泛的使用。因此,点云的结构分析与理解成为一个重要的研究问题,而预测关键点或者结构点是解决这一问题的有效方式。二维图像中的许多关键点检测技术都已经成功移植到三维点云模型上来,比如SIFT算子和Harris角点等。SIFT算子预
学位
图像分类作为计算机视觉领域中一个极其重要的基础任务,一直受到国内外学者的广泛关注。近年来,深度神经网络凭借其强大的学习能力,已逐渐成为解决图像分类任务的主要技术路径。然而,随着对图像分类的精度要求越来越高,深度神经网络的模型结构变得越来越复杂,参数量也随之越来越大,这使得深度模型的实际落地应用受到了极大的限制。针对上述问题,以知识蒸馏为代表的模型轻量化技术应运而生。虽然现有的知识蒸馏方法取得了显著
学位
随着数字设计、虚拟现实、计算机游戏等技术的快速发展,3D模型的数量和规模在各类业务中呈现快速增长。3D形状识别和分类是进行形状理解、智能设计、模型检索以及提高人机协同效率的基础。因此如何使计算机快速准确完成对大量3D形状的识别,成为计算机图形学领域的研究热点。深度学习近年来在众多领域取得重大进展,人们也将其应用到3D形状分类任务中。但3D形状数据并不是一种欧氏数据,这与深度学习的基本计算方法相冲突
学位
由于交通事故行为在真实环境下表现为类型复杂,行为发生的时间跨度较大,产生的时间跨度却极小。通常来说,产生交通事故的小片段对于交通事故是否发生具有重要意义,在构造深度学习张量之前精确的定位这些小片段会提高行为识别模型的准确率。同时,行为识别模型中时间维度的额外引入带来了高昂的计算代价,特别是以3D卷积为基础的深度学习模型。在构造3D张量时,张量时间上的维度会远小于视频本身,视频中稀疏的交通事故行为无
学位
三维目标跟踪是增强现实系统实现环境感知和对动态物体进行空间定位与虚实空间注册的重要手段。然而,相比于传统的平面标志,三维跟踪需要在更高维度的空间进行位姿搜索与优化,并且涉及大量的图形运算,因此在跟踪稳定性和计算效率上都面临更大的挑战。同时,近年来随着手机等便携式移动设备的普及,增强现实的主流平台目前都主要面向移动设备,计算性能非常有限,并且要综合考虑功耗、时延等实际问题。因此,尽管三维目标跟踪与检
学位
目的 研究经血来源的间充质干细胞(MenSCs)对子宫内膜血管生成的调节作用及分子机制。方法 应用MenSCs来源的条件培养液(0,500,1 000,2 000μl)分别培养原代培养的子宫内膜基质细胞,共作用48 h后,采用实时PCR和In Cell-Western的方法对子宫内膜间质细胞中CXCL1的表达进行分析。将子宫内膜基质细胞(组1)、MenSCs和子宫内膜基质细胞(组2)、MenSCs
期刊
可视分析作为一种重要的数据分析方式,在今天的各行业中扮演着越来越突出的角色。可视分析以数据可视化和人机交互技术为基础,通过具像化的数据形象和多层次的交互探索让用户形成对数据全面立体的感知。在地理信息探索、医疗诊断、商业运营分析等各种领域中,可视分析方法都作为高效的分析手段受到越来越多的关注和青睐。随着房地产市场的繁荣,房产经纪行业近年来迅速发展,目前已形成遍布全国、规模庞大的行业体系,庞大的房地产
学位
随着近些年来电子商务平台的繁荣发展,存在于互联网上的时尚商品数据总量呈指数级爆炸增长,海量的服装数据虽然提供了更多的选择,但也导致了信息过载现象,这使得用户眼花缭乱,难以有效地从中找到他们心仪的商品。因此,个性化的时尚商品推荐技术受到了研究者们的广泛关注。该类方法旨在根据用户的历史行为以及某些辅助信息来建模用户的个性化偏好,并基于此从大量的服装数据中为用户推荐其最可能感兴趣的商品。与传统的推荐任务
学位
近年来,随着国家对安防领域的重视程度与日俱增,监控视频的数量呈现指数级增长。为了在监控视频中高效地检索特定的视频片段,跨模态视频片段检索任务受到了研究人员的广泛关注。目前,现有方法大多数是基于监督学习的检索方法,即严重依赖于目标视频片段的开始和结束时间标注。尽管这些方法已经取得了很可观的成效,但难以普及到实际应用中,具体原因如下:首先,人工标注目标片段的开始和结束时间耗时耗力,致使难以收集到大规模
学位