【摘 要】
:
人工智能对数据处理的需求不断上升,通用的图形处理单元不能为特定任务发挥最优的性能和功耗,而人工智能专用芯片,尤其是特定应用场景的加速器,由于能提供并行性和定制运行流程,达到最佳能效,已成为当前移动终端产品主流的解决方案。另一方面,由于设计规模的与日俱增和制造工艺节点的提升,人工智能加速器芯片的功能日趋复杂,设计出错的可能性大大增加,芯片验证的准确性、完备性和稳定性成为芯片研发的重点。卷积神经网络的
论文部分内容阅读
人工智能对数据处理的需求不断上升,通用的图形处理单元不能为特定任务发挥最优的性能和功耗,而人工智能专用芯片,尤其是特定应用场景的加速器,由于能提供并行性和定制运行流程,达到最佳能效,已成为当前移动终端产品主流的解决方案。另一方面,由于设计规模的与日俱增和制造工艺节点的提升,人工智能加速器芯片的功能日趋复杂,设计出错的可能性大大增加,芯片验证的准确性、完备性和稳定性成为芯片研发的重点。卷积神经网络的硬件实现大多通过高级语言生成寄存器转化级电路,该方法对可综合RTL的支持比较有限,在产品的迭代和工程复用性等方面也带来很大的挑战,而本文以硬件描述语言为基础,研究并设计实现了具备卷积神经网络前向运算功能的硬件加速器,完成UVM仿真和FPGA板级验证,确保功能的正确性,也便于卷积神经网络的开发和应用,快速地部署到嵌入式平台。本文结合硬件验证语言System Verilog和UVM验证方法学的优势,对通用验证方法学的平台结构、核心机制和寄存器模型等多方面进行分析,并介绍了接口协议,为制定验证测试用例的激励时序提供参考。研究并设计了一款物联网终端应用中的卷积神经网络硬件加速器,并以此为验证对象,完成了仿真验证平台和原型验证平台的搭建。在此之前,先介绍了这一类神经网络的特点,分析其前向传播的工作流程,然后研究分析加速器模块数据流、卷积计算等功能,常用算法模型的卷积层参数适配,以及各个模块寄存器的功能配置。根据UVM验证方法学思想和设计规格,构建平台的通用验证组件,实现组件之间通信,生成与待测试模块寄存器相对应的寄存器模型,完成了硬件加速器模块的验证平台搭建。重点进行了测试用例的开发、寄存器模型的读写访问操作、参考模型的实现和记分板的结果自动比对。通过大量的测试用例对加速器模块进行全面的仿真验证和覆盖率收集,并对仿真验证平台的代码进行优化,进而缩短了仿真时间,提高了验证平台的可重用性。接着,进行了板级测试环境的搭建,以仿真验证平台测试用例产生的激励为基础,用调试器将数据转换为JTAG协议灌入加速器模块运行,进而验证仿真平台的正确性。在加速器多通道数据读取时,采用一种固定优先级轮询仲裁器,解决仲裁的公平性问题,节省FPGA的资源和功耗。仿真验证和板级测试结果表明,专用硬件加速器设计合理,验证正确,完成所有的功能点测试,代码覆盖率达到100%,所有测试用例的计算结果比对正确,符合设计预期,设计代码综合成门级电路,并进行优化,生成基于工艺库的网表文件。
其他文献
视觉目标跟踪作为计算机视觉领域的热门问题之一,在跟踪目标的过程中,始终存在目标形变、背景复杂等困难。随着深度学习的发展与计算机硬件的增强,视觉目标跟踪不再局限于传统方法,转而利用深度网络提取更丰富的目标特征,构建更加鲁棒的表观模型,虽然一定程度上缓解了跟踪难度,但仍存在一些问题未能解决。本文从跟踪过程中容易忽略的难点出发,利用深度学习的方法对现有的目标跟踪算法进行了改进,分别在构建表观模型和缓解目
探地雷达(Ground Penetrating Radar,GPR)是一种用于探测地下结构分布的电磁勘测技术。GPR采集的数据具有规模大、时空特性复杂和对勘测环境敏感等特点,其中时变结构模态是GPR数据中最有价值的信息,对了解地下结构分布起着非常重要的作用。但是,由于GPR数据中存在大量的噪声、杂波,导致传统的时变结构模态挖掘方法存在时间复杂度高、鲁棒性欠佳等问题。因而,提高时变结构模态挖掘过程的
光伏发电因其具有保护环境、可再生的优势得到市场的认可,并被国家大力推广,因此得到快速的发展。在实践中,光伏发电系统输出的功率与当时的天气状况、设备运行状况等息息相关,并且随着时间和天气状况变化而出现波动性。随着大规模的光伏发电接入电网,电力系统的安全运行受到极大挑战。因此,实现对光伏发电功率的精准预测对优化机组启停计划,保障电网安全稳定运行具有重要意义。本文提出一种基于Elman神经网络、粗糙集属
高血压是一种严重危害人类身体健康的心血管疾病,诱发高血压发病的因素众多,至今尚未完全阐明,在诱发高血压的众多因素中,由基因遗传引起的原发性高血压最主要的原因。近年来,由于基因芯片和DNA微阵列等高通量、短读取、低成本测试技术取得的巨大进展,因此出现了很多的基因组表达数据分析方法,这种基因组的数据分析方法可以揭示基因组活性,从基因的角度去探究一些疾病的发病机制。集成算法、聚类算法及加权基因共表达网络
随着多媒体电子设备的应用和互联网的快速发展,大量用户使用社交媒体平台发布多媒体数据,如短视频、文字、图像等。从海量多媒体数据中准确检索信息有着巨大的应用需求,使得跨媒体检索得到了学术界的广泛关注并开展了深入研究。跨媒体检索使用一种媒体类型的查询数据,返回语义相似但媒体类型不同的检索结果。由于不同媒体类型的特征编码方式不同,无法直接进行相似度度量,因此“异构鸿沟”的存在使跨媒体检索任务面临巨大的困难
在标注正确且数量充足的有标注样本数据集上,有监督分类模型往往可以取得较好的分类效果。但是,实际应用中有标注样本是有限的,采集训练样本是十分繁琐的,并且标注样本工作即费时又费力,代价昂贵。那么在有标注样本匮乏的情况下,如何利用有限的有标注样本和大量的未标注样本,训练泛化能力更强的模型是当下至关重要的问题。因此,本文利用大量廉价的未标注样本和先前已有的少量有标注样本,结合教师-学生模型和半监督学习,基
课堂行为识别是教育领域关注的热点之一。在课堂上,教师通过观察学生的行为判断学生学习状态,但这种方法费时费力,不能满足智慧学习环境下大规模课堂分析需求。随着深度学习技术在文本处理、语音识别、目标检测等方面的快速发展,探索利用深度学习技术识别学生课堂行为具有重要的意义。本文重点关注实际教室中的学生课堂行为,提出将深度学习技术应用于课堂行为识别,实现对学生日常课堂行为的监测与分析。该研究对提高课堂教学质
软件定义网络(SDN)是一种控制与转发分离的新型网络架构。SDN控制层作为SDN网络的中枢,承担着流表规则下发与全网逻辑控制的重任,是DDo S攻击重点关注对象,控制层一旦受到DDo S攻击将出现单点失效的状况,导致整个SDN网络瘫痪。展开针对SDN控制层DDo S攻击的检测与防御技术研究,对于保障SDN网络安全运行,提升可用性、可靠性具有重要意义。本文围绕相关问题展开研究,主要工作如下:1.提出
填埋是当前生活垃圾与工业固废集中处置的有效措施,也是符合未来环境友好型发展的重要手段。在垃圾填埋场长期的运营过程中,特别是填埋场封场以后,水平高密度聚乙烯(High Density Polyethylene,HDPE)防渗帷幕维护难度较大,防渗系统失效后渗滤液扩散会导致更大范围的污染。为此常在垃圾填埋场运营中后期建立垂直防渗帷幕,以防止或阻止渗滤液的扩散。目前,国内垂直防渗帷幕完整性检测研究较少,
公立医院运营管理具有系统性与战略性、广泛性与分散性、统一性与灵活性的特点。单位层面的运营管理是基石,也是业务层面运营管理顺利推进的保障;而业务层面的运营管理是提升效率与效果的关键,主要有运营管理助理、项目管理、职能部门MDT管理、网格化管理等模式,可以视具体情况采取其中一种或几种模式,更好地实现协同效益。