【摘 要】
:
针对大多数基于FPGA的加速器受限于运算资源与访存带宽,很难部署大型的神经网络这一问题,通过研究神经网络的计算特点,运用通用计算模型的思想,提出了一种指令集架构的神经网
【机 构】
:
上海大学 微电子研究与开发中心,上海200444;上海大学 微电子研究与开发中心,上海200444;上海大学 计算中心,上海200444
论文部分内容阅读
针对大多数基于FPGA的加速器受限于运算资源与访存带宽,很难部署大型的神经网络这一问题,通过研究神经网络的计算特点,运用通用计算模型的思想,提出了一种指令集架构的神经网络协处理器的设计方案.该方案中的协处理器具有一套专用的运算指令集,支持多种神经网络结构的运算,搭配相应的指令生成程序,能够灵活快速的进行神经网络在FPGA平台上的部署.考虑神经网络运算的相似性,对电路进行复用,降低资源的占用;设计内存多端口读写控制模块,通过协调片上缓存与片外存储,降低对访存带宽的需求.使用python与UVM验证方法学搭建验证平台进行验证,并在PYNQ-Z2开发板上进行实验.结果表明:方案中的协处理器对激活函数的运算误差在0.05以下,对其他类型指令的运算误差在10-4级别,工作在100MHz下的运算性能达到41.73GOPS,达到同类设计的主流水平,消耗的资源比同类设计平均降低80%.
其他文献
Photocatalysts with the photocatalytic “memory” effect could resolve the intrinsic activity loss of traditional photocatalysts when the light illumination is
风电机组传感器受环境干扰,导致采集的信号存在差异,从而对风电机轴承的故障诊断结果产生影响。为提高故障诊断的可靠性,提出一种多源信号故障诊断方法。提取轴承振动信号、噪声信号、温度信号的时域、频域特征作为故障特征,利用经贝叶斯优化算法优化隐藏层节点结构的堆叠降噪自编码器对故障特征进行融合,采用Softmax对融合的故障特征进行分类。实验表明:该方法的故障准确率比单一信号进行故障诊断的方法更高,并且混合
The Mn1.95-xCo0.21Ni0.84SrxO4 (MCNS) (0 ≤ x ≤ 0.15) based negative temperature coefficient (NTC) materials are prepared by co-precipitation method. The replac
冲击对系统可靠性产生一定影响,而如何量化冲击载荷的影响程度成为系统可靠性分析的关键。在退化失效与突发失效竞争的基础上,研究系统受到不同冲击强度影响下的可靠性模型精度问题。在失效阈值可变的情况下,以极值冲击描述冲击过程,Wiener过程描述两类失效的退化过程。针对不同强度冲击对系统的影响下,考虑对冲击进行载荷区域的划分,建立两类失效过程的分布函数,提出了系统竞争失效的可靠度模型。结合Sandia微引
Lead-free Na0.5Bi0.5TiO3 (NBT) ceramics were prepared via a conventional oxide-mixed sintering route and their electrical transport properties were investigated
A quasi-solid-state lithium battery is assembled by plasma sprayed amorphous Li4Ti5O12 (LTO) electrode and ceramic/polymer composite electrolyte with a little l
针对大排量摩托车中高速行驶时前悬架系统摆振(wobble)和后悬架系统迂回摆动(weave)的综合问题,提出一种基于灵敏度分析和近似建模的多目标优化方案。建立摩托车模型并完成动力学仿真,以表征摆振和迂回摆动的前轮质心位置侧向加速度、整车质心位置横摆角速度和侧倾角速度为目标,对悬架系统参数进行灵敏度分析和近似建模,基于分析结果完成悬架系统参数的多目标优化,并利用根轨迹法对优化结果进行验证。结果表明,
为充分发挥电价对市场的调节作用,考虑用户对实时电价响应行为的差异性,将用户分为短期用户、混合用户和长期用户,基于电量电价弹性矩阵构造了3类用户的实时电价模型。在此基础上,建立了一种基于用户对实时电价响应行为的源荷协调日前调度模型。借助MATPOWER中的MOST工具包和Mosek求解器,算例分析在一个修改IEEE7机57节点系统中展开,与传统经济调度模型的比较结果证明了所提模型的有效性。此外,分析
目前对决策树(Decision Tree,DT)分类问题的相关研究已取得了很多成果,但仍存在一些问题,如决策树在寻找最优切分点时需要遍历特征的所有取值,当数据集规模较大时,递归构建决
针对现实购物场景中存在的用户偏好多样性且兴趣动态变化的问题,本文提出一种融合上下文信息的序列推荐模型(DeepSeq),通过嵌入用户提供的反馈信息深入挖掘用户的长短期潜在