【摘 要】
:
近年来,随着人工智能技术的发展,卷积神经网络(CNN)作为深度学习技术中的常用算法,在计算机视觉、语音识别及自然语言处理等诸多领域得到了广泛的应用.可编程门阵列(FPGA)因其高并行度和高灵活性等优势常被用于CNN的加速.基于此,本文对高性能CNN加速器的设计进行研究.文中采用DSP的级联、卷积核数据的“乒-乓”结构,以及多通道并行、特征图及卷积核数据的复用等方法,以期在资源受限的FPGA平台中为CNN的计算提供高性能加速.实验结果显示,本文的设计方法使用了较少的LUT资源,在Virtex7 VX690T
【机 构】
:
中国电子科技集团公司第五十二研究所,浙江 杭州 311100
论文部分内容阅读
近年来,随着人工智能技术的发展,卷积神经网络(CNN)作为深度学习技术中的常用算法,在计算机视觉、语音识别及自然语言处理等诸多领域得到了广泛的应用.可编程门阵列(FPGA)因其高并行度和高灵活性等优势常被用于CNN的加速.基于此,本文对高性能CNN加速器的设计进行研究.文中采用DSP的级联、卷积核数据的“乒-乓”结构,以及多通道并行、特征图及卷积核数据的复用等方法,以期在资源受限的FPGA平台中为CNN的计算提供高性能加速.实验结果显示,本文的设计方法使用了较少的LUT资源,在Virtex7 VX690T上的峰值运算性能达到1.6TOPs,对VGG16网络加速时吞吐量达到1.334TOPs,具有较高的计算性能和较少的资源消耗.
其他文献
针对可见红外成像辐射仪(visible infrared imaging radiometer suite,VIIRS)月度夜光遥感影像的数据缺失问题,提出一种利用地物邻近关系相关性的像元时空插值方法,以时、空关系互相作为约束条件,将时序变化一致性较好的像元数据作为空间插值的参考,将空间关系一致性较好的月度数据作为时序插值的参考,通过构建不同的卷积核,在时序和空间维度分别对初步插值结果进行卷积运算,求得待插值像元的时空插值.以2015年江苏省月度夜光遥感影像修复为例,对不同维度时空插值方法进行对比分析,结
企业的经营发展中,会计分析工作是重要的内部工作,对企业的盈利、发展等具有重要影响。但结合实际情况来看,企业会计信息失真现象仍然存在,在一定程度上影响到了市场经济的发展。基于此,本文从企业会计信息失真的成因出发,提出相关治理对策,希望能够为有关单位提供参考。
嘉兴地区洪涝台自然灾害情况严重,科学和高效防治至关重要.洪涝台灾害监测指挥系统运用物联网、云计算、大数据等技术,通过整合信息资源和应用系统功能,实现跨部门和跨层级的应急协同和信息共享,可以提升防灾减灾工作和应急管理工作的整体水平.
进入21世纪以来,传统计算机一直面临着数据频繁在CPU与存储器之间交换带来的功耗问题和存储墙问题.新型的存算一体化计算方式有望突破传统冯·诺依曼架构,实现低功耗、高算力的计算.忆阻器是一种具有低功耗、高速度、高密度、非易失等特点的新型电路元件,被认为是未来实现存算一体化的最佳载体.但目前忆阻器还存在功耗过大、稳定性低、器件参数波动大等诸多问题.针对这些问题,本文重点总结了四种提升忆阻器件性能的方法,包括电极优化、掺杂优化、界面优化和阻变层结构优化等,并分析这些优化方法背后的原理,得出调节氧空位浓度和分布将
随着科技和社会的发展,智能机器人慢慢融入到人类的生产生活中,发挥出越来越大的作用.本文针对传统送餐机器人存在的在送餐循迹过程中路径偏差较大、循迹时间过长等问题,设计并实现了一款基于模糊PID算法的循迹机器人系统.整个系统的硬件电路由信息采集模块、信号放大模块、电源模块、电机驱动模块等组成;软件上通过模糊PID算法来设计最优路径.通过试验验证,本方案切实可行,具有较好的应用和推广价值.
针对行车安全对隧道照明要求的不断提高,以及现有的计算机辅助设计存在过程较为繁琐、未针对隧道照明场景进行专门优化等问题,本文基于OpenGL设计了一种隧道以及隧道照明模拟系统.通过输入相应的隧道参数,该系统会自动生成隧道模型以及隧道照明灯具的安装示意,能够简化照明设计人员的工作流程,且符合照明设计规范和提高灯具的照明效率.
在军事领域中,雷达发射电磁波对目标进行照射并接收其回波,在此过程中可根据回波的信息(发射点的距离、径向速度、高度等)来判断敌人的方位.本文设计了中心频率f=9GHz左右的凹槽型小型化微带天线和雷达探测系统,包括电源降压模块、滤波电路模块和数据处理滤波模块.测试结果显示,系统能够正常工作,探测距离能够达到20m,满足设计指标.
在规划和设计智慧矿山系统中,我们对多种无线通信技术进行了测试,最终选择了国产无线通信协议DDA(Dynamic crypto Dense cover Ant colony)作为矿山井下传感器无线网的核心技术,取得了较好的效果.本文首先介绍了智慧矿山无线通信技术应用状况及存在的问题,然后介绍了DDA技术及在智慧矿山无线通信中运用的优势,最后对其具体应用进行了初步设计.DDA无线通信技术是针对物联网窄带业务特点设计的协议和算法,QOS(业务质量控制)、时延和阈值可控,可靠性大于99.9%,可以满足国防、工业和
超高频RFID因读写距离远、效率高、数据记忆容量大等优点,在物流仓储、生产制造等领域的应用越来越广泛.在智能工厂场景中,由于环境温度高、电磁环境复杂,影响了超高频RFID性能的发挥.本文结合智能工厂RFID的应用实践,对超高频RFID的读写器、电子标签和天线进行了优化,提升了超高频RFID的读写性能以及稳定性.
随着新能源汽车销量的快速增长,汽车电子化率日益提高,而作为其典型的动力提供者的储能电池包,关系着整车性能和安全性.如何根据实际应用场景和使用情况,确定电池包的性能、安全、电磁兼容性技术指标,已成为电池生产、研发、检测以及用户共同关注的重要内容之一.本文分析了锂离子储能电池的结构、工作原理以及所应达到的技术指标,为研发、检测和标准制定提供参考.