【摘 要】
:
针对当前神经网络加速器难以高效实现目标跟踪边框后处理的问题,提出一种高效的目标跟踪专用加速器.引入神经网络架构,用于提取输入视图特征并生成边框置信度与偏移量集合.随后针对目标跟踪的边框处理设计了专用于边框的回归、惩罚以及提取操作的加速模块,通过同步神经网络加速器与专用加速模块间的数据,以流水结构并行执行特征提取与边框操作,实现基于深度学习目标跟踪的端到端处理.该加速器在40 nm工艺下消耗面积3.64mm2,获得了5.71 Tops/W能效比.实验结果表明:与现有加速方案相比,该目标
【机 构】
:
南开大学IC设计与系统集成实验室,中国科学院计算技术研究所
【基金项目】
:
国家自然科学基金项目(62004198),北京市自然科学基金资助项目(4194092),国家重点研发计划(2018AAA0102505)。
论文部分内容阅读
针对当前神经网络加速器难以高效实现目标跟踪边框后处理的问题,提出一种高效的目标跟踪专用加速器.引入神经网络架构,用于提取输入视图特征并生成边框置信度与偏移量集合.随后针对目标跟踪的边框处理设计了专用于边框的回归、惩罚以及提取操作的加速模块,通过同步神经网络加速器与专用加速模块间的数据,以流水结构并行执行特征提取与边框操作,实现基于深度学习目标跟踪的端到端处理.该加速器在40 nm工艺下消耗面积3.64mm2,获得了5.71 Tops/W能效比.实验结果表明:与现有加速方案相比,该目标
其他文献
非均衡数据(分类不均匀分布)和冗余特征的出现极大增加了数据准确分类的难度.以最优化学习算法的预测准确率为目标,结合合成少数过采样技术SMOTE,设计了一种针对非均衡数据的
为获取脉动微波循环加热条件下低渗透储层煤层气运移采出规律,文中综合运用多孔介质传热学、电磁学、渗流力学、岩石力学等相关理论,建立低渗透储层煤层气微波注热开采过程渗流电磁-热-流-固多物理场耦合数学模型,结合COMSOL Multiphysics有限元分析软件进行了脉动微波循环加热过程煤层气运移采出规律的数值模拟,获取了不同功率脉动微波循环加热条件下煤层温度场、渗流场的变化规律,并对煤层气产量进行了预测。数值模拟结果表明:脉动微波循环加热煤储层热效应显著,煤层能快速且不断地处于高温状态,气体在高温条件下大量
介绍具有恒流特性的中频高压电源,利用改造前的变压器,节约成本。本产品在高压电源改造时,改造工作量小,安装简单。改造后的高压电源利用控制柜内的电容C和升压变压器的原边电感L组成LC串联谐振电路,具备恒流源的特性,在变压器输出端并联假性负载,以实现开路保护功能。
随着当今科学技术的不断发展,电力大数据技术已经在智能电网中得到了广泛应用。通过应用该技术让智能电网集成管理、数据分析、数据处理以及数据安全方面的技术都实现了显著提升,这对于智能电网的良好应用和发展都十分有利。通过分析这些电力大数据关键技术在智能电网中的应用,以此来为智能电网的进一步发展提供参考。
为了快速预测三维复杂环境中雷达、移动基站等的覆盖性能,提出一种三维抛物方程方法即分步傅里叶变换(SSFT)解法的快速计算方法,并给出了具体公式推导。将SSFT解法快速算法的计算结果与双射线模型以及已有的奇偶分解法进行了对比,结果表明,其与另外两种方法的结果吻合很好,且与奇偶分解法相比,计算速度提高了近1.61倍,由此验证了该快速算法的正确性和高效性。在此基础上,模拟了雷达在复杂海上环境中的电磁衰减特性,探讨了雷达探测的盲区,这将为复杂环境中雷达探测性能的评估提供一定的理论参考。
传统二维重构Toeplitz类算法在进行二维相干信源DOA估计时,利用构造两个相关矩阵或协方差矩阵的部分信息构造Toeplitz矩阵,使得信息利用不完整且需要额外的去噪处理.针对上述问题,提出一种基于二维重构Toeplitz类算法改进的Toeplitz矩阵集重构算法.利用完整阵元接受信号矢量构造两个包含完整信息的Toeplitz矩阵集,再与其共轭转置相乘求和来对矩阵修正而得到满秩矩阵,从而达到去相干的目的;结合传统ESPRIT算法通过旋转不变性进行两次一维重构处理再进行角度匹配来实现二维的相干信号角度估计
设计了一款E波段高增益天线,该天线由基片集成波导缝隙天线和透射阵组成.为实现足够的相位补偿范围,设计了多种贴片结构单元.该透射阵共有289个单元,口径尺寸为33.065 mm×33
针对传统CycleGAN在图像去雾后出现模糊和颜色失真等问题,给出了一种改进CycleGAN的图像去雾网络.所提CycleGAN的生成器包括特征提取、特征融合和图像复原三个子网络.图像特征提取子网络用于提取图像的内容特征和风格特征,特征融合子网络利用两种不同的注意力机制分别对提取到的内容特征和风格特征进行融合,图像复原子网络将融合后的图像特征还原成无雾图像.与传统的CycleGAN和已有的去雾网络
设计了一种低成本的64倍降采样数字抽取滤波器,对∑△ADC的输出码流进行滤波和抽取.为节省面积和保证稳定性,首先选用2抽取级联的滤波器实现方式;其次对单级滤波器进行结构优化,采用更省面积的折叠转置结构;在此基础上对系数相乘与加法部分进行了系数优化和公共项提取;最后采用Modelsim进行了电路仿真,验证了功能.通过优化,可降低寄存器和加法器的使用至优化前的59%和35%,资源优化率达到了41%和65%.数字抽取滤波器采用SMIC 0.18μm CMOS工艺实现,工作电压3.3 V,芯片面积为1.13 mm
优化了简单生成对抗网络结构,用于更有效的通过对抗性实例训练得到视觉显着性图,减少假阳性产生和提高显著性.网络模型仍遵循传统生成对抗网络结构,第一阶段是由一个使用残差结构建的生成器组成,该模型的权值由显著图的下采样版本的二分类交叉熵损失(BCE)的反向传播计算得到的,训练得到更有效的显著图.预测结果由受训练的判别器网络进行生成阶段生成的显著图与真值图之间的二值分类处理.实验展示了改进生成对抗网络中的