【摘 要】
:
深度学习的出现使得计算机视觉得到了蓬勃的发展,而目标检测作为计算机视觉中最为基础的任务,已经在自动驾驶、智能监控、智慧医疗等各个领域中得到广泛的应用。近年来随着社交媒体网络和移动/嵌入式设备的普及,使得视频和图像数据量急剧增长,进而导致了对视觉数据分析的需求不断增加,如何兼顾算法的速度与准确度的平衡,尤其是实现适用于移动低端GPU设备的实时目标检测算法成为当前研究的热点。本文在实时目标检测算法YO
论文部分内容阅读
深度学习的出现使得计算机视觉得到了蓬勃的发展,而目标检测作为计算机视觉中最为基础的任务,已经在自动驾驶、智能监控、智慧医疗等各个领域中得到广泛的应用。近年来随着社交媒体网络和移动/嵌入式设备的普及,使得视频和图像数据量急剧增长,进而导致了对视觉数据分析的需求不断增加,如何兼顾算法的速度与准确度的平衡,尤其是实现适用于移动低端GPU设备的实时目标检测算法成为当前研究的热点。本文在实时目标检测算法YOLOv5s的基础上进行研究与改进,在保证实时性的基础上提高算法的准确度,并将改进后的算法应用到嵌入式设备中实现了不同场景下的实时检测。本文工作总结如下:1.针对基准算法对小目标检测精度不足的问题,本文提出了一种基于自适应感受野增强(ARFA)和多尺度融合注意力机制(MFA)的特征融合网络。首先,自适应感受野增强模块(ARFA),使用空间金字塔卷积来融合不同感受野的特征,同时为了减少参数量,使用不同扩张率的空洞卷积来代替普通卷积。除此之外,对于每个卷积层,不同感受野的特征对网络的贡献是不同的,本文通过一种门控(gate)机制,让网络根据输入特征图去自适应学习不同感受野分支的权重,然后将各分支进行加权融合输出。其次,多尺度融合注意力机制(MFA),目的是建模不同分辨率特征在融合时通道间的相关性,通过网络学习的方式来自动获取到不同尺度每个特征通道的重要程度,最后再为每个通道赋予不同的权重系数,从而来强化重要的特征抑制非重要的特征,使得网络在融合不同尺度特征时可以自动学习不同尺度特征的重要性,能够更充分有效的融合上下文信息,为预测目标提供了更有效的特征信息。最后,本文结合ARFA和MFA提出了增强路径聚合网络(EPANet),在三个尺度的预测层上分别添加ARFA模块,提取更加细粒度的特征,然后在自上而下和自下而上的融合支路上都通过MFA进行融合,使得不同尺度不同感受野的特征能够充分而有效的融合,为预测网络提供了更丰富有效的特征信息,提升对小目标的检测效果。2.针对算法中庞大的超参数需要手动设定的问题,本文使用一种基于遗传算法和超参演化的超参搜索方法对算法中必要的超参数进行搜索,得到最优的超参组合,不消耗额外的推理时间能够提升算法的准确度。3.本文在对YOLOv5s算法改进的基础上,将在Pascal VOC数据集上训练好的模型经过onnx框架转换为TensorRT模型,经过量化加速后部署到带有低端GPU的嵌入式开发板Jetson Nano上,使用摄像头读入视频或直接输入视频或图像数据,通过控制传入参数切换自然场景检测、行人检测和车辆检测等任务,实现了一个移动灵活的实时多目标检测系统,具有一定的工程价值。
其他文献
大型反射面天线广泛应用于战略预警、深空探测、射电天文等领域。随着天线口径的增大和工作频段的提升,对天线指向精度的要求日益提高。与此同时,天线口径的不断增大导致结构的刚度不断下降,指向性能受服役环境的影响也越来越大。因此如何有效保障服役环境下的反射面天线的指向性能是制约天线性能提升的一个关键问题。针对这一问题,本文围绕反射面天线指向性能的监测和补偿两个方面展开研究,具体内容包括:首先,提出了基于指向
第五代移动通信系统(The Fifth Generation Mobile Communication System,5G)将毫米波段引入无线通信,解决了频谱资源短缺的问题,并采用了Massive MIMO波束赋形技术,从而实现了能量较为集中的窄波束定向传输。不仅弥补了毫米波的链路传输损耗,还加快了传输速率,提升了系统的容量。但随着通信双方天线数目的增多,波束宽度变窄,波束数目越来越多。在通信双方
在翻译工作中,译者必须对原文中使用的词汇、句法进行准确的把握,本着语义和句法功能对等的原则,对译语进行选择。如此才能使译文读者获得与原文读者相同的信息,真正实现等效翻译。本文基于上述原则,结合笔译实践文本中出现的具体实例,对于复合格助词“として”的汉译方法进行了分析与总结。“として”作为复合格助词,用法十分广泛。既可以单独接在体言后使用,也可以与其他助词(如格助词“の”、系助词“は”、“も”等)一
科普文的翻译和传播对于各国提高教育水平、促进科技进步均起到重要作用。而科普文本不仅涉及大量科学术语,还需要译者理解各学科知识、复杂文本的特征、多样的修辞手法。这对译者的知识素养、文字水平、翻译功底都提出了较高要求。要想解决这些问题,使译文为传播科学知识服务,就有必要选择合适的理论对翻译实践进行科学指导。没有适用于所有文本的万能翻译方法。我们需要根据文本的特点制定相应的翻译策略。此时,赖斯倡导的文本
太赫兹贝塞尔涡旋波束具有众多优良特性,它结合了太赫兹辐射的宽光谱带宽、良好穿透性,和贝塞尔涡旋波束的无衍射特性、自愈合特性以及携带轨道角动量的能力,在光镊、成像、量子纠缠和通信等领域有了广泛的应用。然而在实际的通信和成像等应用中,必须考虑环境对波束传播特性的影响。本文主要基于贝塞尔涡旋波束的圆柱矢量波函数展开,并结合边界条件,推导得到了贝塞尔涡旋波束在单/多层磁化等离子体介质中的反射和透射场。对于
德国功能翻译学派于20世纪70年代产生,是注重翻译功能的一种翻译流派,其核心思想为目的论,强调翻译的目的在翻译过程中具有决定性作用。在本次翻译实践当中,笔者基于目的论及相关先行研究状况,着眼于文学翻译的目的性,同时结合笔者本次翻译实践对象文本《三则插话》的特点,说明了目的论用于指导翻译实践的可能性,并通过具体例子分析了如何在目的论三原则的指导下选择合适的翻译策略,以解决翻译过程中出现的问题。目的原
在我国的传统文化之中,孝道居于核心地位。在孝道文化中,敬养和关爱老人是其重要内容。从古至今,孝道理念都与法律体系有良好的互动融合,我国对孝道理念融入中国特色社会主义法律体系也做了许多有益的实践,来保障老年人权利,督促人们严格履行尽孝义务。笔者希望通过这篇文章对当下中国孝道纠纷的意义进行论述,分析涉孝纠纷在司法审判实践中存在的问题并分析其背后原因,在这样的基础之上提出一些具有可行性的解决涉孝纠纷难题
企业员工健康服务管理系统是企业日常生产管理流程中对员工健康服务管理信息化的核心部分,员工健康服务管理系统管理工作内容繁杂、涉及对象多;随着数字化转型的要求,对工作流程效率和数字化要求的不断提高,使传统的员工健康服务管理的弊端日益凸显,因此设计一个智能化、数字化的员工健康服务系统,改善企业对员工的健康服务管理效率,优化流程,提高生产和办公效率成为企业员工健康管理数字化的当务之急。根据当前的发展形势,
随着器件特征尺寸的不断减小、芯片集成度的不断提高,超越摩尔定律成为了集成电路行业的发展趋势。在此趋势下,三维集成技术和TSV技术应运而生,成为实现三维微系统的关键技术途径。但是随着三维微系统集成度和功率密度的提高,对电学特性、热特性、应力可靠性等方面带来了诸多的挑战,因此同时考察电设计、热管理与应力的多场耦合分析势在必行。并且随着微系统尺寸的缩小,对封装级的三维微系统进行有限元数值仿真的复杂度也会
变化检测(Change Detection,CD)是通过对同一场景在不同时间获取的两幅或者多幅遥感图像进行对比,分析图像间的差异,从而获得所需的变化信息。合成孔径雷达(Synthetic Aperture Radar,SAR)是遥感技术中比较常见的获取遥感图像的方式,利用合成孔径原理实现高分辨的微波成像,不受天气等外界条件影响,可以全天候、全天时工作,因此SAR图像变化检测成为研究的热点。随着研究