基于改进YOLOv3的红外目标检测方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:sunshine123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对红外场景中的行人、车辆等目标识别率低,存在复杂背景干扰的问题,提出了一种基于YOLOv3改进的红外场景目标检测方法Effi-YOLOv3,该方法结合高效的EfficientNet骨干网络降低模型的参数量,提升训练速度;通过引入改进的RFB感受野模块增大网络的有效感受野;同时基于可变形卷积和动态激活函数构建了DBD和CBD结构,提升模型特征编码的灵活性,增加网络模型容量;最后选择兼顾预测框与真值框中心点距离、重叠率和长宽比的CIoU作为损失函数。实验结果表明,改进后的算法模型大小仅有YOLOv3的
其他文献
在光照条件不充足的情况下,拍摄的图像质量较差。对于低光照图像增强,基于Retinex的方法大多忽略了降噪。本文结合Retinex和卷积神经网络构建了一个有效的模型,包括3个子模块,分解模块、注意力降噪模块和亮度调整模块。分解模块用残差连接方式和空洞卷积来构建,以减少在分解过程中细节信息的丢失,得到更准确的反射图和亮度图。降噪模块引入了注意力机制,对亮度图处理后得到注意力图用来指导反射图的降噪。亮度
期刊
在交通标志检测中,小而稠密的交通标志易受遮挡、恶劣天气等复杂自然环境的影响,导致检测性能较差。针对此问题,提出一种基于注意力机制的多尺度小目标交通标志检测方法。以CSPDarknet53为基础设计了一种新型的特征提取网络,使得输出特征图的分辨率得以增大、目标更易于检测,同时通过反卷积自适应级联结构融合浅层细节信息与深层语义特征。此外,构造了一种基于空间注意力机制的倒金字塔结构,以高分辨特征图生成的
期刊
分形图像压缩作为一种基于结构的图像压缩技术,在许多图像处理中得到了应用。但是分形图像压缩的编码阶段非常耗时,且重建图像的质量效果不佳。针对这些问题,提出了一种基于双层非负矩阵分解的分形图像压缩编码算法。在传统的非负矩阵分解理论上,将投影非负矩阵分解与L3/2范数约束相结合,可以在较短的时间内提取具有代表性的图像特征。算法首先采用双层非负矩阵分解提取原始图像的特征,然后对图像的特征进行K均值聚类,根
期刊
研究休闲期稻作梯田的土壤水分、养分和酶活性特征对提高梯田土壤有机碳的固持水平具有重要的指导意义。在广西龙脊梯田景区内采集休闲期19个稻田土壤样品,测定土壤养分和酶活性。结果表明,龙脊稻作梯田土壤水分、pH、有机碳、总氮、碱解氮、总磷和速效磷的平均值分别为40.58%、4.76、18.82 g·kg~(-1)、1.97 g·kg~(-1)、97.51 mg·kg~(-1)、0.32 g·kg~(-1
期刊
针对嵌入式摄像设备在执行目标检测任务过程中,对于移动中车辆的检测耗时较长无法及时反馈检测结果的问题,提出了一种基于残差连接和注意力机制的轻量级卷积网络来对SSD(Single Shot MultiBox Detector)目标检测模型进行改进。首先,采用h-swish和h-sigmoid激活函数分别替换残差块中的ReLU激活函数和通道注意力模块中的sigmoid激活函数,降低训练和推理所需计算量。
期刊
由于交通场景中的行人目标所处的背景环境复杂、目标较小等因素,使得目前的行人检测算法在实际应用中存在检测精度不高、检测速度较慢的问题。因此行人检测模块作为高级辅助驾驶系统的核心模块,一直以来都是目标检测的研究热点之一。论文针对交通场景中小尺度行人目标,将传统的SSD网络结构中的主干网络卷积层结合Inception模块中的稀疏连接来优化卷积结构,从而增强网络的特征提取能力。同时利用残差结构组成的预测模
期刊
手势识别是人机交互领域的重要研究内容,为截肢患者控制智能假肢手提供基础.当前主流方法之一是利用表面肌电图识别手部运动意图,但肌电信号存在信号弱、易受噪声、汗液、疲劳影响等缺点.同时肌电图在识别准确率方面,尤其是截肢患者手势识别方面仍然具有较大的提升空间.针对这些问题,本文设计了基于气压肌动图的穿戴式信号采集装置,为手势识别提供了优质的信号源.结合深度神经网络中全连接层结构、典型抽样和标准正则化技术
期刊
针对现有姿态引导的人体图像合成方法无法灵活地编辑人体外观属性的问题,通过对输入的人体图像进行语义分割得到不同部位的外观属性,替换这些属性即可达到同时编辑人体姿态与外观属性的目的。针对纯卷积结构的生成对抗网络无法很好地生成衣服上的图案的问题,提出了新的空间变换算法对多个源属性的特征图进行空间变换,使衣服上的图案得到了保留。实验结果表明,所提出的方法实现了控制人体属性的目的,并且相比于之前的方法具有更
期刊
针对传统的视觉同步定位与地图创建(Visual Simultaneous Localization and Mapping, VSLAM)算法在室内弱纹理场景中容易因为特征缺失而定位失败的问题,提出了一种基于最大Fisher信息量云台控制的主动SLAM算法。该方法在经典的ORB-SLAM2框架上进行扩展,增加了Fisher信息场构建模块与云台控制模块。首先,在视觉跟踪的同时,将三维空间划分成若干个
期刊
Self-Training算法的性能很大程度上取决于高置信度样本的识别准确度。受DPC算法启发,利用密度峰值定义样本间的原型关系,并构造出近亲结点图这一新型数据结构。在此基础上,提出了一种近亲结点图编辑的Self-Training算法(Self-Training Algorithm with Editing Direct Relative Node Graph-DRNG)。DRNG采用假设检验的方
期刊