改进型RetinaNet的目标检测算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:monowing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对经典一阶段目标检测算法RetinaNet存在的难以充分提取与融合不同阶段特征及边界框回归不够准确的问题,提出了一个改进型RetinaNet的目标检测算法。该方法首先在特征提取模块加入多光谱通道注意力,以更好地捕获特征原有的丰富信息;然后,将路径聚合模块与特征融合操作相结合构成多尺度特征融合模块,并将其添加在特征提取模块后面,进一步增强不同阶段的特征融合效果。最后,在边界框回归过程中引入完全交并比损失函数,以提升回归过程的收敛速度与准确性。为了测试该算法的检测效果,分别在MS COCO数据集和PA
其他文献
针对织物疵点纹理多变、类型多样和尺度不一的特点,提出了优化Faster R-CNN疵点检测模型。将基于卷积模块的注意力机制(convolutional block attention module,CBAM)引入经典Faster R-CNN模型中,对建立的6 317张包含污渍、破洞、跳花、断经、断纬、缺经、缺纬和并纬等疵点的织物图片样本库进行CBAM的改进模型与原模型对比实验。结果表明:优化后的网
期刊
随着中国高速铁路里程的迅速增长,接触网安全稳定运营面临巨大压力,对其进行视频监控具有重要意义。针对影响电气化铁路接触网正常工作的鸟巢异物进行研究,提出一种基于深度学习的鸟巢异物检测方法,首先利用最邻近插值法进行图像缩放,然后采用双边滤波算法对图像进行去噪,进而用直方图均衡化算法进行图像增强。通过将YOLO v3与Faster RCNN两种目标检测方法进行详细对比分析,给出了准确率、误检率、漏检率和
期刊
在铁矿石烧结过程中,烧结机尾断面图像中的火焰区域蕴含着大量烧结特征信息。为有效识别烧结断面火焰核心区域,本文提出了改进的粒子滤波算法对烧结断面图像进行火焰区域跟踪。在经典粒子滤波算法中引入RGB颜色空间生成带权粒子。同时,烧结过程中火焰区域可能合并、分裂及脱落,对粒子滤波算法中重采样方法进行权值优化、粒子舍弃与重采样策略优化,避免由粒子退化现象与样本贫乏问题引起跟踪失败。结果表明,改进的粒子滤波算
期刊
人脸姿态估计在人脸识别、人机交互和面部表情分析等领域应用广泛,其中一个重要的指标是人脸姿态估计的精度。针对获取的三维(3D)人脸模型存在偏转角度的问题,提出一种基于对称平面的3D人脸姿态估计算法。依据人脸具有的左右对称性来提取对称平面,进而计算对称轮廓;将对称平面与yoz坐标平面对齐,获得首次姿态调整结果;将对称轮廓两端点构成的向量调整到与y坐标轴平行,获得第二次姿态调整结果。综合两次调整,得出姿
期刊
为提高相移条纹投影测量系统的精度与效率,提出了一种四步相移结合互补格雷码的快速相位展开方法,有效消除了相位展开误差,并能够显著提升计算效率。引入的互补格雷码与传统格雷码的条纹阶次存在半周期错位,利用这种错位与中值滤波结合可完全消除相位展开误差。首先,采用大津法对全亮图案进行二值化生成掩码图像;其次,以掩码图像非零区域为路径引导四步相移与互补格雷码解码得到包裹相位与条纹阶次;最后,利用条纹阶次对包裹
期刊
为完善黑钙土地区秸秆还田技术,提升黑钙土可持续生产能力提供理论和实践依据,以吉林省典型黑钙土为供试土壤,采用室内培养法研究秸秆与两种氮肥(尿素和磷酸二铵)配施对黑钙土有机碳(SOC)和微生物量碳氮的影响。结果表明,黑钙土SOC含量随秸秆添加量的增加而增加,增幅达6.27%~31.84%。尿素和磷酸二铵配施显著提高了黑钙土SOC含量,且磷酸二铵的提升效果更好。秸秆还田增加了黑钙土微生物量碳(SMBC
期刊
针对现有基于深度学习的自然图像超分辨率算法在图像高频细节重建方面的不足,提出了一种更注重图像高频细节重建的基于双通道残差网络的图像超分辨率算法。该算法使用带有通道注意力机制的残差结构作为网络的主通道,为了在重建过程中更好地保留原始图像的几何结构和边缘信息,使用自适应结构化卷积设计了网络的辅助通道,以此构建的双通道残差网络在学习过程中会有更强的高频信息捕获能力。为了使重建图像效果更加符合人眼的主观视
期刊
脑肿瘤是世界上最致命的癌症之一。由于脑肿瘤的样性,其图像分类成为了当代研究的热点。近年来,深度神经网络(DNN)常用于医学图像分类,但随着深度的增加网络会出现梯度消失和过拟合的问题,而残差网络(ResNet)通过引入恒等映射可以缓解这些问题。因此,本文基于ResNet提出了一种MDM-ResNet网络,该网络由多尺寸卷积核模块(Multi-size convolution kernel modul
期刊
针对自然场景中任意形状文本容易漏检、错检的问题,提出了一种基于双重注意力融合和空洞残差特征增强的场景文本检测方法。为了增强文本特征通道之间的潜在联系,提出了双重注意力融合(DAF)模块,采用双向特征金字塔与双重注意力融合模块相结合的方式进行多层的特征融合;另外针对深层特征图在降维的过程中可能造成语义丢失的现象,提出了空洞残差特征增强(D-RFA)模块。通过在弯曲文本数据集CTW1500上的测试表明
期刊
电力设备红外图像采集过程中出现的分辨率降低和模糊现象是影响红外诊断准确性的重要因素。然而现有超分辨率方法一般假设模糊核已知,但当假设核偏离真实核时方法性能会显著降低。本文针对这一问题,提出一种压缩感知盲超分辨率改进方法。以图像退化模型为基础,结合图像在变换域内稀疏为先验知识,实现图像的超分辨率重建。在重建过程中通过红外图像亮度分量的极值分布先验信息促进模糊核的优化求解以及重建图像反卷积去模糊运算,
期刊