【摘 要】
:
航拍图像目标检测存在多尺度目标检测精度低、检测速度慢、漏检和误检严重等问题。针对这些问题,提出一种融合卷积注意力机制和轻量化网络的目标检测算法(pro-YOLOv4),并应用于多尺度航拍图像目标检测。首先,利用K-means聚类算法对航拍数据集进行聚类分析并优化锚框参数,以提高对目标检测的有效性;其次,采用轻量级网络结构,精简网络复杂度,提高检测速度;最后,引入卷积注意力模块来解决复杂场景对于航拍
论文部分内容阅读
航拍图像目标检测存在多尺度目标检测精度低、检测速度慢、漏检和误检严重等问题。针对这些问题,提出一种融合卷积注意力机制和轻量化网络的目标检测算法(pro-YOLOv4),并应用于多尺度航拍图像目标检测。首先,利用K-means聚类算法对航拍数据集进行聚类分析并优化锚框参数,以提高对目标检测的有效性;其次,采用轻量级网络结构,精简网络复杂度,提高检测速度;最后,引入卷积注意力模块来解决复杂场景对于航拍目标检测的干扰,从而有效降低误检率和漏检率。在航拍数据集RSOD和NWPU VHR-10上进行实验对比,
其他文献
厚层松散堆积区(盆地或平原等)发震断层多以隐伏活动为主要特征,基于上断点的传统活动断层探测技术通常难以约束断层最新活动性质和时代。利用冲积河流对地表形变的敏感性评估断层活动性,是极具潜力的隐伏活动断层研究方向。本文基于TM/ETM遥感影像,对小浪底水库建设前后(1990~2013年)郑州—济南段黄河水域多期次几何特征进行提取和分段,共获取6个时期河道中心线弯曲度和5个时段河道面积重叠率的沿程变化信
在线知识蒸馏通过同时训练两个或多个模型的集合,并使之相互学习彼此的提取特征,从而实现模型性能的共同提高。已有方法侧重于模型间特征的直接对齐,从而忽略了决策边界特征的独特性和鲁棒性。利用一致性正则化来指导模型学习决策边界的判别性特征。具体地说,网络中每个模型由特征提取器和一对任务特定的分类器组成,通过正则化同一模型不同分类器间以及不同模型对应分类器间的分布距离来度量模型内和模型间的一致性,这两类一致
针对目前表面肌电信号(surface electromyography,sEMG)端到端手势识别特征提取不充分、多手势识别准确率不高的问题,提出一种融合注意力机制的多流卷积肌电手势识别网络模型。该模型通过滑动窗口将多通道时域sEMG生成肌电子图,并使用多流卷积神经网络充分提取每个采集通道sEMG的语义特征,然后将其聚合得到丰富的多通道手势语义特征;同时从时间和特征通道维度上计算语义特征的注意力分布
针对高速公路场景下难以实现车辆轨迹精准还原的问题,提出以新近大规模建设的ETC门架系统作为检测载体,将车牌识别与车辆重识别(ReID)技术结合实现更好的轨迹还原效果。高速公路车辆目标多、速度快,常用目标检测算法难以满足属性检测与重识别要求的情况下,对多目标检测与重识别的FairMOT算法结构作出改进,添加多个并行头输出,对车牌、车辆颜色、类型、品牌及重识别等特征同时训练,输出车辆多标签属性;制作数
针对物联网设备很容易被攻击者利用来入侵网络的问题,设计实现了一种将基于网络拓扑改组的移动目标防御(network topology shuffling-based moving target defense,NTS-MTD)和网络欺骗相结合的物联网集成防御机制,并基于该防御机制设计了一种诱饵路径优化算法(decoy path-based optimization algorithm,DPOA)来进
为了进行复杂交互动作识别,提出基于深度信息的特征学习方法,并使用两层分类策略解决相似动作识别问题。该方法从频域的角度分析深度图像动作序列,提取频域特征,利用VAE对特征进行空间特征压缩表示,建立HMM模拟时序变化并进行第一层动作识别。为了解决相似动作识别问题,引入三维关节点特征进行第二层动作识别。实验结果表明,两种特征在动作数据集SBU-Kinect上能够有效地表示姿态含义,策略简单有效,识别准确
对于复杂点云的骨架提取,由于原始点云的遮挡、缺失、分布不均、分支复杂等原因,所提取骨架会产生断裂、拓扑结构错误等问题。针对复杂结构点云的骨架提取,提出了一种基于等级划分的复杂点云骨架提取算法(multilevel divided skeleton extraction,MDSE)。使用L_1-medial提取初始骨架点,将初始骨架点连接成单分支骨架线,通过对单分支结构的初始骨架线进行等级划分,利用
针对细粒度图像分类问题提出了一种有效的算法以实现端到端的细粒度图像分类。ECA-Net中ECA(efficient channel attention)模块是一种性能优势显著的通道注意力机制,将其与经典网络ResNet-50进行融合构成新的基础卷积神经网络ResEca;通过物体级图像定位模块与部件级图像生成模块生成物体级图像和部件级图像,并结合原始图像作为网络的输入,构建以ResEca为基础的三支
运用人工智能技术将是构建下一代智慧图书馆的关键,为了实现图书的定位和识别,提出一种基于改进Mask R-CNN的在架图书书脊图像实例分割方法。考虑到图书密集排列、具有一定的旋转性、副本纹理极相似等难点,改进锚框为旋转矩形框,提出旋转区域建议网络取代区域建议网络;提出旋转特征提取方法可减少池化误差且有效提取目标特征,结合掩膜的旋转对齐以提升预测掩膜的准确性。建立了一个包含1 849张在架图书书脊图像
古代壁画艺术价值高、内容丰富,对壁画种类进行准确分类是研究者的难题之一。传统的壁画分类任务繁重且需要有经验的研究者完成;现有的图像分类算法已不适于分类含有较强背景噪声的壁画图像。针对以上问题提出了一种新的多通道可分离网络模型(multi-channel separable network model,MCSN)的解决方案。以GoogLeNet网络模型为基本框架,用小卷积核对壁画背景特征进行浅层提取