【摘 要】
:
在单目标跟踪过程中,由于存在目标遮挡、目标消失、相似目标干扰等问题,导致算法错误跟踪目标,跟踪精度下降,并且错误的结果将会参与到模型更新中,使得跟踪精度进一步下降。针对这一问题,提出了基于注意力机制的多尺度单目标跟踪算法。该算法使用Inception网络非对称卷积思想,在增加多尺度卷积核的同时减少参数量,非对称卷积可以有效地结合局部特征和全局特征,提高跟踪的鲁棒性。在模型参数更新阶段,采用基于注意
【机 构】
:
西安电子科技大学计算机科学与技术学院,陕西西安710071
论文部分内容阅读
在单目标跟踪过程中,由于存在目标遮挡、目标消失、相似目标干扰等问题,导致算法错误跟踪目标,跟踪精度下降,并且错误的结果将会参与到模型更新中,使得跟踪精度进一步下降。针对这一问题,提出了基于注意力机制的多尺度单目标跟踪算法。该算法使用Inception网络非对称卷积思想,在增加多尺度卷积核的同时减少参数量,非对称卷积可以有效地结合局部特征和全局特征,提高跟踪的鲁棒性。在模型参数更新阶段,采用基于注意力机制的网络在线更新算法,结合每一帧的结果响应图和注意力响应图计算得到该帧的跟踪结果得分,从而在模型更新
其他文献
为了提高利用四轴飞行器单目摄像头传回的图片帧执行目标跟踪任务时的实时性和稳定性,提出一种基于注意力模型的图片帧预处理和基于反馈控制的四轴飞行器姿态调整的算法。首先,通过注意力模型对四轴飞行器采集到的视频图像进行预处理,选出对跟踪结果贡献度较大的部分帧;其次,将图像预处理阶段选出的图片帧进一步处理,得到选框像素点的位置偏差和面积偏差,记作反馈控制的误差;最后,通过反馈控制,将该误差与四轴飞行器的电机
因为红外图像数据可以有效地弥补单一可见光数据在低照度条件下的不足,因此研究跨模态可见光—红外行人重识别将为构建一个全天候、全场景智能视频监控系统提供强有力的技术支撑。跨模态行人重识别的核心问题是构建多模态数据之间的统一共享特征表达,关键在于有效区分跨模态数据中模态共享/特有的特征信息。基于此,提出了一种基于混合双通路神经网络的跨模态行人重识别方法。该方法深入地分析了混合双通路神经网络中模态共享参数
人脸识别系统会受到照片视频的虚假人脸攻击,但手持照片、视频攻击存在抖动现象,以光流表征运动信息,提出一种利用背景光流特征的假人脸检测方法。该方法聚焦真实人脸背景与虚假人脸背景之间的运动差异性,分析人脸外区域的光流角度分布,背景对比区的运动状况,通过评估对比区的运动一致性虚假人脸。新方法在公开数据集ReplayAttack和CASIA-FASD中的测试准确率分别为97.87%和90.95%,可有效甄
在工业视频监控场景中,由于复杂背景、人体多姿态和人体遮挡等因素的影响,现有人体检测算法存在着准确率不高、模型泛化能力不强等显著问题。针对以上问题,基于特征图像金字塔和多尺度感受野理论,设计了一种检测网络的特征融合方式和特征图的生成策略,依靠轻量级的特征图像金字塔技术,并结合数据增强、锚点框匹配策略和遮挡损失函数等优化方法,进而提出了一种基于深度神经网络的人体检测算法EFIPNet。同时,为了充分验
判别式相关滤波器采用循环移位产生负样本的方式不可避免带来了边界效应。基于背景感知的相关滤波跟踪算法试图利用裁剪矩阵获取更多真实的负样本,既有效缓解了边界效应的影响,又增强了对背景信息的学习。然而,裁剪矩阵的使用缺乏对空间不同位置可靠性的学习,可能会导致背景信息对滤波器的学习占据主导地位。为解决该问题,将空间可靠性的学习引入相关滤波算法中,通过交替方向法与滤波器进行联合迭代求解,加强了滤波器对空间可
随着视频监控技术在道路安全应用的迅猛发展,为实现高速公路智能化管理,提出一套面向高速公路的车辆视频监控分析系统.通过对监控视频流中的车辆进行检测和跟踪,进一步实现了高速公路相关车辆监测的应用.提出了基于双向金字塔多尺度融合的轻量级车辆检测跟踪算法,基于YOLOv3在主干网络上使用轻量级网络EfficientNet,并且利用双向特征金字塔网络进行多尺度特征融合,使得算法在保证检测实时性的同时提升检测的准确度.通过采集高速公路监测视频,构建了一个多场景高速公路车辆目标数据集.在此数据集上的实验结果表明,所提出
针对图像检索中很多深度监督哈希算法不能有效地利用大型数据集监督信息和困难样本的问题,提出了一种端到端的非对称压缩型哈希算法.该算法将网络的输出空间分为查询集与数据库集,构造数据监督矩阵,并采用非对称的方式使全局监督信息得到有效的利用.同时,在损失函数中对同类哈希码聚拢程度与不同类哈希码的分离程度进行显式的约束,提高训练过程中模型对困难样本的判别能力.首先,改进骨干特征提取网络SKNet-50,通过添加哈希层和阈值化层,输出查询集矩阵;然后,使用交叉方向乘子方法优化损失函数得到数据库集矩阵;最后,利用交替优
遥感机场区域目标的检测有很大的军事意义和民用意义。为了取得快速且精确的检测效果,自主构建了更加符合具体任务的数据集;以一步回归全局检测为基础框架,针对数据集中类别分布不均衡问题,提出使用生成的方法用生成对抗网络进行有针对性的数据扩充,以获得具有领域变换特性、类数据分布更为均衡的数据集。同时,使用改进的双权重特征金字塔网络检测部件,来融合得到深层次可区分性的更加鲁棒的特征。实验结果表明,相比原网络,
遥感图像覆盖幅面广、纹理信息丰富,其目标具有尺寸多样性,排列密集且与背景易混淆等特性,给快速定位和精准识别目标带来较多困难,尤其是易漏检小目标等。针对此问题,提出一种深度融合机制的遥感图像目标检测技术。该技术基于深度卷积神经网络,将多尺度、注意力机制与宽度学习三者融合,用于遥感图像目标检测技术。该技术首先基于多尺度与空间注意力机制获取到遥感图像的候选区域信息,然后采用通道注意力机制获取其多个尺度的
针对行人运动过程中拍摄视角、外观变化等因素对步态识别的影响,提出一种长短时记忆网络与卷积神经网络相结合的步态识别方法。该方法首先使用人体三维姿态估计直接获得人体关节的三维坐标;然后根据三维空间中关节之间的周期性运动约束关系,从时间和空间两个维度构建视角鲁棒的三维步态约束模型。其中,模型中的运动约束矩阵用于表征关节运动及人体结构的时序约束特征;动作特征矩阵用于表征关节位移的空间约束特征。接着针对所构