融合注意力机制的双路径孪生视觉跟踪方法

来源 :数据采集与处理 | 被引量 : 0次 | 上传用户:shiguanglai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统基于孪生网络的视觉跟踪方法在训练时是通过从大量视频中提取成对帧并且在线下独立进行训练而成,缺乏对模型特征的更新,并且会忽略背景信息,在背景驳杂等复杂环境下跟踪精度较低.针对上述问题,提出了一种融合注意力机制的双路径孪生网络视觉跟踪算法.该算法主要包括特征提取器部分和特征融合部分.特征提取器部分对残差网络进行改进,设计了一种双路径网络模型;通过结合残差网络对前层特征的复用性和密集连接网络对新特征的提取,将2种网络拼接后用于特征提取;同时采用膨胀卷积代替传统卷积方式,在保持一定感受视野的情况下提高了分辨率.这种双路径特征提取方式可以隐式地更新模型特征,获得更准确的图像特征信息.特征融合部分引入注意力机制,对特征图不同部分分配权重.通道域上筛选出有价值的目标图像信息,增强通道间的相互依赖;空间域上则更加关注局部重要信息,学习更丰富的上下文联系,有效地提高了目标跟踪的精度.为证明该方法的有效性,在OTB100和VOT2016数据集上进行验证,分别使用精确率(Precision)、成功率(Success rate)和平均重叠期望(Expect average overlaprate,EAO)作为评价标准.结果显示,本文算法的精确率、成功率和平均重叠期望分别为0.868、0.641和0.350;相比基准模型分别提高了5.1%、2.0%和0.9%.结果证明本文算法充分利用了不同网络的优点,在保证模型精度的同时,能够较好地适应目标外观的变化,降低相似物的干扰,取得更稳定的跟踪效果.
其他文献
针对蒸馏装置中主蒸馏塔存在塔盘支撑横梁及桁架腐蚀严重、烟囱层变形、支持座腐蚀塌陷以及塔内腐蚀区域明显增多等问题,基于主蒸馏塔腐蚀现状,对其进行了深入的检修检查工作,并尝试提出新的思路,通过使用添加剂、升级相关材料建立比较理想且可行的防腐蚀策略,以确保蒸馏装置的安全运行.
瞬态图像是一种场景对光脉冲进行响应的快速图像序列.通过对时间维度信息的捕获,瞬态图像实现了对时域中蕴藏的场景信息的有效利用,而非视距成像是瞬态图像在场景解析领域中最典型的应用.非视距成像是一种对视线范围外物体或场景进行成像的技术,近几年在国内外广受关注.本文根据不同的成像机理,对瞬态图像的不同成像方式进行分类,并根据算法原理或实现效果的不同,对比了多种基于瞬态图像的非视距成像算法.最后总结了基于瞬态图像的非视距成像技术面临的挑战,并展望了未来的发展方向.
为分割灰度不均图像和各类噪声图像,本文提出了一个结合混合符号压力函数的活动轮廓模型.首先,利用图像的全局和局部信息,根据当前活动轮廓的位置,构造一个混合符号压力函数,该函数通过自适应权值线性组合一个全局压力项和一个局部压力项,得到图像相对于当前活动轮廓的混合压力.然后,结合此混合符号压力函数,构造活动轮廓的演化方程,最后通过交替迭代算法求解模型.实验中采用不同的人造、医学和自然图像对模型进行了测试,实验结果表明,该模型对初始轮廓有较强的鲁棒性,能有效分割灰度不均图像及各类噪声图像,并且相对于其他活动轮廓模
遥感影像在实际土地监测中其检测精度会受到影像数据中噪声的影响.为了提升变化检测方法的精度,本文提出了一种结合多尺度特征提取和注意力机制的孪生卷积神经网络的变化检测方法.首先使用含有不同膨胀率的空洞卷积和空间注意力模块组成多尺度特征提取模块;然后将同一卷积层的特征图相减获取前后两时期影像的差异特征图,并使用通道注意力机制增强特征提取效果;最后通过全连接层输出变化检测结果.将本文方法与目前已有的一些变化检测方法在未添加噪声的原始遥感影像数据和添加噪声后的遥感影像数据上进行对比分析.结果表明:(1)支持向量机这
比较同一场景无雾和有雾时图像RGB(Red-green-blue)三通道和HSV(Hue-saturation-value)三通道的变化,提出一种基于幂指数拉伸的去雾算法.首先将图像从RGB变换到HSV空间,将饱和度分量和亮度分量分别作1~3的幂指数拉伸和调整,将拉伸变换后分量生成HSV图像再变换到RGB空间,生成增强后的去雾图像.以饱和度均值、亮度指标、信息熵和对比度作为去雾评价的指标,确定最优的拉伸幂指数组合.然后使用最优幂指数完成去雾处理,同时根据图像饱和变化的阈值或时间间隔长度决定是否重新寻找最优
针对当前人眼定位相关算法任务单一、且在多种干扰因素影响下(如光照、眼镜、遮挡)性能下降的问题,提出了可同时检测人眼感兴趣区域、识别人眼多种属性及定位关键点的轻量型神经网络MEL-YOLO.将YOLOV3算法与改进的DS-sandglass模块结合,在关键点回归分支应用去归一化的编解码方法提高网络定位宽度,并且在损失函数引入完全交并比(Complete intersection-over-union,CIoU)和均方误差(Mean square error,MSE),使得网络整体性能提升.MEL-YOLO算
随着深度学习的兴起,行人重识别逐渐成为计算机领域的热门话题.它通过给定的查询行人图像进行跨摄像机检索,找出与查询身份相匹配的行人.然而,由于受到不同视角下的背景、光照等因素影响,采集到的行人图像中存在大量的难样本,利用这些难样本训练得到的模型识别性能低下,缺乏鲁棒性.因此,为了提高模型对难样本的鉴别能力,设计了一种新颖的通过混淆因子合成具有难样本信息图像的方法.对于每批输入图片,通过相似性度量寻找每张图像对应的难样本,结合混淆因子合成具有难样本信息的新图像再以有监督的方式促使模型挖掘难样本信息,从而提高模
在SSD(Single shot multibox detector)单阶段人脸检测模型的基础上,针对复杂局部遮挡下人脸检测精确性差的问题,提出了一种基于层级注意力增进网络的多尺寸遮挡人脸检测方法.首先,在SSD基础网络的多层初始特征图上,通过引入注意力增进机制提升人脸可见区域的响应值.然后为不同增强特征层设计不同尺寸的锚框,以提高对多尺寸遮挡人脸的分层识别效果.最后在训练时将注意力损失函数、分类损失函数和回归损失函数融合为多任务损失函数,共同优化网络参数.在WIDER FACE人脸数据集和MAFA遮挡人
作为消化系统最常见的疾病之一,急性胰腺炎的医学影像仍使用简单的手工特征进行分析,效率与精度较低,与其危害性并不相称.由于胰腺的解剖变异性以及各种并发症,急性胰腺炎的影像表现复杂,不同患者不同种类的病灶差异大,基于CT影像的急性胰腺炎诊断难度较大.本文提出一种基于双重注意力网络用于诊断急性胰腺炎,该网络使用全局特征为不同阶段的局部特征生成局部注意力特征,使不同阶段的注意力特征关注不同尺度的病灶,最终通过融合对全局注意力特征进行分类.同时在生成注意力特征时,使用通道域注意力调整通道间的依赖,提高模型的表示能力
放射治疗计划系统需要CT图像准确计算剂量分布,但有时临床只能获得MR图像.图像合成能有效利用现有图像合成新模态图像,从而增强图像信息.针对MR图像生成CT图像问题,综合循环一致生成对抗网络不成对数据可训练合成新模态图像的特点,以及密集连接网络的特征复用和优化信息流传播的优点,提出融合密集连接的循环生成对抗网络模型,改善输入信息的消失和梯度信息稀释,合成更可信的CT图像.在18个病人的数据集上训练和验证模型,优化后的循环生成对抗网络与原方法相比,平均绝对误差降低了3.91%,结构相似性提高了1.1%,峰值信