基于孪生网络的奶山羊目标跟踪方法研究

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:chengshy2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪技术是计算机视觉领域研究的基础任务,其在视频监控、牲畜养殖管理及动物研究与保护等方面均有广泛的应用。随着深度学习技术的发展,目标跟踪算法的性能也得到了广泛提升,但在实际应用中仍面临许多挑战性问题。本文以孪生网络跟踪框架为基础,以西北农林科技大学畜牧教学试验基地中的奶山羊以及VOT2016、VOT2017、OTB2015和La SOT公开数据集为研究对象,在存在相似目标干扰、目标尺度变化、目标旋转和目标形变的情况下对目标跟踪技术进行了深入的研究与探讨。(1)制作了奶山羊运动视频数据集。本研究以西北农林科技大学畜牧教学试验基地中饲养的莎能羊(Shaneng Sheep)为对象制作了奶山羊数据集,并将其命名为DGDataset。该数据集包含200个奶山羊运动视频,共161000帧图像。在135个视频序列中,通过矩形框标注了目标的身体位置区域。在剩余65个视频序列中,通过矩形框标注了目标的头部位置区域,本文使用矩形框左上角坐标以及矩形框的长和宽来表示标注区域。(2)提出了一种基于增强型骨干网络的孪生目标跟踪算法。首先,本研究以具有相同架构并共享参数的两个分支的孪生网络为基础来实现。其次,通过设计的可堆叠模块(多卷积残差模块和下采样多卷积残差模块)对卷积神经网络进行了加宽和加深,以增强特征映射能力。同时利用非对称卷积块替换方形卷积核,进而增强模型解决目标旋转挑战的能力。最后,采用基于锚框的区域生成网络对图像中目标的区域进行定位,从而完成跟踪过程。本研究通过设计强壮的骨干网络在提高目标跟踪的鲁棒性的同时保持了实时性的速度。(3)提出了一种基于注意力机制和无锚框网络的孪生目标跟踪算法。由于浅层特征包含的细节信息和深层特征包含的语义信息分别有助于定位目标和区分类间目标,本研究首先将Efficient Net作为骨干网络提取多层级特征,并通过Bi FPN模块将其聚合以构建鲁棒的和具有辨别性的特征表示,以便在相似性目标干扰和目标发生形变时区分目标与背景。其次,针对目标跟踪器易发生漂移问题,采用注意力模块指导两个分支学习上下文信息,并构建模板分支和搜索区分支间的纽带,以进一步增强目标跟踪器应对相似性目标干扰和目标形变的鲁棒性。最后,针对在实际场景中,目标尺度变化导致的目标跟踪器精确度低的问题,本研究采用无锚网络来定位每一帧图像中目标所在的区域。本文对上述两个算法在DG-Dataset数据集上进行测试。同时,为了验证算法的泛化能力,在VOT2016、VOT2017、OTB-2015和La SOT数据集上分别进行了测试,并与当前主流的目标跟踪算法比较。结果表明,本文提出的两个目标跟踪算法均以实时的速度取得了显著的性能收益,对视觉目标跟踪技术和牲畜智能化跟踪监视技术的发展具有促进作用。
其他文献
近年来,我国高度重视农业信息化发展。我国葡萄种植面积大、产量高。葡萄病虫害的发生将直接影响葡萄的产量和品质。葡萄病虫害知识以书籍文献形式存在,葡萄种植人员无法快速获取到葡萄病虫害知识。为解决以上问题,帮助葡萄种植从业者高效准确地获取到有价值的信息,本研究利用知识图谱组织葡萄病虫害领域知识,利用深度学习模型理解自然语言问句语义信息,设计实现基于知识图谱的葡萄病虫害自动问答系统。因目前我国葡萄产业知识
电子商务的蓬勃发展为用户提供便利的同时也带来了信息过载的问题。推荐系统能够为用户筛选出少量其真正感兴趣的物品,缓解信息过载的问题。为同时兼顾效果和性能两个方面,一般会将整个推荐系统分为召回和排序两个阶段。其中召回阶段使用简单模型,在线性时间内将系统中与用户相关的物品尽可能多的找回,形成召回候选集;而排序阶段则可以使用复杂模型,对召回候选集进行点击率预测和排序,提高最终推荐效果。综上所述,本研究构建
对动物的目标跟踪是研究其健康状况和行为分析的基础。为了准确实时地获取动物的个体信息和行动状况,本文以西北农林科技大学畜牧教学试验基地的奶山羊养殖场视频为研究对象,基于Target-Aware Deep Tracking(TADT)算法,并结合注意力机制和模板更新方法,对奶山羊对象进行跟踪及精度评价,验证了改进后算法的有效性。本文主要的研究内容与结论如下:(1)数据集的构建及预处理。为获取数量充足的
在计算机视觉领域,视频动作识别近年来倍受关注。视频通常具有丰富的场景类型,比如街道监控视频、室内监控视频和某种体育项目的比赛视频等,而针对特定场景下的视频动作识别会更具有实际意义。对于体育视频中的羽毛球单打视频,为了能更好地辅助教练分析视频中球员的动作,以及使用户可欣赏到每种击球动作的视频集锦等多元化需求,本文基于羽毛球视频精彩片段展开对羽毛球动作识别的研究。论文主要的研究内容和结论如下:(1)羽
精准养殖是目前畜牧业发展的主流方向。为提高奶山羊图像分割精度,促进养殖产业精准化和智能化发展,本文以羊场环境下获取的奶山羊图像为研究对象,实现了基于改进Mask R-CNN算法的奶山羊图像实例分割。本文的主要研究内容和结论有:(1)奶山羊实例分割数据集的构建。针对缺少奶山羊实例分割公开数据集的问题,通过在奶山羊养殖场安装远程高清摄像机,获取室内外奶山羊监控视频。首先对视频进行关键帧提取,人工筛选出
目标跟踪是计算机视觉领域的一个重要研究问题,在智能监控、自动驾驶、人机交互以及国防军事等领域都有着广阔的前景与需求。目标在运动过程中的形变、视点变化、遮挡和运动模糊等因素为目标跟踪领域带来许多挑战。基于多域卷积神经网络的目标跟踪方法(MDNet)因其适用于跟踪问题的多域网络结构及良好的性能表现受到了广泛的关注,但仍面临着模型训练速度慢及泛化性能弱的缺点。本文以MDNet及其改进跟踪模型为研究对象,
苹果因其丰富的营养价值,已成为世界上产量较高的水果之一。苹果产业的发展在满足人民生活需求的同时,也为当地经济带来巨大的效益。然而在苹果生长过程中,因受到自然环境因素的影响,在苹果叶片部位会产生多种病害。这些病害严重阻碍苹果正常生长,影响苹果的品质,从而造成巨大的经济损失。构建苹果叶片病害检测模型,对提高苹果品质,减少农户经济损失等方面具有十分重要的意义。本研究以苹果叶片常见的5种病害为研究对象,从
近年来人物图像的应用场景愈发丰富,但在获取过程中,拍摄者审美水平及拍摄环境的差异导致人物图像美感程度参差不齐,因此开展美学质量评价研究,从海量人物图像中挑选出有价值的高美感图像,具有极大的现实意义。人物图像美感评价具有较强的主观性和复杂性,目前还未有统一且完善的评价标准,因此本文以人类视觉特征和审美习惯为依据,提出一种评价人物图像美学价值的可计算方法,用以进一步提高美感评价的准确性,实现各角度的细
随着奶山羊规模化养殖的推进,对羊场的精准监控及高效管理已成为亟待解决的问题。通过对羊场图像的语义分割,观察羊场环境和奶山羊的姿势与位置,可以实时监控奶山羊的行为状态,及时发现奶山羊的健康问题。本文以西北农林科技大学畜牧教学试验基地的奶山羊场图像为研究对象,构建羊场图像语义分割数据集,改进DeepLabV3+的解码网络,并优化ASPP结构,结合通道注意力机制,利用提取的图像特征,实现了羊场图像的语义
三维扫描技术可以扫描获取空间物体的外部结构特征,对于结构形状较为复杂的物体,三维扫描技术可以节省大量人力物力。当前绝大多数的三维扫描设备是分别获得部分点云数据,然后通过点云配准得到物体的完整数据。这样的应用过程没有解决动态扫描问题,不仅使得其应用场景受到极大限制,而且后期配准的时间消耗与精度损失影响了其易用性。为了解决传统双目视觉三维扫描技术需进行多次扫描,然后再进行配准的问题,提出基于光学跟踪的