基于改进孪生网络的目标跟踪研究

来源 :湖南工业大学 | 被引量 : 0次 | 上传用户:olivehht
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪是一项持续追踪视频序列中指定目标的任务。仅根据视频给出的某一帧图像,通过算法完成视频后续帧中的目标跟踪。目标跟踪一直是人工智能领域的研究热点。目前,目标跟踪技术已被应用在视频监控、自动驾驶和军用无人机等诸多领域。由于深度学习技术在目标跟踪上的广泛应用,涌现了一大批性能优秀的跟踪算法,其中最具有代表性的是全卷积孪生网络目标跟踪算法Siam FC。早期的孪生网络算法大多采用浅层的特征提取主干网络,模板不能更新,在面对现实生活中目标被遮挡、尺度缩放等复杂场景时,仍然存在跟踪效果不佳的问题。此外,还必须考虑算法的跟踪速度。因此,针对上述问题,本文基于孪生网络对目标跟踪进行了研究,所做工作如下:(1)提出基于多层特征加权融合的跟踪算法Deep Siam:首先,算法弃用Alex Net网络,采用改进的Res Net-50作为主干网络,利用深层神经网络提取更充分和更复杂的目标特征。其次,对主干网络按层进行特征加权融合,获得低层外观特征和高层语义特征,增强特征对目标的表征能力。实验表明,所提方法在目标跟踪测试数据集上取得了较好的跟踪性能,有效提高了算法处理目标被遮挡的鲁棒性。(2)提出基于增强型混合注意力的跟踪算法ESASiam:结合通道注意力和空间自注意力在深度卷积网络中的聚焦能力,突出图像中感兴趣的区域。通道注意力能够使网络抓取到不同通道之间的特征联系,突出有利于表达目标的通道特征。空间自注意力能让网络建立任意两个不同像素位置的相关关系,帮助定位目标。此外,设计了一个模板-搜索协同注意力模块来隐式地更新模板特征,采用沙漏网络对经主干网络提取的模板特征和搜索特征做多尺度信息交互,有效提高了算法处理目标尺度变化的鲁棒性。(3)提出融合时空上下文信息的跟踪算法STASiam:通过构建一个拉普拉斯型模板特征集合聚合视频中的时序信息,并通过交叉注意力模块前向传播至搜索区域。对于搜索区域特征,模板特征集合被视为一个聚合了不同模板帧特征的掩膜,有助于充分利用视频序列帧与帧之间的上下文信息,解决了Siam FC模板不能更新的问题。
其他文献
目的:分析膳食模式与代谢综合征(Metabolic syndrome,Met S)及其组分的关系,从生物标志物的角度探讨黄酮类化合物与Met S的关联,为Met S的防控提供科学依据。方法:在“新疆多民族自然人群队列建设及健康随访研究”伊犁霍城县招募研究对象,选取完成问卷调查、体格测量、膳食调查及血糖血脂检测的居民。通过因子分析法提取膳食模式,将膳食模式按照因子分数四分位数分成4组(Q1、Q2、Q
学位
由于源语与目的语之间存在语言、文化和思维方式的差异,并且财经文本句式复杂、句意抽象,容易为读者带来阅读和理解的障碍。究其原因,是因为英汉两种语言的逻辑表现形式也存在多方面的差异,这些差异来自于原文隐含的深层语义、也来自英汉不同的表达习惯和行文方式。因此,在汉译过程中要通过一些补偿策略进行加工处理,确切地说就是将逻辑关系做明晰化处理,以便在最大程度上转达原文信息,提高译文的逻辑性和可读性。本文以Th
学位
目的:调查新疆高校学工人员工作投入状况,分析其与社会支持、应对方式、心理健康状况之间的关系,找出工作投入的影响因素,并分析社会支持、应对方式在心理健康状况与工作投入间的链式中介效应,为改善学工人员心理健康状况,提高工作投入提供理论支持,促进高校健康可持续发展,从而强化育人阵地。方法:2020年3月—2021年12月,采用整群抽样的样法,运用工作投入量表、症状自评量表、职业倦怠量表、社会支持量表、应
学位
目的:1)探讨肾透明细胞癌术后转移相关因素及QKI-5在局部中晚期肾癌患者中的表达及临床意义。2)研究QKI-5对肾癌细胞在体外的迁移、侵袭能力的影响。方法:回顾性分析2013年1月1日至2018年12月31日期间在新疆医科大学第一附属医院接受手术治疗的61例局部中晚期肾透明细胞癌的患者。根据随访资料是否转移将他们分为转移组与未转移组,分析影响肾癌转移的相关临床病理特征,通过免疫组化的方法检测肾癌
学位
西方对于空间理论的研究自柏拉图的“洞喻”始便经历了漫长的发展过程,20世纪70年代文化领域中的空间转向更是让空间理论得到快速发展。这一文化领域的新成果也深刻地影响着电影学科对于电影空间的认识,学者们将目光转向了对于电影空间性的批判中来。本文主要分为六个章节:第一章绪论,对西方空间理论,电影空间理论与韦斯·安德森电影进行中外期刊论文的文献综述,明确论文研究思路与方法,以美国独立电影人韦斯·安德森导演
学位
目的:利用血氧水平依赖的功能磁共振成像(blood oxygenation level dependent-functional magnetic resonance image,Bold-f MRI)研究运动性失语患者执行动词产生任务时的脑功能激活情况,以探讨动词产生的神经机制,为运动性失语患者的针对性言语训练和神经调控治疗靶点的选择提供依据。方法:选择符合纳入和排除标准的运动性失语患者23例,
学位
近年来,受经济下行压力影响,许多非金融企业背上巨额负债,企业杠杆率逐步攀升。在此背景下,2016年10月,国务院出台了市场化债转股政策,以期降低企业杠杆率,帮助优质企业渡过难关。航发动力抓住政策机遇开始筹备债转股,经过与多方主体的协商沟通,最终以航发动力旗下三家全资子公司作为标的,同时引入多元战略投资者采取现金与债权的形式对标的公司实行增资减债,这是首个在董事会阶段锁定全部投资者的成功案例。本文以
学位
目的:基于rs-fMRI和DTI技术对母语为汉语和维吾尔语(简称维语)的脑卒中后运动性失语(Broca aphasia,BA)患者的局部脑区功能、脑区间的功能连接和语言通路白质纤维束进行研究,为跨语系脑卒中后BA患者的语言障碍机制提供客观影像学证据,为维、汉脑卒中后BA的康复治疗提供理论依据。方法:选择符合纳入和排除标准的单语BA患者30例,其中维语和汉语单语者各15例,在非急性期对其进行rs-f
学位
滚动轴承作为工业设备中的核心器械,其工作状态直接影响整个机械系统的运行状态和性能,进而影响到工业生产的安全和经济水平。因此,需要通过对滚动轴承的故障诊断和剩余使用寿命预测技术研究来保证机械设备的正常运行。但如何对滚动轴承多位置、多类型的故障进行精准诊断;如何直接从原始的振动信号构建HI以保持信号的完整性是当今滚动轴承故障诊断与剩余使用寿命预测领域的热点问题。针对上述问题,本文将滚动轴承作为研究对象
学位
涡扇发动机是飞机的核心,涡扇发动机的健康状态分析对于航空器的评估、安全使用以及制定维护策略都至关重要,而剩余使用寿命(RUL)是衡量涡扇发动机的健康状况的关键指标,准确地预测剩余使用寿命既能够避免未及时维护带来的安全事故,也能减少过度维护产生的昂贵成本。涡扇发动机因测点较多,工况复杂,数据量大等特点使得其剩余使用寿命预测面临特征提取、预测精度低等极大挑战,如何提取有效特征并提高涡扇发动机的剩余使用
学位