【摘 要】
:
目标跟踪是计算机视觉的重要分支之一,正随着信息科技的发展在人机交互、智能机器人、自动驾驶、国防安全、视频监控和智慧城市等领域中得到越来越多的重视和应用。尽管视觉跟踪技术在过去数十年中得到了长足的发展,但由于目标遮挡、尺度变化、外观形变以及相似物体干扰等跟踪环境因素的复杂多变,能够在多应用场景下满足对跟踪的精度、实时性和鲁棒性等需求仍是一项艰巨但有着光明前景的工作。本文基于深度学习算法模型,针对长时
论文部分内容阅读
目标跟踪是计算机视觉的重要分支之一,正随着信息科技的发展在人机交互、智能机器人、自动驾驶、国防安全、视频监控和智慧城市等领域中得到越来越多的重视和应用。尽管视觉跟踪技术在过去数十年中得到了长足的发展,但由于目标遮挡、尺度变化、外观形变以及相似物体干扰等跟踪环境因素的复杂多变,能够在多应用场景下满足对跟踪的精度、实时性和鲁棒性等需求仍是一项艰巨但有着光明前景的工作。本文基于深度学习算法模型,针对长时或实时跟踪时模型在目标形变、被遮挡、相似物体干扰等复杂情况下容易跟踪漂移或丢失的问题,进行深入的探索研究并提出改进方案,提高了跟踪精度和鲁棒性,并在特定应用场景下满足跟踪的实时性。本文主要研究工作如下:(1)针对长时跟踪时模型常由于目标遮挡、出视野等因素而导致跟踪漂移的问题,基于二分类模型提出一种能有效在线更新参数的目标跟踪方法。首先,引入一种改进的收缩损失函数,以解决模型在线训练时正负样本不均衡的问题;其次,设计一种高置信度保留样本池,对在线跟踪时的每一帧的有效并且置信度最高结果进行保留,并在池满时替换最低置信度的保留样本;最后,在模型检测到跟踪失败或连续跟踪帧数达到特定阈值时,利用保留样本池进行在线训练更新模型,从而使模型在应对长时跟踪时保持鲁棒和高效。实验表明该方法在跟踪精度和成功率上都展现了较强的竞争力并有着良好的鲁棒性。(2)针对孪生网络跟踪模型难以应对目标形变、相似物体干扰等复杂跟踪因素的问题,提出一种融合残差连接与通道注意力机制的快速目标跟踪方法。首先通过残差连接将模板分支网络提取的浅层结构特征与深层语义特征进行有效的融合,以提高模型的表征能力;其次引入通道注意力模块,使模型自适应地对不同语义目标特征通道加权,以提高模型的泛化能力;最后设计并提出一种基于相关性响应值的权重掩码,在离线训练时提高相似语义目标损失值的权重,使模型在端到端的离线学习中增强对相似语义目标的辨别力。实验表明该方法有着良好的跟踪性能并具有优越的实时性。(3)基于Flask应用框架,将本文所设计实现的目标跟踪算法实现于Web系统中,用户可在浏览器页面中与服务器进行自主交互,能够实现对多个摄像头所捕获的实时视频帧流中的多个目标物体的选中、读取后台算法模型对各目标的定位数据以及重置跟踪目标等功能;服务器端则实时监听用户行为,对用户选中目标进行定位跟踪,并回传图像和位置等数据给前端页面显示,以及生成日志文件等。对系统的功能性和非功能性测试验证了所开发系统的稳定性、兼容性和可靠性,系统的运行结果则验证了本文算法的实时性和鲁棒性,展示了本文算法的实用意义。
其他文献
在现代工业生产中,随着传感器、PLC和DCS系统的普及与应用,数据和数据处理技术逐渐受到重视。基于数据驱动的多元统计过程监控方法能够在线评估过程运行状态,保障系统的可靠性和稳定性,对提高产品产量和质量具有重大意义。然而实际过程中大量存在的异常值和缺失数据现象,给基于数据驱动模型的过程监控带来挑战。论文研究基于改进潜结构投影(Modified Projection to Latent Structu
在传统系统辨识和状态估计方法的研究中,噪声经常被假设满足一定的概率分布条件,但是随着被研究系统的复杂度越来越高,满足概率分布的噪声往往难以获取,这时假设噪声在一定区间内更能满足实际生产需求.为了减少计算量,加快参数可行集收缩速率,提高参数辨识效率,本文以凸空间结构收缩分析为基础,研究了基于凸空间结构参数可行集滤波的系统参数辨识和状态估计研究算法,这对丰富和发展参数的集员滤波方法具有前瞻的理论意义和
在体验经济时代下,博物馆正从单一的文化收藏展示机构转型为文化交流、社会教育、展览娱乐等功能为一体的综合性场所,并不断丰富人们的精神文化生活。随着移动互联网的深入发展,以智能手机为载体的移动导览系统正成为博物馆文化信息传播的主流媒介,扮演着辅助观众寻求个性化游览体验的智能助手角色。但是,目前多数博物馆移动端导览系统常关注新媒体技术的应用而忽视了用户情感需求的满足,导致在人性化功能和情感化体验建设方面
无线传感器网络(Wireless Sensor Network,WSN)由大量成本低廉、可收集数据的传感器构成,在环境、健康监测和入侵检测等领域得到广泛应用。由于传感器部署的随机性会影响网络的整体性能,且优化的前提是要获取WSN的整体概况,本文研究的边界和瓶颈就是其中最重要的整体信息。根据中介中心性可衡量节点在节点对间的重要性的特点,发现WSN中不同节点对间的最短路径较少经过边界节点,即边界的中介
受贸易政策变化、大流行疫情等因素影响我国针织童装行业发展增速放缓,但行业总体仍处于上升转型阶段,既有着国家“一带一路”倡议、互联网信息化、行业智能化的发展机遇,又有着缺乏创新性、品牌影响力小、消费者需求升级等挑战。今后几年针织童装行业即将迎来发展的黄金期,但对标国外成熟的针织童装市场以及国际头部童装品牌,中国针织童装行业仍处于成长期,针织童装要朝着柔软舒适、健康安全、时尚创新、多功能化、绿色可持续
由于第四次工业革命对工业智能化的需求逐渐增加,多智能体系统的分布式协同控制问题在近年来逐渐受到越来越多的研究者的关注。在多智能体系统的研究领域中,一致性问题是一个研究热点。在过去的许多研究中,研究者们假设多智能体系统所处的环境是理想的,即多智能体系统不会受到网络攻击的影响。然而,多智能体系统对于通信网络的依赖性使其暴露在了网络攻击的威胁中。因此在设计多智能体系统时,考虑网络攻击所带来的影响非常有必
人体行为识别是人工智能、模式识别以及机器学习等领域中最重要的研究方向之一,是计算机视觉和多媒体分析领域的热点研究课题,在安全监控、人机交互、医疗诊断、视频分类等领域都有着重要的学术意义和巨大的应用价值。虽然人体行为识别方法在早期的研究过程中已经取得了较大的进步,但是在实际应用中人体行为识别数据常受到光照变化、复杂背景、遮挡和人体自身等因素的影响。这使得人体行为识别研究始终是十分具有挑战性的课题。现
近年来,随着人工智能与机器视觉技术飞速发展,行人检测和跟踪技术因其具有重要的学术研究价值和商业价值,受到人们广泛关注,基于检测的目标跟踪算法逐渐成为研究的热点,其中检测器的性能对算法最终的跟踪性能起着至关重要的作用。论文沿用基于检测的跟踪框架,对基于卷积神经网络的行人检测与跟踪算法进行了深入研究,主要研究内容如下:在行人检测方面,针对目前行人检测过程中漏检率高和检测速率慢的问题,在YOLOv3算法
随着网络通信技术的日益成熟、网络规模的不断扩大,网络安全具有越来越重要的意义。网络流量数据的异常检测和分类成了维护网络安全的一种重要手段,近年来受到越来越多的关注和研究。但目前网络流量数据异常检测和分类的研究中存在着数据量大、数据分布不平衡、传统的异常检测和分类方法准确度较低等问题。自编码器是深度学习领域中重要的神经网络,由于其出色的特征提取能力而被广泛研究用于数据的异常检测和分类领域,本文主要针
迭代学习控制广泛应用于具有重复运动特性的被控对象的轨迹跟踪问题,其利用先前批次的输入以及误差信息,不断修正当前批次的输入信号,经过足够多的批次后能够实现准确跟踪。实际中被控系统一般都是非线性系统,因此,将迭代学习控制理论应用于非线性系统的跟踪控制问题具有重要研究价值。在传统的迭代学习控制研究中,学习律的增益大多是固定不可变常数,增益固定系统收敛速度一般也固定,初始参数的设定决定了系统的运行状况。变