基于视频的多目标检测追踪以及人体行为识别的研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:djjsl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代科学技术的发展,深度学习已经成为人工智能领域的主流技术。深度神经网络可以学习到表达能力强、泛化能力强的特征,使得深度学习在各个领域的任务上取得了超越传统算法的性能,特别是在自然语言处理和计算机视觉方面,其取得的成果远远超过先前相关技术。从现代科学研究成果来看,视觉可以捕获大量的信息,是人体五个感觉器官的重要存在。目标检测、目标跟踪、行为识别基于其任务本质,成为了计算机视觉的研究热点。得益于深度学习的发展,这三门技术近年飞速发展,且逐渐被应用到各个领域,但随之而来的是更多的困难和挑战。因此研究目标检测技术、目标跟踪技术、行为识别技术具有重大现实意义,本文将基于这三种技术,设计实现一种在GPU上能够实时计算,集目标检测、目标跟踪与行为识别功能于一体的感知融合算法框架。本文设计的感知融合算法框架由四部分组成,分别是目标检测模块、目标跟踪模块、姿态估计模块以及行为识别模块,这些模块将以串行或并行的方式结合到一起,因此对每一个模块的性能(精度和速度)都有极高的要求。对于目标检测模块,基于对轻量化网络的性对比,设计了基于MobileNetV1 与 YOLOv3 的超实时目标检测算法 YOLOv3-MobileNet1.0,在公开数据集上取得了有竞争力的成绩。对于目标跟踪模块,设计提出了一种超实时的,基于跳帧检测策略,SORT与SiamRPN++相融合的长期目标跟踪算法,并以MobileNet系列网络对SiamRPN++算法进行加速,算法最终在实际应用中取得了不错的性能。对于姿态估计模块,本文使用PixelShuffle作为上采样层,基于AlphaPose的思路设计提出了 FastPose-MobileNet1.0姿态估计网络,在公开数据集上精度超越了同数量级的其他姿态估计算法,并达到了单目标超实时性能。对于行为识别模块,本文认为多目标行为识别,人体骨骼运动特征相较于图像特征,噪声更少、计算量更小,基于GCN设计了基于骨架重建的时空图卷积网络SR-STGCN,相较于ST-GCN在NTU RGB+D数据集上精度高了 3个百分点。综上,本文提出的感知融合算法框架的各个改进或提出的模块均在公开数据集上具备一定性能优势,并且算法框架在实际应用上取得了不错的成果,证明了本文设计提出的感知融合算法框架具有研究价值和使用价值。
其他文献
镁合金的性能优势使得其在新能源汽车、生物医学等领域应用十分广泛。但常规的轧制方法生产板材时极易产生严重的边部裂纹和性能差异,极大的制约了镁合金板材工业化生产及推广应用。因此,本文在课题组“边部预制凸度抑制边裂”研究思路的指导下,采取理论分析、数值模拟、实验研究三维一体的研究方法,通过对以下内容的研究,以期检验边部预制凸度抑制镁合金轧制边裂的可行性,并探明其预控机制。主要研究内容如下:(1)AZ31
本文是有关基于新型材料液态金属镓铟锡合金天线设计的研究。本文在对国内外有关液体天线——主要是液态金属天线设计及液态金属应用的现状研究学习的基础上,对各类基于液态金属的天线设计方案进行对比总结,发现电磁性能较为稳定,且适用于大规模制造的液态金属镓铟锡合金材料,在可重构天线及柔性天线的设计中具备自身独特的优势。文章基于液态金属镓铟锡合金的该种特性,对国内外可重构天线及其液态金属天线的设计进行了深入的研
图像显著性检测是机器视觉的重点研究课题之一,因其广泛的实际应用价值成为研究热点,但如何快速、精准的提取图像中有用信息是图像显著性检测的关键。通过显著性检测获取人类感兴趣的区域,进而分离出图像的目标区域和背景区域,由此可以实现图像分割、目标识别、视频追踪等机器视觉应用。本文首先介绍几种经典的显著性检测模型,并对每种模型的检测图和模型特点进行分析对比,在此基础上提出一种基于低秩稀疏分解与马尔可夫链的显
近年来航天航空事业的高速发展,对电路性能的需求不断增加,而且面临的空间辐射效应不断严重,迫切需要技术的的发展与革新。FDSOI作为一种新型半导体工艺结构,在抗辐射能力、功耗、器件缩比特性方面具有显著优势,越来越受到业界的关注。随着FDSOI技术的不断发展,器件尺寸已步入纳米量级。小尺寸器件由于工作电压较低,电路节点临界翻转电荷也较小,电路对单粒子效应越来越敏感。FDSOI器件尺寸变化对单粒子效应的
支气管哮喘(简称“哮喘”)是过敏原或其他因素引起的气道高反应状态下出现的广泛而可逆的气道狭窄性疾病。最新发表在《柳叶刀》上关于“中国成人肺部健康研究”数据显示,中
在现实世界中,存在相当一部分数据集由大量的无标记样本和少量的有标记样本组成,由此产生了半监督学习。半监督学习通过少量的有标记样本和大量的无标记样本来进行模式识别工作,在减少人工标注成本的同时较准确的进行分类工作。此外,半监督学习的另一大优点是其能够解决监督学习模型泛化能力不强和无监督学习模型不精确等问题。协同训练是一个简单有效的半监督学习框架,在多个视图上训练多个分类器,通过多个视图互补的作用,迭
图像超分辨率重建是指利用现有的数字信号处理方法,在不增加成像设备等硬件成本的前提下,对一个或多个低分辨率图像的分辨率进行提升的一种图像处理技术。本文在研究基于学习的算法基础上,对现有算法中存在问题提出改进。主要研究内容如下:首先,提出了改进的稀疏表示遥感图像超分辨重建算法。该方法先对图像特征提取的一阶、二阶滤波算子进行改进,使用改进的四个一维滤波器提取的低分辨率遥感图像特征信息更丰富完整。然后对字
随着宽带网络的快速发展,对等网络技术(Peer-to-Peer,P2P)已广泛应用于流媒体服务,具有高扩展、低成本的优点,能有效降低服务器带宽开销。近年来,HTTP自适应流媒体技术(DASH)由于具备部署简单、自适应调整码率的优点,也得到了快速的发展,广泛应用于流媒体点播服务(Vo D)中。在流媒体点播服务中,如何有效应用对等网络技术与HTTP自适应流媒体技术的优点是一个要解决的问题。另一方面,随
工业4.0时代的到来,全球掀起了第四次工业革命,智能制造、智慧工厂和智慧物流建设成为工业4.0时代的主题,我国积极面对工业4.0时代的到来,提出“中国制造2025”战略,把握住新的发展机会。智慧物流的发展和应用,是工业4.0时代建设的重要内容之一,也是制造企业建设智慧工厂、实现智能制造的重要支撑。然而智慧物流技术出现至今,还没有得到制造企业广泛的认同,如何增强制造企业采纳智慧物流的意愿,推进智慧物
英语学困生具有学习能力低,课堂表现差的特点,没有养成良好的学习习惯是其学习困难形成的重要因素之一。培养英语学困生的良好学习习惯有利于增强学困生学习的自信心,提升学习能力,使学困生学习成绩有所提高,从而更加促进良好学习习惯的养成,最终形成良性循环。研究者根据所研究班级学困生的实际情况做了全面详细的分析,与相关老师共同合作制定了学困生良好学习习惯培养的措施,并展开了行动性研究。本研究以乌鲁木齐市X中学