【摘 要】
:
行为识别技术是融合了计算机视觉、深度学习、模式识别等众多领域研究成果的交叉学科,在视频搜索、辅助医疗、视频监控等方面具有广泛的实际应用价值。包含人体行为关键信息的骨架数据,不仅能够准确描述三维空间中人体的动作姿态,其刚性连接结构还对多种外部干扰因素具有一定的鲁棒性。因此,基于骨架和姿态信息的行为识别技术也受到了国内外学术界和产业界的关注,是计算机视频分析领域的研究热点之一。本文主要针对人体骨架信息
论文部分内容阅读
行为识别技术是融合了计算机视觉、深度学习、模式识别等众多领域研究成果的交叉学科,在视频搜索、辅助医疗、视频监控等方面具有广泛的实际应用价值。包含人体行为关键信息的骨架数据,不仅能够准确描述三维空间中人体的动作姿态,其刚性连接结构还对多种外部干扰因素具有一定的鲁棒性。因此,基于骨架和姿态信息的行为识别技术也受到了国内外学术界和产业界的关注,是计算机视频分析领域的研究热点之一。本文主要针对人体骨架信息提取和基于骨架的行为识别问题展开研究,主要内容如下:(1)本文对骨架提取和姿态估计算法进行研究。本文首先在数据集上对四种主流的骨架提取和姿态估计算法进行了对比实验分析。然后,为了提高骨架姿态信息的准确性,本文在基于卷积神经网络和PAFs特征的Open Pose姿态估计算法的研究基础上提出了一种基于数据关联和骨架能量模型的去噪方法。该方法通过将骨架数据与人体目标进行数据关联,统计骨架点在时间序列上的累积能量,减少了无关背景和环境噪声的干扰。最后,经过定性实验和定量分析,本文验证了该算法的有效性。(2)本文研究了基于空时图卷积神经网络的人体行为识别算法。首先,通过结合Kinect数据集和实地采集的自建数据集,本文对空时图卷积神经网络在交叉视角类数据上进行了实验测试和性能评估;然后,根据算法对不同动作类型的识别准确性,设计了将骨架信息和注意力模型融合的投票分类策略,进而输出了行为识别结果。实验表明,该方法对于长时间运动的识别精度有一定提高。(3)基于以上研究,本文设计并搭建了一套应用于篮球运动的骨架提取与行为识别系统。该系统主要包含视频采集、骨架提取和行为识别三个模块。其中,视频采集模块对篮球比赛中涉及的六种不同动作进行了拍摄,并构建了相应的人体骨架数据库;骨架提取模块主要用于实时提取骨架信息,并估计运动姿态;行为识别模块则利用基于空时图卷积神经网络的运动行为识别方法,计算得到球场上特定运动员的行为类别。该系统在体育视频直播和智能教学等现实场景中有较好的应用前景。
其他文献
自然场景下的水果检测在自动机械收获系统、水果产量统计与预测等方面具有较大的应用前景。但是,果园现场环境十分复杂,存在着遮挡、光照不均匀、水果颜色与周围环境颜色相近等问题,导致依靠传统手工设计特征的机器学习方法检测准确率不高,泛化性能不强。由于基于深度学习的目标检测算法检测准确率高,泛化能力强,并且对于遮挡和光照不均匀等问题具有较强的鲁棒性。因此,本文利用卷积神经网络进行水果检测,分别研究了使用锚点
旅游早已随着国民经济的发展、人民收入水平的提高,人民物质文化需求的增加,以及旅游开发建设的完善而走进千家万户。如今中国人的旅游需求已经由单纯的满足求异心理进阶为休闲享受,人们的旅游心理、休闲行为和消费习惯都在发生改变,我国正在进入“休闲旅游时代”,国家层面也提出“坚持以人为本、服务民生、安全第一、绿色消费、大力推广坚健康、文明、环保”的旅游休闲理念。风景道作为新兴旅游目的地,以其交通位移、休闲慢行
目前建筑能耗约占我国社会总能耗的30%左右,在过去的十多年中,公共建筑总面积增长了近3倍。高校的能耗占比约为社会总能耗的8%,全国大学生的人均能耗是全国居民人均能耗值的4倍。根据清华大学建筑节能研究中心2018年的研究报告显示,商场与学校增长速度最快约为5倍,并且高校能耗将会一直呈刚性增长的趋势,因此高校建筑节能意义重大。在当前建筑节能新形势下,系统且深入地研究建筑热环境、人体热舒适以及建筑能耗三
快速傅利叶变化(FFT)通过将长序列的DFT计算分解成短序列DFT计算,从而大大减少了计算量。FFT在无线通信、语音识别、图像处理、频谱分析等领域有着广泛的应用。循环冗余校验码(CRC)以其简单的算法结构、强大的检错能力,可极大地提高数据的可靠性,且易于实现。正是靠强检错能力与高校验效率,使得CRC在数字通信中获得了应用广泛。将FFT和CRC作为MCU的外围电路可以增加其灵活性,同时也增强了MCU
二连盆地的勘探开发历史由来已久,近年来随着新的凹陷区不断被发现,其开发价值逐步上涨。自2008年阿尔凹陷被发现以来,快速形成了大规模储量代替区,碎屑岩储层成为主要储层类型。前人已经对阿尔凹陷的沉积环境、地层特征、储层特征、油气开发等做了详细的勘探研究工作,但针对成岩作用和储层岩性特征研究甚少。随着勘探不断深入,优质储层预测与评价显得尤为重要,需要结合二连盆地地质构造、沉积相类型及其展布、储层物性特
布谷鸟搜索算法(Cuckoo Search,CS)是一种新型的元启发式算法,用来解决全局函数目标优化问题。布谷鸟搜索算法在寻优的过程中采用Levy flight随机游走模式,具有控制参数少、简单易实现、搜索路径优、搜索能力强等特点,并成功应用于大量工程型实际问题中。在布谷鸟搜索算法中,存在两个问题。一是Levy flight随机游走产生的步长是完全随机的,因此缺乏可控制性,从而存在后期收敛速度慢和
随着我国经济的进一步腾飞,种类各异的基础设施如火如荼地建设在我国的各个区域。然而我国的膨胀土区域遍布各地,众多的高速公路、铁路建设穿越其中。膨胀土是由强亲水性矿物蒙脱石与伊利石组成的高塑限粘土,具有吸水膨胀、失水收缩且反复变形的工程特性。在动荷载反复作用下,膨胀土会产生不可恢复的永久变形,引起土体变形过大及破坏。磷尾矿是磷矿经选矿后的固体废弃物,每10万吨磷矿将造成3-4万吨磷尾矿,利用其替代石灰
程序性行政行为的可诉性一直都是理论界和实务界的热点问题。2016年最高人民法院第69号指导案例从个案的角度确立了程序性行政行为具备可诉性的判断标准,但在实践过程中行政
充填采煤技术采用充填法管理顶板,其矿压显现及岩层运动规律发生显著变化,矿压显现程度明显弱化。论文在前人研究的基础上,针对充填采场矿压显现弱化的科学问题,采用现场调研、力学计算、数值模拟与工程实践结合的方法,提出了充填开采矿压显现弱化的内涵,分析了充填开采矿压显现弱化的表征,研究了充填采场矿压显现弱化规律及其控制策略。取得了如下成果:(1)提出了充填开采矿压显现弱化的概念并分析了其主要影响因素。由充
法律论证作为一种20世纪70年代出现的法律方法,在司法实践中发挥着重要的作用,也是刑事诉讼实践中重要的法律方法。由于刑事诉讼活动直接关系到对犯罪行为的追诉和对公民生命