基于计算机视觉的人体动作检测和识别方法研究

被引量 : 0次 | 上传用户:jxhxf0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作检测和识别作为人体运动分析研究的重要内容,在智能监控、人机接口、基于内容的视频检索和图像压缩等领域有着广阔的应用前景和潜在的经济价值和社会价值,正受到越来越多研究学者的关注。由于人体动作属于非刚性运动,在不同条件下,同一种动作类型本身变化差异较大,然而不同动作类型之间变化差异较小,因此人体动作检测和识别面对的困难往往比其它目标检测和识别要大。本文系统地研究了如何在视频中检测和识别出人体动作的问题。根据人体动作检测和识别过程以及实际应用的需要,本文研究的问题包括:(a)室内环境下的人体检测;(b)复杂背景下的目标跟踪;(c)遮挡情况下的目标跟踪;(d)运动摄像机下的人体动作检测和识别; (e)动态背景下的人体动作检测和识别。从这些问题出发,本文提出了相应的解决方法,主要研究内容和创新点归纳如下:1.由于人体本身容易受自身或其它物体的遮挡、人体观测角度以及人体肤色差异的影响,加上随着广角镜摄像机的逐步普及,利用人体颜色,形状等特征的方法很可能失效。针对这些问题以及系统可扩展的需求,提出了一种基于黑板模式的室内人体检测算法。该算法通过将其它室内非人体目标排除来实现人体检测。通过增加或者删除知识源(处理模块),就可以实现算法的改进,改善系统的扩展性。实验结果表明基于黑板模式的人体检测方法是有效的。2.针对复杂背景的情形,提出了一种基于非参数聚类和多尺度图像的目标跟踪方法。该算法首先通过利用改进的非参数聚类自动确定颜色直方图的位数,利用确定的直方图位数以及高斯函数来建模目标结构信息,并定义目标外观模型。然后依据Bhattacharyya系数定义推导了目标模型与候选目标模型的相似性函数。另外通过利用金字塔图像进行从粗到细的目标空间定位。最后通过最大化一个对数似然函数的下界得到最优核函数带宽,实现目标尺度定位。实验结果表明该方法优于典型的均值漂移算法。另外针对跟踪过程存在遮挡的情形,提出了一种基于人体检测和改进均值漂移算法的多目标跟踪方法。解决遮挡问题关键就是如何将遮挡前的可靠轨迹和遮挡后的临时轨迹连接起来。文中定义了一个利用目标外观、尺度和位置信息的连接似然函数,并利用Hungarian算法得到最优连接组合。实验结果表明该方法有效。3.针对运动摄像机和动态背景的情形,提出了一种基于形状-运动特征的人体动作基元树的人体动作识别方法。在训练过程中,通过k-均值聚类得到人体动作基元,然后利用层次k-均值聚类方法建立树模型,将人体动作基元保存到各个叶结点中去。测试过程中,首先检测出人体,并通过利用外观信息进行跟踪得到人体的大概位置,然后利用一个联合概率优化过程细化人体的位置和识别与当前帧对应的动作基元。最后通过动态时间规整算法识别人体动作。另外提出了基于HMM的图像帧到动作基元匹配方法,并与基于树模型的图像帧到动作基元匹配方法作实验比较。实验结果为在Keck手势数据库中达到91.07%的识别率,Weizmann动作数据库中达到100%的识别率,KTH动作数据库中达到95.77%和在结算柜台数据库中达到99.23%的识别率。4.针对运动摄像机和动态背景的情形,提出一种基于动作基元判别树模型的集成人体动作检测,识别和分割方法。训练过程中通过k-均值聚类学习得到人体动作基元,然后建立人体动作基元树模型。每个树结点具有一个用于训练和测试过程中快速匹配的截止阈值,每个叶结点还另外包括参数集:匹配到该叶结点的训练图像帧索引和动作类型分布概率。测试过程,首先将从滑动窗口中计算得到的特征描述符快速匹配到学习的树模型中,得到人体动作的初始位置,然后通过一种全局滤波的方法来修正每一幅图像帧的人体动作位置。人体动作的识别过程是通过一个动作类型和动作基元的联合概率之和最大化过程得到。通过使用叶结点保存的帧索引计算得到分割掩膜实现人体动作分割。实验结果为在CMU动作数据库和Weizmann动作数据库中达到100%的识别率。5.针对运动摄像机和动态背景的情形,这里提出了一种基于判别霍夫表决树的多类型人体动作检测和识别方法。训练过程中,首先利用局部运动、外形特征建立一对定位树,对全局联合hog-flow特征运用层次标签一致k-均值聚类方法建立一棵识别树。每个树结点保存着特征类型分布函数,而对于定位树模型来说,每个树结点还保存着相对目标中心位移。测试过程中,首先访问定位树并运用局部特征表决得到一小部分最有可能包含人体动作的位置,然后对这些潜在位置提取全局特征,访问识别树并运用全局特征表决来识别人体动作。实验结果表明该方法优于现有方法在Keck手势数据库,CMU动作数据库以及KTH动作数据库中的测试结果。
其他文献
生产线是制造企业进行生产活动最基本的载体,一条设计合理的生产线可以大大减少企业的投资风险和投资成本。为了规划出一条较好的生产线方案,传统的设计方法已经不能满足需求
以悬拼贝雷钢拱架施工拱圈的某拱式渡槽为背景,通过对拱架结构的稳定性及承载能力进行分析,揭示拱圈现浇过程中拱架的力学行为,并对拱架不同约束形式下其稳定性和承载力的变
通过分析思维导图在单词记忆、课堂内容的整合、提高阅读效果三个教学方面的运用,探究思维导图作为教学模式在初中英语课堂教学中的运用,期望能对初中英语课堂教学实践提供一
随着新《纲要》的深入实验和推广,幼儿的学习方式、教师的教学方式、教学内容的呈现方式和师幼关系都在发生着深刻的变革,所以,教学活动中的语言提炼要赋予新的内涵。提炼语
镁合金具有许多优良的物理和力学性能,在航空航天、汽车制造、电子通讯、军事及核能等诸多领域应用广泛。然而,镁合金的耐蚀、耐热及耐磨性能较差,严重阻碍了其进一步应用。
各个国家的企业文化都有其各自的特点,中美两国由于地域、民族、社会心理的不同,经济社会发展走向和发展水平,特别是社会文化和根本社会制度的差异,中美两国的企业文化呈现出
近年来,随着微电子技术和半导体技术的不断发展,大部分电子产品都在向着小型化、便携式的方向发展,与此同时,人们对于音频功率放大器的要求也日渐趋于小型化、低能耗和高效率
磐安素有'群山之祖、诸水之源'之称,是全国首批国家级生态示范区、国家生态县和国家重点生态功能区.全县森林覆盖率达83.68%,林木蓄积量615.3万立方米,森林年生态价
<正>随着世界经济一体化的加快和我国改革开放的日渐深入,许多日资企业纷纷落户包括长三角地区在内的广大地区。虽然日本与我国在地缘关系上同属于亚洲地区,而且这些地区的文
本论文根据代谢控制发酵和有机酸发酵工艺学分析理论,研究了葡萄糖酸钠高产菌筛选及其发酵条件和发酵动力学。主要研究内容和结果如下:⑴应用“纸层析法”对发酵液中葡萄糖酸