基于稀疏时空特征的人体行为识别研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:wanglinux_0208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别是计算机视觉研究热点之一,同时也是实现人工智能的重要手段,在运动分析、智能视频监控、人机交互、虚拟现实、医疗看护等领域都具有十分广泛的应用前景。为了从海量视频数据中自动获取与人体行为相关的信息,本文以机器学习领域最新方法——深度学习作为技术手段,着重研究深度学习中多尺度输入数据、时空深度置信网络的改进以及不同的池化策略,并将所研究的深度学习框架应用到人体行为识别中。具体如下:1)针对现有深度学习方法输入局限于单一尺度数据,而现实场景中目标对象往往呈现尺度多样性的这一实际,考虑到不同尺度间的信息交流,基于Chen提出的ST-DBN模型,将时空Gabor滤波后形成3个不同尺度的数据作为ST-DBN模型不同通道的值,联合学习多尺度的特征。在KTH数据集上的实验结果表明多尺度学习的特征要优于单一尺度学习的特征。2)针对Chen的ST-DBN模型采用空间信息优先于时间信息的学习方式,并不适合于行为分析的情况,基于大量的运动分析问题中时间信息优于空间信息这一先验,改进原始ST-DBN模型为TS-DBN模型。实验结果表明,无论是单尺度还是多尺度数据下的特征学习,改进后的TS-DBN模型的行为识别效果均优于ST-DBN模型。3)针对神经网络训练时容易出现过拟合的问题,也为了提高行为特征的尺度不变性,提出了稀疏金字塔池化策略。该方法引入空间金字塔思想对空间域CRBM的池化输出进行多级扩充,并采用重叠池化操作调整池化参数,在一定程度上提高了池化方法的性能。同时为了降低特征描述的复杂度,采用稀疏编码从高层语义上进行金字塔多级特征的融合。实验结果表明,稀疏的金字塔池化策略要优于传统的概率最大值池化策略,而且从宽度上进行的网络结构拓展,其识别效果完全不亚于更深一层网络结构的识别结果。4)基于前面三个方面的研究,分别在KTH数据库和UCF体育数据库上进行了基于稀疏时空特征学习的行为识别应用。实验结果表明基于深度学习方法可以自动提取稀疏时空特征,获得与人工设计特征相匹配的识别效果,而相对于传统的时空深度置信网络,本文提出的改进方法在识别率上有了一定程度的提高。
其他文献
对于现代室内环境而言,光环境的营造要在满足使用者的物理、生理视觉、心理、人体功效学及美学等之间形成统一,才能在人与环境之间构建健康、美好、和谐的相互关系。基于视觉
市政道路工程有许多不同于其他道路工程的特点,经常出现一些特殊的质量通病,监理必须予以特别的监控。笔者根据多年的市政道路施工和管理经验,提出了施工中存在的质量通病,,
<正>2017年2月23日,内江市中区召开100万头"内江黑猪"开发利用产业化项目工作推进会。全区相关职能部门的有关人员、有意向参与该项目建设的20余位业主以及负责该项目开发的
“继续深化养老机构的‘放管服’改革,全面放开养老服务市场”日前被民政部明确列为2018年重点工作任务之一。连日来,山西、云南、安徽、江苏等地接连发文,对全面放开养老服务市
报纸
<正>按照山东省总工会关于全面深入开展工会财务会计管理规范建设工作的要求和具体工作部署,泰安市总工会从"四抓"入手,坚持高起点开局,高标准推进,实现了市、县、规模以上企
近些年来,随着互联网和多媒体技术的飞速发展,数字资源正处于指数式的增长状态,数字视频作为数字资源中的重要组成部分,已经进入人们生活的方方面面,如何对这些数字视频中的
由于国家经济的持续发展,信息化建设变得越来越重要,和信息化建设有密切联系的通信产业也发生了比较的变化。虽然建设速度持续增加,但是由于通信工作的分工比较细致,要是没有
矿区资源储量核查是一项比较繁琐的工作。要想提高核查矿区资源储量核查的质量,就必须完整、科学地理解矿区资源储量核查技术要求,保证资源储量数据的可靠程度。从资源储量核查
目的:观察复合膳食纤维对骨科住院病人便秘的防治效果。方法:选取92例胃肠功能正常的无便秘骨科手术病人,随机分为对照组和观察组,每组46例。病人在术后正常饮食的基础上,观
本文在讨论了下一代信令转接点在满足传统信令网络功能的基础上,着重介绍了下一代的信令转接点上实现的号码携带、灵活路由等新业务,并如何实现传统STP面向下一代网络的平滑