基于时空上下文建模的行为识别研究

来源 :苏州大学 | 被引量 : 2次 | 上传用户:wcf2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频行为识别是近年来计算机视觉的研究热点之一,它在智能监控、虚拟现实、医疗看护、机器人视觉、人机交互等众多领域有着广泛的应用前景。为了深入挖掘时空上下文信息,本文提出基于时空上下文建模的行为识别方法。首先利用双向时空建模提取双向时空行为特征描述,其次利用自适应时间金字塔提取多粒度时空行为特征描述,为了弥补以上两个特征描述在空间位置上信息的缺失,使用视觉特征与轨迹特征相结合的方法编码更多空间位置信息,最后使用自适应融合方法融合上述多个时空模型进行行为识别。主要研究工作如下:(1)针对现有流行的行为识别方法难以捕获鲁棒的双向时空上下文信息,导致当前帧的描述只注重前面帧对它的影响,而忽略了后面帧作用的问题,提出了一种基于双向长短时记忆单元(Bi-directional Long Short Term Memory,Bi-LSTM)的双向时空特征描述。该方法首先将VGG16卷积神经网络修改应用到视频行为识别问题上,并对原始视频帧进行裁剪、翻转操作,从而进一步提升网络性能。然后使用该网络提取鲁棒的深度特征,并输入到Bi-LSTM中获取双向时空上下文特征,最后利用Softmax进行分类识别。实验结果表明,双向时空建模方法可以有效地提取鲁棒的双向时空上下文信息,显著地提升行为识别的准确率。(2)针对大多现有方法只在一个时间粒度上建立时空模型,导致提取到的特征无法兼顾全局信息和局部信息的问题,提出基于多层自适应时间金字塔的多粒度时空特征描述。该方法首先利用卷积网络提取视频序列的全连接层特征,并根据时间金字塔的思想,采用改进的自适应时间金字塔划分方式,按照能量自适应地将视频划分成不同长度的时间片段,重点突出能量变化剧烈的时间段,关注短时变化剧烈的行为。然后分别对各时段内提取到的特征进行傅里叶变换,将多层特征表达融合形成最后的特征表达。实验结果表明,该特征描述可以有效表征多粒度时空上下文信息,兼顾长短时特征,并能够更好地应对具有剧烈变化的行为。(3)针对单个模型无法充分表达复杂的行为时空结构,导致模型表达能力不足的问题,提出使用自适应融合方法融合多个模型进行行为识别。首先,为了弥补以上两个时空特征描述提取的空间位置信息的不足,使用了视觉特征与轨迹特征融合的方法加强空间信息。最后为了充分利用各个时空特征各自的优点,对不同特征表达进行后融合,利用行为类别之间的联系引导权重参数的学习,自适应赋予各方法不同的权重。在UCF-101和HMDB-51数据集上的实验表明通过自适应融合方法,可以充分利用各模型的优势,取得优于单一模型的性能。
其他文献
以脱脂桃仁粉为原料,研究了碱溶酸沉法提取桃仁蛋白的工艺条件。以桃仁蛋白提取率为指标,考察了提取温度、pH、料液比和提取时间对桃仁蛋白提取率的影响。在单因素实验基础上
<正>在日新月异的信息时代,地方电视台民生新闻栏目持续以人本主义、本土化及互动性为营销优势的传统市场架构被层出不穷的多媒体形式所冲击后,地方电视台民生新闻节目在文化
本文以澳门益隆炮竹厂的文化再生改造为样本,强调在产业遗产保护过程中保护与再生的紧密关系,并从城市肌理的重构、社会机能的再生,集体记忆的活化三方面,探讨传统产业遗址文
近年来我国私家车保有量的不断增多,城市中户均拥有私家车比例越来越高。90年代开始建设的商品房住区,在今天已经成为城市中的旧住区,这些住区内建筑质量基本完好,在今后一定
伴随着国有企业改革发展关键时期的到来,怎样建立完善的人才培养激励机制,以此达到吸引人才、留住人才的目的是目前很多国有企业关注的问题。本文以某国有企业下二级单位为研
<正>医院要发展,要在市场经济中站稳脚跟,就必须提供优质的医疗服务。"以病人为中心,一切为了病人"是医院工作的根本宗旨,是医疗行业遵循的基本指导原则,同时也是医院门诊乃
为了使工程渣土成为可再次利用的新型建筑材料,首先探究了水泥固化材料对渣土的强度影响,然后将废旧报纸棉状化处理后制成再生纤维,将水、水泥和再生纤维混合在一起,通过流动
本文以湖北省的五个增减挂钩项目作为研究对象,从经济、社会、生态三方面选取指标构建效益评价指标体系,利用农户数据,综合运用层次分析法和模糊综合评价法,测度政府主导模式
目前,我国北方建筑采暖能耗约占到北方建筑总能耗的50%以上,而建筑实施供热计量后能够有效地降低建筑采暖能耗。由于目前供热企业普遍存在资金匮乏的问题,导致供热计量进展缓慢,
民办高校在将近30年的发展道路上,日益扮演者越来越重要的角色,为中国教育的发展而不懈努力。民办高校在快速发展中,以自己灵活的特性,积极开展中外合作办学项目,在教育国际