基于关注度LSTM的动作提议和行为识别

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:da_yu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行为分析的目的是从视频中检测和识别正在发生的行为,使得计算机系统能够理解行为并对场景进行进一步的语义描述。然而,海量视频数据的背后蕴含的是参差不齐的视频内容,这无疑给视频行为分析带来了巨大的挑战与压力。当前已有的各种分析模型虽然能够较好地对视频中的行为进行分析和识别,但是仍然存在一定的局限性:行为分析模型多数局限于底层特征,难以表达行为发生的具体过程;复杂的背景噪声和光照条件的变化,使得视频中包含了大量的背景冗余信息;视频时长的长短不一使得视频中包含了大量与行为分析不太相关的冗余帧。对此,本文通过行为分析任务基本特征,结合循环神经网络的信息依赖特性,在长短期记忆网络中引入时空关注度机制,挖掘时空语境信息,探索行为表达过程,并且能够提取视频中关键帧的显著性区域,提取有效信息,强化行为表达。针对上述问题,本文主要工作如下:(1)针对当前大多数行为分析仍然包含大量的噪声信息以及无法从认知角度理解行为的表达过程,本文在长短期记忆网络中引入关注度机制,挖掘行为时空语境线索,关注时空有效信息,提高行为分析效率。(2)针对当前大多数的动作提议研究方法的效率低下及步骤繁琐等问题,本文提出基于空间关注度的动作提议方法,挖掘场景中重要的刺激而抑制那些不重要的背景噪声,并且模型训练仅仅需要行为的类别信息而无需行为的真实边界框,进一步提高了动作提议的效率。(3)针对现实视频场景中含有大量的背景噪声信息,为了更加准确地对视频中的行为进行表达,在利用外观特征的基础上,采用双流网络进一步利用行为的时序运动特征挖掘行为的详细动作信息,而且由于视频的时长不一且动作发生的区域不同,提出的时空关注度机制可以有效提取关键帧的显著性区域,减少视频中的冗余信息对行为识别的干扰。
其他文献
本文研究紧急订购产能不确定性和风险厌恶对于报童库存决策的影响.文中考虑了两种风险厌恶度量,即条件风险价值(CVaR)和均值–条件风险价值(Mean–CVaR).首先分别给出了只有一个随机紧急订购源时CVaR和均值–CVaR准则下风险厌恶报童问题的最优决策所满足的方程组,并进一步分析了系统参数对于最优订购量的影响,还通过数值模拟对于获得的结论进行了检验和分析.其次,研究了具有两个紧急订购源(一个产能
故障检测是确保工业过程稳定安全运行的重要技术,研究有效、可行的故障检测方法对于工业过程的平稳运行和生产质量的保障具有重要意义。随着大数据的出现,现代工业过程中大量
现阶段,在线学习研究已经成为高等教育领域不可回避的话题,学生的主体地位愈发明显。为了更好的提升在线教育质量,应该多关注学生在在线学习过程中的感受和接受程度,而在线学习投入度作为评估在线教育质量的重要指标是最能够反映大学生在线学习现状的,该指标考察的是大学生在线学习的投入程度、接受程度和学习效果的情况。因此,有关在线学习投入度的研究对于全面了解在线学习模式下大学生的学业成就和评估高校在线教育质量有着
学位
微波光子技术是两门学科的交叉与综合,其两门学科分别为微波和光子学。其不仅利用微波频段可以为无线通信提供较宽的频谱资源,而且还可以利用光纤优势,具有宽带宽、低消耗、抗电磁干扰等特点。该技术在军事、卫星、无线通信方面都有重要的应用,而本文在光载无线通信(ROF,Radio-Over-Fiber)基础上对光载微波信号的传输问题,展开一系列的理论和仿真的研究。为了解决光载微波信号在长距离模拟光链路中传输的
图像修复是对图像中存在的缺失区域进行修补或者是对图像中不需要的目标物体进行移除,使得修复后的结果能够保持图像的视觉合理性,人眼无法观察到图像曾经缺失或已被修复。随
只要有权力,一个人就可能产生腐败动机,做出越轨行为。因此,腐败治理成为世界的难题。腐败作为一种社会污染,一旦蔓延开来,就会蚕食心智,破坏公平,极易引发重大社会事件。中国改革开放以来,为了降低腐败的危险性,在社会进入重要转型期,党中央立于现实,围绕中心任务,采取多种举措反对腐败,进行廉政建设,使党的反腐倡廉建设有了新发展,迈入了新阶段。改革开放新时期,以邓小平同志为核心的中央领导集体,重设反腐倡廉路
学位
随着移动通信技术和传感器技术的迅速发展,群智感知成为移动互联网领域的研究热点。移动节点利用智能终端嵌入的各种传感器感知数据并上传到感知平台,平台通过对数据的分析和
社交媒体平台包含了大量的文本数据,包括用户的反馈、评论、对话、意见等信息,这些信息是情感分析的基础。个体异常检测和情感建模是情感分析的重要组成部分,也是情感计算的
在协同任务环境下,借助工作流管理系统实现企业业务、信息和资源整合,使得多组织参与的业务过程执行更加高效。但是,由于资源服务数量巨大,种类庞杂,资源服务选取效率亟待提
传统测试中通过对比程序的输出结果与预期结果是否一致,来判断此次测试中是否发现了错误。但当一个待测程序的输入与输出关系很复杂时,将难以为待测程序构造预期输出。这即是软件测试中的Oracle问题。蜕变测试通过验证多个测试用例及其输出是否满足蜕变关系来判断程序中是否存在错误,从而缓解了测试中的预言问题。蜕变关系是蜕变测试的核心。为了确保蜕变测试的有效性,在蜕变测试中会构造出大量的蜕变关系。若所有的蜕变关