【摘 要】
:
针对视频中的完整行为建模,目前常用的方法为时间分段网络(Temporal Segment Network,TSN),但TSN不能充分获取行为的变化信息.为了在时间维度上充分发掘行为的变化信息,文中
【机 构】
:
南京航空航天大学计算机科学与技术学院 南京 211100南京航空航天大学计算机科学与技术学院 南京 211100;东南大学计算机网络与信息集成教育部重点实验室 南京 210096;
论文部分内容阅读
针对视频中的完整行为建模,目前常用的方法为时间分段网络(Temporal Segment Network,TSN),但TSN不能充分获取行为的变化信息.为了在时间维度上充分发掘行为的变化信息,文中提出了行为关联网络Action-Related Network(ARN),首先使用BN-Inception网络提取视频中行为的特征,然后将提取到的视频分段特征与Long Short-Term Memory(LSTM)模块输出的特征拼接,最后进行分类.通过以上方法,ARN可以兼顾行为的静态信息和动态信息.实验结果表明,在通用数据集HMDB-51上,ARN的识别准确率为73.33%,比TSN提高了7%;当增加行为信息时,ARN的识别准确率将比TSN提高10%以上.而在行为变化较多的数据集Something-Something V1上,ARN的识别准确率为28.12%,比TSN提高了51%.最后在HMDB-51数据集的一些行为类别上,文中进一步分析了ARN和TSN分别利用更完整的行为信息时识别准确率的变化情况,结果表明ARN的单个类别识别准确率高于TSN 10个百分点以上.由此可见,ARN通过关联行为变化,对完整行为信息进行了更充分的利用,从而有效地提高了变化行为的识别准确率.
其他文献
过去在传媒领域中,我们习惯以传统媒体和新媒体来区分各媒体形式。而在如今的泛媒体环境下,媒体形式瞬息万变,市场似乎不是一步步发展起来,而是一步步跳过来的。新媒体的花样
纹理是图像的基本特征,也是图像解析的一个极其重要的信息来源。纹理分析技术在计算机视觉,模式识别,图像处理领域都有重要的应用。本文在阐述纹理分析的概念和描述方法的基
磐安是一个九山半水半分田的偏远山区县,虽然通过前两轮广播电视“村村通”工程的实施,全县363个行政村、823个自然村中已实现有线电视联网的行政村有227个、自然村381个,联
混杂系统是连续变量动态系统和离散事件动态系统相结合,并且二者相互影响相互作用的一类系统。混杂系统形式验证是混杂系统的一个研究方向,它是分析在给定的初始条件下,系统的可
现有汽车电泳涂装输送系统,例如悬挂链式输送系统和摆杆式输送系统存在无法根除车顶气包的问题,而多功能穿梭机和全旋反向浸渍输送系统,虽然解决了车顶气包问题,但由于采用悬
教育教学质量状况是各学校的灵魂与生命线,因此提升教育教学质量应当是院校一切工作的出发点与归宿。笔者结合自身多年实践工作经验,并通过本文,针对开放教育教学质量保障体系及其相关问题进行集中阐述。 一重视开放教育的教学管理规范化 1开放教育的教学法规的建立和完善 国家在教学的相关纲要中进一步提出,应推动依法治教,健全教育教学法制法规,推进依法行政发展进程,并扩大力度推动依法治校发展,进一步完善监督
目的:研究脑梗死后针灸的早期介入对偏瘫肢体痉挛的影响.方法:48例病人按入院的顺序分成治疗组(针灸+康复)23例和对照组(康复)25例,采用改良Ashworth痉挛评定量表评定病人的
高校的根本价值追求是培养学生,这就是育人为本。图书馆作为高校培养人才的重要阵地,就应与时俱进,充分发挥自己的功用和效能,从读书育人、活动育人等多方面发挥作用。可目前许多高校在对读者的服务管理上仍停留于昔日强调的图书借阅量这静态的“书本位”模式,而不重视开展知识信息交流这动态的“人本位”模式,表现在对读者服务项目的布局上及与院系和学生社团开展的知识信息交流等各种活动未予重视,欠缺支持和扶持,致使高校
目的:探讨椎板减压椎体内固定后路植骨融合治疗退行性腰椎管狭窄症合并腰椎不稳的疗效.方法:共48例患者,男30例,女18例;年龄45岁~75岁,平均63岁;病变部位:L3-4间隙8例,L4-5间
目的:探讨四肢主要血管损伤显微修复的临床疗效.方法:自1999年~2005年对72例四肢主要血管损伤患者采用显微外科技术修复.结果:本组痊愈64例(88.9%),4例肢体坏死行截肢(5.5%),2