【摘 要】
:
动作预测任务是计算机视觉领域的一个非常具有挑战性的课题,在智能视频监控、自动驾驶、人机交互等领域具有广阔的应用前景。与动作识别方法在动作执行完毕以后再进行分类不同,动作预测以仅包含动作开始部分的不完整视频为输入,希望能够在动作早期准确推测出动作的类别。随着动作的进行,视频会呈现出不同的运动特点,因此,动作预测的一个难点在于如何获取待预测视频的动作进展状态信息。为此,本文提出了一种基于多任务深度森林
论文部分内容阅读
动作预测任务是计算机视觉领域的一个非常具有挑战性的课题,在智能视频监控、自动驾驶、人机交互等领域具有广阔的应用前景。与动作识别方法在动作执行完毕以后再进行分类不同,动作预测以仅包含动作开始部分的不完整视频为输入,希望能够在动作早期准确推测出动作的类别。随着动作的进行,视频会呈现出不同的运动特点,因此,动作预测的一个难点在于如何获取待预测视频的动作进展状态信息。为此,本文提出了一种基于多任务深度森林的动作预测方法,采用统一的框架处理动作类别预测和动作进展分析这两个相关任务。多任务深度森林是由多任务随机森林和传统随机森林组成的深度级联结构。与传统随机森林不同,多任务随机森林以同时标注了动作类别和动作进展状态的不完整视频为训练样本,构建动作进展状态分析和动作预测模型。同时采用随机森林和多任务随机森林可以增加分类器的多样性,提高多任务深度森林的识别能力。本文进一步提出了融合回归与分类的多任务深度森林,采用回归模型分析动作进展,采用分类模型识别动作类别。人的运动本质上是一个连续的过程,将动作进展分析建模为回归问题能够更好地表达动作的时序变化。此外,在深度森林的每一层级联结构中,将动作进展分析结果与类别识别结果相融合,构建了一种新的中层特征表示。为了验证本文方法的有效性,在UT-Interaction数据集和BIT-Interaction数据集上进行了大量实验,并对实验结果进行了深入分析和探讨。
其他文献
倒置(P-I-N)钙钛矿太阳能电池(PSCs)由于工艺简单、可低温(<100℃)制备以及兼容柔性沉底等优点具有巨大的应用潜力。P-I-N型平面PSCs中,空穴传输层(HTL)对器件性能至关重要,常用的空穴传输层材料有聚苯乙烯磺酸盐(PEDOT:PSS)、三苯胺聚合物(PTAA)、Ni O等,由先前的报道:PTAA是一种具有相对较低载流子迁移率的无定形聚合物;基于PEDOT:PSS制备的PSC
鄂尔多斯盆地中部奥陶系中组合盐下白云岩储层在近几年勘探成果良好,具有很好的勘探前景,但目前对中组合盐下白云岩储层特征、孔隙成因及形成主控因素等的认识还比较薄弱。为
结直肠癌(Colorectal cancer,CRC),也叫大肠癌,是临床上常见的消化道恶性肿瘤,其发生通常与饮食改变和环境因素有关,发病率和死亡率均偏高。据2018年全球185个国家癌症数据统计,结直肠癌发病率和病死率皆居全球前三位。临床上结直肠癌治疗方式仍以手术治疗、放疗、化疗为主。其中常见的化疗药物氟尿嘧啶、伊立替康、奥利沙铂等具有可预测肝毒性。因此开发一种高效低毒的结直肠癌治疗药物迫在眉睫
过去四十五年,三角范畴在理论及应用上的重要性得到重新认识.自1965年,相对同调代数,特别是Gorenstein同调代数,已发展到一个先进的水平.本文是一篇研究ladder下的紧生成的t-
随着电子科技的高速发展,人们对电子材料的要求也变得越来越高。对于高介电的材料来说,更希望它们能够在保持较高介电常数的同时能够有较低的介电损耗,且要求制备的工艺更加
复杂网络链路预测的目的就是要找出网络中缺失或者潜在的联系,在推荐系统、犯罪预测、群体行为发现以及网络安全领域有着广泛的应用。用于解决这类问题的方法主要分为两类,一
多省并醌类(PAQR)聚合物是一类本征半导电的高分子材料,它是由芳环或者杂芳环与酸酐在路易斯酸的催化下缩聚而成的一种不溶不熔的黑色固体粉末。它既具有半导体的性质又具有
近年来,CdZnTe薄膜探测器由于制备简单、厚度小、成本低、质量轻,还可以制备成大尺寸、多层和多功能叠层结构,愈来愈引起人们的广泛关注。本文提出CdZnTe场效应晶体管薄膜探
水合物法分离混合气作为一种新兴气体分离技术,与传统分离技术相比具有鲜明的优势性和广阔的应用前景。本文旨在利用该技术实现催化裂化干气的分离,对其中高附加值的乙烯组分
本文从两个方面研究了随机切换脉冲系统的稳定性,第一部分研究了带有随机稳定和随机不稳定子系统的随机切换脉冲微分方程的指数稳定性,第二部分研究了非线性随机切换脉冲系统