【摘 要】
:
近年来,第一人称行为识别因其在医疗保健、智能家居、安全监控等领域的广泛应用而受到模式识别和人工智能领域的广泛关注。在传统的第一人称行为识别算法中,主要通过传统图片
论文部分内容阅读
近年来,第一人称行为识别因其在医疗保健、智能家居、安全监控等领域的广泛应用而受到模式识别和人工智能领域的广泛关注。在传统的第一人称行为识别算法中,主要通过传统图片处理和计算机视觉技术来对不同行为进行分类,因此会存在一些缺陷,如识别准确率低、计算量大、算法复杂等问题。最近一段时间以来随着深度学习技术的不断发展,其在计算机视觉的各个应用领取都取得了全面的突破,故将深度学习技术引入第一人称行为识别将带来更大的优势。在本文研究中,我们首先针对图片流数据利用图片深层特征对第一人称行为进行分类,通过在不同数据集上的实验对比结果,选择较好的算法模型。然后针对e Button数据集和多模态数据集提出并实现了多流直接融合框架和多流层次融合框架。在两个融合框架中,采用不同的网络模型分别对运动传感器数据和图片流数据进行建模,最后通过不同的融合策略实现第一人称行为识别。在多流直接融合框架中,采用长短期记忆网络(LSTM)和卷积神经网络+长短期记忆网络(CNN-LSTM)分别对传感器数据和图片流数据进行建模,然后按照平均值池化和最大值池化两种不同的策略直接融合传感器数据和图片流的分类结果。在多流层次融合框架中,首先采用长短期记忆网络(LSTM)对传感器数据进行建模,然后对于低帧率和高帧率的图片流数据分别使用卷积神经网络(CNN)和卷积神经网络+长短期记忆网络(CNN-LSTM)进行建模。其中传感器数据仅用于根据运动状态进行运动状态分组,而图片流数据则用于在运动状态分组中进行进一步的特定行为识别。因此,无论是运动传感器数据还是图片流数据都是以其最合适的分类方式进行划分,以显著降低因传感器差异带来的对融合结果的负面影响。实验结果表明,本文提出的多流直接融合框架在识别精度上相对于现有的直接融合框架没有突出性的优势,而多流层次融合框架比现有的直接融合框架精度提升了6%。而且本文所提出的两个融合框架都避免了现有方法中计算光流的耗时,从而更适合实际应用。
其他文献
科技园建设程序中的前期研究工作至关重要,它直接影响后续各个阶段工作。由于科技园建设周期长,现实条件下,往往存在在前期条件不充分的前提下,有关方面如政府管理部门、甲方
国内寿险市场经过30多年的发展,显示出越来越强的“马太效应”,银保监会发布的2018年寿险公司经营数据显示,85家寿险公司中亏损超过32家,占比超过37.6%,行业前十名的寿险公司
在国家节能减排的号召下,火电机组辅件的改造工程日益增多,例如本文研究的空气预热器热力性能改造工程。这些辅件的改造大都被安排在机组大修期间,为不影响机组正常开机,工期
目的利用磁共振扫描仪(MRI)对正常青年人单侧膝关节行运动前后T1 mapping、T2mapping、T2*mapping成像,探讨三种磁共振生理成像技术定量测量在反映运动前后的膝关节软骨变化
随着新能源汽车及便携式电子设备等对锂离子电池高容量、高续航能力的需求,锂离子电池的发展达到了一个瓶颈。与传统的商业化石墨负极相比,硅材料具有超高的体积和质量比容量,因此成为最具应用前景的锂离子电池负极材料。硅碳复合材料便是研究热点之一。硅的理论容量极高,但在充放电过程中体积变化非常剧烈,从而导致电池的电化学性能大幅降低。碳材料具有较高的电导率,结构相对稳固,在循环过程中体积膨胀很小(10%以下)。
海洋油气管道是石油和天然气的安全开采、生产和运输过程中的重要结构。随着油气开发逐渐走向深海,油气管道的服役环境变得更加严苛,且海洋油气管道一旦发生破坏,后果通常非
微结构光纤(Microstructured optical fibers,MOF)具有独特的包层结构,能够通过材料集成实现光与物质的相互作用。然而传统材料集成技术的弊端在于无法在光信号实时监测过程
目的:探讨血压级别不同的新疆哈萨克族原发性高血压患者T淋巴细胞表面钾离子通道表达的差异。方法:从2018年1月到2018年12月,在新疆医科大学第一附属医院、乌鲁木齐市友谊医院和乌鲁木齐市达坂城区柴窝堡社区卫生服务中心初诊且未经治疗的哈萨克族高血压患者90人;高血压1级组30例,年龄(49.23±9.07),高血压2级组30例,年龄(53.20±8.26),高血压3级组30例,年龄(53.13±9
近年来,以“互联网+”主导的共享经济浪潮席卷了中国的各行各业,给经济和社会发展注入了新的活力。托盘作为物流装卸、搬运和运输中一种重要的集装单元化器具,高效合理利用托
光伏电池模型参数的快速准确辨识在光伏阵列的输出功率预测、最大功率点跟踪以及电池故障模型的特性研究方面具有非常重要的工程意义。传统的数值分析算法在系统参数辨识时的