【摘 要】
:
随着硬件计算能力提升与众多深度学习方法的普及,行为识别算法逐渐应用于现实中。基于骨骼的行为识别算法是行为识别领域下的一个热门研究领域,吸引了不少研究人员的目光。众所周知,相对于深度学习方法,传统方法可以在较少样本情况下较快地进行训练与预测,但是准确率有所不足;而深度学习方法可以得到较高的准确率,但是需要较多样本用以训练并且计算量较大。这启发我们将传统方法与深度学习方法进行结合,使传统方法与深度学习
论文部分内容阅读
随着硬件计算能力提升与众多深度学习方法的普及,行为识别算法逐渐应用于现实中。基于骨骼的行为识别算法是行为识别领域下的一个热门研究领域,吸引了不少研究人员的目光。众所周知,相对于深度学习方法,传统方法可以在较少样本情况下较快地进行训练与预测,但是准确率有所不足;而深度学习方法可以得到较高的准确率,但是需要较多样本用以训练并且计算量较大。这启发我们将传统方法与深度学习方法进行结合,使传统方法与深度学习方法的优势互补。因此,本文先后提出一种基于动态模式分解的传统方法与基于图卷积网络和Transformer的深度学习方法,并在少量样本情况下使用传统方法辅助深度学习方法训练。本文主要工作如下:(一)在传统方法方面,提出了一种基于动态模式分解的行为识别方法。该算法采用动态模式分解从结构化的骨骼序列中提取动作特征,并将提取出的动作特征使用单类支持向量机分类器对正负样本进行二分类。相比于深度学习方法,该方法在速度上有巨大优势,并且在较少样本下进行二分类也能达到90.8%的准确率。(二)在深度学习方法方面,提出了一种基于图卷积网络与Transformer相结合的算法。首先参考Transformer编码器的结构,提出了基于Transformer的行为识别算法,并引入Class-token结构。为了充分利用人体骨骼信息并进一步提高准确率,引入了图卷积网络(Graph Convolutional Network,GCN),利用图卷积网络替代Transformer编码器中的Embedding层,提出了GCN-Transformer算法。随后对算法进行优化,将图卷积网络与Transformer编码器结构构建成一个块;针对于少量样本情况,利用动态模式分解算法来辅助本文的深度学习方法。实验结果显示,基于GCN-Transformer算法在NTU-RGB+D数据集上达到了85.4%的准确率。结合动态模式分解算法辅助训练后,在小数据集上有1%左右的准确率提升。(三)将本文算法应用于实际场景中。在大型数据集上对本文算法模型进行预训练,并在电梯场景数据集中进行微调。然后,对电梯视频异常行为识别安防系统进行设计,将训练好的算法应用于电梯异常行为识别监控系统中。在该系统中,使用Tkinter包进行界面设计,使用ONVIF协议对摄像机参数进行控制,并使用RTSP协议获取视频流,使用Open CV库对视频流进行处理与展示。实验结果显示,本文算法应用于电梯场景数据集上,可以达到92.7%的准确率。系统设计中,本文算法模块的耗时为155毫秒,可以满足实时性。
其他文献
科学技术的进步,使得人们对美好生活的向往有了更深层次的追求,人们已不满足于只能完成单一既定任务的设备,而是更青睐于具有一定思维能力的智能机器人。SLAM是人工智能技术的重要基础,其赋予了机器人自我感知世界的能力,通过搭载特定的传感器,在未知的环境中实现对环境模型的构建,同时估计自己的运动。目前,SLAM技术已被广泛应用于智能机器人、无人机、自动驾驶以及AR/VR等领域。伴随着计算机视觉技术的飞速发
颅内压高症是许多疾病的共有症群,采用植入式设备对患者的颅内压进行连续性监测,并在监测到颅内压异常时自主释放降压药物以维持患者颅内压动态平衡,这对颅内压高症的治疗具有重要意义。本文围绕植入式颅内压监测给药系统进行研究,设计并实现了具有颅内压监测、颅内压异常诊断和药物释放的功能植入式系统。(1)针对传统颅内压监测设备不灵活,患者依从性低的问题,设计了一种软植入的颅内压实时监测设备,在允许患者小范围活动
纳米孔已经成为一类特殊的单分子分析工具,为检测和表征核酸和蛋白质等生物分子提供了巨大的潜力。作为生物纳米孔的替代品,固态纳米孔由于其在孔隙几何和孔径尺寸上的大范围可调性以及其优异的机械特性和电学特性而呈现出显著的多功能性。本文采用离子电流监测机制辅助的各项异性湿法刻蚀法进行锥形硅基固态纳米孔的制备,在满足低成本、批量化、可控性制备需求的同时,将制备工艺节点推进至亚5nm。围绕上述主题,本文主要研究
随着互联网信息科技的发展,人们在日常生活需要处理各式各样的信息,信息过载成为人们快速获取需要的信息内容的一个重大难题。推荐系统的出现无论是对于业务需要的高效工作,还是日常生活的品质体验,都帮助人们大大减轻了筛选信息的工作,带来巨大的帮助和收益。推荐系统的实现方法是根据学习用户或项目本身的属性信息,以及用户与项目的历史交互信息来挖掘用户可能感兴趣的项目。但传统的推荐算法只关注于用户和项目的直接交互数
社交媒体中存在着大量的用户情感信息,企业决策者们不仅希望了解用户情感,还希望了解相应的原因,以帮助他们从用户层面思考和优化产品。在这样的需求下,情感原因检测成为自然语言处理中具有重要价值和应用前景的任务之一,并逐渐发展为情感原因对提取任务(ECPE)。传统的二阶段ECPE模型存在着模型错误传递无法修正的问题,尽管后来的端到端模型解决了这一问题,但仍存在着文档事件特征利用不充分、混淆因子夹杂的问题。
命名实体识别作为自然语言处理领域中的基本任务,可以从非结构化的文本数据中提取实体信息,在问答系统、信息抽取、阅读理解等其他自然语言处理领域任务起重要支撑作用。在文本数据爆炸式增加、GPU计算能力快速提升的背景下,深度学习被应用于解决命名实体识别问题并取得了良好的效果,成为解决该领域问题的主流方案。虽然命名实体识别技术取得了迅猛发展,但许多命名实体识别研究都是在英文领域,中文领域的命名实体识别依然存
组合设备是一种高度自动化集成制造系统,能够对单枚晶圆进行高效且精确的加工。因此,它被广泛应用于半导体芯片制造。组合设备由一对真空锁、一个传输模块以及若干个加工模块组合在一真空环境中。随着半导体芯片制程日益复杂,由若干台组合设备通过缓冲模块耦合而成的多组合设备逐渐被晶圆厂采用。由于组合设备的价格不菲,因此寻找有效的调度与控制方法提高其利用率和回报率,是非常有必要的。近几年来,芯片产品种类多样化,晶圆
随着信息技术推动全球由传统工业进入信息社会,农业也迈入数字化、智能化的新时代。研究基于三维点云技术的植物形状表达与表型分析,对促进农业的高产量、高质量生产具有至关重要的意义。然而,对植物幼苗进行三维重建,常存在户外环境光线不稳定、叶片间的遮挡、摄像头视野限制、扫描精度过低等因素导致植物幼苗点云出现噪声、稀疏、缺失的情况,影响了植物表型分析的准确度。因此,研究植株点云数据的修补算法,能辅助植物三维形
随着互联网的发展,信息量指数增长,如何从大量信息中获取所需要的信息是一个重要问题,因此,信息抽取的相关技术研究愈发重要。事件检测是自然语言处理中事件抽取任务的子任务,是信息抽取中的一个重要方向。给定一段文本,事件检测旨在从中检测出潜在的事件类型。目前的事件检测主流是对文本中的触发词进行识别,并判断该触发词属于哪个事件类型。这种基于触发词的事件检测方式会加大数据标注的工作开销,此外,在事件检测任务中
故障诊断是设备维护中的关键部分,轴承作为现代机械设备中的基础元件更是维护过程中的关键部分。由于滚动轴承受各种复杂因素的影响,使之成为整个旋转机械系统中可靠性最差的零部件之一。传统的轴承故障诊断方法以人工设计降噪、滤波、特征提取为主,手动提取特征的过程相对繁琐,且需要一定的背景知识,在面对海量数据集时越来越力不能及。此外,轴承工作周期跨度大,工况复杂多变,这也使得手动提取特征愈发困难。随着深度学习的