【摘 要】
:
随着人工智能技术的发展,计算机视觉领域因其广阔的应用前景受到了越来越多的关注。其中,人体行为识别研究是计算机视觉领域中的热点,其通过计算机代替人眼来识别视频中的人体行为类别,被广泛应用于视频分析与理解、人机交互、智能监控等多种场景,具有重要的研究价值。人体行为识别研究主要采用2D摄像头采集的RGB视频和3D摄像头捕获的骨骼序列两种数据。视频和骨骼序列中都蕴含了丰富的人体时空特征,如何构建能充分、准
论文部分内容阅读
随着人工智能技术的发展,计算机视觉领域因其广阔的应用前景受到了越来越多的关注。其中,人体行为识别研究是计算机视觉领域中的热点,其通过计算机代替人眼来识别视频中的人体行为类别,被广泛应用于视频分析与理解、人机交互、智能监控等多种场景,具有重要的研究价值。人体行为识别研究主要采用2D摄像头采集的RGB视频和3D摄像头捕获的骨骼序列两种数据。视频和骨骼序列中都蕴含了丰富的人体时空特征,如何构建能充分、准确地提取时空特征的算法模型是提升人体行为识别准确率的关键。论文具体研究内容如下:针对RGB视频中复杂背景和移动摄像头导致的空间特征提取不准确的问题,论文提出一种基于姿态掩模时空网络(Pose Mask Spatio-Temporal Network,PM-STN)的算法模型。在空 间特征提取上,通过将姿态掩模聚焦人体的关键空间特征,进而提升网络的特征提取准确度。在时域特征提取上,论文研究了不同时域网络结构在姿态掩模作用场景下的效果,设计了卷积神经网络与长短时记忆网络结合的网络模型,充分发挥PM-STN的时空特征提取能力。在多个公开数据集上进行实验的结果表明,PM-STN取得了具有竞争力的识别准确率。针对现有的3D骨骼时空特征提取方法局限于局部特征提取,导致其缺乏高层特征表示能力的问题,论文提出一种基于时域感知图卷积网络的算法模型。在空间特征提取上,通过一种改进的全局人体拓扑关系表示,增强网络对于高层空间特征的提取能力。在时域特征提取上,通过增加了一种全局记忆单元选择性地从骨骼序列中提取关键时域特征,进而扩大网络的时域感受野,进一步弥补高层特征提取不足的缺陷。在公开数据集上的实验表明,时域感知图卷积网络与前沿方法对比取得了更高的识别准确率。
其他文献
艾滋病(获得性免疫缺陷综合征,简称:AIDS),由人体免疫缺陷病毒HIV病毒入侵人体,破坏人体免疫系统,最终导致死亡的恶性传染病,极大的威胁着世界人民的身体健康。对于HIV感染高危人群,应积极检测;对于已经确认感染人群,应早诊早治,有效阻断疾病进展。在HIV感染早期(1周),病毒感染巨噬细胞通过血脑屏障进入神经中枢,引起神经细胞慢性长期损伤,即便进行抗逆转录病毒治疗,仍有至少50%HIV感染者发生
随着青藏铁路、哈齐高铁、川藏铁路等一大批重大冻土工程的实施,以及对寒区环境生态的深入研究,促使了大批冻土监测项目的上马。由于冻土地温是一个非常缓慢的变化过程,需要对其进行长期的监测,同时对于冻土的相关监测,需要在同地质、同气象等条件下,才能对其监测的数据进行有效分析,因此以往独立建设、互不相关的“孤岛”方式已不能适应现时及长远的监测需求。中科院冻土工程国家重点实验室与西安工业大学共同建设的“中国冻
随着计算机技术和电力电子技术的发展,交流伺服控制技术在日常生产生活和工业生产制造中的应用越来越广泛。然而在实际应用的过程中,伺服控制系统中总是存在各种不确定干扰,
自1999年Zwilling等人报道了用简单的电化学阳极氧化法制备TiO_2纳米管以来,TiO_2的纳米管结构逐渐引起了各领域科研人员的极大关注。与TiO_2薄膜相比,其纳米管结构具有良好的陷光效应、一维导电通道、大的比表面积以及独特的光、电性能,因而在很多领域诸如传感器、太阳能电池、光催化、生物医学以及微型电子集成器件等方面具有广泛的应用价值。首先,基于TiO_2纳米管生长的基底材料以及形貌结构
目前我国面临着严重的雾霾污染问题,并且有逐渐从区域性大气污染演变为全国性大气污染的态势,给我们的生产生活带来了极大威胁,面对跨行政区域的复合型大气污染,传统的以单一行政区划为界,各自为政的属地管辖治理模式达不到真正的治理目的,严重影响了区域污染的整体治理的效果。在此背景下,迫切根据我国雾霾污染的具体情况,探求一条符合我国雾霾治理实际的有效路径。由于雾霾污染具有流动性,其产生和影响都不只是特定的地区
说话人聚类用于解决“谁,何时,说话”问题,是语音信号处理领域中的重要技术。说话人聚类算法主要应用在会议语音记录分类、语音识别预处理、声音类别检测、说话人识别等诸多研究方向,因此具有重要的研究意义。此前,说话人聚类算法主要集中在单个说话人场景下的会议记录,通话记录等简单的语音场景,已取得了良好的性能表现。然而在复杂的“鸡尾酒会”场景下,多说话人同时说话情况下(overlap)的说话人聚类问题,到目前
随着通信技术和互联网的快速发展,网络视频业务已经成为主要的互联网应用之一。为了保障高质量可靠的流媒体传输,自适应的流媒体传输技术应运而生。码率自适应算法是自适应流媒体传输的技术核心,通过动态地切换视频码率,有效提高了用户的体验质量(Quality of Experience,QoE)。自适应的流媒体传输技术已经广泛应用到各个视频点播平台中。然而在实时直播流中,直播平台经常伴随着用户的沟通交流和弹幕
本研究以大豆和黑豆为原材料。对于大豆,首先将大豆培养成愈伤悬浮培养物,同时制备大豆子叶组织,用褐藻酸寡糖(AOS)诱导愈伤悬浮培养物和子叶组织,UPLC-MS/MS确认愈伤悬浮物
镁合金是具有质轻、环保突出特点的绿色金属结构材料,其高比强、高比模的轻质高强板材的应用已逐渐成为国内外材料界关注的亮点,也日益成为产业竞争的焦点。随着单点渐进成形技术在板材塑性成形领域的推广,逐渐应用于镁合金成形。然而,目前的研究基本限于宏观上的模拟分析与实验,研究镁合金材料的塑形成性工艺过程。为了真正使成形过程不但能“成形”,也能实现“成性”,以便使成形零件同时满足尺寸精度与性能两方面的要求,从
公证,是公证机构行使国家证明权的活动。公证程序具有非讼程序的属性,以行使国家证明权为形式,对民事法律行为和具有法律意义的事实、文书加以明确,预防将来可能发生的纠纷,并实现对社会秩序的监督和管理。公证书,是公证活动的载体,其以书面形式表现了公证活动的发生过程与最终结果,并在不同的法律领域发生不同的效力。在民事诉讼法领域,公证书为书证,所证明的事实发生推定真实的法律效果,符合特定条件的公证书,还可以作