基于深度学习的人物行为分析关键技术研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:lkjh321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人物行为分析技术是人工智能中计算机视觉领域的重要研究方向。深度学习因其具有学习能力的特点被广泛应用于人物行为分析中。然而目前人物行为分析技术中仍存在人物之间交互特征利用不充分及复杂背景下人物行为对象不明确或缺失问题有待解决。针对这些难点,本文对基于深度学习的人物行为分析关键技术进行研究,具体内容如下:(1)针对人物之间交互特征信息利用不充分的问题,本文提出了基于交互特征生成算法的双流网络。该双流网络分别提取了人物特征信息和人物之间交互特征信息。在提取人物特征信息时,考虑到ResNeXt网络具有强大的特征表达能力,利用该网络对图像中人物特征进行提取;在提取人物之间交互特征信息时,利用图卷积神经网络的特征推理能力提出交互特征生成算法。将人和物体的特征作为节点、人物之间的交互行为关系作为边构建图模型。根据交互特征生成算法将输入的图模型通过遍历节点的方式进行交互关系更新,并在更新过程中产生新的交互特征。最后将人物特征信息和人物交互特征信息进行特征融合并送入分类网络进行行为分析,实现对图像中人物特征信息和人物之间交互特征信息的充分利用。(2)针对复杂背景下人物行为对象不明确或缺失问题,本文在已构建的双流网络上进行研究,对人物特征提取网络进行改进,提出基于交互特征生成和关键人物增强的人物行为分析方法。针对复杂背景下人物行为对象缺失问题,提出优化区域快速生成卷积神经网络(Optimized Faster Region Convolutional Neural Network,OFR-CNN)网络,解决了小目标及被遮挡目标的难检测问题。该网络利用多尺度特征优化算法对Faster R-CNN网络进行优化。对ResNeXt特征提取网络中的浅层特征进行最大值池化,深层特征进行反卷积,将特征层进行融合得到最终图像特征。针对复杂背景下人物行为对象不明确问题,本文提出关键人物增强算法,解决了分析过程中目标人物对的模糊问题。利用关键人物增强算法对已获取的人物特征目标框进行空间位置注意力增强,遍历图像目标找到目标人物对形成权值矩阵,对已获得的图像特征权值分配,得到最终识别所需要的特征信息。将改进网络得到的人物特征与交互生成网络得到的人物之间交互特征进行特征融合得到最终特征信息,将其送入分类网络得到人物行为分析结果。本文在HICO-DET数据集和V-COCO数据集上对提出的基于交互特征生成和关键人物增强的人物行为分析方法进行实验验证。结果表明,对比现有的人物行为分析技术,本文方法在两个数据库上的人物行为分析准确率都有了明显的提升。
其他文献
中央苏区体育精神诞生于艰苦革命斗争时期,并在军民的广泛实践中,逐渐形成了如今多样的精神形态。中国共产党领导的苏区体育工作提高了革命区军民的身体素质和精神韧性,对于当代思想政治教育改革具有独特的价值。本文以中央苏区体育精神及其当代思想政治教育价值为研究对象,深入解析中央苏区体育精神的形成背景、主要内涵,精神特质,探究其在新时代的思想政治教育价值与实践进路。中央苏区体育精神是在特殊革命时期发展壮大,历
学位
车联网指的是车辆通过车载网络单元与互联网中其他实体进行信息交互的过程。这种交互可以帮助驾驶员获取实时的交通信息,提高出行效率。V2P(Vehicle to Parking)作为车联网中的一种应用场景,为需要泊车服务的用户提供了合适的车位信息,解决了停车难的问题。然而在使用V2P服务的过程中,车辆与其他实体之间的通信大多在开放性的无线信道中进行,发出的消息在传输过程中容易遭受窃听、篡改等攻击,进而暴
学位
定模动辊变截面辊弯成型装备是对板材进行变截面渐进成型加工的复杂机电设备。加工出的成品具有种类多且载荷性能优良的特点,因而有着广泛应用前景。因此,对五道次定模动辊变截面辊弯成型机的加速度展开优化分析,减小加速度峰值,提高设备运行的稳定性,对提高产品质量具有重要意义。本文利用强化学习智能优化方法,对定模动辊成型机进行优化。首先基于能量守恒原理,通过计算定模动辊机电系统中势能、动能、电场能、磁能、机械损
学位
抑郁症是一种危害极大的心身疾病,其发病机制和病机演变过程十分复杂,本文在王永炎院士提出的“虚气流滞”病机理论的指导下,深入剖析了抑郁症“虚气流滞”的病机特点,详细阐述了抑郁症以虚气为本、流滞为标,虚气与流滞相互裹挟、恶性循环的病机特点和演变规律,同时基于诸多研究提出抑郁症“炎症-线粒体损伤”恶性循环假说,并指出线粒体是打破恶性循环的关键治疗靶点,保护线粒体是抑郁症“补虚培元”治则的潜在生物学实质,
期刊
随着智能监控技术的发展和应用,人体行为检测技术已成为视频监控领域研究的热点问题。采用行为检测技术可以对监控区域中目标的行为进行准确检测,提高人工筛查的工作效率,及时帮助相关人员应对突发情况,减少事故带来的损失。然而由于场景背景复杂、人体之间遮挡严重、行为之间相似度较大、行为类别千姿百态等问题的存在,使行为检测任务变得艰难。针对以上问题,本文通过提取视频序列的时空特征(时间特征和空间特征)对人体发出
学位
随着深度学习技术的不断发展,人类社会逐步进入了一个人工智能的时代。人机交互技术作为人工智能中的一个分支,近年来也取得了巨大的进步。唇语识别技术作为人机交互的一种,也越来越受到关注。然而,有关唇语识别的研究中,大部分都集中在英文语料上,有关中文唇语识别方面的研究鲜有问津。这主要是由于中文的影响力不及英文,中文唇语识别技术的发展起步又较晚,缺少有影响力的中文唇语数据集,且对于中文词语识别的准确率并不理
学位
抑郁症的发病率与日剧增,其病因、病机、病理已成为中西医研究的热点话题。“虚气流滞”创新中医病机理论,认为元气虚衰、气血津液等流动性物质发生郁滞是抑郁症的重要发病机制,该病机强调以气虚为本,以气郁为要,以流滞为标的病理特点。本文结合临床实践经验及现代科学研究成果,以该病机假说为理论框架,提出抑郁症的生物学实质假说体系:抑郁症以突触微环境稳态失衡为核心,“气郁为要”与神经-内分泌-免疫网络失衡有关,“
期刊
同时定位与建图(Simultaneous Localization and Mapping,SLAM)技术主流3D激光传感器为机械3D激光雷达,但因其内置旋转部件所以寿命比较短,同时采用水平线性扫描模式,在识别周围环境时会出现盲区。而固态3D激光雷达内无旋转部件所以寿命比较长,同时采用无重复路径的扫描模式,可以减少盲区,因此利用固态3D激光雷达进行SLAM逐渐成为一种趋势,但是固态3D激光雷达的扫
学位
随着智能交通系统和自动驾驶技术的发展,广义标签多伯努利滤波器(Generalized Labeled Multi-Bernoulli Filter,GLMB)等多目标跟踪算法已成为上述两个领域的关键技术之一。在实际交通场景中,毫米波雷达多目标跟踪技术面临场景疏密程度变化、目标个数时变与目标间遮挡等诸多挑战。本文主要针对的是在毫米波雷达交通监测场景时变过程中,GLMB滤波器参数无法与场景匹配,难以保
学位
舌面裂纹是中医舌诊领域进行疾病诊断的一个可靠依据。面向移动端应用背景,使用手机采集图片存在较大质量差异,传统分割方法处理难以取得较好的结果。本文采用深度学习、迁移学习的方法进行准确地裂纹分割,并根据病症进行分类,对实现智慧医疗、中医数字化具有研究意义。论文主要工作和创新性如下:(1)提出一种基于迁移学习和改进U-Net网络结构的舌面裂纹分割方法。首先,采用水平翻转、随机裁剪、归一化等数据扩充手段缓
学位