【摘 要】
:
三维人体姿态是描述人体输入指令的重要信息点,机器能够很好地阅读人体姿态的含义,对于人机交互有着非常重要的意义。目前三维人体姿态识别存在着生成动作序列抖动、识别速度过慢以及环境遮挡时检测不准确等问题。本文针对上述问题展开研究并提出改进策略,最后根据改进内容制作了实时三维人体姿态识别系统。本文着眼于三维人体姿态识别技术,结合现有技术,分析其中存在的不足,提出了将TCN网络与Open Pose结合的二维
论文部分内容阅读
三维人体姿态是描述人体输入指令的重要信息点,机器能够很好地阅读人体姿态的含义,对于人机交互有着非常重要的意义。目前三维人体姿态识别存在着生成动作序列抖动、识别速度过慢以及环境遮挡时检测不准确等问题。本文针对上述问题展开研究并提出改进策略,最后根据改进内容制作了实时三维人体姿态识别系统。本文着眼于三维人体姿态识别技术,结合现有技术,分析其中存在的不足,提出了将TCN网络与Open Pose结合的二维姿态检测器,并使用角向量计算重建三维人体坐标,最后通过模型压缩技术提高检测速度,最后在具体应用问题上进行了实验验证以及搭建三维姿态识别系统。实验结果与系统演示表明,本文提出的三维人体姿态识别方法在虚拟创作及艺术展演等方面有实际应用价值。主要研究内容如下:提出一种结合Open Pose、TCN网络与角向量计算的三维人体姿态识别方法。使用Open Pose完成初始二维人体姿态识别,使用TCN网络对二维人体进行进一步处理,以消除时序抖动并生成平滑的动作序列。最后,利用角向量计算方法将二维人体姿态重建为三维。通过实验证明,这种两阶段的三维人体姿态识别的方法可以在遮挡、模糊等场景下正确识别出三维人体坐标点,并且在Human Eva、Human 3.6M数据集中表现良好。提出一种基于通道冗余的人体姿态模型压缩方法,可有效提升人体姿态识别模型的检测速度。通过分析通道冗余的对压缩模型参数的可行性,设计了算法用于检测模型中的冗余通道,加快模型推理速度。通过大量实验证明,该方法在压缩模型体积的同时提高了关节点热图的清晰度。本文构建了由数据采集、人体检测、姿态识别、模型输出四个模块构成的三维人体姿态识别系统,并整合了本文提出的算法。然后在相对应的硬件环境下完成了该系统的搭建,并通过实验展示了三维人体姿态识别及输出模型等功能。
其他文献
中国戏曲历史悠久,剧种种类繁多,是中华民族传统文化的重要组成部分,也是中华文明不可再生的重要精神与非物质财富。比较流行著名的剧种有:京剧、豫剧、秦腔等。秦腔作为其中一种,起源于陕西、甘肃一带的古代民间歌舞,由于受到地域等因素的限制,并且随着时间的推移,更多的人特别是青年一代不再对秦腔这种传统民俗演出感兴趣。为了传承和保护秦腔这类戏曲文化,可通过将现代技术与秦腔表演艺术融合,如虚拟现实技术等,来实现
随着互联网技术的飞速发展,信息过载问题愈发严重,为减少用户寻找感兴趣事物所花费的时间成本,同时增加互联网平台收益,推荐系统应运而生。序列推荐作为推荐系统的一个重要子领域,通过对用户的历史行为序列建模来挖掘用户兴趣。目前序列推荐算法的研究已取得了一定的进展,但仍面临着一些挑战。如单向建模用户-项目交互,限制了模型的预测能力;将用户行为序列分段训练,模型无法挖掘超出子序列长度的依赖关系;现有的序列推荐
中国书法以其独特的艺术风格魅力和历史文化承载能力成为众多中华优秀历史文化遗产的代表之一,历史上代表性书法家的作品蕴含了书法家个人书写风格和文化内容。因保存环境等方面的影响,大量书法作品存在破损和缺失,人工修复存在效率低、技术要求高等问题。随着深度学习的发展,应用深度学习方法生成特定书法家书法文字成为修复书法作品的有益探索之一。针对现有书法风格迁移方法存在准确性差、生成效率低和训练过程复杂等问题,本
随着物联网的快速发展与广泛应用,多类不兼容的无线通信协议和多元化无线通信设备共享世界通用的2.4G ISM(Industrial,Scientific and Medical)频段,致使Wi-Fi、Zig Bee等异构无线网络共存于同一空间。由于异构设备共存而导致的跨协议干扰问题,将会大幅度降低系统性能。这是多协议共存环境中数据传输要解决的难题之一。不同于传统无线通信,异构无线网络共存环境对应高度
陶瓷文物是中华民族历史长河所遗留的文化瑰宝,承载着巨大的历史传承意义。但受其环境及自身特性限制,使得陶瓷文物不易保存且易受损,故文物修复是亟待解决的一大难题。因传统人工拼接代价昂贵、准确率低的局限,结合计算机辅助技术修复文物是重点研究方向。深度学习模型在提取特征及后续拼接工作中性能突出,但同时存在信息冗余、过拟合及计算复杂等缺点,因此本文引入能够求解大规模、非线性、多重约束等复杂问题的群智能算法解
时空旅行电影一直是观众和市场的心头好,但此类电影的空间问题却很少被提及,这令之前的时空旅行电影研究都不可避免地走向了缺憾和偏颇,而福柯的异质空间理论的介入使得时空旅行电影的空间问题得到重视。在这个理论视野的观照下,时空旅行电影呈现出强烈的异质空间性,其不仅与异质空间的六个特征都相符合,而且在分为时空平行、时空穿越、时空循环三类后,仍能看到其独特的异质空间建构。作为一个开放的理论,异质空间理论指引人
古代壁画图像采集过程中受到成像设备和环境因素的制约,造成捕获图像存在分辨率低、纹理不清以及细节模糊等失真现象,从而影响壁画图像的观赏效果。因此,作为一种软件解决方案,图像超分辨率能够从低分辨率图像中重建出高分辨率图像,成为当今图像处理和计算机视觉研究领域的热点。然而,现有图像超分辨率技术主要针对自然图像进行处理,在古代壁画领域的应用仍处于起步阶段。与自然图像不同,古代壁画图像呈现丰富线稿和大量平滑
随着电子商务与短视频业务的快速扩增,互联网空间中各种数据信息呈现指数式增长,“信息过载”已经成为人们在当今时代面临的巨大挑战。推荐系统的出现极大的缓解了这个困难。推荐系统以优化用户体验、提高商户利润为目标,在系统中通过分析用户行为日志,构建出用户画像信息,进而主动产生推荐结果。虽然目前推荐系统已取得一定的进展,但其仍然在冷启动问题、共现矩阵稀疏、跟踪用户兴趣变化等方面面临巨大挑战。为缓解上述问题对
受库水位大幅升降和极端强降雨的影响,我国三峡地区滑坡灾害频发,防灾减灾形势严峻。建立高效的滑坡位移预测模型能够直观的反映出滑坡变形趋势,是解决滑坡灾害问题的有效手段。针对三峡地区的阶跃型滑坡,变分模态分解(VMD)可以自适应地将滑坡总位移分解为趋势项位移与周期项位移,对各项位移单独预测可以减小位移曲线急剧增加对预测模型造成的干扰,使预测结果更加精确。针对成因复杂的滑坡位移预测任务,深度学习可以挖掘
陶瓷文物在挖掘出土过程中,会产生大量碎片,很难被完整保存,因此陶瓷文物修复是其保护的一项重要内容。陶瓷修复过程大致包含碎片分类、碎片拼接以及孔洞修补等步骤,其中准确的碎片分类可提高修复效率,减少二次损伤。但现有陶瓷碎片分类方法的准确率和效率较低,其原因涉及两方面:1)碎片数量众多、标记困难;2)宏观陶瓷观察到的特征信息较少。针对上述问题,本文提出两种无监督深度学习方法对陶瓷碎片显微图像进行分类模型