基于分层集成卷积神经网络的三维手姿态估计

来源 :南昌大学 | 被引量 : 0次 | 上传用户:wjyjiedabc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手部作为人类最频繁使用的身体部位之一,对于人机交互具有重要作用。准确的三维手姿态估计成为人机交互领域的关键技术,基于视觉的三维手姿态估计逐渐成为研究热点。目前,大部分的三维手姿态估计都是基于深度图像,但该类图像需要专门的深度相机采集,不易获取,而彩色图像应用范围广,对用户约束小,易获取,采集成本低,因此本文研究基于彩色数字图像的三维手姿态估计。由于普通彩色图像缺少深度信息,同时手部结构又具有自遮挡和高灵活性,使得基于单个彩色图像的手姿态估计任务十分具有挑战性。针对上述问题,本文结合手部结构特点设计了一个三维手姿态估计卷积神经网络,主要工作如下:(1)结合手部结构特点,设计了一个新颖的五层集成卷积神经网络,以更有效地提取手部特征。结合手部拓扑结构特点,利用分层集成网络将整个三维手姿态估计分解为五个单手指姿态估计,分别提取更深层次、更具有代表性的潜在手指特征信息以估计三维手指姿态,然后将三维手指姿态估计过程中生成的三维手指特征集成,估计三维整手姿态。这不仅能够提取更有效的特征,还通过各个手指姿态特征的集成增强了手指间的相关性;(2)在设计的网络中新增五个三维手指姿态约束,以提高姿态估计精度。该约束不仅能有效地促进三维手指姿态估计,而且能够借助误差反向传播实现对二维手指姿态估计的软约束,该过程有助于进一步间接优化三维手姿态的估计精度;(3)构建了一个掌心与中指单相连的手模型解决网络精度退化问题。根据手的拓扑结构,中指居于五个手指中间位置,与掌心的连接更为紧密,因此,将掌心与中指相连。利用这一结构特征,有效地避免了掌心与多个手指同时相连带来的精度退化问题;(4)在RHD和STB公开数据集上对网络进行了对比实验,得到了高精度的三维手姿态估计结果,超过了其他先进方法的估计精度,验证了所设计网络的有效性。
其他文献
我国农村存在师资欠缺、整体素质较低等问题,为了解决这些问题,促进城乡教育公平,国家于2006年实施“农村义务教育阶段学校教师特设岗位计划”,该计划启动后特岗教师数量在农村教师中所占比重越来越高,特岗教师在农村教师群体中扮演越来越重要的角色。特岗教师为农村教育作出重要贡献,教育部门、学校也都对特岗教师的付出给予肯定,然而,教育部门及学校对特岗教师的管理却出现了许多问题。本研究以新干县2016年至20
学位
随着计算机视觉技术不断发展,提取场景图像中的文字需求不断增加,使得场景文本检测与识别也成为目前最热门的研究内容之一,也积累了很多有价值的成果。场景文字的检测与识别在无人超市、自动驾驶、快递、天网系统、工业自动化、即时翻译等领域有极大的应用价值,传统印刷文本的检测与识别方法在图片质量不佳、文本形式多变、图像背景复杂等问题很难得到较高的准确率,近些年来深度学习在目标检测与图像处理方面取得巨大成果,所以
学位
随着移动互联网的迅速发展以及智能设备的普及,诸如门户牌匾、道路指示牌之类的自然场景下的图像文字信息可以被人们获取,它们充斥着我们的生活。所以利用计算机自动高效地提取这些图像中的文字信息,对我国的信息化建设和数字经济的蓬勃发展有着重要的意义。自然场景下的图像由于拍摄角度和拍摄条件的原因,往往存在过曝、光线反射、环境繁杂、图片模糊、文字形状和颜色不理想等问题。如何高效准确地检测、将复杂环境下的文本内容
学位
在光照条件不佳或背对光源的情况下获取的低照度图像往往存在着对比度低、可见性差、噪声严重和颜色失真等问题,导致图像内容难以被人眼感知和计算机视觉识别,需要经过增强处理后才能用于图像分割、目标识别、图像分类等任务。为此,研究者们提出了大量的低照度图像增强(low-light image enhancement,LLIE)算法来提高低照度图像的图像质量。其中,基于Retinex模型的LLIE算法增强的图
学位
长期以来,传统的博士生普通招考在面向高层次人才选拔中暴露出初试制度僵化、复试流于形式的弊端。为改变这一现状,在借鉴国外博士生招生改革的经验基础上,我国部分高校开始了博士生“申请-考核”制改革的试点工作,期待探索一条以科研创新能力为选拔标准的招生改革之路。经过多年的努力,博士生招生“申请-考核”制虽在全国已得到广泛应用但也遭受诸多质疑。在全面深化研究生教育改革的背景下,怎样选拔出优质生源,如何提高博
学位
当前癌症已经成为我国以及全世界居民死亡的重要因素,而乳腺癌更是导致女性死亡的重要疾病。利用显微镜观察病理切片的肿瘤区域进行症状分析,计算肿瘤细胞的阳性指数能给患者提供针对性的治疗方案。由于专业的病理医生数量匮乏以及医生的个人主观因素等限制条件,往往存在各组织区域识别不准确,阳性指数估算偏差较大等问题。而通过深度学习对病理切片的图像数据进行组织分割,一方面能帮助病理医生快速定位不同的组织区域,方便症
学位
野生动物资源是生态系统中的重要组成部分,对野生动物实施高效的检测有利于开展野生动物资源的保护工作,近年来在目标检测领域研究的不断深入,为野生动物的检测识别研究提供了很大的帮助。本文以自然保护区的部分野生动物图像数据为主要研究对象,提出了两种基于YOLOv3的改进算法,本文的主要工作包括以下几个方面:(1)野生动物图像数据集的构建。以红外相机在自然保护区采集野生动物图像为基础,构建野生动物图像数据集
学位
报纸
太阳活动区是日地空间环境的扰动源,其中爆发的太阳耀斑是一种较为强烈的太阳活动,可以导致地磁暴等非常极端空间天气。严重的空间天气扰动会对卫星、电力设施、地面短波无线电通信系统等诸多系统造成危害,产生巨大的经济损失。准确预报太阳耀斑等空间天气事件可以给人类充足的准备时间,提前做好防护措施,以削弱恶劣的空间天气事件对人类生活的影响。太阳耀斑主要在太阳黑子上方的大气中爆发。太阳耀斑与太阳黑子群的面积、数量
学位
穿墙雷达技术凭借电磁波的低频穿透特性,可对墙后物体进行定位、识别与成像,在军事与民用领域具有广泛应用。而在探测中由于墙体等杂波的影响,对电磁波传播造成衰减,大大削减了目标回波强度,给目标探测定位和成像带来很大困难。意味着对墙体杂波的抑制成为首要任务,现有的传统杂波抑制方法对墙体的滤除和其它噪声的去除不能达到并存的效果,仍然存在目标低信噪比的情况。因此,本文提出一种自适应卷积神经网络的方法对雷达信号
学位