单目图像的三维人体姿态估计算法研究

来源 :北京交通大学 | 被引量 : 5次 | 上传用户:liyaping121416
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单目图像的三维人体姿态估计是计算机视觉领域中的热点问题,具有非常广泛的应用前景。由于从单目图像推理三维空间信息本身是一个病态问题,且姿态图像存在着遮挡和视点差异,使其非常具有挑战性。本文分两阶段进行单目图像的三维人体姿态估计,首先从单目图像中估计二维人体姿态,进而根据二维姿态估计结果推理出三维人体姿态。本文还将单目图像的三维人体姿态估计与基于内容的图像检索相结合,提出视点无关的人体姿态图像检索框架。本文的主要贡献如下:
  (1)二维人体姿态估计的深度学习网络的选型。为了更准确地估计单目图像中的二维人体姿态,本文从理论和实验两方面对比分析了单目图像二维人体姿态估计的两种主流的深度网络模型CPM(Convolutional Pose Machines)和Hourglass堆叠模型。由于Hourglass堆叠模型能更好地处理图像中的人体自遮挡问题,因此本文选用Hourglass堆叠模型来估计二维姿态。
  (2)针对基于样例的三维姿态估计方法依赖于姿态样例库规模的问题,本文提出一种基于样例增强的三维人体姿态估计方法,旨在通过匹配和合成策略隐式地实现样例库的自我扩充,增强姿态样例库的多样性。该算法首先进行全身、半身姿态匹配,利用半身匹配姿态样例合成虚拟候选姿态样例。然后从含有虚拟姿态样例的候选姿态样例集中选择出与二维姿态估计结果最佳匹配的姿态样例。本文在Human3.6M数据库中进行了多方位的实验对比与分析。实验证明本文算法可以得到较好的估计结果,尤其是一些复杂姿态类别如“坐下”。
  (3)针对目前人体姿态图像检索结果受视点影响的问题,本文提出一种视点无关的人体姿态图像检索框架。该框架的核心思想是利用单目图像的三维人体姿态估计结果来提取视点无关的人体姿态特征,并在此基础上度量人体姿态图像间的相似度。在多视点人体运动库IXMAS中的实验结果证明,本文框架可以返回不同拍摄视点的相似姿态图像,提高姿态图像检索的性能。
其他文献
本文基于图里的翻译规范理论,勒菲弗尔的操纵改写理论和德国学派的目的论,采用描述—解释的研究方法,对文学翻译中译者的创造性叛逆现象,甚至于改写的现象进行探讨分析。根据上述理论框架,并通过丰富的译例分析,文章揭示出导致译者发生创造性叛逆的因素,这些因素包括译语文化规范,翻译目的等等,并阐明创造性叛逆存在的价值和意义。 通过对文学翻译中译者的创造性叛逆的研究,文章指出创造性叛逆是不可避免的
学位
摘要目的探讨补肾抗衰片对家兔动脉粥样硬化的干预作用及作用机制。方法36只日本雄性大耳白兔随机分为4组:正常对照组6只,模型组10只,补肾抗衰组10只,辛伐他汀组10只。正常对照组饲喂普通饲料;模型组和给药组通过高脂饲料(第1周至第10周)、免疫损伤(第2周)结合经股动脉球囊拉伤(第4周)建立动脉粥样硬化家兔模型,另外补肾抗衰组及辛伐他汀组从第1周开始分别加喂补肾抗衰片和辛伐他汀,直至第10周取材。
对CSP连轧生产线使用的CVC轧辊磨损进行了大量实测,得到CVC轧机F1-F7机架工作辊的不同磨损形式,在此基础上求出各架轧辊的辊形自保持参数和辊形变化特征参数,对各机架轧辊的磨损进行了分析和评价。
同型产乙酸菌是兼具自养和异养两种代谢方式的严格厌氧微生物,既能以H_2还原CO_2合成乙酸,也能发酵有机物产生乙酸等小分子有机物,是乙酸生物生产的优良菌种资源,在生物发酵气(富含CO_2/H_2)、工业合成气(CO/CO_2/H_2)和木质纤维素等资源化方面展现出了很好的发展前景和应用潜力。然而,目前获得的同型产乙酸菌纯培养物还十分有限,对其生理生态特征的了解也不够深入和全面,严重制约着其应用技术
结直肠癌(Colorectal cancer,CRC)发病率在恶性肿瘤中居全球第3位,同时也是我国常见恶性肿瘤之一。近年来随着环境日益恶化、不良的生活方式及人口老龄化等因素,其发病率和死亡率逐年趋增。目前结肠癌主要的治疗方案是手术与化疗相结合,但是在治疗过程中,肿瘤的耐药性和药物给机体自身带来的副作用严重阻碍了癌症的治疗。因此,寻找更安全、更有效的抗癌新药物成为肿瘤治疗亟待解决的问题。天然化合物是
学位
锁阳(Cynomorium songaricumRupr.),是一种生长在沙漠地区的寄生植物,主要用于治疗“肾阳不足、精血亏虚、腰膝痿软、阳痿滑精,肠燥便秘”等。然而,不同地区来源的锁阳品质差异较大、影响锁阳药效的化学成份积累的相关因素尚不清楚等严重制约着锁阳的使用。  本课题以UPLC-Q/TOF-MS/MS为手段,采用代谢组学的方法系统分析锁阳代谢组成,采用多变量统计分析来自我国腾格里沙漠和巴
学位
NCo R1即核受体辅抑制因子1,NCo R1在肿瘤发生、脂肪代谢及肌肉活动中都起重要调控作用,但在免疫系统中的调控作用知之甚少。早期Glass实验室利用CHIP、过表达以及Knockdown等技术阐明NCo R1在巨噬细胞的激活过程中起抑制作用,然而最近Li P等利用条件性基因敲除小鼠进行研究而发表在《Cell》杂志的实验结果并不能重复该早期研究发现,说明技术手段的不同可能会导致截然不同的研究结
网络时代时时刻刻都在产生大量的数据/信号,人们经常需要进行采样压缩以实现对这些信号的存储和传输。随之而来,从压缩后的信号恢复出原始信号则是一件极具挑战性的事,这在实际应用中也起着关键作用。因而对具有稀疏先验的信号,稀疏重建技术一直属于信号处理领域的研究热点之一。  传统的稀疏重建算法大多需要进行很多次迭代运算,对硬件的计算能力和存储能力要求较高,而采用基于常微分方程(ODE)的动态系统可以更加快速
在如今信息化技术高度发展的时代,数字图像是人们日常生活中最常接触到的信息载体,与人们的日常生活息息相关。然而图像在获取(成像)和传输过程中不可避免地会受到噪声的污染,影响图像的质量,进而影响后续的图像应用。因此图像去噪是图像处理最基础的问题之一,也是计算机视觉最底层的研究之一,有着重要的现实意义。  由于图像去噪是一个病态的逆问题,其解存在无穷多个,所以结合图像的先验信息,用于构造合适的正则项来约
学位
通信需求的“立体式”增长,激励着无线通信技术的迅猛发展。频率资源对通信系统容量和性能制约性影响,已经严重的影响了通信系统的发展。如何有效的提高频谱效率和能量效率是第五代移动通信系统发展和建设的关键问题。大规模多天线(Massive MIMO: Massive Multiple Input Multiple Output)技术是突破这一瓶颈的关键技术。  本论文主要研究了大规模多天线系统在典型传播场
学位