改进的CoDe4D方法及其在身姿识别中的应用

来源 :西南大学 | 被引量 : 0次 | 上传用户:jigmei123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在视频身姿识别也即行为识别领域,局部时空(LST)特征提取算法被广泛使用,LST特征提取算法通常用来提取视频中的LST特征点以表示视频中目标人物的行为轨迹。此算法选取视频帧中变化显著的像素点作为LST特征点,LST特征点一般落在目标人物的运动轨迹上,因此LST特征点能较好地表现目标人物的运动轨迹,非常适合用于身姿识别。LST特征提取算法中,特征点的选取对最终的分类准确率起着重要的作用。而随着深度传感器的出现,仅用于提取RGB视频特征的传统LST特征提取算法需要调整才能提取深度信息中的LST特征。深度传感器与RGB传感器获取数据的原理不同,产生噪声的不同,使得两者需要使用不同的噪声处理方法;如何将特征点都聚集在人物的运动轨迹上,避免无效特征点的选取;以及分类准确率尚需进一步的提高。这些都是需要解决的问题。鉴于传统LST特征提取算法存在的这些问题,本文选择将LST特征提取算法中的CoDe4D(Color-Depth Local Spatio-Temporal Features)特征提取算法做出改进,CoDe4D特征提取算法将颜色特征和深度特征融合,但未将颜色信息和深度信息分开降噪,且提取的LST特征点存在无效特征点。改进后的CoDe4D特征提取算法针对颜色信息和深度信息使用不同的降噪方法。为了尽量避免无效特征点的提取,改进后的CoDe4D算法对滤波器的高斯核参数做出修改。在识别分类时采用以广义直方图交叉核为核函数的支持向量机(SVM)做分类器,进一步提高行为识别的分类准确率。并且,将改进的CoDe4D算法得到的特征向量作为输入数据加入改进的MiCT(Mixed 3D/2D Convolutional Tube)网络中。最后将改进的CoDe4D算法和改进的MiCT网络应用于数据集MSR Daily Activity 3D。本文的主要工作主要可以概括为以下两个方面:(1)改进的CoDe4D特征提取算法。在目标人体的边缘地带,深度传感器获取的深度值可能会在背景的深度值和人体边缘的深度值之间来回跳动而产生翻转噪声,或者由于场景中存在的特殊材料以及目标人物快速移动导致翻转噪声的产生,本文使用一个校正函数来抑制这种翻转噪声。对于RGB传感器,使用直方图均衡化来平滑噪声,使视频中的灰度数据均匀分布。修改滤波器的部分参数降低无效特征点的提取数量,然后使用以广义直方图交叉核为核函数的SVM作为分类器提高视频中目标人物行为的分类准确率。为了验证改进后的CoDe4D特征提取方法的有效性,本文将改进后的CoDe4D提取到的特征点图与其他几种特征提取算法提取到的特征点图作比较,然后使用DCSF(Depth Cuboid Similarity Feature)特征描述方法以及词袋法构建特征向量,用SVM分类识别得到分类准确率,再与其他几个特征提取算法比较分类准确率。实验基于MSR Daily Activity 3D数据集,实验结果表明:改进后的CoDe4D特征提取算法的特征点图无效特征点更少,并且运动轨迹更明显,使用DCSF特征描述和词袋法构建特征向量,SVM识别分类之后,分类准确率相比其他LST特征提取算法更高。(2)改进的3D/2D联合卷积混合模块(MiCT)。在原有MiCT网络框架的基础上,调整框架结构使得MiCT网络框架可以同时分析RGB信息和深度信息。MiCT网络框架分为3D/2D串联混合模块和3D/2D并联混合模块。3D/2D串联混合模块用于提取空域信息,3D/2D并联混合模块用于共享空域信息,可以避免梯度消失现象,加快卷积网络计算速度。将MiCT网络用于深度信息和RGB信息的共同处理,然后将改进的CoDe4D算法得到的特征向量作为辅助特征加入MiCT网络中,为了验证改进后的MiCT网络用于深度和RGB的有效性,这里将改进后的MiCT网络的分类准确率与其他LST分类算法作分类准确率比较。实验基于MSR Daily Activity 3D数据集,实验结果表明:分别使用1到3个MiCT模块构建MiCT网络,3个MiCT模块构建的MiCT网络分类准确率最高,且MiCT网络的准确率高于改进的CoDe4D算法。
其他文献
传统的机器学习算法不仅要求有大量的带标签训练数据,还要求训练数据和测试数据满足同分布。但是在实际应用中,常常缺乏与测试数据同分布的带标签的训练数据,因此如何运用其他领域中不同分布的带标签的训练数据,辅助目标任务的完成是亟需解决的问题。迁移学习是解决这一问题的一种有效方法。而在大多数迁移学习中都要求源领域与目标领域之间存在一定的相似度,在迁移学习框架中利用相似度学习可以提高迁移的效果。BP神经网络算
目的为了了解KSHV在新疆石河子地区的正常人群中的血清感染率,开展了KSHV在新疆死石河子地区的普通人群血清感染情况的研究。并且初步分析了KSHV感染的危险因素,为继续开展有
背景:全关节置换术(Total joint arthroplasty,TJA)是晚期关节畸形或退变患者常规的治疗方式,能够有效缓解病人症状,提高生活质量,但也存在相应的手术并发症,常导致大量失血,
在人工智能上升到国家战略的今天,数据作为推动人工智能智能化发展的重要因素,对人工智能的发展起着重要作用,人们日常生活中面临的很多问题都可以简单的转化为数据分类问题,
五年的政治动荡明显降低了经济增长,以及造成了南苏丹一系列的金融摩擦和普遍恐慌。自从战争于2013年12月15日爆发以来,南苏丹作为一个国家在经济和财政上已经陷入瘫痪,国家发展项目也随之停滞。这种对比对如何将稀缺资源分配给经济部门的功能和进步产生了普遍影响。这种情况造成了一些突出的挑战,如通货膨胀,严重的失业和城市的橡胶化。经济部门的稀缺资源分配和当地货币的大规模贬值仍然是最重要的和可识别的。本文研
在当今社会,云计算已经在个个方面严重影响了我们的生活和商业模式。这无疑是许多公司战略方向之一,也是企业最主要的内容之一。现在许多企业不选择购买可以自己管理的IT设备
随着经济全球化和物联网产业的不断发展,企业对供应链管理的要求不断提高。RFID技术作为物联网领域的核心技术,被誉为21世纪知识经济的关键技术之一,在供应链领域得到了广泛
背景与目的自身免疫性脑炎(autoimmune encephalitis,AE)是指由于血清和/或脑脊液存在针对自身抗原的阳性抗体,进而对中枢神经系统产生异常免疫反应的一类脑炎综合征。通常急
随着互联网技术的高速发展及互联网应用的快速增加,使得网络上数据量呈爆炸式增长,大规模数据存储、访问随之成为大数据领域的研究热点。当前,Hadoop分布式文件系统HDFS因高
神经坏死病毒(nervous necrosis virus,NNV)属于Betanodavirus病毒属,引起鱼类的病毒性神经坏死(viral nervous necrosis,VNN),主要侵蚀鱼类的中枢神经系统,使受感染部位出现