【摘 要】
:
基于深度学习的人体行为识别方法相对于传统的方法具有较大的优势。而这类方法大多都是基于原始视频帧的,很容易受到视频冗余信息的干扰。同时,人体的行为容易受背景遮挡、视线变化等因素的干扰,单一的图像特征难以准确地表达出视频中对象的时空信息,影响了行为识别的准确率。为了解决上述的问题,本文基于C3D网络对视频中的行为识别方法展开研究。其主要工作和贡献如下:(1)针对视频帧存在大量冗余的问题,提出了一种新颖
论文部分内容阅读
基于深度学习的人体行为识别方法相对于传统的方法具有较大的优势。而这类方法大多都是基于原始视频帧的,很容易受到视频冗余信息的干扰。同时,人体的行为容易受背景遮挡、视线变化等因素的干扰,单一的图像特征难以准确地表达出视频中对象的时空信息,影响了行为识别的准确率。为了解决上述的问题,本文基于C3D网络对视频中的行为识别方法展开研究。其主要工作和贡献如下:(1)针对视频帧存在大量冗余的问题,提出了一种新颖的自适应关键帧提取方法,该方法利用RGB直方图检测场景变化速度,并以此度量视频片段的信息冗余程度,决定是否应实施关键帧提取过程。以关键帧为输入(如无需提取,则输入视频帧),训练C3D网络进行特征提取,并以此训练支持向量机进行行为识别。UCF101数据集中的实验结果表明,自适应关键帧提取能显著提高C3D网络的识别准确率。(2)针对数据集中单一图像信息不能够充分表达出视频时空信息的问题,提出了融合骨架信息和图像信息的行为识别方法。该方法将基于骨架信息的时空图卷积神经网络模型的softmax层输出与基于图像信息的C3D网络模型的softmax层输出进行融合,得到了一个基于关键帧的信息融合模型。UCF101数据集中的实验结果表明,多网融合能有效提高模型的识别准确率。(3)针对C3D网络特征学习能力不足的问题,提出了基于时空增强型C3D网络的行为识别模型。该模型将时空图卷积模块嵌入到C3D网络卷积层输出之后,通过构造图实现时空图卷积操作来增强C3D网络对动态时空特征的建模能力。UCF101数据集中的实验表明,时空增强型C3D网络模型能显著提高模型的识别准确率。
其他文献
近年来,工农业生产和人类活动是加剧水体磷超标的主要原因,其中水体富营养化是水体磷富集引发的典型的生态问题,另外,磷矿资源短缺及磷肥利用率低,是限制磷回收的主要壁垒,以上两者造成的危害不仅不利于水生态系统的平衡,更在长期内限制了全球生态和经济可持续发展,受到科研学者和社会各界的广泛关注。因此,为缓解水体磷富集产生的负面影响,本研究通过结合沸石(zeolite)和生物炭(biochar)吸附磷酸盐的优
司法实践中,在保证金接受方破产时争议颇多。其中争议之一就是按约履行义务后的保证金给付方能否向已经破产的保证金接受方行使取回权取回之前交付的保证金。决定交付方能否取回交付保证金的关键有二:一是保证金交付方对交付的保证金享有权利的性质为何,是债权还是物权;二是债权能否成为破产取回权的权源。以交付时双方当事人是否具有转移保证金所有权的意思为标准,可将保证金分为有转移所有权意思的保证金和无转移所有权意思的
本文主要研究优化硅基近红外光电探测器,分别制作了微结构、生长了抗反射膜、利用石墨烯与硅构成肖特基结,以提升光电探测器的光电流、量子效率和光响应度等性能。首先制备了表面微结构的硅基近红外光电探测器,分析微结构的形态图。与不做处理的表面平坦的硅基光电探测器进行比较,在性能方面,微结构的制备使器件表面在近红外光的反射率由30%减小到15%;入射808 nm的近红外光后,光电流提升了两个数量级;量子效率由
铜仁下寒武统黑色岩系富含磷、铀等矿产,有机质含量普遍较高,为探究有机质在成矿过程中的作用,本文在详实野外调查基础上,通过岩矿鉴定、总有机碳TOC测试、氯仿沥青“A”抽提及族组分分析、饱和烃及芳香烃GC-MS分析、主量、微量、稀土元素及无机碳同位素测试等,揭示有机质的来源、热演化的程度,从而阐释含磷岩系沉积环境,剖析有机质参与成矿机理。主要取得如下认识:(1)含磷岩系TOC含量较高,且磷块岩含量高于
改革开放四十多年来,我国经济高速发展,一跃成为世界第二大经济体,国内生产总值突破100万亿元。当前,我国人民的社会经济生活水平稳步提升,社会分工及资源配置日益细化。越来越多的人把自己的财产性事务交托给更为专业的人员和机构处理,以此期待能获得更高的经济效益,许多人将为他人处理事务作为自己谋生的职业,市场经济借此运行愈加高效。这种良性发展依靠一个基础前提,即委托人与受托人之间的内部信任关系,只有受托人
贵州东部寒武系第2统第4阶及苗岭统乌溜阶凯里组主要由灰绿色粉砂质泥页岩、泥质灰岩及灰岩组成,含有丰富的三叶虫化石,保存了大量的三叶虫蜕壳标本,为揭示三叶虫的蜕壳行为提供了良好的材料。本文借助产出于黔东地区凯里组中的大量三叶虫蜕壳化石,从蜕壳保存模式、蜕壳方式及蜕壳过程等方面进行讨论。首次对Ptychopariida三叶虫Xingrenaspis xingrenensis、Eosoptychopar
达拉布特蛇绿岩位于中亚造山带西南缘,是古亚洲洋的扩张、俯冲、消减和闭合过程的产物,保留了洋盆形成及构造演化信息。前人对达拉布特蛇绿岩的形成大地构造背景始终未取得统一的认识。为探讨蛇绿岩所代表的构造演化过程,笔者以达拉布特蛇绿岩中的地幔橄榄岩为研究对象,通过详细的岩石学和矿物学及其氧同位素研究,对达拉布特地幔橄榄岩成因及构造背景提出新的制约。(1)达拉布特地幔橄榄岩全岩的组分(如:CaO、Al2O3
胰腺癌是一种恶性程度高、病程发展快、预后差的消化系统恶性肿瘤,目前,CT是胰腺癌最常见的影像学检查方式,利用先进的算法实现CT图像中胰腺肿瘤的自动分割可以辅助医生阅片,对胰腺癌病人的诊断和治疗具有积极的意义。本文提出了一种基于深度学习的自动分割CT图像中胰腺肿瘤的方法。本文的算法分为两部分:基于双支路编码网络的胰腺分割和基于细节增强网络的胰腺肿瘤分割。第一部分的网络采用双支路并行的编码设计,其中一
贵州织金早寒武世戈仲伍组磷矿床因富含稀土元素而备受学者关注,并针对磷块岩中造岩矿物、生物化石以及稀土元素各项特征展开了深入的研究,已得到广泛的科学认识。然而稀土元素的提取利用仍然是阻碍织金磷矿床开发利用的重要因素之一,因此本文以同步辐射实验技术为创新点,主要以戈仲伍剖面为研究对象,围绕磷块岩主要造岩矿物胶磷矿着手,探究织金磷块岩中Y元素的赋存状态以及常见主要类型胶磷矿中稀土元素(包括Y元素)的赋存
糖尿病视网膜病变是糖尿病引起的一种严重的病发症,是糖尿病性微血管病变的重要表现。目前,在临床上对糖尿病视网膜病变的诊断主要通过经验丰富的医生来完成,但受限于医疗资源的匮乏以及人工诊断效率低下等原因,部分患者可能无法得到及时的治疗而耽误病情。随着人工智能技术的不断发展,通过研究一种糖尿病视网膜病变自动分析诊断的方法来辅助医生完成诊断过程具有极其重要的意义。本文将利用深度学习技术,对糖尿病视网膜病变眼