【摘 要】
:
人体动作识别是计算机视觉领域的重点,同时也是难点。随着深度学习的发展、计算机性能的提高,也推动着人体动作识别的进步。解决人体动作识别任务的一个经典算法则是双流网络,其基础是目标检测。目标检测可以分为两类:一类是具有较好实时性的单阶段检测算法和另一类是具有较高准确率的两阶段检测算法。本文综合考虑,选取两阶段目标检测算法的经典网络快速区域卷积神经网络(Faster Region-CNN,Faster
论文部分内容阅读
人体动作识别是计算机视觉领域的重点,同时也是难点。随着深度学习的发展、计算机性能的提高,也推动着人体动作识别的进步。解决人体动作识别任务的一个经典算法则是双流网络,其基础是目标检测。目标检测可以分为两类:一类是具有较好实时性的单阶段检测算法和另一类是具有较高准确率的两阶段检测算法。本文综合考虑,选取两阶段目标检测算法的经典网络快速区域卷积神经网络(Faster Region-CNN,Faster RCNN)作为双流网络的基本架构,来对人体动作识别展开研究,以实现较好的网络性能。本文详细分析了双流Faster RCNN的各个模块的基本原理,讨论了其存在的一些问题,如:不重视通道、小目标检测等,针对这些问题,研究了改进的双流Faster RCNN。首先,在双流Faster RCNN的骨干网络中引入压缩和激励结构(Sequeze and Excitation Block,SE Block),以增强特征通道信息,然后针对SE Block网络,研究了两种改进的SE Block的方法,一种是使用h-swish函数替代S型(sigmoid)函数,以提高计算精度。另一种是在前人的基础上,横向添加了一层随机池化层(Stochastic Pooling),使提取到的特征更加全面,进一步减少了过拟合现象;然后针对小目标检测问题,引出了改进的感兴趣区域池化算法(ROI Pooling),在自制数据集上得到了验证;最后,在预测模块中采用了性能更好的完全的交并比损失函数(Complete IOU loss,CIOU Loss),以进一步提升网络性能。此外,针对当前公开的人体动作识别数据集的不足,本文设计并制作了一个高分辨率、动作持续时间长的包含1800个视频的人体动作识别数据集,详细介绍了各个动作的标签、以及标注注意事项,并在改进的双流Faster RCNN中做了验证试验,证明了改进算法在人体动作识别研究方面具有良好的性能以及自制数据集的有效性。
其他文献
铝元素在钢铁工业生产中是一种较为关键的脱氧元素,决定着低碳铝镇静钢的产品性能,关乎着其中杂质的多少。与低碳铝镇静钢不同,在无间隙原子钢(简称IF钢)中,对其组织与性能产生作用的是酸溶铝的含量,其变化程度直接决定着成品的性能。根据现有的科学研究成果表明,酸溶铝对罩退IF钢的力学性能并未产生不利的影响,罩氏退火后的IF钢组织呈现出等轴的状态,都能够体现出较为良好的成形性能及力学性能。
为了应对日益严峻的能源与环境危机的问题,能源革命在世界范围内积极开展,分布式可再生能源的规模化接入,电动汽车、储能以及需求响应的推广改变了配电网的形态,对配电网投资规划提出新的挑战。论文对考虑配电网新形态的多阶段投资规划开展研究,主要工作如下所示:(1)梳理了新形态下配电网投资规划的基础理论。分析了配电网的发展趋势及投资规划问题的复杂性。针对配电网新形态复杂性,介绍了稀疏自编码器、迁移学习与模糊C
目前,现有的柔性直流输电系统的拓扑结构大多为点对点连接。而点对点柔性直流输电的进一步发展,将促使多端柔性直流输电系统成为未来电网的潜在发展方向。多端柔性直流输电系统具有许多优势,但是多端柔性直流输电系统由于换流站数目较多,在设计控制策略时远比点对点柔性直流输电系统复杂。多端柔性直流输电系统能否稳定运行的关键点之一在于是否拥有稳定可靠的控制策略。从这一层面上讲,研究多端柔性直流输电系统的协调控制策略
随着智能电网技术的快速发展,以智能电表为核心的高级量测体系(Advanced Metering Infrastructure,AMI)也迅速应用在电力管理与测量中。借助于通信、控制、物联网以及计算机技术,智能电表可以实现细粒度用电信息的测量与远程通信,为能源管理带来极大的方便。与此同时,细粒度的智能电表量测技术也给用户的个人隐私带来了极大威胁。本文针对智能电表记录的细粒度数据会造成用户用电模式、个
当前世界,随着各项事业的发展进步,电能越来越成为人类社会赖以生存的基础能源。进入21世纪以来,工业化、信息化的发展程度日益提高,新能源的发展和智能电网的建设使电网结构日趋复杂,电网中接入大量波动性、冲击性负荷,由此引发的电能质量问题导致供用电双方对电能质量的关注度也不断上升。当前我国对于各项电能质量指标都有相应的国家标准作出规定,但在实际中,经常遇到各项指标不属于同一等级的情况。因此,科学有效的实
神经元在不同的空间尺度上连接成各种并行网络结构,使大脑拥有了高度复杂的结构和功能,类脑计算根据大脑工作机制采用非冯·诺依曼架构来模仿大脑的高速并行特性,进而实现复杂功能。如何仿照大脑神经元网络的结构和功能实现类脑计算是当前人工智能领域一个具有挑战性的科学问题,本文设计了一种多级嵌入式神经元网络仿真系统——EmPaas,采用高效的映射方式与混合拓扑结构提高仿真过程中的计算效率与通信效率,实现不同层次
UV遮蔽环氧,即四酚基乙烷环氧树脂(也称四官能环氧树脂),能够提高固化物耐热性能,提高固化物的玻璃化转变温度。在高温条件下,该固化物体系具有良好的强度和刚性,并显示出良好的耐水性能和电气性能。具有荧光和紫外光遮蔽功能,因此可用于印刷线路板的制造。
糖尿病视网膜病变是糖尿病常见的微血管并发症之一,相当于中医学“视瞻昏渺”“雀目”等范畴,现代中医称之为“消渴目病”。糖尿病视网膜病变严重危害患者的身心健康,是造成失明的主要原因之一。对于糖尿病视网膜病变的防治是现代医学及中医学研究的热点及重点。现代医学对糖尿病视网膜病变的发病机制尚未完全阐明,其生理病理复杂,各种机制之间存在不可分割的相关性。目前认为与血管内皮生长因子上调诱发新生血管形成,氧化应激
当今时代,最优化问题普遍存在于人们的生产生活中。区别于传统优化算法高复杂度、遍历全域等局限性,智能优化算法逻辑较为清晰,对目标函数的约束相对较低,渐渐脱颖而出并迅速发展,为解决大维数下的复杂优化问题提供了全新的思路,已经成为最优化领域研究的热点之一。本论文以经典和声搜索算法(Harmony Search,HS)为背景,在三个维度上进行离散化预处理,从不同角度提出若干改进方式,旨在解决不同规模下的N
<正>发展林业碳汇是全球公认的最经济、最环保的固碳减排措施,是应对气候变化的重要举措之一。福建山地资源和森林资源丰富,发展林业碳汇优势和潜力巨大,对助力实现碳达峰碳中和具有重要战略意义和现实意义。自2016年实施碳排放权交易市场建设以来,福建不断创新发展林业碳汇,积极推动生态产品价值实现。