【摘 要】
:
在地铁运行途中,地铁司机的操作行为是否符合安全规范直接关系到乘客的人身安全,所以对地铁司机进行视频监控是一项非常重要的安防措施。地铁司机操作行为识别作为人体行为识别的一个重要应用场景,传统的行为识别方法需要手工设计目标特征,通过特定的方法提取特征,存在效率低、准确率低、泛化性差的问题。深度卷积神经网络具有自学习的特性,能够自动提取数据中的有效信息,效率、精确性得到大大提高。本文基于深度学习对地铁司
论文部分内容阅读
在地铁运行途中,地铁司机的操作行为是否符合安全规范直接关系到乘客的人身安全,所以对地铁司机进行视频监控是一项非常重要的安防措施。地铁司机操作行为识别作为人体行为识别的一个重要应用场景,传统的行为识别方法需要手工设计目标特征,通过特定的方法提取特征,存在效率低、准确率低、泛化性差的问题。深度卷积神经网络具有自学习的特性,能够自动提取数据中的有效信息,效率、精确性得到大大提高。本文基于深度学习对地铁司机操作行为识别的算法展开了进一步的研究,其主要工作内容如下:首先,完成了基于二维卷积神经网络对地铁司机操作行为的识别。基本框架采用二维Inception-v3作为基础网络,构建双流卷积网络模型,提取视频图像中的不同数据形式为RGB、光流数据。实验结果表明,在two-stream网络中,训练过程采用部分BN dropout的方法,其识别准确率提高到81.63%,采用平均池化函数,其识别准确率为82.16%。其次,完成了基于三维残差卷积神经网络对地铁司机操作行为的识别。为了充分利用空间和时间信息,设计使用三维卷积神经网络,同时提取时空特征,并嵌入三维残差结构,提出基于微调和SVM的地铁司机操作行为识别算法。实验结果表明,微调两次(一般场景下),其识别准确率达到83.23%,冻结底层卷积层数的增加,识别准确率持续上升,但高层卷积不能随便冻结,SVM方法(一般场景下),识别准确率达到82.28%,使用全局平均池化操作代替全连接层的识别准确率达到83.17%。最后,完成了基于多流卷积神经网络对地铁司机操作行为的识别。为了增强网络模型的泛化性能,将加入注意力机制的二维卷积神经网络与残差结构的三维卷积神经网络结合,使用多模态数据输入,最后基于特征级联、特征相加两种算法进行实验对比。实验结果表明,特征级联方法,一般场景下达到86.78%的识别准确率,特征相加方法,一般场景下达到85.47%的识别准确率。准确率高并且便捷,所以把深度学习与地铁司机操作行为识别相结合,将会有非常广阔的应用前景。
其他文献
随着电机驱动技术的快速发展,高速电机在工业中得到了越来越广泛的应用,同时,对变频供电条件下高速电机能效水平要求也越来越高。高频供电时的谐波以及由此带来的损耗问题成为高速电机设计时关注的热点。本文针对这一问题,主要开展用于降低高速电机损耗的低谐波绕组设计研究,主要研究工作如下:1)分析了变频器供电带来的谐波特点及其对电机内部空间谐波的影响;并计算分析了电机内部空间和时间谐波的特点;介绍了基于时步有限
随着电力系统智能化的推进,作为电网安全稳定运行三大支柱之一的电力通信网络在电力系统中扮演着越来越重要的角色。电力通信网的安全运行和数据可靠传输直接影响到电力安全生产业务的有序开展,并会对电力系统资源的高效利用产生深远影响。为此,论文基于历史运行统计数据对电力通信网进行多业务风险评估具有重要的理论意义和实际价值。本文通过分析某省电力通信网的年度统计数据,归纳出其电力通信网中主要承载业务的分布情况和业
当前的市场和顾客要求半导体分立器件封装测试企业交付零缺陷的半导体分立器件,但是目前半导体分立器件制造企业的质量水平无法满足客户日益提高的质量要求。不论是在分立器
随着现代科技的飞速发展,社交媒体功能不断更新迭代,如Twitter,Facebook,微博等社交平台都支持用户发布多媒体信息。研究表明多数用户更倾向于选择利用图像与文本两种媒体进行信息发布,利用文字搭配情感图片,表达发送者情感情绪状态。因此,利用文本和图像的跨模态社交媒体数据进行情感分析,有利于如用户兴趣分析进而定向推荐,群体情感倾向分析进行舆情分析等,其研究成果具有潜在的应用前景。跨模态社交媒体
随着我国人口老龄化速度的不断加剧,失能、失智、独居、空巢以及高龄老年人日益增多。机构养老由于具有全天候照护服务、有效减轻老年人孤独感、更加安全等优势,逐渐成为了上述老年人群体安享晚年的首要选择。为了满足这一需求,近些年来,各地养老机构如雨后春笋般地发展了起来。但是快速发展的背后,专业养老护理员有效供给不足的问题却逐步显现了出来。青年专业养老护理员群体的出现显然有助于缓解这一现状。但是由于受到了种种
国内一些很具发展潜力的企业因国内A股市场对新上市企业的限制而选择美国上市,这些选择国外上市以获取当地资本市场融资、而主营业务收入来源于大陆的一类公司被称为中国概念
人们在以往的现实中感受过的事物在头脑记忆中的重现,称为“表象”或者“表征”,空间的环境和事物的表征称为“认知地图”。1948年Tolman首次提出认知地图的概念,也就是啮齿动物和人类拥有空间认知地图的能力这一概念。之后,认知地图概念被人们广泛接受,并且慢慢的成为心理学研究的热门问题之一。本研究在总结前人研究的基础上,采用了实验控制法,探讨了边界的局域空间特点是否对人们在头脑中建立起一个或者多个认知
近年来,随着互联网产品需求量不断增大,越来越多的方面需要用到图像中的文本信息。目前关于自然场景文本检测算法大多采用深度学习算法,其不足是普遍缺少特征级的精细化,导致原本设计良好的模型不能被充分利用。另外由于卷积运算基于局部感受野,需要经过多个卷积才能解决长效依赖问题。针对这两个问题,提出将特征融合和特征金字塔注意力模块应用到自然场景文本检测,以提高检测效果。本文主要工作如下:1.从深度卷积网、基于
印染废水通常具有有机物浓度高,所含化学成分复杂,物理色度大,可生物降解性差,毒副作用大等特点,这样的水处理起来难度高,工艺复杂,难以用生物手段处理,处理成本高。基于这些
随着城市化与农业现代化进程的不断加快,近年来我国人口增加的同时大量土地被占用,土地利用强度,利用结构,利用方式等方面都受到了很大影响。原有的土地利用景观格局,景观空间分布发生变化,土地利用景观生态安全也受到了巨大的影响。因此,了解现有土地利用景观生态安全状况,对土地利用景观生态安全进行评价分析,优化景观环境显得尤为重要。本研究结合景观生态学,构建土地利用景观生态安全评价指标体系,通过主成分分析法确