基于多源相机的银行金库人体异常行为识别方法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:kmyzchenpeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频监控是“天网”系统的重要组成部分,也是近年来治安防护水平提高的重要推动力之一。随着视频监控设备的普及率逐年上升,监控系统智能化的需求也日益提升。目前,国内大多数的视频监控系统都需要人工值守,安排监控人员24小时轮班来实现监管。通常,每个监管人员需要同时监控多个显示屏,存在效率低、抗干扰能力差、容易受监管人员主观意识影响等问题。随着科研人员对图像处理、视频分析、行为识别等技术的研究越发深入,智能视频监控系统因其智能化程度高、鲁棒性强、效率高等优点,在特定的几类场合得到了广泛的应用,例如道路、教室、门禁等区域。但是,在面对银行金库以及金库内的特殊异常行为时,通用的智能监控系统无法取得理想的效果。因此,研究一种基于多源相机的银行金库人体异常行为识别方法及系统具有重要价值。本文以银行金库为研究场景,以使用手机打电话和违规拆箱行为作为识别目标,针对库内数量巨大的相机组设计了一种基于拓扑结构分析的相机调度算法,针对金库环境的特点设计了一种基于改进高斯混合模型的运动目标分割方法和倒影检测算子,针对金库内的两类异常行为,设计了一种基于区域分块降维的HOG-LBP特征提取算子并用SVM(Support Vector Machine,支持向量机)进行分类,并在此基础上完成了UI软件的设计和试验分析。主要内容如下:(1)银行金库人体异常行为识别系统总体方案设计。针对银行金库的场景分布和人员工作特性,完成了相机、刻录机、服务器等硬件的选型和硬件系统的设计。基于异常行为的识别要求,提出了一种相机分级的多线程软件结构,能够根据运动目标在金库内的位置动态调配资源,在确保实时性和识别精度的前提下减少软件资源占用。(2)基于拓扑结构分析的相机调度算法。针对银行金库多源相机配置和异常行为识别要求,设计了一种基于拓扑结构分析的相机调度算法,能够根据运动目标位姿状态实现相机组的开闭调度,在确保识别率的基础上,优化了相机和计算机资源动态配置。该算法在面临银行金库内可能出现的人员遮挡情况时,能够根据目标所在的区域临时调度云台摄像机来进行辅助视频监控。针对运动目标同时出现在多个调度相机视野下的情况,提出了一种基于距离权重的结果投票机制,该机制根据人员在调度相机视野中的位置动态分配权重,避免因人员距离相机过远而产生误判。(3)基于改进高斯混合模型的运动目标分割方法。针对银行金库内出现的鬼影和倒影问题,提出了一种改进的高斯混合模型算法。该算法通过引入像素速度的概念来动态调整不同像素点的模型学习率,从而有效解决前景提取中的鬼影问题。同时,该算法利用像素点的速度和历史信息,能够有效预警并消除银行金库内的光照突变情况,避免对目标分割产生干扰。针对银行金库内的倒影,提出一种融合目标位置和加权HSV(Hue,Saturation,Value,色调、饱和度、明度)颜色模型的特征向量,再使用余弦相似性进行相关性分析,从而实现目标的准确分割。(4)多维特征融合与SVM的行为识别算法。首先,针对银行金库内的相机布局以及工作人员的着装特点,提出一种基于HSV和位置参数的头部、手部ROI(Region of Interest,感兴趣区域)筛选方法,再根据手部ROI和拆箱工具连通域之间的位置关系来进行拆箱工具ROI的定位。然后,提出一种融合LBP(Local Binary Pattern,局部二值模式)特征与HOG(Histogram Oriented Gradient,方向梯度直方图)特征的组合特征,并在此基础上提出一种基于区域分块的特征降维方法。该特征能够有效解决经典HOG特征忽略对角线梯度信息和组合特征维数多、信息冗余且提取时间长的缺点。最后,针对银行金库异常行为的分类需求,使用OVO(One-Versus-One,一对一法)类型的多分类SVM模型实现了异常行为的分类。综上所述,本文根据银行金库人体异常行为识别的技术要求,研究了相机调度算法以及视频分析算法,设计了基于多源相机的银行金库人体异常行为识别系统。系统采用海康威视筒形摄像机和云台摄像机作为视频采集终端,以海康威视硬盘刻录机和Dell高性能服务器作为存储单元和平台主体,进行硬件平台的搭建;本文基于Visual Studio软件平台设计了系统软件,主要包含用户登录模块、自动运行模块、手动测试模块、数据管理模块,并完成了各模块间的调度与管理。经过实际场景试验验证得到:本文研究的基于多源相机的银行金库人体异常行为识别算法能够有效地识别异常行为,两种异常行为的漏检率均小于0.5%、过检率均小于5%,达到了异常行为识别的性能指标且系统软件运行稳定,满足生产需求。
其他文献
图像融合是一种图像增强技术,通过将不同类型的传感器获得的图像组合起来,从而生成具有丰富信息和鲁棒性良好的融合图像,以便后续的图像处理。图像融合技术广泛使用在军事、遥感、安全监控和医学图像等领域。融合方法设计的关键是高效的图像信息抽取和合适的融合规则,并且要避免人工因素对融合结果的影响。传统的图像融合算法基于手工设计融合规则,算法复杂且运行速度慢,泛化能力及鲁棒性较差。随着深度学习在图像融合上的应用
获取大型的带注释数据集是非常昂贵的,需要从现有标签的数据集到未标记的数据的转移过程。然而,特定应用程序相关的数据通常与公开可用的数据集不同,因为这些特定的数据是来自不同的领域。虽然域自适应在利用源领域的标记数据来学习未标记目标领域的精确分类器方面已经取得了巨大的成功,但是这些域自适应算法都是在源域与目标域具有相同类别,利用标签丰富的源域信息对标签稀少且分布相似的目标域数据进行迁移学习。然而,由于现
随着中国传统文化逐渐走向世界,在数字化平台传播、宣传、弘扬中国非物质文化遗产也成为了学界和产业界共同努力的目标。因此,以中国传统文化、传统艺术、非遗文化为主题的应用程序层出不穷。而江苏宜兴的传统紫砂文化在数字化平台上一直处于发展的初期,其界面以图文介绍和商品交易为主要功能,界面的视觉设计也显得相对简单。在以文化传播为主要功能的应用程序案例的借鉴下,在图形化界面和动画交互界面的发展现状下,论文试图通
专利文本记录了大量的科技成果信息,受到了人们的高度关注。随着互联网的快速发展,专利文本数量不断增多,如何从纷繁冗杂的专利文本中高效地抽取其中关键特征一直都是自然语言处理的基础研究问题。然而,现有的面向专利文本的特征抽取还未取得十分令人满意的效果,对专利文本特征抽取的准确度需进一步提高。针对以上问题,论文提出一种无监督的融入公共知识的TextRank专利关键词提取模型,该模型有效地利用了先验公共知识
随着我国汽车制造和智能交通领域的发展,汽车智能化水平逐年提升。在汽车价格平民化与道路条件标准化的背景下,汽车已成为人们工作和生活中的重要工具。然而,汽车的大量使用也产生了一系列的负面影响和安全隐患,例如上下班高峰严重的交通堵塞,频发的交通事故等。如何通过安全辅助驾驶系统预防和减少交通事故的发生成为了学界日益关注的核心焦点。其中,基于双目视觉的障碍距离检测和车道线检测是该领域的热点问题,本文设计开发
伴随着科技的进步与计算机视觉技术的飞速发展,基于深度学习的目标检测技术得到了越来越广泛的应用,在各个领域都展现出蓬勃生机。与此同时,也出现了越来越多样化的数据形式,这给目标检测任务带来了难点。可见光单模态数据在部分特殊情况下提供的信息不够充足,基于可见光单模态图像的目标检测任务可能会出现准确率下降的问题,然而越来越多样化的数据形式给这个问题带来了转机。使得可以通过对不同模态的图像数据进行融合的方式
问答系统在生活与工业中有着广泛的应用,比如智能客服、智能音箱等。但目前的问答系统大都是静态的,一旦训练并部署后,无法再进行知识更新,用户与问答系统的交互语料也没有得到充分利用。即使获得了交互预料,但由于深度神经网络的灾难性遗忘特性,直接使用获取的新交互语料数据训练模型,会导致模型在之前数据上的表现变差。针对以上问题,本文构建了持续学习问答系统框架,处理并存储用户交互信息,并提出了持续学习的关系抽取
PCB(Printed Circuit Board,印刷电路板)是电子产品的核心部件,广泛应用于现代社会的各类行业,市场需求量广大。PCB上元器件的缺陷检测是PCB生产的必经环节,而电子元件小型化、高集成化的趋势以及SMT(Surface Mounting Technology,表面贴装技术)的发展使得PCB上贴装的元件密度更大尺寸更小,传统人工检查的方式已无法满足工业上对于检测精度和速度的要求。
随着中国影响力的扩大和中华文化的传播,全球各地出现“汉语热”的风潮,越来越多的国际友人开始学习汉语。其中,来华留学生对于汉语学习有着必然需求,语言是交流的基础,而在实际生活中,来华留学生存在因语言不通、交流障碍而导致的留学生活体验差等问题。留学生承担着传播中华文化,扩大中国影响力的作用,因此,留学生汉语学习体验需要设计师的深入研究和实践。在本课题以情境认知理论为理论基础,首先对情境认知理论和用户体
不同的线条样式能传递不同的情感,探究线条及其衍生形式的情感表达模型能够揭示影响情感表达的根本因素,发展更多情感表示形式,并促进情感表达软件的开发与人工智能对不同表达形式的情感识别。本文的工作分为以下四个方面:1.探究线条不同样式与情感之间的映射关系。为了探究不同样式线条的情感表达,编写程序创建了87种样式的静态水平线条,采用27个情感效价词汇与2个情感唤醒度词汇,招募测试者进行线上测试,为每种样式