复杂机场监控环境下的行为检测

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:qq14203853
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉和模式识别领域,动态场景下的行为检测和识别是最受关注的研究方向之一,它具有很广泛的应用前景。但是现今大多数的研究都是针对于简单环境的,如果将现有的方法直接应用于复杂场景下,检测和识别效果不佳,所以本文提出使用拆分模型来提取复杂场景下的目标行为,从而提高行为识别率。本文主要是针对复杂机场环境下的行为检测。机场视频量大,活动对象多而且复杂,互相遮挡比较严重,所以本文主要是针对靠近摄像头区域的人类行为,对于远离摄像头,动作细微的行为不进行检测识别。本文中提取运动人体区域使用的是帧间差的方法,提取对象特征使用的是兴趣点的方法。所谓的兴趣点就是在整个视频段上像素变化的局部最大值,这些兴趣点能反映行为的局部特征,而这些局部特征的组合就能区别不同的行为。兴趣点的提取采用Harris角点的方法。鉴于上述第二段所讲述的机场视频的特征,本文的研究重点在于如何从复杂环境下提取目标行为的特征,即从整个场景下的兴趣点集合中获取目标行为对应的兴趣点集合。解决这个问题的方法是采用Graphviz工具和k-means聚类方法,在人工交互的情况下,提取最贴合目标行为的特征。通过这个拆分过程可以训练得到一个拆分模型。本文中每个行为视频的描述采用的是bag-of-words的方法,利用所有训练样本提取的cuboids特征聚类生成visual words,则每个行为视频可以表示为各类visual word出现概率的一个向量,然后利用SVM训练得到行为模型。测试样本进行测试的时候首先提取特征,然后将特征输入拆分模型判定拆分与否,得到该样本的拆分树状图,然后对所有叶子节点提取cuboids,并利用bag-of-words的方法描述节点视频,然后输入行为模型进行行为分类,取得了不错的识别效果。通过实验,本文中所提出的方法取得了85.366%的正确率,充分说明了引入拆分模型对识别率提高的关键作用。
其他文献
Web图像搜索是一门通过抽取网页中存在的图像信息并建立索引供用户查询的技术。基于关键词的图像搜索是指从网页中抽取出图像的文字性语义描述,然后对其进行加工整理并建立索
由于图像增强型CCD (ⅡCCD)相机具有高信噪比、高增益、能在微光条件下稳定的工作等优点,在遥感和军事中具有广阔的应用前景。但是,由于ⅡCCD相机成像不可避免存在光学模糊、噪声干扰等质量退化过程,以及高分辨率图像数据传输,因此人们希望研究不完全采样下的遥感图像复原重建问题。目前,结合稀疏表示和正则化方法的图像复原理论和算法研究是国际研究热点。本文在综述当前压缩感知和图像复原技术的国内外研究现状的
随着信息化技术和经济全球化的飞速发展,企业资源计划ERP(Enterprise Resource Planning)被广泛的应用于各个行业,是计算机技术与企业管理技术结合的杰作,代表了当前集成化企
分布式事务系统的优点决定了分布式系统在实际应用当中得以广泛应用,但是它的结构复杂等缺点也导致了它容易产生故障,为了保证能够在站点失败的情况下也能维持事务的ACID四种
随着信息化的高速发展,如何更高效的取得及利用信息,是很多商业领域面临的问题之一。数据集成及共享技术的出现使得这一问题在某种程度上得到解决。进行数据集成的关键问题是
网络隐蔽通道是单机系统的隐蔽通道在网络环境下的扩展,是信息安全领域的一个重要分支。它是一种违背系统的安全策略利用网络中本来不是用来传递隐蔽信息的资源进行信息传输
计算机与互联网的普及使得信息技术高速发展,促进了社会进步与人类文明。网络安全问题已成为制约科技发展的瓶颈,传统的防火墙技术作为被动防御不能积极主动对抗攻击,入侵检
基于研究人类认知过程而迅速发展起来的人工神经网络,已演化成诸多学科,但是它的中心问题依旧是研究机器学习方法和学习机器的构造问题。它是以研究人的智能行为为前提的模拟
嵌入式系统是以应用为核心的计算机系统,是计算机市场中增长最快的领域。嵌入式系统一般采用片上高速静态随机访问存储器SRAM(Static Random Access Memory)与片外低速动态随
在科学研究和实际应用中,分辨率是表征图像观测水平的一项关键性能指标。但是,伴随着科技信息的迅速发展,某些应用领域和科研工作中对图像分辨率的需求越来越高,因此需要改进