基于结构输出回归的人体检测

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:bamboo007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体检测技术是计算机视觉领域的重点和难点,人体检测在公共安全、人机互动、灾难救援等方面已被广泛应用。但是由于人体检测与其他目标检测相比存在非刚性、姿态复杂、外观不统一等较难解决的问题,人体检测技术仍然存在很大的研究空间。目前对人体检测的研究较多侧重于基于滑动窗口扫描的二值分类器的检测方法上。这种基于分类的人体检测技术通过大量样本图像训练分类器,使用一定步长的窗口对整幅检测图像进行从上到下从左到右的滑动窗口扫描,逐个窗口提取出特征信息进行分类判别。本文首先对目前比较流行的基于分类方法的人体检测技术进行了分析,以BP神经网络、Adaboost、SVM分类器为例介绍了相关算法步骤。针对基于分类的检测方法存在产生的检测窗口数量庞大,对遮挡人体检测效果较差等问题,提出了基于结构输出回归的人体检测方法。基于结构输出回归的人体检测方法使用了一种结构化多输出回归的算法——SOAR算法。该算法改进了传统多输出回归算法,把多输出向量中的部分输出分量作为辅助特征参与进回归模型训练,以简单支持向量回归的结果作为辅助特征的初始值。同时该算法还对输出结构做出改善,使输出各个分量之间存在彼此依赖关系,使最后的结果更加符合结构特点。本文使用含有6个分量的向量作为回归检测的输出,这些分量中2个用来指示训练图像中是否包含人体图像和人体图像所占比例,其他4个用来代表人体目标在图像中的选区坐标位置。本文提取出图像的HOG特征、旋转不变LBP特征和颜色直方图特征作为混合特征输入向量,以结构输出回归程序和目标检测程序进行训练和检测。在检测过程中本文将检测图像以网格形式划分为若干48×96像素的窗口。用回归出的人体目标位置和对应的窗口坐标结合,标记出检测图像中人体所在位置。改善滑动窗口扫描方法大量扫描窗口导致的检测速度低的问题,同时该方法采用结构输出回归预测的手段来提高在人体严重遮挡情况下的检测率。最后本文使用基于结构输出回归的人体检测方法在完整人体、轻微遮挡人体、严重遮挡人体三种情况下进行检测,分析了检测结果并对目前实验中存在的问题进行了总结。
其他文献
互联网信息资源日渐激增,如何高效地从中取出有用信息成为学术界的一个重要研究方向。信息抽取是从半结构化或非结构化的数据中抽取出事实信息的过程,它需要对信息进行一定程度
随着半导体制造工艺的进步,可编程门阵列(Field-Programmable Gate Array,FPGA)迅速发展,单芯片上可供快速实现的逻辑功能越来越多,基于FPGA的可重构计算在高性能计算甚至是
基于物理的流体模拟一直是计算机图形学中的热门研究领域之一。其中,火焰模拟因其重要的应用价值,更是成为了人们研究的重点。但对火焰的研究往往集中在视觉渲染方面,在听觉渲染
随着信息技术与计算机技术的快速发展,关系数据库以及以关系数据库为核心的应用系统得到了广泛的应用,这样使得关系数据库的安全问题变得日益严重,相关的安全课题得到了广大
行人检测是计算机视觉领域的一项重要研究内容,在视频监控,人数统计,入侵检测,辅助驾驶等领域有着广泛的应用前景。最近十多年间,大量的行人检测方法被提出,用于检测直立行人的全身
相比传统的标量传感器节点,多媒体传感器节点能够处理和发送更加复杂、数据量更大的多媒体信息(例如图像、视频、声音等),从而使得多媒体传感器网络可以满足更加复杂的应用需求。
数据模型是XML数据管理研究领域的核心问题之一,用来给出XML数据以及数据上操作的精确语义,是XML数据查询处理和优化的基础。目前数据的不确定性普遍存在于经济、军事、物流、
农业是支撑国民经济建设与发展的基础产业。如何利用有限的农业资源,借助先进的科学技术手段来提高生产效率、环境效益和经济效益已经成为农业领域的研究重点及热点。  近
人脸识别覆盖了计算机科学、数学、认知科学、神经科学以及心理学等多门前沿学科,是模式识别理论的一个典型应用,更是一个具有挑战性的研究课题。目前已有的人脸识别算法在可