基于多特征融合的行人检测算法研究及应用

来源 :江南大学 | 被引量 : 0次 | 上传用户:huimin0609
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测作为计算机视觉研究领域的一项关键技术,在智能监控、车辆辅助驾驶、运动分析与人机交互等领域有广泛的应用价值。但由于姿态、穿着、尺度、光线的变化以及相互遮挡等复杂场景的影响,行人检测仍是一个有挑战性的问题。融合多个特征能加强人体特征表达、提升行人检测算法性能。本文针对多特征融合、候选区域的提取、行人尺度多样性等问题以及行人检测算法的应用进行了研究,主要研究工作如下:(1)针对结合方向梯度直方图(Histogram of Oriented Gradient,HOG)和局部二值模式(Local Binary Pattern,LBP)特征的行人检测算法采用滑动窗口策略搜索时扫描区域过大、计算复杂导致检测速度慢的问题,提出了一种目标候选区域定位的行人检测算法。首先采用选择性搜索算法对目标区域进行定位,并将候选区域的长宽比限制在一定范围内以筛选无效窗口;针对LBP算子只考虑差值符号特征、过于简化纹理结构的问题,引入完备的局部二值模式(Completed Local Binary Pattern,CLBP)加强纹理特征的表达能力,考虑到HOG和CLBP特征维数过高对分类器识别能力的影响,分别经主成分分析(Principal Component Analysis,PCA)降维后串联融合;最后在支持向量机(Support Vector Machine,SVM)训练时引入困难样本挖掘过程,使模型训练更加充分,进而降低误检率。在INRIA数据集上仿真结果表明,所提算法平均漏检率比原算法低了3%,检测速度提高了两倍以上。(2)针对现有SSD(Single Shot Multi Box Detector)网络由于深层特征感受野大,提取的目标较为抽象,缺乏细节信息,导致在应用于行人检测时,小目标行人检测性能不佳的问题,提出了一种结合反卷积方式改进SSD模型的多尺度行人检测框架。首先采用反卷积操作对深层特征上采样,引入上下文信息,然后与浅层特征融合后用于网络预测,预测时添加了包含Conv3_3特征信息的网络层以加强小目标行人检测能力,网络预测层由六层加至七层;针对原SSD算法中多尺度特征层生成默认框时部分纵横比不适合行人的情况,重新设计默认框的长宽比,并单独设置75×75这一特征层的尺度。仿真实验结果表明,所提算法在VOC数据集上准确率比原算法提高了3.2%,单张图片检测时间为0.028s,在Caltech数据集准确率比原算法提升了2%,单张图片检测时间为0.032s,满足实时性要求。(3)为验证本文所提算法在现实场景中的应用性,在本文提出的行人检测算法的基础上,采用PyQt5平台设计并实现了一个行人检测系统。该系统由一个登录界面和工作界面组成,工作界面包括初始化、图像采集、行人检测、日志记录以及可视化交互五大模块,系统利用本文第四章提出的行人检测算法作为检测模型,对随机采集的图片、离线视频数据、实时视频数据进行检测。通过现实场景的实验数据表明,该系统能有效检测到图片和视频画面中的多个行人目标,满足一般场景下的检测要求。
其他文献
传统的ELM优化算法关注的焦点都在隐含层输出权重上面,忽视了隐含层输入与输出的分布方式,针对这一容易令人忽视的方向,本文提出了基于高斯分布优化仿射参数的极限学习机模型,具体研究内容如下:针对让隐含层输出强制服从均匀分布效果不佳的问题,提出了在高斯分布下优化仿射变换的极限学习机(Extreme Learning Machine for Optimized Affine Transformation
论文针对目前乘坐扶梯经常出现的事故和危险行为,使用图像处理方法对扶梯上携带宠物、推车、抱小孩、攀爬等异常行为进行实时检测预警,在此基础上开发出智能监控系统,对扶梯场景进行实时检测分析和在线报警,保护乘客安全。论文主要进行了以下几个方面的研究:第一,针对扶梯入口、出口出现的快速运动导致的目标运动模糊问题,提出基于生成对抗网络的去运动模糊算法。使用生成对抗网络对模糊图片进行重构,以降低运动模糊的影响。
在当今社会的各个领域中,智能化是未来发展的大趋势;生活中的各类物联网产品、汽车飞机的无人驾驶技术、雷达系统、设备结构监测、基础建筑的安全检测以及工业生产自动化及其机器人系统都需要更加智能的感知技术;这就对传感器的感知精度和速度提出了更高的要求,且需要覆盖范围更广、覆盖密度更高的传感器网络。以工业生产中智能机器人为例,智能机器人需要代替人类在极端的环境下进行大量的危险性高、重复率高、难度大以及长时间
近年来,工业以太网技术促进了工业控制系统(Industrial Control System,ICS)和信息技术(Information Technology,IT)网络的集成,使得ICS信息化程度不断加深。信息网络集成虽然提高了系统生产效率,但也带来了更多新的信息安全问题。同时系统中设备节点数量众多且拓扑结构呈现分布式的趋势,传统中心化信息控制的方式中的性能瓶颈和安全问题将会日益明显。就关键基础
表面等离子体共振(SPR)传感器是一种免标记、高灵敏的光学传感器,它的原理是当入射光引起金属与介质界面的SPR时,可获得与共振波长一一对应的介质折射率。目前商用的SPR传感器均为棱镜耦合型,虽然灵敏度很高,但体积庞大,价格昂贵。随着纳米制备工艺的成熟和人们对传感器小型化的迫切需求,光栅耦合型SPR传感器应运而生。目前的光栅耦合型SPR传感器存在灵敏度较低,无法检测不透明溶液的问题,这限制了此类传感
随着车辆数量日益增多,道路交通问题密切影响着日常生活。交通监管部门需要通过视频数据实时监控路况信息。无人机技术的快速发展,使从空中视角获得数据成为可能。无人机能提供更加广阔灵活的视角,包含更多的信息,同时也能胜任长距离监控。在无人机场景下通过图像和视频对车辆目标进行跟踪,也有望成为交通监控的新方式。无人机视角下跟踪场景不够稳定,目标容易产生大幅度的形变,也可能被环境所遮挡。无人机的硬件平台也决定了
基于视觉的微小振动放大技术是一种通过处理图像时空信息,放大微小但重要变化的技术。机器视觉振动放大技术被用来揭示肉眼难以察觉微小变化,在工程结构模态识别、医疗心率检测,故障损伤检测等领域有重要价值。论文对视频微小振动放大技术进行详细的分析和研究,从多角度对微小振动放大算法进行优化,并将优化后的算法应用于非接触式心率检测,具有较好的工程应用价值。论文针对微小振动视频中存在大运动干扰,导致视频放大结果出
自NB-IoT(Narrow-Band Internet of Things,窄带物联网)技术提出以来,各项技术标准逐步得到完善,当前已经成为低功耗广域物联网中最具潜力的技术之一。在与各领域逐渐实现深度融合的过程中,NB-IoT设备将被大规模部署,考虑到NB-IoT系统的180KHz有限频谱资源,海量设备接入时将有可能发生资源竞争现象,使系统出现接入拥塞,从而导致网络接入量降低、资源浪费等问题。因
人脸表情识别是一项极具挑战的模式识别任务,在例如医学研究、交通安全、公共安防、刑侦审讯、影视娱乐等领域有重要的现实意义。对于可预见的未来世界中的高效人机交互,正确快速的识别用户表情也是一项必不可少的技术。近十年来,表情识别的研究进度突飞猛进,从小数据的室内研究转向了具有更大数据量的室外研究,研究方法也从传统方法变革为深度学习方法。深度表情识别的主要难点有以下几点:缺乏有效训练数据、存在大量表情无关
聚类是在无标记的条件下将数据分组,从而发现数据的天然结构的一种技术。聚类在数据分析中扮演了重要的角色,它可以发现数据的潜在结构、对数据进行自然分组或压缩,是人工智能的重要分支之一。2019年,Nie Feiping等人在ACM SIGKDD上提出了指定k个聚类的多均值聚类算法(a multiple-means clustering method with specified K clusters,