基于深度学习的行人自遮挡检测及应用

来源 :南京邮电大学 | 被引量 : 4次 | 上传用户:wang5632968
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,行人检测成为计算机视觉领域中的研究热点。行人检测可被定义成检测输入的图片或者视频帧中是否存在行人。它为自动驾驶、视频监控及人体行为分析提供技术支持,最近还用于受害者营救、航拍图像等新兴领域,具有广泛的应用场景。本论文主要以Faster R-CNN(Region-Convolutional Neural Networks)目标检测算法为基础,针对行人的部分遮挡问题,重新设计其网络结构,使其检测性能得到提高。本文主要包括以下内容:论文首先对目前行人检测的研究难点及国内外现状做了总结,对基于机器学习的传统行人检测方法以及基于深度学习的目标检测算法做了调研和梳理。其中传统方法中最经典的是基于HOG+SVM(Histogram of Oriented Gradients+Support Vector Machine)的行人检测算法,基于深度学习的目标检测算法主要分为SSD(Single Shot Multi Box Detector)、R-CNN系列和YOLO(You Only Look Once)系列这三大类。接着通过综合考虑算法的检测性能与速度,采用自建的遮挡行人数据集训练了一个基于Faster R-CNN目标检测框架的行人检测算法,再用测试集对Open CV(Open Source Computer Vision Library)中自带的基于HOG+SVM的算法模型与训练好的Faster R-CNN模型进行实验,并对比实验结果。实验结果显示Faster R-CNN模型的检测效果明显优于传统的检测方法,通过深度卷积神经网络学习到的特征更具有鲁棒性。最后,针对遮挡行人检测,对Faster R-CNN模型的网络结构作出修改。(1)改进Faster R-CNN的特征网络,选用Res Net(Residual Network)结合SENet(Squeeze-and-Excitation Networks)来进行特征提取;(2)重新设计RPN(Region Proposal Network)网络中的Anchor的宽高比,使其更加容易地匹配到行人;(3)针对行人易出现自遮挡及环境遮挡的问题,在训练集中添加了行人较为密集的数据,同时采用Repulsion Loss提高模型对被遮挡的行人的检测能力。最终结果显示改进的Faster R-CNN模型在检测时间小幅度增加的情况下,检测性能有了较大幅度的提升。
其他文献
日本饮食精致、口味清淡,讲究就餐礼节、食物的形与色、食器和用餐环境等。从这些特征可以看出日本饮食代表一种纤细精致的文化,反映出日本人的审美意识以及严格的上下级关系
城市形象宣传片具有强烈的视觉冲击力和影像震撼力,能更好地展现城市形象,对内培养本地不同社会群体对城市的认同感和归属感,对外吸引资源以促进城市发展。自1999年以来,重庆
伴随着国内市场经济开放程度的不断深化,国内的企业发展也迎来了一个新的春天,大量企业开始加入到跨国经营、投资的行列当中,并取得了良好成效。但从原先的对内经营模式开始
资本下乡可以盘活原来分散低效的农业,促进城乡融合发展,是国家快速城镇化的必然选择,更为解决"三农"问题提供了新的机遇。要避免"冷农民"现象产生,就要尊重经济规律,发挥市
目的:利用腹腔注射雨蛙素法诱导小鼠胰腺急慢性炎症模型,通过组织病理学切片观察胰腺导管腺体(pancreatic duct glands,PDG)及胰腺导管上皮细胞的变化,并利用免疫组化等实验
能源紧缺、土地供需矛盾、生态环境恶化等现象是当前限制我国城市可持续发展的严峻问题。交通系统的高能耗,大规模占地,高污染等现象更是尤为突出。虽然,目前倡导的新能源汽
本文以春秋战国时期楚国官制为研究对象。依据马列主义国家理论,结合古代历史文献,以王国维“二重证据法”为主要研究方法,充分运用近年来发现的地下考古资料,全面、系统、深
针对双渠道供应链低碳减排、低碳宣传与品牌策略问题,构建微分博弈模型,运用汉密尔顿-雅可比-贝尔曼方程分别求得集中决策和Stackelberg博弈下的低碳减排投入、低碳宣传投入
以东营凹陷北带东部沙河街组三段、四段近岸水下扇为例,应用多种方法求取近岸水下扇有效储层物性下限与埋藏深度的定量函数关系,以此为基础研究了近岸水下扇不同亚相的孔隙度随
科学技术的发展促使了科技产品的更新换代,目前市面上已经出现了各种各样的考勤设备,这些考勤设备包括打卡式考勤机、指纹识别考勤机和人脸识别考勤机等,主要是针对一些企业