基于区域卷积神经网络的行人检测问题研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:zhuav
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测一直是机器视觉领域的研究热点和难点,其在智能监控、智能交通和智能机器人等人工智能领域应用越来越广泛,比如在交通安全领域,利用行人检测技术可以预判前方及附近是否有行人,若发现则立即采取紧急制动,这样能够有效避免车辆碰撞行人,减少人员伤亡。行人检测不同于普通目标检测,行人属于非刚性目标,在现实生活中,行人穿着各式各样、人体姿态千变万化、所处背景复杂多变、光照不足以及行人之间相互遮挡等情形给这项工作带来巨大的挑战。前人提出了许多有效的行人检测算法,其中最有代表性的是梯度直方图(Histogram of Oriented Gradient,HOG)特征,但其在更为复杂的背景环境下检测效果仍然不是很理想。近年来,深度学习重新进入人们的视角,其中深度卷积神经网络在模式识别方面更是取得了重大的突破,说明了其在特征提取方面的优越性。本文在充分研究行人检测技术以及深度学习尤其是深度卷积神经网络模型的基础上取得如下成果:(1)设计了基于区域卷积神经网络的行人检测系统。针对传统人工设计的特征提取复杂度高且难以有效表达复杂场景中的行人特征的问题,本文采用深度卷积神经网络模型来进行行人检测,该模型通过组合低层特征形成更加抽象的高层表示属性类别或特征,进而从样本中提取鲁棒性更强、更能刻画图像的特征向量。由于网络模型层次较深,需要训练参数较多,而人工标注行人的数据样本较少,为了防止训练过程中的过拟合现象发生,本文采用微调的方法训练网络。最后,通过多组实验的验证,与基于HOG特征的方法想比,该算法能够明显提升行人检测的准确率。(2)针对行人检测系统中采用选择性搜索算法(Selective Search,SEL)获取预选区域效率低下的问题,本文采用Edge Boxes算法优化了行人检测系统。预选窗口的获取对于行人检测系统至关重要,利用选择性搜索算法提取一张图像的预选区域需要花费2秒左右,这严重影响了整个行人检测系统的检测效率。当本文采用Edge Boxes算法提取预选区域时,虽然检测准确率没有明显的提升,但只需要耗费0.3秒的时间来提取一张图片的窗口,大大改善了系统的检测效率。(3)设计了基于快速区域卷积神经网络的行人检测框架。针对采用深度卷积神经网络进行特征提取难以保证实时性的问题,本文在网络模型中引入了感兴趣区域汇聚层(RoI Pooling Layer),通过该层模型只需要对原图像提取一次卷积特征,并将预选区域映射到特征图(Feature Map)中后,得到固定维度的特征向量。实验表明,使用该方法在保证一定检测准确率的情况能够极大的提升检测速度,改善了算法的实时性和适用性。
其他文献
飞行器航路规划作为飞行器智能控制的关键技术之一,是提高飞行器作战效能和实现飞行器安全可靠飞行的前提。航路规划技术是在综合各种约束条件下寻找一条从起点到终点的最优路
随着网络技术的不断提高和应用领域的不断普及,网络攻击等恶意行为已经严重威胁了计算机网络的安全,网络异常行为会导致网络流量异常,因此能够及时准确的检测出网络异常对于维护
低密度奇偶校验(Low Density Parity Check,LDPC)码是由Gallager博士提出的一种性能优良的线性分组码。它克服了其它很多纠错码的缺点,是目前发现的性能最接近香农限的信道编
随着移动互联网的发展,基于位置的服务(LBS)受到了越来越多的关注,导航定位是其关键技术之一。全球卫星导航定位系统(Global Navigation Satellite System,GNSS)包括美国的GP
矿井通信系统是提升煤矿安全管理水平,促进煤矿安全生产的重要保障。研究矿井通信理论,改进矿井传输技术和手段,对于提高煤矿安全保障水平具有十分重要的理论意义和现实价值。煤
随着物联网、云计算与大数据等新兴互联网技术的迅速发展,信息安全已成为当今我国信息驱动社会的一个迫切问题。传统密码学的安全性完全依赖于加密密钥的安全性,并且加密密钥
随着信息技术的飞速发展,生物识别技术受到了越来越多的关注。其中人脸识别技术是一个重要的分支,它与指纹识别、虹膜识别相比具有直接友好的优点。因此,人脸识别技术在信息安全
本论文的研究工作系国家自然科学基金项目“基于物体棱线线流场的三维物体运动估计与结构重建研究”(61165011)的一部分。视觉运动分析是计算机视觉领域的一个重要课题,主要研
随着后基因组时代的到来,生物组学研究深入发展,大量的生物网络数据涌现,有效地解析和分析这些网络数据是当前生物信息学的研究重点。网络模体是网络中一种有着不同局部结构特征
可分级视频编码(Scalable Video Coding,SVC),作为H.264/AVC视频压缩编码标准的扩展,可以提供一个单独的多层嵌套码流,通过抽取码流中的部分子码流,来满足网络带宽的限制以及