基于卷积神经网络的实时行人检测

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:pausecn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算科学和硬件设备的不断发展,计算机视觉也取得了飞跃式的发展。从最初的需要消耗很多时间精力人工设定规则提取特征的传统图像处理方法到现在利用深度学习自动学习有用特征的方法,计算机视觉可谓是向前跨了一大步,就单在目标检测这一项任务来看,检测一张图片中的目标所需要的时间从几百毫秒减少到十几毫秒,同时检测精度也从百分之二十几增加到百分之七八十。也正是因为计算机硬件的高速发展,计算机视觉可以广泛的应用在现实项目中,比如人脸验证、自动驾驶、智能视频监控等领域。在实际检测场景中,行人检测具有背景信息复杂,目标小等特点,导致检测难度相对一般的目标检测来说更加困难。因此,在实际场景应用中难以在保证时间效率的前提下提高检测的准确率。为解决上述问题,本文提出了一些基于卷积神经网络的改进方法。本文提出了基于并行多种感受野特征提取的网络用于实时行人检测。首先,由于实际场景图片中大多数为小目标,所以本文在特征提取的时候进行了一些改进,利用多个不同大小的感受野代替单一感受野的方法,使得网络在特征提取的时候不是使用单一感受野,而是并行的使用多个不同感受野的卷积核提取行人目标更加丰富的多层次特征,有利于提高行人检测的精度。另一方面,每个卷积层中都有很多特征层,但并不是每个特征层对行人目标的检测都具有相同的作用,所以本文提出利用一个小型网络对特征层进行特征重标定,挑选出对行人检测有用的特征层,同时抑制那些对行人检测没有用的特征层。最后,本文提出将多层特征融合的策略提升行人特征的丰富性。由于浅卷积层可以提取图像的颜色、纹理等低层特征,而深卷积层可以提取更加抽象的语义特征,本文提出利用转置卷积的方式对两种特征进行融合,充分利用不同角度提取到的行人特征,提高行人检测的准确率。本文主要在PASCAL VOC数据集上做实验,实验验证了每部分的改进方法都能对行人检测带来效果的提升。本文改进之后的基于VGG的网络最终准确率达到了75.8%,速度上达到了37帧/秒,而本文提出的轻量级网络的最终准确率达到了71.8%,速度为71帧/秒。
其他文献
<正>眼睛是人类心灵的窗口,情感表达的途径;眼睛在人体外貌美中起着举足轻重的作用。而眼睑是皮肤组织中最薄和最柔软的部分,所以皮肤的皱褶老化也最容易在眼睑部位显现[1]。
近年来,我国的公路工程得到了较多的建设,其中,预应力混凝土是主要的结构类型。在本文中,将就后张法预应力砼桥梁施工技术应用进行一定的研究。
中国革命的纷飞战火锤炼了杨沫作为马克思主义者的革命之心,也造就了她文学创作上的别样神魂。杨沫自觉或不自觉地从俄苏文学中汲取营养,走出“亭子间”,走出刻板的“写实主义”
为探明国红苹果园中幼龄树和成龄树叶片微量元素含量的年周期变化规律,在河北省农林科学院石家庄果树研究所苹果标本实验园内,分别采集了国红苹果幼龄树和成龄树叶片,通过VISTA
本文利用CNKI数据库中的2009—2015年国内高校档案利用的研究成果,从高校档案利用的意义和作用、特点、现状、发展趋势等几个方面进行了数据统计和主题分析,提出了高校档案利
美丽而神秘的岷江上游两岸,生活着一个十分悠久古老的民族——羌族。他们主要聚居在汶川、茂县、理县的高山峡谷之中。勤劳勇敢的古羌人,不仅以其独特精湛的建筑技艺闻名于民
价值观是人的精神文化系统中最深层次的相对稳定而起主导作用的成分,是人的精神心理活动的中枢系统,它支配着人的各种行为的选择。价值观的混乱导致吸毒行为的产生,价值观的扭曲
本文从无线局域网的概念、特点、标准等几个方面简要介绍了无线局域网技术及无线局域网网络覆盖方案的设计思路,从运营商级WLAN组网入手,重点分析AC+AP多种组网方案及相关流程
期刊
采用盆栽方式研究了不同浓度的尿素、硝酸钙和硫酸铵以及硝酸钙和硫酸铵的不同配比对韭菜产量、硝酸盐含量和营养品质的影响。结果表明,3种肥料中,尿素可提高韭菜产量和可溶
贵州省优质特色农产品众多,具有发展生态农产品实现产业脱贫、扶贫的良好基础。“互联网+精准扶贫”成为扶贫开发工作的重要抓手,生态农产品与电商精准扶贫耦合是当前电商精