基于深度学习的视频行人检测

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:xgzyf2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测技术是计算机视觉、图形图像处理方向的关键技术之一,在城市智能交通、虚拟现实和人机系统交互等方面有着不可估量的应用价值和前景。基于视频图像的行人检测算法和基于静态图像的行人检测算法是行人检测的两大研究重点,本文主要研究基于视频图像的检测算法。论文首先介绍行人检测技术的研究背景和意义,并从提取感兴趣区域(Regionsof interest,ROIs)和行人目标检测算法两部分出发,分析、归纳了每个部分涉及的技术与算法。然后,论文介绍了传统的行人检测算法原理和基于深度学习的行人检测算法原理。在传统的行人检测中,总结了从提取图像ROIs到训练ROIs特征再到特征分类三个步骤;在深度学习行人检测中,归纳了从数据集到模型选择、模型测试、模型优化,再到模型检测的自底向上的检测过程。接着,基于行人检测算法的基本理论,本文提出了两种改进算法。(1)论文研究了共生梯度直方图(Co-occurrence Histograms of Oriented Gradients,CoHOG)特征,并从特征提取的角度改进了CoHOG特征。论文先介绍了CoHOG原理,并指出CoHOG未能考虑梯度幅值信息以及特征计算量大导致的检测速度较慢的不足之处。为了解决这个问题,论文提出了一种加权幅值CoHOG(Weighted Amplitude Co-occurrence Histograms of Oriented Gradients,WA-CoHOG)特征和基于弱分类器排序算法构造的链式级联分类器。WA-CoHOG特征利用加权函数引入梯度幅值信息,通过分割图像得到每块的小特征,最后把若干小特征输入级联分类器计算获得分类结果。仿真实验表明,WA-CoHOG特征能充分利用梯度的大小和方向信息,从而提高行人检测精度;级联分类器能有效缩短检测时间。本文提出的算法在得到较高分类精度的同时能保证较快的检测速度。(2)论文研究了基于图文时序的视频行人检测算法,针对视频行人检测中无法提取和利用行人图片的时序和上下文信息的缺点,提出改进的图文时序(Improved Graphics Timing,IGT)深度学习的视频行人检测网络。该网络使用多上下文抑制的方式,按降序对所有建议框的检测分数排序,得分超过阈值的高置信建议框会被保留,而得分低于阈值的低置信建议框会减去一个微小值进行抑制。同时,利用信息向量传播,计算所有像素点的光流并得到边界框的平均光流向量,根据平均光流向量将具有相同检测分数的框坐标传播到相邻帧以抑制假负检测。最后网络通过端到端的训练,有效提高了检测精度。
其他文献
本文基于20世纪90年代起中国企业开始寻求在境外资本市场上市及2010年后几次私有化浪潮卷起的现实背景,结合委托代理理论、税盾价值理论、交易成本理论、信息不对称理论及价
随着社会的发展人民经济水平的提高,大自然的资源不断被消耗。人类生产活动排放的废气废水导致温室效应和城市热岛效应愈加严重,地球的气候逐渐恶化。为了今后人类的持续发展
背景和目的帕金森病(Parkinson’s disease,PD)作为一种与年龄相关的仅次于阿尔茨海默病的第二大神经系统退行性疾病,其发病率在85岁之前一直呈上升趋势,有证据表明年龄的增
背景和目的脑梗死是脑血管疾病中较为常见的一种表现形式,包括缺血性脑梗死和出血性脑梗死两种类型,前者较常见,约占脑梗死患者的85%,致死率高,且大多数患者后期会出现不同程
金融不稳定简单来说就是金融系统不能有效的完成资金的优化配置、出现运行风险的状态。对金融脆弱性研究始于美国经济学家Minskey率先提出的“金融不稳定假说”,他认为西方金
[目 的]系统性红斑狼疮(systemic lupus erythematosus,SLE)并发认知障碍较为常见,影像学研究也发现认SLE患者存在颅脑微病灶或脑区功能异常。本研究假设SLE患者的认知功能损
对于循环和非循环压缩映射的研究是非线性泛函分析的重要组成部分,在数学的各研究分支中都有较为广泛的应用.本文主要研究了广义度量空间中关于循环和非循环压缩映射的不动点
目的探究酪氨酸激酶BTK在心脏纤维化发生发展过程中的调控的作用并探索其具体机制,丰富心脏纤维化的发生机制,为高血压或瓣膜病等心肌损伤相关疾病的治疗策略提供新的潜在靶
溴氰菊酯因具有良好的生物活性和环境相容性而被广泛应用于公共卫生、兽医学、尤其是农业领域,使其成为全球广泛使用的拟除虫菊酯之一,导致了全球性的抗药性,而且与其它类型的杀虫剂之间存在广泛的交互抗性。因此,深入研究溴氰菊酯的抗性机理具有非常重要的意义。Keap1-Nrf2-ARE通路是目前已知的最重要的内源性抗氧化应激通路之一。Nrf2转录因子在活性氧刺激下会与构象发生改变的Keap1蛋白解偶联,移位至
由于惯导系统结构复杂,误差参数辨识试验往往不能取得良好的效果,需要对试验过程进行设计。单目标试验设计只能优化试验时间,试验精度中的一个。多目标试验设计同时优化两者,并提供一个方案集合,有利于试验的执行。本文研究惯导平台系统,采用改进的算法解决了误差参数辨识的多目标试验设计问题。首先建立试验设计所需要的平台系统的误差模型。简化陀螺仪的模型,选取21个误差参数。简化加速度计的模型,选取9个误差参数。基