基于深度学习的行人检测与行人再识别技术研究及应用

来源 :浙江工商大学 | 被引量 : 1次 | 上传用户:huweiboweb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人再识别是指以存在非重叠视域的多摄像机网络所采集的视频为输入,利用计算机视觉技术进行行人匹配的技术,即以算法自动确认不同位置的摄像机在不同时刻拍摄到的行人目标是否为同一人。行人再识别在公共安全和刑侦工作以及图像检索等场景中有很高的应用价值,具有很重要的研究意义。行人再识别以行人检测为基础,通过行人检测获得图像中的行人位置。本文主要研究了基于RetinaNet的行人检测算法和Meta-SR结合身份识别嵌入网络的行人再识别两个方面的内容。(1)速度和精度不可兼得的局面一直是目标检测任务的瓶颈。Yolo等单阶段检测方法检测速度很快,但存在检测精度不高、召回率低以及对小目标检测效果不好的问题;Faster R-CNN等两阶段方法能解决单阶段检测方法检测精度不高和小目标检测效果不好的问题,但检测速度较慢。RetinaNet研究了单阶段检测器精度不如两阶段检测器的主要原因在于单阶段检测器存在严重的“类别不平衡”问题,导致分类器训练容易失败,并针对性地提出焦点损失函数来解决由过量背景而引起的“类别不平衡”问题。本文以RetinaNet为基础,针对行人检测的应用特点,进行了如下三个方面的改进:1)改进了网络结构,改变特征提取方式;2)引入通道注意力模块,更好地学习对行人检测有效的特征;3)针对行人特点设计预选框,以提升行人检测的效果。实验证明本文改进的RetinaNet对于行人检测具有明显的性能提升。(2)现有的行人再识别方法大多假设行人图像具有统一的尺寸,且有足够高的分辨率,它们通常将所有图像归一化到相同的大小后输入到识别系统,而忽略了实际场景中查询图像通常是高分辨率的,而行人候选库中的图像往往是低分辨率的。事实上,由于监控视频的画面通常比较模糊,分辨率也比较低,行人图像的各种分辨率共存和尺度不匹配问题一直存在于现实世界里。为了解决这个问题,本文研究了 Meta-SR结合身份识别嵌入网络的行人再识别,通过融合行人再识别网络和超分辨网络,在输入到再识别模块之前对行人图像的分辨率进行适当的提升,有效地解决了行人再识别系统中各种分辨率共存和尺度不匹配给识别系统带来的困难。
其他文献
【正】 文学理论家形成自己的文学思想,不管他自觉还是不自觉,总是以客观的文学创作、文学批评和欣赏的实践为基础的。但文学理论家在根据客观的文学实际形成自己的文学思想
经济战线是无产阶级专政下继续革命的一条重要战线。长期以来,在生产资料所有制的社会主义改造基本完成以后,经济战线还要不要继续革命,革谁的命,革命的主要任务是什么,依靠谁来革
目的 探讨解酒护肝饮对酒精性肝纤维化的防护作用。方法 肝组织切片的胶原纤维的测定。结果 损伤组肝原纤维含量高,肝纤维化明显与保护组和治疗组差异显著。结论 充分显示了该
【正】 十九世纪七十年代,以社会主义“改革家”自称的政治骗子杜林,抛出了一整套著作,从哲学、政治经济学到社会主义理论,对马克思主义展开了全面进攻,妄图用他臆造出来的所
结合武汉罗家湾大桥主墩双壁钢围堰施工过程,基于有限元分析方法,对深水钢围堰施工各阶段的结构受力特性进行了系统的计算分析,并指出了方案设计中应注意的问题,提出了针对性
现在,世界各地威胁食物安全性的事件屡见不鲜,我国的食品安全问题也十分严峻。研究食物中可能含有毒性的学问被称为“中毒学”或“毒理学”,中毒学与我们的日常生活有很大的联系,在饮食中发挥重要作用。本次翻译实践的翻译文本是《体中异物“毒”的科学》。本书内容是在中毒学的支撑下研究食物含有的毒性,其内容与科技翻译方向吻合。本次翻译文本句式结构复杂,而且笔者在翻译过程中发现,本次翻译文本中涉及到大量专业知识,如
【正】 毛泽东同志一贯主张要理论联系实际,要从我国实际出发,找出适合我国情况的前进道路。毛泽东思想就是马克思列宁主义普遍真理和中国革命实践相结合的产物。毛泽东同志
组胚是一门重要的医学基础课,与病理、解剖同属形态课.但它和临床联系不十分紧密,又不同于解剖,它摸不着,看不见,涉及的名词术词多,对初入校的医学生来说,描述细胞组织结构,
在新的世纪里我国高等教育规模发生了历史性的变化,有望到2005年提前实现大众化教育的总体规划目标,既适龄青年高等教育的毛入学率达到15%以上,这对提高我国整体国民素质,实
苏北里下河一带的人,特别是现龄四五十岁以上的,一般都有小名。他们的小名无论从社会语言学还是民俗学的角度看,都很有研究价值,而且充满浓郁的乡土色彩。