基于精细化部件的行人重识别关键技术研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:sunman511
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频监控系统在城市中的不断普及与其带来的侦破效率提高都为公共安全的刑事侦查破案方式带来了新的解决方式,与此同时,视频侦查技术得到了不断地发展与广泛地应用。然而在实际的侦查工作中,为了查寻嫌疑目标,公安人员往往需要调看安全事件发生时间前后及发生现场的附近区域的海量监控视频,以锁定追踪嫌疑目标。目前主要视频侦查手段往往通过人工肉眼查寻及分析视频中人员的画面及轨迹,最后做出嫌疑目标的确定。因此,过程中需要大量的人力物力消耗支撑。随着人工智能技术的不断更新及公安工作对侦查时效性需求的持续增加,行人重识别技术受到了公安行业的重视。行人重识别,即给一个监控摄像头视频中的行人对象,在其他任何时段任何位置的监控摄像头查寻同一行人对象的技术,可以有效地为公安人员在侦查工作中快速地锁定、排查和追踪嫌疑对象,为黄金破案时间提供有力支持,具有重要意义。
  一个有判别力的行人特征可以为行人重识别后续的距离度量以及重排序带来更为可靠的依据,所以专注于行人对象外观表达,研究如何提取更加鲁棒的外观特征来表示行人对象一直以来是相关学者在行人重识别上的研究基础与重点,近年深度特征的流行更是吸引了大量的学者关注行人重识别中的特征表达。与此同时,一个有效的目标分割区域可以排除非目标杂质的干扰,对目标检索起着重要的正面作用,而深度特征作为目前最具表达力的特征已经被广泛地认可,因此本文依赖深度学习,着重研究具有辨识力的精细化的行人部件区域对行人重识别技术的改进。然而,伴随着深度学习的高效表达,模型对训练数据规模的需求也逐渐增大,加之实际视频侦查环境下的监控数据更复杂,基于精细化的分割部件区域外观表达的行人重识别仍然面临着以下三个瓶颈:(1)标注不足。为获取行人重识别特定区域内的外观特征,首先须通过行人解析数据集获得可信的行人解析部件区域。然而实际情况通常面临缺少针对特定环境下的像素级标注训练样本的问题。若直接利用特定公开数据集训练行人解析模型学习到统一的解析模型,则又会产生特征表达的偏移。(2)解析不准。现有的深度学习解析模型受到网络结构的限制,在网络中存在池化、卷积等类下采样操作,导致目标边缘无法精确解析,造成行人部件提取存在偏差,进而降低特征表达的鲁棒性。(3)特征判别力低。传统行人重识别方法难以有效利用部件信息,容易引入杂质干扰,此外多摄像头间存在视角变化等复杂因素,导致实际环境下的行人外貌特征表达能力不稳定。为此,本文重点在解析模型迁移、解析优化和特征联合表达三个方面展开研究,并取得了如下创新性成果:
  (1)跨域行人部件解析的迁移方法。
  针对特定监控环境下的训练数据匮乏的问题,提出基于实例学习的跨域行人部件解析迁移方法,实现从单域数据训练向跨域数据训练的转变。主要利用高清时尚图里的丰富的信息,建立高清时尚图集与监控图集之间的特征关联,通过对监控图集内目标表观特征的提取及利用与高清时尚图集的特征映射关系,将高清时尚图中的行人解析模型迁移至监控环境中。实验结果表明,本文的迁移模型可以较为精确地解析监控环境下的行人部件,较直接利用高清时尚图集训练的模型有明显的提高,并大幅优于现有最好的迁移模型,解决了监控图域数据集匮乏的问题。
  (2)基于视频序列的行人解析优化方法。
  针对深度模型难以精准刻画低质图像边缘的问题,提出基于视频序列的行人解析优化方法,利用底层动态特征实现静态行人解析的增强。主要通过深度学习获取相邻的多帧序列各部件的置信度,然后利用光流建立同一部件不同帧之间的映射关系,并利用行人动态变化特性对各部件进行约束,设计了基于视频序列底层特征的条件随机场(CRF)进行解析补偿推断。实验结果表明,本文的方法可以有效解决行人序列中的模糊片段,此外将这些序列对应的解析结果重新优化解析模型进而在单张静态图片的行人解析中也取得了一定的效果提升,尤其对于行人对象边缘部分得到更为精细的刻画。
  (3)多任务深度模型部件特征联合表达方法。
  针对行人特征表达存在干扰杂质的问题,提出基于多任务深度模型的部件特征联合表达方法,实现从混合区域到可信区域特征提取的转变。通过寻找最有辨识力的部件进行组合来代替传统的行人整体特征,将拉近同一目标的组合特征,增加不同目标之间的组合特征区分度,优化行人重识别性能。实验结果表明,本文的算法较传统的基于整体特征或局部点、块特征的行人重识别算法有较高的提升,所提取的部件组合特征更具辨识力。
  综上所述,本文面向视频监控侦查技术瓶颈,完成行人重识别特征提取技术中的跨域迁移表达、动态特征反馈、部件特征组合优化等方面的研究,在基础理论和关键技术方面可为行人重识别在实际视频快速侦查应用中提供新的支撑。
其他文献
随着互联网软硬件技术的不断进步,各种电子商务平台蓬勃发展,网络购物成为人们生活中不可或缺的一部分,而网络服装购物成为其中最热门的一个应用,因此如何有效的对网络服装图像进行检索至关重要。针对这一问题,跨场景服装图像检索应运而生,通过输入服装图像快速而准确地检索出所需产品,大大提高了用户的网购体验。跨场景服装检索受到了越来越多专家学者的关注,但目前仍存在很多问题,主要面临的问题包括如下几个方面:1)日
学位
蜜罐技术作为一种主动防御方式可通过诱骗攻击者达到消耗攻击资源的目的,而蜜罐自身的虚假属性面临被攻击者识别的风险,从而绕开蜜罐陷阱转而攻击真实资源。本文课题提出了一种基于区块链技术的阵列蜜罐防御方案,构建由多种服务组成的真假切换蜜罐阵列,通过不断地变换服务真伪属性迷惑攻击者,为计算机网络安全领域提供防护方案。在表象上真实资源与虚假蜜罐已自成一体,即便攻击者觉察到蜜罐的存在,若其仍保持攻击动机,将无法
学位
在高性能计算中,如何根据用户提交的任务需求,对处理核等资源进行合理的按需分配是计算机系统结构的重要研究内容。但目前,该领域还存在诸如调度目标动态性,任务约束多样化及任务对资源需求多样性等问题,这些问题已成为制约众核任务调度效率和系统效能的关键因素。因此,基于调度目标动态性、任务和资源需求多样性,有针对地提出可以支持高效的多目标优化调度算法和调度目标灵活插拔的众核任务调度体系,将有利于调度效率和系统
学位
随着现代计算机软件及开源社区的快速发展,软件维护与管理成为影响软件开发效率和质量的关键因素。如何从大量开源代码库中学习知识,从而提高软件开发效率和质量实现软件自动化,是当前软件工程领域的重要科学课题。目前巳有很多研究将自然语言处理技术应用到程序语言分析上并取得了一定效果,但依然面临一些困难和挑战:(1)现有方法虽然考虑了代码分词所产生的词素序列或抽象语法树等特征,但忽略了代码的控制流等图结构特征。