多尺度特征学习的域泛化行人再识别研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:cl8848kill
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人再识别旨在从不同摄像头检索特定行人是否曾经出现,被广泛认为是一个图像检索的子问题。行人再识别技术面临着行人图像的分辨率变化大、拍摄角度不统一、光照条件差、环境变化大、行人姿态不断变化以及存在遮挡等严峻的挑战,是一个具有挑战性的课题。无监督的行人再识别技术不使用目标域图像的标注信息,其中的域泛化行人再识别能够在源数据集训练并直接在目标数据集进行测试,具有更广泛的实际应用意义。本文针对现有域泛化模型往往由于专注解决光照和色彩变化问题而忽略对细节信息的有效利用,导致识别率较低的问题,提出了一种多尺度特征学习的域泛化行人再识别模型。本文主要研究内容和创新点如下:(1)域泛化行人再识别方法中存在忽略对细节特征提取利用的问题,而细节特征可以有效帮助模型识别光照及姿态相似的困难样本。为了提取出包含更细节信息的特征来提升模型的性能,本文首先利用卷积层叠加的方式构建多尺度特征提取模块(Multi-scale Feature Extract Module,MFEM),提取出不同视野域的多尺度特征,然后设计特征融合注意力模块(Feature Fusion Attention Module,FFAM)对多尺度特征进行动态融合,在模型训练过程中动态的分配权重,使得模型关注到对最终识别更有帮助的区域,使模型保证在对图像整体信息学习的同时也学习到图像的细节信息。(2)域泛化行人再识别问题面临着视角,姿态差异等巨大挑战,单一层次的特征不能很好的捕捉行人图像之间的细微差别,很难提供足够丰富的辨别信息。而图像的多层次信息可以挖掘行人图像不同部分的高维联系,增强特征的丰富性和判别力。为了充分利用特征的层次信息,本文设计了多层次注意力模块(Multi-level Attention Module,MAM)提取特征的多层次信息,进一步挖掘行人图像中不同部分更复杂的细微差别,提取到更有效的行人图像特征表达。(3)在域泛化问题上,因为模型没有任何目标数据集的信息可以学习,所以泛化能力受到了更大的考验。为了减少从源数据集上学习的特征的风格特殊性,有效提升模型的泛化能力,本文设计了风格正则化模块(Style Normalization Module,SNM)来降低不同数据集图像明暗变化对模型泛化能力的影响,首先对特征在单通道单样本数据上计算归一化统计量,然后增加特征的非线性特征,增强模型的鲁棒性和泛化能力。在Market-1501和Duke MTMC-reid数据集上进行消融实验和对比实验,实验证明了本文各模块的有效性,且与主流方法相比,本文方法具有一定的先进性和竞争力。
其他文献
合伙企业作为一种人合性极强的商事组织体,通常是由合伙人共同经营、共担风险,且普通合伙人须对合伙企业财产无法清偿的部分承担无限连带责任,故有关合伙企业名称登记、经营、财产处分等重大的事项,事关合伙企业及合伙人的切身利益,自然须经全体合伙人一致同意才可对外决议。而《合伙企业法》的立法主旨本身就是为了规范合伙企业的行为,以达到保护合伙企业、合伙人及其债权人合法权益的目的。《合伙企业法》中就合伙企业组织的
学位
文本情感分析作为自然语言处理(Natural Language Processing,NLP)的重要部分,其过程主要是对文本中出现的情感以及意见进行挖掘、处理和分析。文本情感分析对政府收集民意、企业发展和决策以及个人获取建议都起着重要的作用。微博作为人们发表个人意见的平台,其平台上评论文本中包含的情感信息具有很高的研究价值以及商业价值。因此本文针对微博平台上的评论文本从三个方面入手进行文本情感分析
学位
量子演化算法通过结合演化算法和量子计算的优点来提升优化性能,以实现搜索空间中探索与开发的平衡。传统的量子演化算法主要用于求解单目标优化问题或小规模多目标优化问题。然而,现实工程中存在许多复杂的大规模多目标优化问题,对此,传统的演化算法优化效率较低。因此,本文研究基于量子力学理论的大规模多目标演化算法,并应用其求解两种现实世界的部署优化问题。对于无线传感器网络(Wireless Sensor Net
学位
赖氨酸作为猪饲粮的第一限制性氨基酸,也是构建理想蛋白质模型的关键。赖氨酸能够影响猪的生长性能、养分消化率、机体免疫、肠道健康、体内蛋白质的合成。赖氨酸缺乏或者过量都会对猪各方面产生影响。所以,探究饲粮中赖氨酸添加水平及赖氨酸需要量对猪的生产性能及各项指标的影响极为重要。作者基于国内外近年来对猪赖氨酸相关的研究发现,饲粮赖氨酸水平比推荐量低15%时会诱导炎症。而适量的赖氨酸可增强猪的细胞免疫,进而影
期刊
心脏作为人体循环系统的动力源,是一个集电生理学、动力学、血液流体力学以及神经、生化控制等于一体的复杂的综合系统,是人体中最重要的器官之一。根据世界卫生组织发布的数据显示,心脏病是全球头号死因。深入研究心脏解剖、运动等特性,对于心脏疾病的防治诊断具有非同寻常的意义。在实际的生活中,需要依靠医生在心脏核磁共振图像中进行勾画,勾画出心脏的轮廓。依靠手工勾画分割心脏轮廓是一件十分耗时的工作,同时传统方法在
学位
早产儿视网膜病变是一种发生于早产儿的未成熟视网膜血管的异常增生性疾病,是目前全球婴幼儿致盲的主要原因之一。目前该疾病常用的治疗方式有激光光凝术、玻璃体内注射抗血管内皮生长因子、冷冻疗法、玻璃体切割术等。不同治疗方法对患者屈光状态发展影响有差异。因此,本文旨在对早产儿视网膜病变治疗后患儿的屈光状态研究进展进行综述。
期刊
防范金融风险是国家审计保障经济社会稳定发展的重要抓手,如何协同多元主体治理更加复杂隐蔽的互联网金融风险值得研究。文章对照考察数字时代下的互联网金融风险防范瓶颈与国家审计能力建设,初步推测国家审计具备参与协同治理互联网金融风险的能力。基于金融脆弱性及其监管、国家审计免疫系统、协同治理等理论提出研究假设,并借用解释性案例印证国家审计主动参与协同治理互联网金融风险的合理性、必要性与可行性。国家审计能够综
期刊
报纸
在肺癌早期利用肺结节图像帮助医生完成肺结节的发现和诊断对于病患的病情控制有着非常重大的作用。在实际医学诊断过程中,肺部CT图像数量庞大,导致影像科医生的工作压力巨大,进而出现误诊漏诊问题。利用海量肺部CT数据的肺结节检索通过查找与待诊断结节图像相似的图像来完成辅助诊断给予医生诊断意见为上述问题提供了决策支持。本文基于卷积深度神经网络,针对不同的数据类型检索需求,提出了两种肺结节CT图像检索模型,并
学位
随着不同分辨率的显示设备数量的快速增长,图像和显示设备大小的不匹配问题使图像重定向方法成为计算机视觉领域的热点问题。内容感知图像重定向方法的主要目标是改变图像长宽比的同时保护图像中的主体对象,使变形尽可能发生在相对不重要的区域。但对于具有多个主体的图像重定向时会由于显著图的不准确造成主体对象的严重失真。同时,由于目前大多数算法并没有考虑图像重定向后的美学分布,生成的图像的美学结构容易受到破坏。针对
学位