基于自监督学习的行人重识别算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:tdsl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别是一种行人图像匹配技术,用于行人搜索或多目标多摄像头跨镜追踪。由于数据集制作成本高昂,因而基于无监督学习的行人重识别方法逐渐成为研究的热点。目前,在小数据集上基于自监督学习的行人重识别研究,大多是对基于自监督学习的分类任务的简单迁移,缺少网络架构各个部分,在自监督学习的行人重识别任务中,的差异性研究,也缺少对行人重识别数据集特征的研究。针对这些问题,本文围绕常用的损失函数NT-Xent展开研究,主要工作如下:首先,通过基线网络的对比实验,发现,在基于MSMT-17以及Market1501数据集的行人重识别任务的优化过程中,出现了明显的最优结果抖动现象。这种抖动现象,来源于交叉熵损失函数(CrossEntropy,简称CE)中,理想概率分布的理论模型与实际使用场景间的不匹配性,为模型的收敛及调试过程增加了难度。本文为CE引入标签平滑技术,解决了该问题。其次,在基线实验中,通过对CE中,Softmax函数的分母项进行拆分测试,发现其分母中的负样本项,在使用基于归一化余弦距离作为度量函数的情况下,其实际的优化结果,是余弦值等于0,而不是理论上的余弦值为-1。这种差异导致Softmax的理论优化目标不再是1,而是一个变量。这与使用标签平滑后的理想概率分布1-e不相同,进一步地导致了优化结果不佳。本文通过理论计算,得到了Softmax理论优化目标的理论值,并使用参数e实现该理论值。此外,为了规避CE带来的若干缺点,本文引入了基于余弦距离的排序损失函数,与CE并联,共同提升自监督学习网络在行人重识别任务上的表现。再次,在基线实验中发现,Softmax函数分母及分子中的正样本项,其实际的优化结果为,均值58度,标准差265,收敛情况非常差。通过消融实验,本文发现,影响正样本分布的主要因素,是数据增强方法的设计及使用方案。本文针对行人重识别数据集的数据分布特征,以及行人重识别任务的特点,对图像裁剪、颜色变化、高斯模糊等方法进行了研究,设计了新的数据增强方案,在简化方案、减少训练图像使用量的情况下,提升了网络的准确率。本文通过PyTorch工具实现了基于自监督学习的行人重识别算法。经过以上若干改进,CMC-1从43.2%提升至55.2%,有较为明显的进步,为基于自监督学习的行人重识别模型研究打下了一定的理论基础。
其他文献
致病菌耐药性的日益发展对人类健康造成了严重威胁。尽管常规抗生素在治疗细菌感染方面仍然发挥着至关重要的作用,但耐药微生物的出现和传播正在迅速降低抗生素的有效性。靶向细菌膜的两亲性聚合物被认为是一种可治疗细菌感染的替代抗菌试剂,这类聚合物具有快速的杀菌作用和较低的耐药性倾向。基于此,本文主要进行了以下研究工作:1、将胆固醇-乙二胺偶联物(Chol-NH2)和L-赖氨酸-N-羧酸酐(L-Lys-NCAs
学位
咔唑及其衍生物是一类五元氮杂环化合物,特殊的稠环结构使其具有独特的生物活性和光物理性质,在药物、农药以及材料等多个领域都有着广泛的应用,因此,开发新型咔唑及其衍生物的合成方法具有重要意义。目前报道最多的主要是通过吲哚的环化反应或联芳基化合物的C-H胺化反应来构建咔唑化合物。其中,钯催化联芳基卤化物与不同类型胺化试剂的分子间C-H胺化反应被证明是构筑咔唑的一种有效方法。然而,要想获得特定位点带有特定
学位
伴随现代电子通信行业的高速发展,迎面而来的挑战是可用的频谱资源愈发紧缺,因此频谱资源的利用率怎样提升就成为了很重要的研究方向。并且为了能够高质量传输信号需要做到良好的群时延,所以可重构线性相位接收前端具有重要的研究意义。本文的研究目标是研制一款C波段可重构线性相位接收前端,其中接收前端主要包括低噪声放大器以及可重构线性相位滤波器两个核心部件。通过对两个核心器件的分析研究,从而研制出一款能够在中心频
学位
二氧化碳(CO2)过度排放导致的环境和生态问题日益引起人们的关注。尤其是2020年我国首次提出CO2排放力争于2030年前达到峰值,努力争取2060年前实现碳中和的战略目标,因此开发高效CO2利用技术迫在眉睫。CO2具有无毒、易获得、廉价和可再生等优点,可作为C1原料参与化学反应。利用CO2和环氧化物环加成制备高附加值的环状碳酸酯是最有前景的CO2利用技术之一,且该反应100%原子经济,具有环保优
学位
在如今经济全球化,“一带一路”蓬勃发展的大背景下,不同国家地区、不同语种人群之间的文化、学术、商贸和政治等方面的交流日益频繁。而通用领域场景下的机器翻译模型已无法满足更加多元化、深层次的跨语言交流需求。为解决多领域翻译的领域适应问题和多领域多模型的成本问题,本文结合终身学习算法,进行多领域翻译任务持续学习的研究,提出了面向终身学习的机器翻译系统。在面向终身学习的机器翻译系统研究过程中,本文的主要工
学位
近几年,世界被笼罩在一种名为SARS-Co V-2(COVID-19)的新型冠状病毒阴霾下,为了阻断病毒传播,世界卫生组织(WHO)大力倡导使用个人防护设备(PPE),尤其是佩戴口罩。然而,现有的口罩、手套、防护服等仅作为人体与空气之间的一层物理屏障,并不能直接起到消杀功效。为此,本文基于绿色高铁酸钾的高氧化活性,开展了这方面的尝试。提出了制备较高纯度高铁酸钾和纳米高铁酸钾的方法,解决了高铁酸钾在
学位
随着图像处理技术在人工智能、机器视觉和工业控制领域的高速发展,图像匹配技术逐渐成为众多科研学者研究的热点之一,现如今匹配技术广泛应用于图像拼接、配准以及工业中产品的质量检测等重要场景中。其中SIFT算法成为众多学者研究的重点,因为对于SIFT算法本身具有尺度不变性、旋转不变性和光照不变性等特点。目前学者对于图像匹配系统的研究主要集中在软件层面,通过高级编程语言来提高匹配算法的效率,但是这种方式容易
学位
以波音747、空客340为代表的现代大型客机,其机载电子设备种类和数量愈加庞大,导致机载网络规模和结构的复杂程度大幅提升。本课题来源于某民机航电总体所承担的国产大飞机客舱网络仿真平台项目,开展机载网络拓扑发现研究,掌握国产大飞机客舱网络设计自主关键技术,实现对机载网络设备的高效配置和管理。本文开展了快速生成树协议和链路层拓扑发现技术的研究,设计并实现了机载网络拓扑发现系统,主要工作和特色如下:首先
学位
本论文研究了8-甲基喹啉C(sp~3)-H选择性的碘化和乙酰氧基化反应。论文共分为两章:第一章喹啉类化合物官能团化反应的研究进展喹啉是一种用途广泛的杂环化合物,是许多天然产物和药物的组成部分。在过去的几十年里,这种骨架也被广泛应用于药物、农药、功能材料以及过渡金属催化剂的配体中。因此,开发高效、区域选择性的合成方法获得官能团化的喹啉类化合物具有重要的意义。目前,过渡金属催化的C-H活化是最简便、高
学位
受限场如何调控高分子链的静态和动态性质不仅是高分子物理学中一个重要的科学问题,还是生命科学中关注的焦点之一,例如,蛋白质分子如何在体内有效折叠?尽管一些工作研究了大分子在受限场中的折叠行为,然而对于不同性质的高分子链,受限空间的几何性质和排斥体积效应如何影响单链高分子的稳定性、结构以及标度行为等仍不十分清楚。为了阐明柔性和半刚性高分子链在受限空间中的折叠行为,本论文主要开展了以下两个方面的研究工作
学位