【摘 要】
:
行人再识别是指通过计算机视觉技术匹配出现在不同地点和时间的行人。在智能安防、商业导购、人机交互等领域,行人再识别技术具有巨大的应用潜力。与基于人工特征的方法相比,基于深度学习的方法是端到端的,可以获得更鲁棒的识别特征,近年来,研究人员已在许多行人再识别数据集上使用深度学习技术并且取得了重大的进展。但是,在诸如公交、地铁等拥挤场合下,严重的遮挡使得利用乘客全身图像进行再识别变的不现实,因此本文选取乘
论文部分内容阅读
行人再识别是指通过计算机视觉技术匹配出现在不同地点和时间的行人。在智能安防、商业导购、人机交互等领域,行人再识别技术具有巨大的应用潜力。与基于人工特征的方法相比,基于深度学习的方法是端到端的,可以获得更鲁棒的识别特征,近年来,研究人员已在许多行人再识别数据集上使用深度学习技术并且取得了重大的进展。但是,在诸如公交、地铁等拥挤场合下,严重的遮挡使得利用乘客全身图像进行再识别变的不现实,因此本文选取乘客图像头部区域作为识别乘客身份的有效部位。但由于乘客人头图像分辨率低,可识别特征很少,不同样本间相似性高,因此当使用基于深度学习的方法对乘客人头进行再识别时,大量相似训练样本使得模型在训练时学习不到具有识别性的特征,另外,由于公交车前门和后门摄像机拍摄的乘客人头具有不同的风格,因此根据人头对前后门乘客进行匹配时会影响再识别模型的识别性能。本文基于深度学习技术,主要解决如何选取有效的训练样本以提升再识别模型的训练效果,如何生成具有不同相机风格的乘客人头图像,使训练集更加丰富,从而指导模型更好的识别不同相机下的图像。本文的主要工作包括以下内容:(1)基于难样本挖掘三元损失的公交乘客人头再识别算法。针对视角、光照、噪声等因素对再识别模型的影响,对训练数据进行增强,以提高模型的泛化性能;使用行人再识别模型作为预训练模型,提高模型训练效率;探究不同的骨干网络对再识别模型影响;对于损失函数,实验比较不同阈值及软化损失边界方法对再识别模型的影响,使用不同三元组采样方法,验证难样本采样的有效性;在三元损失函数的基础上,对难样本三元组增加相机标签的约束条件。在乘客人头再识别数据集上的实验结果显示,对比基准算法,增加相机标签约束条件的难样本挖掘三元损失再识别算法平均准确率提高了1.03%。(2)基于CycleGAN造图的公交乘客人头再识别算法。针对公交车前后门相机风格差异,构建基于CycleGAN的相机风格迁移模型,并使用风格迁移模型对公交乘客人头再识别训练集进行风格迁移,然后将原图像和迁移图像作为训练集训练再识别模型。以Tri Net为基础,通过实验验证了迁移图像对丰富数据集风格的作用;在其它基于深度学习的再识别模型基础上进行的实验显示,生成的迁移图像使模型的识别效果均有大幅度的提高。
其他文献
癌症严重威胁着人类的健康和生命,引起人们的极大关注。科学技术的发展与进步也使人们对癌症的了解逐步加深。皮肤癌是一种相对普遍的癌症,如果能够提早发现并及时进行治疗,在很大程度上能有效缓解患者的痛苦甚至能够完全治愈。荧光寿命成像显微技术(FLIM)能够揭示荧光分子所处微环境的变化,准确反映细胞和组织的代谢状态,通过对其进行高分辨率成像,实现生物细胞和组织的结构与功能地精确表征,为生物医学的研究提供了一
如今,随着微波技术和信息技术的发展,人们对通信容量增加的需求日益提高。在微波通信向高频率信号通信方向发展的同时,有一些难题也随之产生:一是微波信号的频率带宽有限,因此制约了微波通信进一步的发展;二是极短波长的高频特性信号在远距离传输时损耗严重。对于传统的电域滤波器,其带宽和采样频率受限,所以只能对低频特性信号实现滤波处理,这易引起电磁干扰,当所处理的微波信号的频率发生变化时,其滤波电路需重新设计来
智能电视机的出现突破了传统有线电视机的局限,通过联网就能实现看网络视频、听音乐、玩游戏、安装各种软件、KTV功能、网络视频电话、看天气等一系列多媒体功能。但是用一个遥控器来操控智能电视机的诸多功能是很不方便的,通过语音操控电视机,这会大大提升用户的观看体验。本文基于TCL下一代智能电视机的人机语音交互系统进行研究,致力于实现其中的命名实体识别系统。论文的主要工作如下:(1)通过分析命名实体识别系统
近红外(Near infrared,NIR)光谱技术作为一种过程分析技术在制药行业受到越来越多的关注。与传统分析方法相比,近红外分析方法快速、无损,需要样品量少,并且可以同时提供测试样品的化学和物理信息。然而,NIR定量分析属于间接分析方法,该方法是基于多变量校正模型(如PLS模型)和相应的化学计量学方法来解释待测对象光谱信息。使用NIR技术可提高药品质量指标的分析速度和效率,但与此同时,需采用适
第五代移动通信系统为解决现实中的传播场景,对频谱分布和传播模型做了优化。本文为建立能够针对5G模型的仿真系统开展研究,主要包括以下几方面。根据3GPP发布的5G通信模型,对传播场景进行划分,为便于在仿真系统内进行计算,针对不同频率划分为城市,城郊,农村三个场景。其中Sub-3GHz适用全以上三种,作为主要覆盖层进行计算处理,C-band作为主要增量层覆盖城区以及郊区场景,mmWave作为补充容量层
我国农村水污染具有分散性,采用的处理技术又普遍存在资金短缺、技术缺乏、长效性不够的问题,因此采用投资少、运行成本低、能耗低、运行稳定、出水水质高的实用型污水处理技
慢性脑低灌注(chronic cerebral hypoperfusion,CCH)是引发认知功能障碍的重要危险因素和病理生理基础。瞬时受体电位香草酸亚型1(transient receptor potential vanilloid 1,TRPV1)是一种钙离子高通透性的非选择性阳离子通道,辣椒素是其高选择性激动剂。TRPV1的调节参与大脑的各种生理和病理生理过程,可以通过调节神经递质释放、突触
情动于中而形于言,语言是表达我们心理活动的外在社交表现,而谚语则是语言在历史长河中经祖先智慧所提炼而得的经验之宝。这篇论文通过藏汉英三种不同语言,不同民族的谚语比
目的:通过观察健脾补肾治法对治疗多发性骨髓瘤肾损害(脾肾两虚证)的临床疗效,拟为中医治疗多发性骨髓瘤肾损害提供新的解决方案。方法:采用前瞻性研究方法,选择2017年3月至2018年10月期间在成都中医药大学附属医院/四川省中医院住院,且符合纳入排除标准的40例患者作为受试对象,随机分为治疗组、对照组各20例,治疗组予(加味参苓白术散+沙利度胺+环磷酰胺+地塞米松)治疗,对照组予(百令胶囊+沙利度胺
三维有序大孔材料(3DOM)的研究近年来发展十分迅速,该种材料不但具有孔径尺寸单一、孔结构在三维空间内有序排列的特点,而且其孔径尺寸都在50 nm以上(最大可达几个微米),弥补了以往小孔结构分子筛及介孔材料难以让大分子进入空腔的缺点,可广泛应用在催化剂载体、过滤、分离、电池和热阻材料等方面。具有近红外及上转换发光的稀土离子掺杂三维有序大孔材料在生物荧光检测、生物成像、太阳能电池及光通讯等领域具有潜