长尾不平衡图像分类算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:shc200800
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实生活中,视觉图像数据的分布大多都是服从长尾分布的,类与类之间样本数目不平衡,小部分类别(即头部类)拥有较多的样本,而大部分的类别(即少数类,包括尾部类和部分中间类)样本数目较少。使用常规方法基于长尾不平衡数据集训练得到的模型整体识别效果低下,模型对头部类样本的识别准确率较高,对少数类样本的识别准确率很低。通过对常规方法的分类结果进行分析,本文发现模型倾向于将少数类的样本预测到与其特征相似的头部类上,此外,很多基于类别重平衡的方法在长尾图像数据集上训练得到的模型往往对头部类和少数类有不同的偏好,较难在头部类和少数类上同时获得准确率的提升。基于上述两个问题,本文提出了两种不同的解决长尾不平衡图像识别的具有创新性的算法。本文的具体工作如下:(1)提出了一种基于窗口和特征相似性的权重重分配算法(Similarity-WindowReassignment,SWR)。该算法用于解决模型倾向于将少数类的样本预测到与其特征相似的头部类样本的问题。在计算样本权重时,除了考虑类间样本数的不平衡关系,还考虑了类间的相似性关系。通过设置滑动窗口来约束类间样本数的不平衡关系和类间相似性关系的作用范围,基于这两种关系来为每个类设计一个合理的权重。该算法能够有效地缓解模型倾向于将少数类样本预测为与其特征上相似的头部类样本的问题,提高模型对少数类样本的识别准确率以及整体识别准确率。(2)提出了一种基于类先验条件的知识蒸馏长尾图像识别算法(Prior-ConditionKnowledge-Distillation,PCKD)。该算法用于解决当前大多数基于类别重平衡的长尾图像识别方法较难同时在头部类和少数类上获得准确率提升的问题。该算法基于两个分别在头部类和少数类上具有不同侧重点的教师模型,根据类别先验条件来共同指导一个学生模型的训练,通过这种条件能够使得每个教师模型只传授自己最有把握的知识给学生模型。在训练过程中使用分阶段学习来调节学生模型自主学习和蒸馏学习的时机,并结合课程学习策略动态调节来自于不同教师的知识的重要性。该算法能够综合利用两个不同模型的优势,训练得到的学生模型对头部类和少数类都具有更加出色的识别性能。(3)将当前用于解决长尾不平衡图像识别问题的主流方法在模型准确率上与SWR算法和PCKD算法进行横向比较。实验结果表明SWR算法在所有权重设计类方法中整体表现最优,PCKD算法在整体预测的准确率上则能够取得比其它对比方法更好的结果。
其他文献
细胞骨架包括微管、微丝和中间丝,其中细胞微管骨架是细胞内的高效运输系统,可被入侵的病毒所劫持,从而将由基因组与蛋白质组成的复合物运输到复制位点,有利于病毒自身的复制。宿主细胞骨架微管蛋白的结构和功能影响病毒感染过程及复制能力。微管蛋白转录翻译后修饰调节可以影响微管的功能,α-tubulin乙酰化修饰水平可以作为神经细胞微管稳定性的标志。本课题组前期研究发现,细胞肌动蛋白丝骨架通过促进cofilin
学位
室内导航功能是移动机器人重要的功能之一,随着移动机器人应用场景的丰富,传统的建图导航方法无法满足多种场景下的导航问题。未来服务机器人需要能够基于目标物体进行导航,而传统的建图导航方法无法真正的实现基于目标物体的导航。随着深度学习的不断发展,基于深度学习的目标导航方法逐渐兴起,但是现有的方法在效果上有待提升,并且研究主要在仿真环境上,缺乏真实环境的实验和评估。本文针对移动机器人的目标导航的问题,提出
学位
鼻咽癌是一种上皮细胞癌症,患者如能得到及时的诊断和治疗,其存活率将得到显著提高。准确地识别和分割出鼻咽癌的原发灶和转移性淋巴结对于患者分期、放疗规划和预后预测至关重要。然而,这两类目标通常需要经验丰富的医生逐张阅片,并手动勾画出病灶位置,这对医生来说无疑是沉重的负担。因此,一个全自动的分割方法对于高效诊断来说意义重大。本文将分两步,由浅及深地解决上述问题。第一步,本文对问题进行简化,提出了一个能分
学位
十二指肠贾第虫(Giardia duodenalis),又称蓝氏贾第虫(Giardia lamblia)或肠道贾第虫(Giardia intestinalis),简称贾第虫(Giardia),是一种重要的人兽共患原虫,主要寄生于十二指肠,引起贾第虫病(Giardiasis)。贾第虫病的临床表现主要是水样腹泻、脂肪泻、腹痛、呕吐、营养吸收不良和体重减轻。贾第虫还是免疫力低下患者如艾滋病患者、器官移植
学位
犬新孢子虫(Neospora caninum),简称新孢子虫(Neospora),新孢子虫是一种寄生于细胞内的原虫,引起中间宿主如牛、羊的生殖障碍等,导致新孢子虫病。该病呈全球性流行,对牛养殖业造成极大的经济损失。然而目前市面上还没有预防和治疗新孢子虫病的特效药,妥曲珠利及其衍生物帕托珠利对治疗新孢子虫病有较好效果。虽然疫苗是预防病原感染的有效手段,但目前也没有出现成熟有效的商品化新孢子虫病疫苗。
学位
癌症患者的生存预测影响其医疗方案的选择和医疗资源的投入,现有方法借助神经网络处理高维基因表达数据以准确预测患者生存概率。然而,欧式距离的基因表达矩阵完全忽视了生物大分子之间本应存在的图结构相互作用信息。事实上,生物大分子之间的相互作用网络是决定一系列生命过程方向和功能的关键。考虑到蛋白质是生命活动的主要承担者,本文认为其相互作用网络能够补充更多的患者信息。为此,本文针对图结构的患者基因表达网络,提
学位
牛肠道病毒(Bovine enterovirus,BEV)感染是由小RNA病毒科肠道病毒属牛肠道病毒引起的一种临床上以消化道和呼吸道症状为特征的传染病,给养牛业造成较为严重的经济损失。BEV感染自1959年由Moll等首次报道以来,很多国家和地区陆续报道了本病的感染与流行。国内李英利等于2011年分离出首株F种肠道病毒;邢泽黎等于2012年从吉林省发生严重腹泻的牛群中分离获得国内首株E种肠道病毒H
学位
图结构数据广泛存在于现实生活中。由于其非欧式空间数据的特性导致现有大部分方法无法直接处理这类数据,因此如何进行图表示学习备受关注,其中图表示学习旨在为下游任务提取具有高可分性的节点表示。同时,越来越多的证据表明,与单视图图结构数据相比,多视图图结构数据可以提供更全面的节点间关系,从而可以更加全面地捕捉节点间的内在联系。然而,以无监督的方式从多视图图结构数据中挖掘每个节点的节点表示却很少受到关注。为
学位
有创机械通气是通过气管插管或气管切开建立有创人工气道进行机械通气的方式,是重症监护病房中挽救呼吸困难患者的常用干预措施。因为会对患者造成人为创伤,准确且提早预测患者机械通气干预需求有重要意义。太迟开始会错过救治患者的最佳治疗时机,非紧急状况开始干预又会导致不必要的人为创伤;太早结束干预,患者需要再次干预导致二次伤害。本文以广东省某医院重症监护病房(ICU)的患者作为研究对象。该ICU病房部署了比较
学位
肺炎克雷伯菌(Klebsiella pneumoniae)是一种常见的人兽共患的革兰氏阴性病原菌,可以在多种生态环境中生存,主要引起人的呼吸系统疾病,也可以引起尿路感染、菌血症、脑膜炎及院内感染等疾病;在动物引起牛肺炎、牛乳腺炎、水貂肺炎、猪肺炎等。与此同时,抗生素的大量滥用,加速了多重耐药的肺炎克雷伯菌产生,被称为超级细菌NDM-1,甚至导致对该菌的感染到了无药可用的地步,这使得临床治疗举步维艰
学位