【摘 要】
:
图像语义分割作为计算机视觉研究领域的重要分支,被广泛应用于自动驾驶,医疗图像分析和人机交互等场景。目前,基于深度学习的图像语义分割算法依赖于使用大量的像素级标注用于训练,由于获取此类标注需要昂贵的时间和经济代价,全监督语义分割算法的性能和泛化性均受到了制约。为了减少对像素级标注信息的依赖,基于更弱标注信息的弱监督语义分割算法被陆续提出。本文对基于图像级类别标签的弱监督语义分割算法展开了研究,并针对
论文部分内容阅读
图像语义分割作为计算机视觉研究领域的重要分支,被广泛应用于自动驾驶,医疗图像分析和人机交互等场景。目前,基于深度学习的图像语义分割算法依赖于使用大量的像素级标注用于训练,由于获取此类标注需要昂贵的时间和经济代价,全监督语义分割算法的性能和泛化性均受到了制约。为了减少对像素级标注信息的依赖,基于更弱标注信息的弱监督语义分割算法被陆续提出。本文对基于图像级类别标签的弱监督语义分割算法展开了研究,并针对其中的种子区域生长算法框架提出了优化方案。在该算法框架中,瓶颈主要在于两点:种子区域作为提供目标物体定位线索的基本信息,存在稀疏和对目标物体覆盖率低的问题;种子区域扩展算法容易错误地扩展到背景区域,使得生成的分割伪标签较难具有目标物体的清晰轮廓。本文对上述问题依次提出了优化方案,具体工作如下:1)针对种子区域稀疏的问题,在现有种子区域生成算法的基础上,提出了基于图像块的度量学习任务进行联合迭代优化。该任务通过生成目标物体的图像块提案并对其进行度量学习任务训练,能有效地增强种子区域生成网络对目标物体局部特征的理解能力,从而提高种子区域对目标物体的覆盖精度。2)针对种子区域生长算法中存在的分割边界模糊的问题,我们基于Affinity Net提出了对类别置信度不高的模糊区域像素做进一步像素关联度挖掘的改进方案。基于目标物体的边缘常常存在于模糊区域的观察,我们提出对模糊区域像素与高置信度背景像素进行显式的关联度挖掘以学习更精准的分割边界。本文提出的优化算法能显著地提高基于种子区域生长的弱监督语义分割算法的性能。其中,对种子区域生成阶段提出的基于图像块的度量学习算法在与两种不同的基线种子区域生成算法进行联合训练后,均可以有效地提高种子区域的精度。而在种子区域扩展的步骤中,我们提出的模糊区域像素关联度挖掘算法使种子区域扩展后得到的分割伪标签能具有更清晰的边界轮廓,有效地提高了Affinity Net的性能。充分的实验结果证明了本文提出算法的有效性,优化后的种子区域与分割伪标签均能有效地提高弱监督语义分割算法框架的整体性能。
其他文献
室内导航功能是移动机器人重要的功能之一,随着移动机器人应用场景的丰富,传统的建图导航方法无法满足多种场景下的导航问题。未来服务机器人需要能够基于目标物体进行导航,而传统的建图导航方法无法真正的实现基于目标物体的导航。随着深度学习的不断发展,基于深度学习的目标导航方法逐渐兴起,但是现有的方法在效果上有待提升,并且研究主要在仿真环境上,缺乏真实环境的实验和评估。本文针对移动机器人的目标导航的问题,提出
鼻咽癌是一种上皮细胞癌症,患者如能得到及时的诊断和治疗,其存活率将得到显著提高。准确地识别和分割出鼻咽癌的原发灶和转移性淋巴结对于患者分期、放疗规划和预后预测至关重要。然而,这两类目标通常需要经验丰富的医生逐张阅片,并手动勾画出病灶位置,这对医生来说无疑是沉重的负担。因此,一个全自动的分割方法对于高效诊断来说意义重大。本文将分两步,由浅及深地解决上述问题。第一步,本文对问题进行简化,提出了一个能分
十二指肠贾第虫(Giardia duodenalis),又称蓝氏贾第虫(Giardia lamblia)或肠道贾第虫(Giardia intestinalis),简称贾第虫(Giardia),是一种重要的人兽共患原虫,主要寄生于十二指肠,引起贾第虫病(Giardiasis)。贾第虫病的临床表现主要是水样腹泻、脂肪泻、腹痛、呕吐、营养吸收不良和体重减轻。贾第虫还是免疫力低下患者如艾滋病患者、器官移植
犬新孢子虫(Neospora caninum),简称新孢子虫(Neospora),新孢子虫是一种寄生于细胞内的原虫,引起中间宿主如牛、羊的生殖障碍等,导致新孢子虫病。该病呈全球性流行,对牛养殖业造成极大的经济损失。然而目前市面上还没有预防和治疗新孢子虫病的特效药,妥曲珠利及其衍生物帕托珠利对治疗新孢子虫病有较好效果。虽然疫苗是预防病原感染的有效手段,但目前也没有出现成熟有效的商品化新孢子虫病疫苗。
癌症患者的生存预测影响其医疗方案的选择和医疗资源的投入,现有方法借助神经网络处理高维基因表达数据以准确预测患者生存概率。然而,欧式距离的基因表达矩阵完全忽视了生物大分子之间本应存在的图结构相互作用信息。事实上,生物大分子之间的相互作用网络是决定一系列生命过程方向和功能的关键。考虑到蛋白质是生命活动的主要承担者,本文认为其相互作用网络能够补充更多的患者信息。为此,本文针对图结构的患者基因表达网络,提
牛肠道病毒(Bovine enterovirus,BEV)感染是由小RNA病毒科肠道病毒属牛肠道病毒引起的一种临床上以消化道和呼吸道症状为特征的传染病,给养牛业造成较为严重的经济损失。BEV感染自1959年由Moll等首次报道以来,很多国家和地区陆续报道了本病的感染与流行。国内李英利等于2011年分离出首株F种肠道病毒;邢泽黎等于2012年从吉林省发生严重腹泻的牛群中分离获得国内首株E种肠道病毒H
图结构数据广泛存在于现实生活中。由于其非欧式空间数据的特性导致现有大部分方法无法直接处理这类数据,因此如何进行图表示学习备受关注,其中图表示学习旨在为下游任务提取具有高可分性的节点表示。同时,越来越多的证据表明,与单视图图结构数据相比,多视图图结构数据可以提供更全面的节点间关系,从而可以更加全面地捕捉节点间的内在联系。然而,以无监督的方式从多视图图结构数据中挖掘每个节点的节点表示却很少受到关注。为
有创机械通气是通过气管插管或气管切开建立有创人工气道进行机械通气的方式,是重症监护病房中挽救呼吸困难患者的常用干预措施。因为会对患者造成人为创伤,准确且提早预测患者机械通气干预需求有重要意义。太迟开始会错过救治患者的最佳治疗时机,非紧急状况开始干预又会导致不必要的人为创伤;太早结束干预,患者需要再次干预导致二次伤害。本文以广东省某医院重症监护病房(ICU)的患者作为研究对象。该ICU病房部署了比较
肺炎克雷伯菌(Klebsiella pneumoniae)是一种常见的人兽共患的革兰氏阴性病原菌,可以在多种生态环境中生存,主要引起人的呼吸系统疾病,也可以引起尿路感染、菌血症、脑膜炎及院内感染等疾病;在动物引起牛肺炎、牛乳腺炎、水貂肺炎、猪肺炎等。与此同时,抗生素的大量滥用,加速了多重耐药的肺炎克雷伯菌产生,被称为超级细菌NDM-1,甚至导致对该菌的感染到了无药可用的地步,这使得临床治疗举步维艰
现实生活中,视觉图像数据的分布大多都是服从长尾分布的,类与类之间样本数目不平衡,小部分类别(即头部类)拥有较多的样本,而大部分的类别(即少数类,包括尾部类和部分中间类)样本数目较少。使用常规方法基于长尾不平衡数据集训练得到的模型整体识别效果低下,模型对头部类样本的识别准确率较高,对少数类样本的识别准确率很低。通过对常规方法的分类结果进行分析,本文发现模型倾向于将少数类的样本预测到与其特征相似的头部