基于特征擦除与自监督的弱监督目标定位方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lovewebstart
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习发展迅猛,在图像分析、自然语言处理等领域取得了优异的成绩。深度学习的优异表现依托于海量的数据支撑,数据的质量、数量都影响着深度学习模型的性能。然而,在现实场景中获取大量数据标注意味着庞大的人力、时间成本。弱监督目标定位为大规模数据的定位标注提供了途径。弱监督目标定位技术仅使用图像的类别标签,为图像中的目标生成边界框。在现实场景中,图像的类别标签比图中物体的位置信息更加容易获得。因此,基于粗粒度的图像级类别标签获取细粒度的目标物体边界框,可以在仅有类别标注的情况下对大规模图像数据生成目标位置标注,从而减少人力投入,提升工程效率。本文致力于利用深度学习方法,对基于特征擦除的弱监督目标定位方法进行改良和优化,并使用自监督学习进一步提升模型的定位性能。本文的主要贡献在于:1)本文提出了一种基于软引导与通道擦除的弱监督目标定位算法——多擦除流模型MEF-Net(Multiple Erasing Flows Network)。该模型主要包含三个组成部分,分别是软引导模块、通道擦除模块和多数据流结构。软引导模块提出了软擦除,并与硬擦除相结合,突破传统特征擦除中因特征完整性与定位准确性之间的矛盾而产生的性能瓶颈。通道擦除模块则将特征擦除应用在通道域,并提出合理的通道选择方案。最后,多数据流结构提供了一种无需增加额外参数量的方式集成以上擦除模块。2)本文提出了一种位置感知的自监督算法PASS(Position-aware Self-supervision)用于提升算法的定位性能。本文分析了现有的伪监督方法将分类与定位任务分离的原因,设计了位置感知的定位头,并以此构建多任务模型,实现分类与定位任务的联合训练,降低模型的参数量。在此基础上,本文引入自监督学习,在端到端训练过程中生成伪标签。位置感知的定位头与弱监督目标定位的自监督学习共同构成PASS,可以提升已有算法的定位性能。最终,本文提出的算法在相关研究的常用数据集上进行了测试,验证了所提出算法的有效性与优越性。
其他文献
准确地估计胎龄(Gestational Age,GA)对于判断胎儿生长发育是否异常至关重要,是胎儿产前超声筛查的必检项目之一。临床上,医生通过交互地移动虚拟卡尺跟踪超声图像中的颅骨,腹部和股骨,并测量出相应的头围(Head Circumference,HC)、双顶径(Biparietal Diameter,BPD)、腹围(Abdominal Circumference,AC)和股骨长(Femur
学位
飞机火灾事故频发,造成巨大的人员伤亡和财产损失,消防员作为飞机火灾救援中的主力军,而消防服则是消防队员生命安全的重要保障,气凝胶的引入为改良消防服提供了新的思路。气凝胶是一种具有三维纳米网络结构的多孔固体材料,其具有低密度、低导热率、高比表面积、高孔隙率等特点。对位芳纶(Kevlar)是一种具有良好耐热和阻燃性能的有机高聚物。将Kevlar制备成气凝胶纤维势必兼具两种材料的优势,在热防护领域,特别
学位
癌症亚型识别在揭示疾病发病机理和推进个性化精准治疗方面起着重要的作用。高通量测序技术的快速发展使同一组癌症患者的多种基因组学数据如mRNA表达数据、miRNA表达数据和DNA甲基化数据的收集成为可能。多组学数据可提供不同分子水平的患者遗传信息,通过提取多组学间的关联和互补信息,可以帮助准确识别癌症亚型并对相似患者聚类,从而根据患者实际情况制定治疗方案,避免无效治疗和过度治疗。因此,基于多组学融合进
学位
随着互联网的高速发展,电商平台已成为重要的经济产业,尤其是新冠疫情以来,电商平台在防疫和供应保障中发挥了重要作用。推荐系统依赖于用户和商品的交互实现个性化推荐,提升电商平台服务质量,却容易在数据稀疏场景遭遇用户冷启动问题。跨领域推荐通过挖掘用户在源领域的行为信息,辅助目标领域的用户建模,可望缓解用户冷启动问题,但跨领域推荐的性能极大依赖于跨领域的用户偏好建模和迁移。本文围绕用户偏好细粒度建模及跨领
学位
民机航电系统是支持飞机安全飞行的关键系统,当前民机航电系统呈现出复杂化、动态化的整体趋势,系统多阶段运行特性带来的不同任务阶段间元件/模块状态相互依赖、运行和失效过程与时间相关等问题对航电系统的可靠性分析技术提出挑战。同时,航电系统在实际应用中可能出现两个或多个元件由于某种共同原因而同时故障的共因失效,这会破坏系统内部元件/模块间的独立性假设,增大联合失效概率。此外,定量计算作为可靠性分析的关键环
学位
在现实生活中图网络数据无处不在,例如社交网络、引文网络、知识图谱等。随着科学技术和人类文明的发展,人们越来越关注于图网络数据及其信息带来的价值。由于标签的稀少,在挖掘信息的过程中无监督的算法也显得越来越重要。图嵌入是一种与下游任务无关的通用技术,其目的是得到一组能够将节点映射到低维空间的向量表示,以供现有技术和算法高效地挖掘信息。然而,目前的算法存在着一些问题。例如,现有的算法大多执行无偏好信息的
学位
在可生存飞机坠撞事故中,航空座椅/乘员约束系统对保护乘员安全具有重要作用。与航空座椅相关的适航要求较多,仅依靠滑台冲击试验进行符合性验证,适航取证周期长,费用高。采用数值分析方法可以缩短取证周期,精确的数值分析可以部分替代试验。本文利用有限元方法建立双排航空座椅/乘员约束系统数值模型,识别不同因素对乘员头颈部损伤的影响,为航空座椅设计提供参考,为应急着陆情况下乘员保护提供建议。论文首先建立撞击A/
学位
航空器起降风险因素的识别对于机场保持持续安全运行及我国交通运输安全稳定的运行起着重要作用。由于民航飞行事故具备灾难性、随机性及不可控性等特征,起降阶段是事故多发阶段且风险因素更加复杂。本研究将以大兴机场西跑道为研究对象,基于复杂网络理论分析其起降风险因素及演变过程,通过识别航空器在实际运行中的主要风险因素,确定网络的节点,并分析不安全事件案例集中某一节点向下一节点演变过程为网络的边,构建复杂网络拓
学位
随着21世纪航空业的高速发展,坐上飞机这件事也从遥不可及变成了飞入寻常百姓家。2008年,中国民航提出了全面推进民航强国的思想战略。然而科技的发展也是一把双刃剑,先进的科技带来了民航飞机的设备本质安全的同时也带给了我们新的问题。在民航安全方面,随着乘客多样化的增加,民航的机上安全成为了确保飞行运行安全的最后一块阵地。这些新问题的产生不仅仅涉及到机上所服务的乘客,另一方面机上空中安保人员也是重要的组
学位
医学图像是医生对病人病情和诊疗方案做出判断的重要依据,然而不同设备获取的医学图像通常有一定的差异,且不同病人的医学图像内容可能差异较大。医学图像分割能自动提取图像中的相应目标,一定程度上减轻医生的负担,减少因医生主观经验和图像差异等带来的漏诊误诊等。近年来,基于深度学习的分割方法以优异的性能成为医学图像分割领域的主流解决方案。然而,诸多基于深度学习的分割方法在提取特征、提升性能的同时通常会带来巨量
学位