基于双支流编码器生成式对抗网络的协同显著性检测方法研究

来源 :郑州轻工业大学 | 被引量 : 0次 | 上传用户:kc1223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同视觉显著性检测是计算机视觉的一个新兴分支,它通过模拟人类视觉注意力机制来检测一组相关图像中的公共显著目标。目前已在各种计算机视觉任务中得到广泛应用,如协同分割、目标检测等领域。目前,基于深度学习的协同视觉显著性检测方法已成为主流,且取得不错的检测效果,但该方法仍然存在两类问题:一方面,已公开协同视觉显著性数据集的规模较小,容易导致模型训练过拟合问题;另一方面,现有方法未能有效地表征一组相关图像间的语义一致性,从而限制了模型对公共显著目标的推理能力。针对上述两类问题,本文提出了一种基于双支流编码器生成式对抗网络(Two-stream Encoder Generative Adversarial Network,TSE-GAN)的协同显著性检测方法,其训练分为两个阶段,具体工作如下。(1)在第一阶段训练中,对TSE-GAN的子模块进行预训练。一方面,利用已公开的单幅图像显著性数据集,对单幅显著性的生成式对抗网络(Saliency Object Detection Generative Adversarial Network,SOD-GAN)模块进行预训练,不仅缓解了协同显著性标签样本不足的问题,而且使单幅显著性编码器(the Encoder of SOD-GAN,SOD-Encoder)能够有效地提取单幅图像显著性特征(Intra-saliency);另一方面,利用协同显著性数据集的类别标签对分类网络(Classification Network,CN)模块进行预训练,使得该模块能够提取识别类别语义特征,同时为下一阶段训练组间语义编码器(Group-wise Semantic Encoder,GS-Encoder)获取具有语义一致性的组间显著性特征(Inter-saliency)做铺垫。(2)在第二阶段训练中,TSE-GAN网络以第一阶段的子模块为基础,利用协同显著性数据集对TSE-GAN模型进行训练。在整个模型构建方面,TSE-GAN网络有效地解决了双支流编码器的Intra-saliency和Inter-saliency特征融合问题。此外,本文提出了一种多尺度语义融合模型(Multi-scale Semantic Fusion Network,MSFN),用于整合多尺度识别类别语义的特征,以获取具有语义一致性的组间显著性特征,从而解决了一组相关图像间语义一致性表征能力不足的问题。最后,本文的方法在i Coseg和Cosal2015数据集上进行消融实验,证明了双支流编码器中各支路的有效性;与13种流行算法进行对比实验,验证了本文方法的优越性。
其他文献
我国是一个森林资源相对短缺的国家,人均占有率和森林覆盖率均低于世界平均水平。随着市场对木材需求的不断增加,木材供不应求的局面越来越突出。我国又是一个竹资源丰富的国家,竹林资源、面积和产量均居世界第一。竹子具有代木性好、生长快、生态功能强等突出优势,其生态效益、经济效益和社会效益将日益突出和重要。但由于竹资源的生长环境比较复杂,竹林间道路存在坡度大、路况差等问题,由此给竹材的搬运工作带来运输周期长、
高光谱图像(Hyperspectral Images,HSI)分类作为遥感图像分析的核心手段,一直以来都受到极大的关注,并被广泛的应用在国民经济的相关领域,例如自然资源调查、城市土地利用规划、精细农林业和环境保护等。因此,设计一种合适的、稳定的适用于高光谱分类的方法变的十分重要。本文在多核学习方法的框架下,以充分挖掘样本所包含的内在结构信息和判别性信息为出发点,引入局部二值模式(Local Bin
随着经济的发展和社会的进步,人民对生存环境的要求越来越高,园林草坪机具的应用和发展也随着草坪业的发展而提高。国内现有割草机主要采用内燃机为动力,且剪草部分多采用旋转刀片,割草机往往存在耗能大、卡滞堵塞、噪音污染等问题,所以设计一种小型化、紧凑化的电动剪草机,对于降低剪草机能耗、成本以及保护环境降低污染等方面而言都是有意义的。为此,本文针对于四川各种小区、公园、果园的单片面积小、土地分散的草坪现状,
军旅题材油画创作是油画作品题材创作中很重要组成部分,在中国这样的人口大国,有军旅经历的基数也很多,这样的一个群体曾在保卫祖国的战斗中、在建设更加强大中国的伟大征程中奉献过青春、汗水与生命。这样的群体所带来的创作内容是广泛的,作品题材是有相对独立性的,也具有绝对不可替代的代表性。军旅油画作品在题材上多为表现军人群体,在表现军人群体中以爱国情、军人情、军旅情为主线,这种题材创作也是中国精神的最好体现,
积极心理学作为研究人的优势和美德等积极品质的一门科学,主张用一种积极的方式,正面的心态应对心理问题,以激发并利用人自身内在的积极力量和优秀品质,帮助人寻找获得幸福感的方法。动画具有娱乐功能,它是人内心情感的表达方式,也满足观看动画的人内心情感需求;它能带给观众积极体验,激发情感共鸣并从中获得启示,与积极心理学所倡导的关注人的积极力量和追求健康幸福生活的目的异曲同工。从积极心理学视角下探究动画的创作
超分子凝胶(Supramolecular Gels)是由小分子化合物通过非共价键相互作用自组装而成的一类具有三维网络结构的软物质材料,其在传感、生物医药和分子器件等领域有着广泛的发展前景。本文以鸟苷形成的可逆手性硼酸酯为基础,开发了一种动态共价连接策略,可将苯并氧杂硼烷醇药物分子转化为手性抗菌超分子水凝胶。此外,现有的大多数水凝胶的力学性能较差,在使用过程中容易产生应力损伤,导致凝胶整体结构被破坏
为探索适宜万州高山区的云烟87栽培技术,开展了不同栽培密度、不同施肥处理和不同采收成熟度的大田试验,通过对烤烟内在化学成分分析和评价,采收时期下,研究施肥、密度和采收时期对万州高山植烟土壤特性以及烤烟品质的影响。本研究主要结论如下:1.种植密度对烤烟品质的影响从整体上来看,在种植密度为T1(1100株/亩)时,烤烟各部位叶的还原糖、总氮和钾含量以及施木克值均处于各自的最适范围内,当种植密度增加至T
近年来,随着越来越多诸如《西游记之大圣归来》(2015)、《哪吒之魔童降世》(2019)以及《姜子牙》(2020)等动画片在票房上获得了成功,以中国传统题材为主题的动画片开始不断涌现,越来越多的研究人员也开始投入到中国传统文化题材动画的研究中。本文选取了中国传统文化中的巫文化,重点落脚于人类和巫文化的起源地之一的巴渝巫文化。本文主要通过历史文献法、案例分析法以及田野考察法,基于巴渝巫文化的来源、巴
人工智能的兴起为银行业远程银行中心释放劳动力、提高工作效率、盈利创收带来了新的动力,开展对人工智能营销的研究,无疑具有现实意义。本文通过研究G银行远程银行中心的营销现状以及分析其营销环境,得出针对性的人工营销策略。为达到银行业远程银行中心盈利创收的目的,应当在现有的金融资源之下,引入人工智能营销,围绕“全渠道服务中心、共享联接中心、远程营销中心”全方位开展营销业务来增加自营收入,绘制G银行人工智能
由于脆性材料抗冲击能力和抵抗动载荷的能力较差,且抗拉能力远低于抗压能力,因此实际生产过程中非常容易破碎。人造金刚石的合成原料叶蜡石块和叶蜡石环,都是易碎件,并且生产过程伴随着高强度、重粉尘污染的工作环境。实现生产过程的机械化和自动化能够提高生产效率。为了解决脆性材料生产中存在的难题,实现自动化和智能化生产,本文设计了一种内撑式抓取的机械手构型,并对手指结构进行优化分析,探讨了不同刚度匹配的手指骨构