【摘 要】
:
细粒度图像分类是对图像某一类别下的子类进行细分的任务,类间差距小的特点决定了该任务需要关注更细致的图像特征。以往的大多数工作致力于使用弱监督的方式定位具有辨别性的区域,并利用局部特征进行分类。但存在定位的局部区域不够精细,以及对多粒度局部特征的利用不足等问题。针对以上问题,本文使用深度学习技术设计并构建了一系列弱监督的细粒度图像分类网络,具体内容如下:(1)融合多粒度特征的细粒度图像分类网络。本方
论文部分内容阅读
细粒度图像分类是对图像某一类别下的子类进行细分的任务,类间差距小的特点决定了该任务需要关注更细致的图像特征。以往的大多数工作致力于使用弱监督的方式定位具有辨别性的区域,并利用局部特征进行分类。但存在定位的局部区域不够精细,以及对多粒度局部特征的利用不足等问题。针对以上问题,本文使用深度学习技术设计并构建了一系列弱监督的细粒度图像分类网络,具体内容如下:(1)融合多粒度特征的细粒度图像分类网络。本方法利用迭代学习方式来逐步调整骨干网络的不同特征提取阶段,并通过局部错位模块生成的不同粒度的输入图像。将不同的特征提取阶段对应到不同粒度上,实现了用一个骨干网络提取多粒度特征的效果。同时利用迭代学习方式逐层传递经验信息,从而挖掘出粒度互补的信息。引入注意力模块进行精细化特征筛选。为充分利用多粒度局部特征互补性,可变性卷积模块将筛选后的多粒度特征映射到同一特征空间并融合。最后分类器利用融合特征进行最终分类。(2)基于视觉Transformer的局部特征反馈网络。为了扩展视觉Transformer的感受野以适应细粒度图像分类的任务,本方法提出局部选择模块。在不引入额外参数的情况下,利用网络训练过程中产生的自注意力权重图来衡量图像补丁的重要性,从而定位到图像中最具辨别性的局部区域。之后通过局部反馈通道将对应区域的原图像裁剪放大后重新输送给网络作为输入,并让整体网络根据局部特征的特点进行参数调整。达到让网络适应整体图像特征和局部图像特征的目的,从而提高网络的分类效果。(3)基于视觉Transformer的特征选择和融合网络。本方法提出了交叉轴注意模块,用来衡量各个补丁与类别编码间的相似度。并选择出相似度高的补丁作为辨别性补丁,在除去最后一层的Transformer编码器的每一层中重复该步骤来提取足够的辨别性补丁。并引入特征融合模块,聚合类别编码和所有的辨别性补丁作为融合特征。后将其送入最后一层Transformer编码器,让类别编码学习聚合后的图像的局部和低级特征,达到让网络增强对于多粒度特征的敏感度的目的。综上所述,本文主要使用注意力机制来提高细粒度分类网络对辨别性特征的定位能力,并使用不同的特征融合的方式增强网络对多粒度特征的敏感度。本文所提出的三个网络模型的有效性均在常用的细粒度图像分类数据集上得到了实验验证。
其他文献
在能源危机和环境污染加剧的背景下,电动车的发展迎来了新的机遇,其中永磁同步电机控制技术得到了广泛研究。在电机控制中,低分辨率霍尔传感器因其成本优势得到广泛应用,但是电机转子位置检测中每个扇区的角度信息无法直接获取。同时,针对传感器故障,控制器需要有足够的鲁棒性,以满足长时间正常运转要求。针对以上问题,本论文研究了基于霍尔传感器的改进型位置估算算法和霍尔传感器故障容错控制策略等关键技术。首先,对永磁
新型冠状病毒2019(COVID-19)会对人类健康造成巨大危害,并在2020年初迅速蔓延到世界各地,感染数亿人并造成大量患者死亡。遏制COVID-19传播的关键一步是对可能感染的患者进行检测、隔离并治疗,但是逆转录聚合酶链反应(RTPCR)检测以及病毒抗体检测会消耗大量时间,因此对肺部医学图像进行COVID-19医学图像自动诊断在临床上具有重要的意义。本课题基于深度学习对新冠肺炎肺部医学图像进行
主观幸福感是指人们对其生活质量所做的情感性和认知性的整体评价,是衡量个体积极心理健康状态的重要指标之一。初中阶段是个体认知、情绪和社会性发展的关键时期,校园校园是初中生日常生活中的重要场所。以往研究更多关注家庭社会经济地位对初中生幸福感的影响,而较少涉及初中生所处的校园主观社会地位的作用,且二者之间的影响机制还不明确。因此,本研究拟探究初中生主观社会地位与主观幸福感的关系,并探究自尊程度在其中可能
佛山——全国闻名乃至享誉世界的制造业之都,作为全国唯一的制造业转型升级综合改革试点城市,制造业是这个城市经济发展的根和魂。小微制造企业作为佛山制造产业最重要的组成部分,它们虽然规模小,资金有限,但却共同构成了佛山市场经济发展的中坚力量。而为了应对日趋激烈的市场竞争和多样化的市场需求,积极提升员工能力和企业的技术已经成为佛山制造业企业的共识。在小微制造企业中,技术人员是企业的核心员工,是企业创新创造
传统的水环境容量以90%设计枯水流量为计算条件,存在水文计算条件单一、水环境容量不易管控等缺点。考虑河道流量与入河污染物影响下的水环境容量逐月变化,提出了基于水文过程与污染源变化条件下的动态水环境容量与入河污染管控计算方法。以山西潇河流域晋中段为例,计算了研究流域两水功能区的逐月水环境容量及其余量,运用MIKE11模型计算了逐月允许的动态入河污染负荷。研究结果表明:(1)2019年水功能区A的CO
随着并购重组规模日渐壮大,企业合并商誉占资产比重持续提高,对越来越多的群体起到更加重要的影响。近年来商誉会计相关问题不断爆出,标的资产的估值增值率急剧增长,商誉减值成为操纵利润和股价的手段,许多企业面临极高的商誉减值风险,突然大幅计提商誉减值导致的业绩变脸等层出不穷,近几年商誉问题频出,对市场影响巨大。面对商誉问题在资本市场引发的状况和后果,社会各界对于减值测试法作为唯一后续计量方法表示质疑,并就
为探究气候变化对未来地表水资源量的影响,以南通市通州区为研究区,选用CMIP6中的气候模式数据,驱动平原河网产流模型,计算未来地表水资源量。结果表明,平原河网产流模型在通州区径流过程的模拟有较好适用性,率定期月地表径流深模拟R2、NSE分别为0.89、0.88,验证期月地表径流深模拟R2、NSE分别为0.92、0.92;未来区域降雨量、气温较基准期呈增加趋势;相较于基准期,通州区未来地表水资源量总
近年来,随着我国素质教育的发展,高雅艺术逐渐深入百姓的生活中,越来越多的家长希望能让孩子学习一门艺术课程,儿童钢琴教育逐渐得到重视。在儿童钢琴教育中,教师的专业水平、教学方式、家长的配合程度等因素都会对儿童的钢琴学习产生着重大的影响。万宁市作为海南省的一个市级小城市,随着近年来经济的发展,人们开始重视艺术教育,儿童钢琴教育逐渐在本市发展起来,学习钢琴的儿童也逐渐增多。但同时,由于本市儿童钢琴教育刚
信息技术与能源技术的深度融合促使智能电网应运而生。智能电网的出现不仅提升了供电公司的电能管理水平,也进一步实现了电能的精细化调控。与此同时,智能电网的用电信息中存在的很多敏感信息,这些信息一旦泄露出去,如若被不法分子利用,将会给用户和供电企业造成不可估量的损失。因此,保证智能电网用电信息安全是智能电网发展道路上必须克服的困难。本文主要研究了智能电网用电信息安全防护技术,以智能电网的信息安全问题为导
目的:基于Meta分析的研究方法,系统评价大柴胡汤治疗慢性胆囊炎的临床有效性与安全性,并通过网络药理学的研究方法,进一步分析大柴胡汤治疗慢性胆囊炎的潜在靶点与作用机制,为临床应用提供进一步依据。方法:1.使用计算机检索中国知网、维普数据库、万方数据库、中国生物医学数据库、Pubmed、Cochrane Library以及EMBase等中英文数据库中关于大柴胡汤治疗慢性胆囊炎的随机临床试验(RCT)