基于多尺度特征融合与注意力机制的细粒度图像分类方法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:ayhui2046
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度卷积神经网络(VGGNet、Res Net、Densenet等等)的不断发展,计算机在处理常见的粗粒度图像分类的效果已经越来越准确了,在大量的分类任务中甚至已经超过了人工的分类的精度,继而很多学者和研究人员逐渐地将研究的目光投向了细粒度图像分类任务。然而直接将这些深度神经网络用于细粒度图像的分类并不能得到很好的效果,主要是因为这些细粒度的图像之间是具有很多相同的地方,直接使用这些深度卷积神经网络很难找到细粒度图像中具有明显区别的特征。为了满足细粒度图像分类的要求,本文以传统的深度卷积神经网络(VGGNet、Res Net)为基础,通过研究改进其结构,提出了一种新的细粒度图像分类方法。该方法主要是为了获取到细粒度图像当中更能代表其所属小类的细微特征,通过多尺度融合和注意力机制,构建深度分类模型,能够取得较好的实验效果。针对图像在深度卷积网络进行卷积池化过程中,一些细小的可判别区域特征可能会缺失的问题。本文使用端到端的弱监督训练,在传统卷积网络中引入了多尺度特征融合的方法,很好地融合了图像的浅层特征和高层语义特征。并在特征图的空间维度和通道维度层面应用了注意力机制,设计了模型的空间关注模块和通道关注模块,通过在特征上分布权重从而更加突出细粒度图像中的可判别性区域,保证了模型的鲁棒性能。本文分别从模块串联和并联的角度对模型进行了构建,对两种方式都做了实验。在实验过程中,对CUB-200-2011、FGVC Aircraft和Stanford Cars三大公开的细粒度图像数据集进行了训练和测试评估,在Res Net101基础上改进的模型网络模型上进行端到端的实验。实验结果显示,串联方式对三个数据集预测结果的最高准确率比同期其它模型的分类准确度提高了1.2%、0.8%、1.1%,取得了较好的实验效果。
其他文献
世界工业化的程度不断加深,世界能源体系的研究者们也一直在探寻更高效、环保的能源来应对急剧攀升的能源需求。基于锂金属电池发展起来的锂离子电池已经成为通信、运输和可再生能源领域的主要储能设备。但是自然界中锂资源的稀缺以及锂矿石品味较低限制了锂离子电池的发展和应用。而钠离子电池以其自然资源丰富、成本低的优势吸引了研究者们的目光。此外,钠离子电池与锂离子有着相似的储能机制,并且有望表现出更高的稳定性和安全
协作通信技术因其可靠的传输特性成为近年来被广泛研究的领域之一。缓存辅助中继系统的提出打破了传统协作通信中瓶颈链路的限制。与具有固定传输标准的传统中继相比,基于缓冲辅助中继的自适应链路选择协议能够获得更好的性能增益。但是,大多数现有的链路选择策略都是基于理想的信道状态信息(Channel State Information,CSI)设计的,而信道估计本身是非常复杂且较难实现的。此外,在一些复杂的场景
2004年石墨烯的成功制备,开启了石墨烯的黄金时代。随着研究的深入,二维材料展现出各种令人惊喜的性能,激发了科研人员的兴趣,开始探寻其他类似石墨烯的二维材料,磷烯、硼烯、锗烯、硅烯等单元素二维材料进入研究领域。本文选择石墨烯和硅烯作为研究对象,对其电荷输运性质进行研究。本文利用紧束缚近似理论结合格林函数,建立研究模型,利用Kwant软件对材料进行模拟运算,得到系统的能带、电导、态密度等数值结果,并
现代通信技术以无线通信为主,在过去数十年间飞速发展,推动着社会往信息共享和高效互联的方向不断迈进。受智能移动电子产品的影响,移动通信逐渐成为人们生活中通信方式的主流,从最初仅支持语音通话到目前能够满足各类数据传输业务,经过了几代的变迁。当前全球已经进入第五代移动通信(5G)时代,能够满足人们对高速率、低时延、大容量等性能的需求。低噪声放大器作为射频通信系统前端中的重要组成部分,5G移动通信的应用对
电子鼻是一种由传感器阵列和适当的气味识别算法组成的仪器,已广泛应用于食品安全检测、航天飞机和医学诊断等气味检测相关的各行各业中,并发挥着重要的作用。如何设计更高效且低成本的集成电子鼻系统是气味识别的研究热点之一。目前,集成电子鼻设计中,将原本普通电子鼻的传感器阵列模块和识别算法模块两个独立硬件和软件模块集成为一体。这种设计相较于普通电子鼻系统优势明显,避免识别算法使用额外的计算机硬件,降低了电子鼻
如今毫米波雷达被广泛应用于无人驾驶系统中。随着毫米波雷达技术的发展,车载毫米波雷达的分辨率越来越高,从同一目标处获得的数据量以及目标数据集的数据量也随之增多。同一目标的数据量增多能够让系统更准确地分析目标。但目标数据集数据量的增多会导致无人驾驶系统对目标数量的判断能力受到影响,因此需要利用合适的聚类算法处理车载毫米波雷达的目标数据集来得到正确的目标数量。车载毫米波雷达目标数据集的数据密度不均匀,并
在数据挖掘领域,聚类作为一种重要的数据分析方法引起广泛关注,但数据规模不断扩大,数据结构日益复杂,维数也越来越高,很难使用传统的谱聚类技术对其进行分析,子空间聚类是针对高维环境下的信息进行处理的常用方法,可以在其中准确找到与数据子集相对应的低维子空间,去除无关信息对聚类结果的干扰。现有的自适应图正则化的低秩表示方法虽然可以对数据自适应的进行学习,同时保留数据的全局和局部信息,令得到的系数矩阵具有清
随着集成电路产业的快速发展,物联网系统功耗大和电池续航时间不足的矛盾也越来越突显,成为低功耗应用开发亟需攻克的难点。太阳能电池作为绿色可再生能源中的典型代表,因其成本低、资源丰富且能量密度大而得到广泛应用。另外,负载直接连接到太阳能电池通常并不能高效率地捕获能量。能量采集器能匹配能量源的输出阻抗,使能量捕获效率最大化,达到最大功率点跟踪的目的,设计基于MPPT的能量采集器具有重要意义。本文分析了太
随着社会对智能产品依赖越来越强,其对产品的功能要求也越来越高。芯片作为产品设备中重要组成部分之一,目前主要面临着两大挑战,工艺技术无法继续往前和芯片无法兼备高性能及低功耗要求。而电压基准源作为芯片中模拟集成电路设计里的基础模块,与各个电路模块乃至电路的整体性能相辅相成,在电路中占据着重要位置。因此,设计一种高性能低功耗的电压基准源电路结构对今后的发展尤其重要。本论文设计了两种基准源电路,分别为全C
聚对苯二甲酸丁二醇酯(PBT)由于其自身优异的性能,被广泛应用于各行各业,但其回收利用率低,不符合现在低碳和环保的理念,因此研究易回收利用的高性能PBT复合材料一个非常具有研究价值的课题。类玻璃高分子(vitrimer)是一种具有动态交联网络结构的新型聚合物,在高温条件下,动态交联网络快速反应使网络的拓扑结构发生改变和重排,从而使得材料具有可重塑性和可再加工性能,这种性能使得vitrimer材料的