【摘 要】
:
与传统图像识别任务不同,细粒度图像识别目的在于区分同一个物种下的不同子类别,由于其类间差异小、类内差异大的特性,细粒度图像识别成为计算机视觉领域一项极具挑战的研究课题。同时由于其在实际生活中的广泛应用,例如生态保护、无人超市商品识别、车辆识别等,细粒度图像识别技术逐渐成为大数据智能时代诸多领域中的关键技术,具有无可限量的价值,也是近年来计算机视觉、模式识别等领域的研究热点。在众多模型方法中,不使用
论文部分内容阅读
与传统图像识别任务不同,细粒度图像识别目的在于区分同一个物种下的不同子类别,由于其类间差异小、类内差异大的特性,细粒度图像识别成为计算机视觉领域一项极具挑战的研究课题。同时由于其在实际生活中的广泛应用,例如生态保护、无人超市商品识别、车辆识别等,细粒度图像识别技术逐渐成为大数据智能时代诸多领域中的关键技术,具有无可限量的价值,也是近年来计算机视觉、模式识别等领域的研究热点。在众多模型方法中,不使用额外的强监督信息,只使用类别标签进行端到端训练的双线性池化模型逐渐成为细粒度图像识别中的主流方法,本文在双线性池化模型的基础上,从降低背景噪声和改进特征交互两个角度出发,设计了两种端到端的细粒度图像识别模型,并以优异的性能超越了细粒度图像识别领域中其他领先的模型方法。本文主要研究内容如下:(1)基于聚合松弛掩码的双线性池化(HBPASM)模型。该模型致力于降低背景信息对图像识别造成的干扰,首先在单个卷积特征上引入掩码模型提取感兴趣区域(ROI)特征,以此来抑制背景噪声;同时通过引入松弛变量构建松弛掩码模型,来提高在界定主体目标与背景区域时的容错率;最后,我们将多层松弛掩码模型进行融合得到聚合松弛掩码,聚合松弛掩码不仅可以提取更加精细的ROI特征,还对不同位置的特征向量设定了层次化的权重分布,并且该结构可以嵌入到多数卷积神经网络中,实现端到端的训练。最终将提取的ROI特征利用层次化的双线性池化算法生成图像表征,用于分类预测,并通过实验表明了聚合松弛掩码的有效性和HBPASM模型在细粒度图像识别上的优异性能。(2)基于自适应多尺度特征的双二次池化(SHQPM)模型。该模型旨在自主挖掘更有效的特征交互方式,首先从卷积神经网络中提取出了由粗到细的多层次多尺度特征,用以捕捉不同级别的语义信息;然后提出了新颖的双二次池化算法对多尺度特征进行有效的融合,以获得特征层间与层内的互补信息;最后设计了一个稀疏权重模型来为某一特定数据集自主选择最佳的交互特征子集。最终通过实验验证了双二次池化、多尺度特征交互、自适应特征选择各个模块的有效性,通过与当前细粒度图像识别领域处于领先水平的模型进行对比,SHQPM模型展现出了卓越的性能。
其他文献
随着我国经济的快速发展与软件工程重要性的凸显,互联网金融时代的到来,我国银行业的贷款结构正在发生着重大变化,个人贷款所占的比重越来越大。互联网金融的悄然崛起离不开IT工程的的辅助,用户需求瞬息万变导致他们对互联网金融软件的期望也越来越高。Y公司作为一家在金融IT服务行业深耕多年的企业,积累了丰富的金融产品业务经验,面对广阔的零售信贷业务市场,各银行/消费金融公司都希望能够尽可能多占领市场份额,Y公
随着科学技术的不断发展,信息系统在日常生活中逐步扮演起不可或缺的角色,各种身份认证技术也得到了广泛的应用。基于用户名-口令对的身份认证技术由于简单易用等特点成为信息系统中最广泛的认证方式,对保障信息系统安全的重要意义不言而喻。与之相关的口令研究,得到越来越多研究人员的重视。尽管如此,口令在使用中的安全性仍然常常被人们忽视。从历年来各大安全厂商公布的弱口令榜单,到各大网站中用户的口令重用问题,无一不
随着互联网与电子商务的兴起,新的商业模式影响着传统汽车物流发展转变的方向。为了应对日益激烈的市场竞争环境,汽车相关企业逐渐形成了具有柔性化、敏捷化的动态联盟。但是,由于动态联盟合作伙伴选择方法体系落后、利益分配不公、整体协同效益不明显等问题导致联盟失败的案例不在少数。同时,汽车物流不仅是汽车相关企业的基本后勤活动,也是支撑销售服务末端环节成功与否的关键。汽车物流直接决定着最终客户的满意度,是汽车相
无线室内分布式网络在室内位置服务、智慧城市等领域得到了广泛应用。无线时钟同步技术是无线网络完成目标定位、数据聚合等任务的支撑性技术。随着网络部署区域更加广阔与任务更加复杂,对无线网络时钟同步性能要求越来越高。目前主流无线时钟同步技术难以在同步精度、拓展性等方面满足日益严苛的需求。针对这个问题,本文提出了基于超宽带通信技术UWB(Ultra-wide Band)的距离感知无线时钟同步算法DAS(Di
中国经济融入全球一体化,企业之间竞争日益激烈,人力资源则逐渐成为企业的核心竞争力之一。如何正确地展开企业中层管理人员的培训,是企业稳定发展的一个重要基础。KY公司是陕西省一家大型公司,为打破各分公司独立的员工培训系统,打造独具特色的企业培训品牌,公司在2017年成立了企业大学---思创学院,该学院主要是培养公司的中坚力量,同时也承接少量的社会化的培训。截止目前思创学院共招收4期本公司学员和1期对外
四旋翼无人机因其结构简单、成本低、灵活起降等优点,越来越广泛的应用于各个行业领域,比如电力巡检、农业植保、环境监测等。为了降低飞行器对气流、风阻力等外界干扰的敏感性,减少由电机故障带来的安全隐患,实现四旋翼无人机系统的可靠、安全控制,本文针对系统存在外部扰动、执行器故障的情况,设计了一系列容错控制方案,具体研究工作如下:首先,针对四旋翼无人机系统的非线性模型,考虑外界干扰以及执行器偏差故障,利用滑
近年来,随着空间信息网络的不断发展,它的架构体系也越来越多变,网络规模也越来越大,因此需要进行更多低成本、灵活、高保真的实验对提出的各种理论研究进行验证。但是由于真实空间实验的高费用、高风险的特点,难以建立大规模的真实空间节点的试验台。因此,通过仿真平台来进行测试和验证空间信息网络的性能显得至关重要。本实验室搭建了一个面向空间信息网络的半实物仿真平台,能够真实地模拟链路、节点、拓扑等特性。但是该仿
氢能在交通运输领域具有广阔的应用前景.在轨道交通领域,中车四方股份公司已经成功开发世界第一辆氢燃料电池有轨电池并准备在世界上首次进行示范运行.本文总结了国内外氢能
树轮作为过去气候变化研究的代用指标已被广泛应用。当前的研究呈现多种树轮指标(宽度、稳定同位素、密度等)、多维气候因子(气温、降水、相对湿度、热量指数、ENSO、SPEI、sc P
医学图像的准确分割是计算机辅助诊断和感兴趣目标定量分析的关键环节。受成像机理限制,医学图像往往具有模糊、灰度不均匀、弱边界等特点,使医学图像的准确分割成为具有挑战性的问题。模糊连接度是基于模糊集理论的图像分割算法。该算法通过计算邻近度函数和亲和度函数来表达像素之间的连续性和相似性,从而实现对象的定义。由于模糊连接度同时考虑了图像的灰度特征和空间特征,因此在处理模糊图像时能得到理想的分割效果。本文在