【摘 要】
:
样本增广是解决图像分类问题的常用手段之一。它通过生成新的图像来强化数据集的多样性,进而增强模型的泛化性,从而提高模型处理分类问题时的准确率。然而,目前主流的样本增广算法大多是基于图像的局部不变性进行图像基本变换。图像基本变换通常较少考虑图像本身的内容信息,在处理小样本图像数据集时较难增广出多样化的样本。因此,有必要研究如何对小样本图像数据集进行有效增广,以提升小样本图像数据集分类模型的准确率。根据
论文部分内容阅读
样本增广是解决图像分类问题的常用手段之一。它通过生成新的图像来强化数据集的多样性,进而增强模型的泛化性,从而提高模型处理分类问题时的准确率。然而,目前主流的样本增广算法大多是基于图像的局部不变性进行图像基本变换。图像基本变换通常较少考虑图像本身的内容信息,在处理小样本图像数据集时较难增广出多样化的样本。因此,有必要研究如何对小样本图像数据集进行有效增广,以提升小样本图像数据集分类模型的准确率。根据需求的不同,本文将样本增广问题分为正样本增广问题和负样本增广问题。本文从优化的角度分别对两者进行建模分析,提出基于启发式优化的图像分类样本增广算法。本文的研究内容具体包括:(1)本文将正样本增广问题建模为数据集增广前后的样本特征空间分布均值差与标准差极小化的双目标优化问题。受到流形学习中高维数据在局部上仍具备欧式空间性质这一理论的启发,本文假设图像全局特征信息与局部像素点有直接联系,并基于此假设提出了基于流形启发式优化的正样本增广算法。该算法将对所有像素的优化搜索转化为对目标关键特征点的优化搜索,再利用仿射变换生成增广图像。本文在Mini-imagenet和Omniglot数据集上进行了实验。实验结果显示,与Autoaugment、Trival Augment等主流样本增广算法相比,基于流形启发式优化的正样本增广算法能使VGG网络模型的准确率提升1.80%~5.60%。(2)本文将负样本增广问题建模为增广样本与目标类别在特征空间中心距离极小化的约束优化问题。受到难例挖掘思想的启发,本文提出基于难例驱动的负样本增广算法,通过选取难分负样本作为增广目标进行增广。本文在Image Net数据集上选取了多个子集进行实验。结果显示,与Autoaugment、Trival Augment等主流样本增广算法相比,基于难例驱动的负样本增广算法能使VGG网络模型的准确率提升4.83%~10.00%。基于以上研究,本文设计并实现了一个面向图像分类的样本自动增广软件。在用户输入少量数据后,该软件能够自动生成用户规定数量的增广样本供用户进行图像分类模型训练。本文在样本较缺乏的利器识别、敏感旗帜识别、人脸识别三个任务上进行测试。测试结果表明,该软件使模型在三个任务上的准确率提升了3.23%~13.67%,满足了实际应用的训练需求。
其他文献
无监督预训练学习致力于通过设计可适用于大规模数据学习的前置任务,从而帮助神经网络从海量未标注的数据中得到通用的表征。近年来,在计算机视觉和自然语言处理中,无监督预训练模型都取了巨大的成功。在计算机视觉中,无监督预训练模型作为一种通用的网络表征,它对下游任务中图像分类、检索、目标检测、图像分割都有着关键性的影响。大量工作表明,预训练模型的好坏往往决定着下游任务的收敛速度与准确度。对于计算机视觉的任务
在现实社会中,很多场景可以用图结构表示,如论文引用网络,社交网络等。图上的社区发现是图结构分析的重要内容,并有着重要的现实意义。例如,在社交网络中,同一社区的用户之间喜好较为相近,因此能够帮助商家进行更精确的广告推送。与图上的其他问题,如节点分类、链路预测问题不同,社区发现通常需要使用无监督的方法来解决,即在训练过程中不能使用任何数据标签,因此是非常有挑战性的问题。同时,在现实场景中,图结构不会一
卷积神经网络的运行通常需要大量的存储与计算资源,这些限制条件使它们很难部署移动端或嵌入式设备中。因此需要通过神经网络模型压缩、轻量级卷积核设计与神经架构搜索等方式来降低神经网络的参数量与计算量。网络模型压缩是一个工作量大且困难的工作。神经网络架构搜索是在由各种卷积核构成的搜索空间中进行自动的网络架构搜索,输出较优的轻量级网络架构。因此,轻量级卷积核的设计是一项至关重要的工作。本文主要研究轻量级卷积
随着信息收集技术的快速发展,人们可以便利地获得海量信息,但同时也引发了信息过载的问题。人们需要消耗大量的时间和精力筛选出自己需要的信息。推荐系统是缓解信息过载的重要工具,它可以有效地对信息进行筛选,实现个性化的信息推荐。传统的推荐算法主要面向用户的整体偏好进行建模,不能有效地捕捉用户短时期内的兴趣偏好。本文研究的序列推荐算法基于用户在一定时间内与系统的有序交互,不仅可以精确地表征用户的当前意图,还
手性胺类化合物是一类重要的有机化合物,因其具有一定的碱性和潜在的生物活性,在不对称合成领域备受关注。其中,手性α-氟代-β-氨基羟吲哚类化合物具有潜在的药物活性,手性1,3-二胺衍生物可作为潜在的手性配体,因此,发展两类化合物的不对称合成的方法学具有一定的理论意义和应用价值。众所周知,含碳亲核试剂与亚胺的不对称Mannich反应是构建手性β-氨基酮(酯)化合物最有效直接的方法。为此,本论文主要针对
纳米材料和纳米器件在绿色催化、能源存储、传感检测以及治疗诊断等领域中的出色表现在现代科学中引起了广泛的关注。事实上,这些纳米材料的特性很大程度上取决于它们的纳米尺寸,表面改性和聚集程度。超分子大环化合物是一类多功能的大环主体分子,而且根据他们自身独特的空腔结构、易功能化、主客体络合能力等特点可以通过共价或者非共价相互作用修饰在无机纳米粒子表面,形成以大环芳烃为基础的有机-无机杂化纳米平台。无机纳米
活动图在软件需求分析中发挥着重要作用。它帮助业务参与者在软件建模过程中理解系统的组织和运转特征。然而,人工绘制活动图需要花费大量时间和精力。因此,实现需求文本生成活动图的自动化流程具有重要的研究意义与应用价值。为了提高活动图的自动化生成质量与绘制效率,本文提出一种基于需求文本分类的活动图自动生成方法。本文的研究工作主要包括:(1)提出了一种基于语义特征融合的需求文本分类方法。根据软件工程需求文本的
刺玫果是植物山刺玫的果实,主要生长在中国东北、内蒙古等地。它富含黄酮类、维生素、三萜、多糖、有机酸等多种化学成分,具有预防心血管疾病、保肝、增强免疫力、抗氧化、抗疲劳、抗衰老、抗肿瘤等药理作用。黄酮类化合物作为刺玫果中的主要活性物质被广泛关注和研究,但其水溶性差和渗透性低等缺陷,导致总黄酮的生物利用度较低,药物疗效受限。近年来,纳米技术在医药领域上展现出良好的应用前景,目前已经被广泛应用于解决难溶
深度学习算法往往假设训练集与测试集分布一致。然而,在实际应用中,由于采集设备、环境条件不同等因素,导致测试数据分布与训练数据分布不一致。当模型应用到目标测试数据时,性能大幅下降。一种解决方案是用标注的目标数据来微调模型,可是数据标注过程成本高昂。为了解决这个问题,无监督领域自适应探索把源域所学知识迁移到目标域,进而提升目标域性能并节省标注成本。现有的无监督领域自适应算法通过分布对齐的方式以求解决源
芳香胺是广泛存在于药品、农药和天然产物中的重要分子骨架,开发多种多样的芳香胺片段的合成和修饰方法具有重要意义。直接C-H官能团化具有步骤简单和原子经济性等优点,一直被认为是有机分子修饰的强有力工具。近些年来,很多科学家致力于探索高效便捷的芳香胺骨架小分子药物的官能团活化策略,以图改善原药物的性能以及开发新型药物。C-C键和C-O键是存在性极为广泛有机化合物骨架结构,甚至是一些药物、材料或者生物活性