【摘 要】
:
机器学习是对人类学习过程的一种模拟。人类能够利用少量样本学习总结事物的本质规律,但是机器学习却需要大量高质量样本来寻找数据间的规律,总结出分类判断的规则。在实际工作中,样本采集困难、标注代价昂贵,机器常常无法获得足量的样本数据。因此,研究在小样本条件下让机器快速学习的方法,具有较强的理论意义与应用价值。小样本学习问题的核心是数据量少,参数假设空间大,生成的样本特征表示无法充分表示类别信息且包含了大
论文部分内容阅读
机器学习是对人类学习过程的一种模拟。人类能够利用少量样本学习总结事物的本质规律,但是机器学习却需要大量高质量样本来寻找数据间的规律,总结出分类判断的规则。在实际工作中,样本采集困难、标注代价昂贵,机器常常无法获得足量的样本数据。因此,研究在小样本条件下让机器快速学习的方法,具有较强的理论意义与应用价值。小样本学习问题的核心是数据量少,参数假设空间大,生成的样本特征表示无法充分表示类别信息且包含了大量的无效信息及噪声。目前的小样本学习方法大多采用辅助训练集作为先验知识压缩参数假设空间,但是由于任务样本数量过少,训练得到的特征提取器仍然缺乏任务针对性,难以直接提取到样本整体类别特征。因此,文章针对样本特征提取表示困难和噪声干扰多的问题,提出了解决方案。本文的主要研究内容如下:首先,很多小样本学习方法采用图像级别的紧凑表征,无法全面地表示类别信息。对此,我们提出了一种基于视觉词典的特征表示方法。为了充分利用神经网络提取特征的能力,同时降低小样本局部特征描述子分布不均衡的影响,使用神经网络提取局部的深层语义信息,然后结合深度哈希方法,构建了一个端到端的词典训练生成网络。利用融合的局部特征来充分地表示图像整体特征信息。这种方法用记忆中的局部特征表示新样本,规避了直接提取样本整体类别特征的难题,并且与分类模型结合时能有效地缩减参数假设空间。其次,许多小样本学习方法在分类时平等地看待每个从样本中提取到的特征信息,然而不同特征对于不同类别样本的类别特征表示贡献不同。因此我们提出了一种基于关键特征的小样本学习方法。依据小样本局部特征词汇的分布特点,对词频进行统计分析,调整每个局部特征的权重,使得模型尽可能地忽略无效信息、关注关键特征,从而加强模型对关键特征的建模能力。在标准数据集mini Image Net以及CUB上进行了实验,本文提出的特征表示方法可以生成具有类别区分度的特征表示,提出的基于关键局部特征的小样本学习算法与同类方法相比有效地提高了小样本条件下分类任务的准确率。此外,设计了消融实验和一些补充实验,验证了网络各部分的设计的有效性和合理性。
其他文献
新冠病毒的传播具有高传染性和高隐蔽性,对全球人民的生活造成了重大影响。截至2022年3月3日,在全球范围内,新冠疫情已造成近600万人死亡。新冠疫情的防控成为社会关注的热门问题。为控制疫情,许多国家和地区采取了自愿核酸检测、对有症状感染者强制核酸检测、对确诊家庭强制隔离等非药物干预措施。家庭模型是一种考虑随机因素的理论流行病学模型,是研究疫情防控问题的重要手段。本文根据新冠疫情发生时社区的实际疫情
网络的结构模式对疾病传播产生重大的影响。真实网络的结构既具有时变性又具有不同程度的社区性。另一方面,许多真实网络也呈现出多层结构,不同层的结构反映了个体在不同环境下的功能。基于此,本文研究了社区结构在时变网络中的作用。本文的具体研究内容和创新点如下:(1)研究单层网络下社区结构对疾病传播的影响以及社区分配策略。在疾病防控中,社区隔离已经成为相当常见的措施。并且随着时变网络成为研究的主流,研究社区结
研究根据实际案例,介绍1种高频压力数据异常模式识别组合模型,组合模型包含异常模式提取、基于DTW距离的相似搜索、基于DTW的K-means时间序列聚类。有望在实际运用中,针对供水管网中已知的异常模式,进行识别预警。选取某压力监测点的高频压力数据对模型进行分析。结果表明,模型能够有效识别出实际案例中的异常模式,归一化互信息(NMI)指数可达0.818。
明末清初著名小说家李渔的拟话本小说《十二楼》多次经过汉学家的翻译进入英语世界,然而不同的汉学家采用了不同的译介方法。本文以Lefevere改写理论中的诗学理论为切入视角,并借用中国叙事学的一些概念,对比分析了三位汉学家的翻译活动,以考察诗学观对译者选材、译者的译介视野和译本在英语世界接受情况的影响。首先,三位汉学家的诗学观对各自的选材和翻译策略产生了不同影响。德庇时是东印度公司驻中国的职员,他想通
本论文以《世界文学》(《译文》)这一期刊杂志为例,探讨建国“十七年”期间期刊杂志中德语文学翻译在题材的选择、作家作品的选择、译者针对不同题材作品所采用的翻译策略的选择等方面所呈现的规律及特点。本论文通过文本分析、副文本研究等方式,从描述性翻译研究的视角,考察翻译活动中包括译者、编者、读者、及原文作者在内的等多方影响因素在这一受意识形态影响较大的社会文化语境下,如何透过文本和副文本展现出各方的角力和
<正>2021年2月25日,习近平总书记在全国脱贫攻坚总结表彰大会上庄严宣告,我国脱贫攻坚战取得了全面胜利,现行标准下9899万农村贫困人口全部脱贫,832个贫困县全部摘帽,12.8万个贫困村全部出列。脱贫攻坚取得全面胜利,但脱贫摘帽不是终点,而是新生活、新奋斗、新发展的起点。党的十九届五中全会提出:全面实施乡村振兴战略,
转移定价是集团企业各部门之间进行中间产品交易的一个常用手段。以往关于转移定价的研究主要基于完全信息市场,但在实际的市场中,企业在进行竞争时往往会隐藏自己的类型,并且对于同时竞争多种产品,以往的研究也少有提及。因此,在不完全信息市场以及存在多产品竞争时如何进行中间产品转移价格的制定是亟待解决的问题。本文主要对传统的转移定价研究进行改进,在战略转移定价中,通过放松假设条件与结合博弈论和概率论的知识,建
再保险就是保险公司购买的保险。通过购买再保险,保险人将其承保的部分风险转移给再保险人,并向再保险人支付再保费。因此,如何制定一份再保险合同,使自身利益最大化、风险最小化,是保险人和再保险人都很关注的问题,由此关于最优再保险问题的研究应运而生。构建最优再保险模型需要考虑多个要素。从再保险合同的商事主体构成来看,再保险合同包含两个商事主体:保险人和再保险人。从最优再保险模型的构成要素来看,模型包含三个
大脑是人类神经系统中重要的组成部分,它负责几乎所有的高级认知功能。随着脑科学的不断发展,众多学者在各类疾病上探究患者大脑功能的变化,以获得其潜在的神经发病机制,为临床治疗提供理论依据。慢性颈痛作为全球第四大致残因素被广泛关注,目前研究认为慢性颈痛会引起大脑功能异常,但其深层次的神经机制仍不清楚。功能磁共振成像技术可以通过度量大脑活动产生的时间序列信号,来准确地刻画大脑功能。基于此,本文利用动态分析