基于自训练的小样本节点分类研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:SparrowHawk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在监督信息有限的情况下,小样本学习已经被广泛提出来训练具有泛化能力的机器学习模型(例如,卷积神经网络(Convolutional Neural Network,CNN)),这已经在欧几里得数据上有了充分的研究。然而,近年来非欧几里得数据呈现出爆发式增长。因此,研究非欧几里得数据上的小样本学习模型也十分重要。最具代表性的非欧几里得数据是图数据(Graph),当前已经有许多研究工作将小样本学习应用于图数据上。其中,比较流行的研究方向是小样本节点分类(Few-Shot Node Classification,FSNC),它是去使用有限的标签节点来预测图数据上的无标签节点。先前的小样本节点分类模型主要分为两种,即基于元学习和度量学习的模型。然而,它们都过度地把研究重心放在挖掘基类的先验知识上,而没有考虑新类中无标签节点的丰富信息,这造成了新类信息的不充分利用。而自训练算法能够通过给置信度高的无标签节点赋予伪标签来挖掘出无标签节点中的丰富信息。因此,本文针对元学习和度量学习的模型中存在的问题,基于自训练算法提出了两种小样本节点分类模型:(1)提出基于信息增强的自训练小样本节点分类模型。本文通过引入自训练算法去给置信度高的无标签节点赋予伪标签,实现第一轮数据增强,并挖掘了新类中无标签节点的丰富信息。接着,将新类中支撑集和伪标签集输入到映射函数(例如,多层感知机(Multilayer Perceptron,MLP))中生成新的节点集,再用新的节点集更新模型,进而实现第二轮数据增强。在模型的整个训练过程中,通过将自训练作为数据增强中介,实现了两次可靠的数据增强,本文将两次连续的数据增强称为信息增强。(2)提出基于知识蒸馏的自训练小样本节点分类模型。尽管能够通过上述提出的信息增强去训练出好小样本节点分类模型,但信息增强能够工作的关键是自训练模块。然而,在执行自训练时容易产生两个问题。首先,当使用错误的伪标签时,自训练会误导模型的训练方向。其次,当使用过度自信的伪标签时,自训练会导致模型过拟合。这两个问题说明了伪标签的质量会影响自训练的性能。因此,本文提出通过引入知识蒸馏去改进伪标签的质量,进而提升自训练的性能。本文针对先前模型存在的问题,提出了两种自训练模型。这两种自训练模型都能够去挖掘新类中的丰富信息。大量的实验结果表明提出模型都是有效的。
其他文献
目的 探究临床案例教育联合中医辨证取穴治疗对产后缺乳产妇乳汁分泌及母乳喂养效能的影响。方法 选择该院2020年2月至2022年2月收治的产后缺乳产妇120例,按随机数字表法分为2组,对照组采取常规护理,观察组在常规护理基础上加以临床案例教育联合中医辨证取穴治疗,比较2组产妇的乳汁分泌情况及母乳喂养效能。结果 治疗后,观察组日乳汁分泌量大于对照组,且缺乳症状的改善产妇占比高于对照组,差异有统计学意义
期刊
针对配电变压器的重过载、功率因数低问题以及传统解决方法投资大且易造成设备利用率低的不足,提出一种在配电变压器低压侧安装电池储能装置的配电变压器重过载治理与功率因数提升方法。根据电池储能装置在配电网中的安装位置,从配电变压器的负载率和台区电压2个方面分析电池储能装置对配电网的影响;电池储能装置变换器采用电流内环解耦控制策略;基于江西某地区配电网的数据,搭建在该地区重载配电变压器低压侧投入电池储能装置
期刊
预测页岩气藏的长期生产动态和估算EUR值一直是一个难题,所选择的评价方法决定了预测的准确性。为了降低EUR评价的不确定性,本文分析总结了EUR各计算方法的适用条件,提出了在定压生产条件下,YM-SEPD方法相对于SEPD方法有更好的适用性。在进行产量预测时,首先要进行数据诊断,要剔除掉异常数据点,避免预测的EUR值偏差较大,然后进行流态的识别,用经验法和适合的图版进行产量预测,最后用解析模型验证分
会议
体系作战试验总体设计和评估是体系作战试验的关键环节,也是多用途战斗机作战试验实践中的重点和难点。本文建立了基于作战任务的试验设计理念和设计方法,提出了体系作战试验评估指标,并构建了相应的试验设计系统和评估系统,推进了体系作战试验探索和实践进程,可为多用途战斗机体系作战试验提供技术支撑。
会议
目的 对健康体检科体检人员的采血风险因素进行分析,针对性地制定管理对策并探究其应用价值。方法 采用回顾性分析的方法对2019年2月—2020年1月在健康体检科接受采血的体检人员临床资料进行分析,并总结采血风险因素。针对性的制定护理管理对策,并以2020年2月—2021年2月在本健康体检科接受体检的4 500名体检人员作为研究对象,随机分成对照组和研究组,每组人数均为2 250名。对照组体检人员在采
期刊
为明确主要气象因子与向日葵开花期等DUS测试测量型数量性状的关系,本研究从2017年至2022年连续6年在内蒙古巴彦淖尔市定点调查了气象数据和4个向日葵品种DUS测试性状数据,利用方差分析的方法对各品种DUS测试测量型数据年度间变化规律进行研究,后通过相关性分析明确向日葵数量性状与气象因子间的关系,利用逐步回归和通径分析的方法筛选出主要影响气象因子。结果发现:对开花期、叶片大小、株高、花盘大小影响
期刊
DUS测试指南是植物品种特异性(Distinctness)、一致性(Uniformity)和稳定性(Stability)测试的重要标准,是植物品种保护、品种审定、品种登记的工作基础。菱是我国南方地区重要的水生蔬菜,其品种资源丰富,差异明显,但目前尚未制定出菱属品种DUS测试指南。本研究共收集了我国201份菱种质资源,参照农业行业标准筛选出24个菱属品种作为标准品种。在4个生长周期的种植试验中,对标
期刊
<正>星链推出直连手机业务,下一站星地融合?据新京报10月12日消息,当地时间10月11日,马斯克旗下的星链(starlink)官方网站推出了直连手机业务。根据官网信息,星链预计在2024年实现短信发送,2025年实现语音通话和上网,同年分阶段实现IOT(物联网)。星链并非第一家推出卫星手机直连业务的公司。
期刊
番茄褐色皱纹果病毒(tomato brown rugose fruit virus, ToBRFV)是烟草花叶病毒属的一个新种,在自然界中主要危害番茄、辣椒等茄科作物。自2014年首次在以色列发现以来,ToBRFV迅速蔓延至全球4个洲的35个国家,严重影响番茄和辣椒的产量和品质。本文综述了ToBRFV的发现与分布、基因组结构、传播方式、寄主范围和检测方法,并提出了相应的防控建议,以防范ToBRFV
期刊
发挥信息技术的数学教育价值,离不开信息技术与数学教学的深度融合.本文中以函数概念教学为例,通过创设丰富的信息化学习环境,改善学生的学习方式,促进学生对概念和数学问题的理解,提升学生的核心素养.
期刊