【摘 要】
:
现实中存在着大量的未标记数据,而对大量的无标记数据进行标记往往需要耗费大量的人力和物力,半监督学习(Semi-Supervised Learning,SSL)则是用少量标记数据进行预训练,大量未标记数据用于辅助训练的学习系统。如何提高半监督学习的精度,近十年来无数学者对此进行了研究,目前的大多数方法都是对无标记样本进行不同方式的处理,通过增加约束来提高学习效果。现实中的真实数据,训练数据可能是一个
论文部分内容阅读
现实中存在着大量的未标记数据,而对大量的无标记数据进行标记往往需要耗费大量的人力和物力,半监督学习(Semi-Supervised Learning,SSL)则是用少量标记数据进行预训练,大量未标记数据用于辅助训练的学习系统。如何提高半监督学习的精度,近十年来无数学者对此进行了研究,目前的大多数方法都是对无标记样本进行不同方式的处理,通过增加约束来提高学习效果。现实中的真实数据,训练数据可能是一个一个逐个到达或者一块一块逐块到达的,对于这样的数据,本文加入了在线序列极限学习机,使得在每轮迭代的过程中,不需要对所有样本进行重新训练,只需要利用新样本对网络进行微调,这就减少了样本的训练时间。而且现实中的真实数据大多数都是复杂数据,很多数据的分布都不符合高斯分布,有可能是非球形分布,或者是双峰型分布等,传统的一些分类算法和聚类算法对其很难起到很好的效果。因此,本文提出了一种基于密度的半监督在线序列极限学习机(D-SOS-ELM)。提出的方法可以实现逐个或者逐块的未标记数据的在线学习。此外,使用局部密度和相对距离还可以有效地反应样本之间的关系。与传统的基于距离衡量样本之间置信度的方法相比,提出的该策略提高了处理复杂数据的能力。本文的工作主要分两个部分:1.提出一个利用局部密度和相对距离的策略,用于衡量样本之间的相似性,选出高信度的样本进行在线学习,这样可以有效提高学习的准确性和学习的速度。通过不断的选择出的高置信度的未标记样本,所提出的方法实现了对未标记样本的高效学习。通过实验对比证明提出的方法可以很好的继承Clustering by fast search and find of density peaks(CFSFDP)算法对分布不规则数据有较好的判别的能力。2.对几个标准基准数据集进行多组实验对比,证实所提出的D-SOS-ELM模型具有较高的准确性,并优于现有的先进的方法。对MNIST数据集进行进一步实验,也得到了较好的学习结果。
其他文献
随着人类社会的进步与发展,对大功率的电池储能体系的需求愈发强烈。满足应用条件最有效的方法就是开发新型高比能电极,进而来改善二次储能电池。钼基材料例如:MoO2、MoS2、M
随着我国社会经济的逐步发展,个人所得税在我国税收体系中的地位渐渐完善,在改善个人收入、减少贫富阶层矛盾、合理收入分配等方面起着重要作用。由于个人所得税有调节个人收
令图G是简单图,V(G)是图G的顶点集.假设我们把V(G)划分成k个不交非空子集V1,V2,…,Vk,称[V1,V2,…,Vk]为图G的一个k-部划分.当k=2时,[V1,V2]称为G的二部划分.当G的二部划分[V
工程实践表明,旧沥青再生技术具有非常好的社会、经济和环境效益,该技术符合我国可持续发展的战略。SBS改性沥青具有优越的路用性能,近年来在我国路面工程中得到广泛的应用。
近年来预应力混凝土结构被广泛应用于桥梁工程中。但随着预应力技术在桥梁工程中迅速发展,也出现十分严峻的情况—许多预应力桥梁出现了不同程度的病害。究其原因有很多情况
化学链燃烧技术是一种清洁高效的能源转换方式,利用氧载体提供晶格氧,从而避免了燃料与空气的直接接触,在捕集CO_2的同时可实现燃料化学能的梯级利用。化学链气化技术通过控制燃料与氧载体间的氧碳摩尔比以实现燃料不完全氧化,从而制取可燃合成气。随着植物修复技术在治理土壤重金属污染上的大规模应用,如何安全地处理修复植物成为亟待解决的问题。贫铁矿石含铁量低,受技术水平及冶炼成本制约,其利用率低下。因此本文以贫
化学需氧量COD(Chemical Oxygen Demand)是指用化学方法测量水样中需要被氧化的还原性物质的量,是评价水质污染程度的一项重要指标,传统测量化学需氧量COD的方法比较繁琐,操作起来不方便,效率较低。本文的所研究的样本是多组甘蔗制糖业产生的废水样本。利用红外光谱方法,在多组不同波长点上测得污水红外光谱吸收值,旨在建立起污水红外光谱数据与化学需氧量之间的对应关系,实现减少实验操作,降
随着对涡旋光束轨道角动量特性研究的不断发展,人们发现涡旋光束具有旋转多普勒效应,依据入射到旋转目标表面涡旋光束产生的多普勒频移,即可直接计算出旋转目标转速,这一发现对于光学遥感旋转目标探测领域来说具有十分重要的意义。然而,完全相干涡旋光束在遥感探测领域应用,易受大气环境影响,相比之下,部分相干光比完全相干光受湍流影响要小,并且传输距离越远,效果越明显。部分相干涡旋光束则是一类具有轨道角动量特性的部
企业家精神是指企业家尽其所能进而追求利润的能力。企业家精神配置是指企业家将其能力在生产性和非生产性活动之间的配置。主流的学术观点认为,一国经济增长不仅取决于该国企业家的人数和才能,也受企业家精神配置的影响。而法治水平和市场化程度等制度性因素则是影响企业家精神配置的主要因素。就中国而言,改革开放以来,法治水平和市场化程度都较低,尚在逐步提升之中,腐败问题较为严重,但在这样的制度环境下,中国的企业家精
在“互联网+”、大数据等时代背景下,信息技术的使用成为了人们日常生活、工作和学习不可或缺的一部分,呈现一种常态化态势。在教育领域,教师利用信息技术开展教学活动已是普遍现象,教师的信息化教学水平已成为影响教学质量的关键因素,而职前教师信息化教学能力的强弱也必将对我国未来人才的培养质量产生深远影响,因此,作为职前教师培养基地的高等师范院校必须创新教师教育模式。目前国内师范院校主要通过《现代教育技术》课