基于图的半监督学习及其应用研究

被引量 : 0次 | 上传用户:geshufa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习的一项重要任务是对先验知识的表达和利用,除了类标记和成对约束等监督信息外,样本的空间结构也是先验知识的重要表现形式之一。近年来,得益于其对局部结构的刻画能力以及与经典方法(如正则化技术、核方法、谱图理论)的紧密联系,利用图来逼近数据间的局部流形的方法受到了研究者的大量关注。其中,基于图的半监督学习方法由于能同时利用部分有标记样本和大量无标记样本来提高学习性能,成为机器学习领域的研究热点之一。本文在分析了基于图的半监督学习的发展现状和现存问题的基础上,从图的构造和图的优化两大方面入手,围绕半监督图学习在分类、聚类和降维等典型任务中的应用进行了研究。论文的主要研究工作和创新点如下:1、提出了一个融合局部几何信息与全局判别信息的正则化框架。该框架具有一定的宽泛性,可通过选择不同的损失项和正则化项,推广到其他半监督分类算法的改进。作为该框架的一种具体实现,提出了局部敏感的判别直推学习方法,该方法在正则化框架中同时引入了有助于分类的样本局部结构信息和判别信息,从而最大程度地利用样本内蕴信息,能在每个局部邻域中进一步最大化类间样本的间隔。2、提出了一种利用先验知识来同时指导数据降维和聚类的方法。该方法构造成对约束信息的k-最近邻集并扩充成对约束集,分析成对约束实例包含的信息量并构造权系数矩阵,在加权成对约束信息的指导下求得投影矩阵,通过投影矩阵将样本数据投影到低维空间,使类内各点紧密分布,类间各点分散分布。同时,该方法通过一种新的评价函数对k-均值聚类算法进行了改进,能够在尽量不违反成对约束的情况下优化聚类性能。3、提出了一种基于结构和约束保持的半监督特征选择方法。针对特征排序选择算法在处理高维数据问题时存在的一些不足,通过引入以成对约束形式表现的监督信息,并借助流形学习的思想,提出一种能同时保持样本空间结构和监督信息的半监督特征选择方法。该方法同时考虑样本的局部和非局结构,融合成对约束信息,定义了一种新的特征评价准则——结构约束保持分(SCP Score)。结构约束保持分利用大量的未标记样本来学习样本空间的流形结构,利用少量的成对约束信息来学习样本的类内和类间边缘,所选择的特征子集较好地保持了空间结构信息和类属信息。4、提出了一种基于图随机游走的直推学习模型。首先将以Agent表示的样本点随机映射到格网表示的输出空间中,构成初始空间格局,空间格局随时间演化的过程是一个自组织的马尔可夫过程,它将在有限时间内达到平稳分布,从而求得最佳的标记分布,并从数学上分析了算法的性质。
其他文献
人类生活的真实世界都是一些模拟的物理量,而现代科技的发展,数字处理技术越来越成熟。由于数字处理有许多优点,所以一般人们都希望用数字技术来处理真实的物理量,而这就需要先
当建筑物发生火灾突发事件时,人员若能在允许的疏散时间内合理的选择疏散路径,安全地到达安全区域或逃离受灾区域,这对于减少受灾区域人民财产损失,保障受灾区域人民生命安全
为达到以三维工序模型作为机加工艺信息载体的目的,研究了三维机加工序模型的辅助生成方法。分析了工序模型生成的Petri网模型,划分了三维工序模型生成的阶段过程。面向机加
有效的教学策略不仅仅是在课堂教学中设计出完美的教学方案,而是在于如何让学生尽快学会知识,并将所学的知识应用到具体的事例当中.这就要培养学生学会针对一件事情,从问题的
现如今,各地学校在新课改的背景下积极改应试教育为素质教育,小学英语作为一门重要且实用的语言性学科,其教学方式的改革也同样迫在眉睫,对话教学的教学模式为此应运而生,本
进入知识经济时代,科研活动日益呈现出多人合作、协作攻关的特点。高校作为国家创新体系的重要组成部分,在其中扮演着重要角色。高校科研团队是高校开展科研活动的基本组织,
本文在对印象管理、自我监控以及自我监控对印象管理影响的以往理论进行综述的基础上,采用实证分析的方法,对当代大学生的自我监控水平影响其面试过程中的印象管理行为进行了
产品造型设计具有多角色参与、多学科交叉、多问题求解、多进程交互的特点,它本身存在着各种可能性。而通用化并非造型设计发展的一种障碍。相反,倒是一种迫切的先决条件。论
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.