基于图的半监督学习的改进研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:lake_zhong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的飞速发展,人类收集数据和信息变得越来越方便快捷,随着信息量的日益增大,相对的却是对大规模信息的处理能力无法满足人类日常工作、学习的需要。对于大量数据进行学习的方法,多半还停留在传统的机器学习方法。传统的监督学习因为需要大量的人为干预来保证学习的质量,其繁琐程度与学习速度自然就成为了软肋;非监督学习虽然不需要人为干预,能提高学习的速度,但又因缺乏可信的监督信息而无法保证学习的质量。半监督学习作为一种新的学习方法,因其不仅可利用少数已标记数据,更可以使大多数的未标记数据参与到学习的过程中来的这一重要特点,已成为机器学习中新的研究热点。随着机器学习研究的深入,基于图的半监督学习算法,在复杂性和计算速度,以及精确度上,都有了长足的进步。在目前两类分类已成简单应用,多标签分类任务日益复杂的阶段中,基于图的半监督学习算法因其卓越的性能必将受到更多的关注。本文针对多标签分类问题,以基于图的半监督学习为主要研究内容,重点研究了提高其分类效果的关键技术,并取得以下主要研究成果:1)针对适用于多标签分类的ML-GRF算法,通过采用Spearman相关系数矩阵来构造标签相关性模块,提出一种改进的算法,以减少临时分类标记的不确定性。实验结果表明,该算法对临时分类标记有良好的稳定性,能提高分类的精度。2)针对基于图的半监督学习中,所构造的图在分类任务中的重要性,对其结构进行了优化研究。将图的权值矩阵逐块的进行分析与调整,以得到更好的分类结果,减少未标记数据在半监督学习的过程中所造成的负面影响,从而有效地提高了分类的准确性。
其他文献
图像分割是把一副给定图像按照一定的分割标准分成各具特性的区域,同时将其中感兴趣的目标提取出来。图像分割的难点在于在保持同质区域一致性的同时获得清晰准确的分割边缘,
报表设计工具是一种可通过拖拽操作,灵活地进行表格、形式、样式设计,并可导入用户报表数据的软件工具。报表模板库是报表设计工具的重要组成部分,可支持用户方便地进行报表
图像增强是一种基本的图像预处理手段,它对于改善原始图像的图像质量和视觉效果有着重要作用。本文针对X射线胸片中肺节点图像增强算法进行了研究,提出了新的X射线胸片肺节点
在软件生命周期中,软件测试是较为耗费资源和时间的一环,自动化测试虽然可以提高软件测试效率,但效果仍然比较有限,且无法解决耗费资源的问题。随着云计算的产生与发展,其诸
工作流技术把企业的业务过程管理从应用系统中分离出来,为企业更好的实现经营目标提供了先进的手段。但在工作流带来高效率的同时,其安全性也面临严重的挑战。访问控制成为众
随着嵌入式技术的飞速发展,嵌入式计算机渐渐渗透到人们生活的方方面面,其中某些关键性的应用对计算机的可信性要求越来越高,传统的嵌入式系统已无法满足这样的要求。嵌入式
随着空间数据库技术的不断发展和人们应用的增长,空间数据的时域信息的研究越来越受到关注。在这种情况下,时空数据库的诞生成为了必然。然而时空数据量的庞大和非结构化性给
信息时代的到来不仅提供了海量的数据供我们研究和使用,同时也对我们快速、有效获取信息能力提出了一大挑战。文章摘要则在一定程度上缓解了人们的这一难题。文章摘要能以简洁
随着现代信息技术的发展,数据流作为一种新型的、更切合实际的数据模型广泛出现在众多应用领域,各种应用已提出了数据流实时处理需求。由于数据流中的数据经常呈现高维性,其
电力通信网络作为电力网安全生产的重要保障,是电力网安全稳定运行的基础。电力通信网所承载的业务主要是与电力生产、运行相关的通信业务,包括保护业务、自动化业务、调度交换业务等,这些业务对电力通信网业务路由有特殊要求。随着电力通信网络规模不断的扩大,电力通信业务路由能否满足业务的通信要求受到越来越多的关注。如何确保电力通信业务可靠实时传输已经成为电力通信网中研究的重点。本课题在分析电力通信业务及其路由的