基于两种不同构图方法的半监督分类算法研究

来源 :重庆师范大学 | 被引量 : 0次 | 上传用户:wcl929156
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息技术飞速发展的带动下,机器学习领域中的半监督学习自从产生便不断发展壮大,在丰富了数据挖掘、统计研究等相关领域的同时,也为其他学科实现快速发展提供了更好的机遇和更多的可能。伴随着“互联网+”时代的到来,在这样的环境下,大量的数据中隐含着的信息不断被挖掘利用,创造新的价值。基于图的半监督学习凭借其直观性也逐渐被更多的学者所研究和使用。利用样本集构图作为基于图的半监督学习的重要构成环节,往往决定着学习算法的效率高低,合适的构图能够带来更高的分类准确率。当下基于图的学习方法研究中采用的构图方法大多都是K近邻构图法,对于其他的构图方法的研究却相对较少。同时由于常用的构图方法在解决样本数据的连接边的对称性和连通性上存在一定的不足,因而对使用什么样的构图方法能够更好的提高基于图的半监督学习效率的问题研究是十分迫切和必要的。本文的主要研究内容如下:⑴通过查阅大量的国内外文献资料,结合国内外的研究现状和具有代表性的案例分析,对基于图的半监督学习的内涵和特点做了较为全面完整的综述,并概述了基于图的半监督学习方法的基本理论及技术;⑵为了克服半监督分类算法中常用的k近邻图构图方法不能同时满足边的对称性和图的连通性的不足,本文将最小最大邻域阶方法应用到半监督分类算法的构图过程中,提出了基于最小最大邻域阶的半监督分类算法(KMMLGC算法)。通过对随机样本数据和UCI数据集上的数据的仿真实验,表明了KMMLGC算法的有效性;⑶自然最近邻构图法是一种自适应的、无参数的搜索样本最近邻的方法。本文将自然最近邻构图方式应用到半监督算法的构图过程中,提出了基于自然最近邻的半监督分类算法(3NLGC算法),随机样本集和UCI数据集上的仿真实验表明了3NLGC算法的有效性,同时针对3NLGC算法和KMMLGC算法在UCI数据集上进行了对比实验,实验表明3N算法的效率更高。⑷最后,对本文所做的研究工作做了总结,提出了现阶段研究存在的不足,并对后续研究做出展望。
其他文献
在计算机辅助设计和制造系统中,每种系统都有自己规定的数据格式。由于存在众多的数据格式,给产品模型的信息集成、共享和交流带来了巨大的障碍。因此旨在交换图形数据的格式
在网络信息时代,企业和机构都在通过internet寻找新的商机和新的业务开展途径。与此同时,他们必须确保公开信息的信息资产的安全。随着客户、员工、合作伙伴和供应商的数量不
随着现代社会的发展和人们安全意识的提高,越来越多的重要场合,如车站、机场、银行、政府部门、居民社区等,都需要对人的身份进行鉴别。生物特征识别是一种利用人的生理或行
伴随着网络的发展,文本分类技术成为信息处理领域中重要的研究方向,通常用于处理和组织大量文本数据。蒙古语在中国来说是少数民族语言,蒙古文信息处理发展较慢,但在民族文化
蒙古族现在所使用的文字有传统蒙古文、托忒蒙古文和新蒙文三种文字。目前这三种文字主要采用人工转写的方法来实现文字之间的转换。当今时代是高科技迅速发展的信息化时代,
云计算作为计算机行业新兴技术的一个重要组成部分,其运行性能的好坏直接影响到处理大规模问题的效率。对此,探求优化组合智能算法是目前云计算研究的重要任务,同时也具有相
随着生物信息学的发展,生命科学数据呈爆炸式增长,迫使人们寻求强有力的数据管理和分析工具。数据挖掘是目前最有效的数据分析手段,用于发现大量数据所隐含的各种规律。在生
秘密共享是信息安全和数据保密的重要手段,可有效防止重要信息和秘密数据的丢失、毁坏、被恶意修改或被不法分子利用等。(k,n)门限秘密共享具有良好的性质,成为秘密共享中最
在过去的几十年内,数据采集能力的提高以及存储容量的增长,导致了科学研究的很多领域中信息量急剧增长,它向人们提供更加丰富、细致的信息的同时也造成了大量的信息冗余。在机器
随着我国海运事业的发达,为了改善港口船舶交通秩序、减少船舶交通事故、促进港口安全监督管理的现代化,各主要港口都在兴建船舶交通管理系统(VTS系统),采用先进的雷达系统、