基于节点重要性的聚类集成方法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:pdswzjhxr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成学习(Ensemble Learning)作为机器学习中一个十分重要的研究方向,广泛地应用于军事研究、科研教育和社会生活等诸多方面。它是使用多个不同的学习器将其结果整合去解决同一问题的机器学习方法。在互联网通信、卫星追踪、地震监测、人类基因库、语音识别、医疗智能诊断等诸多领域,集成学习技术已经得到了广泛的应用。在集成学习研究的前期,学者们面向的是监督式学习。而聚类集成作为非监督式学习,近年来才慢慢受到关注,成为机器学习领域又一个热门研究。聚类集成是将一个数据集的多次聚类标签结果进行整合,进而得到一个更准确的重新划分。目前,聚类集成重点研究两方面的问题:一是基聚类集的生成;二是设计有效的一致性函数(consensus function),也称为共识函数的设计。现有的聚类集成方法大多是将基聚类的集合看作是一个分类型数据集,然后对这个集合进行聚类。但是这种方法没有结合数据点本身的属性值,忽略了原始数据集,因此形成最终聚类所使用的信息是不完全的。基于这一情况,本文针对集成聚类中一致性函数的设计做了以下研究,主要内容有:(1)在现有一致性函数的基础上提出了一种面向分类型数据的Cate-NIR聚类集成方法。这种算法运用了节点重要性的思想(Node Importance Representative),对一致性函数进行设计,并在UCI分类型数据集上设计实验证实了该算法的普适性。(2)运用提出的Cate-NIR算法思想,针对数值型数据的特殊性进行修改,提出了面向数值型的Num-NIR聚类集成方法,并在通用的数据集上设计实验证实了该算法的适用性。以上研究明显拓宽了聚类集成算法的研究范围,为一致性函数的设计提供了新的研究方向,同时也为聚类集成的研究打下了基础。相信此类算法的不断研究可以解决更多的实际问题。
其他文献
习近平总书记指出,为了实现“十三五”发展目标,必须树立创新、协调、绿色、开放、共享的发展理念。作为湖南西部贫困山区要破解发展难题、厚植发展优势,必须从优化国土空间
如何在有限的时空内提高课堂教学效益,一直是教育者们关注的重要教研课题。课堂补救教学由任课教师在课堂授课完成后实施,被视为教学设计的反馈、矫正环节,是提升课堂教学效益的重要环节。传统课堂补救教学的内容与补救方式的选择往往通过课堂练习、学生提问或教师的授课经验而定,缺乏学生学习数据的支撑。由于课堂教学情况复杂,过于主观的对补救教学方式进行选择易造成补救教学效益的损失,进而影响教学效益。本文在深入研究国
本文结合自身的工作经验,从国家大学生创新性实验计划项目的选题、具体实施、项目总结及整体过程的教学体会,探讨了创新性实验计划中指导教师与学生之间的互动关系,论述了通过大
文章以小见大,从低碳旅游景区构建的关键一环——旅游交通为出发点,针对海南省旅游交通活动中客运索道、游船、观光巴士这三种不同交通方式及其碳排放进行分析,从而对海南旅
作为投影演示用的幻灯片所用图片,色彩一定要鲜明,我们可以通过“图形工具”选项卡下的“调整”功能区的色彩、亮度和对比度工具进行调整。如果亮度、对比度偏高或者偏低,可
清代婴戏题材绘画,不仅技法独特,其审美教育功能在婴戏题材绘画史上也有着独到之处,可惜的是对清代婴戏题材绘画进行专门研究的学者较少。焦秉贞的《百子团圆图册》作为清代
本文介绍用紫金Ⅱ微机及其模数转换卡(A/D卡)和游戏接口,将一台有两个机械扫描阀的压力传感元件组成微机控、测、处系统的工作。系统具有实时校正功能;可在每次实验后进行数
文章提出了一种新的神经网络算法——“距离定位法”来实现机器人在未知环境情况下的路径规划。地图采用神经元阵列表示,机器人通过自带传感器收集周围局部环境信息以及与目
知识经济时代,人力资源的重要性已不言而喻,尤其是在现代企业制度下,如何有效激励企业员工、提升企业绩效成为企业经营过程中的一个重要问题。在我国,物质激励仍然是最主要也是最有效的激励方式。绝对薪酬水平的提高可以有效提升员工的积极性,相对薪酬差距的扩大也可以激励低薪酬层级努力跨越至高薪酬层级、提升自身的业务能力,促进公司绩效的提升。但中国自古以来就弘扬“以和为贵”,高歌“不患贫而患不均”的儒家思想,人们
婴幼儿哮喘(Infantile asthma,以下简称IA)是哮喘病的一种特殊类型,其临床特征与治疗方法具有一定特殊性,我院儿科自1999年8月~2003年8月四年间收治64例IA患儿,现将其临床特征与治疗