基于层次聚类的簇集成方法研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:shihaiquanhanhan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程。目前,文献中存在大量的聚类算法,但是每一种单一的聚类算法都存在各种不同的问题,很难满足实际问题的需要。为了提高聚类算法的性能,近年来人们开始将集成技术应用到聚类方法中的研究工作,并且提出了一些聚类集成算法。聚类集成作为一个迅速发展的新领域,已成为集成学习中一个重要的研究方向。本文对基于层次聚类的簇集成方法及聚类的有效性进行了研究。主要内容包括以下三个方面:第一在成对聚类集成方法(GPCE)基础上,研究了层次聚类的簇集成方法(HCCE),给出了基于层次聚类的簇集成算法框架。实验中,为了研究层次聚类中的三种距离度量方法,即单连接法、全连接法和平均连接法所对应的不同聚类融合方法的性能,使用了数据的分类信息Micro-precision对聚类集成的结果进行了评价。第二将稳定性指数引入到GPCE方法中,提出了改进的簇集成方法(HCICE),并研究了聚类的有效性,实验证明了用它能选择出较好的簇数,进而得到比较好的划分。为了体现HCICE方法优于GPCE方法和单个聚类方法,使用了ARI(Adjusted Rand Index)和Jaccard Index等两种评价指标对聚类结果进行了评价;最后,研究并讨论了聚类正确率和集成规模、簇的个数之间的关系。第三在选择性集成的基础上,提出了基于贪心选择的簇集成方法(GSICE),同时也提出了一种新的目标函数即Joint Criterion。首先利用HCICE算法得到L个聚类结果(划分),不用进行集成;然后利用基于Joint Criterion的贪心选择策略进行选择,得到K个聚类结果(划分);最后再对K个聚类结果(划分)进行集成。为了体现聚类集成选择的性能,实验中对该算法进行了研究,并与之前使用全部的聚类结果(划分)进行集成做了比较研究;同时分别使用ARI(Adjusted Rand Index)和Jaccard Index等两种评价标准对其结果进行了评价。
其他文献
目的 调查我院院内肠杆菌科细菌中产超广谱 β 内酰胺酶 (ESBL)菌株的发生率以及ESBL的表型和基因型。方法 对 1999年 2月~ 5月临床分离的 16 2株肠杆菌科细菌 ,采用美国临
本文从叙事学的角度 ,对话本小说“拟书场”的特殊叙事模式进行了总结。指出话本小说以模拟的说书人为特殊的叙述者 ,以假想的听众为程式化的叙述接受者 ,而固定的叙述者声音
<正> 人类的活动是有目的的。在进行各种认识或实践活动时,“为什么”这个问题是回避不了的。这就涉及到价值问题。现在,越来越多的幼儿园教师开始从事教育科研活动。那么,幼
主位推进是实现语篇衔接和语义连贯的重要途径,体现了语篇的结构框架和整体走向,反映了作者的谋篇方式和交际意图,因此是译者分析源语语篇的有利工具和构建译语语篇的重要参
管理实践的不断深入,哲学与管理的内在联系、理论与实践的密不可分,创造了管理哲学——“管理哲学即哲学管理”。管理哲学这一概念揭示了哲学与管理纵向、横向、辩证与平等联
黑井千次是现代日本文学史上被称为“内向的一代”的代表作家,从1950年起到现在一直活跃在日本文坛的中心,创作了许多批判现代日本社会、剖析日本人深层心理的小说。本文通过
背景:生物力学已被证实对骨组织细胞的形成、增殖和成熟起重要作用。目的:观察力学拉伸强度对小鼠单核细胞RAW264.7诱导分化成破骨细胞的影响。设计、时间及地点:随机对照体
口语交际能力已成为当今和未来社会人才的必备能力,对中等职业学校学生也不例外。然而,当前的中等职业学校语文口语交际教学却存在诸多问题,教学效果难以保证。调查表明,中等
有机电致发光显示(Organic Light-Emitting Diode,OLED)技术以独特的优点成为最具有发展潜力的新一代显示技术之一。本文就在平板显示器,尤其是有机电致发光显示器及驱动技术
随着电子技术发展,模拟电路复杂度越来越高,给电子设备的维护工作带来很大的困难。原先依靠维护人员借助简单仪器对故障设备进行修复的方法越来越难以满足社会的需求,尤其是