聚类有效性指标的研究与对比分析

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:liqiang20010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是数据挖掘的重要研究方法,聚类效果的合理性与聚类个数的事先确定有很大的关系,有效性指标可以帮助人们合理确定最佳聚类个数。本文在对比分析现有经典有效性指标的基础上,提出了一种新的基于隶属比的聚类有效性指标,并实验验证了新指标的可行性。本文首先对聚类分析的理论知识进行了细致学习研究。学习了一些常用的聚类算法并分析其对应优缺点,鉴于模糊C均值(FCM)聚类算法是大多数有效性指标的基本算法,本文重点学习研究了其基本原理和算法步骤并分析其算法性能。其次,对聚类有效性问题进行学习研究,学习了有效性问题的相关理论知识,实验论证聚类个数的事先确定对聚类效果的重要性,深入研究了几种现有典型聚类有效性指标的基本原理,为下文新指标的提出奠定基础。针对模糊聚类需要预知最佳聚类个数的问题,本文提出了一种新的基于隶属比的聚类有效性指标Vnew。首先根据经典有效性指标的设计思路,充分考虑数据集合的隶属度矩阵特征和数据集几何空间结构,通过重新定义类内距和类间距的方式,推导出基本的有效性指标;其次,定义隶属比的概念,放大基本有效性指标的计算值;最后,为了避免隶属比对有效性指标造成过分单调的影响而失去判定意义,引入分类个数c进行抑制。理论分析和仿真实验表明,通过对相同数据集进行分析处理,与对比典型有效性指标相比,新指标Vnew具有更高的准确率和可靠性,在类间有重叠数据的情况下也能够做出正确的判断,具有一定的推广价值。
其他文献
【摘要】实验教学作为提升物理课程教育质量的关键点。文章以推动物理教学发展为前提,围绕实验教学设计这一话题,分析了现阶段初中物理实验教学工作开展情况,并以沪科版物理教材内容为例,针对初中物理实验创新设计提出了几点建议。  【关键词】初中 物理 实验 学生  【中图分类号】G434;G633.7 【文献标识码】A 【文章编号】2095-3089(2018)27-0152-01  沪科版物理教材编设了大
小学美术课堂教学应以学生为主体,寓知识技能于兴趣之中,充分发展学生的个性,提高学生的审美能力,使美术学科成为一门活泼、轻松、富有魅力的学科,使美术课堂成为学生各显其
在自然界和生产过程当中广泛存在着两相流动现象,气液两相流是两相流的重要组成部分,在工业生产过程中十分常见,对其流动过程参数的准确测量一直受其流动状态复杂性的限制,而成为
【摘 要】在新时期教育教学过程中不可忽视的一个重要任务就是培养学生的创新意识、提高学生的创新能力。随着教育改革的不断推进,如何在小学数学教学中培养学生的创新意识和创新能力也已经成为每个数学教师不断探究的问题。小学数学教师有责任也有义务结合小学数学学科特点,想方设法在小学数学教学中培养学生的创新意识和创新能力。本文从培养创新意识的意义入手,对小学数学教学中学生创新意识培养的措施进行了探索研究。  【
通过PCR从已构建的猪源戊型肝炎病毒全基因克隆扩增ORF3全基因,将扩增产物插入到pMD18-T载体中,亚克隆至原核表达载体pET28a(+),构建pET28a-ORF3表达载体,转入E.coliBL21(DE3),IPT
【摘 要】在当今的信息化社会,利用信息技术引导学生认知事物规律,通过运用碎片化、结构化以及综合化的教学方式形成了一套“微课”教育体系。目前该体系已经在中学乃至大学广泛应用开来,并且取得了不错的效果。本文则是通过阐述“微课”的组成以及特点,提出了一些“微课”应用在小学英语教学中的建议开启了一条探究我国小学英语教学模式的新道路。  【关键词】信息化;微课;小学英语教育  【中图分类号】G623.31
英语在课堂上发挥着重要的作用,学好英语能提高学生的语言组织能力,还能丰富学生的知识视野,开阔学生的眼界。在教学的过程中,教师要改变传统教学模式的束缚,将多样化的教学方法应
冬凌草甲素(oridonin)是从冬凌草中分离出来的天然化合物,是冬凌草中最重要的抗癌活性成分,对乳腺癌、前列腺癌、消化道系统癌症和血液系统癌症等细胞具有显著的抑制生长作用
本论文将电化学有机合成和自由基化学相结合,利用电化学阳极直接氧化Br-,Cl-,CF_3-产生高反应活性的Br,Cl,CF_3自由基,避免了传统热化学氧化时外加的当量化学氧化剂,采用廉价易得的NaBr,NaCl,NaSO_2CF_3分别作为Br,Cl,CF_3源,电化学氧化直接生成Br,Cl,CF_3自由基,随后与烯烃加成,在DMF溶液中高效、高选择性实现了一系列芳基烯烃的溴、氯、三氟甲基化甲酰氧
分析了不在同一轨道平面的光通信终端搭载卫星的相对运动模型,通过对终端万向节指向的补偿校正来提高扫瞄捕获概率,缩短激光链路的建立时间,并对通信过程中的接收光束在电荷藕合