基于层次聚类的数据分析

来源 :安徽大学 | 被引量 : 0次 | 上传用户:qwc198762
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的快速发展,计算机技术已经被用于电子商务、商业管理、科学研究、政府办公等各个领域。特别是在Internet技术日趋成熟的今天,在互联网上存在大量甚至海量的数据,人们为了获取对自己有用的信息和知识,就必须解决信息过量与知识贫乏两者之间的矛盾,因此诞生了一门新的学科——数据挖掘。数据挖掘作为一门新的学科,有其特有的步骤和方法。数据挖掘是面向应用的,因此数据挖掘方法的优劣主要取决于在实际应用中的效果。数据挖掘的应用非常广泛,特别是经济领域。数据挖掘已经成为当今社会研究的热点。数据挖掘的基本方法包括分类、聚类、回归分析、关联规则、特征、变化和偏差分析。本文主要是基于数据挖掘的聚类算法的研究,首先阐述了当前数据挖掘的现状,并具体介绍数据挖掘的基本概念、基本方法和应用领域。其次,介绍了聚类的几种常见的聚类算法。再次指出了层次聚类算法与层次分析法的联合应用和一种基于云模型下的层次聚类并通过实验分析来验证。最后通过UCI数据进行试验分析和对比,验证本文提出的算法的有效性和可行性。本文的主要研究内容如下:(1)为了修改层次分析算法中不满足一致性的判断矩阵,提出了一种基于层次分析法(AHP)下特征根法(EM)的改进。该算法是在尽力保留专家意见的同时,对不满足一致性的判断矩阵元素进行适当修改和补充。之后给出了层次聚类算法与层次分析法的联合应用,以弥补单独应用层次分析法所带来的不足之处。(2)为了将层次聚类算法应用到模糊集合理论中并且可以对大量的高维数据进行属性的分析和聚类,提出了一种基于云模型下的层次聚类算法。云模型结合了自然科学规律的随机性和模糊性,本文将层次聚类算法成功应用到模糊集合理论,并给出了隶属度的判定方法。实验结果表明,云模型下的层次聚类具有很好的聚类效果,且随着数据量的增大与原始的层次聚类算法复杂度要低很多,这样可以做大数据的聚类。
其他文献
目的:通过对贵州省毕节市大方县乡镇卫生院绩效管理的实证研究,拟建立乡镇卫生院绩效考核指标体系,并与大方县2011年的实际绩效考核指标体系及考核结果进行对比,分析研制的指
随着社会经济的不断发展,科技进步的日新月异,人类社会已经步入知识经济时代,作为战略性资源以及国际竞争力核心要素的人才资源的特征越来越显著。人才资源,尤其是高层次专业
目的:研究我国贫困农村地区妇女主任对当地不同卫生机构孕产妇保健服务(医疗设备、医务人员技术水平和态度)的满意度评价及影响其评价的相关因素。方法:自行设计问卷,采取整
应用遥感(RS)、地理信息技术(GIS)及地统计学方法,对慈溪市匡堰镇生态系统服务功能价值空间分布进行研究,分析各样方生态系统服务功能价值强度的空间分布规律。结合半变异函
本研究以2011年国家青年女子网球冬训队队员为研究对象,通过文献资料、实地跟踪、测试及数量统计等方法,对中国国家青年女子网球运动员的力量训练进行了研究,揭示我国青年女
农村基层民主政治建设是我国民主政治建设的重要组成部分,是推进我国民主政治改革和经济发展的主要动力之一。我国现在处在民主政治改革和经济发展的关键时期,加强和促进农村基
社会转型期是个社会变革的过渡时期,以中国为背景的社会转型更具中国特色,中国的社会转型是与全球化、经济体制改革同步进行的,所以其社会转型所面临的冲突和矛盾更加明显,对中
杭州市锂电池行业近几年内申请的锂电池专利数量激增,相关专利不仅在国内得到了较好的应用,并且在国际上广泛布局;所涉及的技术领域逐渐拓宽,覆盖了锂电池产业链的各个环节;
以村镇银行和农村资金互助组织为主的新型农村金融机构,对构建产权多元、竞争充分的农村金融体系起到积极作用。本文以在吉林东丰诚信村镇银行和吉林梨树百信资金互助合作社