基于网格的加权平均密度自适应聚类算法及其应用研究

被引量 : 0次 | 上传用户:tianxia108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘领域中的一项重要内容,也是研究的热点。聚类分析能够发现数据的内在分布,也可以作为数据预处理技术,如离群点检测等。聚类分析被广泛用于信息检索、趋势分析、遥感图像等。本文在深入研究聚类分析中的网格划分及边界点提取问题的基础上,提出加权平均密度和自适应容纳阈值概念。然后以这两个概念为基础,对基于网格的密度聚类算法的网格划分方法、聚类边界点提取方法和算法基本思想加以改进,构造基于网格的加权平均密度自适应聚类算法。本文的主要研究内容如下。(1)阐述了数据挖掘含义;论述了数据挖掘所发现的知识、数据挖掘功能、数据挖掘系统组成及其挖掘过程。在此基础上,讨论了聚类分析的基本含义、应用要求和常用算法。分析了传统网格聚类算法和几种改进网格聚类算法的网格划分方法、算法基本思想和各自的优缺点。(2)根据聚类过程中网格尺度变化方式,提出了将网格划分分为均匀网格划分、边长自适应网格划分和区域自适应网格划分的一种新的网格划分分类方法,分析了这3种网格划分方法各自特点并进行了相互比较;根据聚类过程中两种不同密度计算方式,提出了将边界点提取方法分为窗口延伸法和k-近邻延伸法的一种新的边界点提取分类方法。分析了这2种边界点提取方法各自特点并进行了相互比较。(3)提出了加权平均密度和自适应容纳阈值概念。然后以这两个概念为基础,对基于网格的密度聚类算法的网格划分方法、聚类边界点提取方法和算法基本思想加以改进,构造了基于网格的加权平均密度自适应聚类算法。(4)在构造基于网格的加权平均密度自适应聚类算法的算法步骤的基础上,对该算法进行了实验仿真,包括有效性验证、参数变化对聚类结果具有影响的例证、时间性能测试。然后将改进算法与SCI算法对簇不相连数据集聚类结果及簇相连数据集聚类结果进行了比较,验证了改进算法能降低参数敏感性、提高聚类准确率、提升簇相连数据集聚类的有效性。最后将改进算法应用于入侵检测中,证明了改进算法对网络入侵数据集的聚类有较高的准确率。最后,对本文的工作进行了总结并对今后可能的研究方向进行了展望。
其他文献
教师赋权增能是教师专业发展的心理需要和权力重新配置的过程。"教师赋权增能"理论强调尊重教师个体的主观能动性,主张赋予教师以教学政策制订及决策的权力,从而有效地从内部
目的:通过评价针刀松解华佗夹脊穴和阿是穴治疗胸段带状疱疹后遗神经痛的临床疗效,建立操作规范、疗效好、易推广的治疗带状疱疹后遗神经痛的新方案。为针刀的研究和华佗夹脊穴
<正> 近年来人体科学的研究表明,当人体处在气功和人体特异功能这二个功能态时,人体可以具有许多非凡的能力,同时人们可以观测到许多神奇的现象。原北京有线电厂职工赵学忠在
现实社会中的话语权之争主要体现为意识形态话语权之争。中国共产党意识形态话语权实质上是马克思主义话语权。从构成要素上看,其内涵可以界定为在中国革命、建设和改革的历史
自中国——东盟自由贸易区建立以来,中国与东盟双边贸易效应已经逐步显现,中国已经成为东盟第一大贸易合作伙伴,而东盟成为了中国第三大贸易伙伴。重庆与东盟国家之间的经济贸易
郝学君教授从事针炙临床工作近40年,所治疑难杂症众多。郝教授在以火针治疗湿疹方面自成一法,并非针对局部皮损施针治疗,而是以辨病、辨证理论为指导,依据"外症发于外而源于
史铁生是一个沉冥于生命的有限、欠缺又追求无限、超越的作家,诗性的梦想、智性的哲思与神性的祈盼是其创作的三维,这在其笔下的女性形象身上亦有所体现。女性形象是其"南方
"窠囊"是痰瘀互结理论中的重要概念。本文基于古代文献,系统阐发了"窠囊"之病因病机、病性、临床表现及治疗等方面。认为痰瘀同源是窠囊的病因基础;气血津液的运行失常是窠囊
近年来,许多大型企业由于对涉税事项处理不当,不仅导致企业面临严厉的税务处罚,而且还影响了企业的声誉,因此,许多企业越来越重视对税务风险的控制。报业集团作为文化企业,一方面,由
以梅山MYF30H永磁锶铁氧体预烧料为原料,分别采用滚筒球磨机和砂磨机进行球磨制备铁氧体材料。粒度分布、X射线衍射(XRD)和磁性能分析表明,与滚筒球磨相比,砂磨机磨出的料粉