【摘 要】
:
聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分的方法,在数据挖掘、统计学、机器学习、空间数据库技术、生物学和市场学等领域有着广泛的应用。聚类算法可以分为基
论文部分内容阅读
聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分的方法,在数据挖掘、统计学、机器学习、空间数据库技术、生物学和市场学等领域有着广泛的应用。聚类算法可以分为基于划分的方法、基于层次的方法、基于密度的方法、基于网格的方法和基于模型的方法。本文重点对层次聚类算法进行了分析和研究,并给出了层次聚类算法存在的缺陷,在分析Chameleon聚类算法的基础上,提出了一种基于动态近邻选择模型的Chameleon算法。社团结构是许多实际复杂网络中的一个重要特征。寻找和分析社团结构有助于更好地了解网络的内部结构,分析网络的性质。目前,人们已经提出了很多算法用于寻找复杂网络中存在的社团结构,本文将改进的层次聚类算法应用到复杂网络社团发现。论文的主要工作如下:(1)分析了现有的层次聚类算法,并着重介绍了BIRCH算法、CURE算法、ROCK算法和Chameleon算法,并比较了这些算法的优缺点。(2)在分析Chameleon聚类算法的基础上,提出了一种基于动态近邻选择模型的Chameleon算法。新的算法考虑了回溯机制,有利于合并之后的分解。在标准数据集Wine和Iris上的实验表明,DNMC算法的f_a指标优于M-Chameleon算法。通过计算各个属性的差异度,显示出一些属性的存在对于聚类结果影响很小,删除这些属性列可以降低时间复杂度。(3)简单介绍了复杂网络社团发现的主要算法,将改进的层次聚类算法应用于社团发现,取得了良好的效果。
其他文献
近年来Internet发展迅速,网络上需要组通信支持的各种分布式应用不断增多。作为支持组通信的主要技术,传统的IP(Internet protocol)组播技术要求网络为每一个组播组(甚至组播组
随着计算机科学的发展,各行业对软件产品的质量和开发周期提出了更高的要求。面对持续变化的需求,软件本身需要快速地做出响应。建模工具作为软件设计过程中的主要辅助工具,可以
全球经济的发展表明,一个国家的综合实力主要取决于其制造业提供产品和服务的能力。车间是制造企业管理和生产的基础环节,是企业管理与生产制造的结合部位,也是企业信息流与
装配序列规划是产品生产中的一个重要环节,合理的产品装配序列对装配效率的提高、装配成本的降低和装配质量的保证等有重要影响。因此,对装配序列规划的研究具有重要的理论意
建筑物的毁伤效果模拟属于虚拟场景生成的范畴,在游戏娱乐、军事训练、广告与电影制作、旅游等各个领域有着巨大的应用前景。传统的虚拟场景生成方法往往需要对场景进行三维重
统一建模语言(UML)是在多种面向对象建模方法联合的基础上形成的建模语言。它以支持面向对象、可视化建模和强大的表达能力等优点已经被人们广泛的用于多种类型的系统建模。
统计数据表明,我国的餐饮业正处于高速发展时期,与此同时,消费者对餐饮业的服务要求也越来越高,餐饮行业也面临着物价上涨和人力资源成本快速增加的压力。如何提高效率,减少
对业务流程建模是将业务流程计算机化的必要手段,同时工作流建模属于工作流管理系统的三大主要功能,目前已经成为工作流技术的研究热点之一。论文选择在形式化描述和直观图形
随着多媒体技术和计算机网络技术的发展,人们接触到的图像数据以前所未有的速度增长,越来越丰富的图像资源使用户难以在浩如烟海的数据中找到自己真正需要的信息。因此,对图像数
RFID(Radio Frequency Identification)技术是自动识别和数据采集技术的一种,为了在提高产量的同时降低成本,在商业信息化中RFID技术日益兴起,已逐渐深入到各个领域,如供应链