一种改进的离群模糊核聚类算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wergsdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一般说来,离群点是远离其他数据点的数据,但很可能包含着极其重要的信息。对离群点进行识别是相当重要的,它不但能够提高分析的质量,而且能够发现和研究离群点。本文对算法如何初始化参数进行了比较研究,提出用类心作为初始化参数并说明了其优点。针对聚类目标函数的选择,本文提出了一种全新的聚类目标函数——采用核空间类心的距离,即类心的核距离作为聚类的目标函数,并给出了该目标函数的推导过程。通过对本文算法和现有算法目标函数搜索空间的比较,得出文中算法的目标函数是较优的。本文还对算法的空间复杂度和时间复杂度进行了分析,说明本文算法在时间复杂度上比现有算法小。通过对仿真数据和真实数据的实验,测试了算法的可行性和有效性。首先,针对不同的数据集选取了不同的核函数进行了实验,并针对不同聚类目标函数进行了对比分析;其次,结合算法如何初始化参数的分析,对不同初始点对算法灵敏度的影响进行了比较实验;最后,本文对权重常量和权重指数的变化对聚类结果的影响进行了分析,给出了理论上的解释,并结合隶属度和权重系数的图进行了验证。实验结果表明改进算法能在保持聚类效果的前提下,很大程度的提高算法的收敛速度,大大减少算法整体的运行时间。
其他文献
PC104工业控制计算机在国内嵌入式应用领域占据了较大的市场份额。但是,国内PC104产品的核心集成电路,如处理器和芯片组等,全部依赖进口。研究开发高性能工业控制计算机系统
互联网的出现改变了计算机世界,XML的出现改变了互联网。W3C组织公布的XML标准为各种不同类型的信息定义了一个统一的标准,XML的出现同时也给计算机领域带来了许多新的技术。
网格是下一代Internet上的计算平台,其核心任务是管理分布在Internet广域环境中的各种类型的数据与服务资源,并为基于Internet的分布式应用提供一个统一的、虚拟的共享资源的计
随着计算机网络技术的飞速发展,各种网络设备、网络协议和网络服务推陈出新。网络的维护和管理面临着新的挑战,传统的集中式网络管理已经不能满足这种大型复杂网络的需要。移动
随着计算机和互联网络技术的普及应用和飞速发展,业界的分析家估计,对存储容量的需求以后会以每年50%—100%的速度递增;对众多企业而言,由于其工作性质的要求,致使数据必须在
数控加工是CAM的主要组成部分,数控技术及计算机辅助设计的发展使传统的机械设计与制造发生了根本性的变化。在开发基于PMAC卡的数控加工上位机监控系统,完成对加工过程的实时
MMC卡(多媒体存储卡)是一种广泛应用的存储设备,它可以作为单片机系统的外存储设备。本文所讨论的用于单片机的MMC卡的文件系统,可以提供一组文件操作函数,通过调用这些函数,单片
语义复合研究是一项面向计算机的以解决短语语义理解问题为目标的工作,直接地涉及到语言学和计算机科学两个学科,是对信息内容进行语义理解的重要环节。本文以概念网络模型为基
数字水印技术作为知识产权与信息安全保护的有利武器,成为当前研究热点。本论文主要对数字图像水印技术及其应用进行了研究,目的是解决其中两个问题:盲水印鲁棒性和不可见性
本文对互联网信息搜索技术进行研究,并在此基础之上建立一个基于分布式的互联网信息深度搜索系统。 首先分析当前普遍采用的互联网信息搜索引擎的优缺点,鉴于互联网信息搜索