基于划分的联机聚类算法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:dzluzd2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,数据流模型已成为诸多应用的常用模型,其固有特点也致使传统聚类算法在此模型上面临严峻挑战。其次,一系列数据流聚类算法虽相继被提出,但仍存在诸多不足,如现有基于划分的数据流聚类算法难以处理非线性和高维数据等。对此,本文侧重于基于划分的联机聚类算法研究,具体如下:(1)基于核模糊C-均值(KFCM),提出了一种针对大规模数据的联机核模糊C-均值聚类算法(OKFCM),同时考虑到核参数的选择困境,借鉴多核学习思想,通过组合不同参数的多个核,进一步衍生出了联机多核模糊C-均值聚类算法(OMKFCM)。由此,在有效缓和核参数选择难题的同时,核联机算法不仅继承了KFCM优越的聚类特性,在某种程度上还拥有了集成算法的优势。(2)基于模糊C-均值(FCM),提出了一种针对高维数据的联机局部自适应模糊C-均值聚类算法(OLAFCM)。OLAFCM通过为各类特征属性分别赋以相应的局部权重,使各个类分布在不同属性组合的张量子空间内,从而有效避免现有数据流聚类算法在高维空间中面临的“维数灾难”等难题。此外,考虑到输入参数对领域知识的依赖性难题,进一步发展出了基于凝聚的联机局部自适应模糊C-均值聚类算法(OLAFCM_CA)。在人工和真实数据集上的实验结果显示,所提出的新算法成功缓解了对初始化聚类类数的敏感性难题,且比现有基于全局降维的划分联机算法具有更好的聚类性能。
其他文献
建筑交易信息平台是保障建筑市场公平、公开开展交易活动的基本条件,原有的软件系统已不能满足管理中心日益发展的需求,迫切需要开发具有扩展性强、配置方便和服务质量高等特点
现阶段,联网审计在解决因数据量迅速膨胀带来的审计难题方面表现出了很大的优势,且极大地削减了审计成本,因此,在较短的时间内得到迅速推广,逐步取代了传统的审计手段。但是其仍然
饮食习惯健康与否与人们的日常生活息息相关,随着医疗水平与科技水平的不断发展,人们越来越关注健康问题。移动医疗也在这样的情境下应运而生,对生活音信号进行监测,不仅能够对饮
地震灾害是人类面临的最严重的自然灾害和世界上最重要的科学挑战之一。长久以来,人类对地震预报的研究投入了巨大的努力,给予了极大的关注。自20世纪中期以来,世界上许多相关学
随着信息技术的不断发展,传统的对社会保障的人工审计已经不能满足现阶段的审计需求,因此,利用计算机进行审计工作成为了一种有效的方法。在利用计算机进行社保审计时,第一步需要
作为新兴的安全访问策略,RBAC由于具有模型清晰、扩展性大、稳定性高、易于应用等优点,被越来越多的研究者所关注,其研究范围也不断扩大并被越来越广泛的应用于各个领域来减少管
E-Learning(Electronic Learning),又被称为网络化、数字化学习,是一种新的教育方式,学生可以通过互联网进行快速有效、探索、延伸性的学习。WebQuest教学模式是E-Learning教育方
大力发展奶牛畜牧业可以在很大程度上促进我国的经济发展。因为牛奶食品有很高的营养价值,它含有120种人们所需要的营养成分,含20多种氨基酸和20多种矿物质及多种维生素。因
三点相关函数是天文学中主要的宇宙模拟算法之一,如何对其进行高效的计算一直是困扰天文学家的难题之一。本文基于对FFT三点相关算法的研究,为改进该算法计算精度不足和面对海
随着政府部门政务信息化程度的进一步提升,大量的信息开始以电子数据的形式存储起来,并被信息系统统一管理。但大量的文本信息仍以文档的形式被使用,文档中大部分的信息未能被深