K—Means聚类中序列模式和批量模式的比较研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:zxpmine01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘中的聚类分析对发现数据中隐含的类别和分布有着重要的应用.传统的K-Means聚类算法在给出簇数目的条件下能够对数据进行较好的聚类,算法采用批量模式进行学习,在每一趟数据扫描结束后更新簇中心.序列模式是另外一种学习方式,它每扫描一条记录就更新簇中心.本文提出并实现了基于序列模式的K-Means算法,并与采用批量模式的K-Means算法进行了比较.
其他文献
确定平面点集的凸壳是计算几何中的一个基本问题.一维可重构流水线总线并行机是近年提出的一种采用光连接的并行计算模型.本文在规模为n的可重构流水线总线并行机上提出了一
分布式体系结构已成为高性能路由器普遍采用的实现结构,然而迫切需要解决的问题是如何实现独立于上层软件及底层硬件的通用性支撑软件体系结构.本文针对高性能路由器体系结构
聚类是数据挖掘领域中最活跃的研究分支之一,聚类技术在其他的科学领域也有广泛的应用.迄今为止已经提出了大量的聚类算法,其中基于密度的DBSCAN算法因其很多优点而备受关注,
针对医学诊断知识获取问题,提出了基于Rough Sets理论的知识获取方法,利用该理论对数据进行分析,推理出可能规则,并提出了一种概率优化规则。通过实例分析,具体说明了该方法的实现步骤,包括连续信息系统的离散化、信息系统的约简、决策规则提取、决策模型生成等。讨论了知识处理的完整过程,能够有效地解决专家系统中知识获取的瓶颈问题,为人工智能技术在医学诊断领域的应用提供了新的思路。