【摘 要】
:
K-Means是一种基于划分的聚类算法,然而传统的K-Means算法事先必须知道聚类的数目值K,并且初始的K个聚类中心的选择是随机的。针对此算法的这两个缺点提出了一种改进的K-Mean
【机 构】
:
深圳大学图书馆 深圳 518060
【出 处】
:
2008全国软件与应用学术会议(NASAC'08)
论文部分内容阅读
K-Means是一种基于划分的聚类算法,然而传统的K-Means算法事先必须知道聚类的数目值K,并且初始的K个聚类中心的选择是随机的。针对此算法的这两个缺点提出了一种改进的K-Means聚类算法。首先引入自适应K值概念,给出某一教据集(例如文档集),计算不同K值下的聚类结果,通过聚类结果评估函数得到最优的K值,接着将样本数据转化为高维空间上的数据点,建立每个数据点的影响函数(数学函数模型),使其形式化描述数据点在其领域内的影响,计算数据点的密度函数值(该数据点与所有数据点的影响函数之和),从其中挑选出密度函数值较大且相互分离尽可能大的K个数据点作为K-Means算法聚类的初始中心点.实验表明,该算法可以生成质量较高而且聚类波动性较小的结果。
其他文献
从体系结构设计的角度,对构件的求精设计技术进行了研究,针对分布式系统的应用特征,提出一种基于求精的构件设计方法。实际应用表明,该方法支持面向重用的设计,可实现组合构
分布式技术使得应用系统的功能能够分布在各个不同的机器节点上,提高了资源的利用率,增强了系统的可靠性,但同时也使得节点之间数据交换量变大,数据访问变得复杂。为了实现分
本体被越来越多地运用于Web服务匹配过程.通过Web服务语义建模,构建领域本体、服务功能本体、输入输出参数本体来扩充Web服务标准UDDI信息。并通过服务功能本体对Web进行划分
事件流处理系统需要对连续到达的满足复合时序和属性值逻辑关系的多个事件进行关联,把多个原子事件复合为语义更丰富、更抽象的复合事件。已有研究提出了不同的复合事件检测
分析了影响中国需求抽取活动的因素,研究原型法深受欢迎的原因。在此基础上,提出了由多媒体辅助优化需求抽取过程的方法:一种多媒体与目标结合的需求抽取方法。这个方法根据
论述了一种基于小块图片的OGC高性能遥感影像地图服务方法。这种方法的核心思想是将遥感图像划分为小块图片,并且以多级目录的结构存储在服务器上。根据客户端的请求范围,通
提出了一种支持OWL-S需求规约演化的反射机制,在需求分析阶段,使用OWL-S描述系统的需求规约,使用OWL-SA描述需求变更,通过反射机制完成由用户个性化需求引起的需求规约演化。
近年来,随着中间件技术的快速发展,越来越多的企业需要用到各种各样的中间件;中间件的部署成为一项非常重要的工作。传统的中间件部署技术适用性较广,可以在大多数环境中使用;
SNORT是一个强大的轻量级的网络入侵检测系统,它具有实时数据流量分析和日志IP网络数据包的能力,能够进行协议分析,对内容搜索或者匹配。检测引擎作为Snort的核心模块,其模式
PMIC (power management integrated chip) devices become more and more important when more and more different chips integrated together. Such as in cell phone dev