【摘 要】
:
K-means聚类算法是一种基于划分的聚类算法,在众多聚类算法的性能比较中,该算法具有效率高、可发现任意聚类形状、对数据输入顺序不敏感、且对于高维数据也有较好的性能,而得
论文部分内容阅读
K-means聚类算法是一种基于划分的聚类算法,在众多聚类算法的性能比较中,该算法具有效率高、可发现任意聚类形状、对数据输入顺序不敏感、且对于高维数据也有较好的性能,而得到广泛的应用,但是K-means算法需要事先指定K值,并且对于“噪音”和孤立点数据敏感。因此针对K-means算法的以上缺点提出了新算法,从以下两点对传统的K-means算法进行了改进。首先,将文档集合分成一定规模的子文档集,串行聚类。其次,在聚类中心的选择上使用遗传算法的选择、变异操作确定。并且通过实验证明了,该算法无论是在聚类中心选择的精确性还是聚类结果的准确性都得到了提高。
其他文献
现阶段,中国社会老龄化和城市化进程加速,脑血管疾病已成为严重影响居民健康的疾病之一,探讨其相关性因素,对于疾病的预防、诊断、治疗、预后非常有价值.脑梗死的病理学基础
数据挖掘(Data Mining, DM)是从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜在价值的信息或者模式。在数据挖掘概念提出以来十几年间,数据挖掘技术得到日益的
P2P技术作为一种新兴的网络技术在近几年得到迅速的发展。在这种非中心化的网络体系结构中,每一个对等体(Peer)之间可以直接通信,而不需要通过中心服务器,避免了在传统客户机
航片扫描仪是一种高精度的图像扫描输入设备,主要用于全数字摄影测量、遥感、地理信息系统等需要高精度航片数字化影像的领域,是测绘部门必备的图像扫描输入设备。在现阶段,
随着Internet技术的发展和应用,计算机网络对人们生活和工作的影响越来越大,校园网络更是发展迅猛异常。如何顺应历史的潮流,建设好自己的校园网是每一个建网学校所关心的问题。
当前,一个机构往往存在多个不同形式,例如,一个大型的企、事业单位,常有很多分支机构,由于工作的侧重点不同,各分支机构可能使用不同的数据库管理系统来管理数据,这样各机构
H.264编码标准与以往各种编码标准相比,具有更高的编码效率。然而,其编码效率的提高是以增加编码算法的计算复杂度为代价的,较高的算法复杂度在一定程度上影响了H.264的产业