论文部分内容阅读
介绍了数值型和分类型属性的概念以及处理分类型属性的方法,详细探讨了一种处理分类型和数值型的混合型属性数据集的算法(k-pmtotypes);在此算法的基础上,提出了一种基于分组选择法确定初始点的改进算法;并使用实际数据集对改进算法进行了测试,用详尽的数据证明改进算法的正确性和较强的可伸缩性,最后指出了聚类分析技术的进一步研究的方向.