论文部分内容阅读
在数据挖掘研究领域,粗糙集和聚类算法等问题已被广泛研究。越来越多的学者深入地研究该相关领域,很多的问题已经不用使用某个单一的方法来解决,所以,将多种理论相互融合,如何来构造更为复杂的数据挖掘模型来解决真实数据分析问题,是目前研究的热点。本文基于粗糙集和聚类算法,主要做了以下工作:1、提出了一种改进的聚类算法:基于粗糙集的模糊聚类算法。这种算法将粗糙集和模糊聚类相结合,既利用了粗糙集近似集的思想,又利用了模糊隶属度聚类的思想。解决了边界不清晰的问题。2、将基于粗糙集的聚类算法应用于社会网络。通过利用粗糙集的思想,从K均值聚类算法的角度来研究社会网络,将社会网络进行聚类划分,解决社会网络聚类边界不清晰的问题,主要用于发现重叠社区,使得聚类结果能多角度地反映社会网络。3、提出了基于粗糙集聚类的预测模型:PCA-RKM-BP模型,该模型充分利用了主成分回归、粗糙集聚类和BP神经网络的优势,能有效提高预测精度。4、提出了基于动态粗糙集聚类和BP神经网络相结合的预测模型。针对现有聚类算法不能确定类数K的缺点,结合粗糙集的概念进行改进,构成一种预测模型,从而更有效地提高预测精度。