论文部分内容阅读
随着金融行业的快速发展,客户细分模型变得特别重要。客户细分模型是通过分析金融企业收集的客户基本信息,例如年龄、收入、婚姻状况等,将好坏客户区分开来。优质的客户细分模型是许多金融决策的有力支持,同时也会减少金融行业的风险。建立客户细分模型不仅可以减少风险,还可以节省大量的时间、避免资源的浪费。本文根据UCI数据库中的信用数据,建立科学有效的客户细分模型。从而提高金融行业的效率,进而避免资本的浪费。数据挖掘技术的发展为海量数据的量化分析提供了可能,成为金融领域不可或缺决策工具。在本文中,我们介绍了谱聚类算法。聚类算法是一个非常常见的数据挖掘算法,聚类算法也适用于数据的划分。传统的聚类算法仅仅能够处理低维数据,对高维数据(如信用数据)的处理效果不是很好。计算数据间距离是传统谱聚类算法中关键的部分,因此在进行谱聚类分析中,本文使用正交距离来代替欧式距离。随后本文将改进的谱聚类算法与传统聚类算法K均值算法和传统的谱聚类算法进行了比较。结果表明改进的谱聚类算法在处理客户细分模型上面有更高的准确度。基于正交距离的谱聚类算法比K均值聚类算法的准确率高出15%左右,基于正交距离的谱聚类算法比传统的谱聚类算法准确率提高了 34%左右。