论文部分内容阅读
数据挖掘就是从大量的原始数据信息中,挖掘出对使用者有意义的数据并以此指导着人们的实践,从而产生效益和利润等。本文在第二章简要概述了有关数据挖掘方面的理论知识,包括数据挖掘的概念和方法等。在第三章的分类方法的介绍中,我们对分类的概念、特点和数据的处理步骤都简要地进行了列举和说明。在文中还主要介绍了两种聚类和分类的各自的分析方法,依次给了分析方法算法步骤和流程。笔者在本文中引用了经典的K-means聚类算法,这种算法的聚类中心通常采用类中的平均值,找出最合适的聚类中心。在本文中,笔者利用数据挖掘技术中的聚类分析方法和分类方法中的数据缩减的因子分析方法,对同一个数据进行了两种方法的分析,这样方便于比较和分析。为了使理论在实践中有着很好的应用,在本文的第四章和第五章中,笔者对采集到的数据通过补空、清理整理、除噪等操作步骤将数据规则化之后,利用统计软件SPSS for Windows 13.0对数据进行了仔细的分析,并得出了相应的实验结果,笔者采用了实验结果的直接表格和分析数据,此外还有碎石图等表和图进行了直接的展示,使实验的数据和结果一目了然。在进行完完整实验的过程后,在得出实验结果的基础上,对数据进行了进一步的总结分析并给出建设性的意见和建议,分析出了客户在产品满意度方面不满意的原因,由于篇幅有限且加强两种分析算法的特点比较,只在产品满意度这一方面进行实验,实验结果相比较,然后得出结论。本文除了对数据挖掘的基础理论知识简述之外,还对数据挖掘技术中的聚类技术和分类技术进行了重点描述和介绍。以安广网络某分公司的部分农网用户的满意度反馈表收集的数据为基础,对该数据中的产品满意度和服务满意度两大满意度中的子项进行聚类和分类中的因子分析的描述分析,在得出相关实验结果之后,实现了整个知识发现的过程,得出了客户不满意的地方所在,同理,我们还可以在此基础上,对更多的数据进行分析,得出更多我们想知道的数据,为该公司提高数字电视周边的一些产品质量和服务质量提供了相对有意义的决策依据。