论文部分内容阅读
该文以数据挖掘中的数据分类算法为主要研究对象.对决策树分类、贝叶斯网络和连续属性的离散化问题进行了的研究,实现了多种分类算法.在此基础上,利用最相邻子集筛选原理提出了两种决策树的优化算法LDT<+>和SubBagging,提高了原有分类算法的分类准确度.研究了贝叶斯网络的拓扑结构学习、参数学习和网络评估等问题,在此基础上设计实现了一种基于属性相关性分析的贝叶斯网络学习算法.同时,对分类算法中连续属性的离散化问题进行了研究.通过具体实验,分析和比较了层次聚类法、递归最小熵法和One-Rule等离散化方法的性能特点.在数据挖掘算法研究的基础上设计并实现了一个用于数据分类的数据挖掘系统——InfDM.