论文部分内容阅读
多维贝叶斯分类模型是一种描述类变量与类变量、类变量与属性变量和属性变量与属性变量之间的依赖关系的分类模型.本文针对完全朴素多维贝叶斯分类模型要求变量之间具有独立性假设,以及无法有效利用类变量和类变量,属性变量与属性变量之间的依赖关系等问题,研究了多维贝叶斯分类模型并进行了仿真实验.首先基于贝叶斯网络的最大似然值的打分方法,学习多维贝叶斯分类模型的类子图,属性子图和桥子图.再通过加边、减边或者转边等措施对最初的结构图进行改进,得到一个分类效果较好的多维贝叶斯分类模型.其次针对数据包含影响分类效果的冗余属性和无关属性,本文提出了一种新的基于马尔科夫毯的属性选择方法:把分类变量作为普通节点,学习贝叶斯网络结构,在此结构中寻找类变量的子节点和配偶节点,进一步在给定类变量时寻找与类变量的马尔科夫毯节点集条件独立的变量集,进而删除冗余属性节点.最后对三类数据进行仿真实验,结果表明本文采用的属性选择方法能够有效删除冗余属性变量,分类效果优于对比的其它分类算法.