论文部分内容阅读
jBNC是一个著名的基于贝叶斯网的分类器,当处理的数据集不是很大,并且数据集的属性值的个数不是很多时,jBNC拥有很出色的性能.对jBNc原来计算统计信息的接口作出了修改,将巨大的数据集和jBNC所需要的统计信息存储到数据库的表中,并且应用SQL语句来计算各种所需要的统计信息.通过这种方法,jBNC就具有了处理大数据集的能力.实验结果说明了这种改进的有效性,同时也指出了该方法的缺点.