论文部分内容阅读
针对数据流上变化的挖掘问题,提出了算法NBCC,首先利用精确抽样的方法对数据流构建概要数据结构,然后借鉴经典朴素贝叶斯分类方法的思想。将训练样本集分成Ci类,i=1,2,…,m。对测试样本集设定一个阈值α当P(Ci|X)〈α时,即当样本X属于任何已知类别Ci的概率都小于设定的α时,表明有变化发生,并且保留该变化,记为新类Cm+1,并重复使用该方法。