论文部分内容阅读
提出了一种挖掘数值型数据流上的分类的方法,将精确抽样方法与贝叶斯方法合理配合使用,在构建数据流概要数据结构的过程获得了挖掘算法的关键统计量的值,同时,将连续类型的属性值进行了离散化处理,使得可以使用单一的方法来挖掘既包含离散类型数值又包含连续类型数值的数据流。在判断数据流元组的类别时,使用了多阈值方法以增加挖掘结果的可选择性。挖掘结果采用了实时直方图的方法来描述。实验表明,该挖掘方法是有效的。