论文部分内容阅读
由于数据流研究的特殊性,在算法测试过程中通常都要用到大量的人工生成数据。随着对多层次数据流研究的发展,传统的人工数据流生成器变得难以满足要求。本文提出了一种两阶段的方法用于生成包含层次信息的数据流,第一阶段通过用户参数构造层次结构,第二阶段使用模拟随机变量抽取层次结构中的数据项。进而构造出满足特定分布的层次数据流。该人工层次数据流生成器不但可以按照用户要求生成基于多种概念层次的多维数据流,也兼容了一般数据流生成器的功能。