论文部分内容阅读
针对大规模数据流需要巨量存储空间,以及串行处理速度瓶颈,着力于解决处理后的精确度及数据压缩.在并行平台下,利用阈值滑动窗口技术将数据流分段送入各处理器,并使用基因表达式编程(Gene Expression Programming,GEP)的函数发现算法实现对数据模型的函数挖掘,提出了基于基因表达式编程的多数据流压缩并行函数替代算法PFR-GEP(Parallel Function Replace-GEP).在PC机群上的实验结果表明:该算法有效提高了压缩比例与运算速度,且具有线性加速比.