论文部分内容阅读
随着网络的迅速发展和普及,分布式计算的研究在90年代后达到了高潮,目前,在Internet网上分布式计算已非常流行。分布式计算研究主要集中在分布式操作系统研究和分布式计算环境研究两个方面。在过去的20多年间出现了大量的分布式计算技术,如中间件技术、网格技术、移动Agent技术、P2P技术以及最近推出的WebService技术等。每一种技术都在特定的范围内得到了广泛的应用。但是,随着无线网络容量、带宽的增大,移动设备的快速发展和应用,开始提出了移动分布式的计算环境。移动挖掘正是在此基础上提出的。
移动挖掘的最大特点是面向数据流。移动设备资源有限以及数据流的高速、无限、随时间变化的特性给移动挖掘带来了挑战。因而,本文作如下研究,以解决在移动平台上的关联规则挖掘的问题。
1.充分利用FP-树的紧密性,在此基础上利用滑动窗口的近似策略,解决数据流高速性,无限性等特点,提出一个基于整个数据流历史频繁计数的数据流频繁模式算法DSM-FP1。
2.研究FP-Growth频繁模式生成过程,发掘内在并行性,提出一
个适合在移动分布式平台应用的数据流频繁模式挖掘算法DSM-FP2,充分利用移动计算平台上分散的计算能力;
3.在理论分析和实例分析的基础上,设计实现算法,再次通过实验验证所提出的两个算法的正确性和扩展性。与传统的关联规则算法相比较,在保持正确性的基础上,提高性能,稳定性和扩展性。
本文的研究意义在于通过对传统算法的改进,设计出适合移动环境的算法,对数据流挖掘进行有益的探索。