论文部分内容阅读
数据挖掘就是从大量的数据中提取或者“挖掘”知识,因此数据挖掘又被称为数据库中的知识发现。它是一个涉及多学科领域的新兴学科,并随着这些学科的发展而不断发展。随着PDA,手机,便携式和小巧的卡等移动计算设备在我们的日常生活中扮演着越来越重要的作用。带有合理计算和存储容量的移动设备的出现以及嵌入式数据库的发展开辟了高级数据挖掘和密集计算移动应用程序的新时代。这就为挖掘基于移动设备的潜入式数据库提供了可能。这是一个实时的嵌入式的数据挖掘环境,它能分析嵌入式数据库中的数据,并为用户的决策提出建议。金融数据的实时分析,过程控制,规章的遵守,安全应用这些都是基于嵌入式数据库的数据挖掘可以应用的领域。 关联分析是传统数据挖掘的一个功能,它用于发现关联规则,关联规则描述了给定数据集的项之间的有趣联系。目前,已经提出了许多挖掘关联规则的算法,其中最著名的是Apriori算法及其变形。这些传统的算法大多已经在传统的固定大型数据库上得到了实现,但是基本上还没有在嵌入式移动数据库上得到实现。在嵌入式移动数据库上的实现应该考虑到嵌入式移动数据库的一些自身特点。为了解决这些问题,本文介绍了关联分析在嵌入式移动数据库上的实现过程。 本文首先介绍了数据挖掘的基本概念、存在问题及发展方向。其次介绍了嵌入式数据库的基本概念,特点,发展。并比较了几种主要嵌入式移动数据库的特点。然后介绍了传统的关联分析的基本概念、分类及一些常见的算法思想,其中着重介绍了挖掘关联规则的经典算法——Apriori算法的基本思想和前人对它进行的改进。随后介绍:为了把Apriori算法应用于嵌入式移动挖掘中,我对它所进行的一些改进。最后介绍了一个自主设计实现的基于嵌入式移动数据库的数据挖掘系统。它的数据挖掘引擎就是采用了由我改进的Apriori算法。