论文部分内容阅读
数据挖掘是近年来发展十分迅速而且非常活跃的研究领域。关联规则挖掘是数据挖掘中的一个重要课题,关联规则挖掘侧重于确定数据中不同属性域之间的联系,找出满足特定要求的数据属性域之间的相互关系。
针对传统的关联规则挖掘没有考虑与项目相关的数量型数据,将模糊理论和关联规则挖掘技术相结合,描述了模糊关联规则的定义和性质,从理论上探讨了模糊关联规则挖掘过程和多层关联规则挖掘方法,研究了模糊多层关联规则挖掘算法,设计和实现了用VFP6.0产生模糊频繁集的程序,并利用它运行的结果来进行算法举例和分析。模糊多层关联规则挖掘可以看作是关联规则挖掘的一个扩展,该方法更能反映现实世界事物具有的模糊特性,能充分表达数据间的各种模糊关系,其挖掘结果更容易被用户理解和接受。
为了更好地提高模糊多层关联规则挖掘的效率,引入了三角模、模糊蕴含算子和蕴涵度的概念,使用了由t-模计算支持度的公式和由支持度计算蕴涵度的公式。利用蕴涵度代替置信度的方法,研究了基于蕴涵度的模糊多层关联规则挖掘算法。在由模糊频繁项集生成强模糊关联规则时,为了减少模糊候选项集中计算蕴涵度的时间,在处理冗余模糊关联规则的基础上,进一步改进了基于蕴涵度的模糊多层关联规则挖掘算法,理论和实验结果分析证明算法是正确的和有效的。