论文部分内容阅读
                            
                            
                                面对“人们被数据淹没,却饥渴于知识”的挑战,数据挖掘(data mining)和知识发现(knowlegde discovery)应运而生,并得以蓬勃发展。关联规则(association rules)挖掘是数据挖掘众多功能中应用较为广泛,成效较为显著的一种,它最初分析事务数据集中项目之间的联系,后来学者们改进和扩充了问题原型,目前关联规则不仅有理论上还是应用上都比较完善了。在现实中,人们有可能对“购买某物蕴含不购买某物”这样的规则感兴趣,这种类型的规则就是负关联规则,它的重要性等同于正关联规则,负关联规则越来越受研究人员的重视。在挖掘负关联规则时,如果使用传统的衡量标准“支持度-置信度”,会出现大量冗余或错误的规则,所以制定有效的衡量标准在挖掘负关联规则时是至关重要的。  
 许多数据挖掘的问题可以看作是搜索问题,数据集看作是搜索空间,搜索策略可以用一些智能算法。文化算法、免疫克隆算法作为智能进化算法,具有全局优化搜索能力,其所提供的耐噪性、无监督学习、记忆等进化学习机理提供了新颖的解决问题的方法。由于智能算法具有许多优点,研究人员们在进行关联规则挖掘时使用智能算法搜索频繁项目集,从而提取关联规则。  
 本文的研究工作主要包括以下几个方面:  
 (1)分析了正负关联规则的基本概念及挖掘算法,重点研究了挖掘负关联规则时现有的关联规则衡量标准的不足之处,提出了一种新的衡量标准——有效标准,使用该标准可以同时挖掘正负关联规则,剔除无效规则。实验验证了方法的有效性。  
 (2)构造了一种基于文化算法和免疫克隆算法的正负关联规则挖掘算法,该算法将文化算法和免疫克隆算法相结合,新的衡量标准引入其中,同时得到正负关联规则。实验表明,该算法收敛速度快,并且得到有效的关联规则。  
 (3)研究了关联规则挖掘系统原型的设计思路、主要功能,并设计了正负关联规则挖掘系统,应用本文算法部分实现了关联规则挖掘系统原型的功能。建立科学的系统结构,利用挖掘算法的重用性和嵌入性,使算法与系统其他模块有机结合。