论文部分内容阅读
膜计算是自然计算中一种新型的方式,是在活细胞以及器官和组织的结构和功能的启发下,抽象出来的计算模型。膜计算模型具有极大并行性的处理能力,它为计算机学注入了新的思想和方法。同时,有些生命活动的建模和仿真也依赖于膜计算模型。目前,膜计算已经引起了学者们的广泛关注和研究,在数学、医学、生物学、图形学和经济学等学科领域获得了应用,有着很好的前景。近年来,随着“大数据”时代的到来,数据挖掘已然成为学者们研究的热点。关联规则是数据挖掘领域中最重要的研究课题之一。其中,挖掘频繁模式是主要内容。频繁模式是指频繁地在事务数据库中出现的项的集合。本文以两个经典的频繁模式挖掘算法(Apriori算法和FP-Growth算法)为例展开研究。通过对这两种频繁模式挖掘算法进行深入理解与分析,将其与并行性和分布式的膜系统结合起来,从而实现算法的改进。最后通过仿真实验与结果分析,证明实现Apriori算法和FP-Growth算法的膜系统具有良好的有效性和可行性。本文第一章是绪论,介绍了论文研究背景和意义以及目前膜计算和关联规则的国内外研究现状。第二章是膜计算概述,介绍了膜计算的产生与原理。同时,基于三个关键要素——膜结构、膜内对象和进化规则,分别对膜计算模型进行分类,并且提出一种S细胞型膜系统。第三章对传统的Apriori算法进行改进,并且在改进的基础上构造实现该算法的S细胞型膜系统。该膜系统基于并行性的处理能力,按照一定的标准将已有的频繁2项集进行分组,然后将不同的组送入到不同的膜中继续进行频繁模式的挖掘,降低了时间复杂度,提高了算法的效率。第四章以FP-Growth算法为例,将MapReduce结构与膜系统进行结合,构造了基于MapReduce结构实现FP-Growth算法的S细胞型膜系统。构造的膜系统主要有两个关键点:(1)利用MapReduce结构,通过在不同的Map和Reduce工作室中对所有事务进行处理,得到频繁1项集。(2)对于每个频繁1项的子数据库,将不同的条件模式基分配到不同的Map和Reduce工作室中继续挖掘频繁模式。在这里,每个Map和Reduce工作室都用膜系统的膜进行表示。基于以上两个改进点,该膜系统能够并行性地完成频繁1项集以及各个子数据库中频繁模式的挖掘,避免了在传统的FP-Growth算法中需要递归地产生大量条件FP树的可能,减少了内存的占用空间。最后,通过实例以及仿真实验,证明了该膜系统的可行性。第五章是S细胞型P系统在微博用户推荐中的应用研究。在本章中,基于关联规则和MapReduce结构提出了面向微博用户推荐的S细胞型P系统,并且通过实例具体地阐述了该P系统的运行过程。第六章是总结与展望,对论文的所有研究内容进行了论述,同时指出了在以后的学习中需要注意的问题和主要的研究方向。