论文部分内容阅读
膜计算是生物计算一个新的研究方向,其从活细胞处理化合物、能量及信息的方式中获得灵感,设计出分布式、并行计算模型——P系统。系统中每个细胞都是独立的反应控制单位,各单位自主进行计算,因此具有分布式和高度并行性计算的特点,运行效率很高。已在理论层面——数学和计算机理论方面,获得了较好的发展,其为设计离散的、模块化的算法模型提供了系统架构,并且由普通计算机实现了一些应用。膜计算的应用已涉及生物学、生物医学、计算机图形学、经济学、近似优化、密码学等领域,展现出巨大的发展潜力。数据挖掘分析是知识发现的重要阶段之一,不同的分析技术可以从不同的视角来分析数据,例如从探索性、统计上及预测性等角度来实现数据的可视化和多种形式的解读。聚类分析是一种重要的数据挖掘技术,当下的学术界、企业界和政府管理都面临数据洪流问题,借助数据挖掘技术可以发现数据背后隐藏的有价值信息,并以此获得优势。聚类分析通过将数据集划分为聚类簇,以实现簇内相似度最大化同时簇间相似度最小化,发现的聚类簇可用于了解数据分布特征。各种聚类方法也被不断提出和改进,而不同的方法适合于不同类型的数据。本文根据EC组织型P系统的结构特点及并行计算特性,将其应用于聚类分析中,主要进行EC组织型P系统在划分聚类和层次聚类中的研究。论文提出了一种对象控制流程的EC组织型P系统,利用对象在P系统中经由信道流动的特性来实现对各细胞内规则的控制,提升P系统的计算效率。本文的研究工作包括以下几个方面:一是设计出一种改进的EC组织型P系统——对象控制流程的EC组织型P系统,将P系统中的对象作为控制信号,利用其在系统中各个细胞间经由信道流动的特性来实现流程控制,使各个细胞内的规则按一定的流程顺序执行。二是构建了基于RKM算法的EC组织型P系统,设计出系统的膜结构、对象、规则等要素,充分结合RKM算法在处理球状簇的聚类分析中的优势和P系统的分布式并行计算特性,能实现较好的聚类效果。三是提出了实现HEMST算法的P系统模型,通过对子树代表结点集构造的EMST进行迭代聚类。MST聚类算法在发现不规则边界聚类簇方面有优势,构造的P系统模型能利用这一优势更好地实现聚类。并将构造的P系统模型用于高新技术企业层次的聚类分析中,并解决现实中的企业层次划分问题,将企业划分为处于不同发展层次的类型。进而可实现政府、行业对不同层次的企业的监管,采取相应的税收、科技计划、金融保险、项目用地等政策措施,鼓励和支持高新技术产业发展。四是构建了基于EC组织型P系统的协同过滤推荐模型,基于用户的协同过滤推荐是一种较为成功的推荐系统,但也面临可扩展性问题,随着用户和商品的增多,系统的性能会越来越低,利用P系统的并行计算特性显著提高算法的性能。