基因表达式编程的早熟抑制策略研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:gsjsk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘已经成为当前数据库研究开发和应用的热点,函数挖掘是数据挖掘技术的重要研究方向。进化计算常常被用于自动的函数关系发现,基因表达式编程(GEP)具有编码简单,适应性强的优点,同时继承了遗传算法的简单性和遗传编程求解复杂问题的能力,但传统GEP有可能陷入局部最优的未成熟收敛的“早熟”陷阱。为解决这一问题,本文做了如下主要工作: 1)分析了GEP早熟现象,用实验验证了早熟现象对函数挖掘的影响; 2)借鉴生物界的“返祖现象”,引入回溯机制,提出基于回溯策略的GEP算法(GEP with backtracking strategy,GEPBS);提出回溯检查点概念,设计了等比递增检查点序列和加速递增检查点序列用于约束回溯过程; 3)扩充基于回溯的GEP算法和四个抑制策略(a)退化因子(RF)策略,(b)比例回溯策略(GEP with proportional backtracking strategy,GEPPBS);(c)自适应的回溯策略(GEP with self-adaptive backtracking strategy,GEPSBS(d)疏剪策略。借鉴植物人工培育的“疏剪方法”,在传统GEP算法的进化过程中引入疏剪策略(GEP with pruning strategy,GEPPS)帮助种群进化活动; 4)分析进化过程中种群构成特点,提出种群多样性度量标准(Diversity Measure Criterion),并结合前几种早熟抑制策略提出基因表达式编程的种群多样性保持策略(GEP diversity retain strategy,GEPDRS); 5)通过若干实验验证了以上算法能有效地改善传统算法在进化过程中的早熟现象,提高GEP自动函数发现的成功率。 本文的组织如下:第一节介绍了数据挖掘的理论基础与应用范围,并介绍了函数发现的目标、一般步骤和挑战;第二节介绍了本文研究的进化计算背景,分析了遗传算法、遗传编程等典型模型的特点和应用范围;第三节介
其他文献
随着Internet技术的发展,各种网络应用服务越来越多,BBS(Bullet in Boards System )的开设为广大网络用户开辟了自由发表言论的空间,但一些不健康的、反动的言论也给我们的社
汽车牌照自动识别技术可以应用于道路收费、交通管理等领域,起到节省人力成本、提高效率、改进管理体系等作用。随着我国智能交通行业的发展,车牌识别技术越来越呈现出巨大的
计算几何是理论计算机科学领域中一个新的极有生命力的子领域,而Minkowski和算法作为计算几何研究领域中的一个分支,在理论和应用上都有着重要的意义,其研究成果已在机器人学
在网络迅速发展的时代,校园网的规模不断扩大,网络应用日益开展,校园网安全性的管理变得复杂,对网络管理员的素质要求越来越高。同时,网络安全事件频繁发生,病毒肆意快速传播,而网络
移动自组网(MANETs)是一种无固定基础设施支持、由移动节点自组织形成的网络。由于网络自身的特点,如网络拓扑结构和成员关系的动态性、无线信道的不可靠性等因素,使得移动自组
本文介绍了粒度计算的研究背景,研究现状和研究意义,着重阐述了粒度计算的主要理论模型。在此基础上应用抽象粒模型的思想,将粒层内部的结构,粒层的转换,粒层转换的不变性等问题从
大规模、细粒度、长时间的分布仿真对仿真系统的计算能力、可靠性、容错性的要求越来越高。而作为分布仿真系统建立与应用标准的高层体系结构HLA(High Level Architecture)在
追求性价比、降低TCO是中小规模视频点播最重要的目标。基于开源软件和廉价PC的Bluegrid视频点播集群系统实现了一种部署简单、维护方便的视频点播服务解决方案,具有很高的实
网络数据信息爆炸性的增长,宽带的快速发展,存储已经成为企业信息系统的基础和核心。随着企业信息的快速增长和对安全、可靠性等要求的提高,使得存储技术变得越来越重要,存储技术
在无线传感器网络体系结构中,网络层的路由技术对无线传感器网络的生命周期至关重要。分簇路由具有拓扑管理方便、能量利用高效、数据融合简单等优点,成为当前重点研究的路由技