群体智能算法及其在基因表达数据聚类中的应用

来源 :江南大学 | 被引量 : 0次 | 上传用户:ttw961086
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
群体智能算法是一种新兴的优化计算方法,自20世纪80年代提出以来,引起了众多学科研究者的广泛关注,目前已成为优化技术领域的一个热点研究方向。群体智能算法是基于群体行为对给定的目标进行寻优的启发式搜索算法,其寻优过程体现了随机、并行和分布式的特点。作为群体智能算法中的典型代表,粒子群优化(Particle Swarm Optimization,PSO)算法是由Kennedy和Eberhart在1995年提出的,其基本思想是受他们早期对鸟类群体行为研究结果的启发,并利用了生物学家Frank Heppner的生物群体模型。PSO算法具有计算简单,易于实现、控制参数少等优点,但是却不是一个全局收敛的算法。量子行为粒子群优化(Quantum-behaved Particle Swarm, QPSO)算法是在分析了PSO算法中粒子收敛行为的基础上,从量子力学角度出发,提出的一种全新PSO算法模型,具有控制参数更少,收敛速度快,全局收敛能力强等特点。本文以QPSO算法为核心,首先对算法的基本理论进行了系统的研究,提出了算法的改进方法。随后将QPSO算法应用到基因表达数据聚类分析领域中。基因表达数据聚类分析是生物信息学领域的研究热点和难点,本文将基因表达数据聚类分析问题归结为一个优化问题,提出了基于QPSO的基因表达数据聚类算法,取得了良好的聚类划分效果,为基因表达数据的分析开辟了新的方法与思路。论文具体内容如下:(1)首先对课题的研究背景进行了详细地综述,包括群体智能算法和基因表达数据分析的研究现状,提出了本课题的主要研究内容是QPSO算法及其在基因表达数据聚类分析中的应用。在此基础上论述了本课题的研究目标和意义,随后详细阐述了课题的研究基础,即PSO算法的基本理论,介绍了PSO算法的主要改进方法。(2)对QPSO算法的基本原理进行了介绍,针对QPSO算法存在的粒子早熟问题,提出综合学习QPSO(CLQPSO)算法。在CLQPSO算法中,种群中所有粒子的个体最优位置都被用来更新粒子的局部吸引子,这种新的学习策略保证了种群的多样性,从而防止了粒子的过早收敛。针对CLQPSO算法中的几个关键参数的选取问题进行了详细讨论,通过仿真测试给出了参数的经验设置。为了考察CLQPSO算法的收敛性能和优化求解能力,验证算法的优越性,选择包括CLQPSO算法在内的8个具有代表性的PSO和QPSO算法模型进行了数值仿真测试,测试结果及分析表明,CLQPSO算法对各测试函数具有较好的寻优结果,尤其适用于对多峰函数的优化求解,在保证收敛精度的同时,也具有较快的收敛速度,是一种具有较好收敛性能的全局优化算法。(3)简单介绍了基因表达数据聚类分析问题的相关基本理论,包括基因表达数据集的矩阵表示方式,基因表达数据的预处理,数据向量之间的相似性度量准则,基因表达数据聚类问题的描述以及聚类结果的评价。提出了基于聚类中心编码和基于类标签编码的QPSO基因表达数据聚类算法,并在6个选取的基因表达数据集上进行聚类仿真测试,对仿真测试的结果进行了详细的讨论。(4)对专门适用于求解离散空间优化问题的二进制编码QPSO(Binary QPSO, BQPSO)算法进行了深入研究,将综合学习策略引入到BQPSO中,替代原先BQPSO算法中局部吸引子更新时采用的交叉操作,提出了综合学习BQPSO(CLBQPSO)算法。对CLBQPSO算法的数值仿真测试表明,新的学习策略有效提高了算法的全局收敛性能。将其应用于基因表达数据的聚类分析问题中,提出基于类标签编码的CLBQPSO聚类算法。(5)针对之前提出的聚类算法需要预先确定聚类数目,无法在聚类过程中自适应调整最佳聚类数的问题,提出了两种基于QPSO的动态数据聚类算法。第一种QPSO自动聚类(QPSOAC)算法中,通过特殊的粒子编码方式,在每个粒子中增加一组阈值,作为控制对应聚类中心的开关,在聚类过程中,每个粒子中只有满足激活条件的聚类中心才会被选中进行对数据集的聚类划分。第二种QPSO动态聚类(DCQPSO)算法给定一组聚类中心,通过二进制编码QPSO中的粒子对聚类中心进行选择,再由二进制QPSO的迭代更新确定聚类中心的最优组合,并结合K-means聚类算法得到对数据集的最优聚类划分。在对两种动态聚类算法进行了聚类仿真测试验证算法的有效性之后,将它们应用到了基因表达数据的聚类分析问题中。论文最后对本课题的主要研究工作和所获得的成果进行了总结,并对今后的进一步研究进行了展望。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
<正> 《伤寒论》方中姜、枣的使用频率是比较高的,历代伤寒大家多忽视了对仲景姜枣用法的研究,近人又多把姜枣作为药引使用,其适应范围和用法用量也很不规范,加之药房无售,更
年度风险信息既可能提高信息质量进而对分析师跟随产生积极影响,又可能因增加分析师的风险感知进而对分析师跟随产生消极影响。本文通过文本分析法量化年报风险信息,探讨其对
本文通过对仿古建筑的防雷设计图纸审核及施工中存在问题的分析,运用现代雷电防护的相关知识,对仿古建筑防雷设计与施工进行了探讨.强调了仿古建筑防雷的重要性和其特殊性,阐
身份认证是计算机和互联网世界里最基本的一个要素,也是整个信息安全体系的基础。生物识别技术应用于身份认证是未来发展的趋势,相对于基于口令和智能卡的技术来说,生物识别
本文以成都和扬州古典园林为例,分析了城市的地理因素对各自古典园林的影响,提出了在土壤、降水、日照、区位等地理方面的因素对古典园林的植被、建筑以及核心景观风格存在着
基于响应曲面的实验方法,对溶液式空气除湿机组除湿量的影响因素进行了实验研究。回归了溶液除湿量与溶液再生温度、溶液浓度、溶液流量三者的关系式,分析了溶液参数两两交互
4月,丰田汽车采取行动,宣布开放其汽车电动化技术的专利(尤其是混合动力技术),此举有望一举多得。丰田的声明分为两部分:其一,其持有的近2.4万项与汽车电动化相关的技术专利
在人们的工作和生活中,市政道路发挥着十分重要的作用,因此市政道路建设问题受到了人们的普遍关注。本文对市政道路软基处理中存在的问题进行了分析,并且介绍了市政道路软基处理