基于遗传算法的双聚类算法在基因表达数据中的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:pz421769788
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因表达数据分析能够为基因调控机制的研究以及肿瘤疾病的药物治疗提供宝贵的信息参考,有着十分重要的意义。随着基因芯片技术的不断发展,基因表达数据的数据量也在呈指数型增长。因此,如何更加有效的从海量的基因表达数据中挖掘出有用的生物学信息是一个值得挑战的问题。双聚类算法的提出为基因表达数据的分析提供了新的有效的方法。双聚类算法可以找到在特定的条件集下具有相似表达模式的基因集,突破了传统聚类分析方法的局限性,是目前基因表达数据分析中研究的热点。在众多的双聚类算法中,遗传算法由于其突出的全局搜索能力,被广泛应用于双聚类挖掘问题中。大多数传统的基于遗传算法的双聚类算法在评估双聚类的质量时,是把双聚类看成一个整体去评估,而没有单独考虑每一个行和列对于相应的双聚类的贡献程度。也因为如此,大多数遗传双聚类算法只简单考虑了以双聚类为个体的单一种群的遗传进化。随着基因表达数据矩阵的增大,遗传算法的搜索空间也急剧增长。在庞大的搜索空间下,单一种群的遗传进化搜索更倾向于收敛到局部最优解而无法有效的找到全局最优解。出于这样的考虑,本文在传统的以双聚类为个体的种群的基础之上,创新性的提出了以行和列为个体的新的行列种群,并设计了新的编码方案和适应度评价函数。另一方面,传统的以双聚类为个体的双聚类种群和本文所提出的以行和列为个体的行列种群是两种不同类型的种群,应对应着两个不同的遗传进化学习的阶段。因此,针对这两个不同的种群,本文创新性的设计了一个双阶进化算法框架,让两个不同的种群分别在两个不同的阶段进行遗传进化学习,并且通过两个种群之间的交配过程进行种群间的信息交流,从而进一步促进两个种群的进化学习,最终得到更好的双聚类结果。本文在新的双阶进化算法框架的基础之上,分别基于单目标遗传算法和多目标遗传算法,提出了两种双阶进化双聚类算法应用于基因表达数据的双聚类问题上。为了验证本文所提出的两种双阶进化双聚类算法的合理性和有效性,本文从人工模拟数据集和真实基因表达数据集两个方面,设计了多个对比实验,并与多个经典的双聚类算法的实验结果进行了对比分析。实验结果表明,本文所提出的两种算法在人工模拟数据集和真实数据集上相比其他算法都有更好的表现。
其他文献
胶质瘤是一种侵袭性强的原发性中枢神经系统瘤,每年导致大量胶质瘤患者死亡。由于其具有较强的侵袭性和耐药性,传统的治疗方法不能彻底去除胶质瘤,且预后效果差,因此开发新的治疗手段和化疗药物对胶质瘤病人具有极其重要的意义。多拉菌素是阿维菌素的衍生药物,属于大环内酯类抗寄生虫药物,可以广泛的抑制动物体内和体外的寄生虫活性,在家畜业中被大量使用。它与其它大环内酯类药物相比,多拉菌素在动物体内半衰期更长,吸收更
目的研究重组人血管紧张素转化酶2(Rh ACE2)对血管紧张素II(Ang II)诱导的人肾小球系膜细胞(HRMCs)增殖凋亡的影响。方法在含有胎牛血清的低糖DMEM培养基条件下培养人肾小球
三维测量技术作为一种能够获取被测物体表面三维信息以及三维模型的技术,已广泛应用于3D打印、机器视觉、虚拟现实等领域。小波变换轮廓术是一种基于光学的物体三维测量技术,
无线“日盲”紫外光(Ultraviolet,UV)可以通过大气粒子散射实现非直视通信,且具有安全性好、抗干扰能力强、保密性高等优势。然而,无线紫外光散射传输衰减严重且发射功率受限
近年,伴随电子商务的快速发展,Web上的商品图像急速增长,如何有效地组织并管理商品图像,进而向用户提供准确、便捷的检索服务是制约电子商务发展的关键。对大规模图像进行有
作为目前主要储能装置的锂离子电池已经在新能源汽车等领域实际应用,但其较低的能量密度无法满足电动汽车对于高里程续航的要求。因此,理论能量密度高达3505 Wh kg-1与汽油相近的锂氧气电池便引起了人们的广泛关注。它有可能取代锂离子电池作为下一代的储能装置。典型的可充电锂氧气电池由锂金属负极,多孔空气正极和锂离子导体的电解质组成。在放电过程中通过氧还原反应(ORR)将Li_2O_2沉积在阴极表面,并
语音感知是声信号处理的重要研究内容。在户外环境中,远程语音信号信噪比较低,并受到各种噪声和干扰的影响,语音增强是麦克风阵列处理中的一项具有挑战性的任务。本文围绕高
随着人们对图像、音频和视频等多媒体数据需求量的持续增长,无线多媒体传感网技术日益影响民众的生活。无线图像传输技术的应用前景广阔,因此具有图像感知的多载波基带发送电
网络编码领域内的子空间编码(Subspace codes)是一种十分特殊的纠错码。它与一般传统的纠错码相比的特别之处就是:它的每一个码字都是一个子空间,子空间距离就是码字性能好坏
视频目标跟踪是对视频每一帧中的目标位置进行估计的方法,在交通等领域有着广泛的应用。目前,国内外研究学者对视频目标跟踪问题进行了大量的研究,并提出了很多有效的跟踪算