基于改进多目标遗传算法的双聚类算法在基因表达数据中的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:blueskyjava
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因表达数据反映了成千上万个基因在不同实验条件下的表达水平,当我们对这些基因表达数据进行分析时,挖掘隐藏在海量基因表达数据中的相似表达模式能够为我们提供有价值的生物信息。考虑到基因表达数据具有数据量大且高噪声的特点,如何从基因表达数据中有效的挖掘有价值的生物信息成为了一个值得研究的问题。通过生物信息学的研究发现,很多隐藏在基因表达数据中的遗传模式仅仅在特定的实验条件下对一组基因是可见的,这与基因调控的现象也是相符的,协同基因一般仅仅在某些特定条件下才会呈现出共同调控表达的特点。因此,我们将双聚类算法应用到了基因表达数据的挖掘中,双聚类算法能够同时对基因表达矩阵的行和列进行聚类,从而找到局部的相似表达模式。在双聚类的搜索过程中,我们希望能够找到体积较大且质量较高的双聚类,而这两个优化目标是一对互相冲突的优化目标,针对这一问题,本文将多目标遗传算法应用到了基因表达数据的双聚类挖掘中。本文提出了一种改进的多目标遗传算法,分别从种群初始化策略和选择算子设计两个方面对传统多目标遗传算法进行了改进,通过在若干个经典测试函数上与传统多目标遗传算法进行了多样性和收敛性对比,验证了改进多目标遗传算法的有效性。另一方面,本文基于改进的多目标遗传算法,提出了一种创新的双聚类算法。首先,在传统的双聚类种群之外,引入了行列种群来参与遗传进化的过程。行列群体能够帮助我们评估双聚类中每一行或每一列对双聚类的贡献,沿着优良行列个体定义的搜索方向来搜索双聚类,能够帮助我们在较小的搜索空间中有效的检测双聚类。其次,在行列种群和双聚类种群的学习阶段中,对行列群体采用了布谷鸟搜索算法来进行最优解搜索;对双聚类种群采用了改进的多目标遗传算法来进行双聚类种群的初步优化。最后,将进化后的行列种群和初步进化的双聚类中进行交配,使得双聚类群体能够得到进一步的进化,与此同时,行列群体的适应度值也得到更新。通过与多个经典双聚类算法在人工数据集和真实数据集上进行对比实验,本文提出的算法有着更好的表现,验证了本文提出的双聚类算法的有效性。
其他文献
近日,省委常委会审议通过了《实施“基层党建提升年”总体方案》,把2017年作为“基层党建提升年”,全省组织部长会议作了具体部署,要求全省各级党组织全力聚焦基层党建薄弱环节,下
报纸
兼具科学性和艺术性的公路选线设计对个人经验依赖较大,虽然随着工程实践和人们认识的不断深入和进步,设计理念也从选线地质逐步深化到地质选线,但仍未完全形成系统的方法论
MB油田为碳酸盐岩油藏,受微裂缝影响导致部分生产井含水剧增、产能骤降。针对微裂缝无法有效定量刻画的难题,基于岩心描述及地质、测井、地震综合分析,创新性提出并应用双模
目的:探讨临床普外科诊治急性阑尾炎的效果。方法:收治急性阑尾炎患者120例,分成两组。对照组给予保守治疗,研究组给予手术治疗,比较两组临床疗效及并发症发生率。结果:研究
伴随着我国的保险业不断壮大,各公司之间的竞争加剧,优胜劣汰,必然会出现保险企业并购的案例。这就要求我们能够探索一个试用于保险企业价值评估方法。本文针对保险公司的特殊性
文学批评家马塞尔·赖希-拉尼茨基的大名在德语国家可谓家喻户晓,他著述等身,曾在德国《法兰克福汇报》任文学部主任达十五年之久,从上个世纪八十年代开始在德国电视二台由他
钙钛矿半导体因光吸收能力强与带间缺陷密度低的特点,具有一定的光电应用前景。钙钛矿半导体纳米晶体因量子限制效应具有荧光线宽窄化、荧光产率高的发光性质。为了进一步提高钙钛矿半导体纳米晶体光电性能,本论文采用金属掺杂对量子点稳定性和光电性质进行调控,得到如下研究结果:第一,针对小尺寸CsPbI3量子点存在的不稳定性与无法清洗提纯的问题,本论文尝试利用Sr2+掺杂,结合热注射法,得到了尺寸为6.5nm的S
本文选取反倾销措施对外贸影响的这一视角开展研究。希望管中窥豹,揭开国际贸易摩擦背后的真正规律。本文在简要介绍了研究背景、目的、意义及创新之后,概括阐述了相关研究的
在电子线路课程的教学中,一体化教学法能够激发学生的学习兴趣,增强学生的动手能力和操作技能。本文探讨了电子线路课程的一体化教学法的组织、考核,对教师的要求和所存在的
分析公路桥梁养护管理的重要意义,阐述公路桥梁的养护管理现状,并就养护质量控制的措施进行探讨。 This paper analyzes the importance of highway bridge maintenance and