基于互信息网络的疾病关键基因选取

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:caritasSD
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在后基因组时代,生命科学研究的重点不再是对单个基因进行研究,而是在基因组结构和功能的层次来研究生物系统的运行机理。本文利用基因表达谱数据筛选出部分差异表达基因,以此构建基因互信息相关网络,并对正常组和疾病组的基因网络的结构差异进行了分析;利用互信息网络中基因的强度、介数和故障影响力等参数在正常组和疾病组中的差异,得到相应的候选疾病关键基因排序,通过社会选择模型的算法对排序进行了优化聚合,得到基因的最终聚合排序并由此选取疾病关键基因。具体研究内容如下:首先,从GEO数据库下载两组乳腺癌数据,一组为成对数据,一组为非成对数据。对两组数据进行必要的数据预处理后,利用SAM软件均筛选出约300个差异表达基因。根据这些差异表达基因的表达谱数据构建了正常组和癌症组的基因互信息相关网络。对互信息相关网络的平均度、平均核数等6个参数的分析发现,正常组和癌症组数据所导出的基因互信息相关网络的结构存在显著差异。特别的,非成对数据的差异较成对数据更显著。按照生物学中结构决定功能理论,结构的差异性正是功能差异性的直接原因。对非成对数据的基因互信息相关网络的节点(基因)强度、介数和故障影响力进行正常组与癌症组的比对,根据这3个参数在两个网络中的差异大小得到了相应的3个基因排序。利用社会选择理论中的Borda算法和Max-Diff算法进行了排序聚合,结果显示两个算法得到的最终排序几乎相同,均在最终排序的前15个基因中得到了8个疾病关键基因。这说明Borda算法和Max-Diff算法均适用于关键基因的选取。此外,对另一个序列聚合Footrule算法进行了小规模验证,结果发现,Footrule算法过于关注整体排序,而忽略了个别基因。因此,Footrule算法不适用于关键基因的选取。上述基因网络的结构分析及关键基因选取的研究,能帮助我们分析与基因相关的疾病(如癌症)的发病原因及致病基因,对疾病的诊断和治疗有着一定的参考价值。
其他文献
对于单变量的经典Hardy空间,我们由Beurling定理可以清楚的得到不变子空间的形式.但是对于双圆盘的Hardy空间情况就比较复杂,于是可以先从一些相对简单的具体子模入手,从而对一般的情形有更好的理解.本文主要研究了两类特殊的子模:内序列基子模M=(?)∞j=0qjH2(z)ωj和双内序列基子模M=∑∞j=0φj(z)H2(z)(?)(Ψj(ω)H2(ω)(?)Ψj+1(ω)H2(ω)).研究
学位
本文对半序方法和几类非线性积分方程解的存在性进行了研究。主要内容包括:第一章介绍了研究背景和主要结果。第二章研究下列带有超线性扰动项的时滞积分方程S-渐近周期解的存
Z曲线是空间填充曲线的一种,空间填充曲线是一种降低空间维度的方法,近年来人们致力于研究它在空间数据库索引技术方面的应用.基于R树的索引结构虽然存在优势,但在维数增高时会
摘 要:运用科学的激励方式,使员工在工作中表现出高昂的激情,坚强的意志,从而最大限度地挖掘出员工的内在潜力和外在斗志,为企业、为社会创造更大的价值和效益。  关键词:激励 激励的作用 激励的方式  激励是指管理者对下属的需要,采取外部诱因进行刺激,使之内化为按照管理者的要求自觉行动的过程。即通过某种适当的、健康的刺激,促使完成目标的行为保持高度积极状态的某些心理需求的外在因素。在现代企业管理中,激
有向图的scrambling指数是当前国际上十分活跃的一个研究课题,广义scrambling指数是scrambling指数的推广,在非记忆通讯系统中有着广泛的应用.本文主要对特殊的本原有向图(对称本