多组学数据融合的驱动基因识别方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户：wcjlb

【摘要】

：

【作者】

：

缪秋麦

【出处】

：

湖南大学

【发表日期】

：

2020年06期

【关键词】

：

驱动基因整合数据重叠社区发现体细胞突变突变影响

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

癌症是一种复杂的疾病,对人类生命构成严重威胁。高通量测序技术的突破降低了癌症诊断、临床治疗和预后预测等方面的研究成本。整合多组学高通量数据,让癌症研究系统且全面的分析成为了可能,癌症生成过程也得到了更深层次和更完整的研究。从遗传学的角度分析,癌症的产生是基因突变不断选择、累积的结果。因此,通过整合多组学数据挖掘与癌症相关的基因和驱动癌症的基因,成为研究癌症致病机制的热点。本文提出了两种识别驱动基因的方法,主要工作包括以下两点:(1)提出一种基于重叠社区发现的驱动基因方法(GCommunity),用来挖掘具有重叠性质的基因社区并识别与癌症相关的驱动基因。该方法首先采用EMDomics对具有高异质性的癌症数据进行差异表达分析,筛选出显著差异表达的基因作为输入基因;然后对基因表达数据进行吉布斯采样聚类(Gibbs sampler)构建基因相互作用网络,并加入蛋白质相互作用(PPI)数据,使得基因相互作用网络的信息更加完善;通过重叠社区发现的算法挖掘最终的基因社区;通过对拷贝数变异数进行频率计算选出癌症的候选驱动基因,再利用回归树模型建立候选驱动基因和基因社区之间的调控机制,从而获得最终的癌症驱动基因。GCommunity方法从基因组和蛋白质组中获取基因的相互作用关系,从拷贝数变异数据中分析基因的突变行为,用概率统计模型建立突变基因与基因社区之间的调控关系。实验结果表明,GCommunity方法能够挖掘出的质量较高且具有生物意义的基因社区,所识别的驱动基因具有驱动意义。(2)提出一种基于体细胞突变的癌症驱动基因识别方法(MaxSIF),整合了基因表达数据、蛋白质相互作用数据以及体细胞突变数据。该方法首先利用校正因子去除沉默突变这种背景噪声的影响;然后计算在核苷酸序列上出现无义突变、错义突变、移码突变以及短插入/删除与总突变的比例作为该核苷酸的突变得分;接着将基因表达数据和蛋白质相互作用数据构成的基因相互作用网络与突变得分结合,计算该基因与邻居节点的突变影响得分并用最大值表示该基因的突变影响得分;最后选择突变影响得分较大的基因作为驱动基因。MaxSIF方法的动机来自两个基因如果它们都具有高突变分数并且在基因网络中彼此接近,则他们应该具有强烈的突变影响。该方法考虑基因在基因网络中的所有邻居突变影响来计算该基因的最大突变影响值。实验结果表明,MaxSIF方法所识别的驱动基因能在癌症通路中显著富集,能正确识别驱动基因并区分致癌基因和抑癌基因。

其他文献

结肠镜前置先端帽可提高结肠腺瘤检出率

目的探讨结肠镜前置先端帽(Cap-assisted colonoscopy CAC)对结肠腺瘤检出率、到达回盲部成功率及到达回盲部所用时间的影响。方法收集2014年9月~2015年11月在山东省千佛山医

学位

先端帽结肠腺瘤腺瘤检出率结直肠癌

滑移对部分充填式钢箱-混凝土组合梁力学行为的影响

钢-混组合结构是钢梁与混凝土板通过抗剪连接件形成的抗弯构件,在正弯矩作用下混凝土板受压、钢梁受拉,材料能充分发挥各自的性能,在负弯矩作用下混凝土板受拉开裂,钢梁受压

学位

部分充填式钢箱-混凝土连续组合梁滑移效应相对滑移抗弯承载力

锰酸钇基粉体的合成及隔热涂层的制备

高温下热量传递以短波红外辐射传热为主,应用近红外反射型/红外辐射型隔热材料可以有效保护基底材料,是高温工业节能增效的有效手段。锰酸钇熔点较高（2067 K）,具有较好的近红外

学位

锰酸钇粉体离子掺杂近红外反射率红外发射率红外涂层

下栓上焊隔板贯通节点力学性能研究与参数化分析

本文以矩形钢管混凝土柱-H型钢梁下栓上焊隔板贯通节点为研究背景。为响应国家装配化发展的号召,大力推进钢管混凝土柱-钢梁结构体系发展刻不容缓。传统翼缘与贯通隔板(以下

学位

下栓上焊隔板贯通节点抗震性能抗剪性能有限元分析钢管混凝土柱

中国英语学习者书面语中评价性形容词important的扩展意义单位研究

本文以中国英语学习者语料库(CLEC)为观察语料库,以英国国家语料库(BNC)为参照语料库,从词频和扩展意义单位的层面,即搭配、类联接、语义倾向和语义韵,通过与英语本族语者的比较,分析中国英语学习者书面语中对评价性形容词important的使用情况。研究结果表明:1.在词频层面,中国英语学习者和英语本族语者对评价性形容词important的使用存在显著性差异,前者较多使用important,较少使

学位

评价性形容词important扩展意义单位中国英语学习者

(Fe50Mn30Co10Cr10)100-xCx高熵合金的制备及强塑性

本文选用Fe、Mn、Co、Cr四种金属元素和非金属元素C（以铁碳合金的形式引入碳元素）,使用真空感应熔炼法制备了Fe50Mn30Co10Cr10、（Fe50Mn30Co10Cr10）99.8C0.2、（Fe50Mn30Co10Cr10）99

学位

双相高熵合金间隙碳原子强塑性锻造

基于虚拟同步电机控制的逆变器并联系统功率分配策略

在如今能源短缺、环境污染等问题日益突出的情况下,分布式电源得到广泛关注。逆变器作为分布式发电系统的核心,其控制技术一直是研究的重点内容。分布式电源的容量通常较小,

学位

逆变器并联虚拟同步电机线路阻抗功率解耦功率分配方案

高斯白噪声激励下非线性系统的参数识别

现代工程中的各种结构都朝着精度高、自重轻、体积大的方向发展,结构的复杂动力学特性研究变的尤为重要。在实际工程领域中,使结构系统产生振动的振源常常是随机振源。故此需

学位

高斯白噪声非线性系统随机平均法参数识别

混合储能系统双向DC/DC变换器及功率分配策略研究

随着能源与环保问题愈发受到重视,大力发展绿色能源成为必然趋势。家庭能源路由器有利于对可再生能源的充分合理利用,而混合储能系统能够使家庭能源路由器维持高效稳定运行。

学位

能源路由器混合储能系统功率分配策略滑模控制

利用SPION标记和AAP识别探究BMSC在CKI中的肾定位和存活性

足细胞的损伤和丢失是慢性肾小球疾病和进展的重要因素。近年来,采用干细胞来治疗足细胞损伤已取得一定进展。为了深入考察输注到小鼠体内干细胞的分布及聚集情况以及干细胞

学位

阿霉素肾脏损伤模型Fe3O4@CA-PLL激活式核酸适配体探针核磁共振成像荧光成像

多组学数据融合的驱动基因识别方法研究

其他学术论文