融合SNP和KEGG的综合因素分析方法搜索复杂疾病关联的基因及其交互作用

来源 :哈尔滨医科大学 | 被引量 : 0次 | 上传用户:hlj123456789001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂疾病是遗传和环境因素共同作用的结果。从现有的复杂疾病高通量数据出发利用生物信息学手段系统地研究其发病机制在生命科学研究中具有十分重大的意义。许多关联分析方法都能很好地鉴别出疾病易感的单个基因。本文在以往关联分析单基因挖掘方法基础上,即在复杂疾病关联基因的遗传因素基础上,进一步通过生物信息学手段,考虑其在KEGG生物学通路背景下的环境因素,通过综合考虑多个基因的联合遗传效应以及它们所在的环境因素,最终提出一种融合SNP和KEGG的综合因素分析方法来搜索复杂疾病关联的风险通路、基因及其交互作用。该方法从一个新的视角将影响疾病的遗传因素和KEGG环境因素进行合理的量化并融合,提出一种关联风险打分测度(RS)来识别与复杂疾病密切相关的生物通路,进而研究风险通路中基因及其交互作用关系,以便从多层面研究复杂疾病致病机制。 复杂疾病通常发生在大的群体中,而且是致残和致死的主要原因。这些复杂疾病被认为是由多个易感因子(遗传因素和环境因素)及其联合效应引起的。后基因组计划最大的挑战之一就是寻找复杂疾病的靶基因及其它们之间的相互关系,并对它们进行功能鉴定,在此基础上进一步完善各种基因预防、诊断与治疗技术。复杂疾病的发病机制不能仅仅通过传统的单个基因的突变、单个基因产物或通路的行为来解释,还与遗传因素、环境因素(生物学上下文背景)以及它们之间的相互作用有关。通常情况下,在处理复杂疾病的“疾病—对照”样本数据时,基因组层面关联分析能够很好地检测出疾病相关的遗传因素。然而,与“复杂疾病—多因子影响”理念相悖的是,基因组层面关联分析虽然可以很好地挖掘出一些复杂疾病的致病基因,但是它仍然存在着一些缺陷:第一,在基因组层面关联分析过程中,过于严格的多重检验校正,往往会筛选掉很多具有生物学意义的位点;第二,当样本量过少时,有些高效应的变异位点往往不易通过此方法检测到。如何避免关联分析的两大缺陷对复杂疾病的研究具有重大意义。同时,在此基础上综合考虑环境因素对复杂疾病的影响也是很有必要的。生物学通路数据库的不断完善与发展为研究者从遗传因素及遗传物质所在的生物学代谢环境角度来研究复杂疾病提供了条件。KEGG通路作为一种描述由酶催化的代谢物之间的反应关系和互作关系的分子电路网络。它不仅提供了一个将基因组和生物学系统相联系的平台,还通过反应过程和互作关系提供了将基因组和环境相联系的平台。这样,KEGG代谢通路在某种程度上反映着遗传物质在生物体代谢环境下行使功能的方式,并体现了遗传物质行使功能的多样性。从现有的高通量数据出发综合考虑遗传因素和KEGG环境因素来研究复杂疾病是可行的。 综合考虑复杂疾病关联的遗传因素和遗传物质所处的KEGG生物学代谢环境的复杂性,本文提出了一种挖掘与复杂疾病密切相关的风险通路,进而在此基础上进一步挖掘与复杂疾病密切关联的基因及其相互作用关系。该方法从一个新的视角将影响疾病的遗传因素和生物环境因素进行合理的量化,通过融合遗传因素统计量与代谢环境复杂程度指标,识别与复杂疾病密切相关的生物通路,以便更好地揭示复杂疾病的致病机理。利用此方法处理双极性疾病BD、肠炎CD、n型糖尿病T2D、高血压HT和冠心病CAD相关的群体遗传学数据,结果发现,这五种人类复杂疾病均与花生四烯酸代谢通路、嘌呤代谢通路和MAPK代谢通路关系密切;另外,它们还有着各自特异的通路,通过对高风险通路中风险基因及其作用关系的进一步分析,筛选出复杂疾病关联的风险基因及其相互作用关系。通过文献证实,本研究进一步发现通过本文的方法挖掘得到的这五种人类复杂疾病关联的风险通路、风险基因及其交互作用关系均获得了很好的文献支持。以后,会将此方法推广到其他复杂疾病的风险致病基因集及其风险作用关系中,以便更好解释基因组范围内关联分析数据结果和有效地从多层面揭示复杂疾病致病机制。
其他文献
PAQR(progestin and adipoQ receptor)家族成员在很多生理活动,比如代谢调控,肿瘤生成和激素应答中都发挥着重要的作用。这个家族包含有11个成员,其中PAQR4的功能尚未被研究过。
MicroRNA(miRNA)是一类进化保守、大小约为21个核苷酸的小分子非编码RNA,普遍存在于真核生物中。一般通过非完全碱基互补配对方式识别靶基因mRNA3非翻译区(3UTR)的序列元件,在
血管新生(Angiogenesis)是指血管内皮细胞从原有毛细血管的基础上以出芽、增殖、迁移的方式形成新血管的过程。血管新生是胚胎原始血管丛建立以后以及成体生理病理状态下新血
3T3-L1细胞系是研究前脂肪细胞分化的理想体外模型,并被广泛应用于肥胖等代谢相关疾病的研究。人们从2000年开始用基因芯片技术来研究3T3-L1细胞分化的基因表达调控的分子机制
GaN基半导体器件的商业化使得当前Ⅲ族氮化物的研究发展非常迅猛。由于其带隙可以从6.2ev到0.7eV连续变化,所对应的波长覆盖了从近红外到紫外极为宽广的光谱范围,GaN基半导体材
通信安全影响到社会的方方面面,从个人隐私到国家安全,都要求通信方式安全可靠。随着光电子技术的不断发展,曾经被认为是安全的光纤通信也逐渐暴露出被窃听的安全隐患。本论文研
Ⅲ族氮化物半导体材料是直接带隙半导体材料,禁带宽度根据合金组分不同,可以在0.7~6.2 eV之间连续调节,覆盖了从红外到紫外的广阔光谱区域,很适合用于制造固态发光照明器件。到现
细胞壁主要由纤维素、半纤维素及果胶组成,它是植物抵御外界不良环境的第一道屏障,也是结合金属离子的重要部位。果胶被认为在植物逆境营养机制中起着重要的作用,但关于果胶参与
机载激光海洋探测是一种全新的海洋探测技术,具有大面积、高精度、实时性和良好的机动性等优点。它是集光、机、电为一体的系统,涉及大气光学、海洋光学、激光技术、微弱信号
学位
生物多样性是生态学家和生物地理学家关注的焦点问题之一,β多样性是生物多样性核心内容。β多样性描述的是不同群落或者地区之间物种组成的差异,可以被分解为物种更替和物种嵌