论文部分内容阅读
人类多数(80%)疾病属于复杂疾病,复杂疾病一般是由多个遗传基因及环境因素共同交互作用而发生发展的,并且往往具有家族聚集倾向性、遗传异质性等特征,表型与基因型间没有简单对应关系。现代医学研究认为疾病的发生、易感性及对药物的反应差异性等复杂性状与基因突变或遗传多态性密切相关。因此,利用遗传多态性标记对复杂疾病相关基因进行精确定位是目前研究的热点和难点。
我们对比了现有的基因定位分析方法,基于连锁分析和关联分析的基因定位方法多是针对单个疾病特征标记来研究,忽略了多个可能疾病特征标记间复杂互作的综合效应。在本课题中,我们将创新性地提出SNPs虚拟网络的概念,我们将基因定位问题看作提取疾病特征标记(SNPs)的模式识别问题,提出了基于SNP互作关系的特征提取算法决策森林。首先将具有家系结构的SNP遗传谱转化为IBD谱,然后基于决策森林算法提取那些IBD分布在两类受累同胞对组中显著差异的SNP互作关系。确定互作的染色体区域。此外,将SNPs虚拟网络与基因网络和蛋白质网络进行映射,纵向地对复杂疾病相关的遗传物质进行定位克隆。结果表明:用该方法发现的真实的基因互作对大部分都参与到与神经系统疾病相关的生物过程中,例如:信号传导、细胞调亡、神经中枢、及免疫系统。我们并对处于基因网络中的连接度比较高的节点进行了通路分析,发现几个和神经系统疾病密切相关的通路。
通过我们提出的方法,最后对GAW14真实的SNPs数据分析,结果表明:该方法识别出的gene互作关系与已有的生物学知识相符。证明了方法的有效性。总之,从IBD表达谱数据出发,利用SNP网络重构的方法挖掘疾病相关基因,为复杂疾病发病机理的研究提供了一个全新的视角。