复杂网络分析方法在全基因组关联研究中的应用

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:smtl520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全基因组关联研究(Genome-Wide Association Studies,GWAS)是在全基因组层面上,识别与人类复杂疾病相关联的遗传变异的研究方法。传统的病例-对照分析主要研究单个单核苷酸多态性(Single Nucleotide Polymorphism,SNP)与疾病的关联关系,忽略了SNP与SNP之间存在的复杂相互作用。本文以互信息理论和仿真数据为基础,逆向构建了SNPs相互作用网络。比较了病例组与对照组SNPs相互作用网络的结构参数随互信息阈值增加而变化的情况并选取合适的阈值。根据给定阈值的互信息网络,筛选对网络结构具有显著贡献的“结构性关键SNPs”。具体内容如下:  将SNP间的互信息值作为SNPs间复杂相互作用的度量,构建以SNPs为节点,SNPs间互信息为权值的无向加权网络。根据不同互信息阈值,得到对照组和病例组对应的互信息网络。在不同互信息阈值下,比较病例组与对照组网络的结构参数:平均度K、模块度Q、平均路径长度L、聚类系数C、平均点介数召以及网络中非孤立点比例R随阂值增加而变化的情况,选取能显著区别病例组和对照组网络的阈值作为最终阈值。根据给定互信息阈值的病例组与对照组网络中节点度的差异,设置差值参数r筛选出对网络结构具有显著贡献的“结构性关键SNPs”。  基于国际HapMap项目提供13号染色体上基因GPC6和基因BRCA2的信息,利用软件HAPGEN2,在预设致病SNPs的前提下产生大量病例对照仿真数据。基于仿真数据,构建病例组和对照组互信息相互作用网络,通过比较网络结构参数发现,在相当宽的互信息阈值范围内,随着阈值的不断增加,网络聚类系数C、模块度Q、平均点介数B及平均路径长度L都能将病例组和对照组网络明显区分。对给定互信息阈值的相互作用网络,计算每个节点在病例对照网络中度变化的差值。设置差值参数r对网络中SNPs进行筛选,得到了在特定阈值下,对网络结构具有显著性影响的“结构性关键SNPs”集合。对差值参数r不同取值的实验表明:本文使用的参数r的取值能够较准确地筛选出对网络结构有较大影响的关键SNPs。结构性关键SNPs集合选取的方法能够有效地筛选出预先设定的致病SNPs。
其他文献
体育游戏是根据一定的规则及目的所进行的体育活动,有着较强的智力性以及娱乐性,有助于学生参与积极性的激发,有助于加强学生的身体体质、开发智力和陶冶情操.所以,在初中体
期刊
本文主要利用KAM理论、Brouwer度理论和Banach不动点理论研究了近可积哈密顿系统的预给频率方向的不变环面的保持性、给定势能的非线性Schr(o)dinger方程在Dirichlet边界条件
差族方法是构作平衡不完全区组设计的最常用也是最有用的方法之一,人们对它已有很多研究,同时将其应用于编程理论及密码学中。2004年,Ogata,Kurosawa,Stinson和Saido[1]引进
期刊
随着科学技术的高速发展,要求人们对非线性系统的动力学特征有更深的了解。由于人工神经网络以及模糊系统在非线性系统的建模和控制中的广泛应用而引起了人们广泛的关注。特别
随机环境中随机游动是随机环境中马氏链的特例,本文共分三章,第一章主要介绍了随机环境中马氏链的构造;第二章分两个部分,第一部分给出了环境独立同分布时直线上的可逗留模型,给出
循环码是一类非常重要的线性码。它不仅具有很好的代数结构、循环特性,而且其编码和译码都可以很容易地利用线性移位寄存器来实现。因此,循环码特别引人注目。1957年普朗格(Pran
期刊
期刊