复杂网络方法在全基因组关联研究中的应用

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:l13633332021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全基因组关联研究(Genome-Wide Association Studies,GWAS)在识别与人类复杂遗传疾病相关的遗传变异中起着非常重要的作用。标准的病例-对照GWAS分析了单个单核苷酸多态性(Single Nucleotide Polymorphism,SNP)和疾病风险之间的关联。然而,这种方法受到有限的再生性和上位性效应的限制,且单个SNP分析方法的功效较低。从SNP层面上来看,基因组也是一个大系统,SNP与SNP间存在复杂的关联关系,直接对SNP集进行检验忽略了SNP之间的相关性。本文考虑SNP间的相关性,提出基于网络的SNP聚类方法和P值的校正方法,比较了基于网络SNP聚类和基于基因SNP聚类方法的Logistic核检验的功效。具体内容如下:  利用复杂互信息网络来刻画SNP与SNP间的复杂关系。对一个基因上所有SNPs形成的复杂加权网络,利用适用于无向加权网络聚类的改进Newman聚类方法对SNP进行聚类,形成k个SNP集。对每个SNP集,计算Logistic核检验的P值,取最小的P值并对其进行校正,得到基于网络SNP聚类的Logistic核检验的最终P值。基于国际Hapmap项目提供的信息,利用软件HAPGEN2产生大量仿真数据,比较了基于网络SNP聚类和基于基因SNP聚类的Logistic核检验的功效。  大量的仿真实验表明:基于网络SNP聚类和基于基因SNP聚类的Logistic核检验都能控制第一类错误率。当基因的连锁不平衡(linkage disequilibrium,LD)图中显示SNP之间连锁不平衡中度偏高时,基于网络SNP聚类和基于基因SNP聚类的Logistic核检验在选择线性核函数时的功效都很高,且这两种方法各有优势。选择加权线性核函数时,基于网络SNP聚类的Logistic核检验的功效大。当基因LD图中显示SNP之间连锁不平衡偏低且选择线性核函数时,基于网络SNP聚类的Logistic核检验的功效大;若选择加权线性核函数时,我们方法的检验功效普遍比基于基因SNP聚类的Logistic核检验的功效大。因为加权线性核函数是线性核函数对罕见等位基因的相似性权重的推广,突出了罕见变异的重要性。
其他文献
倒向随机微分方程(BSDE)理论的创立和完善极大地推动了随机最优控制理论的发展,为解决金融经济等问题提供了一个强大的新型数学工具。近年来,随着随机最优控制理论的进一步发展
该文主要研究了线性模型回归分析中的参数的贝叶斯推断方法,包括简单的一元模型,并推广到多重和多元的情形,探讨了分别在扩散无信息先验分布和多元正态以及矩阵正态先验分布
网络第二层设备的拓扑结构的自动发现对于现代网络管理变的日趋重要,采用第二层交换机构建以太网是目前最主要的组网方式。如在网络负载均衡、网格计算等网络应用中都必须明确
在机器学习中,很多目标都以高维数组或张量的形式存在,近年来的研究成果表明,充分利用张量数据的空间结构能够有效地降低学习结果对训练集的过度适应,因此对张量型的机器学习方法
在回归分析中,回归函数并非全是自变量的线性函数,之前总是通过变换将之转化为线性函数,再利用线性回归来对其分析,这类非线性回归问题与普通的线性回归问题基本类似。近年来,随着
粒子群算法是一种新型智能算法,具有概念简单、参数较少、易于实现等特点,自提出以来已经得到广泛研究,并成功应用于函数优化、神经网络训练、模式识别等许多领域,但粒子群算法也
骨龄在在儿科学和体育科学等领域有着非常重要的作用。在中国人骨成熟度评价标准(CHN积分法)中,需要借助于X光胶片来获得各骨的等级得分,然后计算骨龄。这样造成了费用高、耗时