复杂性状与基因组多位点的关联分析方法研究

被引量 : 7次 | 上传用户:jstxwt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
影响复杂性状的遗传结构包括很多基因,这些基因的顺式及反式作用位置中的多个突变位点能够相互互作共同影响复杂性状。因此,多个位点的联合分析比单个位点的分析能获得更多的信息。单倍体型,即位于一条染色体上或某一区域内的一组相关联的SNP位点。显然,对单倍体型进行分析为运用SNP信息探究遗传性状尤其是复杂性状的遗传机制提供了一条更加便捷、更加有效的途径。因此本文研究单个基因的SNP互作的同时,利用单倍体型从基因组水平考虑非连锁区域基因与基因的共同作用。主要研究内容及其结果如下:第一,基于半参数回归模型的单区域多位点与复杂性状关联分析探讨复杂性状与某一区域功能位点的关联定位备受关注。目前通常用的方法是单独分析每一个区域的单个SNP,但这样可能会由于位点SNP与性状标记之间存在不完全的连锁不平衡而导致分析结果效力降低。也有通过单倍体型等方法联合分析这些位点,但如果有许多单倍体型时,可能会使单倍体型的分析方法的效能减弱。因此,我们基于Kwee等针对数量性状基因座的半参数回归模型,其模型能够同时利用多个SNPs的信息且能考虑位点之间的连锁不平衡,但相比现有多个位点联合分析方法,维度能更低。针对Kwee等的模型缺陷,我们引入对缺失数据的处理。另外,通过逐步向下P值法筛选与数量性状关联的多个联合SNP标记。人的前列腺癌是个普发的疾病,威胁着很多人的生命,备受世界关注。本节我们利用HapMap的公共数据,对人前列腺癌通路上具有淋巴细胞表达数据的67个基因与339个候选基因进行顺式与反式调控的分析,找出影响人前列腺癌通路上基因表达的顺式和反式作用因子,并进行通路分析。第二,基于参数回归模型的多区域单倍体型与复杂性状关联分析复杂性状的遗传基础包括很多基因,这些基因的联合作用是很普遍的。因此同时考虑多个基因、多个区域是比较可取的。我们提出基于广义线性回归模型复杂性状跟多个非连锁区域的单倍体型联合的关联分析,通过打分统计来检验单倍体型效应的零假设。另外,通过多重检验最小P值法获得最好非连锁区域多个位点的联合。通过模拟研究检验我们提出的方法的准确性和检出效能,证实模型的有效性和对单倍体型互作的关联分析的检出率。对于没有考虑其他协变量的数据,通过跟软件FAMHAP的htr和hapcc模型比较得出,我们的方法在准确性和有效检出率能与htr和hapcc相当,甚至超过它们。另外,我们模型能考虑更多的性状类型以及允许加入其他协变量。为了验证我们方法的有效性,我们应用在有4个非连锁侯选基因与猪肉质的关联分析中。第三,基于半参数回归模型的多区域单倍体型与复杂性状关联分析一般复杂性状的遗传模式都包括多个基因及它们之间的相互作用。我们提出一种新的统计方法即基于单倍体型水平找出影响某一连续性状变化的基因组多个区域。我们提出的方法是使用具有核函数的半参数回归模型,能够同时考虑大量基因。此种方法比现有的方法能够有效地达到降维的作用。对于参数的估计和非参数函数检验我们参照Liu等和Kwee等,即通过最小乘方核机器(LSKM)进行参数估计和通过打分统计进行非参数函数检验。为了获得最好的基因或区域组合,通过逐步向下P值法筛选。模拟研究证明这种方法的准确性以及检验多个基因的检出效能。我们把这种方法应用到人前列腺癌通路的KLK3表达与339个候选基因的关联分析中,找到影响KLK3表达的基因群,比上节单个基因的分析获得更多的信息。另外,我们应用这种方法研究猪肉质的遗传机制。第四,基于半参数逻辑斯蒂核模型的多区域单倍体型与二类性状关联分析寻找新的统计方法来检验疾病的遗传通路越来越受到关注。原因是一个通路中的基因倾向于彼此相互作用,如果使用传统的参数估计由于维数太大而不可行,使得用非参数方法更可取。通过核机器函数对高维基因组单倍体型信息拟合,我们提出了高效灵活的分析和检验基因组基因与疾病关联的遗传通路的半参数逻辑斯蒂模型。按照Liu等,我们把我们半参数模型转化成逻辑斯蒂混合模型来表达,利用现有的统计软件进行参数估计,对非参数函数检验采用打分统计。通过模拟研究证明这种方法准确性以及检验疾病遗传通路的效能。这个方法应用在磷酸盐治疗下的多种骨髓瘤下巴骨坏死病人数据的通路分析中。第五,基于半参数回归模型的多区域单倍体型与纵向性状关联分析对于具有多次记录的纵向数据研究中,能够同时考虑影响性状的时间及其他协变量是很重要的。基于Zhang等研究纵向数据的半参数模型,我们把模型的参数固定效应用来拟合单倍体型和其他固定协变量效应,参数的估计按照Zhang等的方法,采用似然比检验来检验单倍体型效应。通过对我们改进的方法与一般的混合模型Haplo.stats和FAMHAP的htr模型进行模拟比较,证实对动态性状通过考虑多次采样数据的时间效应比对单次采样更能提高单倍体型效应的检出率。我们通过这种半参数回归模型研究猪具有多胎的繁殖记录与MMP1和MMP10基因的单倍体型分析中。综上所述,本论文针对基因组研究中存在的问题,建立了基于广义线性模型研究复杂性状与多个非连锁区域单倍体型联合的关联分析、基于核函数的半参数回归模型分析静态与动态数据的遗传模式。通过模拟研究证实了模型的可靠性,并将我们的模型系统应用到多个实际的例子中。本研究结果不仅能推进复杂性状候选基因研究,而且为从基因组层面上进行复杂性状遗传通路等研究的实施奠定了理论基础。同时,这些算法都开发出相应的软件程序并可自由下载,为科研工作者提供更全面准确的进行基因组关联分析。
其他文献
1984年《专利法》确立了专利行政保护制度,之后,该制度成为专利法历次修改的争议焦点。比较研究这些修改内容,可以发现该制度的以下发展趋势:专利行政裁决职能呈现出弱化趋势
<正>笔者收集了有关维生素和矿物质对繁殖作用的最新报道,现摘译如下,以供参考。 维生素A 奶牛和公牛的繁殖紊乱与维生素A缺乏有关。关于维生素A对繁殖功能作用的研究热点在
文章简单论述了存货计价方法的意义,并分析了不同存货计价方法对企业财务及纳税的影响,提出各企业应该根据自身及行业的特点选择新的会计方法。
目的分析非肥胖2型糖尿病合并周围血管病变患者血脂水平变化及意义。方法非肥胖2型糖尿病患者320例,其中合并周围血管病变156例(合并组),无周围血管病变164例(对照组)。比较
女性阴道的微环境健康状态是女性生殖健康的一个重要指标,阴道微环境是一个复杂的系统,阴道内的菌群之间处于一个平衡状态,各菌群共存共生、互相依存,共同维持阴道内微生态菌
<正> 杨妪,年五十余,某年二月患胸痹心痛证,曾服桂附理中汤,重用党参、白术,并加当归,药之病未见减,日有所发,心胸撮痛,有如气结在胸,甚则痛彻肩背,痛急则面唇发青,冷汗淋漓,
期刊
目的探讨影响恶性肿瘤患者并发肺部真菌感染的危险因素。方法回顾性分析412例恶性肿瘤疑似肺部真菌感染患者的临床资料,对其高危因素进行单因素及多因素分析。结果恶性肿瘤患
过氧化氢,化学式为H2O2,无色黏稠液体,水溶液俗称双氧水。一般市售的是质量分数为30%的双氧水,家庭使用的是质量分数为3%-5%。
目的探讨多索茶碱联合噻托溴铵粉治疗慢性阻塞性肺疾病的效果。方法将2017年2月至2018年2月在我院呼吸内科治疗的100例慢性阻塞性肺疾病(COPD)患者随机分为两组,对照组采用多
依据现场调查、工程探测和室内测试分析,探讨了徐水县北楼村漕河地裂缝的形成机理和演化过程。北楼村漕河地裂缝沿河道发育,属张性拉裂缝,呈现逐年向上游、下游扩展的趋势。