【摘 要】
:
大规模多重检验在许多领域都有着广泛的应用。随着大数据时代的到来,处理大量的数据信息以及数据结构之间呈现的复杂的相关性为传统的多重检验方法提出了新的要求和新的挑战。例如在全基因组关联分析(GWAS)中,为了识别复杂疾病的遗传变异点,通常需要我们同时进行数以万计的检验。而且必须考虑在实际情况下,基因位点在减数分裂的过程中,与疾病或性状相关的单核苷酸多态性(SNP)通常会倾向于分离到同一个配子中,这就导
论文部分内容阅读
大规模多重检验在许多领域都有着广泛的应用。随着大数据时代的到来,处理大量的数据信息以及数据结构之间呈现的复杂的相关性为传统的多重检验方法提出了新的要求和新的挑战。例如在全基因组关联分析(GWAS)中,为了识别复杂疾病的遗传变异点,通常需要我们同时进行数以万计的检验。而且必须考虑在实际情况下,基因位点在减数分裂的过程中,与疾病或性状相关的单核苷酸多态性(SNP)通常会倾向于分离到同一个配子中,这就导致了我们在进行大规模多重检验的时候,不可以忽视相邻的检验之中存在的复杂的相依结构。对于处理大规模多重检验以及其结构间复杂的相依性,传统多重检验方法的控制准则往往显得过于保守。而且传统的多重检验方法都是基于一阶隐马尔可夫模型,即只考虑前一时刻状态对当前时刻状态的影响,显然假设性太强,不符合实际情况的要求,会造成检验功效的损失。为了解决上述问题,本文进一步考虑检验之间的相依性,将一阶隐马尔可夫模型推广到高阶。提出了基于高阶隐马尔可夫模型的大规模多重检验方法hoLIS方法。本文主要分为以下五个部分:第一章,主要介绍了大规模多重检验的研究的背景和意义,根据大规模多重检验控制方法的发展历程总结了国内外专家及学者们的研究历程及成果,并阐述了研究的贡献和不足。此外,本章还介绍了全篇论文的结构和本文的创新之处。第二章,主要介绍了一些基于FWER和FDR的经典多重检验方法。同时介绍了关于隐马尔可夫模型的相关知识,包括理论框架、基本问题、前向后向算法以及Baum-Welch算法等。第三章,本文进一步考虑了数据之间的相依关系,将隐马尔可夫模型扩展到高阶。通过建立加权分类问题和多重检验问题的联系,证明了多重检验方法的最优性。推导并实现了高阶隐马尔可夫模型的前向后向算法、Baum-Welch算法等。第四章,对本文所提出的基于高阶隐马尔可夫模型的大规模多重检验方法进行数值模拟和实证分析。在模拟研究部分,通过一系列的数值模拟,验证本文所使用的方法是否能够将FDR控制在预设的显著性水平。在实证分析部分,本文所提出的hoLIS方法应用到全基因组关系分析中,同时与其他传统的多重检验方法进行对比,以证明该方法的功效。第五章,是对全文总结以及对未来发现的展望。本文的研究结果表明:基于高阶隐马尔可夫模型的多重检验方法可以将错误发现率(FDR)控制在预设的显著性水平α。并且FDR在同一显著性水平α下,与其他传统的多重检验方法相比,拥有最小的错误无发现率(FNR)。并且与其他传统的多重检验相比,本文所提出的hoLIS方法具有更高的功效。
其他文献
Hh信号通路在胚胎体轴建立及神经管背腹图式形成中扮演重要角色。文昌鱼是无脊椎向脊椎动物进化的重要过渡类群,因而是研究脊椎动物起源和胚胎发育机制的很好模型。本实验室最近研究发现,Hh突变可导致文昌鱼左右不对称发生紊乱,多数运动神经元无法形成。Gli是Hh信号的转录因子,在Hh蛋白存在时,Gli蛋白会以全长激活形式存在,而当Hh缺乏时,Gli蛋白的C端会被切除,形成仅具有N端序列的抑制形式。所以Gli
外汇风险影响着我国跨国公司的各类筹资、投资和经营活动。于是,外汇风险管理便成为跨国公司财务管理中非常重要的管理工作。伴随着人民币汇率制度的深入变革,特别是从“以国际市场供求关系为主要基石、按照一篮子货币加以调整、有管理的浮动汇率制度”实施至今,人民币兑换世界货币的汇率波动更加频繁。与此同时,我国进出口贸易发展神速,进出口额逐年增加,国际参与度也变得越来越高,导致跨国公司所面临的外汇风险也变得越来越
近年来,科学技术快速发展推动了人类社会向海洋探索与开发的步伐。但是,随着世界各国工业生产、生活等领域对各类资源的消耗日益提高,缺乏合理约束的海洋资源开发利用正导致日益严重的海洋污染。海洋环境监测是海洋环境生态保护和海洋资源可持续开发的关键技术,得到广泛重视。海洋环境参数的高效获取、传输和处理为海洋环境监测提供了有效的信息支持。相对于空中、陆地、水面可采用成熟的无线通信技术,水声通信是海洋环境监测参
厦门市以国家基本医保制度体系为基础,结合厦门城市功能定位,逐步构建了一个多层次的全民医保体系。近两年来,厦门市医保定点医药机构数量迅速增加。从人口和面积配比来看,厦门的医保定点机构数量已远远超过国内平均水平,如无规划的不断增加,不利于我市基本医疗保险事业的可持续性发展。传统的医保定点机构规划主要是根据行政区划内人均医保医疗资源保有量进行规划,该方法缺点在于各行政区划内的人口分布极不均匀,因此根据人
在我国的经济发展中,企业一直发挥着举足轻重的作用。企业的发展离不开资金的支持,这其中很大一部分来自外源性融资。外源性融资分为股权融资和债务融资,相较于股权融资而言,债务融资的成本更低,操作起来手续简单,且股东仍拥有对企业的所有权和监管权,所以一直受到众多企业的青睐。而过高的债务融资成本同时也制约了企业的发展,这其中有经济环境的原因,也有企业自身的因素。目前我国已经通过定向降准、推进利率市场化改革等
当前世界正处于人才全球化的时代,人才的跨国交流日益频繁。其中,留学生作为跨国流动中的一个重要群体,不仅为留学目的国带来巨额的经济收益以及多元文化结构,还带来了大批潜在的国际化人才。所以,很多国家都将留学作为重要的服务产业来发展。随着中国国力的日益增强,人民生活水平的逐渐提高,选择出国留学的中国留学生人数逐年增加。然而,突如其来的全球新冠疫情对留学生及相关产业造成较大的影响,中国作为第一大留学生输出
随着我国工业的发展和科学技术的进步,电气自动化技术也逐渐发展起来,并在社会生产和生活中占有越来越大的比重。我国的工业发展相对滞后,在工业装备和技术水平上还存在着一些差距。本文针对当前电气自动化仪器仪表的使用状况,并结合各种技术的运用形式,探讨其在电气自动化领域中的作用,以期对促进我国电气自动化技术的进一步发展起到一定的促进作用。
海洋大量吸收人类排放的CO2,导致海洋酸化。同时,臭氧层破坏与海洋上部混合层变浅导致该层内浮游生物接受UV辐射量增加。桡足类,作为浮游动物重要类群,通过摄食浮游植物参与海洋食物网过程。本文以厦门近海常见桡足类刺尾纺锤水蚤(Acartiaspinicauda)及汤氏长足水蚤(Calanopia thompsoni)为研究对象,探究了其对UV辐射与海水CO2升高的生理生态学响应。主要结果如下:刺尾纺锤
Periostin(POSTN)是一种主要由基质细胞表达分泌的细胞外基质蛋白。已有研究证实,在绝大多数的正常组织中POSTN蛋白低表达,而在结直肠癌、肝癌等实体瘤中高表达。Hippo信号能够抑制肿瘤的发生,在肝癌中Hippo信号的下游效应器YAP/TAZ异常激活。然而,现有的研究对于POSTN蛋白和YAP/TAZ在原发性肝癌中的相互调控关系知之甚少,而且POSTN在原发性肝癌中的功能以及分子机制也
职业作为联系个人与社会的中间媒介,能够有效反映出个人在社会生产活动中的地位和作用以及社会各方面的变迁。同时,职业作为连接经济结构与社会结构的重要连接点,经济的发展对社会的作用首先会反映到职业结构中。所以以职业结构为基础研究分析社会结构的发展变迁是十分有意义的。我国社会经历了改革开放,尤其是经济体制的改革对我国的社会结构的变迁产生深远影响。研究经济体制改革前后我国职业结构的变迁对了解我国社会结构的发