【摘 要】
:
全基因组关联研究是一种旨在确定遗传与某种表型或某种疾病在全基因组范围的关联的研究手段,它可从人类全基因组范围内的序列变异中,成功筛选出和复杂疾病或表型关联的变异位
论文部分内容阅读
全基因组关联研究是一种旨在确定遗传与某种表型或某种疾病在全基因组范围的关联的研究手段,它可从人类全基因组范围内的序列变异中,成功筛选出和复杂疾病或表型关联的变异位点。然而,目前的全基因组关联研究是基于显著的统计学含义来鉴定遗传变异,具有自身局限性。基于通路的全基因组关联研究却能够考虑相互作用的基因或者相关的基因中多个变异位点,以进一步利用和挖掘全基因组关联数据。它通常被认为是对只关注最显著位点的全基因组关联研究的一种补充。本文针对通路分析的时间效率低和通路评估方法对数据分布要求高的问题分别提出了解决方案。首先,本文实现了 CUDA平台下的一种全基因通路分析模型。该算法以基于差异打分的通路分析方法为原型,通过充分利用GPU的高并行化能力大幅提高了通路分析的时间效率。这有效解决了通路分析的时间消耗过大的问题,和基于CPU的串行算法相比,基于GPU的细粒度数据的并行算法在运行时间上要快一个数量级。本文在CUDA平台下编程实现了完整模型,并用部分全基因数据进行了实验。实验结果表明,本文提出的模型在保证通路分析准确性的前提下实现了时间效率的提高,加速比最高可达到120。此外,本文提出一种基于主成分分析(PCA)的全基因通路研究方法。主成分分析法是一种有效的系统评估方法,被广泛应用于决策分析中。它利用降维的思想将众多指标映射到少量几个指标之上,并且可以定量度量各个原始参数对各主成分的贡献率。本文将全基因通路视为一个系统,将各通路作为具体变量,并通过运用距离度量将各通路量化,最终通过系统评估方法主成分分析评估出与某种表型或疾病相关的通路。该方法绕过了现有通路分析方法对样本分布要求过高的缺陷。实验结果表明,该应用行之有效。
其他文献
一、研究背景和目的肿瘤转移与肿瘤患者的预后直接相关[1,2]。近年来,随着生命科学研究的技术进步,肿瘤病因及其发病机制的研究已取得了重要的进展,但目前临床上对肿瘤转移的
特大型齿轮多应用于航空、船舶等重大工程项目中,在经济发展和国防安全方面扮演着重要角色。受限于技术、资金、人才等因素,特大型齿轮的测量依然有诸多重大难题需要解决,因
二道沟金矿位于华北克拉通北缘中段,本文主要通过近六个月的野外和井下地质调研与室内整理、分析测试和综合研究互相结合,查明了该矿床的成矿地质背景、矿床地质特征、成矿流
目的:观察温阳补肾法治疗睾丸微石症(Testicular microlithiasis,TM)之精子质量低下患者精液化验结果的变化情况,探讨温阳补肾法治疗TM之精子质量低下的可行性。方法:将符合纳入标准的66例TM之精子质量低下患者按随机数字表法分为治疗组、对照组(每组各33例)。治疗组给予仙灵苁蓉颗粒(每日一剂,早晚分服),对照组以还少胶囊治疗(5粒tid),两组病例均每20天一个疗程,所有病例
钌化合物在有机合成中发挥着重要的作用,它们可以催化醇脱氢、转移氢化、C-H活化和烯烃复分解等反应。另一方面,与环戊二烯衍生物相比,茚基金属有机化合物具有η1、η2、η3
高棅,福建长乐人,闽中十才子之一,是明初闽中诗派“诗主盛唐”主张的理论奠基者,其诗歌理论对后世产生了深远影响。高棅写诗拟效唐风,创作了大量的拟唐之作,其拟唐诗既是其诗歌理论的创作实践,也是其思想情感的集中体现,值得学界重视。本文以高棅《啸台集》与《木天清气集》中的拟唐诗为基础,运用文献研究法、知人论世法、文本细读法等研究方法对高棅拟唐诗进行全面、细致的整理与分析,重点探究其题材类型、思想内容、艺术
基因组编辑技术作为一种定点改造基因组DNA的方法,已广泛的应用于各类研究对象中。蛋白质精氨酸转移酶5(Prmt5)是一类Ⅱ型酶,能够催化形成对称的二甲基化精氨酸,在小鼠胚胎发
智能化开采是我国煤炭工业发展的需求和必然方向,基于三维空间尺度的采煤机运行姿态是实现智能化开采的必需性基础信息。采煤机运行姿态的精确感知不仅能为探知、预测智能化
本研究主要针对纯化凹凸棒土(purified attapulgite(ATP))及酸处理凹凸棒土(acid treated attapulgite(ATP))含量对超高分子量聚乙烯(ultrahigh molecular weight polyetheyl
赛买提杏是新疆有地方特色的品种,在南疆部分地区已成了特色林果产业之一,被列为优质品种重点推广,但是该品种在采摘后常温条件下衰老迅速,易变软、腐烂,货架期很短限制了其