基于高通量测序数据的基因组结构变异识别方法

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:sdniloveu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近十年来,高通量测序(High-throughput sequencing Technology)技术的快速发展极大地推动了人们对各个物种特别是人类本身基因组序列越发深入的了解。在对基因组的研究过程中,结构变异(Structural Variation)由于其在进化与自然变异中的重要意义而倍受关注。高通量测序技术的进步,又将对基因组上结构变异的研究推上更高的层次。  在此背景下,本文的工作即采用统计学方法对结构变异中最重要的两大类,插入删除变异(Insertion and Deletion)和拷贝数变异(Copy Number Variation),相应构建基于高通量测序数据的变异识别算法和工具。  对于INDEL变异的识别,虽然很多现有的工具已经能够通过整合多种信号来提高变异识别的灵敏度,但其绝大多数仍有诸多局限。通过本研究,我们提出一种全新的基于断点的多信号整合变异识别工具BreakSeek,不仅能够有效识别不同规模的纯合、杂合INDEL变异,同时能够提供变异的断点位置及杂合度精确估计。通过大量基于模拟数据和真实数据集的测评,本文所构建的BreakSeek在对不同规模的INDEL识别的灵敏度和对假阳性率的控制上,都在不同程度上优于现有方法。此外,通过对不同识别工具在实际数据上所检测到的变异处各个信号的统计分析,我们剖析并展示了多信号整合模型对假阳性及冲突信号的关注和处理的重要性。  除了INDEL变异外,CNV(Copy Number Variation)同样是基因组结构变异中重要的一类,并且在一些重大病症对人类的造成的基因功能失调中扮演重要角色。当前对CNV识别的研究主要集中于对单一个体相对于参考序列的CNV识别和对两样本相对CNV的识别,对此类CNV识别的研究虽已日趋完善,但对这种单纯基于个体的CNV的分析和结论也只能局限在个体间而不能通过遗传的角度分析。不同于这两种传统的CNV识别,本文基于千人基因组计划中三样本父-母-子女的家庭数据进行了基于家系的CNV分析寻找子女相对于父、母的CNV,不仅找出了子女继承自父母的CNV并通过分层聚类分析推断出这些继承式CNV的生成方式,同时还找出了少量子女相对于父母的新生变异。
其他文献
作为目前全球最大温室气体排放国和人口大国,中国面临着农田土壤退化和粮食安全的双重威胁,而土壤有机碳是土壤肥力的核心,所以迫切需要探求有效的措施来提高我国的碳储量和粮食
在电力系统运行过程中,会经常出现很多随机扰动和不确定性因素,从而造成电压不稳定现象的发生。因其对社会的影响面广,造成巨大的经济损失,俨然已演变成一个急需解决的社会问题。电压稳定裕度作为一个重要依据可直观地判断出系统的电压稳定性,为了能够准确地得出系统中各节点的电压稳定裕度,于是提出一种径向基神经网络算法,它具有收敛精度高、收敛速度快和极强的拟合能力等优点。而标准BP算法经常导致局部极小值,并且具有
永磁同步电机具有体积小、重量轻、效率高、转子无发热等优点,在电力传动领域内已经获得了广泛的应用。近年来,永磁同步电机直接转矩控制系统具有结构简单、转矩响应快、鲁棒性好等特点,使其受到国内外的普遍重视。首先,论文介绍了永磁同步电机的直接转矩技术以及永磁同步电机的无速度传感器控制技术的研究背景以及现状;简要地介绍了永磁同步电机的结构及其特点,分析了永磁同步电机在不同坐标系的数学模型。然后,根据永磁同步
在能源枯竭和环境污染日益严重的今天,新能源与可再生能源既是重要的补充能源,又是未来能源结构的基础。近年来,太阳能光伏发电技术得到了前所未有的发展,已经成为当今利用太
本文通过对荣华二采区10
期刊
目的:观察蒲黄对糖尿病胃轻瘫大鼠胃窦平滑肌电活动和对大鼠模型离体胃窦平滑肌条收缩活动的影响,并探讨其作用机制.结论:蒲黄水煎液可显著增强DGP大鼠胃窦平滑肌电活动,蒲黄
目前,湄公河流域经济的快速发展已经影响到它社会生态系统的各个方面。由于复杂的社会生态系统,粮食的最大化生产已经不可避免地影响到了其他生态服务系统,如传染病的控制。后常
作为新型、可靠、实用的FACTS装置,磁阀式可控电抗器的出现为超高压、特高压电网的电压控制、无功调节提供了一种全新的技术手段。它可以为系统提供动态电压支撑,保持电压稳定,实现动态无功调节,提高电网安全稳定运行水平;抑制潜供电流和降低恢复电压,提高重合闸成功率,具有良好的经济和社会效益。本文首先对磁阀式可控电抗器的基本结构和工作原理进行了深入的阐述,基于基尔霍夫电压、电流定律,安培环路定律建立了电抗
生态系统服务是近年来生态学研究新的热点领域和学术前沿,是将生态系统与人类福祉联系起来的重要纽带,受到了全球众多国家与研究组织的重视。传统的生态保护以生物多样性相关组
配电网的无功优化是增强网络电压水平、降低网络损耗、保障电力网安全稳定运行的一项重要手段。采用在配电网中安装DG(Distributed Generation,分布式能源)可在一定程度上缓解目前所面临的能源危机,达到节能减排,环保低碳的目标。但是DG加入配电网使网络中的潮流分布发生变化,从而使配电网的规划、运行以及控制方式发生改变。本文研究含DG的配电网的无功优化问题,所做的主要工作如下:(1)本文