基于高通量测序数据的结构变异检测方法的研究

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户:lovemy521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着高通量测序数据技术的发展,人类全基因组的测序成本在不断降低,测序速度也有了较为显著地提升。运用生物信息学的手段处理这些海量基因组数据的需求也越来越迫切,而对于基因组结构变异的检测更是这个领域的核心内容。由高通量测序数据特征入手,介绍了当前主流的生物信息学结构变异检测方法,并阐述了有关基因组结构变异检测结果的评测指标和手段,最后,结合个人基因组的发展,对于该领域未来的发展提出了改进建议。 全文查看链接   其中,可利用的双末端测序数据都是经过BWA等[6]软件比对之后的SAM格式文件。文中将可利用的数据主要分为两类:非一致短序列对(discordant pair)和单映射双末端测序数据(hanging pair)。如果这两个序列片段的映射距离被认为是在插入距离的可接受范围内,而且两个片段的朝向都没有发生改变,即可认为这种序列对为一致的序列对(concordant pair),该种序列在绝大多数情况下均不会被认为覆盖了一个结构变异。除此之外,其他的双末端测序数据,无论是序列朝向问题、插入距离问题或者CIGAR值异常等问题发生时,均可认为产生的是非一致的序列对(discordant pair)。除此之外,一种特殊情况,就是双末端测序数据中仅有一个序列片段比对到参考序列上,而另一个却未能比对到参考序列上,由此将没有CIGAR值,这类特殊的序列可称为单映射双末端测序数据对[7]。 全文查看链接
其他文献
<正> 在临床工作中,经常遇到葡萄膜炎瞳孔后粘连并发白内障的患者,对这类患者治疗难度较大,对白内障手术术中术后的处理提出了更高的要求。我们于1998年10月至2001年10月间,
静脉输液在临床治疗中占有很重要的地位。是常用的临床操作和重要的给药方法之一。特别是在紧急抢救病人中.尽快建立起静脉通络,给抢救病人赢得时间,减少病人的痛苦,根据自己的临
该文针对液力传动主要产品,分析了液力传动发展的关键技术及存在的诸多挑战,并结合液力传动技术的发展,论述了液力传动技术的主要发展目标和技术途径。
围绝经期综合征的发生会对女性身心健康造成影响,目前多采用激素替代治疗。中医药是治疗围绝经期综合征的有效方法。本文对近年来国内外有关中医药治疗围绝经期综合征文献报
水产饲料添加剂具有提高水产动物摄食率和饲料转化效率、促进生长和发育、调节机体代谢机能或免疫功能、增强抗病力、改善水产品品质等作用。近年来,国内外已有较多关于水产
摘要:目前,二氧化碳的排放量的持續增加已构成全球性重大问题,为改善区域生态环境,本研究主要提出了区域碳平衡评估及动态预警的主要模型予以实现,可以在不同时间、不同尺度条件下,对区域碳平衡的状况进行评估及动态预警。本文将哈尔滨市作为研究区域,基于多种碳平衡模型,采集哈尔滨市土地利用,统计数据,道路工厂等空间数据,结合人口数量、能源消耗等统计数据,实现了碳吸收—碳排放以及区域二氧化碳含量动态预警服务评估
以碳纳米管为基体,制备了碳纳米管/磁性氧化铁复合材料(mMWCNTs),再与(3-氨丙基)三乙氧基硅烷(APTES)反应得到氨基修饰的mMWCNTs(mMWCNTs-NH2),在mMWCNTs-NH2表面采用发散法
通过调查分析大学生运动损伤的性别、年龄、运动项目、损伤类型与部位等特点,结合大学生现场救护技能掌握、获得途径和技能类型需求等情况,以高校体育课程教学为依托,制定具