下一代测序短序列比对软件算法比较及评价

被引量 : 0次 | 上传用户:ni0ni
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高通量的测序能力使下一代测序技术迅速成为全基因组测序应用领域中的主流技术。ChIP-Seq,RNA-Seq及全基因组重测序等基因组范围内的相关研究均涉及下一代测序数据分析,而理解下一代测序数据最重要的第一步即比对——精确定位每条短序列片段在参照基因组中的位置。目前生物学者通过随机选择短序列比对软件比对分析高通量测序数据,并未根据自身研究类型以及测序数据类型的特异性,选择最佳的短序列比对软件。而本课题的研究目的主要是通过系统比较评价19款短序列比对软件的性能,评价短序列比对软件优劣性,指导生物学家选择合适的比对软件,从高通量的下一代测序数据中精确提取最大化的生物信息。我们首先比较了19款比对软件的算法及特征功能;其次,通过10组来自不同的下一代测序平台的实际测序数据评价短序列比对软件运行效率,最后,通过设计下一代测序数据模拟软件,模拟生成14组参数不同的下一代测序模拟数据(涉及测序误差率,插入/缺失大小及序列片段长度等参数),评价比对精确度,从而综合评价短序列比对软件的优劣性。根据比较结果分析,Novoalign和Segemeh比对功能具有多样性,包括空位比对,双末端比对和bisulfite alignment等比对功能,可以分别应用于研究单核苷酸多态性和结构变异,处理重复区域比对定位问题,构建组蛋白甲基化模式图谱等等不同类型的生物学应用;另外,Bowtie, BWA和SOAP2处理高通量短序列数据比对问题时,计算速度快,内存使用量低,具有高效的实用性;而SOAP2,RMAP,PASS,Novoalign和PerM处理存在错配的短序列数据时具有较高的精确度和灵敏度,适合用于单核苷酸多态性检测相关研究;PASS, SOAP2和Novoalign处理存在插入/缺失的短序列数据时,精确度和灵敏度较高,适合用于结构变异相关研究;最后GASSST比对精确度和灵敏度随着片段长度增加而增加,比较适合分析长序列数据。本课题可以作为重要指导性资源,为生物学研究者选择最佳的短序列比对软件提供理论依据。
其他文献
本文以近年中国网络安全公司发展现状和全球网络安全技术发展趋势作为研究背景,以中国网络安全公司的综合计数据作为研究依据,并结合国内网络安全公司商业运营现状,进行系统
背景:慢性肾脏疾病是多种慢性肾脏疾病的终末阶段,慢性肾脏疾病的死亡率高,防治率低,病死率较高。起病隐匿,病情凶险,近年发病率有明显上升趋势。据国际权威肾脏疾病组织统计C
介绍了爪极发电机轴电流产生的原因及其危害,提出了解决这一问题的方法,并通过样机进行了验证,对改进和优化爪极发电机的工程设计具有一定的参考价值。
重新研究了交流异步电机的数学模型,提出了用电流角密度法来研究异步电机数学模型和用等效二相转子电流来表达异步电机数学模型的方法,在同步旋转坐标系上推导得到简洁明了的异
<正>收藏是近些年来出现频率相当高的热词之一,在中国目前整个市场经济中,艺术品市场所占的份额不高,但却在逐步稳定的增长,艺术品行业的异军突起从客观上改变了社会经济结构
<正>清代京师地区的监狱建在刑部衙门内,刑部设有提牢厅、司狱司,管理部内南、北两监一切事务。司狱司有常设的管狱官,即司狱。提牢厅则无定员,刑部堂官委派各司满、汉主事各
刑法学界有关特殊防卫权条款一直存在诸多争议,这些争议深刻的影响着学界有关特殊防卫权的认识,鉴于特殊防卫权蕴含着丰富的宪法学知识,从宪法学角度对特殊防卫权问题进行研究有
自2004年银监会正式批准商业银行开展人民币理财业务以来,我国商业银行理财业务发展迅速。尤其自2005年中国银监会颁布了《商业银行个人理财业务管理暂行办法》和《商业银行
我国已进入老龄化社会,未富先老、老年人口基数大以及家庭人口的结构变化使养老问题成为全社会关注的热点。而老年人的居住是老龄化问题的核心之一,并且老年人户外活动空间是