基于并行计算的基因序列快速比对方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:hengheng5251984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因序列比对是生物信息学分析的重要手段。随着人类基因组计划的完成,测序技术不断发展,测序成本大幅降低,使得个人基因组测序成为可能,基因序列比对计算的需求也随之转变为全基因比对。为了适应高通量测序的发展,需要快速准确的序列比对方法。目前包括美国国立生物技术信息中心(NCBI) BLAST平台在内的基因序列比对服务平台难以满足大计算量和高计算精度的新要求。并行化计算作为一种高效调度计算资源的有效手段,已逐渐应用于大规模的基因序列比对分析。NCBI BLAST的并行化版本mpiBLAST,面向参考基因组实现了并行化计算,使计算大幅加速,但其对计算资源的要求过高,在被测基因的处理上依然有提升的空间。因此,为了更有效满足基因序列比对的新要求,本论文的目标是设计了一种面向被测基因组实现并行化计算的快速高效基因序列比对方法。具体工作如下:1)基于BLAST算法思想,论文首先剖析了并行化处理对序列比对算法的要求,选择了一种能实现短读序列快速准确比对的算法,并对其进行了改进,使之更适合并行化计算;2)分别设计了针对被测基因组的静态/动态并行化分配策略;3)分析了并行化计算加速和数据传输优化效果,并通过静态分配效果的剖析和数据多次传输模拟实验,比较和评估静态和动态分配策略的优势和劣势,建立了一种通过被测基因组序列长度和最大序列读长进行最佳计算策略选择的方法;4)开发了并行化基因序列比对在线分析工具。论文利用大肠杆菌、酵母、果蝇等多个全基因组序列数据对所提出的并行化设计方案的加速效率、数据传输优化和并行任务分配效果进行了比较与评估。结果表明,本论文提出的方法,可以高效调度更多的计算资源;降低被测基因组的数据传输压力;降低承担任务的计算机的缓存要求;更有效满足序列比对的新要求;为并行化基因序列比对分析应用的推广提供了一种可行的手段。
其他文献
<正>美国女作家斯蒂芬妮·梅尔(Stephenie Meyer)的成名作《暮光之城》系列小说描写的是女高中生贝拉与吸血鬼帅哥爱德华之间的浪漫爱情故事。该系列分为《暮色》《新月》《
高超声速飞行器因其大马赫数和高海拔的飞行特性,具有极大的军事和民用价值。高超声速飞行系统集成了多学科的前沿技术,学科之间交互复杂,需要通过综合的优化设计来达到最优
磁共振成像(MRI)可以准确、无创地采集活体信息,在临床医学与科学研究等领域有着广泛应用。磁共振成像仪中的梯度子系统用于产生梯度磁场,以实现对成像物体的空间编码。其中
研究背景:帕金森病(Parkinson’s disease,PD)是一种中老年人常见的慢性进行性神经变性疾病,随着我国人口的老龄化,其发病率呈逐年递增的趋势。目前,PD的诊断尚为临床诊断,根据患者在
背景:胆管下端的梗阻性病变复杂多样,良性的病变主要包括胆管结石和胆管炎症,恶性的则主要有胆管下段癌、胰头癌、壶腹部癌等。由于这些良恶性病变都可引起胆管的狭窄或梗阻,
硅微陀螺仪是一种新型的MEMS惯性传感器,与传统的陀螺仪相比具有体积小、重量轻、易于数字化、可批量生产、功耗低等优点,其在国民经济和国防军事领域具有广阔的应用和发展前
虽然随着器官保存技术、外科手术技巧的提高,肝移植术后胆道并发症的发生率和致死率都有了一定的降低,但仍分别高达8%~25%和1%~5%,占肝移植术后死亡原因的15%~34%。缺血性胆道损伤(ischem
汽车保险在社会中受到广泛的关注,同时在保险公司中具有重要的位置,因此对汽车保险的索赔次数进行预测是非寿险精算理论的重点研究内容之一。车险数据主要包括索赔频率、索赔
水平井下套管作业比常规直井相比有特殊的难点,其中套管偏心和套管摩阻影响固井。当套管偏心程度过大时会降低水泥浆顶替效果,无法保证固井质量。套管摩阻过大时套管不能下入
每一座城市对于生活在这座城市里的人而言都是最好的。透过短视频这一载体,以日益革新的方式变化和发展着的城市被记录下来,随之而传递的,又将是怎样的情感呢?