基于英特尔多核及众核平台的全局序列比对算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户：ssskkkmmm77

【摘要】

：

随着测序技术的发展,基因序列的数量得到了迅猛的增长,为了有效地利用这些序列数据,我们往往需要将它们与已知的基因组进行比对,从而获取序列间的相似性以及同源性等信息,为

【作者】

：

张吉凯

【出处】

：

山东大学

【发表日期】

：

2004年期

【关键词】

：

高性能计算序列比对 SIMD 异构计算并行框架

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着测序技术的发展,基因序列的数量得到了迅猛的增长,为了有效地利用这些序列数据,我们往往需要将它们与已知的基因组进行比对,从而获取序列间的相似性以及同源性等信息,为后续的进一步分析打下基础。传统的序列比对算法由于自身算法复杂度的限制,在处理海量序列的比对时,往往难以达到期望的效果。近年来随着硬件和软件技术的发展,尤其是众核架构的出现,高性能计算在自然语言处理、人工智能、计算生物学等领域发挥着越来越重要的作用。将高性能计算应用于序列比对,可以显著地改善比对的速度,提高序列分析的效率。本文主要基于英特尔的多核和众核平台,针对全局序列比对问题进行研究,利用多核及众核平台的高速计算能力对全局序列比对算法进行加速优化,进一步提升算法的性能。目前常用的全局序列比对算法是Needleman-Wunsch算法,在此算法的基础上衍生出两种基于位并行优化的比对算法:Myers和BitPAl,它们在功能性上做了一些削减,以获取更高的性能。我们主要从两个维度对上述算法进行了优化:线程并行和SIMD并行,线程并行主要利用多线程技术,将序列数据划分为多个数据块,每个线程并行地处理一块数据。在线程内部,我们利用SSE、AVX2、KNC和AVX512等SIMD指令进行更加细粒度的并行优化。为了提升系统的可扩展性,我们设计并实现了一个模块化的并行框架,我们将系统中的功能进行拆分细化,划分出多个独立的功能性模块,模块间相互协作,共同完成指定的任务。比对算法的逻辑被抽象为一个计算模块,其他的模块只需向该模块中传入数据,然后获取对应的计算结果,无需关心计算模块的具体实现,这样如果需要往并行框架中加入新的比对算法,我们只需修改计算模块的实现,便可以复用框架的其他功能,保证了系统具有良好的扩展性。同时为了解决SIMD指令集不统一的问题,我们设计了虚拟SIMD指令,并实现了对应的指令解释器,利用虚拟SIMD指令,我们只需维护一份代码,通过虚拟指令解释器,我们可以将其翻译为针对不同指令集的代码,可以极大地提高开发效率。我们在不同的平台上对我们的并行算法做了测试,实验证明我们的并行算法取得了很好的加速效果,同时我们和其他的并行实现做了对比,我们的算法取得了更加优异的性能。

其他文献

闽西汀江流域古村镇的历史考察

本文是以闽西汀江流域古村镇为研究对象,汀江流域作为闽西地区的历史文化发祥地,至今保存了许多风格迥异的古村古镇。本文主要是通过历史角度,试图运用历史学、地理学、建筑

学位

古村镇自然景观人文景观保护开发

同位素水文地质学的数学方法及其在西北干旱内陆河流域的应用

我国西北干旱区降水稀少,气候干燥,沙漠广布,但境内的高山如祁连山等却是荒漠中的“湿岛”。发源于冰川而最终消失于沙漠的内陆河孕育着许多绿洲。这种特殊的山地-盆地结构决

学位

西北干旱区内陆河同位素水文学数学模型集中参数模型地下水滞留时间14C年龄校正模型

IGF-2、IGF-1R、IGF-2R在子宫内膜腺癌的表达及临床意义

目的:胰岛素样生长因子属于一类生长因子家族,大多数胚胎组织或出生后个体的某些正常或癌变组织,都能够合成并分泌胰岛素样生长因子(insulin-like growth factors,IGFs),通过

学位

子宫内膜癌腺癌IGF-2IGF-1RIGF-2R免疫组织化学

皮质电刺激控制液压损伤致大鼠外伤后癫痫发作的实验研究

目的:为研究外伤性脑损伤在大鼠外伤后癫痫形成中的作用,采用自行研制的颅脑液压损伤装置造成大鼠重度颅脑损伤,建立大鼠外伤后癫痫动物模型。然后,在模型成功建立基础上引入

学位

创伤性脑损伤液压损伤外伤后癫痫动物模型清醒大鼠皮质电刺激脑电图

我国高校教师激励机制研究

进入二十一世纪,高校间人才竞争、高水平师资竞争日趋激烈。只有将激励理论与高校管理实践相结合,建立一套科学的、有利于人才培养和使用的激励机制,才能充分调动广大教师的

学位

高校教师激励机制需要层次激励因素激励措施

城市轨道交通供电再生制动反馈能量利用仿真研究

随着经济的发展,城市交通拥挤状况越来越严峻,严重影响人们的日常工作和生活。地铁具有速度快、站距短、起制动频繁等特点,已成为解决城市快速交通的有效方式。制动技术是城

学位

地铁牵引供电系统再生制动电阻制动节能率储能装置

基于模拟退火算法的PCB板电子元件条件热布局优化研究

随着电子行业的快速发展,电子设备在汽车上的运用也越来越广泛。电子元件在PCB板上的集成度越来越高,芯片尺寸也趋向微小化,功率也逐步提升,导致整个PCB板热流密度急剧增加,芯片工作时表面温度过高,由此引发一系列的热失效问题。采用智能优化算法进行芯片布局优化能有效的降低PCB板电子元件的热负荷。实际工业中芯片的位置往往有一些位置条件限制。本文在更接近工业应用的情况下,采用模拟退火算法对PCB板上电子元

学位

PCB条件热布局优化模拟退火算法温度场红外成像技术

面向多体系统的五轴联动数控机床运动建模及几何误差分析研究

数控加工后置处理不仅是CAD/CAM技术和数控编程系统的重要组成部分,而且也是实现数控机床几何误差软件补偿的重要途径。后置处理的关键是机床运动求解,即根据机床的运动结构

学位

五轴联动数控机床运动学建模多体系统几何误差建模误差参数辨识刀位文件数控加工代码

河马石·四季景园房地产（二期）开发项目可行性及风险防范分析

房地产业的发展对国民经济保持持续增长起着举足轻重的作用。在未来的几十年的发展中,房地产业对经济社会发展和国民经济的贡献率将会进一步提升,房地产业将会成为经济发展的

学位

房地产市场可行性财务可行性综合效益可行性风险防范

本科教学审核评估背景下人文地理与城乡规划专业实践教学体系研究

实践教学作为教育部本科教学评估工作重要的审核项目,是教学评估工作中重要的考查内容,作为高校培养学生实践能力和创新能力的重要手段,对于人才培养工作具有举足轻重的作用

期刊

人文地理与城乡规划专业审核评估实践教学体系构建

基于英特尔多核及众核平台的全局序列比对算法研究

其他学术论文