CUP-GPU协同计算在生物数据分析中的应用研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:com_cn121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物信息学领域,对生物数据进行分析是极其重要的一个过程。随着数据量的增大,对生物数据分析的耗时越来越长,严重制约了相关理论设想的验证。CPU-GPU协同计算,能够以较小的代价,组建一个高性能计算平台,加快数据分析与处理的速度。  本文针对大量生物数据分析中硬件资源利用率低,计算耗时长的问题,在经过技术、性能以及资金消耗多方面的权衡下,提出了利用多核CPU与GPU搭建一个CPU-GPU协同计算平台的方案。平台采用OpenMP实现对多核CPU的编程,采用CUDA实现GPU并行程序的编写。并针对平台硬件的特征,提出了几种数据预处理与任务分配的策略,能够最大限度的缩减生物数据分析的处理时间,为研究提供支撑与促进作用。  本文旨在解决标签SNP选择仿真实验以及DTI计算与预测两个具体的生物数据分析问题。本文通过对现有标签SNP选择算法进行分析,提出了HTag算法,并对该算法进行了并行化的具体实现,不仅使标签SNP的数量减少,而且使运行时间大幅缩短。本文针对NetCBP算法执行效率低的问题,对该算法过程进行了详细的分析与拆解,使之适合并行化。通过并行化使单药物DTI计算的时间缩短,并考虑到多药物同时计算的情况,通过并行任务调度缩短了多药物同时计算的时间。  实际应用计算表明,利用CPU-GPU协同计算可明显缩短生物数据分析的计算时长。在对其他领域的数据分析处理中,也具备一定的参考价值。
其他文献
图像识别属于人工智能的一部分,是当前学术前沿,诞生了众多的研究分支。本文选择了对图像识别的基础算法加以研究,分别为图像相似度、边缘检测和物体轮廓定位方法,并提出了新
目前,基于内容的商标检索是商标查重的一种重要的技术手段,该技术主要通过计算机自动地对图像进行特征提取以及特征匹配,最终返回与待检索图像相似的图像,避免了基于类目或文本的
多示例学习是一种新的机器学习框架,是机器学习领域中的热门的研究方向。近年来,有监督学习在很多应用领域中已经取得了的成功。然而,在现实应用中,许多问题依然难以用简单的示例
随着Internet网络的快速发展,产生了越来越多的针对个人的网络服务,这就需要越来越多的敏感数据要在公共Internet网络上进行传输。因为这些敏感信息关系到网络用户的个人财产安
随着互联网技术的飞速进步以及深度学习展现出强大的性能,基于图像和视频的各种应用也得到了前所未有的发展。然而,伴随着这些应用给日常生活带来便利的同时,也给社会带来了许多
随着应用程序规模的扩大,对内存系统的容量需求不断增加。传统动态随机存储器(Dynamic Random Access Memory,DRAM)的扩展性有限且刷新能耗高,难以满足未来应用程序的需求。新型非
手机短信作为移动通信中的一项基本业务,伴随着移动互联网的飞速发展,其使用量日益增长,功能范围日趋广泛,极大地方便了人们的生活。短信的大量使用致使用户在对其管理上存在一定
由设计瑕疵引起的安全问题占据了系统开发过程中出现的安全性问题的50%,因此,无论在多么坚实的软件安全程序中,对于系统体系结构的风险分析都显得十分重要。安全性风险分析是
IaaS公有云服务将计算资源打包成虚拟机实例的形式供租户租赁,并按照“按用量收费”的方式进行计费。租户不但免去了购置基础设施的资金投入,还可以灵活便捷地根据任务负载对资
近年来,图论和复杂网络的相关研究受到了越来越多领域学者的广泛关注,包括物理、化学、计算机科学、数学、生物学、经济学等,而相关研究也逐渐从单学科向多学科交叉转变。与