【摘 要】
:
在生物信息学领域,利用计算对蛋白质结构预测进行模拟运算并从中预测出蛋白质分子空间构象的方法已被普遍接受。由于模拟运算所需要的计算量异常巨大,针对生物信息学领域对高
论文部分内容阅读
在生物信息学领域,利用计算对蛋白质结构预测进行模拟运算并从中预测出蛋白质分子空间构象的方法已被普遍接受。由于模拟运算所需要的计算量异常巨大,针对生物信息学领域对高性能计算的迫切需求,在分析国内外对等计算研究成果的基础上,设计并实现了一种基于结构化对等网络的高性能计算平台P2HP-2的编程模型及其应用实例蛋白质结构预测。为了使高性能计算平台P2HP-2支持具有树状任务图的对等高性能计算应用,给出了一种共享消息编程模型CMP。CMP由软件开发包(SDK)组成,提供完备的用户编程接口。利用CMP对应用进行分布式计算时,将应用分成若干程序模块,任务运行在不同的计算节点上。各计算任务通过调用软件开发包的函数在不同计算节点之间互相通信。根据共享消息编程模型CMP,在P2HP-2上实现了分布式Threading算法,进行蛋白质三级结构预测。Threading的分布式计算过程结合了P2HP-2的编程模型CMP特征以及Threading方法本身的计算特点,将Threading计算过程划分为叶子、树杈和根,提出了基于不同度数和叶子数的并行划分策略,由此构建出不同的任务树,以便提高任务划分的均衡性。通过模拟测试与应用实例测试,对P2HP-2编程模型CMP性能和分布式Threading算法进行测试。从PDB库中选取了20条目标序列和20条模板,固定序列和模板并采用不同的叶子数和度数分别计算,系统运行取得了不同的计算加速比:在志愿者节点数为4的情况下,叶子数为20、度数为5时计算加速最高比为2.5;而在志愿者节点数增加到15时,最高计算加速比为8.91。实验表明,P2HP-2能高效地支持具有树状任务图的对等高性能计算应用,其编程模型具有较好的能用性和可扩展性。
其他文献
现有的资源定位机制定位模式单一,定位延迟没有保证,在可扩展性和可维护性方面存在不足,并且在资源查找过程中,消息洪泛带来的网络开销大,不适合大规模的复杂网络应用。针对
随着互联网的普及和发展,产生了许多新的应用,其中许多是高带宽需求的,如视频会议、视频点播、股市行情发布等。组播技术就是顺应这种网络应用的需要而产生的。组播技术因其
模糊查询在现实生活中非常普遍,在很多应用场合中,用户需要某些属性的目标值,但是不需要这些值的精确匹配。这些查询的结果就是一系列最符合所要求属性值的“Top-k”元组。网
随着电信业务的迅速发展,网络基础设施的建设工程日益增加,工程项目种类日益繁多,施工条件日益复杂。同时,传统的工程项目管理主要基于人工管理模式,导致项目管理效率低下,管理部门
随着机构改革的深化和现代化信息技术的发展,原有的政府办公模式已经不能适应日益增长的事务处理和信息共享等方面的要求,政府部门纷纷构建电子政务系统。政府业务过程的自动化
相比较传统的集中式的信息检索技术而言,对等计算(P2P)信息检索技术具有成本低、容错性好、可扩展性强等优点,可充分挖掘网络资源,并可提供个性化的网络服务。在面向文档资源
随着高性能计算应用的需求越来越大,设计性能良好、低价格的高性能计算集群满足不同用户的需求是中小型规模高性能计算的重要目标。蓝星高性能计算平台通过图形化的并行程序
P2P应用中有很多难点问题,比如效率、可靠性,信誉,安全性等,本文着眼于信誉机制的设计这一问题进行研究。目的在于设计并实现出一种可以直接部署在P2P文件共享应用中的信誉机
计算机网络已经渗入到人们生活的各个领域,微小的错误可能导致无法挽回的损失甚至危及人的生命。通信协议是网络正常发挥作用的基础,如何保证它的可靠性和安全性是学术界和工
求解NP难度问题一直是计算机科学技术的一个瓶颈任务。近年来的研究表明,对于NP难度问题可能根本不存在既完整严格又不太慢的求解算法。因此,这类问题的求解方法多为启发式方法