【摘 要】
:
网络模拟,是研究网络行为、评估协议性能的重要方式。PDNS是应用非常广泛的一个并行分布式网络模拟器。然而,PDNS也面临着分布式应用难以回避的系统可靠性方面的缺陷。检查点
论文部分内容阅读
网络模拟,是研究网络行为、评估协议性能的重要方式。PDNS是应用非常广泛的一个并行分布式网络模拟器。然而,PDNS也面临着分布式应用难以回避的系统可靠性方面的缺陷。检查点/卷回恢复技术是实现系统容错的重要手段。通过在系统正常运行过程中设置检查点,保存任务的相关状态。在程序崩溃后,可以根据检查点文件中所记录的系统及进程的信息,将进程卷回至最近保存的正常运行状态继续执行,而不必重启任务,从而节省了大量的重复计算时间。本文主要研究使用检查点/卷回恢复技术来提高PDNS的容错能力。分布式检查算法以单进程检查点算法为基础,对于PDNS而言,则需要首先实现分布式模拟中单个模拟进程的检查点容错。文章分析比较了单进程检查点算法不同实现层次之间的优缺点,然后基于Condor实现了用户级透明检查点。文章通过实验对该单进程检查点的性能进行了测试,并分析了其时空开销的规律。PDNS检查点容错需要解决的第二个问题是如何备份恢复各个模拟节点之间的连接。在局域网中,PDNS通过TCP完成各个节点之间的交互。因此,文章对Linux中TCP连接通信过程进行了分析,在此基础上采用可装载内核模块的方式实现了PDNS各个节点之间TCP连接的备份与恢复。在实现以上两个基本功能之后,选择合适的分布式检查点算法是PDNS检查点容错的最后一个问题。PDNS在模拟时采用了保守的时间同步机制,并且从逻辑上看PDNS具有主从结构。结合PDNS的以上特点,文章给出了Sync-and-Stop分布式同步检查点算法在PDNS中的原型实现。
其他文献
机器学习的核心目标之一是让机器具有像智能生物一样的自主学习的能力。时至今日,机器学习已经成为人工智能领域的核心研究内容,其应用遍及人工智能的各研究方向,包括专家系
随着互联网的快速发展,Web已成为人们获取信息的重要来源。为了满足人们不断增长的从互联网上获取信息的需求,Web信息抽取技术不可避免地成为当今研究的技术热点。由于互联网上
在当今数字化生活中,多媒体数据与日俱增,大数据时代更让多媒体数据在人们的生活中起到至关重要的作用。在多媒体数据中,占最大多数的是图像和视频,而图像是视频的基础,自然
集成了传感器、嵌入式计算、网络和无线通信四大技术而形成的无线传感器网络(Wireless Sensor Networks, WSN)是一种全新的信息获取和处理技术。它在环境、健康、军事、空间
随着移动通信的发展,移动用户迅速增加,同时对数据业务提出更多需求。如何利用现有技术满足市场的需求是各大运营商共同关注的问题。GSM无线网络规划和优化对GSM无线网络建设进
在建筑环境中,停留在场景中的人数及滞留时间通常在一定程度上反映了人们对此场景的喜爱程度,可以作为景观评价的指标。为了实现这一目标,本文采用运动检测和跟踪的相关技术
在互联网迅速发展、Web信息资源急剧增长的背景下,传统的信息检索由于信息源的固有特点和检索技术的缺陷,无法找到语义上匹配的信息,导致漏检、误检现象,从质量和效率上都不
随着社会信息化程度越来越高,各种各样的应用系统处理的数据量也就越来越大,因此,怎样提高数据库访问的响应速度就显得尤为重要。结果集缓存就是一种能够提高数据库响应速度
宽带网的飞速发展推动了流媒体直播系统的广泛应用,但传统的基于C/S模式的流媒体直播系统存在服务能力瓶颈,很难适应大规模的应用。为此,通过将P2P网络技术与流媒体技术相结
随着嵌入式系统与网络的日益结合,如何保证嵌入式系统间重要数据的安全通信,成为嵌入式领域中重要的研究方向。由于IPSec为IP网络提供安全服务,能有效防止长期困扰人们的许多