论文部分内容阅读
迁移工作流是将移动计算技术应用于工作流管理的一项新技术。工作流业务过程根据业务目标的复杂程度被映射为一个或多个迁移实例,每个迁移实例执行一个目标相对独立的子业务过程,迁移实例在工作位置的支持下通过迁移和协作实现总的业务目标。构成迁移工作流管理系统的三要素是迁移工作流管理引擎、迁移实例和工作位置。工作流引擎完成工作流过程定义、迁移实例生成和多迁移实例协调等,工作位置指停靠站服务器及其相关联的工作机网络。其中,停靠站服务器是迁移实例的运行场所,工作机为迁移实例提供各种工作流服务,是工作流服务的实际执行场所。由于作为迁移工作流管理系统的主体:迁移实例是一类在复杂网络环境中迁移、异构系统环境中执行移动计算的程序,因此,它不可避免地会受到环境中诸多不可靠因素的影响,停靠站服务器主机节点崩溃会导致其上所有迁移实例的夭折,迁移实例运行时环境失效和本地工作流服务失效会导致业务流程阻塞等,可以说迁移工作流管理系统的容错性能是目前其应用推广的瓶颈。因此,容错是迁移工作流管理系统中的重要研究内容之一。基于对迁移实例活动过程和工作流管理特征的研究,停靠站服务器容错机制需要具备以下基本性质:(1)完成性。即迁移实例在工作位置上的工作,不能因为停靠站服务器主机崩溃、迁移实例运行时环境失效或工作机网络失效等因素而发生阻塞。(2)仅一次性。即任何修改工作流服务资源的业务过程,不能因为系统或迁移实例恢复而执行多次。对于完成性,本文提出了基于软件方式的全复制主-备服务器模式;对于仅一次性,本文提出在工作流流程定义中将全局业务过程划分为若干个目标相对独立的业务断点,以业务断点作为迁移实例工作和恢复的原子事务。本文主要讨论了停靠站服务器主机容错,迁移实例运行时环境容错和工作流服务容错三种情况,为这三种情况分别制定了失效检测和恢复的相关策略。本文在系统已有的服务架构上,按照提出的容错模型,在停靠站服务器核心层上实现了一个容错组件,使其在具备较高的扩展性的同时还能有较好的性能保障。分析容错组件的实际运行结果,表明该原型正确、有效的实现了预期目的,验证了容错模型设计的正确性。