论文部分内容阅读
工作流管理系统要求能够清楚的表达出业务过程的工作流设计,通常工作流设计非常费时且容易出现错误。过程挖掘的方法从已经发生的业务日志记录中提炼出工作流模型,能方便地设计工作流管理系统。 工作流是一种反映业务流程的计算机化的模型,是为了在先进计算机环境支持下实现经营过程集成与经营过程自动化而建立的、可由工作流管理系统执行的业务模型。工作流的生命周期包括工作流设计、工作流配置、工作流执行、工作流诊断四个阶段。传统工作流管理方法存在的一个问题是:设计阶段工作通常由业务专家具体执行,并力求体现企业管理层改进当前业务流程的思想。实践证明,建立一个工作流过程模型是一项复杂和耗费时间的工作,而且建立的过程模型往往不能与实际过程完全相符。 工作流挖掘技术不是一个工作流设计的工具,但它对充分理解现有业务过程执行情况有很大的帮助。工作流挖掘的目标是:倒转过程,收集和利用运行数据,从而支持工作流设计和分析。通过多年的信息化建设工作,很多组织都拥有或大或小的传统信息化管理工具,如:管理信息系统(MIS)、企业资源计划(ERP)、客户关系管理(CRM)等。大多数信息系统都能够记录事务数据,这些运行数据记录了长时间的业务过程具体执行情况,可以用来生成一个描述业务过程的模型。 工作流挖掘的起点是收集和处理工作流日志。本文对工作流日志定义是任务序列(二元组)的集合。文中提出的定义在保留必要日志信息的基础上,简化了工作流日志的形式,除此以外,还对日志相关概念做出了定义。 目前,工作流挖掘技术的一个难点是:怎样挖掘出更多有价值的过程信息。对于一组工作流日志,以往挖掘算法的处理方法均是对其整体进行挖掘处理,而在实际生产生活中,很多业务过程往往会随时间变化、环境变化、业务变动而发生变化。 本文针对以往工作流挖掘技术对日志挖掘受噪音数据影响比较严重,而且挖掘效率比较低的缺点,引入了挖掘效率较高的FP-tree算法,利用FP-tree算法对日志中的数据进行剪枝和排序,生成FP-tree;然后再对FP-tree进行搜索,得出节点之间的频繁依赖关系;最后将搜索得出的频繁依赖关系传给WF-graph生成