论文部分内容阅读
随着信息技术的发展,信息系统广泛应用于各类组织机构。人、机器和软件执行活动时会在信息系统中留下轨迹,这些轨迹被记录在所谓的事件日志(Event Log)中。事件日志挖掘(又称流程挖掘)就是要从这些日志中自动挖掘业务流程模型,并将挖掘的流程模型与现有模型进行对比、诊断,发现偏差,提供洞察帮助企业取得提升。事件日志挖掘是一个相对比较年轻的研究领域,一方面它介于机器学习和数据挖掘之间,另一方面它又将流程建模与流程分析联系起来。目前,事件日志挖掘已经引起了业务流程管理领域的研究者和软件供应商的极大关注,学者们提出了多种适用于事件日志的挖掘算法,软件供应商也在产品中推出了相应的功能。与传统的流程建模相比,基于历史数据的事件日志挖掘获得的流程模型更加客观,能够像X光一样深入流程内部诊断问题,获得合适的解决方案。因此,对事件日志挖掘的研究具有一定的理论意义和实践意义。首先,本文阐述了事件日志挖掘的研究背景和意义,概括了国内外相关研究成果,指出当前事件日志挖掘算法的优点和缺陷。介绍了关于事件日志挖掘的相关概念,包括流程挖掘和事件日志,并描述了用于表示流程模型的Petri网和因果矩阵及两者之间的转换。这些基本理论的阐述和模型构建与应用的前期研究为本文进行事件日志挖掘研究奠定了良好基础。然后,改进传统应用于流程挖掘的遗传算法。设计适应度函数和创建初始种群的启发式规则。交叉操作中增加交叉点选择的启发式规则,提高交叉后个体的适应度值;变异操作中引入衰减的变异率,加速算法后期向最优解收敛。其次,在改进的遗传挖掘算法基础上,提出混合的遗传挖掘算法。引入模拟退火和蜂群繁殖原理,保留最优个体基因,克服原始遗传算法效率不高,容易“早熟”的缺点,提高事件日志挖掘的性能。最后,在ProM平台上使用一定数量的事件日志测试本文提出的挖掘算法,获得算法运行时间以及流程挖掘领域五个评价指标的数据并进行分析。实验结果表明:改进的挖掘算法性能优于原始遗传挖掘算法;在改进的遗传挖掘算法基础上继续提出的混合遗传挖掘算法性能优于改进的遗传挖掘算法和原始遗传挖掘算法,且在挖掘复杂事件日志上优势更加明显。