论文部分内容阅读
业务流程模型(Business Process Models,BPMs)作为一种形式化方法,广泛应用于业务分析及业务结构优化等方面。随着实际应用中越来越多、越来越复杂的流程模型的频繁出现,流程模型之间的比较在许多真实环境中成为一个需要解决的关键性问题。那么,如何快速地在流程模型仓库中找到所需要的模型就成为人们关注的焦点。这些方法从智能仓库到模型相似性搜索。其中,关于模型的相似性分析方法受到人们的广泛关注。行为相似性度量及评价方法是业务流相关研究领域的热点问题,同时也是很多数据挖掘任务:比如分块、聚类算法的核心内容,构成了一些业务流程模型优化与重建的基础。关于该问题大量文献考虑的只是行为方面的相似性,对时间因素进行了弱化。而在实际应用当中,忽视时间信息的模型间的比较在很大程度上不能真实反映模型间的差异程度,对模型的分析与研究造成一定程度的影响。本文首先分析了原型Petri网所构建的模型间的相似性;然后在该模型中加入时间因子提出相似度计算方法SCMBATA;最后,基于该算法提出聚类方法CBOSMA,并且将以该聚类方法得到的的分类结果与传统的SPSS聚类结果进行对比,从而展示出了该方法的有效性。本文的主要贡献包括:(1)在计算机网络技术迅猛发展的大趋势下,与Cookies的相关的各种数据服务也越来越多,根据分析和挖掘网络用户的日志信息,我们可以了解用户的行为习惯。利用Petri网建模并借助行为关系理论,对用户网络行为差异性进行分析。首先通过Petri网模型将行为之间的对应关系进行确定,然后应用已有的基于行为轮廓的行为相似性计算方法对模型间的相似性进行计算。实现了应用基于行为轮廓的相似性计算方法分析两组用户的行为特性,并且得到具体数值,为用户的特征分析提供决策支持。(2)随着业务流程模型日益庞大,行为相似性量化分析对于分析研究对象之间的关系有非常重要的实用价值,可以为电商等众多行业提供意想不到的商机。但是,现有的研究大多将关注点仅仅集中在模型的结构上,而忽视了与模型相关的其它因素。在序列对齐(SequenceAlignment)方法的基础上,通过时延Petri网来分析Cookies网络日志,提出了网络用户行为的相似性比较标准,并给出了快速计算网络用户行为相似度的算法,从Petri网的结构特征和时间特征上计算不同用户的相似性,所提出的方法为网络用户行为的细分提供了一种新的思路和方法。(3)行为相似性度量及评价方法是业务流相关研究领域的热点问题,同时也是很多数据挖掘任务:比如分块、聚类,构成了一些业务流程模型优化与重建的基础。已有的研究成果大都将相似性度量转换为集合的交集运算,但是忽视了信息流的其它因素。利用网络用户的Cookies日志,考虑用户行为以及行为所持续的时间长度等因素,提出了用户行为相似度计算方法SCMBATA,并在此基础上通过事件隶属度的概念,提出了基于行为属性的用户聚类算法CBOSMA。最后,利用自动程序采集到的Web用户事件日志,对所提出的SCMBATA和CBOSMA算法进行分析验证。通过与传统的SPSS聚类结果进行分析比较,结果表明:所提出的基于含时间因素的用户行为相似度算法得到的聚类结果与传统基于不含时间因素的用户行为相似度聚类结果有明显区别,从而说明时间因素对于网络用户行为有重要的影响。