基于工作流网的成批处理工作流模型挖掘方法.ppt
基于工作流网的成批处理工作流模型挖掘方法,Outline,问题的提出:研究背景,成批处理工作流一类包含成批处理区的特殊业务过程成批处理区中同一类型工作流活动的多个活动实例可进行合并处理原本分别执行的多个活动实例可成组合并执行例:某公司处理共享租车的工作流 活动A为提出租车申请;活动B审批租车申请;若租车申请未被审批通过,则选择活动C发送拒绝通知,反之选择活动D安排出租车;活动E为通知司机;活动G为通知乘车人;活动H为乘车人缴费。,问题的提出:研究背景,假设系统事件日志中包含了活动实例执行时的输入输出数据、开始与结束时间等,该业务过程在执行时产生的部分事件日志记录可用表1表4描述 活动A为提出租车申请;活动B审批租车申请;若租车申请被审批通过,则选择活动D安排出租车;(注意合并情况),问题的提出:研究背景,活动A为提出租车申请;活动B审批租车申请;若租车申请被审批通过,则选择活动D安排出租车;然后执行活动E通知司机;然后执行活动G通知乘车人;(注意分解情况),问题的提出:研究的问题,从这个例子容易得出如下结论:成批处理区外的活动实例各自独立执行,并具有完整的事件记录;并发过程实例P1与P2位于成批处理区中具有相同出发时间与目的地的同一活动的实例将分组合并为新的活动实例后再执行,以节约乘车费用或执行开销(例如:Zhang,Wang两人均只需支付50元而非100元),这导致了P2的部分活动实例的事件记录隐含于P1的事件记录中。现有的过程挖掘方法大都未考虑成批处理区的存在,同时会忽视这些隐含的事件记录或将其作为噪声数据进行处理,因此并不适用于解决成批处理工作流模型的挖掘问题。因此,需要研究可从支持成批处理工作流系统的日志文件中自动构建成批处理工作流模型的工作流挖掘方法。,问题的提出:相关概念的形式化描述,为便于说明,本文利用WF-net对成批处理工作流模型描述如下:,Outline,算法思想,成批处理工作流模型主要包含传统工作流模型与成批处理区两部分信息。现有基于WF-net的过程挖掘方法已被证明可有效解决传统工作流模型的挖掘问题,而成批处理区中活动实例的分组合并涉及多个并发过程实例。因此,本文设计的挖掘方法从检测过程实例的并发关系出发,主要思路是:首先通过分析活动实例的输入输出等数据来发现成批处理区以及隐含的事件记录然后将这些事件记录加入到事件日志并利用现有基于WF-net 的过程挖掘方法来挖掘其对应的传统工作流模型最后结合之前发现的成批处理区便可获得成批处理工作流模型,基本概念,为便于描述,首先定义算法中用到基本概念定义如下:,基本概念(继1),基本概念(继2),基本概念(继3),过程描述,本文设计的成批处理工作流模型挖掘方法可分为成批处理区挖掘、隐含工作流活动记录构建和成批处理工作流模型构建三个阶段,过程描述(继),detectBPA函数主要用于根据定义14判定活动序列能否用于构建一个成批处理区,并将相关的成批处理区信息保存于集合BPS中;getImplictEvents函数结合过程实例间的并发情况与成批处理区信息,构建出隐含的部分活动实例事件记录;constructWF函数主要利用现有基于WF-net 的过程挖掘方法,从事件日志中构建传统工作流模型部分的元素。detectBPA函数中产生活动成批处理特征集是一个计算量较大的操作。为提高算法性能,本文设计了一种活动成批处理特征挖掘优化方法,Outline,相关定义与规则,具体过程,采用分层搜索策略并以规则1作为修剪规则以减少搜索次数,Outline,实验设置,通过对共享租车流程进行仿真以产生事件日志文件,具体仿真参数设置如下:(1)乘车申请的到达服从参数为的泊松分布;(2)车辆总数为5,各车仅配备1名司机且最多可同时载4位乘客;(3)乘车目的地唯一;(4)调度时根据先来先服务的原则选择具有相同出发时间与目的地的等待活动实例,被选中的车辆在经过10个时间间隔后可再次参与调度。,实验结果,采用f度量来测量挖掘得到的模型与事件日志的符合性,以此评价算法1的挖掘能力 与成批处理特征挖掘优化方法(Algo2)作比较的另一种算法是穷举法(AlgoE),即逐个穷举的计算出活动的成批处理特征集,Thank you!,Q&A,