过程挖掘旨在从业务过程执行产生的事件日志中挖掘有价值的客观信息,这些信息对部署新的业务系统(过程建模),或者分析、审计、改进已实施的业务系统(变化分析)具有重要的参考价值与现实意义。近年来各种过程挖掘算法发展非常迅速,但缺乏通用的方法来评估由这些算法发现的过程模型的质量,进而很难对算法的优劣进行客观评价。本项目尝试建立一个包含三部分内容的过程挖掘算法评估框架(1)提供具有各类典型特征的多组事件日志以及对应参考模型作为公共测试集(含过程模型及日志自动生成工具);(2)提供一组常见过程建模语言到Petri网的转换工具;(3)提供一整套针对Petri网的综合度量工具。本项目的研究将有助于形成过程挖掘算法的基准测试平台,从而推动过程挖掘技术的成熟和完善;同时将有助于推广过程挖掘技术在企业中的实际应用,降低业务过程建模、审计和优化的难度,提高业务过程管理的效率和效益,进而提高企业的核心竞争力。
Process Mining;Evaluation Framework;Process Retrieval;Process Similarity;Process Log Management
本项目以过程挖掘算法评估框架的研制为核心,围绕过程数据管理系统BeehiveZ,经过了三年的研发工作,圆满完成预期任务。共发表和录用论文31篇(其中SCI索引6篇、EI索引29篇),待出版过程挖掘译著一部,举办相关国际会议2次、国内会议3次,累计参与470余人,项目组成员累计出国参加相关国际学术会议15次,并做分组报告13次,累计参加国内相关学术会议3次,并做分组报告10次,BeehiveZ从2.0升级到了3.5。项目组具体取得的研究成果如下(1) 提出了基于结构相似性和行为相似性的过程挖掘算法评估框架,以及基于过程模型特征和主分量分析的重要参考过程模型选择方法,能够基于训练得到的回归模型加速挖掘算法的选取过程,为企业选择适合的过程挖掘算法提供了依据;(2) 综合考虑过程模型的业务语义、拓扑结构和行为语义,提出了过程模型过滤——验证两阶段检索框架,给出了基于路径、结构、次序关系、时序逻辑的过程模型索引方法以及相应的精确匹配和相似检索算法,大大提高了过程模型的检索效率和精度;(3) 为了高性能的实现海量分布式从原始记录格式到标准日志格式的转换,提出了事件日志在云平台上基于MapReduce架构的分布式转化算法;提出了一种基于完全有限前缀的完备日志生成算法;提出了一种从包含噪声的事件日志中检测错误轨迹的方法;提出了一种评估无噪声事件日志完备性的方法;(4) 申请人正从事将经典算法α++与α#相结合的工作,即从缺失部分事件的日志中挖掘出非自由选择结构,已经取得重大的技术突破,该新挖掘算法将成为第一个可被证明正确性的、高效的、同时支持不可见任务和非自由选择结构的挖掘算法;(5) 应用图编辑算法中的贪心算法,设计相似性算法度量模型之间的结构相似性,提出了五种过程模型存储方案,并设计实验对各方案进行了比较。结果显示,结合用户需求应用不同的存储方案,可以在响应时间和存储空间上取得较好的平衡;(6) 提出了基于任务最短跟随距离矩阵的流程模型行为相似性算法,与现有算法的对比表明,该算法更符合流程模型行为相似性算法应该具有的各项性质;提出了基于任务间紧邻关系的TAR算法的改进算法,克服了TAR在过程开始/结束位置、不可见任务、非自由选择结构和循环结构处理上的不足;(7) 提出过程感知工作流网的概念,并给出了带变迁条件的工作流网的合理性验证方法及过程模型中不可行路径的检测算法。