前 言
业务过程广泛存在于工作流管理系统、业务过程管理系统、企业资源计划系统等过程感知的信息系统以及半结构化的分布式应用中,过程挖掘技术从这些业务过程日志中提取有价值的知识,可发现、监控和改进原有业务流程,是实现业务过程管理(BPM)的重要方法。过程挖掘研究包括过程发现、符合性检查、模型改进三方面,其中过程发现的目标是从事件日志中构造业务过程模型。当前,过程挖掘已广泛应用在医疗、金融、教育、电子商务等领域。
本书在总结归纳过程挖掘历史和发展的基础上,主要阐述基于工作流网(WF-net)的过程发现算法,侧重于复杂控制流结构发现算法研究,并介绍其在教育领域的应用。全书分为5章,包括基本概念、基本算法、应用实例以及轨迹挖掘中新的研究方向。第1章是过程挖掘概述,是对全书描述的问题的铺垫,介绍了过程挖掘基本概念、任务、研究现状和挑战。第2章是Petri net 过程挖掘概述,阐述了形式化算法的代表理论——Petri net,系统介绍了日志的表示、WF-net 等概念,这是全书研究的理论基础。第3章是WF-net 过程挖掘技术,系统介绍了? 系列算法,并阐述了短循环结构和重复任务问题的挖掘算法,开拓复杂控制流结构,发现算法研究新思路。第4章是教育物联网过程挖掘应用,把过程发现算法应用到教育物联网领域的一卡通RFID应用分析实践中,重点研究事件日志质量和多角度过程挖掘分析方法,阐述了某高校教育管理实例应用。第5章是基于语义的过程挖掘技术,在轨迹挖掘研究中引入过程挖掘技术,阐述了基于主题模型LDA 的语义轨迹挖掘方法。
本书系统阐述了WF-net过程挖掘技术,提出了解决短循环结构和重复任务问题的挖掘算法,并进一步拓展至轨迹挖掘领域,理论体系完整又有所创新,基于物联网的高校一卡通案例增强了本书的应用参考价值。
本书在清华大学出版社相关领导和专家、编辑的信任、指导、支持和帮助下完稿并出版,同时,本书是广东省普通高校创新团队项目“数据科学与智慧教育创新团队”(2021KCXTD038)、广东省省级科技计划项目“基于物联网的陶瓷生产远程监控平台研究”(2015A010103015)、广东省教育厅创新强校资金“基于过程发现和主题模型的RFID数据轨迹挖掘及应用研究”(2017KTSCX123)、广东省普通高校重点实验项目“数据科学 与智慧教育重点实验室”(2022KSYS003)的研究成果,也参考了国内外相关研究。在此,谨致谢意!
冯健文
2022年7月
