基于业务过程模型的刑事案件裁判文书过程信息自动梳理技术
Method for automatic extracting process models from criminal case records with business process model作者机构:南京大学计算机软件新技术国家重点实验室江苏南京210046
出 版 物:《计算机集成制造系统》 (Computer Integrated Manufacturing Systems)
年 卷 期:2024年第30卷第8期
页 面:2968-2980页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:过程挖掘 过程文本 自然语言处理 事件抽取 裁判文书
摘 要:在信息时代,大量过程信息被隐藏在由自然语言写成的文档中,从中自动抽取过程模型并可视化将有助于对过程信息的查看和管理。在中国刑事案件裁判文书中,存在着以下两个挑战:①事件在文本中的描述未严格按照时间顺序;②存在大量噪声信息。尽管该特征广泛存在于不同领域的文本中,相关的研究却很少。为此,提出一种具有可移植性的文本过程挖掘算法,通过结合领域知识和机器学习建立名为“事件框架的新型数据结构,从而解决上述难点并最终自动构建业务过程模型。通过人工构建的大量过程模型与自动生成的过程模型在结构、文本相似度上的实验对比,证明该算法能有效地解决上述挑战。