融合时序行为链与事件类型的类案检索方法
作者机构:贵州大学文本计算与认知智能教育部工程研究中心 公共大数据国家重点实验室(贵州大学) 贵州大学计算机科学与技术学院
出 版 物:《计算机应用》 (Journal of Computer Applications)
年 卷 期:2024年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目(62066008) 贵州省科学技术基金重点资助项目(003)
主 题:案情要素 行为要素 事件类型 时序行为链 聚合评分器
摘 要:针对现有的类案检索方法缺乏对案情要素的有效利用容易被案例内容语义结构相似性所误导的问题,提出了融合时序行为链与事件类型的类案检索方法。首先,采取序列标注的方法识别出案情描述中的法律事件类型,并利用案例文本中的行为要素构建时序行为链,突出案情的关键要素,使模型聚焦于案例的核心内容,以解决现有方法易被案例的语义结构相似性所误导的问题。其次,利用分段编码构造时序行为链的相似性向量表征矩阵,增强案例间行为要素的语义交互。最后,经过聚合评分器,从时序行为链、法律事件类型、犯罪类型三个角度衡量案例的相关性,增加案例匹配得分的合理性。实验结果表明,与SAILER(Structure-Aware pre-traIned language model for LEgal case Retrieval)方法相比,该方法在LeCaRD(Legal Case Retrieval Dataset)数据集中,P@5值提升了4个百分点、P@10值提升了3个百分点、MAP值提升了4个百分点、NDCG@30值提升了0.8个百分点。该方法有效利用案情要素,避免了案例内容语义结构相似性的干扰,能为类案检索提供可靠的依据。