咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于事件抽取的文本冲突检测方法及其应用研究 收藏
基于事件抽取的文本冲突检测方法及其应用研究

基于事件抽取的文本冲突检测方法及其应用研究

作     者:盛宇 

作者单位:南京大学 

学位级别:硕士

导师姓名:骆斌

授予年度:2020年

学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:文本冲突检测 事件抽取 长短期记忆网络 条件随机场 司法诉讼 

摘      要:数据之间的冲突不可避免,发现数据间的冲突是合理利用这些数据的前提。现有的待处理数据量庞大而且持续增长,数据又是机器不可理解并难以被处理的。因此数据间的冲突检测自动化是一个迫切但又困难的问题。自动化冲突检测技术能够识别文本数据之间的差异。但是,目前自动化冲突检测工作大多是基于句法和词汇特征,使用分类模型完成,面临对齐单一文档甚至多文档中涉及同一个主题的句子困难,中文语义知识库少等问题。本文尝试从一种新的角度出发,运用事件抽取技术进行自动化冲突检测。事件抽取是指从非结构化或半结构化的文档中发现并抽取出结构化的用户感兴趣的事件实例。具体而言,本文的主要工作包括:首先,本文提出一种基于事件抽取的文本冲突检测方法。该方法旨在通过抽取事件以获取语句的核心语义信息,然后基于抽取的事件对齐原语句,并检测原语句之间是否冲突。方法工作流包括:定义领域相关的核心事件,使用事件抽取模型抽取核心事件,基于已抽取的事件对齐并检测原文本之间的冲突。其次,针对在中文语句中,常常存在缩略,导致单个句子中的多个事件实例共享事件参数和触发词的问题。本文设计了一种新颖的两阶段式事件抽取方法。在方法的第一阶段,使用双向长短期记忆网络对字词进行编码,然后结合编码和其他特征,使用条件随机场标注出有意义的候选词,第二阶段针对共享参数和共享触发词分别制定再分配的规则,从而更为准确地抽取出核心事件。最后,本文以司法诉讼中离婚纠纷案由案件为例,针对双方当事人提供的诉讼材料,应用提出的基于事件抽取的文本冲突检测方法,实现了智能司法助手系统。实现过程包括:定义离婚纠纷核心事件,人工标注事件数据,训练模型抽取离婚纠纷核心事件,识别共识事件并检测共识事件是否有语义冲突以得出原诉讼文本间的冲突关系。本文通过实验评估了所提出的事件抽取技术的高性能,并证明了该系统能够帮助法官更快地理解案件,明确争议焦点,从而验证了将事件抽取技术应用到自动化冲突检测中的可行性和有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分