基于机器阅读理解模型与众包验证的属性值抽取方法
Attribute Value Extraction Method Based on Machine Reading Comprehension Model and Crowdsourcing Verification作者机构:复旦大学计算机科学技术学院上海200433
出 版 物:《计算机工程》 (Computer Engineering)
年 卷 期:2021年第47卷第5期
页 面:97-103页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:属性值抽取 机器阅读理解模型 知识图谱 众包 序列标注
摘 要:由于互联网语料的高噪音特性,传统的属性值抽取方法存在人工成本增加及训练集缺乏等问题。提出一种新的实体属性值抽取方法。利用机器阅读理解模型,从互联网语料中抽取出高质量的候选属性值,通过高效的众包验证机制调整各候选属性值的权重,得到最终抽取结果。实验结果表明,与OpenTag、QANET等模型相比,该机器阅读理解模型有效提升了候选属性值抽取的准确性,抽取准确率提升10%左右,同时通过众包验证方法,能够以较低的众包成本提高属性值抽取的整体性能。