滑坡地质灾害语料库构建与命名实体识别
作者机构:南京信息工程大学遥感与测绘工程学院 北京市地质灾害防治研究所 南京信息工程大学地理科学学院 安徽理工大学空间信息与测绘工程学院 南京师范大学地理科学学院
出 版 物:《南京信息工程大学学报》 (Journal of Nanjing University of Information Science & Technology)
年 卷 期:2024年
学科分类:081801[工学-矿产普查与勘探] 081803[工学-地质工程] 08[工学] 0818[工学-地质资源与地质工程]
基 金:国家自然科学基金(42301478) 江苏高校哲学社会科学研究一般项目(2023SJYB0179)
主 题:标注体系 滑坡地质灾害 语料库 命名实体识别 标注规范
摘 要:从描述滑坡地质灾害的海量文本中抽取有价值的滑坡地质灾害实体是构建滑坡地质灾害知识图谱的基础。基于滑坡地质灾害勘查报告等相关非结构化文本数据,依据滑坡灾害机理分析滑坡地质灾害文本语言描述特点,制定了滑坡地质灾害语义信息的标注体系与标注规范,构建了面向滑坡地质灾害领域的语料库。基于该语料库的实体识别实验结果表明,命名实体识别模型的准确率、召回率和精确率均达到90%以上,验证了该语料库的适用性,可以为后续滑坡地质知识图谱的研究提供有力的数据支撑。