一种基于知识库和SimBert在短文本场景下的实体链接方法
An entity linking method based on knowledge base and SimBert in short text scenarios作者机构:中移(杭州)信息技术有限公司杭州310023
出 版 物:《电信工程技术与标准化》 (Telecom Engineering Technics and Standardization)
年 卷 期:2024年第37卷第2期
页 面:59-63页
学科分类:0810[工学-信息与通信工程] 08[工学] 081001[工学-通信与信息系统]
摘 要:随着互联网和人工智能技术的发展,用户输入自由文本越来越不规范,在提升用户搜索结果的准确性和用户体验感方面,实体链接技术在其中发挥了很大的作用。传统的实体链接技术大多只适用于长文本场景,对于短文本场景下的实体链接效果泛化能力差。为了解决短文本场景下的实体链接问题,本文基于知识库构建前缀树进行实体匹配,同时利用SimBert模型进行实体词向量的定制化调整,提升短文本实体链接的准确度,然后分为前缀树构建模块、实体编码模块、实体链接模块3个模块设计实现了一种基于知识库和SimBert的中文短文本实体链接方法。该方法可提升在短文本场景下实体链接的准确性,避免出现实体链接错误,同时也减少了人工参与。