语义驱动的科技服务需求交互式匹配方法与应用
作者单位:北方工业大学
学位级别:硕士
导师姓名:刘晨;孙为群
授予年度:2024年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:随着信息时代的到来,科技服务资源的数量迎来了爆炸式的增长。然而,目前各种资源搜索网站仍然仅能通过关键词进行严格或模糊匹配。因此,用户需求和科技服务资源之间存在严重失配的问题。本研究的目标在于探索和实施一种基于语义的交互式匹配方法,以实现科技服务需求与资源之间更精准的匹配。该交互式匹配方法允许用户使用自然语言来表达需求,与资源进行匹配后返回给用户,并与用户进行交互来引导用户继续发问,最终为用户准确的匹配到他们需要的科技服务资源。 本文主要贡献有: (1)针对科技服务需求人群,本文提出了一种基于BERT的意图识别与槽位填充双向关联的联合模型。双向关联模型包含两个模块,即用于槽位填充的Intent Recognition to Slot Filling(IR2SF)模块和用于意图识别的Slot Filling to Intent Recognition(SF2IR)模块。该模型使用BERT对输入句子进行编码,通过预训练模型来增强泛化能力。IR2SF模块利用意图的概率分布来标注每个词,能够同时利用整个序列的语义信息。SF2IR模块则将词标签的概率分布作为意图识别的补充向量,最终通过联合建模的方式增强对用户需求的理解。本文在STSD科技服务需求数据集上进行了实验,与其他四种算法进行了比较,实验结果说明了该方法在槽位填充F1值、意图识别准确率和句子级语义准确率方面都有所提高。 (2)提出了一种基于语义转换的增强型资源匹配方法。交互式匹配系统允许用户使用自然语言提出需求,而需求文本与资源文本之间因为语义表达不同导致语义距离较大。虽然需求文本与资源文本之间的语义表达差距较大,但是他们自身之间的语义表达是很相似的。基于这个特点,本文从一种新的角度,结合需求理解中得到的结构化信息,并使用Cycle GAN将文本从需求语义域转换到资源语义域后再与资源文本进行匹配。通过这种语义域的转换,可以缩小语义之间的距离,从而增加匹配的准确率。本文选取了4种基准匹配方法,在CCKS2021科技服务问答数据集上进行了实验,实验结果说明在经过语义转换之后再进行匹配与直接进行匹配相比,匹配准确率和F1分数均有提高。 (3)本文使用状态机与槽框架结合的方式来构建交互式系统。既解决了状态机因获取不到准确信息而导致交互过程卡死的问题,也解决了槽框架获取信息单一的问题。利用之前语义理解阶段得到的结构化信息,设计状态集合、动作集合以及状态转移方法。通过规则生成回复语句来指导用户,并促使用户进一步具体描述需求,以实现交互式的匹配过程。