融合知识图谱和大模型的高校科研管理问答系统设计
作者机构:重庆邮电大学电子商务与现代物流重点实验室
出 版 物:《计算机科学与探索》 (Journal of Frontiers of Computer Science and Technology)
年 卷 期:2024年
核心收录:
学科分类:040106[教育学-高等教育学] 12[管理学] 0401[教育学-教育学] 04[教育学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 081203[工学-计算机应用技术] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(62272077,72301050) 重庆市教育委员会科学技术研究项目(KJQN202300605,KJZD-M202400604)
主 题:知识图谱 多任务模型 意图分类 命名实体识别 大语言模型
摘 要:“十四五规划鼓励高校参与场景创新,以人工智能技术推动智能化建设。其中,科研管理是高校管理中的重要组成部分,但现有的科研管理系统难以满足用户的个性化需求。为此,本文以高校科研管理向智能化转型为需求导向,将知识图谱、传统模型和大语言模型相结合,共同构建新一代高校科研管理问答系统。首先,采集科研知识用于构建科研知识图谱。然后,利用同时进行意图分类和实体提取的多任务模型进行语义解析。最后,借助解析结果来生成查询语句,并从知识图谱中检索信息回复常规问题。同时,将大语言模型与知识图谱相结合,以辅助处理开放性问题。通过在意图和实体具有关联的数据集上的实验结果表明,本文采用的多任务模型在意图分类和实体识别任务上的F1值分别为0.958和0.937,优于其它对比模型和单任务模型。Cypher生成测试表明以自定义Prompt在激发大语言模型涌现能力方面的成效,利用大语言模型实现文本生成Cypher的准确率达到85.8%,有效处理了基于知识图谱的开放性问题。此外,以知识图谱、传统模型和大语言模型搭建的问答系统其准确性为0.935,很好地满足了智能问答的需求。