基于知识图谱和大语言模型的口述历史资源的问答应用研究
作者机构:上海交通大学图书馆
出 版 物:《图书馆杂志》 (Library Journal)
年 卷 期:2024年
核心收录:
学科分类:1205[管理学-图书情报与档案管理] 12[管理学] 120502[管理学-情报学] 120503[管理学-档案学]
基 金:国家社会科学基金项目一般课题“数字人文视域下口述历史档案资源知识图谱构建及应用研究”(项目编号:22BTQ083)的研究成果之一
摘 要:档案馆和图书馆等人文机构逐渐形成了丰富多样的有序化整理后的口述历史档案集合。引入问答系统,通过互动方式可展示档案单元内容的知识推理能力。本研究融合知识图谱和大语言模型,充分发挥知识图谱的准确性、内容透明度等优势,降低大语言模型带来应答幻觉、建设成本高等问题,尝试构造面对口述历史档案资源的问答系统。文章详细阐述了系统设计思路与构建过程,以及核心部件的关键技术要点等,并以李政道图书馆藏有的CUSPEA主题的口述历史为研究对象,进行问答应用实践。实践验证了问答系统的可行性,能实现口述历史档案资源的知识融汇与知识挖掘,能有效辅助人文学者和历史爱好者理解与洞悉口述历史本质。