基于中文深度智能问答系统的证据检索和评分算法研究
作者单位:郑州大学
学位级别:硕士
导师姓名:周清雷
授予年度:2018年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:深度问答系统 证据检索 语言表示模型 证据评分 语义相似度
摘 要:伴随着知识管理及智能化深度分析等技术的深入研究,基于知识层面的深度智能问答系统已成为人工智能发展不可缺少的一部分。深度智能问答系统主要采用Deep QA框架结构和知识图谱推理相结合的方法,通过级联协作流程处理问题,在系统框架扩展和智能推理分析方面有很大程度的提升。证据检索和评分算法的优劣对系统准确率起关键作用。本文通过深入研究分析,阐明了基于中文深度智能问答系统的证据检索和评分算法存在的若干问题:一是目前中文深度问答系统缺欠基于句法结构和语义分析的证据评分算法;二是已有算法流程中缺少高效的证据段落生成策略以及词条预处理流程;三是现有证据检索和评分模块欠缺更优的基于段落评分池的合并算法。因此,优化和创新证据检索和评分算法是提高中文深度智能问答系统性能的重要问题之一。针对现有证据检索和评分算法中的存在的问题,本文提出了一种新型适用于中文深度智能问答系统的证据检索和评分算法体系。首先,加入了基于自由文档的证据段落生成方法和词条预处理策略;然后,对基于词条频率和词条顺序的两种证据评分算法进行了改进,提出了新的基于卷积树核函数的句法结构评分算法以及基于语言表示模型和卷积神经网络的语义分析评分算法;最后,通过对基于段落评分池的合并算法的分析,提出了基于PCA和K均值的两种新型评分池合并算法。实验表明,改进后的证据检索和评分算法,完善了系统算法体系和缩减了级联流程误差,有效地提高了整个系统的准确率。