咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于领域知识的自动答题方法研究 收藏
基于领域知识的自动答题方法研究

基于领域知识的自动答题方法研究

作     者:潘囿丞 

作者单位:哈尔滨工业大学 

学位级别:硕士

导师姓名:王晓龙

授予年度:2016年

学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:自动答题 翻译模型 答案发现 文本聚类 词图 

摘      要:在移动互联网广泛普及的年代,人们获取信息的方式越来越便捷,对信息的需求也越来越大。为了满足不同层次的人们对于不同领域的信息需求,搜索引擎在移动互联网中面临着巨大的挑战。问答技术的日渐完善在很大程度上克服了搜索引擎显现出的弊端,使人们拥有了更加自然的人机交互方式。问答系统可以较为准确地理解人们自然语言形式的问题,并利用知识库检索即时地返回言简意赅的答案,有效地满足了人们的需求。随着人工智能、自然语言处理等相关技术的进步,针对不同的数据形态也衍生出了不同种类的问答系统。近几年,国内外诸多科研机构开始致力于类人智能技术的研究,将问答相关技术应用到考试领域。本课题主要面向我国高考文综试题历史部分,利用自然语言处理、问答系统等技术搭建一个能够求解高考历史简答题的自动答题系统。本文的主要研究内容包括:数据预处理与平台搭建。本文对历年高考历史真题进行了抽样分析,对题目类型和解题难点进行了归纳总结;依据各类题目的主要问题,完成了领域知识库的数据采集和存储,搭建了历史检索系统,确保了答题系统的正常运行;针对历史题目中可能存在文言材料的问题,通过互联网渠道收集了一定规模的平行语料,完成了文言文判别模型和文言文翻译模型的训练。基于知识库的候选答案发现。为了能够准确地从知识库中得到与题目相关的文档,本文在对题目进行关键词提取、信息检索、置信度计算等传统步骤之后,针对历史简答题的特殊性,尝试了基于卷积神经网络的问答匹配方法,将候选答案发现问题转化为序列预测问题,通过卷积神经网络模型做到更深层次的匹配。基于多文档的答案生成。利用知识库检索得到了包含答案要点的候选文档集合,为了从中提出了简洁、准确、符合题意的答案,本文借鉴了多文档摘要的算法思想,通过对文档集合中语句进行文本聚类生成多个簇,再利用多语句压缩方法对每个簇进行信息抽取,生成题目答案。为了便于对系统性能进行实验分析,本文建立了统一的人工评分标准,在历年高考真题上进行测试,证明了系统的有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分