基于领域知识的自动答题方法研究-南通市图书馆

文献详情 >基于领域知识的自动答题方法研究收藏

基于领域知识的自动答题方法研究

作者：潘囿丞

作者单位：哈尔滨工业大学

学位级别：硕士

导师姓名：王晓龙

授予年度：2016年

学科分类：08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术（可授工学、理学学位）]

主题：自动答题翻译模型答案发现文本聚类词图

摘要：在移动互联网广泛普及的年代,人们获取信息的方式越来越便捷,对信息的需求也越来越大。为了满足不同层次的人们对于不同领域的信息需求,搜索引擎在移动互联网中面临着巨大的挑战。问答技术的日渐完善在很大程度上克服了搜索引擎显现出的弊端,使人们拥有了更加自然的人机交互方式。问答系统可以较为准确地理解人们自然语言形式的问题,并利用知识库检索即时地返回言简意赅的答案,有效地满足了人们的需求。随着人工智能、自然语言处理等相关技术的进步,针对不同的数据形态也衍生出了不同种类的问答系统。近几年,国内外诸多科研机构开始致力于类人智能技术的研究,将问答相关技术应用到考试领域。本课题主要面向我国高考文综试题历史部分,利用自然语言处理、问答系统等技术搭建一个能够求解高考历史简答题的自动答题系统。本文的主要研究内容包括:数据预处理与平台搭建。本文对历年高考历史真题进行了抽样分析,对题目类型和解题难点进行了归纳总结;依据各类题目的主要问题,完成了领域知识库的数据采集和存储,搭建了历史检索系统,确保了答题系统的正常运行;针对历史题目中可能存在文言材料的问题,通过互联网渠道收集了一定规模的平行语料,完成了文言文判别模型和文言文翻译模型的训练。基于知识库的候选答案发现。为了能够准确地从知识库中得到与题目相关的文档,本文在对题目进行关键词提取、信息检索、置信度计算等传统步骤之后,针对历史简答题的特殊性,尝试了基于卷积神经网络的问答匹配方法,将候选答案发现问题转化为序列预测问题,通过卷积神经网络模型做到更深层次的匹配。基于多文档的答案生成。利用知识库检索得到了包含答案要点的候选文档集合,为了从中提出了简洁、准确、符合题意的答案,本文借鉴了多文档摘要的算法思想,通过对文档集合中语句进行文本聚类生成多个簇,再利用多语句压缩方法对每个簇进行信息抽取,生成题目答案。为了便于对系统性能进行实验分析,本文建立了统一的人工评分标准,在历年高考真题上进行测试,证明了系统的有效性。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于领域知识的自动答题方法研究

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于领域知识的自动答题方法研究

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：