咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >汉语阅读理解问答题解答研究 收藏
汉语阅读理解问答题解答研究

汉语阅读理解问答题解答研究

作     者:赵红红 

作者单位:山西大学 

学位级别:硕士

导师姓名:谭红叶

授予年度:2017年

学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:阅读理解 问答题 答案句抽取 句子生成 

摘      要:阅读理解任务是给定一篇文本,要求机器根据文本的内容,对相应的问题作出回答,是目前自然语言处理领域的一个研究热点,也是衡量人工智能水平的一个重要手段。本文以北京语文高考文学类阅读理解的解答为背景,对其中的问答题进行了分析与研究,主要工作如下:(1)高考文学类阅读理解问答题及其解答分析。本文对问答题的类别、难点、研究技术进行了分析,并将本文的研究重点确定为答案句抽取及句子融合两个关键技术。(2)答案句抽取。本文首先使用了三种语义相似度方法进行答案句抽取,分别为:基于HowNet的句子相似度,基于词向量的句子相似度,基于LDA的句子主题分布相似度。在人工标注答案句的高考真题中对三种方法进行测试,结果显示,基于词向量句子相似度的方法效果最好,其答案句抽取的F值可达49.08%。此外,答案句抽取也可以看做二分类问题,本文使用卷积神经网络(CNN)对句子进行分类,从而判别是否为答案句。通过在人工标注数据集上的训练及测试,结果显示,分类为答案句的F值为68.35%。(3)句子融合。针对阅读理解问答题,本文提出了一种兼顾信息量、问题关联度与句子流畅度的句子融合方法来生成答案。句子融合的主要思想为:首先,针对特定的问答题计算词重要度;然后,基于句子拆分和子句重要度选择待融合部分;再次,基于词对齐进行相同信息的合并;最后,利用基于依存关系、二元语言模型及词重要度的整数线性规划优化生成句子。在历年高考阅读理解数据集上的测试结果表明,基于词计算的句子融合的F值达到82.62%。(4)将答案句抽取及句子融合两项技术结合起来应用于高考问答题的解答,通过人工打分,本文提出的答题框架达到了30.84%的答题率。本文对中文文学类阅读理解问答题的研究进行了探索,主要贡献有:(1)尝试了多种技术进行答案句的抽取;(2)提出了面向阅读理解问答题的基于依存关系、语言模型及词重要度的句子融合方法;(3)形成了答案句抽取及句子融合的问答题解题框架。本文的研究为未来阅读理解问答题的进一步解答奠定了一定基础。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分