咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >时地名词句首作状语依存分析的研究 收藏
时地名词句首作状语依存分析的研究

时地名词句首作状语依存分析的研究

作     者:刘珊珊 

作者单位:沈阳化工大学 

学位级别:硕士

导师姓名:唐忠

授予年度:2021年

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:中文依存句法分析 时地名词 状语 BiLSTM CRF 

摘      要:句法分析是自然语言处理(Natural language processing,NLP)的一项关键技术,在NLP领域起着承前启后的作用。依存句法分析是一种重要的句法分析技术,它的表现形式相对更为简洁直观,而且能取得很高的精度,所以在句法分析中应用比较广泛。目前存在的依存句法分析方法主要基于规则、统计和深度学习的方法,例如条件随机场(conditional random field algorithm,CRF)、双向长短期记忆网络(Bi-directional long short-term memory,Bi LSTM)、卷积神经网络(Convolutional neural network,CNN)等。这些方法在英文的依存分析中表现出非常不错的性能,但对中文,特别是中文的特殊句式的分析性能不高。经实验分析时地名词句首作状语句式的分析错误最为突出,在依存句法分析的性能上达不到理想的水平,不仅影响中文句法分析整体的性能,而且阻碍了语义分析下层研究的进展。针对上面的问题,提出了一种神经网络模型与传统模型相结合的综合模型,即结合Bi LSTM和CRF的优化神经网络的中文依存分析研究方法。该方法利用Bi LSTM-CRF模型,把依存分析问题转化为序列标签预测问题,比纯粹的LSTM、Bi LSTM、CRF更具优势,可以有效地针对时间或处所名词性成分位于句首的中文句式得到代表性的特征,从而得到其正确的依存关系。论文的具体工作内容如下:(1)针对依存句法分析预测依存弧提出了基于Bi LSTM模型,通过Bi LSTM网络获取时地名词位于句首句式的序列特征,充分考虑特殊句子上文和下文信息,进行有效的特征提取,得到句子中各个词语之间依存弧初始的依存标签。(2)Bi LSTM虽然能获取该特殊句式有效的特征,但没有考虑依存弧之间的顺序。CRF能主动从训练数据中学习得到标签序列的依存关系与顺序的约束条件,计算标签间最优联合概率的方式,能进一步抓住时地名词在句式中为状语的特征信息,增强了模型的分析能力,获得依存标签。为了验证所提出模型的有效性,在Stanfordnlp平台上实现了所提出的模型,并利用Co NLL 2018 Shared Task中文数据集和收集的《现代汉语语法讲义》、《人民日报》、百度百科等相关数据集上对本文提出的模型与原来斯坦福依存分析的模型进行了对比实验与性能分析。本文所提的模型捕获了时间或地点位于句首句式的有效特征,在针对该句式的准确率和F1值两个指标上提高了1.3%的性能。实验结果表明,Bi LSTM-CRF的模型对时地名词句首作状语句式在性能上有一定的提高。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分