基于特征融合的中文隐式情感分析方法研究
作者单位:武汉邮电科学研究院
学位级别:硕士
导师姓名:卢山
授予年度:2022年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:隐式情感分析 序列特征 句法结构特征 上下文特征 图神经网络
摘 要:随着移动互联网的快速发展,针对社会实事,社交平台上会出现大量的议论,这些议论文本存在数量大、话题多、结构口语化和语义信息不足的特点,特别是一些隐式情感语句,会存在暗讽、反话等语言方式,其情感特征并不明显,这些特点对传统的情感分析方法提出了较大的挑战,实验表明,单纯的文本序列信息无法满足隐式情感分析的需要。本文主要围绕着隐性情感的极性判别任务,在传统的仅仅依靠序列特征进行分类的基础上,通过引入语法结构和上下文信息,使二维的文本序列转变为高维的图结构,将文本映射为一张文本图,通过图神经网络进行图分类来实现对原始文本信息的分类。主要研究内容如下:(1)引入序列信息和依存句法信息的特征融合网络研究:本文提出了一种将文本序列特征和语法结构特征融合的网络(SDNN),对文本序列信息和句法信息进行抽提取,并在构建文本图表示过程中加以体现,最终通过对文本图的分类来实现对情感极性的分类。(2)引入上下文信息的特征融合网络研究:本文在SDNN的基础上,进一步融合了上下文文本特征,并以此提出了将三种特征融合的网络(CDHNN),通过模型将上下文信息也引入到图表示中,并最终来实现对情感极性的分类。(3)基于微博舆论分析方法的设计与验证:本文为了进一步验证所提出模型在实际应用中的有效性,提出了一种对微博舆论情感进行判别的方法,并将本文所提模型带入此方法,以验证模型的实际可用性。本文在SMP-ECISA2019竞赛所提供的隐式情感分析数据集上进行实验,以验证本文所提出模型的有效性,以BERT+LSTM做为基线模型,SDNN模型的准确率提升了1.6%,CHDNN模型的准确率提升了3.3%,可以看出,本文提出的基于特征融合的模型能有效提高隐性情感的发掘能力。