基于结构-语义融合的评论文本情感分类研究
A study on sentiment classification of commentary text based on structural-semantic fusion作者机构:河北科技大学信息科学与工程学院河北石家庄050018 河北经贸大学信息技术学院河北石家庄050061
出 版 物:《河北工业科技》 (Hebei Journal of Industrial Science and Technology)
年 卷 期:2024年第41卷第2期
页 面:92-98页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:2024年度人文社会科学研究重大课题攻关项目(ZD202402)
主 题:自然语言处理 情感分类 语义融合 预训练模型 句法结构
摘 要:为了解决当前部分情感分析模型片面依赖文本语义特征、忽视句法结构特征的问题,提出了一种基于结构-语义融合的情感分类模型SF-TLSTM(sentiment-fusion-tree LSTM),即将句法结构信息与语义信息进行融合,全面提取文本特征。首先,将BERT(bidirectional encoder representation from transformers)模型引入TreeLSTM(tree-structured bidirectional LSTM)网络结构中;其次,利用SimCSE(simple contrastive learning of sentence embeddings)模型的自监督训练对BERT获得的向量表示进行数据增强;最后,通过节点编码的方式在构建的TreeLSTM网络上实现结构语义特征融合,并与基线模型进行多组对比分析。结果表明:在斯坦福大学发布的SST(stanford sentiment tree-bank)数据集上,SF-TLSTM模型相较于经典树形结构情感分类模型获得更高的准确率,其中在二分类任务中的准确率达到了96.79%。所提方法能够全面有效地提取评论文本的特征,增强文本的向量表示,对自然语言处理领域中的文本处理具有重要意义。