融合多特征和表情情感词典的性别对立言论识别方法
Gender Opposition Speech Recognition Method of Fusing Multi-feature and Emoji Sentiment Lexicon作者机构:安徽理工大学计算机科学与工程学院淮南232001 合肥综合性国家科学中心人工智能研究院合肥232088
出 版 物:《数据采集与处理》 (Journal of Data Acquisition and Processing)
年 卷 期:2024年第39卷第3期
页 面:699-709页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金面上项目(62076006) 安徽省高校协同创新项目(GXXT⁃2021⁃008)
主 题:性别对立 表情情感词典 多特征 BERT Bi-GRU Word2Vec
摘 要:为识别相关极端言论,提出了一种融合多特征和表情情感词典的性别对立言论识别方法。首先,使用BERT(Bidirectional encoder representation from transformer)提取输入文本的字符特征,并使用Word2Vec提取输入文本中五笔、郑码以及拼音3个方面的特征;然后,将这4个方面的特征进行融合,再输入到Bi-GRU(Bi-directional gated recurrent unit)网络中学习更深层次的语义信息;最后,通过全连接层加SoftMax函数计算出情感极性概率,并融合表情情感词典判别输入文本是否为性别对立言论。通过在自行收集的中文性别对立数据集上进行实验,与未加入特征和表情情感词典的方法相比,在F1值上有5.19%的提升。同时,在公开中文情感分析数据集Weibo_senti_100k上进行验证,证明了本方法的泛化性。