基于旅游领域的细粒度情感词典构建方法
作者机构:兰州交通大学数理学院 兰州交通大学电子与信息工程学院
出 版 物:《北京航空航天大学学报》 (Journal of Beijing University of Aeronautics and Astronautics)
年 卷 期:2024年
核心收录:
学科分类:12[管理学] 120203[管理学-旅游管理] 1202[管理学-工商管理] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:情感词典作为识别词汇情感的重要先验知识,对旅游评论文本的情感分析至关重要。在领域情感词典构建过程中,种子词集的筛选标准通常仅依赖于词频统计或语义向量,导致种子词集的情感代表性不足,进而影响词汇情绪识别的准确率。针对上述问题,提出一种基于多元特征融合策略与表情符号集成的情感种子词集筛选方法。该方法通过整合语料统计特征、情感强度特征和词汇语义特征,形成各类情绪种子词集的筛选依据,确保种子词汇与语料特性高度匹配,有效提升了种子词集的代表性和覆盖率,同时引入表情符号辅助情感词汇捕获情感特征,增强了种子集的情感表达能力,提高了词汇归类精度,构建了面向旅游领域的细粒度情感词典。实验结果表明,与通用情感词典相比,使用构建的领域情感词典在旅游评论情感分析任务上的精确率平均提升9.49%,召回率平均提升8.96%,F1值平均提升9.22%。