基于情感分类方法的产品特征情感指数研究
作者单位:湘潭大学
学位级别:硕士
导师姓名:朱红灿
授予年度:2022年
学科分类:050302[文学-传播学] 05[文学] 0503[文学-新闻传播学]
摘 要:由于信息技术的迅速发展,我国网民规模持续保持增长,互联网普及率大大提升,其中我国手机网民规模占比巨大,移动端的智能化也让网购变成了大众生活的一部分。电子商务作为信息技术发展中新业态的典型代表,网络零售额持续保持较快增长,也逐渐成为社会消费的一个重要部分。随着网购规模的不断扩大,商品评论文本也越来越多,其中蕴含着十分有价值的信息资源,对于广大用户、企业等各类用户做出决策时均有很重要的帮助。所以,通过抽取商品特征,从而对具体的商品特点做出情感分析,将具有很大的意义。因此,本文将采用经过改良后的商品特征提取和情感分析技术,同时为增加情感数据真实性,增加了对垃圾评论的处理,从而能够较为精准有效地进行电子商务产品评论情感分类,提出更加合理的情感指数计算公式,可以直观地为消费者优化购买决策,为企业改善产品和服务提供理论依据。首先,为了获取电子商务产品评论中产品特征的情感倾向,结合现在流行的情感分类模型和特征提取技术,构建更加合理的情感指数计算公式。运用文献研究法提出了情感指数公式的一些新的构成要素,分别从数据源、数据处理技术、特征提取技术三个步骤为情感指数公式构成的合理性做准备。通过文献调研的方式,选取了具有代表性的评论文本数据来源。根据电子商务平台的发展历史、主营业务以及产品本身的影响力,确认了产品的品类。其次,通过文献研究法,分析研究了情感分类的一些基础的方法和运用的一些模型,结合之前的文献和电子商务评论文本分析中可能出现的问题,提出了产品特征情感指数计算模型,其中包含情感分类模块和产品特征情感指数计算模块。论文利用LSTM对文本数据进行语言建模,并添加softmax分类器构建情感分类模型。论文保留了语言建模时获得的词向量,通过计算词向量间的余弦相似度,来提取包含在评论文本中的同一类产品特征,并且根据情感分类的结果,提出一种全新的产品特征情感指数计算公式。该计算公式相比于传统的方法,考虑到正向情感评论和负向情感评论对于消费者的影响是有差异的,并且将产品特征分为体验型和实用型两类,在计算情感指数时,对于正负评论会根据产品特征类型的不同分别赋予不同的权重,并结合关注度得到最终的产品特征情感指数。最后,围绕产品特征情感指数进行了实证以及应用。对于实证结果和应用的实现,从产品特征情感指数应用出发,为提升应用性给出了合理性的建议。