基于多种LSTM结构的文本情感分析
作者单位:北京邮电大学
学位级别:硕士
导师姓名:袁健华
授予年度:2018年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:随着互联网技术的飞速发展,越来越多的用户开始在网上发表自己的意见,这些意见包含着用户的情感表达。制造商为了提高产品质量,改善营销策略,就必须充分了解用户对商品和相关服务的意见。但是,同一商品的评论往往有很多,传统的依靠人工进行问卷调查的手段越来越无法满足市场竞争的需要,因此如何从大量文本中挖掘用户的情感倾向就成为了一项重要的研究课题。本文使用长短时记忆(Long Short-Term Memory,LSTM)结构及其一种变形门控循环单元(Gated Recurrent Unit,GRU)结构搭建了两个文本情感分类模型,对中文文本进行情感多分类。长短时记忆结构可以克服传统的循环神经网络(Recurrent Neural Network,RNN)不能学习远距离信息的缺点。虽然RNN在理论上能够处理任何长度的序列数据,但是在实践中,当间隔不断增大时,由于梯度消失和梯度爆炸问题,RNN会丧失远距离学习的能力。本文还提出了一种伪梯度下降法进行模型的参数调整。与传统的网格取值法和随机取值法相比,网格取值法效率太低,随机取值法又有很大的不确定性,本文提出的伪梯度下降参数调整方法可以使模型在较短的时间内达到较高的正确率。