摘要

MOS

Modeling and Simulation

2324-8696

Scientific Research Publishing

10.12677/MOS.2022.115116

MOS-55557

MOS20220500000_43493021.pdf

信息通讯工程技术

基于LSTM的文本情感分析方法 Text Sentiment Analysis Method Based on LSTM

郭

霖

¹^*高

允轩

¹²

湖北工业大学计算机学院，湖北武汉

null

15082022

110512481254

2014

This work is licensed under the Creative Commons Attribution International License (CC BY). http://creativecommons.org/licenses/by/4.0/

随着互联网的发展和电子商务的兴起，人们通过各种社交、电商平台发表自己的看法与见解，从这些用户评论数据中准确地挖掘出有用的信息是当前的研究热点。针对网络中的各类文本评论数据，本文基于深度学习的方法对这些数据进行情感分析，采用长短期记忆(Long Short-Term Memory, LSTM)神经网络模型构建情感分类器，对文本的情感倾向进行预测与分类。实验表明基于LSTM的情感分析方法可以很好地解决长距离依赖问题，具有较好的分类效果。 With the development of the Internet and the rise of e-commerce, people express their views and opinions through various social and e-commerce platforms. It is a challenging issue to accurately mine useful information from user comment data. For all kinds of text comment data in the network, sentiment of the comment data is analyzed in this paper through deep learning. The Long Short-Term Memory (LSTM) neural network model is used to construct a sentiment classifier to predict and classify the sentiment tendency of the text. The experimental results show that the sentiment analysis method based on LSTM can solve the problem of long-distance dependence and has a good classification effect.

情感分析，长短期记忆，神经网络，深度学习, Sentiment Analysis Long Short-Term Memory Neural Network Deep Learning

摘要

关键词

情感分析，长短期记忆，神经网络，深度学习

Text Sentiment Analysis Method Based on LSTM

Lin Guo, Yunxuan Gao

School of Computer Science and Technology, Hubei University of Technology, Wuhan Hubei

Received: Jul. 15^th, 2022; accepted: Aug. 26^th, 2022; published: Sep. 6^th, 2022

ABSTRACT

With the development of the Internet and the rise of e-commerce, people express their views and opinions through various social and e-commerce platforms. It is a challenging issue to accurately mine useful information from user comment data. For all kinds of text comment data in the network, sentiment of the comment data is analyzed in this paper through deep learning. The Long Short-Term Memory (LSTM) neural network model is used to construct a sentiment classifier to predict and classify the sentiment tendency of the text. The experimental results show that the sentiment analysis method based on LSTM can solve the problem of long-distance dependence and has a good classification effect.

Keywords:Sentiment Analysis, Long Short-Term Memory, Neural Network, Deep Learning

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

近年来，在网络的影响下，人们可以通过各大电商平台在网络上进行购物，并在使用后对商品进行评论，或在社交平台上表达自己对于某件事的看法、感想等。我们可以通过提取网络上的这些情感信息从而分析消费者的想法以及舆论的倾向等，为后续改进的方向与决策的实施提供便利。情感分析主要以计算机技术为基础，分析电商平台与社交平台评论的情感倾向 [1] [2]，从而挖掘出更多重要信息。目前该项技术已经广泛应用于政治与经济等领域 [3]。

本文利用深度学习方法构建了情感分类模型，提出基于长短期记忆(Long Short-Term Memory, LSTM)神经网络模型的情感分类方法，通过实验分析比较了本文方法与卷积神经网络(CNN)、循环神经网络(RNN)性能的差异，实验结果表明本文方法可以很好地解决长距离依赖问题，具有较好的分类效果。

2. 相关工作

情感分析的研究历程主要分为基于情感词典的方法、基于传统机器学习的方法、基于深度学习的方法三个阶段。

基于情感词典 [4] 的情感分类方法主要是将文本中的单词与情感词典中的词进行匹配从而得到文本的情感倾向。该方法的分类质量主要取决于情感词典是否全面且精确。然而，由于分类结果对情感词典的依赖性较高，网络时代新的词语与文本诞生的速度很快，使得该方法不能很好地应用于实时评论数据分析。

基于机器学习的情感分类算法 [5] [6] 是利用训练好的分类器对文本的情感倾向进行分类。比较常用的方法有朴素贝叶斯方法，主要通过计算先验概率、后验概率、条件概率等来对文本的情感进行分类，该方法对小规模数据表现良好；最大熵方法主要通过计算文本的熵值来进行分类；支持向量机方法通过核方法来进行优化，并加入了正则项来提高模型的泛化能力。与基于情感词典的方法相比，机器学习方法提高具有一定的自主性，不需要制作特定词典进行分类，只需要对标记好的语料库进行训练即可。但对语料进行标注需要花费大量人力与物力 [7]。

随着网络的发展，传统的情感分析方法在处理文本数据时效率低下。而随着深度学习的出现与发展，基于深度学习的情感分析模型逐渐发展壮大。常用的基于深度学习的情感分析算法主要包括：卷积神经网络CNN [8]、循环神经网络RNN [9] 以及由RNN改进而来的长短期记忆网络LSTM [10]。其中，CNN模型存在许多局限性，虽然其通过卷积层对特征图进行了提取，获取了文本中最重要的特征，但同时也失去了该特征的位置信息，而位置信息在文本情感分析中往往十分重要。RNN的出现使文本序列问题有了解决方法，但还是无法解决文本的长距离依赖问题。而LSTM网络通过添加记忆单元使得网络能够处理长距离信息，适用于文本情感分析问题。因此，本文基于LSTM构建文本情感分类模型，对文本的情感倾向进行预测与分类。

3. 基于LSTM的情感分类模型

LSTM的主要原理是在隐藏层添加一种特殊的记忆单元来保存长距离信息，并加上了特殊的门结构，包括输入门、输出门和遗忘门，这些门结构会协助处理信息在网络中的传递，并且记忆单元的状态更新也依赖于三个门结构的控制 [11]。图1为LSTM的单元结构图。

图1. LSTM网络结构图

LSTM的关键在于记忆单元，首先该单元需要决定丢弃哪些无用的信息，这一步操作主要通过遗忘门来实现。遗忘门采用的激活函数σ为sigmoid函数，如公式(1)所示：

f t = σ ( W f ⋅ [ x t , h t − 1 ] + b t ) (1)

其中，W_f表示遗忘门的权重矩阵，b_t表示遗忘门的偏置。获得的结果f_t的值域为[0,1]，f_t通过t时刻的输入x_t以及t-1时刻的输出h_t_-1的内容来决定该单元需要丢弃的信息。当f_t的取值为0时，该单元则会丢弃过往传递来的所有信息；当f_t的取值为1时，该单元则会保留所有的信息；而当f_t的取值为0.5时，该单元则会丢弃部分信息。相比于RNN网络始终保留所有信息的特点，遗忘门的操作使得LSTM网络能够控制依赖信息的取舍。

记忆单元经过遗忘门的处理后，第二步则是选择需要选择向信息传送带中加入的哪些新的信息，主要通过输入门来实现。添加的新信息主要分为两个部分，首先，采用σ函数对两个输入信息x_t和h_t_-1进行处理，根据公式(2)获取有用的新信息i_t。其次，利用公式(3)计算需要加入的候选信息C̃_t。

i t = σ ( W i ⋅ [ x t , h t − 1 ] + b i ) (2)

C ˜ t = tanh ( W c ⋅ [ x t , h t − 1 ] + b c ) (3)

其中，W_i和W_c分别表示输入门和候选信息的权重矩阵，C̃_t和b_c则表示输入门和候选信息的偏置。

在通过输入门获取了新的信息后，根据公式(4)来更新当前时刻的记忆信息C_t。

C t = f t × C t − 1 + i t × C ˜ t (4)

其中，C_t_-1为上一时刻的记忆单元保存并传递过来的信息。

信息更新后便是信息的输出，主要由输出门来完成。输出门分为两个部分，首先根据输入信息x_t和h_t_-1来获得门函数o_t，如公式(5)所示：

o t = σ ( W o ⋅ [ x t , h t − 1 ] + b o ) (5)

其中，W_o表示输出门的权重矩阵，b_o表示输出门的偏置。

其次，将上一步获取的C_t与门函数o_t相乘，从而得到本单元的的输出h_t，如公式(6)所示：：

h t = o t × tanh ( C t ) (6)

正是由于以上的三种门结构使得LSTM网络能够很好的控制信息在记忆单元之间的流通，在许多自然语言处理问题中表现优秀 [12]。

基于LSTM的文本情感分类方法流程图如图2所示。首先，将从社交平台上爬取的评论数据按7:3比例分为训练集与测试集。其次，将经过文本预处理和文本向量化操作后的文本数据导入神经网络，形成Embedding层。之后再进入神经网络的LSTM层，在这一层可以对窗口大小、迭代次数、等超参数进行调节，来优化模型的训练，同时为了防止模型产生过拟合，该层也添了Dropout方法，从而避免导致过拟合。

图2. 基于LSTM的文本情感分类方法流程图

4. 实验结果与分析4.1. 实验数据

实验所用的设备与环境如表1所示。

Table 1 Experimental environmen

工具	参数
操作系统	Windows10
CPU	Intel(R) Core (TM) i7-7700HQ
显卡	NVIDIA GTX 1050ti
内存	DDR4 16GB
深度学习工具包	TensorFlow/Keras

表1. 实验环境

本文的语料数据集来自亚马逊的审查数据集，其主要信息如表2所示。该数据集共有10,000条样本，其中积极情感样本5097条，消极情感样本4903条，其中70%的文本样本作为训练数据集，30%的文本样本作为测试数据集。

Table 2 Datase

数据集	正类样本	负类样本
训练数据集	3568	3432
测试数据集	1529	1471
总数	5097	4903

表2. 数据集

图3. 文本情感分析流程图

4.2. 实验流程与参数设置

文本情感分析实验分为四个步骤，如图3所示。

首先，从网络上整理数据获取数据集，并对数据集进行数据预处理，去除文本中存在的大量噪声，通常会先消除文本的格式，再对文本进行分词处理并删除无意义的停用词。将清洗好的数据采用Word2Vec算法或Glove算法进行文本特征提取，获取低维稠密的词向量。然后，建立文本情感分析模型，将词向量或句向量输入模型中进行训练。最后，将测试集输入到模型中获取测试结果。

本文采用CNN、RNN和LSTM模型分别进行了实验，三种模型所使用的参数如表3所示。

Table 3 Parameter settin

模型	参数	值
CNN	卷积层卷积核大小	5
	卷积核个数	128
	卷积层激活函数	relu函数
	全连接层单元个数	10
	全连接层激活函数	relu
	输出层损失函数	binary_crossentropy
	舍弃神经元占总神经元的比例dropout	0.5
	迭带次数epoch	10
	一次训练所选取的样本数batch_size	10
RNN	舍弃神经元占总神经元的比例dropout = 0.5
	激活函数activation	tanh函数
	迭代次数epoch	10
	一次训练所选取的样本数batch_size	64
LSTM	舍弃神经元占总神经元的比例dropout	0.5
	激活函数activation	tanh函数
	迭代次数epoch	4
	输出维度units	3
	一次训练所选取的样本数batch_size	32
	LSTM层的单元个数output_dim	50

表3. 参数设置

4.3. 实验结果与分析

Table 4 Classification result

方法	准确率	精确率	召回率
无预训练方法 + CNN	73.81	72.63	72.59
无预训练方法 + RNN	83.76	82.92	82.05
无预训练方法 + LSTM	85.30	84.91	84.47
Word2Vec + CNN	79.26	78.92	78.31
Word2Vec + RNN	89. 42	88.74	87.21
Word2Vec + LSTM	93.86	92.53	93.04

表4. 分类结果

对本文数据进行情感二分类的实验结果如表4所示，观察表中的数据可以发现，基于LSTM的情感分类方法各项指标表现最优，说明在文本情感分析问题中，LSTM模型本身的特点保证了情感分类的准确性和实时性。通过对比表4中各个模型的结果可以看出，基于CNN的方法效果并不理想，主要原因在于文本数据是存在密切联系的序列结构，卷积操作所产生的负面影响可能会高于其提取特征的效果，从而导致整体效果较差。而RNN和LSTM是专门处理序列数据的网络结构，保留了词与词之间的位置信息，因此RNN和LSTM的分类效果优于基于CNN的方法。然而，RNN模型由于只能获取较短时间的信息，而基于LSTM的情感分类方法在RNN的基础上增加了记忆单元，能够有效解决长距离依赖问题，从而记住长期的信息。因此，基于LSTM的情感分类方法性能更好，各项评价指标均为最优。

5. 结论

针对RNN在处理长距离依赖问题时的不足，本文提出了基于LSTM的情感分类方法，在隐藏层添加记忆单元以达到长久记忆信息的目的。采用三种模型对文本情感倾向进行分类。实验结果表明卷积神经网络容易丢失文本的结构信息导致各项指标偏低。而RNN和LSTM保留了词与词之间的位置信息，在处理序列信息时具有较大优势。在三种模型中，基于LSTM的情感分类方法由于添加记忆单元，可以很好地解决长距离依赖问题，具有较好的分类效果。

今后可以进一步研究多分类模型，对文本情感进行更细致的分析。同时，研究更有效的分类方法，从而提高模型对于情感倾向的识别精度。

基金项目

大学生创新训练项目(S202110500067)。

文章引用

郭霖,高允轩. 基于LSTM的文本情感分析方法Text Sentiment Analysis Method Based on LSTM[J]. 建模与仿真, 2022, 11(05): 1248-1254. https://doi.org/10.12677/MOS.2022.115116

参考文献

References1

Studiawan, H., Sohel, F. and Payne, C. (2020) Anomaly Detection in Operating System Logs with Deep Learning-based Sentiment Analysis. IEEE Transactions on Dependable and Secure Computing, 18, 2136-2148. https://doi.org/10.1109/TDSC.2020.3037903

张军阳, 王慧丽, 郭阳, 等. 深度学习相关研究综述[J]. 计算机应用研究, 2018, 35(7): 1921-1928+1936.

王天笑. 自然语言处理的现状研究与未来发展初探[J]. 中国科技纵横, 2017, 1(2): 196-197.

刘爽, 赵景秀, 杨红亚, 等. 文本情感分析综述[J]. 软件导刊, 2018, 17(6): 1-4+21.

Zhai, G., Yang, Y., Wang, H., et al. (2020) Multi-Attention Fusion Modeling for Sentiment Analysis of Educational Big Data. Big Data Mining and Analytics, 3, 311-319. https://doi.org/10.26599/BDMA.2020.9020024

王根生, 黄学坚. 基于Word2vec和改进型TF-IDF的卷积神经网络文本分类模型[J]. 小型微型计算机系统, 2019, 40(5): 1120-1126.

Singh, L.G. and Singh, S.R. (2020) Empirical Study of Sentiment Analysis Tools and Techniques on Societal Topics. Journal of Intelligent Information Systems, 56, 379-407. https://doi.org/10.1007/s10844-020-00616-7

Kim, Y. (2014) Convolutional Neural Networks for Sentence Classification. Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing, Doha, October 2014, 1746-1751. https://doi.org/10.3115/v1/D14-1181

Sun, J., Han, P., Cheng, Z., et al. (2020) Transformer Based Multi-Grained Attention Network for Aspect-Based Sentiment Analysis. IEEE Access, 8, 211152-211163. https://doi.org/10.1109/ACCESS.2020.3039470

梁军, 柴玉梅, 原慧斌, 等. 基于极性转移和 LSTM 递归网络的情感分析[J]. 中文信息学报, 2015, 29(5): 152-159.

杨小平, 张中夏, 王良, 等. 基于Word2Vec的情感词典自动构建与优化[J]. 计算机科学, 2017, 44(1): 42-47.

何炎祥, 孙松涛, 牛菲菲, 等. 用于微博情感分析的一种情感语义增强的深度学习模型[J]. 计算机学报, 2017, 40(4): 773-790.