CN110287320A - 一种结合注意力机制的深度学习多分类情感分析模型 - Google Patents

一种结合注意力机制的深度学习多分类情感分析模型 Download PDF

Info

Publication number
CN110287320A
CN110287320A CN201910553755.7A CN201910553755A CN110287320A CN 110287320 A CN110287320 A CN 110287320A CN 201910553755 A CN201910553755 A CN 201910553755A CN 110287320 A CN110287320 A CN 110287320A
Authority
CN
China
Prior art keywords
word
cnn
text
model
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910553755.7A
Other languages
English (en)
Other versions
CN110287320B (zh
Inventor
刘磊
孙应红
陈浩
李静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201910553755.7A priority Critical patent/CN110287320B/zh
Publication of CN110287320A publication Critical patent/CN110287320A/zh
Application granted granted Critical
Publication of CN110287320B publication Critical patent/CN110287320B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种结合注意力机制的深度学习多分类情感分析模型,属于自然语言处理技术领域,本发明分析了现有CNN网络和LSTM网络在文本情感分析方面的弱点,提出了一种结合注意力机制的深度学习多分类情感分析模型。该模型运用注意力机制将CNN网络提取的局部特征和LSTM模型提取的语序特征相融合,并在分类层采用集成模型的思想,分别将CNN网络和LSTM网络提取的情感特征拼接,作为模型最终提取的情感特征。通过对比实验,发现该模型的准确率有了显著的提高。

Description

一种结合注意力机制的深度学习多分类情感分析模型
技术领域
本发明属于文本信息处理领域,涉及一种结合注意力机制的深度学习多分类情感分析模型。
背景技术
随着微博、Twitter等社交网络的不断兴起,互联网已不仅仅是人们获取日常信息的来源,同时也成为人们表达自己观点不可或缺的平台。人们在网络社区评论热点事件、抒写影评观点以及描述产品体验等,都会产生大量的带有情感色彩(如:喜怒哀乐等)的文本信息,而对这些文本信息进行有效的情感分析,可以更好地了解用户的兴趣倾向和关注程度。但随着人们对网络信息关注度的增加,网络社区每天都有海量的带有情感色彩的文本产生,如果仅仅依靠人工标记,已经远远无法完成这一任务,这就使得文本情感分析成为自然语言处理领域的一个研究热点。
随着深度学习方法在计算机视觉方向的成功应用,越来越多的深度学习技术也被应用于自然语言处理方向。深度学习的优势在于,不仅可以自动提取文本的特征,而且对大数据有较强的表达能力。目前主流的基于深度学习的文本情感分析方法主要包括卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent NeuralNetwork,RNN)两种,基于这两种方法的情感分析模型的准确率都较低,主要有以下几个方面的原因:
首先,在文本的情感分析过程中,卷积神经网络通过扩大卷积核尺寸,有效地捕捉到不同位置的情感信息,进而获取到文本的局部情感特征。但卷积的过程中,往往忽略了文本中语序间的前后关系。但在文本情感分析过程中,语序的先后关系又十分重要,没有语序的特征信息必导致结果有一定的偏差。
其次,循环神经网络网络利用前后依赖关系,有效模拟文本数据的先后顺序,能够提取到文本的语序关系和语义信息,因此在文本的情感分析中能达到很好的效果。但当样本数据较长或者语言场景较复杂时,有用的情感信息的间隔有大有小,长短不一,长短记忆网络(Long Short-Term Memory,LSTM)的性能也因此受到限制。
本发明充分利用了注意力机制、CNN网络、LSTM网络,提出并实现了一种结合注意力机制的深度学习多分类情感分析模型。此模型能够有效的提高文本情感分析的准确率。
发明内容
本发明提出了一种基于注意力机制的深度学习多分类情感分析模型。该模型结合CNN网络和LSTM网络进行情感特征融合。首先利用CNN网络的多尺度卷积核提取出待分析文本的局部特征,然后利用注意力机制,将CNN网络提取的局部特征融入到LSTM网络中。最后利用集成模型的思想,将CNN网络的池化层结果和LSTM网络的特征提取结果进行拼接,作为最终的模型输出。实验表明,在文本情感分析中,该模型的准确率有了显著的提高。
为实现上述目的,本发明采用如下的技术方案:
1.一种结合注意力机制的深度学习多分类情感分析方法,其特征在于包括以下步骤:
步骤(1)数据预处理
设情感数据集表示为:G=[(segtxt1,y1),(segtxt2,y2),......,(segtxtN,yN)],其中,segtxti表示第i个样本,yi则为对应的情感类别标签,N表示数据集G中样本个数,对G中样本进行数据预处理,
数据集G经预处理后,表示为G′=[(seg1,y1),(seg2,y2),...,(segM,yM)],其中:segi表示为数据集G′中第i个样本,yi则为对应的情感类别标签,M表示数据集G′中样本个数;
步骤(2)构建模型的输入
对于数据集G′中任意一个待分析样本数据(seg,y),将其进一步细化表示为:
seg=[w1,w2,w3,...,wd]T (1)
y=[0,0,1,...,0] (2)
其中:wi∈Rε是指依据词表wordList对待分析文本中第i词语的one-hot编码,ε为词表wordList的大小,d表示该文本的句长。y∈Rp是依据情感类别的one-hot编码,p表示模型待分的类别数目。则该样本的词向量嵌入矩阵可表示为:
X=seg*ET (3)
其中:X∈Rd×m,X=[x1,x2,...,xd]T为待分析文本的词向量矩阵表示,m为词向量的维度,xi∈Rm为该文本中第i个词汇的词向量表示,E为词向量嵌入层表示;
步骤(3)构建深度学习多分类情感分析模型
深度学习多分类情感分析模型包括基于CNN网络的局部特征提取阶段和基于LSTM网络的语序关系特征提取阶段,将基于CNN网络的局部特征提取阶段的池化层结果CCnn和基于LSTM网络的语序关系特征提取阶段的结果C'Rnn拼接,即向量[CCnn;C'Rnn]作为模型最终提取的特征向量。然后将特征向量[CCnn;C'Rnn]经过全连接层得到最终的模型输出向量其中p表示模型待分的类别数目。
所述的基于CNN网络的局部特征提取阶段,包括以下内容:
局部特征提取阶段输入为公式3的待分析文本的词向量矩阵表示X;
局部特征提取阶段基于CNN网络,一共包括两层,即一层卷积层、一层池化层,其中:
卷积层采用n种不同尺度的卷积核对待分析文本进行卷积,且同一尺度卷积核的滤波器即神经元各k个;
池化层采用最大池化层的方法将卷积所得的向量做下采样,选出局部最优特征,因此每个滤波器通过最大池化层变为一个标量,该标量代表着该滤波器中最优的情感特征;
局部特征提取模块的输出为CCnn=[c1,c2,...,cnk],即将池化层中不同尺寸的多个滤波器选取的最优特征拼接到一起CCnn=[c1,c2,...,cnk]作为本模块的输出,其中,CCnn∈Rnk,nk为卷积层中所有滤波器的个数;
所述的基于LSTM网络的语序关系特征提取阶段,包括以下内容:
多尺度CNN网络局部特征提取:将基于CNN网络的局部特征提取阶段中卷积层同一卷积尺度的k个滤波器的卷积结果拼接,得到集合ZCnn,然后将集合ZCnn中的每个向量Zi输入到GLU机制中,即门控卷积网络,得到的结果记为{π12,...,πn},完成多尺度CNN网络局部特征的提取。
其中,ZCnn={Z1,Z2,...,Zn},Zi为尺度为i的多个滤波器卷积结果的拼接;
其中,Zi代表某一尺度的k个滤波器卷积结果的拼接,W1,W2∈Rλ×q为权重矩阵,λ表示对应权重矩阵的维度,的b1,b2∈Rq为偏置量,σ表示sigmoid函数,πi∈Rq,q为LSTM网络的输出维度;
然后,利用注意力机制,将多尺度CNN网络局部特征提取结果{π12,...,πn}融入到LSTM网络中,得到基于LSTM网络的语序关系特征提取阶段的输出结果C'Rnn,即
其中,表示待分析文本中最后一个词语所对应的LSTM模块的输出,表示待分析文本中第一个词语所对应的LSTM模块的输出,本发明采用双向LSTM模型,即BiLSTM模型,
采用正向传播,具体计算过程如下:
d为待分析文本的长度,该文本中每一个词语顺序对应一个LSTM模块,,
正向传播过程中,第t-1个LSTM模块的输出为则第t个LSTM模块的输出计算公式如下:
其中:是两个向量的点乘,也称打分函数,是用来计算前一词语的LSTM的输出和当前局部特征向量的相似度,
其中:αt,i∈R代表特征πi的权重,
其中:st-1∈Rq是多个卷积特征的加权结果,利用st-1代替结合当前词语的词向量xt求得当前LSTM模块的输出公式如下:
采用反向传播,具体计算过程与正向传播一样,此处不再赘述;
步骤(4)模型训练:将训练数据输入多分类情感分析模型,采用交叉熵损失函数,结合反向传播BP算法调整参数,利用softmax回归作为分类算法,完成训练;
步骤(5)模型分析:将待分析文本输入训练完成的模型,最终输出对该文本分析后的情感分类结果。
所述的预处理过程包括以下步骤:
1)分词、去除停用、英文大写转小写、繁体转简体。
2)选取数据集G中频率大于等于σ的词语,构造词汇表wordList={word1,word2,...wordε},其中,wordi表示词汇表wordlist中第i个词语,ε表示数据集G中词频超过σ的词语总数。
3)对数据集G中每一个样本,若长度大于d,则删除该样本,若长度小于d,则用符号</>补齐。
所述的基于CNN网络的局部特征提取模块的卷积层计算公式如下:
z=f(∑WT*xi:i+s-1+b) (8)
其中:z表示一个神经元对待分析文本的卷积所得的特征向量,f(·)表示激活函数,W∈Rs×m表示神经元的权重矩阵,同一个神经元参数共享,s×m表示卷积核尺寸的大小,b表示阈值,xi:i+s-1表示由文本句子中的第i个词到i+s-1个词语的词向量。
所述的训练数据为经过预处理之后的数据。
所述的基于CNN网络的局部特征提取阶段的卷积层采用4种不同尺度的卷积核。所述的训练结束条件是准确率不再改变或达到设置迭代次数。
附图说明
图1本发明的方法流程图;
图2结合注意力机制的深度学习多分类情感分析模型结构示意图。
具体实施方式
下面结合图表和实施例,对本发明的具体实施方式作进一步的详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本发明提出的方法是依次按以下步骤实现的:
步骤(1)数据预处理
情感语数据集表示为:G=[(segtxt1,y1),(segtxt2,y2),......,(segtxtN,yN)],其中,segtxti表示第i个样本,yi则为对应的情感类别标签。N表示数据集G中样本个数,情感标签取“喜悦”、“愤怒”、“厌恶”、“低落”四大类,N取80000,其中,四类情感样本各20000条。对G中样本进行数据预处理包括以下几个步骤:
1)分词、去除停用、英文大写转小写、繁体转简体。
2)选取数据集G中频率大于等于σ的词语,构造词汇表wordList={word1,word2,...wordε},其中,wordi表示数据集G中第i个词语,ε表示数据集G中词频超过σ的词语总数。σ取2,最终得到的数据集G中,词频大于等于2的词语共41763个,即ε为41763。
3)将上述处理后,对数据集G中每一个样本,若长度大于d,则删除该样本,若长度小于d,则用符号</>补齐。d取64。
数据集G经预处理后,表示为G′=[(seg1,y1),(seg2,y2),...,(segM,yM)]。其中:segi表示为数据集G′中第i个样本,yi则为对应的情感类别标签,M表示数据集G′中样本个数。最终数据集G′中样本的个数为73150条,各情感类别的样本条数如表1所示:
表1预处理后各类别样本数量
步骤(2)模型的输入
对于数据集G′中任意一个待分析样本数据(seg,y),将其进一步细化表示为:
seg=[w1,w2,w3,...,wd]T (1)
y=[0,0,1,...,0] (2)
其中:wi∈Rε是指依据词表wordList对待分析文本中第i词语的one-hot编码,ε为词表wordList的大小,文本的句长d为64。y∈Rp是依据情感类别的one-hot编码,p表示模型待分的类别数目,p为4。则该样本的词向量嵌入矩阵可表示为:
X=seg*ET (3)
其中:X∈Rd×m,X=[x1,x2,...,xd]T为待分析文本的词向量矩阵表示,词向量维度m取256。xi∈Rm为该文本中第i个词汇的词向量表示,词向量嵌入层表示E,采用***开源word2vec词向量,接下来将X作为网络模型的输入。
步骤(3)构建深度学习多分类情感分析模型
深度学习多分类情感分析模型包括基于CNN网络的局部特征提取阶段和基于LSTM网络的语序关系特征提取阶段,将基于CNN网络的局部特征提取阶段的池化层结果CCnn和基于LSTM网络的语序关系特征提取阶段的结果C'Rnn拼接,即向量[CCnn;C'Rnn]作为模型最终提取的特征向量。然后将特征向量[CCnn;C'Rnn]经过全连接层得到最终的模型输出向量其中p表示模型待分的类别数目。
所述的基于CNN网络的局部特征提取阶段,包括以下内容:
局部特征提取阶段输入为公式3的待分析文本的词向量矩阵表示X;
局部特征提取阶段基于CNN网络,一共包括两层,即一层卷积层、一层池化层,其中:
卷积层采用n种不同尺度的卷积核对待分析文本进行卷积,且同一尺度卷积核的滤波器即神经元各k个,本发明n取4,k取128。
池化层采用最大池化层的方法将卷积所得的向量做下采样,选出局部最优特征,因此每个滤波器通过最大池化层变为一个标量,该标量代表着该滤波器中最优的情感特征;
局部特征提取模块的输出为CCnn=[c1,c2,...,cnk],即将池化层中不同尺寸的多个滤波器选取的最优特征拼接到一起CCnn=[c1,c2,...,cnk]作为本模块的输出,其中,CCnn∈Rnk,nk为卷积层中所有滤波器的个数,共512个;
所述的基于LSTM网络的语序关系特征提取阶段,包括以下内容:
多尺度CNN网络局部特征提取:将基于CNN网络的局部特征提取阶段中卷积层同一卷积尺度的k个滤波器的卷积结果拼接,得到集合ZCnn,然后将集合ZCnn中的每个向量Zi输入到GLU机制中,即门控卷积网络,得到的结果记为{π12,...,πn},完成多尺度CNN网络局部特征的提取。
其中,ZCnn={Z1,Z2,...,Zn},Zi为尺度为i的多个滤波器卷积结果的拼接;
其中,Zi代表某一尺度的k个滤波器卷积结果的拼接,W1,W2∈Rλ×q为权重矩阵,λ表示对应权重矩阵的维度,b1,b2∈Rq为偏置量,σ表示sigmoid函数,πi∈Rq,q为LSTM网络的输出维度,q取256;
然后,利用注意力机制,将多尺度CNN网络局部特征提取结果{π12,...,πn}融入到LSTM网络中,得到基于LSTM网络的语序关系特征提取阶段的输出结果C'Rnn,即
其中,表示待分析文本中最后一个词语所对应的LSTM模块的输出,表示待分析文本中第一个词语所对应的LSTM模块的输出,本发明采用双向LSTM模型,即BiLSTM模型,
采用正向传播,具体计算过程如下:
d为待分析文本的长度,该文本中每一个词语顺序对应一个LSTM模块,,
正向传播过程中,第t-1个LSTM模块的输出为则第t个LSTM模块的输出计算公式如下:
其中:是两个向量的点乘,也称打分函数,是用来计算前一词语的LSTM的输出和当前局部特征向量的相似度,
其中:αt,i∈R代表特征πi的权重,
其中:st-1∈Rq是多个卷积特征的加权结果,利用st-1代替结合当前词语的词向量xt求得当前LSTM模块的输出公式如下:
采用反向传播,具体计算过程与正向传播一样,此处不再赘述;
步骤(4)模型训练:将训练数据输入多分类情感分析模型,采用交叉熵损失函数,结合反向传播BP算法调整参数,利用softmax回归作为分类算法,完成训练。
步骤(5)模型分析:将待分析文本输入训练完成的模型,最终输出对该文本分析后的情感分类结果。
所述的基于CNN网络的局部特征提取模块的卷积层计算公式如下:
z=f(∑WT*xi:i+s-1+b) (8)
其中:z表示一个神经元对待分析文本的卷积所得的特征向量,f(·)表示激活函数,W∈Rs×m表示神经元的权重矩阵,同一个神经元参数共享,s×m表示卷积核尺寸的大小,b表示阈值,xi:i+s-1表示由文本句子中的第i个词到i+s-1个词语的词向量,s取[2,3,4,5]四种不同的卷积尺寸,f(·)采用RELU激活函数。
所述的训练数据为经过预处理之后的数据。
所述的基于CNN网络的局部特征提取阶段的卷积层采用4种不同尺度的卷积核。所述的训练结束条件是准确率不再改变或达到设置迭代次数。
1.实验分析
测试阶段,选取喜悦、愤怒、厌恶、低落各类别情感语料各占2000条。使用准确率Acc(Accuracy)作为评价指标,测试阶段模型的参数保持不变,测试集结果如表2所示:
表2情感分析结果对比
表2中给出了几种模型的测试结果对比,其中,实验1是通用的卷积核尺寸为3的单尺度CNN网络模型,实验2是通用的LSTM网络,实验3则是本文提出的基于注意力机制的文本情感分析模型。
通过实验的对比性分析可见,相较通常的CNN网络和LSTM网络,本文提出的基于注意力机制的情感分析模型的准确率都明显提高,说明了本发明提出的方法可以有效的提取CNN网络的局部特征信息和LSTM网络的语序特征信息,说明了该方法的有效性。

Claims (6)

1.一种结合注意力机制的深度学习多分类情感分析方法,其特征在于包括以下步骤:
步骤(1)数据预处理
设情感数据集表示为:G=[(segtxt1,y1),(segtxt2,y2),...,(segtxtN,yN)],其中,segtxti表示第i个样本,yi则为对应的情感类别标签,N表示数据集G中样本个数,对G中样本进行数据预处理,
数据集G经预处理后,表示为G′=[(seg1,y1),(seg2,y2),...,(segM,yM)],其中:segi表示为数据集G′中第i个样本,yi则为对应的情感类别标签,M表示数据集G′中样本个数;
步骤(2)构建模型的输入
对于数据集G′中任意一个待分析样本数据(seg,y),将其进一步细化表示为:
seg=[w1,w2,...,wi,...,wd]T (1)
y=[0,0,1,...,0] (2)
其中:wi∈Rε是指依据词表wordList对待分析文本中第i词语的one-hot编码,ε为词表wordList的大小,d表示该文本的句长,y∈Rp是依据情感类别的one-hot编码,p表示模型待分的类别数目,则该样本的词向量嵌入矩阵可表示为:
X=seg*ET (3)
其中:X∈Rd×m,X=[x1,x2,...,xd]T为待分析文本的词向量矩阵表示,m为词向量的维度,xi∈Rm为该文本中第i个词汇的词向量表示,E为词向量嵌入层表示;
步骤(3)构建深度学习多分类情感分析模型
深度学习多分类情感分析模型包括基于CNN网络的局部特征提取阶段和基于LSTM网络的语序关系特征提取阶段,将基于CNN网络的局部特征提取阶段的池化层结果CCnn和基于LSTM网络的语序关系特征提取阶段的结果C'Rnn拼接,即向量[CCnn;C'Rnn]作为模型最终提取的特征向量,然后将特征向量[CCnn;C'Rnn]经过全连接层得到最终的模型输出向量其中p表示模型待分的类别数目,
所述的基于CNN网络的局部特征提取阶段,包括以下内容:
局部特征提取阶段输入为公式3的待分析文本的词向量矩阵表示X;
局部特征提取阶段基于CNN网络,一共包括两层,即一层卷积层、一层池化层,其中:
卷积层采用n种不同尺度的卷积核对待分析文本进行卷积,且同一尺度卷积核的滤波器即神经元各k个;
池化层采用最大池化层的方法将卷积所得的向量做下采样,选出局部最优特征,因此每个滤波器通过最大池化层变为一个标量,该标量代表着该滤波器中最优的情感特征;
局部特征提取模块的输出为CCnn=[c1,c2,...,cnk],即将池化层中不同尺寸的多个滤波器选取的最优特征拼接到一起CCnn=[c1,c2,...,cnk]作为本模块的输出,其中,CCnn∈Rnk,nk为卷积层中所有滤波器的个数;
所述的基于LSTM网络的语序关系特征提取阶段,包括以下内容:
多尺度CNN网络局部特征提取:将基于CNN网络的局部特征提取阶段中卷积层同一卷积尺度的k个滤波器的卷积结果拼接,得到集合ZCnn,然后将集合ZCnn中的每个向量Zi输入到GLU机制中,即门控卷积网络,得到的结果记为{π12,...,πn},完成多尺度CNN网络局部特征的提取,
其中,ZCnn={Z1,Z2,...,Zn},Zi为尺度为i的多个滤波器卷积结果的拼接;
其中,Zi代表某一尺度的k个滤波器卷积结果的拼接,W1,W2∈Rλ×q为权重矩阵,λ表示对应权重矩阵的维度,b1,b2∈Rq为偏置量,σ表示sigmoid函数,πi∈Rq,q为LSTM网络的输出维度;
然后,利用注意力机制,将多尺度CNN网络局部特征提取结果{π12,...,πn}融入到LSTM网络中,得到基于LSTM网络的语序关系特征提取阶段的输出结果C'Rnn,即
其中,表示待分析文本中最后一个词语所对应的LSTM模块的输出,表示待分析文本中第一个词语所对应的LSTM模块的输出,本发明采用双向LSTM模型,即BiLSTM模型,
采用正向传播,具体计算过程如下:
d为待分析文本的长度,该文本中每一个词语顺序对应一个LSTM模块,,
正向传播过程中,第t-1个LSTM模块的输出为则第t个LSTM模块的输出计算公式如下:
其中:是两个向量的点乘,也称打分函数,是用来计算前一词语的LSTM的输出和当前局部特征向量的相似度,
其中:αt,i∈R代表特征πi的权重,
其中:st-1∈Rq是多个卷积特征的加权结果,利用st-1代替结合当前词语的词向量xt求得当前LSTM模块的输出公式如下:
采用反向传播,具体计算过程与正向传播一样,此处不再赘述;
步骤(4)模型训练:将训练数据输入多分类情感分析模型,采用交叉熵损失函数,结合反向传播BP算法调整参数,利用softmax回归作为分类算法,完成训练;
步骤(5)模型分析:将待分析文本输入训练完成的模型,最终输出对该文本分析后的情感分类结果。
2.根据权利要求1所述的一种结合注意力机制的深度学习多分类情感分析方法,其特征在于,所述的预处理过程包括以下步骤:
1)分词、去除停用、英文大写转小写、繁体转简体,
2)选取数据集G中频率大于等于σ的词语,构造词汇表wordList={word1,word2,...wordε},其中,wordi表示词汇表wordlist中第i个词语,ε表示数据集G中词频超过σ的词语总数,
3)对数据集G中每一个样本,若长度大于d,则删除该样本,若长度小于d,则用符号</>补齐。
3.根据权利要求1所述的一种结合注意力机制的深度学习多分类情感分析方法,其特征在于,所述的基于CNN网络的局部特征提取模块的卷积层计算公式如下:
z=f(∑WT*xi:i+s-1+b) (8)
其中:z表示一个神经元对待分析文本的卷积所得的特征向量,f(·)表示激活函数,W∈Rs×m表示神经元的权重矩阵,同一个神经元参数共享,s×m表示卷积核尺寸的大小,b表示阈值,xi:i+s-1表示由文本句子中的第i个词到i+s-1个词语的词向量。
4.根据权利要求1所述的一种结合注意力机制的深度学习多分类情感分析方法,其特征在于,所述的训练数据为经过预处理之后的数据。
5.根据权利要求1所述的一种结合注意力机制的深度学习多分类情感分析方法,其特征在于,所述的基于CNN网络的局部特征提取阶段的卷积层采用4种不同尺度的卷积核。
6.根据权利要求1所述的一种结合注意力机制的深度学习多分类情感分析方法,其特征在于,所述的训练结束条件是准确率不再改变或达到设置迭代次数。
CN201910553755.7A 2019-06-25 2019-06-25 一种结合注意力机制的深度学习多分类情感分析模型 Active CN110287320B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910553755.7A CN110287320B (zh) 2019-06-25 2019-06-25 一种结合注意力机制的深度学习多分类情感分析模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910553755.7A CN110287320B (zh) 2019-06-25 2019-06-25 一种结合注意力机制的深度学习多分类情感分析模型

Publications (2)

Publication Number Publication Date
CN110287320A true CN110287320A (zh) 2019-09-27
CN110287320B CN110287320B (zh) 2021-03-16

Family

ID=68005491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910553755.7A Active CN110287320B (zh) 2019-06-25 2019-06-25 一种结合注意力机制的深度学习多分类情感分析模型

Country Status (1)

Country Link
CN (1) CN110287320B (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110855474A (zh) * 2019-10-21 2020-02-28 广州杰赛科技股份有限公司 Kqi数据的网络特征提取方法、装置、设备及存储介质
CN110866113A (zh) * 2019-09-30 2020-03-06 浙江大学 基于稀疏自注意力机制微调伯特模型的文本分类方法
CN111079985A (zh) * 2019-11-26 2020-04-28 昆明理工大学 一种基于bert并融合可区分属性特征的刑事案件刑期预测方法
CN111079547A (zh) * 2019-11-22 2020-04-28 武汉大学 一种基于手机惯性传感器的行人移动方向识别方法
CN111291832A (zh) * 2020-03-11 2020-06-16 重庆大学 基于Stack集成神经网络的传感器数据分类方法
CN111339768A (zh) * 2020-02-27 2020-06-26 携程旅游网络技术(上海)有限公司 敏感文本检测方法、***、电子设备及介质
CN111402953A (zh) * 2020-04-02 2020-07-10 四川大学 基于层次注意力网络的蛋白质序列分类方法
CN111582397A (zh) * 2020-05-14 2020-08-25 杭州电子科技大学 一种基于注意力机制的cnn-rnn图像情感分析方法
CN111881262A (zh) * 2020-08-06 2020-11-03 重庆邮电大学 基于多通道神经网络的文本情感分析方法
CN111914084A (zh) * 2020-01-09 2020-11-10 北京航空航天大学 一种基于深度学习的带有情感标签文本生成及评估***
CN112597279A (zh) * 2020-12-25 2021-04-02 北京知因智慧科技有限公司 一种文本情感分析模型的优化方法及装置
CN112598065A (zh) * 2020-12-25 2021-04-02 天津工业大学 一种基于记忆的门控卷积神经网络语义处理***及方法
CN112818123A (zh) * 2021-02-08 2021-05-18 河北工程大学 一种文本的情感分类方法
CN113177111A (zh) * 2021-05-28 2021-07-27 中国人民解放军国防科技大学 中文文本情感分析方法、装置、计算机设备和存储介质
CN113239199A (zh) * 2021-05-18 2021-08-10 重庆邮电大学 一种基于多方数据集的信用分类方法
CN113268592A (zh) * 2021-05-06 2021-08-17 天津科技大学 基于多层次交互注意力机制的短文本对象情感分类方法
CN113377901A (zh) * 2021-05-17 2021-09-10 内蒙古工业大学 一种基于多尺寸cnn和lstm模型的蒙古语文本情感分析方法
CN113379818A (zh) * 2021-05-24 2021-09-10 四川大学 一种基于多尺度注意力机制网络的相位解析方法
WO2021174922A1 (zh) * 2020-03-02 2021-09-10 平安科技(深圳)有限公司 语句情感分类方法及相关设备
CN114298025A (zh) * 2021-12-01 2022-04-08 国家电网有限公司华东分部 基于人工智能的情感分析的方法
CN114662547A (zh) * 2022-04-07 2022-06-24 天津大学 基于脑电信号的mscrnn情绪识别方法及装置
CN115116448A (zh) * 2022-08-29 2022-09-27 四川启睿克科技有限公司 语音提取方法、神经网络模型训练方法、装置及存储介质
US20230160942A1 (en) * 2020-04-22 2023-05-25 Qingdao Topscomm Communication Co., Ltd Fault arc signal detection method using convolutional neural network

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108460089A (zh) * 2018-01-23 2018-08-28 哈尔滨理工大学 基于Attention神经网络的多元特征融合中文文本分类方法
CN109670169A (zh) * 2018-11-16 2019-04-23 中山大学 一种基于特征提取的深度学习情感分类方法
CN109710761A (zh) * 2018-12-21 2019-05-03 中国标准化研究院 基于注意力增强的双向lstm模型的情感分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108460089A (zh) * 2018-01-23 2018-08-28 哈尔滨理工大学 基于Attention神经网络的多元特征融合中文文本分类方法
CN109670169A (zh) * 2018-11-16 2019-04-23 中山大学 一种基于特征提取的深度学习情感分类方法
CN109710761A (zh) * 2018-12-21 2019-05-03 中国标准化研究院 基于注意力增强的双向lstm模型的情感分析方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MING-HSIANG SU.ETL: "LSTM-based Text Emotion Recognition Using Semantic and Emotional Word Vectors", 《 2018 FIRST ASIAN CONFERENCE ON AFFECTIVE COMPUTING AND INTELLIGENT INTERACTION》 *
THITITORN SENEEWONG NA AYUTTHAYA.ETL: "Thai Sentiment Analysis via Bidirectional LSTM-CNN Model with Embedding Vectors and Sentic Features", 《2018 INTERNATIONAL JOINT SYMPOSIUM ON ARTIFICIAL INTELLIGENCE AND NATURAL LANGUAGE PROCESSING》 *
关鹏飞等: "注意力增强的双向LSTM情感分析", 《中文信息学报》 *

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110866113A (zh) * 2019-09-30 2020-03-06 浙江大学 基于稀疏自注意力机制微调伯特模型的文本分类方法
CN110866113B (zh) * 2019-09-30 2022-07-26 浙江大学 基于稀疏自注意力机制微调伯特模型的文本分类方法
CN110855474B (zh) * 2019-10-21 2022-06-17 广州杰赛科技股份有限公司 Kqi数据的网络特征提取方法、装置、设备及存储介质
CN110855474A (zh) * 2019-10-21 2020-02-28 广州杰赛科技股份有限公司 Kqi数据的网络特征提取方法、装置、设备及存储介质
CN111079547A (zh) * 2019-11-22 2020-04-28 武汉大学 一种基于手机惯性传感器的行人移动方向识别方法
CN111079985A (zh) * 2019-11-26 2020-04-28 昆明理工大学 一种基于bert并融合可区分属性特征的刑事案件刑期预测方法
CN111914084A (zh) * 2020-01-09 2020-11-10 北京航空航天大学 一种基于深度学习的带有情感标签文本生成及评估***
CN111339768B (zh) * 2020-02-27 2024-03-05 携程旅游网络技术(上海)有限公司 敏感文本检测方法、***、电子设备及介质
CN111339768A (zh) * 2020-02-27 2020-06-26 携程旅游网络技术(上海)有限公司 敏感文本检测方法、***、电子设备及介质
WO2021174922A1 (zh) * 2020-03-02 2021-09-10 平安科技(深圳)有限公司 语句情感分类方法及相关设备
CN111291832A (zh) * 2020-03-11 2020-06-16 重庆大学 基于Stack集成神经网络的传感器数据分类方法
CN111402953A (zh) * 2020-04-02 2020-07-10 四川大学 基于层次注意力网络的蛋白质序列分类方法
CN111402953B (zh) * 2020-04-02 2022-05-03 四川大学 基于层次注意力网络的蛋白质序列分类方法
US11860216B2 (en) * 2020-04-22 2024-01-02 Qingdao Topscomm Communication Co., Ltd Fault arc signal detection method using convolutional neural network
US20230160942A1 (en) * 2020-04-22 2023-05-25 Qingdao Topscomm Communication Co., Ltd Fault arc signal detection method using convolutional neural network
CN111582397B (zh) * 2020-05-14 2023-04-07 杭州电子科技大学 一种基于注意力机制的cnn-rnn图像情感分析方法
CN111582397A (zh) * 2020-05-14 2020-08-25 杭州电子科技大学 一种基于注意力机制的cnn-rnn图像情感分析方法
CN111881262A (zh) * 2020-08-06 2020-11-03 重庆邮电大学 基于多通道神经网络的文本情感分析方法
CN111881262B (zh) * 2020-08-06 2022-05-20 重庆邮电大学 基于多通道神经网络的文本情感分析方法
CN112598065A (zh) * 2020-12-25 2021-04-02 天津工业大学 一种基于记忆的门控卷积神经网络语义处理***及方法
CN112597279A (zh) * 2020-12-25 2021-04-02 北京知因智慧科技有限公司 一种文本情感分析模型的优化方法及装置
CN112598065B (zh) * 2020-12-25 2023-05-30 天津工业大学 一种基于记忆的门控卷积神经网络语义处理***及方法
CN112818123A (zh) * 2021-02-08 2021-05-18 河北工程大学 一种文本的情感分类方法
CN113268592A (zh) * 2021-05-06 2021-08-17 天津科技大学 基于多层次交互注意力机制的短文本对象情感分类方法
CN113377901A (zh) * 2021-05-17 2021-09-10 内蒙古工业大学 一种基于多尺寸cnn和lstm模型的蒙古语文本情感分析方法
CN113377901B (zh) * 2021-05-17 2022-08-19 内蒙古工业大学 一种基于多尺寸cnn和lstm模型的蒙古语文本情感分析方法
CN113239199A (zh) * 2021-05-18 2021-08-10 重庆邮电大学 一种基于多方数据集的信用分类方法
CN113379818B (zh) * 2021-05-24 2022-06-07 四川大学 一种基于多尺度注意力机制网络的相位解析方法
CN113379818A (zh) * 2021-05-24 2021-09-10 四川大学 一种基于多尺度注意力机制网络的相位解析方法
CN113177111A (zh) * 2021-05-28 2021-07-27 中国人民解放军国防科技大学 中文文本情感分析方法、装置、计算机设备和存储介质
CN114298025A (zh) * 2021-12-01 2022-04-08 国家电网有限公司华东分部 基于人工智能的情感分析的方法
CN114662547A (zh) * 2022-04-07 2022-06-24 天津大学 基于脑电信号的mscrnn情绪识别方法及装置
CN115116448A (zh) * 2022-08-29 2022-09-27 四川启睿克科技有限公司 语音提取方法、神经网络模型训练方法、装置及存储介质
CN115116448B (zh) * 2022-08-29 2022-11-15 四川启睿克科技有限公司 语音提取方法、神经网络模型训练方法、装置及存储介质

Also Published As

Publication number Publication date
CN110287320B (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
CN110287320A (zh) 一种结合注意力机制的深度学习多分类情感分析模型
CN111767741B (zh) 一种基于深度学习和tfidf算法的文本情感分析方法
CN109740148B (zh) 一种BiLSTM结合Attention机制的文本情感分析方法
CN113254599B (zh) 一种基于半监督学习的多标签微博文本分类方法
CN109241255B (zh) 一种基于深度学习的意图识别方法
CN107608956B (zh) 一种基于cnn-grnn的读者情绪分布预测算法
Alwehaibi et al. Comparison of pre-trained word vectors for arabic text classification using deep learning approach
CN110287323B (zh) 一种面向目标的情感分类方法
CN107818084B (zh) 一种融合点评配图的情感分析方法
CN107862087A (zh) 基于大数据和深度学习的情感分析方法、装置和存储介质
CN110765769B (zh) 一种基于子句特征的实体属性依赖情感分析方法
CN112818861A (zh) 一种基于多模态上下文语义特征的情感分类方法及***
CN110851601A (zh) 基于分层注意力机制的跨领域情感分类***及方法
CN109271636B (zh) 词嵌入模型的训练方法及装置
CN112860896A (zh) 语料泛化方法及用于工业领域的人机对话情感分析方法
CN112287106A (zh) 一种基于双通道混合神经网络的在线评论情感分类方法
CN107818173B (zh) 一种基于向量空间模型的中文虚假评论过滤方法
CN114462385A (zh) 一种文本分段方法及装置
CN113204624B (zh) 一种多特征融合的文本情感分析模型及装置
CN113159831A (zh) 一种基于改进的胶囊网络的评论文本情感分析方法
Siddique et al. Bilingual word embeddings for cross-lingual personality recognition using convolutional neural nets
CN111414755A (zh) 一种基于细粒度情感字典的网络情绪分析方法
CN109635289B (zh) 词条分类方法及审计信息抽取方法
CN111694960A (zh) 基于词性特征和观点特征结合卷积神经网络的电商评论情感分析模型
Vayadande et al. Mood detection and emoji classification using tokenization and convolutional neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant