CN111930940B

CN111930940B - 一种文本情感分类方法、装置、电子设备及存储介质

Info

Publication number: CN111930940B
Application number: CN202010748294.1A
Authority: CN
Inventors: 吴双志; 谢军; 李沐
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-07-30
Filing date: 2020-07-30
Publication date: 2024-04-16
Anticipated expiration: 2040-07-30
Also published as: CN111930940A

Abstract

本发明涉及自然语言处理及机器学习技术领域，具体是一种文本情感分类方法、装置、电子设备及存储介质，所述方法包括：获取待分类的目标文本，对所述目标文本进行处理，得到所述目标文本的词向量序列；利用预先训练的语义编码模型对所述词向量序列进行处理，得到所述词向量序列对应的词语义向量序列以及所述目标文本的语义向量；将所述词向量序列、所述词语义向量序列以及所述语义向量输入预先训练的情感生成模型，得到所述目标文本的情感向量，所述情感生成模型为基于注意力的神经网络模型；将所述语义向量和所述情感向量输入预先训练的情感分类模型，得到所述目标文本的情感分类结果。本发明引入动态生成的情感向量，提高了情感分类的准确性。

Description

一种文本情感分类方法、装置、电子设备及存储介质

技术领域

本发明涉及自然语言处理及机器学习技术领域，特别涉及一种文本情感分类方法、装置、电子设备及存储介质。

背景技术

随着互联网技术的发展，网络产品越来越多。用户在使用网络产品的过程中或者使用网络产品后，通常会输入表达自身需求或观点的网络文本，例如在智能客服或者语音助手中输入需要解决的问题，或者在使用某项服务后发表针对该项服务的评价等等。由于网络文本蕴含着丰富的情感信息，对应着用户相应的心理状态，通过对用户输入的网络文本进行情感分析，判定它的情感类别，能够根据分析结果确定恰当的处理策略，以提供更符合用户需求的网络产品。因此情感分析技术被广泛应用于消费决策、舆情分析、个性化推荐和人机交互等领域。

传统的情感分类方法通常利用多元文法、词法等作为特征，采用传统的分类模型进行分类，例如支持向量机、最大熵模型等。近期随着神经网络以及深度学习的发展，神经网络也被用在了情感分类领域。现有的情感分类方法一种是利用外部词典帮助情感分类的方法，该方法在长短时记忆(Long Short Term Memory，LSTM)网络的基础上提出了自注意力网络，并将外部词典引入到模型的训练中；另一种是利用领域知识的情感分类方法，该方法在预训练语言模型的基础上引入了领域知识，其目的是针对不同的情感分类任务，提取相应的领域知识，来帮助语言模型更好的适应新场景、新任务。现有的情感分类方法在训练分类模型的过程中需要依赖外部的情感词典或者领域知识，可能会出现由于标注不一致带来的不匹配问题或者由于词典覆盖度不够导致情感分类的准确性较差的问题。

发明内容

针对现有技术的上述问题，本发明的目的在于提供一种文本情感分类方法、装置、电子设备及存储介质，能够提高情感分类的准确性。

为了解决上述问题，本发明提供一种文本情感分类方法，包括：

获取待分类的目标文本，对所述目标文本进行处理，得到所述目标文本的词向量序列；

利用预先训练的语义编码模型对所述词向量序列进行处理，得到所述词向量序列对应的词语义向量序列以及所述目标文本的语义向量；

将所述词向量序列、所述词语义向量序列以及所述语义向量输入预先训练的情感生成模型，得到所述目标文本的情感向量，所述情感生成模型为基于注意力的神经网络模型；

将所述语义向量和所述情感向量输入预先训练的情感分类模型，得到所述目标文本的情感分类结果。

本发明另一方面提供一种文本情感分类装置，包括：

词向量序列生成模块，用于获取待分类的目标文本，对所述目标文本进行处理，得到所述目标文本的词向量序列；

语义向量生成模块，用于利用预先训练的语义编码模型对所述词向量序列进行处理，得到所述词向量序列对应的词语义向量序列以及所述目标文本的语义向量；

情感向量生成模块，用于将所述词向量序列、所述词语义向量序列以及所述语义向量输入预先训练的情感生成模型，得到所述目标文本的情感向量，所述情感生成模型为基于注意力的神经网络模型；

情感分类模块，用于将所述语义向量和所述情感向量输入预先训练的情感分类模型，得到所述目标文本的情感分类结果。

本发明另一方面提供一种电子设备，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述的文本情感分类方法。

本发明另一方面提供一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或至少一段程序由处理器加载并执行以实现如上述的文本情感分类方法。

由于上述技术方案，本发明具有以下有益效果：

(1)本发明的文本情感分类方法，通过预先训练的情感生成模型动态地为目标文本的各个词语生成基于上下文的词情感向量，并将词情感向量引入文本情感分类中，能够有效地提高情感分类的准确性。由于动态的为每个词语生成词情感向量，相比于固定标注，可以有效地处理一词多情感问题。

(2)本发明的文本情感分类方法在模型训练过程中无需依赖外部情感词典，避免了由于标注不一致带来的不匹配问题和词典覆盖度问题。由于不需要依赖外部词典，本发明的文本情感分类方法可以对新任务、新数据有较好的适应性。

附图说明

为了更清楚地说明本发明的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1是本发明一个实施例提供的文本情感分类方法的实施环境示意图；

图2是本发明一个实施例提供的文本情感分类方法的流程图；

图3是本发明一个实施例提供的神经网络模型的结构示意图；

图4是本发明另一个实施例提供的文本情感分类方法的流程图；

图5是本发明一个实施例提供的用户界面的示意图；

图6是本发明一个实施例提供的模型训练方法的流程图；

图7是本发明一个实施例提供的文本情感分类装置的结构示意图；

图8是本发明另一个实施例提供的文本情感分类装置的结构示意图；

图9是本发明一个实施例提供的服务器的结构示意图。

具体实施方式

自然语言处理(Nature Language Processing，NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

具体地，本发明实施例提供的基于语义编码模型、情感生成模型和情感分类模型对目标文本进行分析处理，得到目标文本的情感分类结果的过程，涉及NLP中的文本处理、语义理解技术等。

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为了使本发明实施例公开的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明实施例进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本发明实施例，并不用于限定本发明实施例。首先，本发明实施例对下述概念进行解释：

情感分类：指根据文本内容，将文本划分成预定义好的多种类型的情感(比如，愤怒，喜悦等)。

BERT：全称为Bidirectional Encoder Representations from Transformers，即双向Transformer的编码器，是一种利用海量文本的双向语言模型训练方法。BERT用于提取文本特征，能够充分描述字符级、词级、句子级甚至句间关系特征，被广泛用于多种自然语言处理任务。

LSTM：全称为Long-short Term Memory，即长短时记忆网络，是一种人工设计的循环神经网络结构，主要是为了解决长序列训练过程中的梯度消失和梯度***问题。LSTM已经在自然语言处理领域有了多种应用，例如可以利用基于LSTM的***学习翻译语言、控制机器人、图像分析、文档摘要和语音识别图像识别等等。

MLP：全称为Multi-layerPerceptron，即多层感知机，是一种多层前馈神经网络。MLP是由全连接组成的神经网络，至少含有一个隐藏层，并且每个隐藏层的输出均通过激活函数进行变换。

参考说明书附图1，其示出了本发明一个实施例提供的文本情感分类方法的实施环境示意图。如图1所示，该实施环境至少可以包括终端110和服务器120，所述终端110和所述服务器120可以通过有线或无线通信方式进行直接或间接地连接，本发明对此不做限制。比如，所述终端110可以通过有线或无线通信方式向所述服务器120上传相应的需要进行情感分类的目标文本等，所述服务器120可以通过有线或无线通信方式向所述终端110展示所述目标文本的情感分类结果等。

具体地，所述终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。所述服务器120可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式***，还可以是提供云计算服务的云服务器。

需要说明的是，图1仅仅是一种示例。

参考说明书附图2，其示出了本发明一个实施例提供的文本情感分类方法的流程。本发明实施例提供的文本情感分类方法可以应用于任何需要对文本进行情感分析的场景中，例如可以应用于智能客服和语音助手中对用户输入文本的情感分类，也可以应用于对用户评价信息的文本情感分类。具体的如图2所示，所述方法可以包括：

S210：获取待分类的目标文本，对所述目标文本进行处理，得到所述目标文本的词向量序列。

本发明实施例中，所述目标文本可以是任意文本，本发明实施例不对获取目标文本的方式进行具体限定，例如，可以基于应用场景进行获取。

示例性地，若本发明实施例提供的文本情感分类方法应用于智能问答、智能客服、语音助手等场景中，该类场景包括实施文本情感分类方法的服务器以及终端。其中，终端显示用户界面，基于该用户界面获取用户输入的文本，并将该文本发送至服务器，则服务器接收该文本，即为获取到的目标文本。

需要说明的是，所述目标文本可以为用户输入的一段话，也可以为一个句子或者一个词语等；所述目标文本可以是任何内容，例如可以是一定的问题，也可以是表达一定的用户想法等，本发明实施例不对目标文本的内容及长度进行限定。在实际应用中，如果需要进行情感分析的文本为包括多个句子的文本段落，可以直接将所述文本段落作为目标文本，采用本发明实施例提供的文本情感分类方法进行情感分类，得到所述文本段落的情感分类结果；也可以对所述文本段落进行分句处理，将分句后的各个句子作为目标文本，分别采用本发明实施例提供的文本情感分类方法进行情感分类，得到各个句子的情感分类结果，从而确定所述文本段落的情感分类结果。

在一个可能的实施例中，所述获取待分类的目标文本，对所述目标文本进行处理，得到所述目标文本的词向量序列可以包括：

对所述目标文本进行分词处理，得到所述目标文本包含的多个词语；

对所述多个词语分别进行编码，得到所述多个词语的词向量；

根据所述多个词语的词向量生成所述目标文本的词向量序列。

本发明实施例中，分词处理可以采用文本处理领域的任意分词方法，只要可以确定所述目标文本包括的分词词语即可，本发明实施例不对进行分词处理的方法进行限定。例如，所述目标文本为“我今天真郁闷，不开心”，那么对所述目标文本进行分词处理，可以得到其包括的分词词语“我”、“今天”、“真”、“郁闷”和“不开心”。

本发明实施例中，可以采用文本处理领域的任意词向量表示方法确定所述目标文本包含的多个词语的词向量，本发明实施例对此不进行限定。例如，可以通过预先训练的词向量模型确定各个词语的词向量。

本发明实施例中，词向量序列是指排序好的词向量，词向量的排序和所述目标文本中词语的前后顺序是相对应的。

S220：利用预先训练的语义编码模型对所述词向量序列进行处理，得到所述词向量序列对应的词语义向量序列以及所述目标文本的语义向量。

本发明实施例中，可以将所述词向量序列输入预先训练的语义编码模型，为所述目标文本中的每个词语生成一个隐层向量，作为各个词语的词语义向量，同时利用所述隐层向量生成并输出所述目标文本的语义向量。

在一个可能的实施例中，所述语义编码模型可以包括基于自注意力的第三神经网络；

所述利用预先训练的语义编码模型对所述词向量序列进行处理，得到所述词向量序列对应的词语义向量序列以及所述目标文本的语义向量可以包括：

基于所述第三神经网络对所述词向量序列进行处理，得到所述目标文本中各个词语的词语义向量；

根据所述目标文本中各个词语的词语义向量生成所述词向量序列对应的词语义向量序列；

对所述词语义向量序列进行聚合，得到所述目标文本的语义向量。

本发明实施例中，所述第三神经网络可以为多种神经网络，例如双向长短时记忆网络(Bi-directional Long-short Term Memory，Bi-LSTM)、循环神经网络(RecurrentNeural Network。RNN)或者卷积神经网络(Convolution Neural Network，CNN)等不同的神经网络，以及混合使用RNN、CNN和自注意力的其他网络等，本发明实施例对此不做限定。所述词语义向量序列是指排序好的词语义向量，词语义向量的排序和所述目标文本中词语的前后顺序是相对应的。

示例性地，结合参考说明书附图3，其示出了本发明一个实施例提供的神经网络模型的结构，所述神经网络模型可以包括语义编码模型310，所述语义编码模型310可以包括Bi-LSTM网络，将目标文本的词向量序列{E_w1,E_w2,E_w3,…,E_wn}输入所述Bi-LSTM网络，可以输出所述目标文本中各个词语的词语义向量组成的词语义向量序列{h₁,h₂,h₃,…,h_n}，以及所述目标文本的语义向量h_s。

S230：将所述词向量序列、所述词语义向量序列以及所述语义向量输入预先训练的情感生成模型，得到所述目标文本的情感向量，所述情感生成模型为基于注意力的神经网络模型。

本发明实施例中，所述情感生成模型可以根据所述词向量序列和所述词语义向量序列为所述目标文本的每个词语生成一个基于上下文的词情感向量，并采用注意力机制根据各个词语的词情感向量和所述语义向量生成所述目标文本的情感向量。

实际应用中，同一个词语在不同的句子中可以表示不同的情感，例如“惩罚”，在句子“这个坏人终于得到了应有的惩罚！”中表达了“气愤”的情感，而在“我今天摔碎了花瓶，被妈妈惩罚了。”中表达了“悲伤”的情感。而本发明实施例中生成的词情感向量具有动态性，能够根据上下文对词语的情感进行调整，使得相同的词语在不同的场景下可以生成不同的词情感向量，相比于现有技术中的固定标注准确性更高，从而能够有效地提高情感分类的准确性。

在一个可能的实施例中，所述情感生成模型可以包括基于自注意力的第一神经网络和注意力网络；

结合参考说明书附图4，所述将所述词向量序列、所述词语义向量序列以及所述语义向量输入预先训练的情感生成模型，得到所述目标文本的情感向量可以包括：

S410：基于所述第一神经网络对所述词向量序列和所述词语义向量序列进行分析，得到所述目标文本中各个词语的词情感向量。

S420：根据所述目标文本中各个词语的词情感向量生成所述目标文本的词情感向量序列。

S430：基于所述注意力网络对所述语义向量和所述词情感向量序列进行分析，将所述词情感向量序列聚合成所述目标文本的情感向量。

本发明实施例中，所述第一神经网络可以为多种神经网络，例如双向长短时记忆网络或者卷积神经网络等不同的神经网络，本发明实施例对此不做限定。所述词情感向量序列是指排序好的词情感向量，词情感向量的排序和所述目标文本中词语的前后顺序是相对应的。所述目标文本中各个词语的词情感向量还可以作为副产物，用于进行后续自然语言处理任务。

示例性地，结合参考说明书附图3，所述神经网络模型还可以包括情感生成模型320，所述情感生成模型320可以包括Bi-LSTM网络、归一化层和注意力网络，将目标文本的词向量序列{E_w1,E_w2,E_w3,…,E_wn}和词语义向量序列{h₁,h₂,h₃,…,h_n}输入所述Bi-LSTM网络，可以输出所述目标文本中各个词语的词情感向量e₁,e₂,e₃,…,e_n，生成所述目标文本的词情感向量序列{e₁,e₂,e₃,…,e_n},将所述词情感向量序列输入归一化层进行归一化后与所述目标文本的语义向量h_s一同输入注意力网络，可以得到所述目标文本的情感向量e_s。

S240：将所述语义向量和所述情感向量输入预先训练的情感分类模型，得到所述目标文本的情感分类结果。

本发明实施例中，可以针对当前应用场景预先确定一个情感集合，所述情感集合可以包括当前场景下常见的情感类型，例如，可以包括“高兴”、“悲伤”、“惊讶”、“气愤”、“厌恶”和“恐惧”等等。所述情感分类模型可以根据所述语义向量确定所述目标文本在所述情感集合中的每一类情感上的分量，再结合所述情感向量最终确定所述目标文本的情感分类结果。

需要说明的是，在不同的应用场景下可以有不同的情感集合，并且不同场景下的情感集合的情感类型及情感类型的数量也可以不同，本发明实施例对此不做限定。

在一个可能的实施例中，所述情感分类模型可以包括第二神经网络和分类网络；

所述将所述语义向量和所述情感向量输入预先训练的情感分类模型，得到所述目标文本的情感分类结果可以包括：

基于所述第二神经网络对所述语义向量进行处理，得到所述目标文本的分类特征向量；

基于所述分类网络对所述分类特征向量和所述情感向量进行分析，得到所述目标文本的情感分类结果。

本发明实施例中，所述第二神经网络可以为多种神经网络，例如多层感知机或者卷积神经网络等不同的神经网络，所述分类网络也可以为多种神经网络，例如Softmax分类网络等等，本发明实施例对此不做限定。

示例性地，结合参考说明书附图3，所述神经网络模型还可以包括情感分类模型330，所述情感分类模型330可以包括MLPs网络和Softmax分类网络，将所述目标文本的语义向量h_s输入所述MLPs网络可以输出所述目标文本的分类特征向量，将所述分类特征向量和目标文本的情感向量e_s输入所述Softmax分类网络可以输出所述目标文本的情感分类结果。

在一个可能的实施例中，所述方法还可以包括根据目标文本的情感分类结果确定响应文本，并将所述响应文本反馈给终端。示例性地，在智能问答***中，可以预先针对不同情感分类结果构建对应的答案文本集合，当得到目标文本的情感分类结果后，可以基于所述情感分类结果在对应的答案文本集合中选取匹配的答案文本作为响应文本反馈给终端。例如，具体可采用一些文本匹配的检测算法等，本发明实施例对此不作具体限定。

下面以智能问答***为例进行说明，所述智能问答***包括终端和服务器，所述智能问答***在实现智能问答时，可以包括如下几个步骤：

1)终端获取用户通过客户端输入的目标文本，向服务器发送问答请求，所述问答请求包括文本标识和所述目标文本，所述文本标识用于标记所述目标文本，由此区分不同的目标文本。

2)服务器接收到所述问答请求后，使用本发明方法实施例提供的情感分类方法，基于所述语义编码模型、所述情感生成模型和所述情感分类模型对所述目标文本进行情感分类，得到情感分类结果，并根据所述情感分类结果确定对应的答案文本，将所述答案文本返回给终端。

3)终端接收到所述答案文本后，可以通过客户端的交互界面进行展示。

基于上述智能问答***的交互过程，以图5所示的用户界面为例进行说明。用户可以通过会话界面51中的用于供用户输入消息文本的操作控件52和用于供用户触发发送消息文本的操作控件53输入并发送所述目标文本。服务器接收到目标文本后，对所述目标文本进行情感分类，并根据所述情感分类结果确定对应的答案文本，将所述答案文本返回给终端。终端可以通过所述会话界面51展示所述答案文本。当用户输入的目标文本为“我今天好郁闷啊，不开心。”则通过本发明实施例提供的情感分类方法获取到情感分类结果之后，基于该情感分类结果获取到的答案文本可以为“不要哭泣，阳光总在风雨后。”

此外，除上述举例外，本发明实施例提供的方法还可应用于应用程序评价分析、网络产品评价分析、网商智能客服和语音助手等等，赋予机器人一定的情感能力。

参考说明书附图6，其示出了本发明一个实施例提供的模型训练方法的流程图。如图6所示，所述文本情感分类方法还可以包括训练所述语义编码模型、所述情感生成模型和所述情感分类模型的步骤；所述训练所述语义编码模型、所述情感生成模型和所述情感分类模型的步骤可以包括：

S610：构建预设神经网络模型，所述预设神经网络模型包括预设语义编码模型、预设情感生成模型和预设情感分类模型，所述预设语义编码模型包括基于自注意力的第三神经网络，所述预设情感生成模型包括基于自注意力的第一神经网络和注意力网络，所述预设情感分类模型包括第二神经网络和分类网络。

在一个可能的实施例中，所述第一神经网络包括双向长短时记忆网络或者卷积神经网络，所述第二神经网络包括多层感知机网络或者卷积神经网络，所述第三神经网络包括双向长短时记忆网络、循环神经网络或者卷积神经网络。示例性地，所述预设语义编码模型可以包括Bi-LSTM网络，所述预设情感生成模型可以包括Bi-LSTM网络、归一化层和注意力网络，所述预设情感分类模型可以包括MLPs网络和Softmax分类网络。

S620：获取训练文本集，所述训练文本集包括多个训练文本及其对应的情感标签。

本发明实施例中，所述训练文本集中的训练文本可以为目标领域(例如智能问答领域)的标注有情感类型标签的语料文本，所述标签可以为人工标注的用于标记所述训练文本的情感类型的标签。实际应用中，可以采用公开的数据集作为训练所述语义编码模型、所述情感生成模型和所述情感分类模型的训练文本集。

S630：使用所述训练文本集中的训练文本对所述预设神经网络模型进行训练，在训练过程中调整所述预设语义编码模型、所述预设情感生成模型和所述预设情感分类模型的模型参数至所述预设神经网络模型的输出结果与训练文本的情感标签相匹配，得到所述语义编码模型、所述情感生成模型和所述情感分类模型。

本发明实施例中，可以基于BERT模型、LSTM网络、MLPs网络进行机器学习训练，在训练过程中根据损失函数的值调整所述预设语义编码模型、所述预设情感生成模型和所述预设情感分类模型的模型参数直至所述损失函数收敛，然后将当前模型参数对应的预设语义编码模型作为训练完成的语义编码模型，将当前模型参数对应的预设情感生成模型作为训练完成的情感生成模型，将当前模型参数对应的预设情感分类模型作为训练完成的情感分类模型。

通过在公开的数据集SemEval 2018上验证表明，本发明实施例提供的情感分类方法有效的高于现有的其他方法，将该数据集上测试集的准确率提高到了59.3％，与Baziotis等人2018提出的方法相比提高了5％。

综上所述，本发明的文本情感分类方法，通过预先训练的情感生成模型动态地为目标文本的各个词语生成基于上下文的词情感向量，并将词情感向量引入文本情感分类中，能够有效地提高情感分类的准确性。由于动态的为每个词语生成词情感向量，相比于固定标注，可以有效地处理一词多情感问题。本发明的文本情感分类方法在模型训练过程中无需依赖外部情感词典，避免了由于标注不一致带来的不匹配问题和词典覆盖度问题。由于不需要依赖外部词典，本发明的文本情感分类方法可以对新任务、新数据有较好的适应性。

参考说明书附图7，其示出了本发明一个实施例提供的文本情感分类装置的结构。如图7所示，所述装置可以包括：

词向量序列生成模块710，用于获取待分类的目标文本，对所述目标文本进行处理，得到所述目标文本的词向量序列；

语义向量生成模块720，用于利用预先训练的语义编码模型对所述词向量序列进行处理，得到所述词向量序列对应的词语义向量序列以及所述目标文本的语义向量；

情感向量生成模块730，用于将所述词向量序列、所述词语义向量序列以及所述语义向量输入预先训练的情感生成模型，得到所述目标文本的情感向量，所述情感生成模型为基于注意力的神经网络模型；

情感分类模块740，用于将所述语义向量和所述情感向量输入预先训练的情感分类模型，得到所述目标文本的情感分类结果。

在一个可能的实施例中，所述装置还可以包括模型训练模块750，所述模型训练模块750用于训练所述语义编码模型、所述情感生成模型和所述情感分类模型；参考说明书附图8，所述模型训练模块750可以包括：

模型构建单元751，用于构建预设神经网络模型，所述预设神经网络模型包括预设语义编码模型、预设情感生成模型和预设情感分类模型，所述预设语义编码模型包括基于自注意力的第三神经网络，所述预设情感生成模型包括基于自注意力的第一神经网络和注意力网络，所述预设情感分类模型包括第二神经网络和分类网络；

训练文本集获取单元752，用于获取训练文本集，所述训练文本集包括多个训练文本及其对应的情感标签；

模型训练单元753，用于使用所述训练文本集中的训练文本对所述预设神经网络模型进行训练，在训练过程中调整所述预设语义编码模型、所述预设情感生成模型和所述预设情感分类模型的模型参数至所述预设神经网络模型的输出结果与训练文本的情感标签相匹配，得到所述语义编码模型、所述情感生成模型和所述情感分类模型。

在一个可能的实施例中，所述第一神经网络包括双向长短时记忆网络或者卷积神经网络，所述第二神经网络包括多层感知机网络或者卷积神经网络，所述第三神经网络包括双向长短时记忆网络、循环神经网络或者卷积神经网络。

需要说明的是，本发明实施例提供的装置实施例与上述方法实施例基于相同的发明构思。上述实施例提供的装置，在实现其功能时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

本发明实施例还提供了一种电子设备，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述方法实施例提供的文本情感分类方法。

其中，存储器可用于存储软件程序以及模块，处理器通过运行存储在存储器的软件程序以及模块，从而执行各种功能应用以及情感分类。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、功能所需的应用程序等；存储数据区可存储根据所述设备的使用所创建的数据等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器还可以包括存储器控制器，以提供处理器对存储器的访问。

本发明实施例所提供的方法实施例可以在终端、服务器或者类似的运算装置中执行，即上述电子设备可以包括终端、服务器或者类似的运算装置。以运行在服务器上为例，如图9所示，其示出了本发明一个实施例提供的运行文本情感分类方法的服务器的结构示意图。该服务器900可因配置或性能不同而产生比较大的差异，可以包括一个或一个以***处理器(Central Processing Unit，CPU)910(例如，一个或一个以上处理器)和存储器930，一个或一个以上存储应用程序923或数据922的存储介质920(例如一个或一个以上海量存储设备)。其中，存储器930和存储介质920可以是短暂存储或持久存储。存储在存储介质920的程序可以包括一个或一个以上模块，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器910可以设置为与存储介质920通信，在服务器900上执行存储介质920中的一系列指令操作。服务器900还可以包括一个或一个以上电源960，一个或一个以上有线或无线网络接口950，一个或一个以上输入输出接口940，和/或，一个或一个以上操作***921，例如Windows ServerTM，Mac OS XTM，UnixTM，LinuxTM，FreeBSDTM等等。

输入输出接口940可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器900的通信供应商提供的无线网络。在一个实例中，输入输出接口940包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，输入输出接口940可以为射频(RadioFrequency，RF)模块，其用于通过无线方式与互联网进行通讯，所述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯***(Global System ofMobilecommunication，GSM)、通用分组无线服务(General Packet Radio Service，GPRS)、码分多址(Code Division Multiple Access，CDMA)、宽带码分多址(Wideband Code DivisionMultiple Access，WCDMA)、长期演进(Long Term Evolution，LTE)、电子邮件、短消息服务(ShortMessaging Service，SMS)等。

本领域普通技术人员可以理解，图9所示的结构仅为示意，服务器900还可包括比图9中所示更多或者更少的组件，或者具有与图9所示不同的配置。

本发明一个实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或至少一段程序由处理器加载并执行以实现如上述方法实施例提供的文本情感分类方法。

可选地，在本发明实施例中，上述计算机可读存储介质可以包括但不限于：U盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(RandomAccess Memory，RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本发明一个实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述方法实施例中各种可选实现方式中提供的文本情感分类方法。

需要说明的是：上述本发明实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、终端和服务器实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种文本情感分类方法，其特征在于，包括：

利用预先训练的语义编码模型对所述词向量序列进行处理，得到所述词向量序列对应的词语义向量序列以及所述目标文本的语义向量；所述语义编码模型包括基于自注意力的第三神经网络；所述利用预先训练的语义编码模型对所述词向量序列进行处理，得到所述词向量序列对应的词语义向量序列以及所述目标文本的语义向量包括：基于所述第三神经网络对所述词向量序列进行处理，得到所述目标文本中各个词语的词语义向量；根据所述目标文本中各个词语的词语义向量生成所述词向量序列对应的词语义向量序列；对所述词语义向量序列进行聚合，得到所述目标文本的语义向量；

将所述词向量序列、所述词语义向量序列以及所述语义向量输入预先训练的情感生成模型，得到所述目标文本的情感向量，所述情感生成模型为基于注意力的神经网络模型；所述情感生成模型根据所述词向量序列和所述词语义向量序列为所述目标文本的每个词语生成一个基于上下文的词情感向量，采用注意力机制根据各个词语的词情感向量和所述语义向量生成所述目标文本的情感向量；所述情感生成模型包括基于自注意力的第一神经网络和注意力网络；所述将所述词向量序列、所述词语义向量序列以及所述语义向量输入预先训练的情感生成模型，得到所述目标文本的情感向量包括：基于所述第一神经网络对所述词向量序列和所述词语义向量序列进行分析，得到所述目标文本中各个词语的词情感向量；根据所述目标文本中各个词语的词情感向量生成所述目标文本的词情感向量序列；基于所述注意力网络对所述语义向量和所述词情感向量序列进行分析，将所述词情感向量序列聚合成所述目标文本的情感向量；

2.根据权利要求1所述的方法，其特征在于，所述情感分类模型包括第二神经网络和分类网络；

所述将所述语义向量和所述情感向量输入预先训练的情感分类模型，得到所述目标文本的情感分类结果包括：

3.根据权利要求1所述的方法，其特征在于，所述获取待分类的目标文本，对所述目标文本进行处理，得到所述目标文本的词向量序列包括：

4.根据权利要求1所述的方法，其特征在于，所述方法还包括训练所述语义编码模型、所述情感生成模型和所述情感分类模型的步骤；

所述训练所述语义编码模型、所述情感生成模型和所述情感分类模型包括：

构建预设神经网络模型，所述预设神经网络模型包括预设语义编码模型、预设情感生成模型和预设情感分类模型，所述预设语义编码模型包括基于自注意力的第三神经网络，所述预设情感生成模型包括基于自注意力的第一神经网络和注意力网络，所述预设情感分类模型包括第二神经网络和分类网络；

获取训练文本集，所述训练文本集包括多个训练文本及其对应的情感标签；

使用所述训练文本集中的训练文本对所述预设神经网络模型进行训练，在训练过程中调整所述预设语义编码模型、所述预设情感生成模型和所述预设情感分类模型的模型参数至所述预设神经网络模型的输出结果与训练文本的情感标签相匹配，得到所述语义编码模型、所述情感生成模型和所述情感分类模型。

5.根据权利要求4所述的方法，其特征在于，所述第一神经网络包括双向长短时记忆网络或者卷积神经网络，所述第二神经网络包括多层感知机网络或者卷积神经网络，所述第三神经网络包括双向长短时记忆网络、循环神经网络或者卷积神经网络。

6.一种文本情感分类装置，其特征在于，包括：

语义向量生成模块，用于利用预先训练的语义编码模型对所述词向量序列进行处理，得到所述词向量序列对应的词语义向量序列以及所述目标文本的语义向量；所述语义编码模型包括基于自注意力的第三神经网络；所述利用预先训练的语义编码模型对所述词向量序列进行处理，得到所述词向量序列对应的词语义向量序列以及所述目标文本的语义向量包括：基于所述第三神经网络对所述词向量序列进行处理，得到所述目标文本中各个词语的词语义向量；根据所述目标文本中各个词语的词语义向量生成所述词向量序列对应的词语义向量序列；对所述词语义向量序列进行聚合，得到所述目标文本的语义向量；

情感向量生成模块，用于将所述词向量序列、所述词语义向量序列以及所述语义向量输入预先训练的情感生成模型，得到所述目标文本的情感向量，所述情感生成模型为基于注意力的神经网络模型；所述情感生成模型根据所述词向量序列和所述词语义向量序列为所述目标文本的每个词语生成一个基于上下文的词情感向量，采用注意力机制根据各个词语的词情感向量和所述语义向量生成所述目标文本的情感向量；所述情感生成模型包括基于自注意力的第一神经网络和注意力网络；所述将所述词向量序列、所述词语义向量序列以及所述语义向量输入预先训练的情感生成模型，得到所述目标文本的情感向量包括：基于所述第一神经网络对所述词向量序列和所述词语义向量序列进行分析，得到所述目标文本中各个词语的词情感向量；根据所述目标文本中各个词语的词情感向量生成所述目标文本的词情感向量序列；基于所述注意力网络对所述语义向量和所述词情感向量序列进行分析，将所述词情感向量序列聚合成所述目标文本的情感向量；

7.根据权利要求6所述的装置，其特征在于，所述装置还包括模型训练模块，所述模型训练模块用于训练所述语义编码模型、所述情感生成模型和所述情感分类模型；所述模型训练模块包括：

模型构建单元，用于构建预设神经网络模型，所述预设神经网络模型包括预设语义编码模型、预设情感生成模型和预设情感分类模型，所述预设语义编码模型包括基于自注意力的第三神经网络，所述预设情感生成模型包括基于自注意力的第一神经网络和注意力网络，所述预设情感分类模型包括第二神经网络和分类网络；

训练文本集获取单元，用于获取训练文本集，所述训练文本集包括多个训练文本及其对应的情感标签；

模型训练单元，用于使用所述训练文本集中的训练文本对所述预设神经网络模型进行训练，在训练过程中调整所述预设语义编码模型、所述预设情感生成模型和所述预设情感分类模型的模型参数至所述预设神经网络模型的输出结果与训练文本的情感标签相匹配，得到所述语义编码模型、所述情感生成模型和所述情感分类模型。

8.根据权利要求7所述的装置，其特征在于，所述第一神经网络包括双向长短时记忆网络或者卷积神经网络，所述第二神经网络包括多层感知机网络或者卷积神经网络，所述第三神经网络包括双向长短时记忆网络、循环神经网络或者卷积神经网络。

9.一种电子设备，其特征在于，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如权利要求1-5任意一项所述的文本情感分类方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或至少一段程序由处理器加载并执行以实现如权利要求1-5任意一项所述的文本情感分类方法。