CN111291187B

CN111291187B - 一种情感分析方法、装置、电子设备及存储介质

Info

Publication number: CN111291187B
Application number: CN202010074496.2A
Authority: CN
Inventors: 任鑫涛; 郭豪; 蔡准; 孙悦; 郭晓鹏
Original assignee: Beijing Trusfort Technology Co ltd
Current assignee: Beijing Trusfort Technology Co ltd
Priority date: 2020-01-22
Filing date: 2020-01-22
Publication date: 2023-08-08
Anticipated expiration: 2040-01-22
Also published as: CN111291187A

Abstract

本申请提供了一种情感分析方法、装置、电子设备及存储介质，其中，该方法包括：获取待分析文本；将待分析文本划分为包括目标维度词语的多个待分析词语；基于各待分析词语和训练好的语义提取模型，得到各待分析词语的语义特征向量；基于各语义特征向量，确定目标维度词语对于各待分析词语的注意力权重，基于每个待分析词语的语义特征向量及目标维度词语对于该待分析词语的注意力权重，确定待分析文本的第一向量；基于待分析文本的第一向量及目标维度词语的第二向量，确定与目标维度词语对应的情感分析结果。上述方案利用目标维度词语对各个待分析词语的注意力权重确定目标维度词语与文本上下文之间的关联信息，从而更能完整且准确的进行情感分析。

Description

一种情感分析方法、装置、电子设备及存储介质

技术领域

本申请涉及计算机处理技术领域，具体而言，涉及一种情感分析方法、装置、电子设备及存储介质。

背景技术

随着互联网的高速发展，网络用户数量急剧上涨，人们在信息交互的过程中产生了大量的对诸如人物、事件、产品等有价值的评论信息。例如，在电商、智能旅游、网络约车等领域，用户在消费后会对商品质量、服务等多维度进行评价，各个维度包含了丰富的情感信息，通过对情感信息的挖掘，可以更好的理解用户行为，从而预测出事件的发展方向。

相关情感分析的主要流程一般是，首先针对单条用户评论进行分析，给出其情感极性，然后将全部用户评论的情感极性进行聚合，得到最终的分析结果。但很多用户评论并非单纯的表达一种情感极性。比如，用户在餐后发表的评论，“这个餐厅的气氛很好，菜品的味道不错，就是服务员的态度有些差。”，也即用户从三个维度“环境”、“口味”、“服务”分别进行评价，此时如果只给出该评论的整体情感极性将会产生较大的信息缺失或分析偏差。

发明内容

有鉴于此，本申请的目的在于提供一种情感分析方法、装置、电子设备及存储介质，以提高情感分析的完整度和准确性。

主要包括以下几个方面：

第一方面，本申请提供了一种情感分析方法，所述方法包括：

获取待分析文本；

将所述待分析文本划分为包括目标维度词语的多个待分析词语；

基于各个待分析词语和训练的训练好的循环神经网络语义提取模型，得到针对所述目标维度词语的语义特征向量以及所述多个待分析词语中除所述目标维度词语之外的其它待分析词语的语义特征向量；

基于所述目标维度词语的语义特征向量以及所述其它待分析词语的语义特征向量，确定所述目标维度词语对于各个所述待分析词语的注意力权重，并基于每个待分析词语的语义特征向量及所述目标维度词语对于该待分析词语的注意力权重，确定所述待分析文本对应的第一向量；

基于所述待分析文本的第一向量以及所述目标维度词语的第二向量，确定与所述目标维度词语对应的情感分析结果。

在一种实施方式中，所述基于各个待分析词语和训练的训练好的循环神经网络语义提取模型，得到针对所述目标维度词语的语义特征向量以及所述多个待分析词语中除所述目标维度词语之外的其它待分析词语的语义特征向量，包括：

将各个待分析词语输入至训练的训练好的词向量转换模型中，得到与每个待分析词语对应的词向量；

将各个待分析词语对应的词向量输入至训练的训练好的循环神经网络语义提取模型，得到针对所述目标维度词语的语义特征向量以及所述多个待分析词语中除所述目标维度词语之外的其它待分析词语的语义特征向量。

在一种实施方式中，所述基于所述目标维度词语的语义特征向量以及所述其它待分析词语的语义特征向量，确定所述目标维度词语对于各个所述待分析词语的注意力权重，包括：

针对每个所述待分析词语，基于该待分析词语的语义特征向量以及所述目标维度词语的语义特征向量，确定第一乘积；以及，基于该待分析词语的语义特征向量以及所述目标维度词语的第二向量，确定第二乘积；

确定第一乘积与乘积和值之间的比值；所述乘积和值由各个待分析词语的语义特征向量以及所述目标维度词语的语义特征向量确定；

基于确定的所述比值以及所述第二乘积，确定所述目标维度词语对于每个所述待分析词语的注意力权重。

在一种实施方式中，所述基于每个待分析词语的语义特征向量及所述目标维度词语对于该待分析词语的注意力权重，确定所述待分析文本对应的第一向量，包括：

针对每个待分析词语，将该待分析词语的语义特征向量及所述目标维度词语对于该待分析词语的注意力权重进行乘积运算，得到第三乘积；

将各个待分析词语对应的第三乘积进行求和运算，得到所述待分析文本对应的第一向量。

在一种实施方式中，所述基于所述待分析文本的第一向量以及所述目标维度词语的第二向量，确定与所述目标维度词语对应的情感分析结果，包括：

为所述第一向量和所述第二向量分别赋予第一权重和第二权重；

将所述第一向量与所述第一权重进行乘积运算，得到第四乘积，以及将所述第二向量与所述第二权重进行乘积运算，得到第五乘积；

将所述第四乘积和所述第五乘积进行求和运算，得到所述目标维度词语对应的情感分析结果。

在一种实施方式中，所述方法还包括：训练所述循环神经网络语义提取模型和所述注意力权重的步骤；

其中，所述循环神经网络语义提取模型和所述注意力权重基于获取的各个分析文本样本以及与每个所述分析文本样本中的维度词语对应的文本标注信息训练得到。

第二方面，本申请还提供了一种情感分析装置，所述装置包括：

获取模块，用于获取待分析文本；

划分模块，用于将所述待分析文本划分为包括目标维度词语的多个待分析词语；

生成模块，用于基于各个待分析词语和训练的训练好的循环神经网络语义提取模型，得到针对所述目标维度词语的语义特征向量以及所述多个待分析词语中除所述目标维度词语之外的其它待分析词语的语义特征向量；

确定模块，用于基于所述目标维度词语的语义特征向量以及所述其它待分析词语的语义特征向量，确定所述目标维度词语对于各个所述待分析词语的注意力权重，并基于每个待分析词语的语义特征向量及所述目标维度词语对于该待分析词语的注意力权重，确定所述待分析文本对应的第一向量；

分析模块，用于基于所述待分析文本的第一向量以及所述目标维度词语的第二向量，确定与所述目标维度词语对应的情感分析结果。

在一种实施方式中，所述装置还包括：

训练模块，用于训练所述循环神经网络语义提取模型和所述注意力权重；

第三方面，本申请还提供了一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当所述电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述处理器执行所述机器可读指令时实现如第一方面及其各种实施方式任一所述的情感分析方法的步骤。

第四方面，本申请还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现如第一方面及其各种实施方式任一所述的情感分析方法的步骤。

采用上述方案，首先可以将待分析文本划分为包括目标维度词语的多个待分析词语，并可以基于划分后的各个待分析词语以及训练好的循环神经网络语义提取模型，得到针对所述目标维度词语的语义特征向量以及所述多个待分析词语中除所述目标维度词语之外的其它待分析词语的语义特征向量，然后可以基于所述目标维度词语的语义特征向量以及所述其它待分析词语的语义特征向量，确定所述目标维度词语对于各个所述待分析词语的注意力权重，并基于每个待分析词语的语义特征向量及所述目标维度词语对于该待分析词语的注意力权重，确定所述待分析文本对应的第一向量，最后基于所述待分析文本的第一向量以及所述目标维度词语的第二向量，确定与所述目标维度词语对应的情感分析结果。也即，本申请在对待分析文本进行情感分析时，利用目标维度词语对各个待分析词语的注意力权重确定目标维度词语与文本上下文之间的关联信息，从而更能完整且准确的进行情感分析。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例一所提供的一种情感分析方法的流程图；

图2示出了本申请实施例一所提供的另一种情感分析方法的流程图；

图3示出了本申请实施例一所提供的另一种情感分析方法的流程图；

图4示出了本申请实施例一所提供的另一种情感分析方法的流程图；

图5示出了本申请实施例一所提供的一种情感分析方法的应用示意图；

图6示出了本申请实施例二所提供的一种情感分析装置的结构示意图；

图7示出了本申请实施例三所提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

考虑到相关技术中的情感分析，首先针对单条用户评论进行分析，给出其情感极性，然后将全部用户评论的情感极性进行聚合，得到最终的分析结果。但很多用户评论并非单纯的表达一种情感极性，此时如果只给出该评论的整体情感极性将会产生较大的信息缺失或分析偏差。基于此，本申请实施例提供了至少一种情感分析方案，以提高情感分析的完整度和准确性。

为便于对本实施例进行理解，首先对本申请实施例所申请的一种情感分析方法进行详细介绍，本申请实施例所提供的情感分析方法的执行主体一般为具有一定计算能力的电子设备，该电子设备例如包括：终端设备或服务器或其它处理设备，终端设备可以为用户设备(User Equipment，UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant，PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中，该情感分析方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。

下面以执行主体为服务器为例对本申请实施例提供的情感分析方法加以说明。

实施例一

参照图1，为本申请实施例提供的一种情感分析方法的流程图，该方法具体包括如下步骤：

S101、获取待分析文本；

S102、将待分析文本划分为包括目标维度词语的多个待分析词语；

S103、基于各个待分析词语和训练好的语义提取模型，得到针对目标维度词语的语义特征向量以及多个待分析词语中除目标维度词语之外的其它待分析词语的语义特征向量；

S104、基于目标维度词语的语义特征向量以及其它待分析词语的语义特征向量，确定目标维度词语对于各个待分析词语的注意力权重，并基于每个待分析词语的语义特征向量及目标维度词语对于该待分析词语的注意力权重，确定待分析文本对应的第一向量；

S105、基于待分析文本的第一向量以及目标维度词语的第二向量，确定与目标维度词语对应的情感分析结果。

这里，本申请实施例在训练得到语义提取模型之后，即可以基于该语义提取模型进行语义特征向量的提取了，基于提取的语义特征向量即可以确定待分析文本对应的第一向量，这样基于该第一向量即可以进行情感分析了。

本申请实施例在基于语义提取模型进行语义特征向量的提取之前，可以首先对待分析文本进行分词处理，以得到多个待分析词语。为了便于实现情感分析的完整性，本申请实施例在基于语义提取模型进行语义特征向量提取之前，需要对待分析词语中的目标维度词语进行标识，该目标维度词语用于表征待分析文本中能够具有情感分析意图的维度词语，例如，服务质量，物流速度等等。

其中，上述目标维度词语可以有一个，也可以有多个。例如，针对“这件衣服质量非常好，但是物流非常慢”这一待分析文本而言，可以将质量和物流均作为目标维度词语，也即，可以选取意图关注情感分析结果的待分析词语作为目标维度词语。

在确定包括目标维度词语的多个待分析词语之后，即可以基于训练好的语义提取模型，提取得到包括目标维度词语在内的各个待分析词语的语义特征向量。

本申请实施例在提取语义特征向量时，可以首先将各个待分析词语输入至训练好的词向量转换模型，而后再基于训练好的语义提取模型提取语义特征向量。

其中，在获取到各个待分析词语之后，可以基于数学化的方法word2vec，将作为自然语言的待分析词语转化为向量形式的数字信息，以便于机器识别，此过程称为编码(Encoder)。也即，采用词向量转换模型转换得到的词向量来表示一个词，然后将该词向量作为语义提取模型的输入特征。

本申请实施例可以采用的词向量转换模型主要有两种，一种是基于一次性表示(One-hot Representation)的词向量转换模型，另一种是基于分布式表示(DistributedRepresentation)的词向量转换模型。

其中，前一种词向量转换模型用一个很长的向量来表示一个词，向量长度为词典的词量大小N，每个向量只有一个维度为1，其余维度全部为0，为1的位置表示该词语在词典中的位置。也即，前一种词向量转换模型是采用稀疏方式存储词信息，也就是给每个词分配一个数字标识，表示形式相对简洁。后一种词向量转换模型则需要根据上下文信息进行语义表示，也即，相同语境出现的词，其语义也相近。也即，后一种词向量转换模型是采用稠密方式存储词信息，表示形式相对复杂。考虑到前一种基于One-hot Representation的词向量转换模型在解决实际问题时经常会遇到维数灾难，且无法揭示词汇之间的潜在联系，在实际实施中可以采用后一种基于Distributed Representation的词向量转换模型对标签信息进行向量表示，不但避免维数灾难问题，并且挖掘了词汇之间的关联属性，从而提高了语义表达的准确度。

本申请实施例中，在基于词向量转换模型提取到词向量之后，即可以基于训练好的语义提取模型进行语义特征向量的提取了。考虑到语义特征向量的提取过程作为本申请实施例提供的情感分析方法的关键步骤，接下来可以对用于进行语义提取的语义提取模型的训练过程进行简单描述。

在训练语义提取模型之后，需要获取各个分析文本样本以及与每个分析文本样本中的维度词语对应的文本标注信息，本申请实施例中，可以基于维度词语的情感状态进行语义标注，如在确定情感状态可以分为积极情感和消极情感时，可以将积极情感对应标注为1，将消极情感对应标注为0；再如，在确定情感状态可以分为积极情感、消极情感和中性情感时，可以对应标注为1、0、-1。上述语义标注仅为示例，在具体应用时，不仅可以基于上述粗分类进行语义标注，还可以对上述粗分类情感进一步进行细化后再进行语义标注，在此不做具体的限制。

在进行语义标注之后，即可以将基于获取的各个分析文本样本以及与每个分析文本样本中的维度词语对应的文本标注信息对待训练的语义提取模型以及注意力权重进行训练了，有关语义提取模型的训练，即是训练语义提取模型的参数的过程，此外，本申请实施例还可以将注意力权重作为训练参数进行同步训练以使得模型输出的结果与预先标注的信息匹配，从而训练得到语义提取模型和注意力权重。

在具体应用中，语义提取模型将一个输入向量映射为一个输出向量。本申请实施例可以采用一种特殊类型的循环神经网络(Recurrent Neural Networks，RNN)—长短期记忆(Long Short-Term Memory，LSTM)网络进行模型训练，其中，LSTM包含了3种门结构用来控制信息的传输和变化，分别是：输入门，输出门和忘记门。输入门用来控制输入信号所占据的比例，输出门用来控制输出信号所占的比例，忘记门用来控制过去信息被遗忘的比例。三者协同工作，共同控制了LSTM内部的运作方式。每一时刻其接受一个信号输入，同时输出一个信号，并改变其内部的参数状态，是一种非常适合处理序列信息特征的模型。这样，本申请实施例采用LSTM网络通过反复迭代学习，逐渐掌握各种基础知识，并最终学习到如何根据词向量生成一个符合要求的语音特征向量。

本申请实施例提供的情感分析方法在进行模型训练的过程中，为了衡量上述模型输出的结果与预先标注的信息是否匹配，可以采用各种损失函数的表征方式来实现。本申请实施例中，可以采用交叉熵作为损失函数以衡量信息的匹配程度，这主要是考虑到交叉熵损失可以避免由于误差较小所存在的梯度很小而导致无法继续训练的问题，从而使得训练的鲁棒性较好。

考虑到目标维度词语对于待分析文本的情感分析结果的影响，本申请实施例可以基于各个待分析词语的语义特征向量确定目标维度词语对于每个待分析词语的注意力权重，以根据注意力权重确定目标维度词语对应的情感分析结果，本申请实施例中的情感分析结果可以采用积极情感和消极情感这两种情感中的一种，也可以采用积极情感、消极情感、中性情感等三种情感中的一种，也可以采用多种情感中的一种，具体采用哪种分类方式，可以由训练过程中的分类类型来确定，在此不做具体的限制。

这里仍以“这件衣服质量非常好，但是物流非常慢”这一待分析文本为例，如果采用二分类方式，针对质量这一目标维度词语而言，其情感分析结果为积极，针对物流这一目标维度词语而言，其情感分析结果为消极。

本申请实施例中可以基于待分析文本的第一向量以及目标维度词语的第二向量的拼接结果来确定与目标维度词语对应的情感分析结果。其中，有关目标维度词语的第二向量可以是有关目标维度词语的向量表示。有关待分析文本的第一向量，则可以基于每个待分析词语的语义特征向量及目标维度词语对于该待分析词语的注意力权重来确定。

本申请实施例中，可以基于目标维度词语的语义特征向量以及其它待分析词语的语义特征向量，确定上述注意力权重。考虑到注意力权重的确定对于待分析文本对应的第一向量的关键作用，这里，可以结合图2对上述确定注意力权重的过程进行说明。

S201、针对每个待分析词语，基于该待分析词语的语义特征向量以及目标维度词语的语义特征向量，确定第一乘积；以及，基于该待分析词语的语义特征向量以及目标维度词语的第二向量，确定第二乘积；

S202、确定第一乘积与乘积和值之间的比值；乘积和值由各个待分析词语的语义特征向量以及目标维度词语的语义特征向量确定；

S203、基于确定的比值以及第二乘积，确定目标维度词语对于每个待分析词语的注意力权重。

这里，可以针对每个待分析词语，首先可以基于该待分析词语的语义特征向量以及目标维度词语的语义特征向量，确定第一乘积，以及基于该待分析词语的语义特征向量以及目标维度词语的第二向量，确定第二乘积，然后可以确定第一乘积与乘积和值之间的比值，最后可以基于确定的比值以及第二乘积，确定目标维度词语对于每个待分析词语的注意力权重。其中，上述乘积和值由各个待分析词语的语义特征向量以及目标维度词语的语义特征向量确定。

也即，本申请实施例可以基于权重计算策略确定目标维度词语对不同待分析词语的影响，这里仍以“这件衣服质量非常好，但是物流非常慢”这一待分析文本为例，针对“好”这一待分析词语，目标维度词语“质量”对其影响将远远超出其它词语对其影响，从而可以确定出与目标维度词语“质量”最为相关的情感词汇，进一步提升情感分析的准确性。同理，针对“慢”这样待分析词语，目标维度词语“物流”对其影响将远远超出其它词语对其影响，从而可以确定出与目标维度词语“物流”最为相关的情感词汇，可知，本申请实施例不仅可以针对质量这一维度进行情感分析，还可以针对物流这一维度进行情感分析，进一步提升了情感分析的完整性。

在确定目标维度词语对于每个分析词语的注意力权重之后，可以确定待分析文本对应的第一向量。如图3所示，上述第一向量的确定过程具体包括如下步骤：

S301、针对每个待分析词语，将该待分析词语的语义特征向量及目标维度词语对于该待分析词语的注意力权重进行乘积运算，得到第三乘积；

S302、将各个待分析词语对应的第三乘积进行求和运算，得到待分析文本对应的第一向量。

这里，针对每个待分析词语，首先可以将该待分析词语的语义特征向量以及目标维度词语对该待分析词语的注意力权重进行乘积运算，将各个待分析词语对应的第三乘积进行求和运算，以得到待分析文本对应的第一向量，也即，本申请实施例利用加权求和的方式可以得到当前的待分析文本的向量表示，这样，利用该向量表示以及目标维度词语的第二向量之间的拼接结果即可得到最终的语义表示，利用该语义表示即可确定与每个目标维度词语对应的情感分析结果。

其中，如图4所示，本申请实施例利用最终的语义表示确定情感分析结果的过程包括如下步骤：

S401、为第一向量和第二向量分别赋予第一权重和第二权重；

S402、将第一向量与第一权重进行乘积运算，得到第四乘积，以及将第二向量与第二权重进行乘积运算，得到第五乘积；

S403、将第四乘积和第五乘积进行求和运算，得到目标维度词语对应的情感分析结果。

这里，本申请实施例可以首先为待分析文本的第一向量赋予第一权重，并可以为目标维度词语的第二向量赋予第二权重，这样，基于将第一向量与第一权重进行乘积运算，即可得到第四乘积，将第二向量与第二权重进行乘积运算，即可得到第五乘积，然后将第四乘积和第五乘积进行求和运算，即可确定最终的向量表示以得到目标维度词语对应的情感分析结果。

其中，为了确定目标维度词语对应的情感分析结果，这里，可以将最终的向量表示输入至softmax函数中，以得到最终的概率输出，例如，针对二分类而言，确定质量这一目标维度词语对应的积极情感的概率为98％，通过概率阈值的设定，即可确定其情感分析结果为积极情感。

为了便于进一步理解本申请实施例提供的情感分析方法的过程，可以结合图5和如下公式进行具体说明。这里，仍以这件衣服质量非常好，但是物流非常慢作为待分析文本进行说明。

(1)首先输入的待分析文本可以经过分词转化成为词语序列，如图5所示“这件衣服质量非常好，但是物流非常慢”会映射为词向量序列W＝{W₁,W₂,W₃,W₄,W₅,W₆,W₇,W₈,W₉,W₁₀},W∈R^m×n，m为词向量的长度，n为输入文本长度，最终这些词向量可以作为模型参数的一部分随着模型一起训练。其中，有两个维度词语，“质量”和“物流”，每次训练分别对其中一个维度词的情感极性进行训练。

(2)输入的每一个待分析词语经过LSTM网络映射成语义特征向量序列H＝{H₁,H₂,H₃,H₄,H₅,H₆,H₇,H₈,H₉,H₁₀},H∈R^m×n，m为隐藏向量的长度，n为输入文本长度，最终这些向量作为模型参数的一部分随着模型一起训练。

(3)接下来H₁,H₂,H₃,H₄,H₅,H₆,H₇,H₈,H₉,H₁₀可以和其对应的目标词语一起通过注意力机制得到注意力权重α₁,α₂,α₃,α₄,α₅,α₆,α₇,α₈,α₉,α₁₀，注意力权重的计算公式为其中，W_a∈R^m×n表示句子中的维度词语的词向量，H∈R^m×n代表经过LSTM输出的隐藏层向量，m为词向量的长度，n为输入文本长度，H_a表示维度词W_a经过LSTM输出的隐藏层向量，H_i表示输入文本的第i个词W_i经过LSTM输出的隐藏层向量，a∈R^1×1,b∈R^1×1,Q∈R^n×n为参数，α_i代表第i个词的注意力权重，[H^T*Q*W_a]_i表示(H^T*Q*W_a)∈R^m×n向量的第i个位置分量。

(4)在得到隐藏层向量的注意力权重之后，通过注意力权重对隐藏层向量进行加权，得到得到当前文本输入的向量表征形式(即第一向量)，最后将其和维度词语的词向量W_a(即第二向量)通过拼接模块拼接形成词语的完整语义表征T,拼接模块的拼接方式为T＝M₁×H_total+M₂×W_a，其中M₁∈R^m×m,M₂∈R^m×m为参数，m为词向量的长度。

(5)在4步骤中得到待分析文本最终的向量表征T，然后将其输入到softmax函数中，得到最终模型的概率输出。模型可采用交叉熵作为损失函数，公式为：

其中，y_i用于表征真实标识结果，T_i用于表征模型输入结果。

综上，本申请实施例提供的情感分析方法能够同时利用维度词语信息及维度词语与上下文语义信息，提出了一种的网络架构，使得模型在对于词语信息表征方面能够利用到更加全面、完整的词义，也即，提出了基于维度信息的注意力权重生成方式，而舆情监控是依赖对于词义的准确全面的理解，故本申请实施例所采用的相关模型架构有助于提升基于维度词语的舆情监控的准确率。

实施例二

基于同一申请构思，本申请实施例二提供了一种与情感分析方法对应的情感分析装置，由于本申请实施例中的装置解决问题的原理与本申请实施例上述情感分析方法相似，因此装置的实施可以参见方法的实施，重复之处不再赘述。

如图6所示，本申请实施例所提供的情感分析装置，包括：

获取模块601，用于获取待分析文本；

划分模块602，用于将待分析文本划分为包括目标维度词语的多个待分析词语；

生成模块603，用于基于各个待分析词语和训练好的语义提取模型，得到针对目标维度词语的语义特征向量以及多个待分析词语中除目标维度词语之外的其它待分析词语的语义特征向量；

确定模块604，用于基于目标维度词语的语义特征向量以及其它待分析词语的语义特征向量，确定目标维度词语对于各个待分析词语的注意力权重，并基于每个待分析词语的语义特征向量及目标维度词语对于该待分析词语的注意力权重，确定待分析文本对应的第一向量；

分析模块605，用于基于待分析文本的第一向量以及目标维度词语的第二向量，确定与目标维度词语对应的情感分析结果。

在一种实施方式中，确定模块604，用于按照如下步骤确定目标维度词语对于各个待分析词语的注意力权重：

针对每个待分析词语，基于该待分析词语的语义特征向量以及目标维度词语的语义特征向量，确定第一乘积；以及，基于该待分析词语的语义特征向量以及目标维度词语的第二向量，确定第二乘积；

确定第一乘积与乘积和值之间的比值；乘积和值由各个待分析词语的语义特征向量以及目标维度词语的语义特征向量确定；

基于确定的比值以及第二乘积，确定目标维度词语对于每个待分析词语的注意力权重。

在一种实施方式中，确定模块604，用于按照如下步骤确定待分析文本对应的第一向量：

针对每个待分析词语，将该待分析词语的语义特征向量及目标维度词语对于该待分析词语的注意力权重进行乘积运算，得到第三乘积；

将各个待分析词语对应的第三乘积进行求和运算，得到待分析文本对应的第一向量。

在一种实施方式中，分析模块605，用于按照如下步骤确定与目标维度词语对应的情感分析结果：

为第一向量和第二向量分别赋予第一权重和第二权重；

将第一向量与第一权重进行乘积运算，得到第四乘积，以及将第二向量与第二权重进行乘积运算，得到第五乘积；

将第四乘积和第五乘积进行求和运算，得到目标维度词语对应的情感分析结果。

在一种实施方式中，上述装置还包括：

训练模块606，用于训练语义提取模型和注意力权重的步骤；

其中，语义提取模型和注意力权重基于获取的各个分析文本样本以及与每个分析文本样本中的维度词语对应的文本标注信息训练得到。

实施例三

如图7所示，为本申请实施例所提供的一种电子设备的结构示意图，该电子设备包括：处理器701、存储器702和总线703，存储器702存储执行指令，当装置运行时，处理器701与存储器702之间通过总线703通信，处理器701执行存储器702中存储的机器可读指令时实现实施例一所涉及的情感分析方法的步骤。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器701运行时执行情感分析方法的步骤。

具体地，该存储介质能够为通用的存储介质，如移动磁盘、硬盘等，该存储介质上的计算机程序被运行时，能够执行上述情感分析方法，从而解决目前产生较大的信息缺失或分析偏差的问题，进而达到提高情感分析的完整度和准确性的效果。

本申请实施例所提供的情感分析方法的计算机程序产品，包括存储了程序代码的计算机可读存储介质，程序代码包括的指令可用于执行前面方法实施例中的方法，具体实现可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种情感分析方法，其特征在于，所述方法包括：

获取待分析文本；

基于各个待分析词语和训练好的语义提取模型，得到针对所述目标维度词语的语义特征向量以及所述多个待分析词语中除所述目标维度词语之外的其它待分析词语的语义特征向量；

基于所述待分析文本的第一向量以及所述目标维度词语的第二向量，确定与所述目标维度词语对应的情感分析结果；

所述基于所述目标维度词语的语义特征向量以及所述其它待分析词语的语义特征向量，确定所述目标维度词语对于各个所述待分析词语的注意力权重，包括：

基于确定的所述比值以及所述第二乘积，确定所述目标维度词语对于每个所述待分析词语的注意力权重；

所述基于每个待分析词语的语义特征向量及所述目标维度词语对于该待分析词语的注意力权重，确定所述待分析文本对应的第一向量，包括：

将各个待分析词语对应的第三乘积进行求和运算，得到所述待分析文本对应的第一向量；

所述基于所述待分析文本的第一向量以及所述目标维度词语的第二向量，确定与所述目标维度词语对应的情感分析结果，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于各个待分析词语和训练好的语义提取模型，得到针对所述目标维度词语的语义特征向量以及所述多个待分析词语中除所述目标维度词语之外的其它待分析词语的语义特征向量，包括：

将各个待分析词语输入至训练好的词向量转换模型中，得到与每个待分析词语对应的词向量；

将各个待分析词语对应的词向量输入至训练好的语义提取模型，得到针对所述目标维度词语的语义特征向量以及所述多个待分析词语中除所述目标维度词语之外的其它待分析词语的语义特征向量。

3.根据权利要求1～2任一所述的方法，其特征在于，所述方法还包括：训练所述语义提取模型和所述注意力权重的步骤；

其中，所述语义提取模型和所述注意力权重基于获取的各个分析文本样本以及与每个所述分析文本样本中的维度词语对应的文本标注信息训练得到。

4.一种情感分析装置，其特征在于，所述装置包括：

获取模块，用于获取待分析文本；

生成模块，用于基于各个待分析词语和训练好的语义提取模型，得到针对所述目标维度词语的语义特征向量以及所述多个待分析词语中除所述目标维度词语之外的其它待分析词语的语义特征向量；

分析模块，用于基于所述待分析文本的第一向量以及所述目标维度词语的第二向量，确定与所述目标维度词语对应的情感分析结果；

所述确定模块，具体用于：

所述确定模块，还具体用于：

所述分析模块，具体用于：

5.根据权利要求4所述的装置，其特征在于，所述装置还包括：

训练模块，用于训练所述语义提取模型和所述注意力权重；

6.一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当所述电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述处理器执行所述机器可读指令时实现如权利要求1-3任一所述的情感分析方法的步骤。

7.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现如权利要求1-3任一所述的情感分析方法的步骤。