WO2024114382A1

WO2024114382A1 - 文本分析方法、情感分类模型、装置、介质、终端及产品

Info

Publication number: WO2024114382A1
Application number: PCT/CN2023/131788
Authority: WO
Inventors: 张静如
Original assignee: 蚂蚁财富(上海)金融信息服务有限公司
Priority date: 2022-11-28
Filing date: 2023-11-15
Publication date: 2024-06-06
Also published as: CN115828889A

Abstract

本说明书实施例提供了一种文本分析方法、情感分类模型、文本分析装置、计算机可读存储介质、终端以及计算机程序产品。该方法包括：对文本中的目标语句进行编码，得到目标语句中每个词对应的目标词向量。之后，对目标词向量的上下文语义特征进行提取，得到目标词向量对应的特征向量。根据对特征向量的分类结果得到目标语句的情感语义类型。最后根据目标语句的情感语义类型以及目标语句中的关键词，得到对目标语句的分析结果。

Description

文本分析方法、情感分类模型、装置、介质、终端及产品

技术领域

本说明书实施例涉及自然语言处理技术领域，尤其涉及一种文本分析方法、情感分类模型、文本分析装置、计算机可读存储介质、终端以及计算机程序产品。

背景技术

在理财应用平台中，理财师作为平台和用户之间的重要桥梁，对客户表述的投顾观点往往会在很大程度上影响用户的理财决策，而用户的体验和投资收益也会成为维持用户粘性的重要因素。因此，现在大多数平台都会通过机器模型等手段来对理财师所提供的投顾观点进行分析，以更好地对投顾观点和理财产品进行改善。

现阶段对于投顾观点的分析方法还需要更加准确高效的方案来实现。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本说明书的背景的理解，因此可以包括不构成对本领域普通技术人员已知的相关技术的信息。

发明内容

本说明书实施例的目的在于提供一种文本分析方法、情感分类模型、文本分析装置、计算机可读存储介质、终端以及计算机程序产品，至少能够在一定程度上提高对文本的特征提取效果和情感语义提取效果。

本说明书实施例的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本说明书的实践而习得。

根据本说明书实施例的第一个方面，提供一种文本分析方法，上述方法包括：对文本中的目标语句进行编码，得到上述目标语句中每个词对应的目标词向量；对上述目标词向量的上下文语义特征进行提取，得到上述目标词向量对应的特征向量；对上述特征向量进行分类处理，以得到上述目标语句的情感语义类型；根据上述目标语句的情感语义类型以及上述目标语句中的关键词，得到对上述目标语句的分析结果。

在本说明书一个实施例中，上述对上述特征向量进行分类处理，以得到上述目标语句的情感语义类型，包括：通过注意力机制确定上述特征向量在上述目标语句中的权重，得到加权后的特征向量；对上述加权后的特征向量进行分类处理，以得到上述目标语句的情感语义类型。

在本说明书一个实施例中，上述对上述加权后的特征向量进行分类处理，以得到上述目标语句的情感语义类型，包括：对上述加权后的特征向量进行降维处理，得到降维后的特征向量；将上述降维后的特征向量输入至分类器中，并根据上述分类器的输出结果得到上述目标语句的情感语义类型。

在本说明书一个实施例中，上述对文本中的目标语句进行编码，得到上述目标语句中每个词对应的目标词向量，包括：通过情感分类模型中的预训练的语言表示模型，对文本中的目标语句进行编码，得到上述目标语句中每个词对应的目标词向量；上述对上述目标词向量的上下文语义特征进行提取，得到上述目标词向量对应的特征向量，包括：通过上述情感分类模型中的双向门控循环单元，对上述目标词向量的上下文语义特征进行提取，得到上述目标词向量对应的特征向量；在上述根据上述目标语句的情感语义类型以及上述目标语句中的关键词，得到对上述目标语句的分析结果之前，上述方法还包括：通过预设词典确定上述目标语句中的关键词。

在本说明书一个实施例中，在上述将文本中的目标语句输入至情感分类模型中之前，上述方法还包括：对待训练的情感分类模型进行训练，以确定上述情感分类模型；其中，上述对待训练的情感分类模型进行训练，以确定上述情感分类模型，包括：获取N个样本语句，并根据上述N个样本语句中第n样本语句的实际情感语义类型，对上述第n样本语句进行标注，得到第n标注语句，其中，N为正整数，n为小于等于N的正整数；通过上述预训练的语言表示模型，对上述第n标注语句进行编码，得到上述第n标注语句中M个词对应的M个词向量，其中，M为正整数；通过上述双向门控循环单元，对上述M个词向量的上下文语义特征进行提取，得到上述M个词向量对应的M个特征向量；对上述M个特征向量进行分类处理，以得到上述第n样本语句的预测情感语义类型；根据上述实际情感语义类型和上述预测情感语义类型确定上述待训练的情感分类模型的损失函数，并根据上述损失函数优化上述待训练的情感分类模型中的参数，以确定上述情感分类模型。

在本说明书一个实施例中，上述对上述M个特征向量进行分类处理，以得到上述第n样本语句的预测情感语义类型，包括：通过上述注意力机制确定上述M个特征向量在上述第n样本语句中的权重，得到M个加权特征向量；对上述M个加权特征向量进行分类处理，以得到上述第n样本语句的预测情感语义类型。

在本说明书一个实施例中，上述对上述M个加权特征向量进行分类处理，以得到上述第n样本语句的预测情感语义类型，包括：对上述M个加权特征向量进行降维处理，得到M个降维特征向量；将上述M个降维特征向量输入至上述分类器中，并根据上述分类器的输出结果得到上述第n样本语句的预测情感语义类型。

根据本说明书实施例的第二个方面，提供一种情感分类模型，上述模型包括：预训练的语言表示模型，用于对文本中的目标语句进行编码，得到上述目标语句中每个词对应的目标词向量；双向门控循环单元，用于对上述目标词向量的上下文语义特征进行提取，得到上述目标词向量对应的特征向量；输出层，用于对上述特征向量进行分类处理，以得到上述目标语句的情感语义类型。

根据本说明书实施例的第三个方面，提供一种文本分析装置，上述装置包括：情感分类模块，用于：通过情感分类模型中的预训练的语言表示模型，对文本中的目标语句进行编码，得到上述目标语句中每个词对应的目标词向量；通过上述情感分类模型中的双向门控循环单元，对上述目标词向量的上下文语义特征进行提取，得到上述目标词向量对应的特征向量；通过上述情感分类模型对上述特征向量进行分类处理，以得到上述目标语句的情感语义类型；分析结果确定模块，用于：确定上述目标语句中的关键词，并根据上述目标语句的情感语义类型以及上述目标语句中的关键词，得到对上述目标语句的分析结果。

根据本说明书实施例的第四个方面，提供一种终端，包括：存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序，上述处理器执行上述计算机程序时实现上述第一个方面所述的文本分析方法。

根据本说明书实施例的第五个方面，提供一种计算机可读存储介质，其上存储有计算机程序，上述计算机程序被处理器执行时实现上述第一个方面所述的文本分析方法。

根据本说明书实施例的第六个方面，提供一种计算机程序产品，当上述计算机程序产品在计算机或处理器上运行时，使得上述计算机或处理器执行时实现上述第一个方面所述的文本分析方法。

本说明书的实施例所提供的文本分析方法、情感分类模型、文本分析装置、计算机可读存储介质、终端以及计算机程序产品，具备以下技术效果：本说明书示例性的实施例提供的方案适用于对文本语句的浅层特征提取以及深层上下文特征提取，以实现对文本的情感分类和观点分析。具体地，对文本中的目标语句进行编码，得到目标语句中每个词对应的目标词向量。然后，对目标词向量的上下文语义特征进行提取，得到目标词向量对应的特征向量。之后，对特征向量进行分类处理，并根据分类结果得到目标语句的情感语义类型。最后，根据目标语句的情感语义类型以及目标语句中的关键词，得到对目标语句的分析结果。从而实现对文本的观点挖掘，并提高对观点的挖掘效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本说明书。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本说明书的实施例，并与说明书一起用于解释本说明书的原理。显而易见地，下面描述中的附图仅仅是本说明书的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本说明书一示例性的实施例提供的文本分析方法的示意性流程图；

图2是本说明书一示例性的实施例提供的情感分类模型的示意性结构图；

图3是本说明书一示例性的实施例提供的预训练的语言表示模型的示意性结构图；

图4是本说明书一示例性的实施例提供的双向门控单元的示意性结构图；

图5是本说明书一示例性的实施例提供的特征向量分类方法的示意性流程图；

图6是本说明书一示例性的实施例提供的情感分类模型的训练方法的示意性流程图；

图7是本说明书一示例性的实施例提供的文本分析装置的示意性结构图；

图8是本说明书另一示例性的实施例提供的文本分析装置的示意性结构图；

图9是本说明书一示例性的实施例提供的终端的示意性框图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚，下面将结合附图对本说明书实施例方式作进一步地详细描述。

下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反，它们仅是如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。

在本说明书的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本说明书中的具体含义。此外，在本说明书的描述中，除非另有说明，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

观点挖掘或情感分析旨在从文本中挖掘出人们所表达的观点或情感，以识别出人们所谈论的主题以及针对该主题所表达出的情感倾向等。

传统的观点挖掘或情感分析主要基于情感词典和机器学习模型，但这些方法需要大量的人工干预。并且，在新词频出的信息大***时代下，很难构建完备的情感词典；传统机器学习模型则面临数据特征稀疏、泛化能力不足等问题，无法很好地抽取文本中包含的情感信息。

针对上述问题，本说明书实施例提供了一种文本分析方法、情感分类模型、装置、介质及终端，下面，将结合附图及实施例对本示例实施方式中的文本分析方法的各个步骤进行更详细的说明。

其中，图1示意性示出了根据本说明书一示例性的实施例中文本分析方法的流程图，图2示出了本说明书一示例性的实施例中情感分类模型的结构图。情感分类模型可以运用于文本分析方法中。

本说明书实施例将结合图2示出的情感分类模型对图1所示实施例进行详细介绍。

在S110中，对文本中的目标语句进行编码，得到目标语句中每个词对应的目标词向量。

示例性的，理财师与用户在应用平台上沟通时，会生成若干沟通数据。可选的，沟通数据可以通过理财师与用户的聊天记录获取，也可以将理财师与用户的通话内容通过自动语音识别技术(Automatic Speech Recognition，ASR)转换为可识别的文本，等等。本实施例对获取沟通数据的方式不做限制。

示例性的，因为最终的目的是对理财师的观点进行分析，因此，在对沟通数据的获取过程中，主要是对理财师所发表的观点语句进行获取。例如，所获取的文本中的语句有：“相对于其他的理财产品，xxx产品是现在卖的比较好的产品。”，“您可以购买这种相对稳健一点的理财产品，后续的收益虽然不会比现在的投入高很多，但是不会造成亏损。”，“但是这并不代表我不看好xxx企业。”，等等。

示例性的，接下来，可以将所获取的文本输入至图2所示的情感分类模型中。如图2所示，情感分类模型包括输入层、嵌入层、双向门控单元层、注意力机制层、以及输出层。

示例性的，其中，嵌入层包括预训练的语言表示模型，预训练的语言表示模型，用于对文本中的目标语句进行编码，得到目标语句中每个词对应的目标词向量。双向门控循环单元，用于对目标词向量的上下文语义特征进行提取，得到目标词向量对应的特征向量。输出层，用于对特征向量进行分类处理，以得到目标语句的情感语义类型。

下面以文本中的其中一个目标语句为例对具体的文本分析方法以及情感分类模型进行说明。

示例性的，如图2所示，假设目标语句中共有M个目标词，并将目标语句中的目标词记为W1、W2、W3、……Wm-2、Wm-1、Wm，其中，m取值为1至M的每一个正整数。将目标语句输入至嵌入层后，可以使用通过嵌入层对目标语句中的目标词进行编码，从而得到目标词对应的目标词向量。在嵌入层所使用的模型可以为预训练的语言表示模型，即BERT预训练模型。

示例性的，参考图3所示的预训练的语言表示模型的结构图。BERT预训练模型首先会对目标语句进行分词处理，并通过词嵌入(Token Embeddings)、段嵌入(Segment Embeddings)、以及位置嵌入(Position Embeddings)得到目标词对应的输入表征W₁、W₂、……、W_m。然后通过多个编码器(Transformer)得到目标词对应的目标词向量e₁、e₂、……、e_m。BERT预训练模型中只保留了原始Transformer的编码部分(Encoder)。使用多个Transformer实现双向编码，可以使得BERT预训练模型所输出的目标词向量能够尽可能地全面、准确地刻画输入目标语句的整体信息，能够处理一词多义的情况，并能配合上下文语境实现目标词向量的动态调整，提高对目标语句的浅层语义信息的提取效果。

在S120中，对目标词向量的上下文语义特征进行提取，得到目标词向量对应的特征向量。

示例性的，如图2所示，在得到上述目标词向量后，将它们输入至双向门控单元(Bidirectional Gated Recurrent Unit，BiGRU)层中。参考图4所示的双向门控单元的结构图。如图4所示，BiGRU模型中包括正向GRU和反向GRUGRU 单元保留了长短期记忆(Long Short-Term Memory，LSTM)对解决循环神经网络(Recurrent Neural Network，RNN)梯度消失问题的优点，并且内部结构更简单，参数减少了1/3，收敛时间和需要的迭代次数上也相对更胜一筹。

示例性的，其中，正向GRU用于处理正向目标语句(即正向排列的目标语句)的正向信息，反向GRU用于处理反向目标语句(即反向排列的目标语句，但目标词本身不反向)的反向信息，在每一时刻，输入会同时提供两个方向相反的GRU，而输出则由这两个GRU共同决定。通过BiGRU可以提取目标词向量对应的深层次的上下文语义特征，得到对应的特征向量，即特征向量中既包含目标词的上文信息(正向信息)，也包含目标词的下文信息(反向信息)。

示例性的，如图4所示，以时刻t为例，其输出结果h_t由正向GRU和反向GRU的输出连接组成，计算方法可参考公式(1)-(4)：
x_t＝W_ee_t，t∈[1,M] (1)

其中，t取值为1至M的每一个正整数，W_e为BiGRU的权重矩阵，x_t为根据目标词向量e_t得到的BiGRU的输入向量，表示在t时刻下正向传播的隐状态，表示在t时刻下反向传播的隐状态，最终输出的特征向量h_t由和拼接而成，其中包含目标词向量e_t的双向语义信息，即上下文语义信息。

在S130中，对特征向量进行分类处理，以得到目标语句的情感语义类型。

一种可能的场景中，情感分类模型可以根据图5所示的流程图实现步骤S130的过程。该过程包括步骤S510步骤S530。

S510，通过注意力机制确定特征向量在目标语句中的权重，得到加权后的特征向量。

示例性的，如图2所示，由BiGRU层得到目标词向量对应的特征向量h₁、h₂、h₃、……h_m-2、h_m-1、h_m之后，将特征向量输入至注意力机制(Attention)层中。注意力机制是一种类似人脑的注意力资源分配机制，由于每个特征向量对目标语句的分类任务的重要性不同，例如，对于投顾观点的分类，“收益”会比“考虑”的重要性更高，因此，可以通过注意力机制来计算每个特征向量的重要性α₁、α₂、α₃、……α_m，从而为特征向量分配相应的权重，得到加权后的特征向量。对重要性较高的特征向量分配更高的权重，从而在分类器进行分类时，重要性较高的特征向量可以获得更多的关注，提高情感分类模型的分类效果。

示例性的，对于特征向量的权重的计算方法，可参考公式(4)-(6)：
u_t＝tanh(ω_wh_t+b_w)，t∈[1,M] (4)

V＝∑tα_th_t (6)

其中，ω_w和b_w为注意力机制的可调节权重和偏置项，h_t为上述特征向量，u_t为h_t的隐含状态，u_w为Softmax分类器的权重参数，α_t用于计算特征向量的重要性，V即为加权后的特征向量。

示例性的，BiGRU-Attention结构可以利用注意力机制获取目标语句中最重要的信息，且在学习长距离语义上优于文本卷积神经网络(TextCNN)，并且可以提高情感分类模型的分类效果。

S520，对加权后的特征向量进行降维处理，得到降维后的特征向量。

示例性的，接下来可以将加权后的特征向量输入至全连接层(Dense Layer)中，以进行降维处理，并得到降维后的特征向量。

S530，将降维后的特征向量输入至分类器中，并根据分类器的输出结果得到目标语句的情感语义类型。

示例性的，如图2所示，得到降维后的特征向量后，将其输入至输出层中的Softmax分类器中，从而得到情感分类模型的最终情感分类结果，即目标语句的情感语义类型，其中，情感语义类型可以包括“看好”、“不看好”、“中立”、“非观点”等等，情感语义类型可以根据具体的应用场景进行设定，本实施例对情感语义类型的内容不做限制。

示例性的，Softmax分类器的计算公式可参考公式(7)：
p＝softmax(ω₀V+b₀) (7)

其中，ω₀为权重系数矩阵，b₀为偏置矩阵，p为输出的情感语义类型。

在S140中，根据目标语句的情感语义类型以及目标语句中的关键词，得到对目标语句的分析结果。

示例性的，通过上述目标语句的情感语义类型可以得知理财师所表达的情感语义。例如，对于目标语句“相对于其他的理财产品，xxx产品是现在卖的比较好的产品。”，将其输入至情感分类模型中，所得到的情感分类结果可能为“看好”，由此便可以得知理财师所表达的情感语义是积极的。

示例性的，除了得知理财师所表达的情感语义之外，还可以对理财师所发表的目标语句中的关键词进行获取。对于投顾场景，关键词可以包括基金产品、基金经理等等。关键词可以通过预设词典来进行识别与提取，预设词典可以根据具体的应用场景进行预先构建，例如，为投顾场景所构建的预设词典中，可以包括大量的与投顾场景相关的词汇。需要说明的是，对目标语句中关键词的提取方法可以通过深度神经网络实现，例如，循环神经网络(Recurrent Neural Network，RNN)、长短时记忆网络LSTM(Long-Short Term Memory)等等，本实施例中对关键词的提取方法不做限制。

示例性的，对于目标语句“相对于其他的理财产品，xxx产品是现在卖的比较好的产品。”，通过预设词典对该目标语句进行关键词的识别与提取后，所得到关键词可能为“xxx产品”等。

示例性的，在得到目标语句的情感类型以及关键词后，便可以对理财师的投顾观点进行整体的分析。例如，对于上述目标语句“相对于其他的理财产品，xxx产品是现在卖的比较好的产品。”，其情感类型为“看好”，关键词为“xxx产品”，那么便可以根据这两个结果分析得到理财师的投顾观点为“对xxx产品看好/对xxx产品持积极态度”。

示例性的，另外，通过本说明书所提供的文本分析方法，还可以构建能够执行该方法的文本分析***，该***可以运行于终端中，从而可以通过该***对理财师的观点和应用平台所提供的预设观点等进行离线批量分析以及在线实时分析。并且，还可以对观点分析结果以及观点中所涉及的理财产品进行跟踪与召回，从而有针对性地对理财师的分析效果和理财产品进行改善。从而可以提升理财应用平台中的投顾业务的水平和质量，提高并维持用户粘性。

本说明书还提供了一种情感分类模型的训练方法。具体的训练过程请参考图6所示实施例。

S610，获取N个样本语句，并根据N个样本语句中第n样本语句的实际情感语义类型，对第n样本语句进行标注，得到第n标注语句，其中，N为正整数，n为小于等于N的正整数。

示例性的，对于训练样本，同样可以通过理财师与用户的聊天记录获取，也可以将理财师与用户的通话内容通过自动语音识别技术(Automatic Speech Recognition，ASR)转换为可识别的文本，等等。本实施例对获取训练样本的方式不做限制。进一步的，可以将训练样本以语句为单位进行划分，得到N个样本语句。

示例性的，之后，再对N个样本语句中的第n样本语句进行标注，以确定第n样本语句的实际情感语义类型，其中，n取值为1至N的每一个正整数。例如，对于投顾场景，可以将实际情感语义类型分为“看好”、“不看好”、“中立”、“非观点”等等，并对每一种实际情感语义类型设定相应的情感标签(label)。例如，“看好”对应的标签可以为“3”，“不看好”对应的标签可以为“2”，“中立”对应的标签可以为“1”，“非观点”对应的标签可以为“0”。实际情感语义类型及其标签可以根据具体的应用场景进行设定，本实施例对情感语义类型的内容不做限制。

示例性的，对第n样本语句进行标注后，可以将所得到的第n标注语句通过输入层输入至情感分类模型中。

S620，通过预训练的语言表示模型，对第n标注语句进行编码，得到第n标注语句中M个词对应的M个词向量，其中，M为正整数。

示例性的，接下来，可以通过嵌入层中的BERT预训练模型对第n标注语句进行编码，以得到第n标注语句中M个词对应的M个词向量。

S630，通过双向门控循环单元，对M个词向量的上下文语义特征进行提取，得到M个词向量对应的M个特征向量。

示例性的，得到M个词向量后，将它们输入至BiGRU层中，以通过BiGRU对M个词向量的上下文语义特征进行提取，得到M个词向量对应的M个特征向量，特征向量中包含词向量的上下文语义信息。

S640，对M个特征向量进行分类处理，以得到第n样本语句的预测情感语义类型。

示例性的，得到M个特征向量后，将特征向量输入至注意力机制层中，以根据M个特征向量在第n标注语句中的重要性，来对M个特征向量分配对应的权重，最终得到M个加权特征向量。

示例性的，接下来，可以将M个加权特征向量输入至全连接层中，以对M个加权特征向量进行降维处理，得到M个降维特征向量。之后，再将M个降维特征向量输入至Softmax分类器中，并根据分类器的输出结果得到第n样本语句的预测情感语义类型。

示例性的，对于情感分类模型中上述各层的具体执行过程可以参考图1至图5所示的实施例，本实施例中不再赘述。

S650，根据实际情感语义类型和预测情感语义类型确定待训练的情感分类模型的损失函数，并根据损失函数优化待训练的情感分类模型中的参数，以确定情感分类模型。

示例性的，第n样本语句的预测情感语义类型可能与实际情感语义类型相同，也可能与实际情感语义类型不同。例如，假设对第n标注语句所标注的实际情感语义类型的情感标签为“3”，那么情感分类模型所输出的预测情感语义类型的情感标签可能为“3”，也可能为“2”等其他情感标签。即情感分类模型对于第n标注语句的分类可能具有一定的误差。因此，还需要根据预测情感语义类型和实际情感语义类型来对情感分类模型进行进一步的优化，以提高情感语义的分类效果。

示例性的，可以计算预测情感语义类型和实际情感语义类型的交叉熵，并通过最小化交叉熵的方法来优化情感分类模型中的相关参数，从而确定情感分类模型。交叉熵的计算公式可参考公式(8)：

其中，D为训练数据集，C为情感标签的类型数，y为实际情感语义类型，为预测情感语义类型，λ为L₂正则化，θ为可设置的参数。

本说明书实施例所提供的文本分析方法以及运用于文本分析方法的情感分类模型，对文本中的目标语句进行编码，得到目标语句中每个词对应的目标词向量，而对文本语句的浅层特征进行提取。然后，对目标词向量的上下文语义特征进行提取，得到目标词向量对应的特征向量，从而对文本语句的深层上下文特征进行提取。之后，对特征向量进行分类处理，并根据分类结果得到目标语句的情感语义类型。最后，根据目标语句的情感语义类型以及目标语句中的关键词，得到对目标语句的分析结果。从而实现对文本的观点挖掘，并提高对观点的挖掘效果。

下述为本说明书装置实施例，可以用于执行本说明书方法实施例。对于本说明书装置实施例中未披露的细节，请参照本说明书方法实施例。

其中，图7示出了根据本说明书一示例性的实施例中文本分析装置的结构图。

本说明书实施例中的文本分析装置700包括：情感分类模块710，以及分析结果确定模块720，其中：情感分类模块710，用于：通过情感分类模型中的预训练的语言表示模型，对文本中的目标语句进行编码，得到目标语句中每个词对应的目标词向量；通过情感分类模型中的双向门控循环单元，对目标词向量的上下文语义特征进行提取，得到目标词向量对应的特征向量；通过情感分类模型对特征向量进行分类处理，以得到目标语句的情感语义类型；分析结果确定模块720，用于：确定目标语句中的关键词，并根据目标语句的情感语义类型以及目标语句中的关键词，得到对目标语句的分析结果。

其中，图8示出了根据本说明书另一示例性的实施例中文本分析装置的结构图。

一种可能的实现方式中，上述情感分类模块710具体用于：通过注意力机制确定特征向量在目标语句中的权重，得到加权后的特征向量；对加权后的特征向量进行分类处理，以得到目标语句的情感语义类型。

一种可能的实现方式中，上述情感分类模块710具体用于：对加权后的特征向量进行降维处理，得到降维后的特征向量；将降维后的特征向量输入至分类器中，并根据分类器的输出结果得到目标语句的情感语义类型。

一种可能的实现方式中，上述情感分类模块710具体用于：通过情感分类模型中的预训练的语言表示模型，对文本中的目标语句进行编码，得到目标语句中每个词对应的目标词向量。

一种可能的实现方式中，上述情感分类模块710具体用于：通过情感分类模型中的双向门控循环单元，对目标词向量的上下文语义特征进行提取，得到目标词向量对应的特征向量。

一种可能的实现方式中，上述情感分类模块710具体用于：通过预设词典确定目标语句中的关键词。

可选的，上述装置还包括：训练模块730。在上述情感分类模块710将文本中的目标语句输入至情感分类模型中之前，上述训练模块730用于：对待训练的情感分类模型进行训练，以确定情感分类模型。

一种可能的实现方式中，上述训练模块具体用于：获取N个样本语句，并根据N个样本语句中第n样本语句的实际情感语义类型，对第n样本语句进行标注，得到第n标注语句，其中，N为正整数，n为小于等于N的正整数；通过预训练的语言表示模型，对第n标注语句进行编码，得到第n标注语句中M个词对应的M个词向量，其中，M为正整数；通过双向门控循环单元，对M个词向量的上下文语义特征进行提取，得到M个词向量对应的M个特征向量；对M个特征向量进行分类处理，以得到第n样本语句的预测情感语义类型；根据实际情感语义类型和预测情感语义类型确定待训练的情感分类模型的损失函数，并根据损失函数优化待训练的情感分类模型中的参数，以确定情感分类模型。

一种可能的实现方式中，上述训练模块具体用于：通过注意力机制确定M个特征向量在第n样本语句中的权重，得到M个加权特征向量；对M个加权特征向量进行分类处理，以得到第n样本语句的预测情感语义类型。

一种可能的实现方式中，上述训练模块具体用于：对M个加权特征向量进行降维处理，得到M个降维特征向量；将M个降维特征向量输入至分类器中，并根据分类器的输出结果得到第n样本语句的预测情感语义类型。

需要说明的是，上述实施例提供的文本分析装置在执行文本分析方法，时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的文本分析装置与文本分析方法实施例属于同一构思，因此对于本说明书装置实施例中未披露的细节，请参照本说明书上述的文本分析方法的实施例，这里不再赘述。

上述本说明书实施例序号仅仅为了描述，不代表实施例的优劣。

本说明书实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前述任一实施例方法的步骤。其中，计算机可读存储介质可以包括但不限于任何类型的盘，包括软盘、光盘、DVD、CD-ROM、微型驱动器以及磁光盘、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、闪速存储器设备、磁卡或光卡、纳米***(包括分子存储器IC)，或适合于存储指令和/或数据的任何类型的媒介或设备。

本说明书实施例还提供了一种终端，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时实现上述任一实施例方法的步骤。

图9示意性示出了根据本说明书一示例性的实施例中终端的结构图。请参见图9所示，终端900包括有：处理器901和存储器902。

本说明书实施例中，处理器901为计算机***的控制中心，可以是实体机的处理器，也可以是虚拟机的处理器。处理器901可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器901可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field－Programmable GateArray，FPGA)、可编程逻辑阵列 (ProgrammableLogic Array，PLA)中的至少一种硬件形式来实现。处理器901也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称中央处理器(CentralProcessing Unit，CPU)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。

在本说明书实施例中，上述处理器901具体用于：对文本中的目标语句进行编码，得到上述目标语句中每个词对应的目标词向量；对上述目标词向量的上下文语义特征进行提取，得到上述目标词向量对应的特征向量；对上述特征向量进行分类处理，以得到上述目标语句的情感语义类型；根据上述目标语句的情感语义类型以及上述目标语句中的关键词，得到对上述目标语句的分析结果。

进一步地，在本说明书一个实施例中，上述处理器901具体用于：通过注意力机制确定上述特征向量在上述目标语句中的权重，得到加权后的特征向量；对上述加权后的特征向量进行分类处理，以得到上述目标语句的情感语义类型。

可选的，上述处理器901具体用于：对上述加权后的特征向量进行降维处理，得到降维后的特征向量；将上述降维后的特征向量输入至分类器中，并根据上述分类器的输出结果得到上述目标语句的情感语义类型。

可选的，上述处理器901具体用于：通过情感分类模型中的预训练的语言表示模型，对文本中的目标语句进行编码，得到上述目标语句中每个词对应的目标词向量。

可选的，上述处理器901具体用于：通过上述情感分类模型中的双向门控循环单元，对上述目标词向量的上下文语义特征进行提取，得到上述目标词向量对应的特征向量。

可选的，上述处理器901还具体用于：通过预设词典确定上述目标语句中的关键词。

可选的，上述处理器901还具体用于：对待训练的情感分类模型进行训练，以确定上述情感分类模型。

可选的，上述处理器901具体用于：获取N个样本语句，并根据上述N个样本语句中第n样本语句的实际情感语义类型，对上述第n样本语句进行标注，得到第n标注语句，其中，N为正整数，n为小于等于N的正整数；通过上述预训练的语言表示模型，对上述第n标注语句进行编码，得到上述第n标注语句中M个词对应的M个词向量，其中，M为正整数；通过上述双向门控循环单元，对上述M个词向量的上下文语义特征进行提取，得到上述M个词向量对应的M个特征向量；对上述M个特征向量进行分类处理，以得到上述第n样本语句的预测情感语义类型；根据上述实际情感语义类型和上述预测情感语义类型确定上述待训练的情感分类模型的损失函数，并根据上述损失函数优化上述待训练的情感分类模型中的参数，以确定上述情感分类模型。

可选的，上述处理器901具体用于：通过上述注意力机制确定上述M个特征向量在上述第n样本语句中的权重，得到M个加权特征向量；对上述M个加权特征向量进行分类处理，以得到上述第n样本语句的预测情感语义类型。

可选的，上述处理器901具体用于：对上述M个加权特征向量进行降维处理，得到M个降维特征向量；将上述M个降维特征向量输入至上述分类器中，并根据上述分类器的输出结果得到上述第n样本语句的预测情感语义类型。

存储器902可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器902还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储终端、闪存存储终端。在本说明书的一些实施例中，存储器902中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器901所执行以实现本说明书实施例中的方法。

一些实施例中，终端900还包括有：***终端接口903和至少一个***终端。处理器901、存储器902和***终端接口903之间可以通过总线或信号线相连。各个***终端可以通过总线、信号线或电路板与***终端接口903相连。具体地，***终端包括：显示屏904、摄像头905和音频电路906中的至少一种。

***终端接口903可被用于将输入/输出(Input/Output，I/O)相关的至少一个***终端连接到处理器901和存储器902。在本说明书的一些实施例中，处理器901、存储器902和***终端接口903被集成在同一芯片或电路板上；在本说明书的一些其他实施例中，处理器901、存储器902和***终端接口903中的任意一个或两个可以在单独的芯片或电路板上实现。本说明书实施例对此不作具体限定。

显示屏904用于显示用户界面(UserInterface，UI)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏904是触摸显示屏时，显示屏904还具有采集在显示屏904的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器901进行处理。此时，显示屏904还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在本说明书的一些实施例中，显示屏904可以为一个，设置终端900的前面板；在本说明书的另一些实施例中，显示屏904可以为至少两个，分别设置在终端900的不同表面或呈折叠设计；在本说明书的再一些实施例中，显示屏904可以是柔性显示屏，设置在终端900的弯曲表面上或折叠面上。甚至，显示屏904还可以设置成非矩形的不规则图形，也即异形屏。显示屏904可以采用液晶显示屏(Liquid CrystalDisplay，LCD)、有机发光二极管(OrganicLight-EmittingDiode，OLED)等材质制备。

摄像头905用于采集图像或视频。可选地，摄像头905包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及虚拟现实(VirtualReality，VR)拍摄功能或者其它融合拍摄功能。在本说明书的一些实施例中，摄像头905还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路906可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器901进行处理。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端900的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。

电源907用于为终端900中的各个组件进行供电。电源907可以是交流电、直流电、一次性电池或可充电电池。当电源907包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

本说明书实施例中示出的终端结构框图并不构成对终端900的限定，终端900可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

在本说明书中，术语“第一”、“第二”等仅用于描述的目的，而不能理解为指示或暗示相对重要性或顺序；术语“多个”则指两个或两个以上，除非另有明确的限定。术语“安装”、“相连”、“连接”、“固定”等术语均应做广义理解，例如，“连接”可以是固定连接，也可以是可拆卸连接，或一体地连接；“相连”可以是直接相连，也可以通过中间媒介间接相连。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本说明书中的具体含义。

本说明书的描述中，需要理解的是，术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本说明书和简化描述，而不是指示或暗示所指的装置或单元必须具有特定的方向、以特定的方位构造和操作，因此，不能理解为对本说明书的限制。

本说明书实施例还提供了计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机或处理器上运行时，使得计算机或处理器执行上述实施例中的一个或多个步骤。上述文本分析装置的各组成模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取存储介质中。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。上述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行上述计算机程序指令时，全部或部分地产生按照本说明书实施例上述的流程或功能。上述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。上述计算机指令可以存储在计算机可读存储介质中，或者通过上述计算机可读存储介质进行传输。上述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(Digital Subscriber Line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。上述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。上述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，数字多功能光盘(Digital Versatile Disc，DVD))、或者半导体介质(例如，固态硬盘(Solid State Disk，SSD))等。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

以上所述，仅为本说明书的具体实施方式，但本说明书的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本说明书揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本说明书的保护范围之内。因此，依本说明书权利要求所作的等同变化，仍属本说明书所涵盖的范围。

Claims

一种文本分析方法，其中，包括：

对文本中的目标语句进行编码，得到所述目标语句中每个词对应的目标词向量；

对所述目标词向量的上下文语义特征进行提取，得到所述目标词向量对应的特征向量；

对所述特征向量进行分类处理，以得到所述目标语句的情感语义类型；

根据所述目标语句的情感语义类型以及所述目标语句中的关键词，得到对所述目标语句的分析结果。
根据权利要求1所述的文本分析方法，其中，所述对所述特征向量进行分类处理，以得到所述目标语句的情感语义类型，包括：

通过注意力机制确定所述特征向量在所述目标语句中的权重，得到加权后的特征向量；

对所述加权后的特征向量进行分类处理，以得到所述目标语句的情感语义类型。
根据权利要求2所述的文本分析方法，其中，所述对所述加权后的特征向量进行分类处理，以得到所述目标语句的情感语义类型，包括：

对所述加权后的特征向量进行降维处理，得到降维后的特征向量；

将所述降维后的特征向量输入至分类器中，并根据所述分类器的输出结果得到所述目标语句的情感语义类型。
根据权利要求1至3中任意一项所述的文本分析方法，其中，

所述对文本中的目标语句进行编码，得到所述目标语句中每个词对应的目标词向量，包括：

通过情感分类模型中的预训练的语言表示模型，对文本中的目标语句进行编码，得到所述目标语句中每个词对应的目标词向量；

所述对所述目标词向量的上下文语义特征进行提取，得到所述目标词向量对应的特征向量，包括：

通过所述情感分类模型中的双向门控循环单元，对所述目标词向量的上下文语义特征进行提取，得到所述目标词向量对应的特征向量；

在所述根据所述目标语句的情感语义类型以及所述目标语句中的关键词，得到对所述目标语句的分析结果之前，所述方法还包括：

通过预设词典确定所述目标语句中的关键词。
根据权利要求1至3中任意一项所述的文本分析方法，其中，在将文本中的目标语句输入至情感分类模型中之前，所述方法还包括：对待训练的情感分类模型进行训练，以确定所述情感分类模型；

其中，所述对待训练的情感分类模型进行训练，以确定所述情感分类模型，包括：

获取N个样本语句，并根据所述N个样本语句中第n样本语句的实际情感语义类型，对所述第n样本语句进行标注，得到第n标注语句，其中，N为正整数，n为小于等于N的正整数；

对所述第n标注语句进行编码，得到所述第n标注语句中M个词对应的M个词向量，其中，M为正整数；

对所述M个词向量的上下文语义特征进行提取，得到所述M个词向量对应的M个特征向量；

对所述M个特征向量进行分类处理，以得到所述第n样本语句的预测情感语义类型；

根据所述实际情感语义类型和所述预测情感语义类型确定所述待训练的情感分类模型的损失函数，并根据所述损失函数优化所述待训练的情感分类模型中的参数，以确定所述情感分类模型。
根据权利要求5所述的文本分析方法，所述对所述M个特征向量进行分类处理，以得到所述第n样本语句的预测情感语义类型，包括：

通过注意力机制确定所述M个特征向量在所述第n样本语句中的权重，得到M个加权特征向量；

对所述M个加权特征向量进行分类处理，以得到所述第n样本语句的预测情感语义类型。
根据权利要求6所述的文本分析方法，其中，所述对所述M个加权特征向量进行分类处理，以得到所述第n样本语句的预测情感语义类型，包括：

对所述M个加权特征向量进行降维处理，得到M个降维特征向量；

将所述M个降维特征向量输入至所述分类器中，并根据所述分类器的输出结果得到所述第n样本语句的预测情感语义类型。
一种情感分类模型，其中，包括：

预训练的语言表示模型，用于对文本中的目标语句进行编码，得到所述目标语句中每个词对应的目标词向量；

双向门控循环单元，用于对所述目标词向量的上下文语义特征进行提取，得到所述目标词向量对应的特征向量；

输出层，用于对所述特征向量进行分类处理，以得到所述目标语句的情感语义类型。
一种文本分析装置，其中，包括：

情感分类模块，用于：通过情感分类模型中的预训练的语言表示模型，对文本中的目标语句进行编码，得到所述目标语句中每个词对应的目标词向量；通过所述情感分类模型中的双向门控循环单元，对所述目标词向量的上下文语义特征进行提取，得到所述目标词向量对应的特征向量；通过所述情感分类模型对所述特征向量进行分类处理，以得到所述目标语句的情感语义类型；

分析结果确定模块，用于：确定所述目标语句中的关键词，并根据所述目标语句的情感语义类型以及所述目标语句中的关键词，得到对所述目标语句的分析结果。
一种终端，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的文本分析方法。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的文本分析方法。
一种包含指令的计算机程序产品，当所述计算机程序产品在计算机或处理器上运行时，使得所述计算机或处理器执行如权利要求1至7中任一项所述的文本分析方法。