CN108536681A

CN108536681A - 基于情感分析的智能问答方法、装置、设备及存储介质

Info

Publication number: CN108536681A
Application number: CN201810339061.9A
Authority: CN
Inventors: 晁阳; 陆遥; 李东; 孙广元; 郭晓婷; 赵毅; 卫然; 郑滔; 庄夏敏; 严亦佳
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-04-16
Filing date: 2018-04-16
Publication date: 2018-09-14
Anticipated expiration: 2038-04-16
Also published as: CN108536681B

Abstract

本申请公开了一种基于情感分析的智能问答方法、装置、设备及存储介质。方法包括：获取问题文本，对问题文本进行处理，得到处理后的词序列；基于情感词典对词序列进行情感分类，得到问题文本的第一情感分类结果，情感词典包括至少两种情感类别的情感词；调用目标网络模型对问题文本进行序列特征提取及句法结构分析，根据提取的序列特征及分析的句法结构获取问题文本的第二情感分类结果；根据问题文本的第一情感分类结果及第二情感分类结果获取问题文本的综合情感分类结果；根据综合情感分类结果获取问题文本对应的答案文本。基于情感词典及目标网络模型对问题文本的分类结果获取综合情感分类结果，提高了据此得到的答案文本的准确性。

Description

基于情感分析的智能问答方法、装置、设备及存储介质

技术领域

本发明实施例涉及互联网技术领域，特别涉及一种基于情感分析的智能问答方法、装置、设备及存储介质。

背景技术

随着互联网技术的发展，网络产品越来越多。为了提供更符合用户需求的网络产品，情感分析技术的应用越来越广泛。情感分析(Sentiment analysis)，又称倾向性分析，意见抽取(Opinion extraction)，意见挖掘(Opinion mining)，情感挖掘(Sentimentmining)，主观分析(Subjectivity analysis)，它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。由于从文本中挖掘用户表达的观点及情感在网络产品中的作用越来越大，如基于情感分类的智能问答方法中，如何进行准确的情感分析显得尤为重要。

相关技术在基于情感分析进行智能问答时，预先构建情感词典，该情感词典中包括多个情感词，但情感词典中的情感词仅被分为正面和负面两种情感类别的情感词。之后，将问题文本中的词与情感词典中的情感词进行比对，根据文本中所包含的正面情感词和负面情感词的个数进行情感分类，得到情感分析结果，据此得到答案文本。

然而，基于上述的情感分析方法，由于仅依赖于情感字典，且仅采用正、负两方面的情感词，因而情感分析的准确性不高，导致据此得到的答案文本的准确性也不高。

发明内容

本发明实施例提供了一种基于情感分析的智能问答方法、装置、设备及存储介质，可用于解决相关技术中的问题。所述技术方案如下：

一方面，本发明实施例提供一种基于情感分析的智能问答方法，所述方法包括：

获取问题文本，对所述问题文本进行处理，得到处理后的词序列；

基于情感词典对所述词序列进行情感分类，得到所述问题文本的第一情感分类结果，所述情感词典包括至少两种情感类别的情感词；

调用目标网络模型对所述问题文本进行序列特征提取及句法结构分析，根据提取的序列特征及分析的句法结构获取所述问题文本的第二情感分类结果；

根据所述问题文本的第一情感分类结果及第二情感分类结果获取所述问题文本的综合情感分类结果；

根据所述综合情感分类结果获取所述问题文本对应的答案文本。

一方面，提供了一种基于情感分析的智能问答装置，包括：

第一获取模块，用于获取问题文本；

处理模块，用于对所述问题文本进行处理，得到处理后的词序列；

第一分类模块，用于基于情感词典对所述词序列进行情感分类，得到所述问题文本的第一情感分类结果，所述情感词典包括至少两种情感类别的情感词；

第二分类模块，用于调用目标网络模型对所述问题文本进行序列特征提取及句法结构分析，根据提取的序列特征及分析的句法结构获取所述问题文本的第二情感分类结果；

第二获取模块，用于根据所述问题文本的第一情感分类结果及第二情感分类结果获取所述问题文本的综合情感分类结果；

第三获取模块，用于根据所述综合情感分类结果获取所述问题文本对应的答案文本。

一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被所述处理器执行时实现上述的基于情感分析的智能问答方法。

一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被执行时实现上述的基于情感分析的智能问答方法。

本发明实施例提供的技术方案可以带来如下有益效果：

通过基于情感词典及目标网络模型分别对问题文本进行分类处理，并基于二者得到的分类结果获取综合情感分类结果，使得分类结果的准确性更高，进一步提高了据此得到的答案文本的准确性。此外，由于情感词典包括的情感类别较多，因而提高了采用情感词典进行分类的准确性，进一步提高了分类结果及答案文本的准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种实施环境的示意图；

图2是本发明实施例提供的一种界面示意图；

图3是本发明实施例提供的一种界面示意图；

图4是本发明实施例提供的一种基于情感分析的智能问答方法流程图；

图5是本发明实施例提供的一种模型的结构示意图；

图6是本发明实施例提供的一种智能问答交互示意图；

图7是本发明实施例提供的一种界面示意图；

图8是本发明实施例提供的一种基于情感分析的智能问答装置的结构示意图；

图9是本发明实施例提供的一种基于情感分析的智能问答装置的结构示意图；

图10是本发明实施例提供的一种服务器的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

请参考图1，其示出了本发明实施例提供的实施环境的示意图。该实施环境可以包括：终端11和服务器12。

终端11安装有基于情感分析的智能问答类应用客户端，例如，智能问答客户端，智能服务客户端、游戏玩家情感捕捉客户端等。当该应用客户端启动后，终端11可显示有应用界面，通过该界面可获取用户输入的问题文本，将该问题文本发送至服务器12。

服务器12获取到问题文本后，通过本发明实施例提供的基于情感分析的智能问答方法，对该问题文本进行情感分类。可选的，服务器12得到情感分类结果后，可以基于该情感分类结果获取与问题文本匹配的答案文本，并将该答案文本发送至终端11，由终端11在应用界面上显示该答案文本。

为了便于理解上述交互过程，以终端11上安装有智能问答客户端为例。当智能问答客户端启动后，显示智能问答界面。以图2所示的智能问答界面为例，该智能问答界面上包括显示框21及输入框22，通过该输入框22可以获取用户输入的问题文本，并将该问题文本显示在显示框21中，如图2所示的问题文本23。此后，为了获取该问题文本23对应的答案文本，终端11将问题文本23发送至服务器12。服务器12获取到问题文本23后，通过本发明实施例提供的基于情感分析的智能问答方法，对该问题文本23进行情感分析。服务器12得到问题文本23的情感分类结果后，可以基于该情感分类结果获取与问题文本23匹配的答案文本，并将该答案文本发送至终端11。终端11接收到答案文本后，在智能问答界面的显示框21中显示该答案文本，如图3所示的文本24。如此，通过终端11与服务器12之间的交互，实现智能问答。

当然，除了实现上述的智能问答之外，基于本发明实施例提供的基于情感分析的智能问答方法，还可以实现智能服务、游戏玩家情感捕捉等，实现原理与智能问答相同，此处不再一一赘述。

其中，终端11可以是诸如手机、平板电脑、个人计算机等电子设备。

服务器12可以是一台服务器，也可以是由多台服务器组成的服务器集群，或者是一个云计算服务中心。

终端11与服务器12通过有线或无线网络建立通信连接。

本发明实施例提供了一种基于情感分析的智能问答方法，请参考图4，其示出了本发明实施例提供的基于情感分析的智能问答方法流程图，该方法可应用于图1所示实施环境的服务器12中。如图4所示，本发明实施例提供的方法可以包括如下几个步骤：

在步骤401中，获取问题文本。

问题文本可以是任意文本，本发明实施例不对获取问题文本的方式进行具体限定，例如，可以基于应用场景进行获取。

例如，若本发明实施例提供的基于情感分析的智能问答方法应用于智能问答、智能客服、游戏玩家情绪捕捉等服务场景中，该类服务场景包括实施基于情感分析的智能问答方法的服务器以及终端。其中，终端显示智能服务界面，基于该智能服务界面获取用户输入的问题文本，并将该问题文本发送至服务器，则服务器接收该问题文本，即为获取到问题文本。

需要说明的是，该问题文本可以为用户输入的一段话，或者是一个词语等，问题文本中的内容不仅仅局限于一定的问题，还可以是表达用户想法的一句话或一个词语等，可以是任何内容，本发明实施例不对问题文本的内容及长度进行限定。

在步骤402中，对问题文本进行处理，得到处理后的词序列。

本发明实施例中，为了更为准确地进行情感分析，本发明实施例提供的方法在获取到问题文本后，将问题文本进行分词处理，从而将问题文本拆分成多个词语，基于每个词语进行情感分析。

分词处理时，可以采用HMM(Hidden Markov Model，隐马尔可夫模型)的分词***对问题文本进行分词处理。当然也可以采用其他分词方式，本发明实施例对此不作具体限定。

进一步地，考虑到有些词语并无明确的意义，例如一些语气助词、副词、介词、连接词等，通常自身并无明确的意义，只有将其放入一个完整的句子中才有一定作用，如常见的“的”、“在”之类。为此，为节省存储空间和提高处理效率，在处理问题文本之后，可以自动过滤掉某些字或词，这些字或词即被称为Stop Words(停用词)。针对该种情况，本发明实施例提供的方法在对问题文本进行处理，得到处理后的词序列时，包括但不限于对问题文本进行分词处理及停用词筛选处理，得到处理后的词序列。

其中，进行停用词筛选时，可以预先获取停用词，这些停用词可以是人工输入、非自动化生成的，生成后的停用词会形成一个停用词表。将问题文本分词之后的结果与停用词表中的词进行比对，筛选掉停用词表中包括的停用词，从而得到处理后的词序列。

在步骤403中，基于情感词典对词序列进行情感分类，得到问题文本的第一情感分类结果，情感词典包括至少两种情感类别的情感词。

本发明实施例提供的方法中，情感词典可以为预先构建的。此外，为了使得情感词典的内容更为全面，本发明实施例提供的方法采用微博，人工标注等半自动的方式构建覆盖维度更广的情感词典。例如，通过预先收集词语，并对其进行分析，得到由30000多个情感词构成的情感词典，且该情感字典由词语，词性标注种类(POS)，词义数，词义序号，情感分类，情感强度，情感极性，辅助情感分类，辅助情感强度，辅助情感极性十个维度构成。

进一步地，由于人类的情感比较丰富，为了使得情感分析的更为精准，本发明实施例提供的情感词典不仅仅局限于正面和负面两种情感类别的情感词，还可以包括两种以上情感类别的情感词。例如：情感词典包括喜、怒、哀、乐这4种情感类别的情感词。

当获取到情感词典后，可以基于情感词典对词序列进行情感分类，得到第一情感分类结果。实施时，对于词序列中的每个词，基于情感词典计算不同情感类别下的情感得分，之后根据各个词在不同情感类别下的情感得分确定第一情感分类结果，该第一情感分类结果可以反映词序列中的每个词被划分的对应的情感类别。

其中，对于词序列中的每个词，基于情感词典计算不同情感类别下的情感得分时，可以根据预先设定的得分计算策略来计算。例如，根据是否有修饰副词，确定情感得分；又例如，检测到感叹号时，将感叹号之前的词对应的情感得分加倍等。当然，实际应用中，还可以结合具体的应用效果采用其他计算策略，本发明实施例对此不做具体限定。

进一步地，根据各个词在不同情感类别下的情感得分确定第一情感分类结果时，可以将各个词在相同情感类别下的情感得分求和，将和值作为该问题文本在该情感类别下的情感得分，之后，将问题文本在各个情感类别下的情感得分作为第一分类结果。

为了便于理解，以情感词典包括喜、怒、哀、乐这4种情感类别的情感词，问题文本为一句话，对该句话进行处理得到包括A、B及C这3个词语的词序列为例，则针对词语A分别计算属于喜这种情感类别的得分(以0.5为例)、属于怒这种情感类别的得分(以0.1为例)、属于哀这种情感类别的得分(以0.1为例)以及属于乐这种情感类别的得分(以0.8为例)。针对词语B分别计算属于喜这种情感类别的得分(以0.4为例)、属于怒这种情感类别的得分(以0.1为例)、属于哀这种情感类别的得分(以0.1为例)以及属于乐这种情感类别的得分(以0.6为例)。针对词语C分别计算属于喜这种情感类别的得分(以0.4为例)、属于怒这种情感类别的得分(以0.1为例)、属于哀这种情感类别的得分(以0.1为例)以及属于乐这种情感类别的得分(以0.6为例)。

之后，对词语A、B及C属于喜这种情感类别的得分求和，得到的值为0.5+0.4+0.4＝1.3，则目标文本属于喜这种情感类别的情感得分为1.3。同理，目标文本属于怒这种情感类别的情感得分为0.1+0.1+0.1＝0.3，目标文本属于哀这种情感类别的情感得分为0.1+0.1+0.1＝0.3，目标文本属于乐这种情感类别的情感得分为0.8+0.6+0.6＝2。因此，第一情感分类结果为喜、怒、哀、乐这四种情感类别对应的情感得分1.3、0.3、0.3和2。

在一种可选实施方式中，本发明实施例提供的方法在进行情感分析时，可以直接根据第一情感分类结果获取问题文本的情感分类结果，并据此得到答案文本。例如，将情感得分最高的情感类别作为问题文本的情感分类结果。或者，按照每种情感类别的权重，对问题文本在各个情感类别下的情感得分进行加权，将加权后得分最高的情感类别作为问题文本的情感分类结果。

仍以上述举例进行说明，第一情感分类结果为喜、怒、哀、乐这四种情感类别对应的情感得分1.3、0.3、0.3和2，由于喜这种情感类别的情感得分最高，可以直接将其作为问题文本的情感分类结果。

进一步地，为了避免过分依赖情感字典以及对于情感词典中没有的词无法处理的情况，且为了提高基于情感分析的智能问答方法的准确性，本发明实施例提供的方法除了采用情感词典进行情感分析之外，还结合了网络模型，具体参考如下步骤。

在步骤404中，调用目标网络模型对问题文本进行序列特征提取及句法结构分析，根据提取的序列特征及分析的句法结构获取问题文本的第二情感分类结果。

针对该步骤，本发明实施例采用的目标网络模型包括但不限于双向记忆模型、注意力模型及递归神经网络模型。

其中，由于用户的情感话语属于开放领域的问题，自然语言是很典型的文本序列语句，因此，本发明实施例采用了LSTM模型，提取的是句子的序列特征，处理句子的每个时间步长(time steps)。但是，采用LSTM模型存在如下两个问题：

(1)LSTM在处理自然语言语句时，因为是序列输入，处理这一时刻的输入数据时只收到当前输入词和此时刻前输入词的影响，而日常生活中人们所说的语句中存在前后关联，并不只是受到前面词语的影响。

(2)在使用LSTM对自然语言处理时候，向LSTM输入一条句子(sentence)，得到编码器的矢量(encoder vector)，然后使用编码器的矢量去做分类或者解码(decoder)成另一条句子(比如翻译)，无论语句多长都会被压缩成一个几百维的矢量，这就意味着语句越长，最后的得到的最终状态矢量(final state vector)就会损失越多的信息，模型的性能会随着句子的长度增加而降低。

考虑到上述两个问题，本发明实施例提供的方法针对上述两个缺点做了相应的优化：针对缺点一，使用Bi-LSTM即双向LSTM对句子进行处理，双向LSTM的基本思想是使用一个训练序列向前向后各训练一个LSTM模型，再将两个模型的输出进行线性组合，以达到序列中每一个节点都能完整的依赖所有上下文信息。也就是说，处理语句时有两个方向不同的LSTM对数据进行处理，分别从前后两个不同的方向进行传播，避免了在处理序列数据时只收到前时刻数据的影响。

针对缺点二，在LSTM中加入attention机制(即注意力模型)，attention在NLP(Neuro-Linguistic Programming，神经语言程序学)中的思想就是使得一个模型完全可以在分类的过程中利用sentence的全部信息，模型保存每个time steps的隐藏状态矢量(hidden state vector)输出作为attention的输入，最后使用attention的输出作为模型分类的特征矢量(feature vector)，使得模型可以识别哪一部分是对分类结果最有帮助的信息，而不仅仅是最终状态矢量。其中，attention相对于长文本优势明显，attention在短文本优势相比较于长文本优势略小。由于Bi-LSTM更具有普适性，在应对长短语句时都具有较好的效果。

基于上述分析，本发明实施例提供的方法在调用目标网络模型对问题文本进行序列特征提取及句法结构分析，根据提取的序列特征及分析的句法结构获取问题文本的第二情感分类结果，包括：将问题文本转换成包含上下文语义信息的向量，例如，将问题文本转换成包含上下文语义信息的向量时，可以利用word2vec将问题文本转换成包含上下文语义信息的向量。之后，将得到的向量输入至双向记忆模型中，即调用双向记忆模型对该向量进行问题文本的序列特征提取，并将双向记忆模型的输出结果输入至注意力模型中，得到一级分类结果；获取问题文本的语法树结构信息，将语法树结构信息输入至递归神经网络模型中进行处理，即调用递归神经网络模型对语法树结构信息进行句法结构分析，得到二级分类结果；最后，根据一级分类结果及二级分类结果确定问题文本的第二情感分类结果。

其中，根据一级分类结果及二级分类结果确定问题文本的第二情感分类结果时，包括但不限于可采用权重的方式实现。例如，针对双向记忆模型及注意力模型设置一个权重，针对递归神经网络模型设置一个权重，将一级分类结果按照双向记忆模型及注意力模型对应的权重进行加权，得到加权后的一级分类结果；将二级分类结果按照递归神经网络模型对应的权重进行加权，得到加权后的二级分类结果；根据加权后的一级分类结果及加权后的二级分类结果确定问题文本的第二情感分类结果。

进一步地，以分类结果为情感值为例，根据加权后的一级分类结果及加权后的二级分类结果确定问题文本的第二情感分类结果时，可以在加权后的一级分类结果及加权后的二级分类结果中，选取情感值高的分类结果作为问题文本的第二情感分类结果。

由此可见，本发明实施例提供的方法利用Bi-Lstm+Attention+Tree-LSTM深度学习并行框架，第一层：将问题文本利用word2vec转成包含上下文语义信息的向量，利用双向的LSTM转成矩阵输入至模型进行处理，加上attention机制，输出层接一个softmax分类器。其中，softmax分类器以多项式分布(Multinomial Distribution)为模型建模的，它可以分多种互斥的类别。第二层：利用Tree-LSTM标注好的语法树结构信息输入到网络模型里进行处理，模型可以自动学习一些潜在的句法结构信息。由于Tree-LSTM比较容易训练，对数据量要求比较低，因此只需要一些少量的精确标注的数据即可。

进一步地，为了实现上述方法，本发明实施例提供的方法预先获取目标网络模型，获取方式包括但不限于：获取包括至少两种情感类别的数据集；将数据集划分为训练集、验证集以及测试集；采用训练集对初始网络模型进行训练，得到训练后的网络模型；采用验证集对训练后的网络模型进行验证；在验证通过后，采用测试集对训练后的网络模型进行测试，得到目标网络模型。

例如，获取包括喜、怒、哀、乐这四种情感类别的数据集，然后按照训练集，验证集和测试集8:1:1的比例，将该数据集划分为训练集、验证集以及测试集。将训练集经过向量化，输入到双向LSTM中，对双向LSTM进行训练，再采用验证集进行验证，验证通过后，采用测试集进行测试，得到双向LSTM模型。

在一种实现方式中，为了更好地支持鲁棒性和模型训练效果，本发明实施例提供的方法采取随机打乱索引和动态学习率衰减的方式，经过多次试验，在学利率0.5，轮数epoch为60轮，词维度为300时取得了最优的结果。又由于在训练过程中引入了attention机制，使得该网络模型更有效地识别句子的整体有效信息，最后输出层接一个softmax多分类器，则本发明实施例提供的目标网络模型结构可以如图5所示。

由于本发明实施例提供的方法采用的目标网络模型还用到了Tree-LSTM进行补充，Tree-LSTM的输入是分析好的句子结构，这个需要大量的标注数据，因此Tree-LSTM是作为有限的补充，先对句子进行依存句法分析，分析句子的句法结构，然后将分析好的句子结构输入到Tree-LSTM里，使得模型更了解句子结构，递归神经网络也可以自动学习一些潜在的句法结构信息。但不是所有的句子，都可以有有效的句法情感结构，因此可以看作是Bi-Lstm+Attention模型的补充。

此外，需要说明的是，如果以目标网络模型也采用喜、怒、哀、乐这四种情感类别的数据集进行训练为例，则通过目标网络模型得到的第二情感分类结果也包括这4类情感类别对应的情感得分。

在步骤405中，根据问题文本的第一情感分类结果及第二情感分类结果获取问题文本的综合情感分类结果。

针对该步骤，为了使得情感分类结果更为准确，本发明实施例提供的方法在基于情感词典得到的第一情感分类结果，基于目标网络模型得到的第二情感分类结果之后，将第一情感分类结果和第二情感分类结果进行综合，以得到问题文本的综合情感分类结果。根据第一情感分类结果及第二情感分类结果确定问题文本的综合情感分类结果时，包括但不限于获取第一情感分类结果的权重；获取第二情感分类结果的权重；根据第一情感分类结果、第一情感分类结果的权重、第二情感分类结果以及第二情感分类结果的权重确定问题文本的综合情感分类结果。

其中，第一情感分类结果的权重和第二情感分类结果的权重可以根据经验进行设置，还可以后续根据情感分类的效果进行调整，本发明实施例对此不作具体限定。

在一种实现方式中，根据第一情感分类结果、第一情感分类结果的权重、第二情感分类结果以及第二情感分类结果的权重确定问题文本的综合情感分类结果时，可以将第一情感分类结果与第一情感分类结果的权重相乘，即将第一情感分类结果中各个情感类别对应的情感得分分别乘以第一情感分类结果的权重，得到加权后的第一情感分类结果；将第二情感分类结果与第二情感分类结果的权重相乘，即将第二情感分类结果中各个情感类别对应的情感得分分别乘以第二情感分类结果的权重，得到加权后的第二情感分类结果；之后，将加权后的第一情感分类结果与加权后的第二情感分类结果中相同情感类别对应的情感得分求和，得到各个情感类别的综合得分；选取综合得分最高的情感类别作为综合情感分类结果。

为了便于理解，以第一情感分类结果包括喜、怒、哀、乐这四种情感类别对应的情感得分，且分别1.3、0.3、0.3和2，第二情感分类结果也包括喜、怒、哀、乐这四种情感类别对应的情感得分，且分别为1.4、0.2、0.3和2.1为例，如果第一情感分类结果的权重为0.2，第一情感分类结果的权重为0.8，则加权后的第一情感分类结果和加权后的第二情感分类结果如下面表1所示：

表1

由上述表1可以看出，综合得分最高的情感类别为乐，则将其作为综合情感分类结果。

当然，上述获取综合情感分类结果的过程仅作为举例，实际应用中，基于本发明实施例提供的方法还可以扩展其他方式，本发明实施例对此不加以限定。由于相关技术中，情感分类仅有正负两个维度，本发明实施例提供的方法可以基于喜、怒、哀、乐这四种情绪类别，基于情感字典和深度网络模型的分类结果，并赋予相关的权重，去计算最终的情感综合得分，从而使得情感分析结果更为精准，能够成功捕捉用户的喜怒哀乐情绪，进一步提高据此获取答案文本的准确性。

得到更为准确的综合情感分类结果后，将该综合情感分类结果应用到具体场景中，可以基于设定的不同情感类的个性化回答，做出针对性的回复。有鉴于此，在一种实现方式中，基于上述情感分类过程，本发明实施例提供的方法还包括如下步骤。

在步骤406中，根据问题文本的综合情感分类结果获取问题文本对应的答案文本。

具体实施时，可以预先针对不同情感分类结果构建对应的答案文本集合，当得到问题文本的综合情感分类结果后，可以基于该综合情感分类结果在对应的答案文本集合中选取匹配的答案文本作为响应文本反馈给终端。例如，具体可采用一些文本匹配的检测算法等，本发明实施例对此不作具体限定。

接下来，以将综合情感分类结果应用于智能问答***为例进行说明，该智能问答***在实现智能问答时，交互过程可如图6所示，包括如下几个步骤：

1)各个需求方客户端(如有问答需求的用户触发终端启动客户端)向中心服务端(服务器)发起请求，以HTTP(HyperText Transfer Protocol，超文本传输协议)请求为例，且为了提高安全性，以加密的方式。服务端做分布式调度，然后向服务端接口发送请求，请求包含用户问题和ID(标识)，该ID用于标识用户问题，由此区分不同的用户问题。

2)服务器端程序收到用户问题和ID后，去调用java MVC(Model ViewController，模型视图控制器)框架中的情感字典模块，命中则根据检索模块，取相应的TOP值，否的话调用深度学习框架模型(即本发明实施例中所述的目标网络模型)，返回响应答案，即答案文本。

通过情感字典和深度网络模型检测后，本发明实施例提供的方法对用户的句子进行了喜怒哀乐的分类，然后根据检索技术，计算Jaccard similarity和利用向量模型空间，给出情感分值最高的几个候选答案，可以根据业务方的需求取情感分值最高的topN到top1。其中，N为大于1的数值，本发明实施例对此不作限定，例如，可以取10，也可以取5等。

3)服务端接口处理完毕，以json的形式返回中心服务端。其中，json为基于JavaScript语言的轻量级的数据交换格式(JavaScript Object Notiation)的缩写。

可选的，还可以根据缓存和话语过滤模块(主要过滤反动，政治等)返回给客户端，使得客户端通过应用界面展示得到的答案。

需要说明的是，上述情感字典模块、检索模块及话语过滤模块均为服务器端为实现智能问答的功能模块。

基于上述智能问答的交互过程，以图7所示的交互界面为例进行说明。当用户问题为“我今天捐了10元钱”，即问题文本为“我今天捐了10元钱”，则通过本发明实施例提供的基于情感分析的智能问答方法获取到综合情感分类结果之后，基于该综合情感分类结果获取到的答案文本为“做的太棒了”。

此外，除上述举例外，本发明实施例提供的方法还可应用于游戏的智能问答和游戏内问答服务，赋予机器人一定的情感能力，减少玩家的焦急心情，安抚玩家的情绪，包括但不限于如下几点作用：

1、让机器人从感知走向认知，赋予机器人一定的情感能力。

2、捕捉用户的情感和情绪，做出个性化的回复。

3、安抚用户的情感，减少玩家因为智能机器人的答非所问而造成的流失率。

由此可见，本发明实施例提供的方法，首先将传统情感二分类由正负情感判断变成了喜怒哀乐等两种以上情感类别的判断，用于解决目前AI(Artificial Intelligence，人工智能)***弱情感的缺点，让AI***具有更好的拟人化特性。其次，在游戏里的应用，可以更好的捕捉玩家的情绪，针对性的做出个性化的判断，有效的提升了用户的体验。最后，本发明实施例提供的方法还可以有效的弥补NLP领域，四分类情感判断相关方法的缺失。

综上所述，本发明实施例提供的方法，通过基于情感词典及目标网络模型分别对问题文本进行分类处理，并基于二者得到的分类结果获取综合情感分类结果，使得分类结果的准确性更高，进一步提高了据此得到的答案文本的准确性。

此外，由于情感词典包括的情感类别较多，因而提高了采用情感词典进行分类的准确性，进一步提高了分类结果及答案文本的准确性。

基于与方法同样的构思，参见图8，本发明实施例提供了一种基于情感分析的智能问答装置，用于执行上述基于情感分析的智能问答方法，该装置包括：

第一获取模块801，用于获取问题文本；

处理模块802，用于对问题文本进行处理，得到处理后的词序列；

第一分类模块803，用于基于情感词典对词序列进行情感分类，得到问题文本的第一情感分类结果，情感词典包括至少两种情感类别的情感词；

第二分类模块804，用于调用目标网络模型对问题文本进行序列特征提取及句法结构分析，根据提取的序列特征及分析的句法结构获取问题文本的第二情感分类结果；

第二获取模块805，用于根据问题文本的第一情感分类结果及第二情感分类结果获取问题文本的综合情感分类结果；

第三获取模块806，用于根据综合情感分类结果获取问题文本对应的答案文本。

在一种实现方式中，第一分类模块803，用于对词序列中的每个词，基于情感词典计算不同情感类别下的情感得分；根据各个词在不同情感类别下的情感得分确定问题文本的第一情感分类结果。

在一种实现方式中，目标网络模型包括双向记忆模型、注意力模型及递归神经网络模型；

第二分类模块804，用于将问题文本转换成包含上下文语义信息的向量，调用双向记忆模型及注意力模型基于向量提取问题文本的序列特征，根据提取的序列特征获取一级分类结果；获取问题文本的语法树结构信息，调用递归神经网络模型对语法树结构信息进行句法结构分析，得到二级分类结果；根据一级分类结果及二级分类结果确定问题文本的第二情感分类结果。

在一种实现方式中，第二获取模块805，用于获取问题文本的第一情感分类结果的权重；获取问题文本的第二情感分类结果的权重；根据问题文本的第一情感分类结果、第一情感分类结果的权重、第二情感分类结果以及第二情感分类结果的权重确定问题文本的综合情感分类结果。

在一种实现方式中，处理模块802，用于对问题文本进行分词处理及停用词筛选处理，得到处理后的词序列。

在一种实现方式中，参见图8，该装置还包括：

第四获取模块807，用于获取包括至少两种情感类别的数据集；将数据集划分为训练集、验证集以及测试集；采用训练集对初始网络模型进行训练，得到训练后的网络模型；采用验证集对训练后的网络模型进行验证；在验证通过后，采用测试集对训练后的网络模型进行测试，得到目标网络模型。

本发明实施例提供的装置，通过基于情感词典及目标网络模型分别对问题文本进行分类处理，并基于二者得到的分类结果获取综合情感分类结果，使得分类结果的准确性更高，进一步提高了据此得到的答案文本的准确性。此外，由于情感词典包括的情感类别较多，因而提高了采用情感词典进行分类的准确性，进一步提高了分类结果及答案文本的准确性。

需要说明的是，上述实施例提供的装置在实现其功能时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的装置与方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

请参考图10，其示出了本发明实施例所涉及的服务器的结构示意图，该服务器可以用于实施上述实施例中提供的基于情感分析的智能问答方法。具体来讲：

该服务器1000可因配置或性能不同而产生比较大的差异，可以包括一个或一个以***处理器(central processing units，CPU)1022(例如，一个或一个以上处理器)和存储器1032，一个或一个以上存储应用程序1042或数据1044的存储介质1030(例如一个或一个以上海量存储设备)。其中，存储器1032和存储介质1030可以是短暂存储或持久存储。存储在存储介质1030的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1022可以设置为与存储介质1030通信，在服务器1000上执行存储介质1030中的一系列指令操作。

服务器1000还可以包括一个或一个以上电源1026，一个或一个以上有线或无线网络接口1050，一个或一个以上输入输出接口1058，一个或一个以上键盘1056，和/或，一个或一个以上操作***1041，例如Windows ServerTM，Mac OS XTM，UnixTM，LinuxTM，FreeBSDTM等等。

服务器1000可以包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行上述基于情感分析的智能问答方法。

在示例中实施例中，还提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集。所述至少一条指令、至少一段程序、代码集或指令集经配置以由一个或者一个以上处理器执行，以实现上述基于情感分析的智能问答方法。

在示例性实施例中，还提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被计算机设备的处理器执行时实现上述基于情感分析的智能问答方法。

可选地，上述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

应当理解的是，在本文中提及的“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

以上所述仅为本发明的示例性实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于情感分析的智能问答方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于情感词典对所述词序列进行情感分类，得到所述问题文本的第一情感分类结果，包括：

对所述词序列中的每个词，基于情感词典计算不同情感类别下的情感得分；

根据各个词在不同情感类别下的情感得分确定所述问题文本的第一情感分类结果。

3.根据权利要求1所述的方法，其特征在于，所述目标网络模型包括双向记忆模型、注意力模型及递归神经网络模型；

所述调用目标网络模型对所述问题文本进行序列特征提取及句法结构分析，根据提取的序列特征及分析的句法结构获取所述问题文本的第二情感分类结果，包括：

将所述问题文本转换成包含上下文语义信息的向量，调用所述双向记忆模型及所述注意力模型基于所述向量提取所述问题文本的序列特征，根据提取的序列特征获取一级分类结果；

获取所述问题文本的语法树结构信息，调用所述递归神经网络模型对所述语法树结构信息进行句法结构分析，得到二级分类结果；

根据所述一级分类结果及所述二级分类结果确定所述问题文本的第二情感分类结果。

4.根据权利要求1所述的方法，其特征在于，所述根据所述问题文本的第一情感分类结果及第二情感分类结果获取所述问题文本的综合情感分类结果，包括：

获取所述问题文本的第一情感分类结果的权重；

获取所述问题文本的第二情感分类结果的权重；

根据所述问题文本的第一情感分类结果、所述第一情感分类结果的权重、所述第二情感分类结果以及所述第二情感分类结果的权重确定所述问题文本的综合情感分类结果。

5.根据权利要求1所述的方法，其特征在于，所述对所述问题文本进行处理，得到处理后的词序列，包括：

对所述问题文本进行分词处理及停用词筛选处理，得到处理后的词序列。

6.根据权利要求1-5中任一所述的方法，其特征在于，所述方法还包括：

获取包括至少两种情感类别的数据集；

将所述数据集划分为训练集、验证集以及测试集；

采用所述训练集对初始网络模型进行训练，得到训练后的网络模型；

采用所述验证集对所述训练后的网络模型进行验证；

在验证通过后，采用所述测试集对所述训练后的网络模型进行测试，得到所述目标网络模型。

7.一种基于情感分析的智能问答装置，其特征在于，所述装置包括：

第一获取模块，用于获取问题文本；

8.根据权利要求7所述的装置，其特征在于，所述第一分类模块，用于对所述词序列中的每个词，基于情感词典计算不同情感类别下的情感得分；根据各个词在不同情感类别下的情感得分确定所述问题文本的第一情感分类结果。

9.根据权利要求7所述的装置，其特征在于，所述目标网络模型包括双向记忆模型、注意力模型及递归神经网络模型；

所述第二分类模块，用于将所述问题文本转换成包含上下文语义信息的向量，调用所述双向记忆模型及所述注意力模型基于所述向量提取所述问题文本的序列特征，根据提取的序列特征获取一级分类结果；获取所述问题文本的语法树结构信息，调用所述递归神经网络模型对所述语法树结构信息进行句法结构分析，得到二级分类结果；根据所述一级分类结果及所述二级分类结果确定所述问题文本的第二情感分类结果。

10.根据权利要求7所述的装置，其特征在于，所述第二获取模块，用于获取所述问题文本的第一情感分类结果的权重；获取所述问题文本的第二情感分类结果的权重；根据所述问题文本的第一情感分类结果、所述第一情感分类结果的权重、所述第二情感分类结果以及所述第二情感分类结果的权重确定所述问题文本的综合情感分类结果。

11.根据权利要求7所述的装置，其特征在于，所述处理模块，用于对所述问题文本进行分词处理及停用词筛选处理，得到处理后的词序列。

12.根据权利要求7-11中任一所述的装置，其特征在于，所述装置还包括：

第四获取模块，用于获取包括至少两种情感类别的数据集；将所述数据集划分为训练集、验证集以及测试集；采用所述训练集对初始网络模型进行训练，得到训练后的网络模型；采用所述验证集对所述训练后的网络模型进行验证；在验证通过后，采用所述测试集对所述训练后的网络模型进行测试，得到所述目标网络模型。

13.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被所述处理器执行时实现如权利要求1至6任一项所述的基于情感分析的智能问答方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被执行时实现如权利要求1至6任一项所述的基于情感分析的智能问答方法。