CN111091011B

CN111091011B - 领域预测方法、领域预测装置及电子设备

Info

Publication number: CN111091011B
Application number: CN201911327989.6A
Authority: CN
Inventors: 陈洋; 梅林海; 尹坤; 刘权; 陈志刚; 王智国; 胡国平
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2019-12-20
Filing date: 2019-12-20
Publication date: 2023-07-28
Anticipated expiration: 2039-12-20
Also published as: CN111091011A

Abstract

本发明提供一种领域预测方法、领域预测装置及电子设备，领域预测方法包括：确定本轮交互文本；将本轮交互文本和监督信息输入至领域预测模型，得到领域预测模型输出的与本轮交互文本对应的领域概率分布，其中，监督信息为基于上一轮交互文本在语义理解后确定的领域信息，对领域预测模型输出的与上一轮交互文本对应的领域概率分布进行修正获得；基于与本轮交互文本对应的领域概率分布，确定领域预测结果。本发明实施例的领域预测方法，可以极大地提高多轮交互过程中模型预测的准确率，特别是面对多轮交互过程中的简化式交互，可以获得准确的领域预测结果。

Description

领域预测方法、领域预测装置及电子设备

技术领域

本发明涉及语音交互技术领域，更具体地，涉及一种领域预测方法、领域预测装置及电子设备。

背景技术

在语音交互过程中，为了更好地进行语义理解，通常需要先预测用户的表达内容属于哪一个领域。

现有技术中，一种方法是基于文法规则网络或者状态机规则来匹配用户表达内容是否属于某一领域，该方法泛化能力差，对于没有收录的句式，将无法理解。另一种方式是使用深度神经网络，学习用户表达内容存在的句式信息，从而达到模型预测领域的目的，但是深度神经网络在单轮的交互的表达内容的预测上准确率尚可，一旦涉及到多轮对话，模型预测的准确率大大降低。

发明内容

本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的领域预测方法、领域预测装置、电子设备和可读存储介质。

第一方面，本发明实施例提供一种领域预测方法，包括：确定本轮交互文本；将所述本轮交互文本和监督信息输入至领域预测模型，得到所述领域预测模型输出的与所述本轮交互文本对应的领域概率分布，其中，所述监督信息为基于上一轮交互文本在语义理解后确定的领域信息，对所述领域预测模型输出的与所述上一轮交互文本对应的领域概率分布进行修正获得；基于所述与所述本轮交互文本对应的领域概率分布，确定领域预测结果；所述领域预测模型为，预先以多轮交互文本数据为样本，以预先确定的与所述多轮交互文本数据分别对应的领域概率分布数据为样本标签训练得到。

根据本发明实施例的领域预测方法，所述监督信息按照如下步骤获得：获得所述上一轮交互文本在语义理解后确定的领域信息；将所述上一轮交互文本输入至所述领域预测模型，得到所述领域预测模型输出的与所述上一轮交互文本对应的领域概率分布；基于所述领域信息及与所述上一轮交互文本对应的领域概率分布确定所述监督信息。

根据本发明实施例的领域预测方法，所述将所述本轮交互文本和监督信息输入至领域预测模型，得到所述领域预测模型输出的与所述本轮交互文本对应的领域概率分布，包括：将所述本轮交互文本输入至所述领域预测模型的预处理层，得到本轮内容特征和本轮领域词占比特征，所述本轮内容特征用于表征所述本轮交互文本的表达内容，所述本轮领域词占比特征用于表征所述本轮交互文本的各个领域实体的长度占所述本轮交互文本的占比；将所述本轮内容特征、所述本轮领域词占比特征和所述监督信息输入至所述领域预测模型的推理层，得到所述与所述本轮交互文本对应的领域概率分布。

根据本发明实施例的领域预测方法，所述将所述本轮内容特征、所述本轮领域词占比特征和所述监督信息输入至所述领域预测模型的推理层，得到所述与所述本轮交互文本对应的领域概率分布，包括：将所述本轮内容特征和所述本轮领域词占比特征输入至所述推理层的第一层结构，得到带领域信息占比的文本表达以及带领域分类信息的文本表达，所述带领域信息占比的文本表达用于表征所述本轮交互文本的领域信息，所述带领域分类信息的文本表达用于表征所述本轮交互文本的预测领域占比权重；将所述带领域信息占比的文本表达、所述带领域分类信息的文本表达以及所述监督信息输入至所述推理层的第二层结构，得到所述与所述本轮交互文本对应的领域概率分布。

根据本发明实施例的领域预测方法，所述带领域分类信息的文本表达基于所述本轮内容特征、所述本轮领域词占比特征和所述领域预测模型的领域分类信息的权重确定，且领域分类信息的权重根据所述领域预测模型在训练过程学习到的各个领域信息确定。

根据本发明实施例的领域预测方法，所述将所述本轮交互文本和监督信息输入至领域预测模型，还包括：将所述本轮交互文本、所述监督信息和个性化特征输入至所述领域预测模型，其中，所述个性化特征用于表征本轮交互中的关联信息。

根据本发明实施例的领域预测方法，所述个性化特征包括本轮交互的前景领域特征和本轮交互的后景领域特征。

第二方面，本发明实施例提供一种领域预测装置装置，包括：文本确定单元，用于确定本轮交互文本；概率分布确定单元，用于将所述本轮交互文本和监督信息输入至领域预测模型，得到所述领域预测模型输出的与所述本轮交互文本对应的领域概率分布，其中，所述监督信息为基于上一轮交互文本在语义理解后确定的领域信息，对所述领域预测模型输出的与所述上一轮交互文本对应的领域概率分布进行修正获得；领域确定单元，用于基于所述与所述本轮交互文本对应的领域概率分布，确定领域预测结果；其中所述领域预测模型为，预先以多轮交互文本数据为样本，以预先确定的与所述多轮交互文本数据分别对应的领域概率分布为样本标签训练得到。

第三方面，本发明实施例提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如第一方面所提供的领域预测方法的步骤。

第四方面，本发明实施例提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如第一方面所提供的领域预测方法的步骤。

根据本发明实施例的领域预测方法、领域预测装置、电子设备和可读存储介质，通过用上一轮交互文本对应的领域概率分布、上一轮交互文本在语义理解后确定的领域信息以及本轮交互文本共同预测本轮的领域预测结果，可以使本轮领域预测考虑到上一轮的预测的领域以及上一轮实际的语境，极大地提高多轮交互过程中模型预测的准确率，特别是面对多轮交互过程中的简化式交互，可以获得准确的领域预测结果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例的领域预测方法的流程图；

图2为本发明实施例的领域预测模型在应用阶段的拓扑结构示意图；

图3为本发明实施例的领域预测模型在训练阶段的拓扑结构示意图；

图4为本发明实施例的领域预测装置的结构示意图；

图5为本发明实施例的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

现有技术中，深度神经网络没有完全解决在交互的过程中，多轮对话中的对简短口语化的预测。例如当用户第一次说“导航去科大讯飞”，目前使用的深度神经网络可以预测出当前请求属于mapU导航领域；但是当用户接着说“万达”，此时将“万达”输入到深度神经网络中，由于本轮表达内容中没有较强的句式信息，单独从实体信息来分析也无法预测出本轮表达内容属于哪一个领域，所以模型对于此类问题的理解能力较差。

下面参考图1-图3描述本发明实施例的领域预测方法，该领域预测方法可以用于多轮交互的情景。

本发明实施例的领域预测方法包括如下步骤：

步骤S100、确定本轮交互文本。

在实际的执行中，确定本轮交互文本可以包括：获取本轮交互语音信息；将本轮交互语音信息转写为本轮交互文本。

需要说明的是，多轮交互表示用户与人工智能进行多次的有关联的沟通，本轮交互包括当前用户说出或者用其他形式进行意思表达，以及人工智能在接收到该轮意思表达后进行的对应的反馈，对应地，上一轮则为本轮交互之前的那一轮交互。

步骤S200、将本轮交互文本和监督信息输入至领域预测模型，得到领域预测模型输出的与本轮交互文本对应的领域概率分布。其中，监督信息为基于上一轮交互文本在语义理解后确定的领域信息，对领域预测模型输出的与上一轮交互文本对应的领域概率分布进行修正获得。

上一轮交互文本在语义理解后确定的领域信息指的是用户上一轮表达内容，进行最终的语义理解后，得到的领域信息。例如：用户说“我想听格林童话”，模型预测本轮对话的领域为音乐领域，但是经过语义理解之后，用户的表达内容被理解为故事领域。其中故事领域为语义理解后的领域信息。

以图2所示的实施例为例，将上一轮交互输入的文体命名为his_sent，本轮交互输入的文本命名为sent。

上述的监督信息记为his_attention_vec，上一轮交互文本在语义理解后确定的领域信息可以用矩阵his_label_vec表示，该矩阵his_label_vec可以由经过一系列语义理解后的上一轮交互文本的领域矩阵his_label_matrix确定。

比如，his_label_vec＝his_label_matrix^T*his_label_matrix，换言之，将his_label_matrix的转置矩阵和his_label_matrix相乘，得到his_label_vec，这样his_label_vec的矩阵维度变大，信息量变丰富。

语义理解后确定的领域信息用于修正上一轮的领域概率分布，相当于与语义理解结果相关的领域信息(矩阵his_label_vec)和上一轮的领域概率分布进行全连接后，得到监督矩阵(监督信息)，利用来监督矩阵来监督本轮领域预测。

需要说明的是，在使用领域预测模型确定本轮交互文本对应的领域概率分布时，上一轮交互文本在语义理解后确定的领域信息(his_label_vec)的目的用于监督本轮交互的领域概率分布。例如在上一轮交互文本预测过程中，上一轮领域预测模型预测的领域与上一轮语义理解后的领域一致时(假设为音乐领域)，his_sent_vec中属于音乐领域的权重将会加强，其他领域的权重就会减弱；当上一轮领域预测模型预测的领域与上一轮语义理解后的领域不一致时(假设领域预测模型预测为音乐领域，实际语义理解的领域为故事领域)，则his_sent_vec中属于故事领域的权重就会加强，其他领域的权重就会减弱，在预测本轮交互文本属于某一个领域时，就会更加不相信音乐领域，反而会更加相信本轮交互文本为故事领域。

领域预测模型为，预先以多轮交互文本数据为样本，以预先确定的与多轮交互文本数据分别对应的领域概率分布数据为样本标签训练得到。

以图3为例，在训练时，输入上一轮交互文本数据、与上一轮交互文本数据对应的领域概率分布数据、本轮交互文本数据和与本轮交互文本数据对应的领域概率分布数据，其中上一轮交互文本数据和本轮交互文本数据作为训练的样本，与上一轮交互文本数据对应的领域概率分布数据和与本轮交互文本数据对应的领域概率分布数据作为训练的样本标签。

通过一定量的样本数据和样本标签的训练，可以获得训练后的领域预测模型。在训练阶段，领域预测模型无需输入交互文本在语义理解后确定的领域信息(his_label_vec)或领域矩阵(his_label_matrix)。

步骤S300、基于与本轮交互文本对应的领域概率分布，确定领域预测结果。

在实际的执行中，领域概率分布可以为概率分布矩阵的形式，在该概率分布矩阵中，最大值对应的领域可以确定为领域预测结果。

根据本发明实施例的领域预测方法，通过用上一轮交互文本对应的领域概率分布、上一轮交互文本在语义理解后确定的领域信息以及本轮交互文本共同预测本轮的领域预测结果，可以使本轮领域预测考虑到上一轮的预测的领域以及上一轮实际的语境，极大地提高多轮交互过程中模型预测的准确率，特别是面对多轮交互过程中的简化式交互，可以获得准确的领域预测结果。

在一些实施例中，如图2所示，本发明实施例的领域预测方法，还包括：

步骤S010、获取上一轮交互文本在语义理解后确定的领域信息。

比如获取上一轮交互文本在语义理解后确定的领域矩阵his_label_matrix，基于领域矩阵his_label_matrix确定上一轮交互文本在语义理解后确定的领域信息his_label_vec。

其中，上一轮语义理解的业务编码输出的矩阵维度是1*label(简称his_label_matrix),如果上一轮语义理解后的业务是导航领域，则将导航领域的那位参数设置为1，其他全部为0；或者也可以反向设置，也就是，将导航领域的那位参数设置为0，其他全部为1。

其中，his_label_vec＝his_label_matrix^T*his_label_matrix，换言之，将his_label_matrix的转置矩阵和his_label_matrix相乘，得到his_label_vec，这样his_label_vec的矩阵维度变大，信息量变丰富。

步骤S020、将上一轮交互文本输入至领域预测模型，得到领域预测模型输出的与上一轮交互文本对应的领域概率分布。

在实际的执行中，该上一轮交互文本对应的领域概率分布可以在本轮预测时通过领域预测模型确定得到，或者在上一轮预测时存储得到的领域概率分布，并在本轮预测时调用。

步骤S030、基于领域信息及与上一轮交互文本对应的领域概率分布确定监督信息。

在实际的执行中，将领域信息与上一轮交互文本对应的领域概率分布进行全连接，可以得到监督信息。

在一些实施例中，步骤S200、将本轮交互文本和监督信息输入至领域预测模型，得到领域预测模型输出的与本轮交互文本对应的领域概率分布，包括：

步骤S210、将本轮交互文本输入至领域预测模型的预处理层，得到本轮内容特征和本轮领域词占比特征。

以图2所示的领域预测模型为例，本轮内容特征为“忘情水”，本轮领域词占比特征为“领域词占比”。

其中，本轮内容特征用于表征本轮交互文本的表达内容，本轮内容特征可以为word-embedding(词嵌入向量)矩阵的形式，例如可以通过神经网络或其他网络模型生成word-embedding矩阵等。

本轮领域词占比特征用于表征本轮交互文本的各个领域实体的长度占本轮交互文本的占比。具体地，通过整理每一个领域的领域词汇，用户的表达内容去匹配领域词汇(匹配领域词汇的算法目前有很多方法，例如有AC自动机(Aho-Corasick automaton)等)，计算当前表达内容中有多少个字属于领域词汇，从而获得各个领域词汇的个数占整个表达内容的百分比。

本轮领域词占比特征可以采取领域字典贴弧编码的形式确定，其中，领域字典贴弧编码输出的矩阵维度是1*label，领域字典贴弧是指将某个领域的所有实体都搜集整理到一起，使用实体贴弧(实体贴弧的实现方式可以为正则匹配、AC自动机等方法，本文不在赘述)的方法对用户的表达内容进行贴弧，获得用户的表达内容中属于本领域的实体的个数占整个表达内容文本的长度比。

步骤S220、将本轮内容特征、本轮领域词占比特征和监督信息输入至领域预测模型的推理层，得到与本轮交互文本对应的领域概率分布。

以图2为例，将本轮内容特征(忘情水)、本轮领域词占比特征(领域词占比)和监督信息(his_attention_vec)输入至领域预测模型的推理层，可以得到与本轮交互文本对应的领域概率分布(domain)。

这样在推理层进行预测时，推理层同时考虑到了本轮交互文本的表达内容、本轮交互文本的各个领域实体的长度占本轮交互文本的占比以及根据上一轮交互文本的监督信息，来预测本轮交互文本对应的领域概率分布，在面对多轮交互过程中的简化式交互时，可以获得准确的领域预测结果。

在一些实施例中，步骤S220、将本轮内容特征、本轮领域词占比特征和监督信息输入至领域预测模型的推理层，得到与本轮交互文本对应的领域概率分布，包括：

步骤S221、将本轮内容特征和本轮领域词占比特征输入至推理层的第一层结构，得到带领域信息占比的文本表达以及带领域分类信息的文本表达，带领域信息占比的文本表达用于表征本轮交互文本的领域信息，带领域分类信息的文本表达用于表征本轮交互文本的预测领域占比权重。

以图2所示的领域预测模型为例，将本轮内容特征(忘情水)、本轮领域词占比特征(领域词占比)输入至推理层的第一层结构，得到带领域信息占比的文本表达(sent_vec)和带领域分类信息的文本表达(attention_label_vec)。

进一步地，推理层包括：前处理层，前处理层用于根据本轮内容特征，确定原始文本表达；第一层结构用于根据原始文本表达和本轮领域词占比特征，确定带领域信息占比的文本表达，第二层结构用于根据原始文本表达、本轮领域词占比特征和领域分类信息的权重，确定带领域分类信息的文本表达。前处理层可以是编码层，第一层结构可以是attention层，可以进行attention处理；第二层结构可以是全连接层，可以进行全连接。

步骤S221、将本轮内容特征和本轮领域词占比特征输入至推理层的第一层结构，得到带领域信息占比的文本表达以及带领域分类信息的文本表达可以包括：

步骤S221a、将本轮内容特征输入至推理层的前处理层，得到原始文本表达。在实际的执行中，如图2所示，对本轮内容特征(sent，比如忘情水)经过Bi-LSTM编码后得到原始文本表达(sent_veco)。

步骤S221b、根据原始文本表达和本轮领域词占比特征，确定带领域信息占比的文本表达。在实际的执行中，如图2所示，对原始文本表达(sent_veco)与本轮领域词占比特征(arc_vec)进行attention，得到带领域信息占比的文本表达(sent_vec)。

步骤S221c、根据原始文本表达、本轮领域词占比特征和领域分类信息的权重，确定带领域分类信息的文本表达。在实际的执行中，如图2所示，对原始文本表达(sent_veco)、本轮领域词占比特征(arc_vec)和领域分类信息的权重(label_embedding)进行attention，得到带领域分类信息的文本表达(attention_label_vec)。或者，对原始文本表达(sent_veco)和本轮领域词占比特征(arc_vec)先进行attention，并将该attention的结果和领域分类信息的权重(label_embedding)再进行attention，得到带领域分类信息的文本表达(attention_label_vec)。

步骤S222、将带领域信息占比的文本表达、带领域分类信息的文本表达以及监督信息输入至推理层的第二层结构，得到与本轮交互文本对应的领域概率分布。

以图2所示的领域预测模型为例，将带领域信息占比的文本表达(sent_vec)、带领域分类信息的文本表达(attention_label_vec)和监督信息(his_attention_vec)输入至推理层的第二层结构，得到与本轮交互文本对应的领域概率分布(domain)。

具体地，对将带领域信息占比的文本表达(sent_vec)、带领域分类信息的文本表达(attention_label_vec)和监督信息(his_attention_vec)通过第二层结构进行全连接：

fc_vec＝[attention_label_vec,sent_vec,his_attention_vec]，

fc＝weight*(fc_vec*fc_vec^T)+b。

其中，带领域分类信息的文本表达基于本轮内容特征、本轮领域词占比特征和领域预测模型的领域分类信息的权重确定，且领域分类信息的权重根据领域预测模型在训练过程学习到的各个领域信息确定。换言之，领域分类信息的权重可以为在领域预测模型在训练完成后，即保持不动。当然，领域分类信息的权重还可以在其他模型中确定后，再将其他模型确定的领域分类信息的权重输入到该领域预测模型。

在一些优选的实施例中，步骤S200、将本轮交互文本和监督信息输入至领域预测模型，还包括：将本轮交互文本、监督信息和个性化特征输入至领域预测模型，其中，个性化特征用于表征本轮交互中的关联信息。

该实施例较上面的实施例，在输入时，增加了个性化特征，以应对领域预测时，出现基本相同的多种预测结果的情况，通过添加个性化特征，辅助领域预测模型对于摸棱两可的结果，做进一步的区分。

个性化特征，指的是根据不同的模型应用场景、从用户当前交互中可以提取出来，和本轮交互有一定关联的信息，包括但不局限于用户使用交互设备过程中，整个交互设备前景、后景状态下，其他应用设备的状态。例如当用户使用交互设备在导航相关的语音交互，但是此时用户的交互设备后台还开启了音乐、淘宝等其他应用app；则此时，导航领域属于前景，音乐领域、购物领域属于后景。

进一步地，个性化特征包括本轮交互的前景领域特征和本轮交互的后景领域特征。

个性化特征的个性化数据编码输出的矩阵维度是1*2label(简称personal_matrix)，1*2lable矩阵由2个1*label矩阵拼接而成。第一个1*label表示本轮交互中前景领域，如果当前交互过程中导航领域在前景，则将导航领域的那位参数设置为1，其他全部为0。第二个1*lable表示本轮交互中后景领域，将当前交互过程中所有在后景的领域的参数设置为1，其他全部为0。

在一些实施例中，步骤S220为，将本轮内容特征、本轮领域词占比特征、个性化特征和监督信息输入至领域预测模型的推理层，得到与本轮交互文本对应的领域概率分布。

以图2为例，将本轮内容特征(忘情水)、本轮领域词占比特征(领域词占比)、个性化特征(personal_matrix)和监督信息(his_attention_vec)输入至领域预测模型的推理层，可以得到与本轮交互文本对应的领域概率分布(domain)。

步骤S222为，将带领域信息占比的文本表达、带领域分类信息的文本表达、个性化特征(personal_matrix)以及监督信息输入至推理层的第二层结构，得到与本轮交互文本对应的领域概率分布。

以图2所示的领域预测模型为例，将个性化特征(personal_matrix)转换为矩阵pers_vec，转换方式包括但不限于，将用来表示本轮交互中前景领域的第一个矩阵与用来表示本轮交互中后景领域的第二个矩阵直接相加；或者将用来表示本轮交互中前景领域的第一个矩阵与用来表示本轮交互中后景领域的第二个矩阵加权相加等方式。

对带领域信息占比的文本表达(sent_vec)、带领域分类信息的文本表达(attention_label_vec)、个性化特征(pers_vec)以及监督信息(his_attention_vec)进行全连接，

fc_vec＝[attention_label_vec,sent_vec,pers_vec,his_attention_vec]

fc＝weight*(fc_vec*fc_vec^T)+b，

得到与本轮交互文本对应的领域概率分布(domain)。

在本发明的一个实施例中，领域预测方法包括：将上一轮交互文本、上一轮交互文本在语义理解后确定的领域信息输入至领域预测模型的第一部分，得到监督信息，监督信息用于表征矫正后的与上一轮交互文本对应的领域概率分布；将本轮交互文本、个性化特征以及监督信息输入至领域预测模型的第二部分，得到与本轮交互文本对应的领域概率分布，其中，个性化特征用于表征本轮交互中的关联信息；基于与本轮交互文本对应的领域概率分布，确定领域预测结果；领域预测模型为，预先以多轮交互文本数据为样本，以预先确定的与多轮交互文本数据对应的多轮交互的领域概率分布为样本标签训练得到。

本方案在充分使用深度神经网络的泛化能力的基础上，通过使用用户上一轮的表达内容、上一轮表达内容最终的语义理解的领域信息以及本轮交互过程中可以提取的个性化特征，共同预测本轮表达内容的领域。从而解决现有方案在多轮交互过程中模型预测准确率不高的问题。

下面参考图3描述本发明实施例的领域预测模型的训练过程。

如图3所示，左边的部分是上一轮交互的文本，右边的部分是本轮交互的文本；本案将上一轮交互输入的文体命名为his_sent，本轮交互输入的文本命名为sent。

左边的部分，先将用户上一轮交互的文本his_sent，经过Bi-LSTM编码后得到his_sent_veco，his_sent_veco直接和his_arc_vec进行attention，得到原始文本的句子表达his_sent_vec，his_sent_vec矩阵反应了领域信息在原始文本句子的占比。

his_sent_veco＝Bi-LSM(his_sent)

his_sent_vec＝attention(his_sent_veco,his_arc_vec)

然后将his_sent_veco、his_arc_vec与his_label_embedding(his_label_embedding是模型在训练过程中生成的矩阵，该矩阵表示的是模型预测的时候，学习到的各个领域的信息，矩阵维度是label*256)进行attention，计算出上一轮交互文本的在领域上的特征矩阵，生成his_attention_label_vec。

最后将his_attention_label_vec和his_sent_vec进行全连接操作，即

为了让模型更好地去学习上一轮交互文本weight，上面使用了损失函数，

其中y_i表示预测上一轮交互文本在各个领域上的得分，y是一个1*label的矩阵，矩阵的哪一位得分越高，表示模型认为上一轮交互文本预测属于那一位对应的领域的概率越大；y_i-表示模型实际输出。

通过使用交叉熵损失函数，使得在模型训练的时候，模型预测的结果越来越接近正确的结果。

如图3所示，基于带领域信息占比的文本表达(his_sent_vec)和带领域分类信息的文本表达(his_attention_label_vec)，确定上一轮交互文本对应的领域概率分布(his_attention_veco)。

右边的部分中，对本轮交互文本进行处理过程中，前面处理逻辑和左边的处理一模一样。在获取到本轮交互的attention_label_vec矩阵之后，对上一轮交互文本的his_attention_veco、pers_vec、sent_vec、attention_label_vec进行全连接操作。即：

fc_vec＝[attention_label_vec,sent_vec,pers_vec,his_attention_veco]

fc＝weight*(fc_vec*fc_vec^T)+b

同理，为了让模型更好的去学习本轮交互文本的wegiht，使用了和上一轮交互相同的损失函数，

其中J_i表示预测本轮交互文本在各个领域上的得分，J_i-表示模型实际输出。

上述训练过程，需要输入与上一轮交互文本对应的领域概率分布标签his_domain_label，与本轮交互文本对应的领域概率分布标签domain_label。

领域预测模型的应用过程和模型训练过程的输入网络拓扑结果略有不同，不同的地方在于上一轮交互的网络拓扑结构中，需要输入上一轮交互文本在语义理解后的确定的领域矩阵his_label_matrix。

在领域预测模型的应用网络中，计算监督信息his_attention_vec的时候，相比训练模型中确定his_attention_veco而言，多了一个his_label_vec矩阵。在实际模型测试的时候，经过一系列语义理解后的上一轮交互文本的领域矩阵是his_label_matrix，具体his_label_vec计算公式如下：

his_label_vec＝his_label_matrix^T*his_label_matrix

his_attention_vec＝[his_sent_vec,his_attention_label_vec,his_label_vec]

fc_vec＝[attention_label_vec,sent_vec,pers_vec,his_attention_vec]

fc＝weight*(fc_vec*fc_vec^T)+b

将his_label_matrix的转置矩阵和his_label_matrix相乘，得到his_label_vec，his_label_vec的矩阵维度变大，信息量变丰富。在领域预测模型预测本轮交互文本的领域时，his_label_vec的目的用于监督本轮交互的模型预测结果。例如在上一轮交互文本预测过程中，上一轮领域预测模型预测的领域与上一轮语义理解后的领域一致时(假设为音乐领域)，his_sent_vec中属于音乐领域的权重将会加强，其他领域的权重就会减弱；当上一轮领域预测模型预测的领域与上一轮语义理解后的领域不一致时(假设模型预测为音乐领域，实际语义理解的领域为故事领域)，则his_sent_vec中属于故事领域的权重就会加强，其他领域的权重就会减弱，在预测本轮交互文本属于某一个领域时，就会更加不相信音乐领域，反而会更加相信本轮交互文本为故事领域。

本发明实施例的领域预测方法，在充分使用深度神经网络的泛化能力的基础上，通过使用用户上一轮的表达内容、上一轮表达内容最终的语义理解的领域信息以及本轮交互过程中可以提取的个性化特征，共同预测本轮表达内容的领域，可以解决现有方案在多轮交互过程中模型预测准确率不高的问题。

下面对本发明实施例提供的领域预测装置进行描述，下文描述的领域预测装置与上文描述的领域预测方法可相互对应参照。

如图4所示，本发明实施例的领域预测装置，包括：文本确定单元710，用于确定本轮交互文本；概率分布确定单元720，用于将本轮交互文本和监督信息输入至领域预测模型，得到领域预测模型输出的与本轮交互文本对应的领域概率分布，其中，监督信息为基于上一轮交互文本在语义理解后确定的领域信息，对领域预测模型输出的与上一轮交互文本对应的领域概率分布进行修正获得；领域确定单元730，用于基于与本轮交互文本对应的领域概率分布，确定领域预测结果；其中领域预测模型为，预先以多轮交互文本数据为样本，以预先确定的与多轮交互文本数据分别对应的领域概率分布为样本标签训练得到。

图5示例了一种电子设备的实体结构示意图，如图5所示，该电子设备可以包括：处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840，其中，处理器810，通信接口820，存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令，以执行领域预测方法，该方法包括：确定本轮交互文本；将所述本轮交互文本和监督信息输入至领域预测模型，得到所述领域预测模型输出的与所述本轮交互文本对应的领域概率分布，其中，所述监督信息为基于上一轮交互文本在语义理解后确定的领域信息，对所述领域预测模型输出的与所述上一轮交互文本对应的领域概率分布进行修正获得；基于所述与所述本轮交互文本对应的领域概率分布，确定领域预测结果；所述领域预测模型为，预先以多轮交互文本数据为样本，以预先确定的与所述多轮交互文本数据分别对应的领域概率分布数据为样本标签训练得到。

需要说明的是，本实施例中的电子设备在具体实现时可以为服务器，也可以为PC机，还可以为其他设备，只要其结构中包括如图5所示的处理器810、通信接口820、存储器830和通信总线840，其中处理器810，通信接口820，存储器830通过通信总线840完成相互间的通信，且处理器810可以调用存储器830中的逻辑指令以执行上述方法即可。本实施例不对电子设备的具体实现形式进行限定。

此外，上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

进一步地，本发明实施例公开一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的执行领域预测方法，该方法包括：确定本轮交互文本；将所述本轮交互文本和监督信息输入至领域预测模型，得到所述领域预测模型输出的与所述本轮交互文本对应的领域概率分布，其中，所述监督信息为基于上一轮交互文本在语义理解后确定的领域信息，对所述领域预测模型输出的与所述上一轮交互文本对应的领域概率分布进行修正获得；基于所述与所述本轮交互文本对应的领域概率分布，确定领域预测结果；所述领域预测模型为，预先以多轮交互文本数据为样本，以预先确定的与所述多轮交互文本数据分别对应的领域概率分布数据为样本标签训练得到。

另一方面，本发明实施例还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各实施例提供的执行领域预测方法，该方法包括：确定本轮交互文本；将所述本轮交互文本和监督信息输入至领域预测模型，得到所述领域预测模型输出的与所述本轮交互文本对应的领域概率分布，其中，所述监督信息为基于上一轮交互文本在语义理解后确定的领域信息，对所述领域预测模型输出的与所述上一轮交互文本对应的领域概率分布进行修正获得；基于所述与所述本轮交互文本对应的领域概率分布，确定领域预测结果；所述领域预测模型为，预先以多轮交互文本数据为样本，以预先确定的与所述多轮交互文本数据分别对应的领域概率分布数据为样本标签训练得到。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种领域预测方法，其特征在于，包括：

确定本轮交互文本；

将所述本轮交互文本和监督信息输入至领域预测模型，得到所述领域预测模型输出的与所述本轮交互文本对应的领域概率分布，其中，所述监督信息为基于上一轮交互文本在语义理解后确定的领域信息，对所述领域预测模型输出的与所述上一轮交互文本对应的领域概率分布进行修正获得；所述监督信息具体通过将所述领域信息与所述上一轮交互文本对应的领域概率分布进行全连接得到；

基于所述与所述本轮交互文本对应的领域概率分布，确定领域预测结果；

所述领域预测模型为以多轮交互文本数据为样本，以预先确定的与所述多轮交互文本数据分别对应的领域概率分布数据为样本标签训练得到。

2.根据权利要求1所述的领域预测方法，其特征在于，所述监督信息按照如下步骤获得：

获得所述上一轮交互文本在语义理解后确定的领域信息；

将所述上一轮交互文本输入至所述领域预测模型，得到所述领域预测模型输出的与所述上一轮交互文本对应的领域概率分布；

基于所述领域信息及与所述上一轮交互文本对应的领域概率分布确定所述监督信息。

3.根据权利要求1所述的领域预测方法，其特征在于，所述将所述本轮交互文本和监督信息输入至领域预测模型，得到所述领域预测模型输出的与所述本轮交互文本对应的领域概率分布，包括：

将所述本轮交互文本输入至所述领域预测模型的预处理层，得到本轮内容特征和本轮领域词占比特征，所述本轮内容特征用于表征所述本轮交互文本的表达内容，所述本轮领域词占比特征用于表征所述本轮交互文本的各个领域实体的长度占所述本轮交互文本的占比；

将所述本轮内容特征、所述本轮领域词占比特征和所述监督信息输入至所述领域预测模型的推理层，得到所述与所述本轮交互文本对应的领域概率分布。

4.根据权利要求3所述的领域预测方法，其特征在于，所述将所述本轮内容特征、所述本轮领域词占比特征和所述监督信息输入至所述领域预测模型的推理层，得到所述与所述本轮交互文本对应的领域概率分布，包括：

将所述本轮内容特征和所述本轮领域词占比特征输入至所述推理层的第一层结构，得到带领域信息占比的文本表达以及带领域分类信息的文本表达，所述带领域信息占比的文本表达用于表征所述本轮交互文本的领域信息，所述带领域分类信息的文本表达用于表征所述本轮交互文本的预测领域占比权重；

将所述带领域信息占比的文本表达、所述带领域分类信息的文本表达以及所述监督信息输入至所述推理层的第二层结构，得到所述与所述本轮交互文本对应的领域概率分布。

5.根据权利要求4所述的领域预测方法，其特征在于，所述带领域分类信息的文本表达基于所述本轮内容特征、所述本轮领域词占比特征和所述领域预测模型的领域分类信息的权重确定，且领域分类信息的权重根据所述领域预测模型在训练过程学习到的各个领域信息确定。

6.根据权利要求1-5中任一项所述的领域预测方法，其特征在于，所述将所述本轮交互文本和监督信息输入至领域预测模型，包括：

将所述本轮交互文本、所述监督信息和个性化特征输入至所述领域预测模型，其中，所述个性化特征用于表征本轮交互中的关联信息。

7.根据权利要求6所述的领域预测方法，其特征在于，所述个性化特征包括本轮交互的前景领域特征和本轮交互的后景领域特征。

8.一种领域预测装置，其特征在于，包括：

文本确定单元，用于确定本轮交互文本；

概率分布确定单元，用于将所述本轮交互文本和监督信息输入至领域预测模型，得到所述领域预测模型输出的与所述本轮交互文本对应的领域概率分布，其中，所述监督信息为基于上一轮交互文本在语义理解后确定的领域信息，对所述领域预测模型输出的与所述上一轮交互文本对应的领域概率分布进行修正获得；所述监督信息具体通过将所述领域信息与所述上一轮交互文本对应的领域概率分布进行全连接得到；

领域确定单元，用于基于所述与所述本轮交互文本对应的领域概率分布，确定领域预测结果；其中

所述领域预测模型为，预先以多轮交互文本数据为样本，以预先确定的与所述多轮交互文本数据分别对应的领域概率分布为样本标签训练得到。

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至8任一项所述领域预测方法的步骤。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1至8任一项所述的领域预测方法的步骤。