CN111046132B

CN111046132B - 一种检索多轮对话的客服问答处理方法及其***

Info

Publication number: CN111046132B
Application number: CN201911022722.6A
Authority: CN
Inventors: 冯璠; 雷画雨; 王恒
Original assignee: Zhongan Information Technology Service Co Ltd
Current assignee: Zhongan Information Technology Service Co Ltd
Priority date: 2019-10-25
Filing date: 2019-10-25
Publication date: 2023-06-16
Anticipated expiration: 2039-10-25
Also published as: CN111046132A

Abstract

一种检索多轮对话的客服问答处理方法及其***，其中客服问答处理方法包括：获取用户输入的当前信息；根据当前信息识别归属的业务领域，从业务领域中筛选多条候选回复信息，以及提取用户输入的与业务领域相关的历史信息；将每一条候选回复信息与当前信息、历史信息构成的上下文信息进行检索匹配，得到对应的匹配度得分；确定最高的匹配度得分对应的候选回复信息作为当前信息的回复内容。在依据业务领域确定当前信息的回复内容时，是将每一条候选回复信息与当前信息、历史信息构成的上下文信息进行检索匹配，可以避免仅与当前信息进行检索匹配的局限问题，能够从上下文的语境中准确理解用户的真实意图，提高检索匹配的准确度。

Description

一种检索多轮对话的客服问答处理方法及其***

技术领域

本发明涉及信息处理技术领域，具体涉及一种检索多轮对话的客服问答对话处理方法及其***。

背景技术

智能客服***是在大规模知识处理基础上发展起来的一项面向行业应用的，适用大规模知识处理、自然语言理解、知识管理、自动问答、推理等技术行业，智能客服不仅为企业提供了细粒度的知识管理技术，还为企业与海量用户之间的沟通建立了一种基于自然语言的快捷有效的技术手段，同时还能够为企业提供精细化管理所需的统计分析信息。

目前，智能客服在保险行业中发挥着越来越重要的作用，能够在保险售前咨询、服务指引、导购、健康核保、费率计算以及售后核赔等多个环节取代人工，提高服务时效，降低运营成本，并正融入更多AI技术解决更多基础性重复性问题。

但是，以往的智能客服多轮对话交互过程中，多是简单地将用户问题语句连接起来，这样会存在一些缺点：1)忽略了历史轮次问题之间的交互关系；2)上下文存在冗长和冗余的情形，相当于引入很多噪音，造成较低的答复准确率。由于这些缺点造成的不利影响，使得智能客服***无法准确获取用户意图，影响用户获取信息的效率和体验感。

发明内容

本发明主要解决的技术问题是如何提高现有智能客服***的答复准确率和用户体验感。

根据第一方面，一种实施例中提供一种检索多轮对话的客服问答处理方法，包括以下步骤：获取用户输入的当前信息；根据所述当前信息识别归属的业务领域，从所述业务领域中筛选多条候选回复信息，以及提取所述用户输入的与所述业务领域相关的历史信息；将每一条所述候选回复信息与所述当前信息、所述历史信息构成的上下文信息进行检索匹配，得到对应的匹配度得分；确定最高的匹配度得分对应的所述候选回复信息作为所述当前信息的回复内容。

所述根据所述当前信息识别归属的业务领域，包括：对所述当前信息进行文本编码，得到文本向量表示；对所述文本向量表示进行特征归纳，得到所述当前信息的归类特征，依据所述当前信息的归类特征识别得到一个或多个领域及各自的向量表示；将所述文本向量表示与各个所述领域的向量表示分别进行关系度量，得到归类到各个所述领域的概率值；根据所述概率值从各个所述领域中确定所述当前信息应当归属的业务领域。

所述根据所述概率值从各个所述领域中确定所述当前信息应当归属的业务领域，包括：判断归类到每个所述领域的概率值大于或等于该领域的第一预设阈值，则设置该领域为待确定业务；遍历各个所述领域且设置有一个或多个待确定业务时，则检测每个所述待确定业务是否属于预设业务相关的领域，若是则将所述当前信息识别为应当归属的业务领域，直至检测完成各个所述待确定业务；在各个所述待确定业务均不属于预设业务相关的领域时，则向所述用户发出闲聊信息，所述闲聊信息包括随机形成的推荐内容。

若遍历各个所述领域且未设置有待确定业务时，则判断归类到每个所述领域的概率值是否大于或等于该领域的第二预设阈值，若是则设置该领域为待澄清业务，若否则设置该领域为拒识业务；所述第二预设阈值小于所述第一预设阈值；遍历各个所述领域且设置有一个或多个待澄清业务时，则向所述用户发出问题澄清信息，以便所述用户从各个所述待澄清业务中确认至少一个所述领域；遍历各个所述领域且未设置有待澄清业务时，则将所述用户转接至人工客服。

所述将每一条所述候选回复信息与所述当前信息、所述历史信息构成的上下文信息进行检索匹配，得到对应的匹配度得分，包括：将所述当前信息和所述历史信息构成上下文信息，所述上下文信息包括所述用户输入的与所述业务领域相关的至少两个语境问题；利用多个粒度的文本处理模型对每一个所述语境问题进行文本分析，以及对每一条所述候选回复信息进行文本分析，得到该语境问题对应的多种粒度表示和该条所述候选回复信息对应的多种粒度表示；将各个所述语境问题对应的多种粒度表示和每一条所述候选回复信息对应的多种粒度表示进行交互处理，计算得到该条所述候选回复信息对应的交互表示序列；根据预设的循环神经网络对所述交互表示序列进行向量匹配处理，输出对应的匹配度得分。

所述多个粒度的文本处理模型包括以下模型中的至少两者：基于卷积神经网络的字向量表示模型、Word2Vec词向量表示模型、局部语境化语义向量表示模型、序列语境化语义向量表示模型、自注意力机制语义向量表示模型、交互注意力语义向量表示模型。

所述将各个所述语境问题对应的多种粒度表示和每一条所述候选回复信息对应的多种粒度表示进行交互处理，计算得到该条所述候选回复信息对应的交互表示序列，包括：若定义每一个所述语境问题为U_i，每一个所述候选回复信息为R_r，其中i、r分别为语境问题序号、候选回复序号；计算R_r关于U_i的加权表示，用公式表示为

其中，

表示U_i的第j列参数，/>

对表示R_r的第k列参数，k为粒度表示序号，exp()为指数函数，tanh()为双曲正切函数，n_r表示R_r对应的第r条候选回复信息的总词数，/>

W_a、b_a均表示超参数；对/>

和/>

进行交互运算，得到

其中，f()表示交互函数，ReLU()表示激活函数，W_p、b_p均表示超参数；根据t_i,j得到R_r对应的交互表示序列

其中n_i表示U_i的总列数。

所述根据预设的循环神经网络对所述交互表示序列进行向量匹配处理，输出对应的匹配度得分，包括：利用预设的循环神经网络将所述交互表示序列

归纳为第一向量V_i，得到匹配向量列表(V₁,...,V_i,....,V_m)，其中m为所述语境问题的总个数；再利用所述循环神经网络将所述匹配向量列表(V₁,...,V_i,....,V_m)归纳为第二向量C_r，将所述第二向量C_r通过一线性层之后，输出第r条所述候选回复消息对应的匹配度得分，直至得到各条所述候选回复消息对应的匹配度得分。

根据第二方面，一种实施例中提供一种客服问答处理***，包括：通信服务模块，用于接收用户输入的咨询信息，所述咨询信息包括所述用户输入的当前信息和历史信息；问答处理模块，与所述通信服务模块连接，用于根据上述第一方面中所述的客服问答处理方法确定所述当前信息的回复内容；响应回复模块，与所述问答处理模块连接，用于向所述用户反馈已确定的回复内容。

根据第三方面，一种实施例中提供一种计算机可读存储介质，包括程序，所述程序能够被处理器执行以实现上述的第三方面中所述的客服问答处理方法。

本申请的有益效果是：

依据上述实施例的一种检索多轮对话的客服问答处理方法及其***，其中客服问答处理方法包括：获取用户输入的当前信息；根据当前信息识别归属的业务领域，从业务领域中筛选多条候选回复信息，以及提取用户输入的与业务领域相关的历史信息；将每一条候选回复信息与当前信息、历史信息构成的上下文信息进行检索匹配，得到对应的匹配度得分；确定最高的匹配度得分对应的候选回复信息作为当前信息的回复内容。第一方面，本申请在对当前信息进行识别归属的业务领域时，根据归类到各个领域的概率值从各个领域中确定当前信息应当归属的业务领域，如此可以提高业务领域的识别准确度，利于精准地回复用户的关注问题；第二方面，本申请在对当前信息进行识别的过程中，不仅可以根据识别结果确定应当归属的业务领域，还考虑到了领域不符合业务要求而进行闲聊回复，领域不清晰而进行澄清回复，以及领域无法识别而转接至人工客服的可能性情况，丰富了客服问答的实施模式，最大限度地满足用户的咨询需要，利于提升用户的咨询体验；第三方面，在依据业务领域确定当前信息的回复内容时，是将每一条候选回复信息与当前信息、历史信息构成的上下文信息进行检索匹配，可以避免仅与当前信息进行检索匹配的局限问题，能够从上下文的语境中准确理解用户的真实意图，提高检索匹配的准确度；第四方面，在计算每一条候选回复信息对应的匹配度得分时，利用多个粒度的文本处理模型对每一个语境问题和每一条候选回复信息分别进行文本分析，从而通过交互处理和向量匹配处理得到匹配度得分，如此可以充分利用不同文本处理模型的优势，增强匹配度得分的可信性，利于从中确定可信度最高的候选回复消息；第五方面，本申请通过通信服务模块、问答处理模块和响应回复模块构建而成的客服问答处理***，能够利用多粒度的文本表示方法将上下文信息与回复内容进行准确地检索匹配，从而实现自然流畅的多轮交互问答要求，可以有效地提高智能客服对话***的效率，为用户提供更高标准的咨询体验，具有很大的实用价值。

附图说明

图1为本申请中检索多轮对话的客服问答处理方法的流程图；

图2为根据当前信息识别归属的业务领域的流程图；

图3为根据归类到各个领域的概率值确定不同情形下客服问答方式的流程图；

图4为通过检索匹配得到对应的匹配度得分的流程图；

图5为领域识别模型的原理示意图；

图6为计算匹配度得分的原理示意图；

图7为客服问答处理方法的原理示意图；

图8为本申请中客服问答处理***的结构示意图。

具体实施方式

下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中，很多细节描述是为了使得本申请能被更好的理解。然而，本领域技术人员可以毫不费力的认识到，其中部分特征在不同情况下是可以省略的，或者可以由其他元件、材料、方法所替代。在某些情况下，本申请相关的一些操作并没有在说明书中显示或者描述，这是为了避免本申请的核心部分被过多的描述所淹没，而对于本领域技术人员而言，详细描述这些相关操作并不是必要的，他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。

另外，说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时，方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此，说明书和附图中的各种顺序只是为了清楚描述某一个实施例，并不意味着是必须的顺序，除非另有说明其中某个顺序是必须遵循的。

本文中为部件所编序号本身，例如“第一”、“第二”等，仅用于区分所描述的对象，不具有任何顺序或技术含义。而本申请所说“连接”、“联接”，如无特别说明，均包括直接和间接连接(联接)。

为清楚地理解本申请的技术方案，这里将对一些技术术语进行解释说明。

文本分类算法，大致分为两类，一类是忽略词序、对文本进行浅层语义建模(代表模型包括LDA，EarthMover’s distance)；一类是考虑词序、对文本进行深层语义建模(代表模型有深度学习算法，比如LSTM、CNN等)。在深度学习模型中，空间模式(spatial pattern)汇总在较低层，有助于表示更高层概念，例如CNN建立卷积特征检测器提取来自局部序列窗口的模式，并使用最大池化来选择明显的特征。

卷积神经网络，(Convolutional Neural Network，CNN)是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现。卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成，同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网络能够利用输入数据的二维结构。与其他深度学习结构相比，卷积神经网络在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。此外，卷积神经网络需要考量的参数较少，使之成为一种颇具吸引力的深度学习结构。

门控循环神经网络，引入了重置门(reset gate)和更新门(update gate)的概念，从而修改了循环神经网络中隐藏状态的计算方式，通过可以学习的门来控制信息的流动，更好地捕捉时间序列中时间步距离较大的依赖关系。

胶囊网络，属于一种特殊的神经网络，用神经元向量代替传统神经网络的单个神经元节点，以动态路由(Dynamic Routing)的方式去训练的一种全新神经网络。因为CNN对空间信息进行建模，需要对特征检测器进行复制，所需复制的特征检测器个数或所需标注数据的数量会随着数据维度呈指数增长，降低了模型效率。以往神经网络对空间不敏感的方法不可避免地受限于丰富的文本结构(比如保存单词的位置信息，语义信息、语法结构等)，然而胶囊网络有效改善了CNN神经网络方法的缺点。

Transformer网络，使用了Attention机制，将序列中的任意两个位置之间的距离是缩小为一个常量；其次它不是类似循环神经网络的顺序结构，因此具有更好的并行性，符合现有的GPU框架。

Word2Vec词向量，是词的特征向量或表征，把词映射为实数域向量。

问答对话***，包括NLU(自然语言理解过程)和NLG(自然语言生成)两个过程。NLU过程是将人的语言转换为机器理解的语言，NLG过程是通过对话***处理后，最后通过自然语言生成的方式给出答案。

下面将结合实施例对本申请的技术方案进行说明。

实施例一、

请参考图1，本申请公开一种检索多轮对话的客服问答处理方法，其包括步骤S100-S400，下面分别说明。

步骤S100，获取用户输入的当前信息。

用户可以在移动终端、计算机、服务机器人等设备输入任意的信息，通常为咨询问题，信息被传输至具备智能客服问答功能的后台服务器，后台服务器获取信息之后进行回复，从而开启用户和后台服务器之间的对话。在两者的多轮对话过程中，用户当前输入的信息可以被称之为当前信息，而用户已经输入且服务器已经回复的信息可以被称之为历史信息。

步骤S200，根据当前信息识别归属的业务领域，从业务领域中筛选多条候选回复信息，以及提取用户输入的与业务领域相关的历史信息。

具备智能客服问答功能的后台服务器在针对用户输入的当前信息进行回复之前，需要从当前信息中准确地确定用户的咨询意图，就需要利用当前信息中所包含的关键词汇、语境、语义等信息来识别咨询问题所指向的知识领域，进而将咨询问题归属到后台服务器所能够支持的业务领域，从而依据自身存储的该些业务知识来进行回复。

步骤S300，将每一条候选回复信息与当前信息、历史信息构成的上下文信息进行检索匹配，得到对应的匹配度得分。

在本实施例中，可以将当前信息和历史信息进行结合，构成上下文信息，通过上下文信息可以通过语境、语义更好地关注到用户的真实意图，如此在利用上下文信息与候选回复信息进行检索匹配时，可以得到更加准确的匹配度得分。

步骤S400，确定最高的匹配度得分对应的候选回复信息作为当前信息的回复内容。匹配度得分是评价消息相关程度的一种量化指标，得分越高，则说明回复内容和咨询问题之间的相关度越高，将最高匹配度得分对应的候选回复信息作为回复内容时，可以针对用户的咨询意图进行准确作答，提升用户的问答体验。

在本实施例中，参见图2，上述的步骤S200中涉及了根据当前信息识别归属的业务领域的处理过程，该处理过程可以通过步骤S210-S240进行具体说明，分别说明如下。

步骤S210，对当前信息进行文本编码，得到文本向量表示。

需要说明的是，计算机、服务器等设备不能够直接处理自然语言，需要对信息进行文本编码，加工得到数字形式且可可识别的文本向量表示。

步骤S220，对文本向量表示进行特征归纳，得到当前信息的归类特征，依据当前信息的归类特征识别得到一个或多个领域及各自的向量表示。

需要说明的是，特征归纳得到的归类特征可以是关键词汇、语境、语义等数字信息，表示不同领域的知识，如此便可以通过这些知识识别得到所属的一个或多个领域。同样地，在计算机、服务器等设备中，知识和所属领域均使用数字形式的向量表示来进行记录。

步骤S230，将文本向量表示与各个领域的向量表示分别进行关系度量，得到归类到各个领域的概率值。关系度量是评价相关程度的计算过程，评价结果往往以概率值进行表示。

在一个具体实施例中，见图5，可以建立一个领域识别模型来对当前信息进行识别和领域归类。例如，采用基于胶囊网络的文本分类模型来对用户输入的当前信息进行处理，该文本分类模型是通过文本分类训练语料来训练学习而得到的，模型主要由编码层、特征归纳层和关系度量层的三个处理模块构成，训练得到最优模型参数之外，还会得到各领域类别的向量表示。在利用基于胶囊网络的文本分类模型进行实际应用的过程中，用户输入的信息会通过编码器编码成文本向量表示，与知识库中各个领域的向量表示进行比较，计算相近程度，从而得到归类到各领域的概率值。

步骤S240，根据归类到各个领域的概率值从各个领域中确定当前信息应当归属的业务领域。在一个具体实施例中，参见图3，步骤240可以包括步骤S241-S249以及步骤S251-S253，分别说明如下。

步骤S241，判断归类到每个领域的概率值是否大于或等于该领域的第一预设阈值，若是则进入步骤S242，反之进入步骤S247。

这里的第一预设阈值是人为设置的认定标准，大于或等于该领域的第一预设阈值时，则表明用户输入的当前信息的真实意思已经清晰明了，可以被机器理解并划分入某一个具体的知识领域内。

步骤S242，设置与该概率值对应的领域为待确定业务。此外，根据步骤S241的方法遍历步骤S220中识别得到的领域之后，就可以设置有一个或多个待确定业务。

步骤S243，检测每个待确定业务是否属于预设业务相关的领域，若是则进入步骤S244，反之进入步骤S246。

后台服务器往往只能回复与自身所支持的业务范围相关的内容，所以这里需要进一步地确认待确定业务是属于支持的业务领域(如保险行业中的投保、理赔业务，律师行业的侵权、法律业务，或者是其它行业中的业务)，还是属于非相关的业务领域。

步骤S244，将当前信息识别为应当归属的业务领域。此外，根据步骤S243的方法遍历各个待确定业务，直至检测完成各个待确定业务之后，就可以得到一个或者多个应当归属的业务领域。

步骤S245，从所确定的一个或多个业务领域中筛选出多条候选回复消息。具体地，可以在每个业务领域中筛选出若干条候选回复信息，从而组成这里的多条候选回复消息。

步骤S246，在各个待确定业务均不属于预设业务相关的领域时，则表明用户提出的咨询问题超出了后台服务器的业务处理范围，此时可以向用户发出闲聊信息，闲聊信息可以包括随机形成的推荐内容，通过这种方式既可以让用户注意到所提问题超出了咨询服务的范围，可以避免什么都不进行回复的尴尬情形。

步骤S247，在判断归类到每个领域的概率值小于该领域的第一预设阈值时进入此步骤。可以根据步骤S241的方法遍历各个领域，可能会出现每个领域的概率值均小于该领域的第一预设阈值的情况，此时认为未设置有待确定业务。

步骤S248，判断归类到每个领域的概率值是否大于或等于该领域的第二预设阈值，若是则进入步骤S249，反之进入步骤S252。

这里的第二预设阈值也是人为设置的认定标准，大于或等于该领域的第二预设阈值时，则表明用户输入的当前信息能够被机器理解，但是还存在一定的歧义，可能是用户把多个意图杂糅在一句话中，或是用户在表达意图之前铺垫了很长，这些情况需要与用户进行进一步地澄清。

步骤S249，设置该概率值对应的领域为待澄清业务。可以根据步骤S248的方法遍历各个领域，就可以设置一个或多个待澄清业务，也就是说用户的咨询问题中同时包括了多个知识领域，需要对这些知识领域进行核实。

步骤S251，遍历各个领域且设置有一个或多个待澄清业务时，可以向用户发出问题澄清信息，以便用户从各个待澄清业务中确认至少一个领域，如此可以让后台服务器清晰明了地得知用户的真实意图。

步骤S252，在判断归类到每个领域的概率值小于该领域的第二预设阈值时进入此步骤。可以根据步骤S248的方法遍历各个领域，可能会出现每个领域的概率值均小于该领域的第二预设阈值的情况，此时可以认为未设置有待澄清业务，也就是说用户的所提出的咨询问题都为拒识状态，后台服务器根本无法得知用户的真实意图和模糊意图，机器已经无法再继续受理用户的咨询问题了，此时可以进入步骤S253。

步骤S253，将用户转接至人工客服，由客服人员来与用户进行沟通，人与人之间的沟通可以更好地理解用户的表达。

在本实施例中，参见图4，上述的步骤S300中涉及计算每一条候选回复信息对应的匹配度得分的过程，可以通过步骤S310-S340来进行具体说明，分别说明如下。

步骤S310，将当前信息和历史信息构成上下文信息，这里的上下文信息包括用户输入的与业务领域相关的至少两个语境问题。

可以理解，用户在当前对话或者是历史对话中每次输入的信息都可以看做是一个咨询性质的问题，那么在多轮对话中就将是多个咨询性质的问题。如果当前信息与所归属的一个或多个业务领域有关，那么历史对话中也可能存在一个或多个问题与这些业务领域有关，将均与该些业务领域有关的问题进行标记，就可以得到至少两个同一语境下的问题，可以将同一语境下的每个问题称之为语境问题。

步骤S320，利用多个粒度的文本处理模型对每一个语境问题进行文本分析，以及对每一条候选回复信息进行文本分析，得到该语境问题对应的多种粒度表示和该条候选回复信息对应的多种粒度表示。

在本实施例中，多个粒度的文本处理模型包括以下模型中的至少两者：基于卷积神经网络的字向量表示模型、Word2Vec词向量表示模型、局部语境化语义向量表示模型、序列语境化语义向量表示模型、自注意力机制语义向量表示模型、交互注意力语义向量表示模型。

这里将对每一个粒度的文本处理模型进行简要说明。1)基于卷积神经网络的字向量表示模型，是将用户问题中的文本词汇切成字，通过字向量模型转化为字向量表示后，并通过卷积神经网络和最大池化操作得到词汇的向量表示，该方法能够编码词汇中字的共现信息，可处理对话中出现的错别字等非常规表达的问题。2)Word2Vec词向量表示模型，是编码词汇在语料中的共现信息。3)局部语境化语义向量表示模型，是对用户问句进行Word2Vec词向量表示并应用卷积神经网络和最大池化操作，对词之间的局部依赖进行建模。4)序列语境化语义向量表示模型，是对用户问句进行Word2Vec词向量化并应用门控循环神经网络操作，捕捉词汇之间的序列关系。5)自注意力机制语义向量表示模型，是对用户问句进行Word2Vec词向量化，并应用Transformer网络进行Self-attention操作，输入的K和V都是用户问句，句中每个词由此可被句中相似的词所表示，能够将句中远程词之间的依赖进行编码，建模句子中词汇的全局依赖信息。6)交互注意力机制语义向量表示模型，分别对用户问句和候选回复进行Word2Vec词向量表示，应用Transformer网络进行Cross-attention操作，输入K和V分别是用户问句和候选回复，由此用户问句中的词可用候选回复中相似的词进行表示，能够建立用户问句和候选回复直接的联系，提取出问题和回复匹配时需要的关键信息。

本领域的技术人员可以理解，上面所提及的每个粒度的文本向量表示模型都是技术人员常用的文本处理工具，均属于现有技术，通过目前已经公开的技术文献即可获知，为避免赘述，这里将不对该些文本向量表示模型进行的工作原理和应用方式进行限制和具体说明。

步骤S330，将各个语境问题对应的多种粒度表示和每一条候选回复信息对应的多种粒度表示进行交互处理，计算得到该条候选回复信息对应的交互表示序列。

在一个具体实施例中，若定义每一个语境问题为U_i，每一个候选回复信息为R_r，其中i、r分别为语境问题序号、候选回复序号。则可以计算R_r关于U_i的加权表示，用公式表示为

其中，

表示U_i的第j列参数，/>

W_a、b_a均表示超参数。

进一步地，对

和/>

进行交互运算，得到

其中，f()表示交互函数，ReLU()表示激活函数，W_p、b_p均表示超参数。

进一步地，根据t_i,j得到R_r对应的交互表示序列

其中n_i表示U_i的总列数。

步骤S340，根据预设的循环神经网络对交互表示序列进行向量匹配处理，输出对应的匹配度得分。

在一个具体实施例中，可以利用预设的循环神经网络将交互表示序列

归纳为第一向量V_i，得到匹配向量列表(V₁,...,V_i,....,V_m)，其中m为所述语境问题的总个数。

进一步地，再利用该循环神经网络将匹配向量列表(V₁,...,V_i,....,V_m)归纳为第二向量C_r，将第二向量C_r通过一线性层之后，输出第r条候选回复消息对应的匹配度得分，直至得到各条候选回复消息对应的匹配度得分。

需要说明的是，本实施例中提及的循环神经网络可以是门控循环神经网络(GatedRecurrent Unit，GRU)，GRU引入了重置门(reset gate)和更新门(update gate)的概念，从而修改了以往循环神经经络中隐藏状态的计算方式，通过可以学习的门来控制信息的流动，更好地捕捉时间序列中时间步距离较大的依赖关系。GRU的输入是一个序列，序列的每一步都是一个向量，输出一般是隐藏层最后一步的隐藏状态向量。

需要说明的是，本实施例中涉及的线性层(Linear layer)是神经网络的常见结构层，而神经网络的线性层可以实现对数据进行仿射变换的操作，能够对特征进行组合的功能。由于门控循环神经网络和线性层均属于现有技术的范畴，所以这里不再对其进行详细说明。

在一个具体实施中，参见图6，上述步骤S310-S340可以归纳为文本表示阶段和候选回复匹配阶段，分别说明如下。

在文本表示阶段，各个语境问题可以表示为语境问题为U₁至语境问题U_m，通过6个粒度的文本向量表示模型分别对该些语境问题进行文本分析，得到语境问题U₁对应的6种粒度表示，语境问题U_i对应的6种粒度表示，依次类推。那么，针对候选回复信息中的一个候选回复信息R_r，通过6个粒度的文本向量表示模型对该候选回复信息R_r进行文本分析，得到候选回复信息R_r对应的6种粒度表示。

在候选回复匹配阶段，可以通过步骤S330中所介绍的计算方法，将各个语境问题(U₁至U_m)对应的多种粒度表示和条候选回复信息R_r对应的多种粒度表示进行交互处理，从而计算得到该条候选回复信息R_r对应的交互表示序列

利用门控循环神经网络GRU可以将交互表示序列/>

归纳为第一向量V_i，得到匹配向量列表(V₁,...,V_i,....,V_m)，再利用该循环神经网络GRU将匹配向量列表(V₁,...,V_i,....,V_m)归纳为第二向量C_r，将第二向量C_r通过线性层之后，输出第r条候选回复消息R_r对应的匹配度得分。

可以理解，通过文本表示阶段和候选回复匹配阶段可以处理得到各条候选回复消息(R₁、…，R_r，…，R_n，其中n表示选回复信息的总数量)对应的匹配度得分。

为了使本领域的技术人员可以清楚地了解本申请的技术方案，这里根据图6和图7对本实施例中的客服问答处理方法进行工作原理的说明。

可以将客户问答处理方法分为用户输入过程、NLU(自然语言理解)解析过程、NLU(自然语言理解)输出过程、NLG(自然语言生成)过程、查库过程和回复输出过程。

在用户输入过程中，通过多轮对话，可以得到用户输入的当前信息和历史信息。

在NLU解析过程中，可以通过步骤S230中介绍的领域识别模型对当前信息和历史信息分别进行语言解析，得到当前信息归类到各个领域的概率值(历史信息的处理过程可以参考当前信息，这里不再进行赘述)。可以通过步骤S240得到三种识别结果：无法确定领域(即未设置有待澄清业务的情况)、结果待澄清(即设置一个或多个待澄清业务的情况)、可确定领域(即设置有一个或多个待确定业务的情况)。

在NLU输出过程中，可以在无法确定领域时将用户转接至人工客服，在结果待澄清时进行问题澄清处理，在可确定领域时进一步地判断是否属于预设业务相关的领域。

在NLG过程中，在可确定领域时还可以进一步地得到不属于业务领域(即不的情况)和属于业务领域(即属于预设业务相关的领域的情况)的结果，当得到不属于业务领域时进行闲聊回复处理，当得到属于业务领域时进行检索匹配处理。

在查库过程中，基于当前信息归属的业务领域来访问相应的日志库，在日志库中筛选出多条候选回复消息并存在候选池中，等待对该些候选回复消息进行进一步地检索匹配处理，从而确定最高的匹配度得分对应的候选回复信息作为当前信息的回复内容。

在回复输出过程中，在闲聊回复处理的情况下，向用户发送闲聊的回复内容；在检索匹配处理的情况下，向用户发送最高匹配度得分对应的候选回复信息。

本领域的技术人员可以理解，通过上述的步骤S100-S400可以实现以下的应用优势：(1)对当前信息进行识别归属的业务领域时，根据归类到各个领域的概率值从各个领域中确定当前信息应当归属的业务领域，如此可以提高业务领域的识别准确度，利于精准地回复用户的关注问题；(2)对当前信息进行识别的过程中，不仅可以根据识别结果确定应当归属的业务领域，还考虑到了领域不符合业务要求而进行闲聊回复，领域不清晰而进行澄清回复，以及领域无法识别而转接至人工客服的可能性情况，丰富了客服问答的实施模式，最大限度地满足用户的咨询需要，利于提升用户的咨询体验；(3)在依据业务领域确定当前信息的回复内容时，是将每一条候选回复信息与当前信息、历史信息构成的上下文信息进行检索匹配，可以避免仅与当前信息进行检索匹配的局限问题，能够从上下文的语境中准确理解用户的真实意图，提高检索匹配的准确度；(4)在计算每一条候选回复信息对应的匹配度得分时，利用多个粒度的文本处理模型对每一个语境问题和每一条候选回复信息分别进行文本分析，从而通过交互处理和向量匹配处理得到匹配度得分，如此可以充分利用不同文本处理模型的优势，增强匹配度得分的可信性，利于从中确定可信度最高的候选回复消息。

实施例二、

请参考图8，在实施例一中公开的客服问答处理方法的基础上，本申请还公开一种客服问答处理***1，其包括通信服务模块11、问答处理模块12和响应回复模块13，下面分别说明。

通信服务模块11，用于接收用户输入的咨询信息，咨询信息包括用户输入的当前信息和历史信息。

需要说明的是，通信服务模块11可以是移动终端、计算机、服务机器人上的信息输入部件，用户可以据此信息输入部件输入任意的信息。用户输入的信息通常为咨询问题，信息被传输至具备智能客服问答功能的后台服务器，后台服务器获取信息之后进行回复，从而开启用户和后台服务器之间的对话。在两者的多轮对话过程中，用户当前输入的信息可以被称之为当前信息，而用户已经输入且服务器已经回复的信息可以被称之为历史信息。

问答处理模块12与通信服务模块11连接，其可以是后台服务器上的数据处理单元，其主要根据实施例一中公开的客服问答处理方法确定当前信息的回复内容，还可以根据当前信息的领域识别结果选择进入人工客服的应对机制、问题澄清处理的应对机制、闲聊回复处理的应对机制和检索匹配处理的应对机制。问答处理模块12的具体功能可以参考实施例一，这里不再进行赘述。

响应回复模块13与问答处理模块12和通信服务模块11连接，其可以包括业务领域相关的日志库，可以响应于问答处理模块的查库要求而输出一些候选回复消息，还可以将候选回复消息和闲聊回复消息及时地发送至通信服务模块11，以便用户进行查收。

本领域的技术人员可以理解，本申请通过通信服务模块、问答处理模块和响应回复模块构建而成的客服问答处理***，能够利用多粒度的文本表示方法将上下文信息与回复内容进行准确地检索匹配，从而实现自然流畅的多轮交互问答要求，可以有效地提高智能客服对话***的效率，为用户提供更高标准的咨询体验，具有很大的实用价值。

本领域技术人员可以理解，上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现，也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器、随机存储器、磁盘、光盘、硬盘等，通过计算机执行该程序以实现上述功能。例如，将程序存储在设备的存储器中，当通过处理器执行存储器中程序，即可实现上述全部或部分功能。另外，当上述实施方式中全部或部分功能通过计算机程序的方式实现时，该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中，通过下载或复制保存到本地设备的存储器中，或对本地设备的***进行版本更新，当通过处理器执行存储器中的程序时，即可实现上述实施方式中全部或部分功能。

以上应用了具体个例对本发明进行阐述，只是用于帮助理解本发明，并不用以限制本发明。对于本发明所属技术领域的技术人员，依据本发明的思想，还可以做出若干简单推演、变形或替换。

Claims

1.一种检索多轮对话的客服问答处理方法，其特征在于，包括以下步骤：

获取用户输入的当前信息；

根据所述当前信息识别归属的业务领域，从所述业务领域中筛选多条候选回复信息，以及提取所述用户输入的与所述业务领域相关的历史信息；

将每一条所述候选回复信息与所述当前信息、所述历史信息构成的上下文信息进行检索匹配，得到对应的匹配度得分，其中包括：

将所述当前信息和所述历史信息构成上下文信息，所述上下文信息包括所述用户输入的与所述业务领域相关的至少两个语境问题，

利用多个粒度的文本处理模型对每一个语境问题进行文本分析，以及对每一条候选回复信息进行文本分析，得到该语境问题对应的多种粒度表示和该条候选回复信息对应的多种粒度表示，其中，定义每一个语境问题为U_i，每一个候选回复信息为R_r，其中i、r分别为语境问题序号、候选回复序号，定义

表示U_i的第j列参数，/>

表示R_r的第k列参数，j、k分别为语境问题粒度表示序号、候选回复粒度表示序号，

将各个语境问题对应的多种粒度表示和每一条候选回复信息对应的多种粒度表示进行交互处理，计算得到该条候选回复信息对应的交互表示序列，包括：

计算R_r关于U_i的加权表示

用公式表示为

其中，exp()为指数函数，tanh()为双曲正切函数，n_r表示R_r对应的第r条候选回复信息的总词数，

W_a、b_a均表示超参数，

对

和/>

进行交互运算，得到

其中，f()表示交互函数，ReLU()表示激活函数，W_p、b_p均表示超参数，根据t_i,j得到R_r对应的交互表示序列

其中n_i表示U_i的总列数；

根据预设的循环神经网络对所述交互表示序列进行向量匹配处理，输出对应的匹配度得分；

确定最高的匹配度得分对应的所述候选回复信息作为所述当前信息的回复内容。

2.如权利要求1所述的客服问答处理方法，其特征在于，所述根据所述当前信息识别归属的业务领域，包括：

对所述当前信息进行文本编码，得到文本向量表示；

对所述文本向量表示进行特征归纳，得到所述当前信息的归类特征，依据所述当前信息的归类特征识别得到一个或多个领域及各自的向量表示；

将所述文本向量表示与各个所述领域的向量表示分别进行关系度量，得到归类到各个所述领域的概率值；

根据所述概率值从各个所述领域中确定所述当前信息应当归属的业务领域。

3.如权利要求2所述的客服问答处理方法，其特征在于，所述根据所述概率值从各个所述领域中确定所述当前信息应当归属的业务领域，包括：

判断归类到每个所述领域的概率值大于或等于该领域的第一预设阈值，则设置该领域为待确定业务；

遍历各个所述领域且设置有一个或多个待确定业务时，则检测每个所述待确定业务是否属于预设的业务领域，若是则将所述当前信息识别为应当归属的业务领域，直至检测完成各个所述待确定业务；

在各个所述待确定业务均不属于预设的业务领域时，则向所述用户发出闲聊信息，所述闲聊信息包括随机形成的推荐内容。

4.如权利要求3所述的客服问答处理方法，其特征在于，若遍历各个所述领域且未设置有待确定业务时，则判断归类到每个所述领域的概率值是否大于或等于该领域的第二预设阈值，若是则设置该领域为待澄清业务，若否则设置该领域为拒识业务；所述第二预设阈值小于所述第一预设阈值；

遍历各个所述领域且设置有一个或多个待澄清业务时，则向所述用户发出问题澄清信息，以便所述用户从各个所述待澄清业务中确认至少一个所述领域；

遍历各个所述领域且未设置有待澄清业务时，则将所述用户转接至人工客服。

5.如权利要求1所述的客服问答处理方法，其特征在于，所述多个粒度的文本处理模型包括以下模型中的至少两者：基于卷积神经网络的字向量表示模型、Word2Vec词向量表示模型、局部语境化语义向量表示模型、序列语境化语义向量表示模型、自注意力机制语义向量表示模型、交互注意力语义向量表示模型。

6.如权利要求1所述的客服问答处理方法，其特征在于，所述根据预设的循环神经网络对所述交互表示序列进行向量匹配处理，输出对应的匹配度得分，包括：

利用预设的循环神经网络将所述交互表示序列

归纳为第一向量V_i，得到匹配向量列表(V₁,...,V_i,....,V_m)，其中m为所述语境问题的总个数；

再利用所述循环神经网络将所述匹配向量列表(V₁,...,V_i,....,V_m)归纳为第二向量C_r，将所述第二向量C_r通过一线性层之后，输出第r条所述候选回复信息对应的匹配度得分，直至得到各条所述候选回复信息对应的匹配度得分。

7.一种客服问答处理***，其特征在于，包括：

通信服务模块，用于接收用户输入的咨询信息，所述咨询信息包括所述用户输入的当前信息和历史信息；

问答处理模块，与所述通信服务模块连接，用于根据权利要求1-6中任一项所述的客服问答处理方法确定所述当前信息的回复内容；

响应回复模块，与所述问答处理模块连接，用于向所述用户反馈已确定的回复内容。

8.一种计算机可读存储介质，其特征在于，包括程序，所述程序能够被处理器执行以实现如权利要求1-6中任一项所述的客服问答处理方法。