CN112885337A

CN112885337A - 数据处理方法、装置、设备及存储介质

Info

Publication number: CN112885337A
Application number: CN202110130657.XA
Authority: CN
Inventors: 杨海军; 徐倩; 杨强
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2021-01-29
Filing date: 2021-01-29
Publication date: 2021-06-01

Abstract

本发明实施例提供一种数据处理方法、装置、设备及存储介质，该方法包括：获取多个客户端分别发送的模型参数，其中，每个客户端发送的模型参数为所述客户端根据本地训练数据对全局模型进行训练后得到的模型参数，所述本地训练数据为对应的客户端进行智能坐席服务中得到的数据；对所述多个客户端发送的模型参数进行聚合处理，得到更新后的全局模型；根据所述更新后的全局模型，对输入信息进行处理，得到对应的辅助结果，所述辅助结果用于辅助确定所述输入信息对应的应答回复。由于全局模型是通过多个客户端的本地训练数据进行联邦学习得到的，模型的准确率和完整性更高，得到的辅助结果的准确性也更高，更有利于坐席助手对于坐席的应答辅助。

Description

数据处理方法、装置、设备及存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种数据处理方法、装置、设备及存储介质。

背景技术

坐席助手是一种以语音识别、语义分析等为基础的，面向坐席人员提供坐席应答辅助能力的***工具，能够有效帮助坐席人员提升工作效率，改善服务水平等等。

目前的坐席助手主要是预先通过模型训练实现坐席应答辅助的服务的。以语音识别为例，语音通话需要进行实时语音识别转换成文字，坐席助手根据语音识别的结果为坐席人员提供推荐话术等等。因此，需要预先获取语音标注数据作为训练样本训练语音识别模型。但是语音识别模型的效果需要丰富场景的大量标注数据才能有较好的效果，目前各个***的数据由于不互通，因此很难获取到能覆盖大量场景的标注数据用于模型的训练，导致模型的准确率较低。

因此，目前的坐席助手由于使用的模型难以覆盖大量场景，导致坐席助手提供的应答辅助的准确度较低。

发明内容

本发明的主要目的在于提供一种数据处理方法、装置、设备及存储介质，旨在解决目前的坐席助手提供的应答辅助的准确度较低的问题。

为实现上述目的，本发明提供一种数据处理方法，所述方法包括：

获取多个客户端分别发送的模型参数，其中，每个客户端发送的模型参数为所述客户端根据本地训练数据对全局模型进行训练后得到的模型参数，所述本地训练数据为对应的客户端进行智能坐席服务中得到的数据；

对所述多个客户端发送的模型参数进行聚合处理，得到更新后的全局模型；

根据所述更新后的全局模型，对输入信息进行处理，得到对应的辅助结果，所述辅助结果用于辅助确定所述输入信息对应的应答回复。

在一种可能的实施方式中，所述根据所述更新后的全局模型，对输入信息进行处理，得到对应的辅助结果，包括：

根据所述更新后的全局模型，对所述输入信息进行处理，得到中间结果；

根据所述中间结果，确定对应的所述辅助结果。

在一种可能的实施方式中，所述全局模型为分类模型，所述本地训练数据包括多组第一样本数据，每组第一样本数据包括第一样本信息和所述第一样本信息的样本分类标签；所述根据所述更新后的全局模型，对所述输入信息进行处理，得到中间结果，包括：

根据所述分类模型，对所述输入信息进行处理，得到所述输入信息对应的分类标签。

在一种可能的实施方式中，所述根据所述中间结果，确定对应的所述辅助结果，包括：

根据所述输入信息对应的分类标签，在第一数据库中确定所述分类标签对应的分类结果。

在一种可能的实施方式中，所述输入信息为文本信息，所述全局模型为语义理解模型，所述本地训练数据包括多组第二样本数据，每组第二样本数据包括样本文本信息和所述样本文本信息的样本语义标签；所述根据所述更新后的全局模型，对所述输入信息进行处理，得到中间结果，包括：

根据所述语义理解模型，对所述文本信息进行处理，得到所述文本信息对应的语义标签。

根据所述文本信息对应的语义标签，在第二数据库中确定所述语义标签对应的至少一个搜索答案。

在一种可能的实施方式中，所述输入信息为语音信息，所述全局模型为语音识别模型，所述本地训练数据包括多组第三样本数据，每组第三样本数据包括样本语音信息和所述样本语音信息的样本语音识别结果；所述根据所述更新后的全局模型，对所述输入信息进行处理，得到中间结果，包括：

根据所述语音识别模型，对所述语音信息进行处理，得到所述语音信息对应的语音识别结果。

根据所述语音信息对应的语音识别结果，在第三数据库中确定所述语音识别结果对应的至少一个应答文本。

在一种可能的实施方式中，所述输入信息为用户信息，所述全局模型为用户画像模型，所述本地训练数据包括多组第四样本数据，每组第四样本数据包括样本用户信息和所述样本用户信息的样本用户标识；所述根据所述更新后的全局模型，对所述输入信息进行处理，得到中间结果，包括：

根据所述用户画像模型，对所述用户信息进行处理，得到所述用户信息对应的用户标识。

根据所述用户信息对应的用户标识，在第四数据库中确定所述用户标识对应的用户标签。

本发明还提供一种数据处理装置，所述装置包括：

获取模块，用于获取多个客户端分别发送的模型参数，其中，每个客户端发送的模型参数为所述客户端根据本地训练数据对全局模型进行训练后得到的模型参数，所述本地训练数据为对应的客户端进行智能坐席服务中得到的数据；

训练模块，用于对所述多个客户端发送的模型参数进行聚合处理，得到更新后的全局模型；

处理模块，用于根据所述更新后的全局模型，对输入信息进行处理，得到对应的辅助结果，所述辅助结果用于辅助确定所述输入信息对应的应答回复。

在一种可能的实施方式中，所述处理模块具体用于：

根据所述中间结果，确定对应的所述辅助结果。

在一种可能的实施方式中，所述全局模型为分类模型，所述本地训练数据包括多组第一样本数据，每组第一样本数据包括第一样本信息和所述第一样本信息的样本分类标签；所述处理模块具体用于：

在一种可能的实施方式中，所述处理模块具体用于：

在一种可能的实施方式中，所述输入信息为文本信息，所述全局模型为语义理解模型，所述本地训练数据包括多组第二样本数据，每组第二样本数据包括样本文本信息和所述样本文本信息的样本语义标签；所述处理模块具体用于：

在一种可能的实施方式中，所述处理模块具体用于：

在一种可能的实施方式中，所述输入信息为语音信息，所述全局模型为语音识别模型，所述本地训练数据包括多组第三样本数据，每组第三样本数据包括样本语音信息和所述样本语音信息的样本语音识别结果；所述处理模块具体用于：

在一种可能的实施方式中，所述处理模块具体用于：

在一种可能的实施方式中，所述输入信息为用户信息，所述全局模型为用户画像模型，所述本地训练数据包括多组第四样本数据，每组第四样本数据包括样本用户信息和所述样本用户信息的样本用户标识；所述处理模块具体用于：

在一种可能的实施方式中，所述处理模块具体用于：

本发明还提供一种数据处理设备，所述数据处理设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据处理程序，所述数据处理程序被所述处理器执行时实现如前述任一项所述的数据处理方法的步骤。

本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有数据处理程序，所述数据处理程序被处理器执行时实现如前述任一项所述的数据处理方法的步骤。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现如前述任一项所述的数据处理方法的步骤。

本发明实施例提供的数据处理方法、装置、设备及存储介质，首先获取多个客户端分别发送的模型参数，其中，每个客户端发送的模型参数为客户端根据本地训练数据对全局模型进行训练后得到的模型参数，本地训练数据为对应的客户端进行智能坐席服务中得到的数据；然后对多个客户端发送的模型参数进行聚合处理，得到更新后的全局模型；并根据更新后的全局模型，对输入信息进行处理，得到对应的辅助结果，该辅助结果用于辅助确定输入信息对应的应答回复。本发明实施例的方案中，由于全局模型是对多个客户端各自的本地训练数据进行联邦学习得到的模型，样本数据来源更加广泛和全面，因此通过这多个客户端提供的样本数据训练得到的共有的全局模型，在不损害各个客户端的隐私的前提下，其模型的准确率和完整性更高，得到的辅助结果的准确性也更高，更有利于坐席助手对于坐席的应答辅助。

附图说明

图1为本发明实施例提供的一种应用场景示意图；

图2为本发明实施例提供的一种坐席助手的***架构示意图；

图3为本发明实施例提供的一种数据处理方法的流程示意图；

图4为本发明实施例提供的联邦学习模型训练的***架构示意图；

图5a为本发明实施例提供的横向联邦学习模型训练的示意图；

图5b为本发明实施例提供的纵向联邦学习模型训练的示意图；

图6为本发明实施例提供的坐席助手的辅助结果示意图一；

图7为本发明实施例提供的坐席助手的辅助结果示意图二；

图8为本发明实施例提供的坐席助手的辅助结果示意图三；

图9为本发明实施例提供的坐席助手的辅助结果示意图四；

图10为本发明实施例提供的数据处理装置的结构示意图；

图11为本发明实施例提供的一种数据处理设备的结构示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

首先对本发明实施例的一种适用的应用场景进行介绍。

图1为本发明实施例提供的一种应用场景示意图，如图1所示，包括用户11、坐席人员12和坐席助手13。坐席人员12可以和用户11进行通话，坐席助手13可以获取用户11和坐席人员12通话时的通话信息，然后根据用户11和坐席人员12通话时的通话信息，进行相应的处理，并展示给坐席人员12，帮助坐席人员12进行与用户11之间的应答回复。

图2为本发明实施例提供的一种坐席助手的***架构示意图，如图2所示，坐席助手可以为坐席人员提供全方面的服务，例如主要可以包括提供用户画像、智能推荐、答案搜索和智能质检等服务。

用户画像：包括用户的基本属性信息、分析标签等。坐席助手可以通过自动分析业务***数据等建立全方位的用户画像。在坐席人员与用户对话时，用户画像信息实时展现在对话页面上，把坐席人员从手工整理用户信息的繁重劳动中解放出来，用户画像模块展现的信息更丰富、更及时。

智能推荐：实时分析用户提出的问题，从知识库中查找相关的答案，按相关性由大到小排序，并将最相关的几条答案推荐在坐席服务页面上，供坐席人员参考回复，从而提升坐席回复的精度和效率，提升用户体验。

答案搜索：当坐席人员想查找某个问题的答案的时，可以使用答案搜索输入自己想了解的问题，答案搜索从知识库中查找相关问题并按相关性由大到小排序，然后将所有答案序列输出给坐席人员参考。

智能质检：根据事先配置的质检项要求，针对坐席对话文本进行实时质检，并把质检结果反馈给坐席，及时提示坐席对话中的注意事项，监督规范坐席行为。比如暴力催收质检项质检可发现对话中骂人、恐吓等暴力催收行为并发出警告。

坐席助手提供上述服务时，需要获取相关的信息。本发明实施例中，坐席助手获取相关的信息的渠道可以包括语音客服渠道，例如电话语音、线上音频等等。获取相关的信息的渠道还可以包括文本客服渠道，例如手机APP、网页等等。

目前的坐席助手，需要通过预先训练的模型来提供上述服务。其中，涉及的模型包括分类体系和分类模型、语音识别模型、语义理解模型和用户画像模型等等。

分类体系和分类模型在进行训练时，获取的训练样本通常包括一些待处理信息以及该待处理信息对应的标注数据，此时标注数据标注的就是该待处理信息所属的分类。以银行业为例，银行场景的分类包括借款、还款、存款等各个不同的分类。待处理信息可能是用户与坐席人员之间的语音对话，也可能是坐席人员输入的文本信息等。以某个银行为例，在需要训练分类体系和分类模型时，可以获取该银行的历史待处理信息，并对其进行标注。举例来说，用户在此之前曾经询问过“你们银行的借款利息如何计算？”，确定该语音信息所属的分类为“借款”，因此，该语音信息进行标注之后就可以作为一个训练样本进行分类体系和分类模型的训练。

针对于语音识别模型，在进行训练时，也是首先获取相应的语音信息，并标注出对应的语音识别结果，构成一个训练样本进行训练。针对于语义理解模型，首先获取相应的文本信息，并标注出对应的语义识别结果，构成训练样本进行训练。

对于用户画像模型，在进行训练时，可以获取用户的身份信息，然后获取该身份信息下的用户的其他信息。以银行业为例，用户的其他信息可以包括用户的消费情况，财务情况等等，实现用户画像模型的训练。

坐席助手在主要是通过预先训练的模型来实现坐席应答辅助服务的，因此，模型的准确率对于坐席助手而言至关重要。目前的坐席助手中训练的模型，都是通过单个数据方提供的数据进行训练得到的，没有与其他的数据防进行信息共享，提供的数据较为单一和有限，形成了数据孤岛，因此训练得到的模型的准确率较低，造成坐席助手提供的服务质量较差，应答辅助的准确度较低。具体表现在以下方面：

首先，坐席助手的意图分类体系不够健全，意图分类准确率不够高。以金融业为例，在银行场景的智能问答分类体系包括借款、还款、存款、利息、理财等数十个大类，以及下一层的数百个小类。每家银行的知识库编辑的时候可能只包含部分分类的内容，难以覆盖全部的类别。这就导致分类体系分割开来，难以完整表述分类体系；每个分类下的数据也是分割的，难以使用更多更全的数据训练出准确率更高的分类体系和分类模型。

其次，坐席助手的语义理解能力不够强，即对同一种语义的多种说法的理解准确率不够高。比如在银行业，“贷款利息怎么计算”这个问题还存在其他不同的问法，比如“借款利钱的计算方法”、“借了1万块钱7天需要支付多少利息”等。每家银行在配置知识库的时候往往只枚举已知的少数问题集，而问题集又是彼此割裂的，问题集不能联合起来训练语义识别模型，导致问题语义匹配的召回率和准确率较低。

再次，坐席助手的语音识别效果不够好，即语音通话需要进行实时语音识别转换成文字，这样才可以智能话推荐话术、智能质检是否合规等。语音识别模型的效果是需要丰富场景的大量的标注数据来支持的，每个客户终端提供的数据都难以覆盖大量的服务场景，也难以承受大量数据标注的成本，导致语音识别的准确率较低。

最后，坐席助手提供的用户信息不够全面。仍以银行业为例，需要用户的基本信息、财务标签、行为标签、等才能全面了解客户，才能更高效、精准的完成客户服务。单家公司或机构是难以获得有效、全面的用户信息的，数据获取成本高，一般企业难以承受。

基于此，本发明实施例提供一种数据处理方案以解决上述问题。

图3为本发明实施例提供的一种数据处理方法的流程示意图，如图3所示，该方法可以包括：

S31，获取多个客户端分别发送的模型参数，其中，每个客户端发送的模型参数为所述客户端根据本地训练数据对全局模型进行训练后得到的模型参数，所述本地训练数据为对应的客户端进行智能坐席服务中得到的数据。

本发明实施例中的执行主体可以为坐席助手，客户端可以是任意参与模型训练的终端。每个客户端均设置有各自的本地训练数据，针对任意客户端而言，其本地训练数据为该客户端进行智能坐席服务中得到的数据，不同的客户端对应的本地训练数据可能各不相同。

在进行模型的训练的过程中，首先会将全局模型分别发送给每个客户端，每个客户端根据自身的本地训练数据对获取到的模型进行分别训练，得到训练后的模型并发送给坐席助手。其中，模型参数可以指用于确定模型的任意参数，例如可以包括模型中的直接参数，也可以包括用于确定模型中的直接参数的任意其他参数。模型与模型参数具有对应关系，根据模型参数能够相应的确定模型。客户端与坐席助手之间进行模型的发送均可以通过发送模型参数实现。

在本发明实施例中，坐席助手可以先将全局模型的模型参数发送给每个客户端，各客户端根据模型参数更新本地模型，并利用本地训练数据对本地模型进行训练，得到训练后的本地模型的模型参数，然后，将本地模型的模型参数上报给坐席助手，坐席助手可以从每个客户端获取其对应的训练后的本地模型的模型参数。

S32，对所述多个客户端发送的模型参数进行聚合处理，得到更新后的全局模型。

在获取了多个客户端分别发送的模型参数后，就可以对多个客户端的模型参数进行聚合，得到更新后的全局模型，聚合的方式不限，例如可以对多个客户端的模型参数采用求和的聚合方式，得到更新后的全局模型的模型参数，进而得到更新后的全局模型。

在模型训练中，可能会经过多个迭代过程，本发明实施例中的方案，可应用于模型训练中的任意一个或多个迭代过程中，例如针对任意一个迭代过程，均可以采用上述方法实现全局模型的更新，得到更新后的全局模型。

S33，根据所述更新后的全局模型，对输入信息进行处理，得到对应的辅助结果，所述辅助结果用于辅助确定所述输入信息对应的应答回复。

当用户与坐席进行沟通交流时，坐席助手可以获取输入信息，输入信息可以包括不同的类型，例如可以是坐席与用户沟通时的语音信息，可以是坐席输入的文本信息，可以是获取的用户的身份信息等等。

在获取输入信息之后，坐席助手可以通过训练得到的全局模型对输入信息进行处理，得到对应的辅助结果。根据输入信息的不同的类型，辅助结果的类型也可能各有不同。例如，当输入信息为用户的身份信息时，辅助结果可能是用户的画像；当输入信息为输入的文本信息时，辅助结果可能是该文本信息对应的搜索结果等等。

得到辅助结果之后，坐席可以根据辅助结果为确定输入信息对应的应答回复。例如，如果输入信息为用户的语音信息，询问“你们公司在哪些地方有线下网点？”，坐席助手获取到该用户的语音信息之后，对其进行语音识别，从而得到该问题的搜索答案并展示给坐席。坐席在看到相应的搜索答案之后，就能够迅速回答用户的问题。

本发明实施例提供的数据处理方法，首先获取多个客户端分别发送的模型参数，其中，每个客户端发送的模型参数为客户端根据本地训练数据对全局模型进行训练后得到的模型参数，本地训练数据为对应的客户端进行智能坐席服务中得到的数据；然后对多个客户端发送的模型参数进行聚合处理，得到更新后的全局模型；并根据更新后的全局模型，对输入信息进行处理，得到对应的辅助结果，该辅助结果用于辅助确定输入信息对应的应答回复。本发明实施例的方案中，由于全局模型是对多个客户端各自的本地训练数据进行联邦学习得到的模型，样本数据来源更加广泛和全面，因此通过这多个客户端提供的样本数据训练得到的共有的全局模型，在不损害各个客户端的隐私的前提下，其模型的准确率和完整性更高，得到的辅助结果的准确性也更高，更有利于坐席助手对于坐席的应答辅助。

下面结合附图对本发明实施例的方案进行详细介绍。

由于本发明实施例中的全局模型是对多个客户端提供的本地训练数据进行联邦学习得到的，因此首先对联邦学习模型的训练进行介绍。

图4为本发明实施例提供的联邦学习模型训练的***架构示意图，如图4所示，以两个数据拥有方A和B的场景为例，A和B的业务***分别拥有各自用户的相关数据，同时B还拥有模型训练需要预测的标签数据。

由于数据隐私保护，A和B无法直接进行数据交换，因此可以采用联邦学习***建立模型。如图4中所示，该联邦学习模型训练的***架构主要包括如下部分：

第一部分，加密样本对齐。

由于A和B两个业务***中的用户群体并非完全重合，因此在A和B不公开各自数据的前提下确认双方的共有用户，并且不暴露不相互重叠的用户，以利用这些用户的特征进行建模。

第二部分，加密模型训练。

在确定共有用户群体后，就可以利用这些数据进行联邦学习模型的训练。为了保证训练过程中数据的隐私性，需要第三方C协助进行加密训练。训练的过程包括：

(1)第三方C将公钥分发给A和B，用于对模型训练过程中需要交互的数据进行加密。

(2)A和B之间以加密行驶交换用于计算梯度的中间结果。

(3)A和B分别基于加密的梯度值进行计算，同时B根据其标签数据计算损失，并将结果发送给第三方C，第三方C通过汇总结果计算总梯度值并将其解密，得到解密后的梯度值。

(4)第三方C将解密后的梯度值分别回传给A和B，A和B根据接收的梯度值分别更新各自模型的参数。

重复上述步骤直至计算的损失函数收敛后，就完成了整个联邦学习的全局模型的训练过程。在用户样本对齐和模型训练的过程中，A和B各自的用户数据均保留在本地，保证了数据隐私性和安全性。

图4示例了联邦学习模型的基本训练过程，在联邦学习训练时，包括横向联邦学习模型训练和纵向联邦学习模型训练，下面分别进行介绍。

图5a为本发明实施例提供的横向联邦学习模型训练的示意图，如图5a所示，服务器和n个客户端可以参与联邦学习过程。图5b为本发明实施例提供的纵向联邦学习模型训练的示意图，如图5b所示，服务器和客户端1、客户端2可以参与联邦学习过程。

横向联邦学习和纵向联邦学习主要是针对不同的数据集来进行区分的。当多个客户端提供的数据集中的用户特征重叠较多，而用户重叠较少的情况下，可以将数据集按照横向(即用户维度)进行切分，并取出各个客户端中用户特征相同而用户不完全相同的数据进行联邦学习模型的训练，这种方式称为横向联邦学习。在图5a的示例中，示意的是横向联邦学习模型的训练过程，主要包括4个步骤：(1)各个客户端向服务器发送加密后的梯度值；(2)服务器进行安全聚合；(3)服务器向各个客户端发送模型更新参数；(4)各个客户端根据接收到的模型更新参数更新模型。上述步骤重复执行，即可完成模型的训练。

当各个客户端的用户重叠较多而用户特征重叠较少的情况下，可以将各个客户端的数据集按照纵向(即特征维度)切分，并取出各个客户端中用户相同而用户特征不完全相同的数据进行联邦学习模型的训练，这种方式称为纵向联邦学习。在图5b的示例中，示意的是纵向联邦学习模型的训练过程，主要包括6个步骤：(1)各个客户端将全局ID加密后上发至服务器；(2)服务器进行全局ID对齐；(3)服务器向各个客户端发送训练样本ID；(4)向量转换(embedding)加密后上发给服务器；(5)服务器计算加密后的损失后下发给各个客户端；(6)各个客户端根据接收的损失来更新模型。上述步骤重复执行，即可完成模型的训练。

本发明实施例中，全局模型的训练可以采用图5a示例的横向联邦模型的训练的方式，也可以采用图5b示例的纵向联邦模型的训练的方式。多个客户端对各自本地训练数据进行参数化处理后得到对应的参数数据，并将各自的参数数据发送给服务器。服务器在获取了多个客户端分别发送的参数数据之后，根据多个客户端分别发送的参数数据就可以进行联邦学习训练得到全局模型。

在进行联邦学习训练，得到更新后的全局模型后，可以根据更新后的全局模型，对输入信息进行处理，得到中间结果，然后根据中间结果，确定对应的辅助结果。

由于全局模型在应用于坐席助手时，坐席助手可能涉及分类、语音识别、语义理解、用户画像等不同的领域，因此全局模型的数量可能有多个，例如可以分别包括一个分类模型、一个语音识别模型、一个语义理解模型和一个用户画像模型，等等。下面将分别进行介绍。

当全局模型为分类模型时，对于分类模型而言，多个客户端可以提供自身的本地训练数据。针对任意客户端而言，其本地训练数据包括多组第一样本数据，每组第一样本数据包括第一样本信息和第一样本信息的样本分类标签。不同的客户端在自身的业务***下的分类体系可能不同。以银行业为例，A银行为线上银行，涉及各类线上银行业务，B银行既涉及线上业务，也涉及线下网点的业务。如果仅采用A银行的数据进行模型训练，则训练得到的分类模型可能无法涉及线下的体系分类。但是如果结合A银行和B银行的数据联合进行模型训练，则训练得到的分类模型能够涵盖线上和线下的体系分类，使得分类模型更加完善。

可以根据分类模型对输入信息进行处理，得到输入信息对应的分类标签。然后，根据输入信息对应的分类标签，在第一数据库中确定分类标签对应的分类结果。

图6为本发明实施例提供的坐席助手的辅助结果示意图一，如图6所示，用户11和坐席人员12正在进行通话，坐席人员12旁边设置了一个坐席助手13。其中，坐席人员12为一个银行的员工，负责为客户提供咨询应答等服务。

用户11和坐席人员12通话时，坐席助手13能够获取用户11和坐席人员12的通话，如图6中示意了用户11发出的信息，用户11询问“请问您这边有没有什么较好的线上理财产品可以推荐？”，该信息即为一个输入信息。

通过分类模型对该输入信息进行处理，可以得到对应的分类标签。例如根据“线上理财产品”，可以得到分类标签1为“理财”，分类标签2为“线上”。根据分类标签“理财”和“线上”，在第一数据库中确定上述分类标签的分类结果，如图6中的分类结果60示意，包括理财产品1、理财产品2和理财产品3，这3个理财产品均为线上理财产品，与分类标签“理财”和“线上”均对应。可选的，还可以示例出这3个理财产品各自的特点。例如在图6中，理财产品1为高收益率且高风险的产品，理财产品2为中收益率且中风险的产品，理财产品3为低收益率且低风险的产品。根据分类标签1和分类标签2确定的分类结果，可以展示给坐席人员12，坐席人员12根据展示的分类结果，可以为用户进行上述几个线上理财产品的具体介绍。

本发明实施例中，通过联邦学习将意图分类改进为联邦意图分类。例如针对某个单一数据方而言，如果该数据方涉及的业务均为线下业务，则可能不存在“线上”这一分类，而通过联邦学习得到的分类模型，具备更多更全面的分类标签，从而能够得到更具针对性的分类结果。

当全局模型为语义理解模型时，对于语义理解模型而言，由于同一种语义存在多种不同的说法，单个客户端涉及到的智能坐席服务往往只涉及少数问题集，导致问题集之间彼此割裂。通过获取多个客户端提供的本地训练数据进行模型训练，能够使得覆盖更全面的问题集，从而提高语义匹配的召回率和准确率。其中，针对任意客户端而言，其本地训练数据包括多组第二样本数据，每组第二样本数据包括样本文本信息和样本文本信息的样本语义标签。

当输入信息为文本信息时，可以根据语义理解模型，对文本信息进行处理，得到文本信息对应的语义标签。然后，根据文本信息对应的语义标签，在第二数据库中确定语义标签对应的至少一个搜索答案。

图7为本发明实施例提供的坐席助手的辅助结果示意图二，如图7所示，用户11和坐席人员12正在进行通话，坐席人员12旁边设置了一个坐席助手13。其中，坐席人员12为一个银行的员工，负责为客户提供咨询应答等服务。

用户11和坐席人员12通话时，用户11询问“这个理财产品3的利息是多少？”坐席人员12可以将用户询问的问题作为文本进行输入，坐席助手13获取该文本信息，并通过语义理解模型对该文本信息进行处理，得到对应的语义标签例如可以为“理财产品3的利息计算方法”。然后，根据该语义标签，在第二数据库中确定对应的至少一个搜索答案。例如在图7中，示例了搜索答案70，搜索答案70中展示了理财产品3的年收益率为a％，这是对理财产品3的利息计算方法的总的介绍。搜索答案70中还展示了不同的数额的理财产品3的具体利息，例如存一千块钱一年的利息为X，存一万块钱一年的利息为Y，存十万块钱一年的利息为Z。这几个搜索答案是对理财产品3的利息的具体计算。坐席人员12可以根据搜索答案70，为用户11进行理财产品3的利息计算的具体介绍。

本发明实施例中，通过联邦学习将语义匹配改进为联邦语义匹配。例如针对某个单一数据方而言，该数据方涉及的利息询问方法为“某理财产品的利息是多少”，但实际可能存在其他的询问方式，例如“存一万块钱一年有多少利息”。而通过联邦学习得到的语义理解模型，能够囊括更多的问题集，从而能够根据得到的语义标签确定对应的搜索答案。

当全局模型为语音识别模型时，对于语音识别模型而言，由于语音识别模型需要丰富场景下大了的标注数据来支持，而单个客户端涉及到的智能坐席服务都难以覆盖大量的服务场景。通过获取多个客户端提供的本地训练数据联合进行模型训练，能够使得训练数据覆盖更多更全面的场景，得到的语音识别模型也更加完善和全面，语音识别的效果更佳。其中，针对任意客户端而言，其本地训练数据包括多组第三样本数据，每组第三样本数据包括样本语音信息和样本语音信息的样本语音识别结果。

当输入信息为语音信息时，可以根据语音识别模型对语音信息进行处理，得到语音信息对应的语音识别结果。然后，根据语音信息对应的语音识别结果，在第三数据库中确定语音识别结果对应的至少一个应答文本。

图8为本发明实施例提供的坐席助手的辅助结果示意图三，如图8所示，用户11和坐席人员12正在进行通话，坐席人员12旁边设置了一个坐席助手13。其中，坐席人员12为一个银行的员工，负责为客户提供咨询应答等服务。

用户11和坐席人员12通话时，用户11询问“请问您这边有没有什么较好的线上理财产品可以推荐？”用户发出的这个输入信息为一个语音信息，坐席助手13可以获取该语音信息，并通过语音识别模型对该语音信息进行处理，得到对应的语音识别结果，获知用户11想要了解线上理财产品。然后，根据该语音识别结果，可以在第三数据库中确定对应的至少一个应答文本。例如在图8中，展示了应答文本80，其中包括4个备选的应答方案。应答1：好的我这边为您介绍几款产品供您考虑。应答2：有的，不知道您这边想要哪种理财产品？应答3：您这边对收益率这些方面有要求吗？应答4：这边根据您的历史消费记录为您推荐几款产品。

上述几个备选应答文本可以展示给坐席人员12，供坐席人员12选择其中的任意一个来快速答复用户11。

当全局模型为用户画像模型时，对于用户画像模型而言，通过多个客户端提供的本地训练数据进行训练，能够获取各个用户身份信息下的更多的用户标签信息，从而能够构建出更加准确的用户标签。其中，针对任意客户端而言，其本地训练数据包括多组第四样本数据，每组第四样本数据包括样本用户信息和样本用户信息的样本用户标识。

当输入信息为用户信息时，可以根据用户画像模型对用户信息进行处理，得到用户信息对应的用户标识。然后，根据用户信息对应的用户标识，在第四数据库中确定用户标识对应的用户标签。

图9为本发明实施例提供的坐席助手的辅助结果示意图四，如图9所示，用户11和坐席人员12正在进行通话，坐席人员12旁边设置了一个坐席助手13。其中，坐席人员12为一个银行的员工，负责为客户提供咨询应答等服务。

在用户11和坐席人员12通话时，坐席助手13获取了用户11的电话号码。通常，用户的电话号码会与用户的相关信息进行绑定，因此该电话号码为可以为用户11的一个用户信息。

坐席助手13获取了用户11的电话号码之后，就可以将用户11的电话号码输入至全局模型，得到全局模型输出的用户11的用户标识，例如在图9中页面90示例的用户11的姓名为李明，电话号码为13XXXXXXXXX，所属地为北京等等。然后，根据用户11的上述信息，可以获取用户的用户标签，如页面90中，用户11过去一年的历史消费记录为13次，包括记录1、记录2、记录3等等，可以根据用户11过去一年的历史消费记录结合其他信息，得到用户标签为低风险型消费者，等等。

图9的示例中，用户画像模型是根据多个客户端提供的本地训练数据进行训练得到的。以银行业为例，假设用户11持有一张A银行的银行卡，并在过去一年进行了消费。坐席人员12为B银行的工作人员，无法获知用户11在A银行卡的消费数据。如果全局模型只采用B银行提供的样本数据进行训练，则用户画像模型是无法获取到用户11在A银行的消费记录的。由于无法获取在A银行的消费记录，也就无法结合A银行的消费记录来共同判定用户的标签。

而如果用户画像模型采用了多个客户端提供的样本数据进行训练得到，则借助于联邦学习机制，可以让多个客户端使用客户端机制将相同用户身份信息的各类信息参数化，传回服务器之后，服务器联合各个客户端提供的参数化后的信息进行联合训练得到用户画像模型，从而使得用户画像模型能够根据用户信息，得到更加完善的用户标签。

坐席助手除了可以提供上述实施例示例的用户画像、智能推荐、答案搜索等服务外，还可以提供智能质检服务。坐席助手可以根据实现配置的质检项要求，针对用户和坐席人员质检的对话文本进行实时质检，并将质检结果反馈给坐席，及时提示坐席人员对话中的注意事项，监督规范坐席人员的行为。当发现坐席人员有不当言辞时，例如骂人、恐吓等，则可以控制发出警告，例如“请注意您的言辞！”等等。

图10为本发明实施例提供的数据处理装置的结构示意图，如图10所示，所述装置包括：

获取模块101，用于获取多个客户端分别发送的模型参数，其中，每个客户端发送的模型参数为所述客户端根据本地训练数据对全局模型进行训练后得到的模型参数，所述本地训练数据为对应的客户端进行智能坐席服务中得到的数据；

训练模块102，用于对所述多个客户端发送的模型参数进行聚合处理，得到更新后的全局模型；

处理模块103，用于根据所述更新后的全局模型，对输入信息进行处理，得到对应的辅助结果，所述辅助结果用于辅助确定所述输入信息对应的应答回复。

在一种可能的实施方式中，所述处理模块103具体用于：

根据所述中间结果，确定对应的所述辅助结果。

在一种可能的实施方式中，所述全局模型为分类模型，所述本地训练数据包括多组第一样本数据，每组第一样本数据包括第一样本信息和所述第一样本信息的样本分类标签；所述处理模块103具体用于：

在一种可能的实施方式中，所述处理模块103具体用于：

在一种可能的实施方式中，所述输入信息为文本信息，所述全局模型为语义理解模型，所述本地训练数据包括多组第二样本数据，每组第二样本数据包括样本文本信息和所述样本文本信息的样本语义标签；所述处理模块103具体用于：

在一种可能的实施方式中，所述处理模块103具体用于：

在一种可能的实施方式中，所述输入信息为语音信息，所述全局模型为语音识别模型，所述本地训练数据包括多组第三样本数据，每组第三样本数据包括样本语音信息和所述样本语音信息的样本语音识别结果；所述处理模块103具体用于：

在一种可能的实施方式中，所述处理模块103具体用于：

在一种可能的实施方式中，所述输入信息为用户信息，所述全局模型为用户画像模型，所述本地训练数据包括多组第四样本数据，每组第四样本数据包括样本用户信息和所述样本用户信息的样本用户标识；所述处理模块103具体用于：

在一种可能的实施方式中，所述处理模块103具体用于：

前述任一实施例提供的数据处理装置，用于执行前述任一方法实施例的技术方案，其实现原理和技术效果类似，在此不再赘述。

图11为本发明实施例提供的一种数据处理设备的结构示意图。如图11所示，所述设备可以包括：存储器111、处理器112及存储在所述存储器111上并可在所述处理器112上运行的数据处理程序，所述数据处理程序被所述处理器112执行时实现如前述任一实施例所述的数据处理方法的步骤。

可选地，存储器111既可以是独立的，也可以跟处理器112集成在一起。

本实施例提供的设备的实现原理和技术效果可以参见前述各实施例，此处不再赘述。

本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有数据处理程序，所述数据处理程序被处理器执行时实现如前述任一实施例所述的数据处理方法的步骤。

在本发明所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。

上述以软件功能模块的形式实现的集成的模块，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器执行本发明各个实施例所述方法的部分步骤。

应理解，上述处理器可以是中央处理单元(Central Processing Unit，简称CPU)，还可以是其它通用处理器、数字信号处理器(Digital Signal Processor，简称DSP)、专用集成电路(Application Specific Integrated Circuit，简称ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

存储器可能包含高速RAM存储器，也可能还包括非易失性存储NVM，例如至少一个磁盘存储器，还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。

上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。

一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits，简称ASIC)中。当然，处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种数据处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述更新后的全局模型，对输入信息进行处理，得到对应的辅助结果，包括：

根据所述中间结果，确定对应的所述辅助结果。

3.根据权利要求2所述的方法，其特征在于，所述全局模型为分类模型，所述本地训练数据包括多组第一样本数据，每组第一样本数据包括第一样本信息和所述第一样本信息的样本分类标签；所述根据所述更新后的全局模型，对所述输入信息进行处理，得到中间结果，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述中间结果，确定对应的所述辅助结果，包括：

5.根据权利要求2所述的方法，其特征在于，所述输入信息为文本信息，所述全局模型为语义理解模型，所述本地训练数据包括多组第二样本数据，每组第二样本数据包括样本文本信息和所述样本文本信息的样本语义标签；所述根据所述更新后的全局模型，对所述输入信息进行处理，得到中间结果，包括：

6.根据权利要求5所述的方法，其特征在于，所述根据所述中间结果，确定对应的所述辅助结果，包括：

7.根据权利要求2所述的方法，其特征在于，所述输入信息为语音信息，所述全局模型为语音识别模型，所述本地训练数据包括多组第三样本数据，每组第三样本数据包括样本语音信息和所述样本语音信息的样本语音识别结果；所述根据所述更新后的全局模型，对所述输入信息进行处理，得到中间结果，包括：

8.根据权利要求7所述的方法，其特征在于，所述根据所述中间结果，确定对应的所述辅助结果，包括：

9.根据权利要求2所述的方法，其特征在于，所述输入信息为用户信息，所述全局模型为用户画像模型，所述本地训练数据包括多组第四样本数据，每组第四样本数据包括样本用户信息和所述样本用户信息的样本用户标识；所述根据所述更新后的全局模型，对所述输入信息进行处理，得到中间结果，包括：

10.根据权利要求9所述的方法，其特征在于，所述根据所述中间结果，确定对应的所述辅助结果，包括：

11.一种数据处理装置，其特征在于，所述装置包括：

12.一种数据处理设备，其特征在于，所述数据处理设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据处理程序，所述数据处理程序被所述处理器执行时实现如权利要求1至10中任一项所述的数据处理方法的步骤。

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有数据处理程序，所述数据处理程序被处理器执行时实现如权利要求1至10中任一项所述的数据处理方法的步骤。

14.一种计算机程序产品，其特征在于，包括计算机程序，所述计算机程序在被处理器执行时实现如权利要求1-10中任一项所述的数据处理方法的步骤。