CN109492085A

CN109492085A - 基于数据处理的答案确定方法、装置、终端及存储介质

Info

Publication number: CN109492085A
Application number: CN201811364713.0A
Authority: CN
Inventors: 毕野; 黄博; 吴振宇; 王建明; 肖京
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-11-15
Filing date: 2018-11-15
Publication date: 2019-03-19
Anticipated expiration: 2038-11-15
Also published as: CN109492085B

Abstract

本发明实施例公开了一种基于数据处理的答案确定方法、装置、终端及存储介质。其中，方法包括：获取用户输入的初始问题，并调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合；调用预设的生成模型确定出所述初始问题对应的生成答案集合；按照预设的计算规则分别计算所述候选答案集合中的各候选答案与所述初始问题之间的候选匹配度，以得到至少一个候选匹配度，并求取所述至少一个候选匹配度的第一平均值；按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案。本发明实施例可以更好地确定目标答案，避免目标答案出现长尾问题以及保证目标答案的一致性和合理性。

Description

基于数据处理的答案确定方法、装置、终端及存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及基于数据处理的答案确定方法、装置、终端及存储介质。

背景技术

人机交互(Human–Computer Interaction，HCI)是指人与计算机之间使用某种对话语言，以一定的交互方式确定人与计算机之间的信息交换过程。随着人机交互技术的发展，越来越多的基于人机交互技术的智能产品应运而生，例如聊天机器人等。这些智能产品可以和用户进行聊天交流，并根据用户的问题生成相应的回答信息。但是，目前智能产品根据用户的问题所检索到的回答信息通常存在长尾问题(即小众问题)，或者难以保证回答信息的一致性和合理性。因此，如何更好地根据用户的问题确定目标答案成为了研究热点。

发明内容

本发明实施例提供了一种基于数据处理的答案确定方法、装置、终端及计算机可读存储介质，可以更好地确定目标答案，避免目标答案出现长尾问题以及保证目标答案的一致性和合理性。

一方面，本发明实施例提供了一种基于数据处理的答案确定方法，该基于数据处理的答案确定方法包括：

获取用户输入的初始问题，并调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合，所述预设知识库包括至少一个问题以及各问题所对应的一个或多个答案，所述候选答案集合中包括至少一个候选答案；

调用预设的生成模型确定出所述初始问题对应的生成答案集合，所述生成答案集合中包括至少一个生成答案，所述预设的生成模型是采用多个包含问题的训练数据集进行模型训练优化得到的；

按照预设的计算规则分别计算所述候选答案集合中的各候选答案与所述初始问题之间的候选匹配度，以得到至少一个候选匹配度，并求取所述至少一个候选匹配度的第一平均值；

按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案。

另一方面，本发明实施例提供了一种基于数据处理的答案确定装置，该基于数据处理的答案确定装置包括：

获取单元，用于获取用户输入的初始问题，并调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合，所述预设知识库包括至少一个问题以及各问题所对应的一个或多个答案，所述候选答案集合中包括至少一个候选答案；

所述获取单元，用于调用预设的生成模型确定出所述初始问题对应的生成答案集合，所述生成答案集合中包括至少一个生成答案，所述预设的生成模型是采用多个包含问题的训练数据集进行模型训练优化得到的；

计算单元，用于按照预设的计算规则分别计算所述候选答案集合中的各候选答案与所述初始问题之间的候选匹配度，以得到至少一个候选匹配度，并求取所述至少一个候选匹配度的第一平均值；

确定单元，用于按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案。

再一方面，本发明实施例提供了一种终端，该终端包括输入设备、输出设备、存储器以及处理器，所述处理器、所述输入设备、所述输出设备和所述存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如下步骤：

再一方面，本发明实施例提供了一种计算机可读存储介质，该计算机存储介质存储有计算机程序。该计算机程序包括至少一条程序指令，该至少一条程序指令可由一处理器加载，并用于执行如下步骤：

在本发明实施例中，在获取到用户输入的初始问题之后，可以调用预设的检索模型从预设知识库中确定出初始问题对应的候选答案集合，以及调用预设的生成模型确定出初始问题对应的生成答案集合。然后分别计算候选答案集合中的各候选答案与初始问题之间的候选匹配度，以得到至少一个候选匹配度，并求取至少一个候选匹配度的第一平均值。最后可以根据第一平均值从候选答案集合或者生成答案集合中确定待输出的目标答案。本发明实施例调用检索模型和生成模型来确定目标答案，可以避免目标答案出现长尾问题以及保证目标答案的一致性和合理性。并且根据第一平均值来确定是从候选答案集合还是从生成答案集合中确定目标答案，可以规避检索模型误检索的情况，从而提高准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对本发明实施例描述中所需要使用的附图作简单的介绍。

图1是本发明实施例提供的一种基于数据处理的答案确定方法的流程示意图；

图2是本发明另一实施例提供的一种基于数据处理的答案确定方法的流程示意图；

图3a是本发明实施例提供的一种基于数据处理的答案确定方法的应用场景图；

图3b是本发明实施例提供的一种基于数据处理的答案确定方法的应用场景图；

图4是本发明实施例提供的一种基于数据处理的答案确定装置的结构示意图；

图5是本发明实施例提供的一种终端的结构示意图。

具体实施方式

下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

本发明实施例提出了一种基于数据处理的答案确定方法，该基于数据处理的答案确定方法可以运用在终端与用户的聊天对话中，此处的终端可以包括但不限于：智能手机、膝上计算机、平板电脑、台式计算机等智能设备，以及基于聊天对话的聊天设备，例如聊天机器人等等。具体的，终端在和用户进行聊天对话的过程中，可以在用户界面获取用户输入的初始问题，然后调用预设的检索模型从预设知识库中确定出初始问题对应的候选答案集合，以及调用预设的生成模型确定出初始问题对应的生成答案集合。并按照预设的计算规则分别计算候选答案集合中的各候选答案与初始问题之间的候选匹配度，以得到至少一个候选匹配度，并求取至少一个候选匹配度的第一平均值。最后可以按照预设的确定规则根据第一平均值从候选答案集合或者生成答案集合中确定待输出的目标答案。在确定出目标答案之后，可以在用户界面中输出该目标答案，以实现和用户的聊天对话。

请参见图1，是本发明实施例提供的一种基于数据处理的答案确定方法的流程示意图，该答案确定方法可以由上述的终端来执行。如图1所示，该基于数据处理的答案确定方法可以包括以下步骤S101-S104：

S101，获取用户输入的初始问题，并调用预设的检索模型从预设知识库中确定出初始问题对应的候选答案集合。此处的预设知识库包括至少一个问题以及各问题所对应的一个或多个答案，此处的候选答案集合中包括至少一个候选答案。

具体的，终端在获取用户输入的初始问题时，可以获取用户的语音信息，从该语音信息中提取出初始问题；例如，用户对着终端说出“你好，你知道电脑的组件有哪些吗？”，终端可以获取到该语音信息，并从该语音信息中提取出初始问题为“电脑的组件有哪些”。在一种实施方式中，终端也可以获取用户输入的文本信息，从该文本信息中提取出初始问题；例如，终端可以给用户提供一个对话界面，以使得用户可以在该对话界面中输入文本信息“你好，你知道电脑的组件有哪些吗？”，终端可以检测到用户的输入操作，并获取用户输入的文本信息，然后从该文本信息中提取出初始问题为“电脑的组件有哪些”。

在获取到初始问题之后，终端可以调用预设的检索模型从预设知识库中确定出初始问题对应的候选答案集合，该预设的检索模型可以基于预设的检索算法训练得到，此处的预设的检索算法可以包括但不限于：IR(Information Retrieval)算法、BM25(OkapiBM25)算法，等等。

S102，调用预设的生成模型确定出初始问题对应的生成答案集合，此处的生成答案集合中包括至少一个生成答案。

具体的，该预设的生成模型是采用多个包含问题的训练数据集进行模型训练优化得到；在一个实施例中，该预设的生成模型可以是基于attention+seq2seq的生成模型。在获取到初始问题之后，终端可以调用该预设的生成模型针对该初始问题生成一个或多个生成答案，然后将预设的生成模型所生成的所有生成答案或者预设数量的生成答案所构成的集合作为生成答案集合。

S103，按照预设的计算规则分别计算候选答案集合中的各候选答案与初始问题之间的候选匹配度，以得到至少一个候选匹配度，并求取至少一个候选匹配度的第一平均值。

在一种实施方式中，预设的计算规则可以包括：根据各候选答案与初始问题答案联合出现的频率确定候选匹配度的规则。具体的，可以基于预设知识库，分别统计各候选答案与初始问题联合出现的频率，将统计得到的频率作为候选答案与初始问题之间的候选匹配度，从而可以得到至少一个候选匹配度。然后再求取这至少一个候选匹配度的第一平均值。

再一种实施方式中，预设的计算规则可以包括：对各候选答案进行打分处理以确定候选匹配度的规则。具体的，可以采用多特征的统计机器学***均值。具体的，在采用多特征的统计机器学习方法针对初始问题为各候选答案进行打分处理时，可以从句子特征、语言特征、词汇模式特征、冗余特征等多个特征进行打分处理。

需要说明的是，若候选答案集合中只包括一个候选答案，则第一平均值就等于该候选答案与初始问题之间的候选匹配度。

S104，按照预设的确定规则根据第一平均值从候选答案集合或者生成答案集合中确定待输出的目标答案。

在得到第一平均值之后，可以按照预设的确定规则根据该第一平均值来确定是从候选答案集合中确定目标答案，还是从生成答案集合中确定目标答案。在一种实施方式中，预设的确定规则包括：根据第一平均值和预设阈值的大小关系确定目标答案，相应的，按照预设的确定规则根据第一平均值从候选答案集合或者生成答案集合中确定待输出的目标答案的具体实施方式可以是：判断第一平均值是否大于预设阈值，此处的预设阈值可以根据实际的业务需求设置，例如预设阈值可以取值为0.5；若第一平均值大于预设阈值，则从候选答案集合中选取候选匹配度最高的候选答案作为目标答案；若第一平均值不大于预设阈值，则从生成答案集合中选取生成匹配度最高的生成答案作为目标答案，此处的生成匹配度为生成答案集合中的生成答案与初始问题之间的匹配度。

实践表明，有时会出现候选答案集合中的只存在一个候选答案与初始问题的匹配度较高，其他候选答案与初始问题的匹配度较低，此时说明匹配度较高的候选答案可能是由于检索模型出现检索错误，误检索到的。也就是说，此情况下的候选答案集合中的各候选答案均是不准确，若此时直接将该匹配度较高的候选答案作为目标答案输出，则会降低目标答***性。因此本发明实施例采用第一平均值的方法，根据第一平均值和预设阈值之间的大小关系来确定是从候选答案集合中确定目标答案还是从生成答案集合中确定目标答案，可以在一定程度上规避检索模型误检索的情况，从而可以提高目标答***性。

再一种实施方式中，预设的确定规则包括：根据第一平均值和第二平均值的大小关系确定目标答案，相应的，按照预设的确定规则根据第一平均值从候选答案集合或者生成答案集合中确定待输出的目标答案的具体实施方式可以是：分别计算生成答案集合中的各生成答案与初始问题之间的生成匹配度，以得到至少一个生成匹配度，并求取至少一个生成匹配度的第二平均值；若第一平均值大于第二平均值，则从候选答案集合中选取候选匹配度最高的候选答案作为目标答案；若第一平均值小于第二平均值，则从生成答案集合中选取生成匹配度最高的生成答案作为目标答案；若第一平均值等于第二平均值，则从候选答案集合中选取候选匹配度最高的候选答案作为目标答案，或者从生成答案集合中选取生成匹配度最高的生成答案作为目标答案。

需要说明的是，若生成答案集合中只包括一个生成答案，则第二平均值就等于该生成答案与初始问题之间的生成匹配度。由此可见，此实施方式是根据第一平均值和第二平均值之间的大小关系来确定是从候选答案集合中确定目标答案还是从生成答案集合中确定目标答案，可以规避因预设阈值取值不合理而降低准确性的情况，即可以进一步提高目标答***性。

请参见图2，是本发明实施例提供的另一种基于数据处理的答案确定方法的流程示意图，该基于数据处理的答案确定方法可以由上述终端来执行。如图2所示，该基于数据处理的答案确定方法可以包括以下步骤S201-S207：

S201，构建第一训练数据集，该第一训练数据集包括至少一对聊天问答语料，该至少一对聊天问答语料从至少一个问答***中获取得到，每一对聊天问答语料包括一个问题和对应的标准答案。

具体的，可以预先在互联网上查找一个或多个问答***，并从这一个或多个问答***中获取一对或多对聊天问答语料，每一对聊天问答语料均是真实且实际存在的聊天问答语料，所谓的真实且实际存在的聊天问答语料是指由用户曾在问答***中输入的问题以及该问答***针对该问题所输出的标准答案所构成的语料。例如，用户曾在某问答***中输入“故宫在什么地方”，此问答***针对该问题所输出的标准答案为“北京”，那么“故宫在什么地方”以及“北京”即可作为真实且实际存在的聊天问答语料。

S202，获取预先构建的初始模型，并采用第一训练数据集对初始模型进行训练，得到中间模型。

具体的，该预先构建的初始模型中可以包括编码器模型和解码器模型，并且在预先构建初始模型时，均选用Bi-GRU双向GRU模型作为编码器模型和解码器模型，此处的Bi-GRU双向GRU模型是一种可以识别倒装句结构的模型。由于用户在输入初始问题时，可能使得该初始问题为倒装句结构，即与正常的语句结构不一样，例如用户输入的初始问题为“去哪里今天”，而正常的语句结构为“今天去哪里”，采用Bi-GRU双向GRU模型可以识别出倒装句结构的初始问题，从而可以丰富预设的生成模型的功能，以及可以提高预设的生成模型的鲁棒性。

需要说明的是，本发明实施例虽然都选用Bi-GRU双向GRU模型作为编码器模型和解码器模型，但是编码器模型和解码器模型的架构不一致，即编码器模型和解码器模型中的模型参数不一致。由于编码器模型和解码器模型的模型参数不一致，因此在后续对生成模型的训练过程中所需训练并更新的模型参数更多，从而可以提高生成模型的鲁棒性以及性能，使得训练得到的预设的生成模型所确定的生成答案更加贴近于人类的语言，更具真实性。

在采用第一训练数据集对该初始模型进行训练时，可以将第一训练数据集输入至初始模型中。初始模型在接收到该第一训练数据集之后，初始模型中的编码器模型可以将第一训练数据集中的每一对聊天问答语料中的问题编码成特征向量，然后由解码器模型根据该特征向量进行解码处理，以确定该问题所对应的相应答案。然后判断该相应答案和第一训练数据集中的该问题所对应的标准答案是否一致：若不一致，则不断更新初始模型中的编码器模型和解码器模型的模型参数，直至更新后的初始模型所确定出的问题所对应的相应答案可以与标准答案一致，此时可将更新后的初始模型作为中间模型；若一致，则说明该初始模型可以准确地确定出该问题对应的相应答案，此时可直接将该初始模型作为中间模型。

S203，根据第一训练数据集获取第二训练数据集，并采用第二训练数据集对中间模型进行优化处理，得到预设的生成模型。

在得到中间模型之后，可以通过该中间模型和第一训练数据集来获取第二训练数据集。具体的，根据第一训练数据集获取第二训练数据集的具体实施方式可以是：针对第一训练数据集中的每一个问题，依次调用中间模型确定每一个问题对应的相应答案，并将第一训练数据集中的所有问题对应的相应答案作为负样本；获取第一训练数据集中的每一个答案所对应的标准答案，并将第一训练数据集中的所有问题对应的标准答案作为正样本；将包括负样本和正样本的数据集作为第二训练数据集。也就是说，第二训练数据集包括的负样本为中间模型生成的相应答案，正样本为人类真实语言所对应的标准答案，该负样本和正样本可以统称为样本。例如，第一训练数据集中的问题为“电脑的组件有哪些”，调用中间模型确定该问题对应的相应答案为“①屏幕、②键盘、③显卡、④声卡、⑤硬盘”，那么负样本就为“①屏幕、②键盘、③显卡、④声卡、⑤硬盘”；第一训练数据集中该问题所对应的标准答案为“电脑一般由屏幕、键盘、显卡、声卡以及硬盘等组件构成”，那么正样本就为“电脑一般由屏幕、键盘、显卡、声卡以及硬盘等组件构成”。

在得到第二训练数据集之后，可以采用第二训练数据集对中间模型进行优化处理，得到预设的生成模型。具体的，在采用第二训练数据集对中间模型进行优化处理的过程中，可以引入判别器模型，该判别器模型可以是一个二分类模型，其目标是判别第二训练数据集中的各个样本是正样本还是负样本。针对第二训练数据集中的任意一个样本，可以调用判别器模型对该样本进行判别，得到该样本为正样本的概率。在判别过程中，判别器模型还可以学习正样本和负样本之间的区别，根据学习到的区别来更新判别器模型的模型参数，以提高判别器模型的判别能力。

在调用判别器模型得到该样本为正样本的概率之后，可以将该概率作为中间模型的奖励函数(rewards)，其中rewards的值越大，则表明该样本越有可能是正样本，即该样本越贴切人类真实语言。然后可以结合强化学习算法(Policy Gradient算法)，根据rewards计算中间模型的损失函数的值，然后按照减少计算得到的损失函数的值的原则，优化中间模型的模型参数。然后采用优化参数后的中间模型再次根据第二训练数据集中的该问题生成新的相应答案，将新的相应答案作为新的负样本。然后调用判别器模型对新的负样本和正样本进行判别，并得到新的概率，在判别过程中，判别器模型可以学习到新的负样本和正样本之间的区别，并根据学习到的新的区别再次更新判别器模型的模型参数。

在调用判别器模型得到新的概率之后，将新的概率作为新的rewards，并结合强化学***衡的状态，即中间模型确定出的问题对应的相应答案无限逼近于标准答案，即无限贴切于人类真实语言，判别器模型无法区分负样本和正样本，可以将趋于平衡状态时的中间模型作为预设的生成模型。

由此可见，本发明实施例在得到中间模型之后，并不是直接将中间模型作为预设的生成模型，而是再引入对抗学习的思想，采用第二训练数据集对中间模型进行优化处理，从而得到预设的生成模型。通过对中间模型进行优化处理，可以进一步提高预设的生成模型的质量，使得调用预设的生成模型确定出的生成答案更加贴近于人类真实语言，更具真实性。

S204，获取用户输入的初始问题，并调用预设的检索模型从预设知识库中确定出初始问题对应的候选答案集合。此处的预设知识库包括至少一个问题以及各问题所对应的一个或多个答案，此处的候选答案集合中包括至少一个候选答案。

终端可以通过获取语音信息或者文本信息来确定初始问题，然后调用预设的检索模型确定出初始问题对应的候选答案集合。具体的，调用预设的检索模型从预设知识库中确定出初始问题对应的候选答案集合的具体实施方式可以包括如下步骤s11-s13：

s11，针对初始问题，调用预设的检索模型在预设知识库中进行查询处理，以确定至少一个目标问题，目标问题中的至少一个目标单词与所述初始问题中的至少一个初始单词相匹配。

具体的，可以先对初始问题进行词句拆分处理，得到一个或多个初始单词，然后对各个初始单词进行词向量转换，得到各个初始单词的词向量。基于各个初始单词的词向量，调用预设的检索模型在预设知识库查找到与该各个初始单词相匹配的匹配单词。针对目标单词，该目标单词包括初始单词和/或匹配单词，采用倒排索引的方法将该目标单词映射到包含该目标单词的目标问题，以确定目标问题。此处的倒排索引又可称为反向索引、置入档案或反向档案，是一种索引方法，被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。采用倒排索引的方法，可以根据目标单词快速获取包含该目标单词的目标问题，提高了检索的速率。

例如，初始问题为“电脑的组件有哪些”，对该初始问题进行词句拆分处理，可以得到一个或多个初始单词“电脑”“组件”。然后对各个初始单词进行词向量转换，并基于各个初始单词的词向量，调用预设的检索模型在预设知识库查找到与该各个初始单词相匹配的匹配单词，例如“平板电脑”“计算机”“零件”。将初始单词和/或匹配单词作为目标单词，即目标单词可以包括“电脑”“组件”“平板电脑”“计算机”“零件”中的一个或多个单词。以目标单词为“计算机”为例，可以采用倒排索引的方法将该目标单词进行映射处理，所谓的映射处理是指查找包含该目标单词的目标问题的处理。采用倒排索引的方法查找到问题“计算机的结构是什么”中包含了目标单词“计算机”，那么可以将该问题“计算机的结构是什么”作为目标问题；又如，以目标单词为“电脑”“零件”为例，采用倒排索引的方法查找到问题“电脑的零件有哪些”包含了目标单词“电脑”“零件”，那么可以将该问题“电脑的零件有哪些”作为目标问题。

s12，分别计算至少一个目标问题与初始问题之间的相似度，并确定相似度最高的目标问题。

具体的，可以先采用相似度算法分别计算至少一个目标问题与初始问题之间的相似度，以得到多个相似度；此处的相似度算法可以包括但不限于：BM25算法、欧式距离相似度算法、夹角余弦相似度算法、皮尔逊相似度算法，等等。在得到多个相似度之后，可以采用排序函数对多个相似度进行排序处理，此处的排序函数可以包括但不限于：Rank排序函数、Sort排序函数、Oracle排序函数，等等。

此处的排序处理可以是相似度从高到低的排序处理，也可以是相似度从低到高的排序处理。若排序处理是相似度从高到低的排序处理，则可以将排序序号最小的目标问题确定相似度最高的目标问题；若排序处理是相似度从低到高的排序处理，则可以将排序序号最大的目标问题确定相似度最高的目标问题。

s13，从预设知识库中获取相似度最高的目标问题所对应的至少一个答案，并根据至少一个答案确定出候选答案集合。

在确定了相似度最高的目标问题之后，可以从预设知识库中获取相似度最高的目标问题所对应的至少一个答案，并根据至少一个答案确定出候选答案集合。在一种实施方式中，可以将获取到的相似度最高的目标问题所对应的每一个答案均作为候选答案，即将获取到的相似度最高的目标问题所对应的所有答案构成的集合确定为候选答案集合。

再一种实施方式中，在从预设知识库中获取相似度最高的目标问题所对应的至少一个答案之后，可以计算每个答案与初始问题之间的匹配度。然后根据匹配度从高到低的顺序，选取预设数量的答案构成候选答案集合。该预设数量的取值可以根据实际业务需求确定，例如预设数量为5，那么根据匹配度从高到底的顺序，将前top5的答案均作为候选答案，将该候选答案构成的集合确定为候选答案集合。

举例来说，从预设知识库中获取相似度最高的目标问题所对应的答案总共有7个，7个答案及其匹配度分别是：答案A(匹配度85％)、答案B(匹配度25％)、答案C(匹配度45％)、答案D(匹配度75％)、答案E(匹配度80％)、答案F(匹配度70％)以及答案G(匹配度60％)。按照匹配度从高到低的顺序可知：答案A(匹配度85％)＞答案E(匹配度80％)＞答案D(匹配度75％)＞答案F(匹配度70％)＞答案G(匹配度60％)＞答案C(匹配度45％)＞答案B(匹配度25％)；预设数量为5，则将前top5的答案均作为候选答案，即“答案A”、“答案E”、“答案D”、“答案F”以及“答案G”均为候选答案，即候选答案集合为“答案A、答案E、答案D、答案F以及答案G”。

S205，调用预设的生成模型确定出初始问题对应的生成答案集合，该生成答案集合中包括至少一个生成答案，所述预设的生成模型是采用多个包含问题的训练数据集进行模型训练优化得到的。

具体的，可以调用预设的生成模型确定出初始问题对应的至少一个生成答案，并按照预设的计算规则分别计算各个生成答案与初始问题之间的匹配度；然后按照匹配度从高到低的顺序，选取预设数量的生成答案构成生成答案集合，此处的预设数量可以根据实际业务需求确定。例如预设数量为5，那么根据匹配度从高到底的顺序，选取前top5的生成答案构成生成答案集合。在其他实施例中，还可以调用预设的生成模型确定出初始问题对应的至少一个生成答案，将预设的生成模型确定出的所有生成答案构成的集合确定为生成答案集合。

S206，按照预设的计算规则分别计算候选答案集合中的各候选答案与初始问题之间的候选匹配度，以得到至少一个候选匹配度，并求取至少一个候选匹配度的第一平均值。

S207，按照预设的确定规则根据第一平均值从候选答案集合或者生成答案集合中确定待输出的目标答案。

需要说明的是，本发明实施例中的步骤S206-S207可以参见上述发明实施例中的步骤S103-S104，本发明实施例不再赘述。

请参见图3a-3b，是本发明实施例提供的一种基于数据处理的答案确定方法的应用场景图，用户可以打开与终端进行聊天对话的用户界面，如图3a所示。然后用户可以在该用户界面输入初始问题，如图3b所示。终端检测到用户的输入操作之后，可以获取用户输入的初始问题，并调用预设的检索模型从预设知识库中确定出初始问题对应的候选答案集合，以及调用预设的生成模型确定出初始问题对应的生成答案集合。然后按照预设的计算规则分别计算候选答案集合中的各候选答案与初始问题之间的候选匹配度，以得到至少一个候选匹配度，并求取至少一个候选匹配度的第一平均值。最后可以按照预设的确定规则根据第一平均值从候选答案集合或者生成答案集合中确定待输出的目标答案。在确定出目标答案之后，可以在用户界面中输出该目标答案，以实现和用户的聊天对话，如图3b所示。调用检索模型和生成模型来确定目标答案，可以避免目标答案出现长尾问题以及保证目标答案的一致性和合理性。并且根据第一平均值来确定是从候选答案集合还是从生成答案集合中确定目标答案，可以规避检索模型误检索的情况，从而提高准确性。

请参见图4，是本发明实施例提供的一种基于数据处理的答案确定装置的结构示意图。如图4所示，本发明实施例中的装置可以包括：

获取单元101，用于获取用户输入的初始问题，并调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合，所述预设知识库包括至少一个问题以及各问题所对应的一个或多个答案，所述候选答案集合中包括至少一个候选答案；

获取单元101，用于调用预设的生成模型确定出所述初始问题对应的生成答案集合，所述生成答案集合中包括至少一个生成答案，所述预设的生成模型是采用多个包含问题的训练数据集进行模型训练优化得到的；

计算单元102，用于按照预设的计算规则分别计算所述候选答案集合中的各候选答案与所述初始问题之间的候选匹配度，以得到至少一个候选匹配度，并求取所述至少一个候选匹配度的第一平均值；

确定单元103，用于按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案。

在一种实施方式中，所述确定单元103在用于按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案时，具体用于：

判断所述第一平均值是否大于预设阈值；

若所述第一平均值大于所述预设阈值，则从所述候选答案集合中选取候选匹配度最高的候选答案作为目标答案；

若所述第一平均值不大于所述预设阈值，则从所述生成答案集合中选取生成匹配度最高的生成答案作为目标答案，所述生成匹配度为所述生成答案集合中的生成答案与所述初始问题之间的匹配度。

再一种实施方式中，所述确定单元103在用于按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案时，具体用于：

分别计算所述生成答案集合中的各生成答案与所述初始问题之间的生成匹配度，以得到至少一个生成匹配度，并求取所述至少一个生成匹配度的第二平均值；

若所述第一平均值大于所述第二平均值，则从所述候选答案集合中选取候选匹配度最高的候选答案作为目标答案；

若所述第一平均值小于所述第二平均值，则从所述生成答案集合中选取生成匹配度最高的生成答案作为目标答案；

若所述第一平均值等于所述第二平均值，则从所述候选答案集合中选取候选匹配度最高的候选答案作为目标答案，或者从所述生成答案集合中选取生成匹配度最高的生成答案作为目标答案。

再一种实施方式中，所述获取单元101在用于调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合时，具体用于：

针对所述初始问题，调用预设的检索模型在所述预设知识库中进行查询处理，以确定至少一个目标问题，所述目标问题中的至少一个目标单词与所述初始问题中的至少一个初始单词相匹配；

分别计算所述至少一个目标问题与所述初始问题之间的相似度，并确定相似度最高的目标问题；

从所述预设知识库中获取所述相似度最高的目标问题所对应的至少一个答案，并根据所述至少一个答案确定出候选答案集合

再一种实施方式中，所述获取单元101在用于调用预设的生成模型确定出所述初始问题对应的生成答案集合时，具体用于：

调用预设的生成模型确定出所述初始问题对应的至少一个生成答案，并按照所述预设的计算规则分别计算各个生成答案与所述初始问题之间的匹配度；

按照所述匹配度从高到低的顺序，选取预设数量的生成答案构成生成答案集合。

再一种实施方式中，所述获取单元101还可用于：

构建第一训练数据集，所述第一训练数据集包括至少一对聊天问答语料，所述至少一对聊天问答语料从至少一个问答***中获取得到，每一对聊天问答语料包括一个问题和对应的标准答案；

获取预先构建的初始模型，并采用所述第一训练数据集对所述初始模型进行训练，得到中间模型；

根据所述第一训练数据集获取第二训练数据集，并采用所述第二训练数据集对所述中间模型进行优化处理，得到预设的生成模型。

再一种实施方式中，所述获取单元101在用于根据所述第一训练数据集获取第二训练数据集时，具体用于：

针对所述第一训练数据集中的每一个问题，依次调用所述中间模型确定所述每一个问题对应的相应答案，并将所述第一训练数据集中的所有问题对应的相应答案作为负样本；

获取所述第一训练数据集中的所述每一个答案所对应的标准答案，并将所述第一训练数据集中的所有问题对应的标准答案作为正样本；

将包括所述负样本和所述正样本的数据集作为第二训练数据集。

基于上述所描述的基于数据处理的答案确定方法以及装置，本发明实施例还提出了一种终端，该终端可以用于实现上述的基于数据处理的答案确定方法。请参见图5，是本发明实施例提供的一种终端的结构示意图。如图5所示，该终端包括输入设备201、输出设备202、存储器203以及处理器204，所述输入设备201、所述输出设备202、所述存储器203可以和所述处理器204相互连接，其中，所述输入设备201可以用于获取用户输入的初始问题收发消息，该输入设备201可以对应于上述发明实施例中的获取单元101。所述存储器203可以用于存储计算机程序，所述计算机程序包括程序指令，该计算机程序包括程序指令。再一种实施方式中，输入设备201、输出设备202、存储器203以及处理器204可通过总线的方式相互连接。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，该程序可存储于一计算机可读存储介质中，该程序包括至少一条程序指令，该至少一条程序指令是由该处理器204加载，并用于执行如下步骤：

在一种实施方式中，在按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案时，该至少一条程序指令可由处理器204加载并用于执行：

判断所述第一平均值是否大于预设阈值；

再一种实施方式中，在按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案时，该至少一条程序指令可由处理器204加载并用于执行：

再一种实施方式中，在调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合时，该至少一条程序指令可由处理器204加载并用于执行：

从所述预设知识库中获取所述相似度最高的目标问题所对应的至少一个答案，并根据所述至少一个答案确定出候选答案集合。

再一种实施方式中，在调用预设的生成模型确定出所述初始问题对应的生成答案集合时，该至少一条程序指令可由处理器204加载并用于执行：

调用预设的生成模型确定出所述初始问题对应的至少一个生成答案，并按照预设的计算规则分别计算各个生成答案与所述初始问题之间的匹配度；

再一种实施方式中，该至少一条程序指令还可由处理器204加载并用于执行：

再一种实施方式中，在根据所述第一训练数据集获取第二训练数据集时，该至少一条程序指令可由处理器加载并用于执行：

本发明实施例还提供了一种计算机存储介质，所述该计算机存储介质存储有计算机程序。该计算机程序包括至少一条程序指令，该至少一条程序指令可由一处理器加载，并用于执行上述所描述的基于数据处理的答案确定方法。

该计算机存储介质是一种记忆设备，用于存放程序和数据。可以理解的是，此处的计算机存储介质既可以包括服务器中的内置存储介质，当然也可以包括服务器所支持的扩展存储介质。在一个实施例中，该计算机存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或者随机存储记忆体(Random Access Memory，RAM)等等。

以上所揭露的仅为本申请的部分实施例而已，当然不能以此来限定本申请之权利范围，本领域普通技术人员可以理解实现上述实施例的全部或部分流程，并依本申请权利要求所作的等同变化，仍属于申请所涵盖的范围。

Claims

1.一种基于数据处理的答案确定方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案，包括：

判断所述第一平均值是否大于预设阈值；

3.如权利要求1所述的方法，其特征在于，所述按照预设的确定规则根据所述第一平均值从所述候选答案集合或者所述生成答案集合中确定待输出的目标答案，包括：

4.如权利要求1-3任一项所述的方法，其特征在于，所述调用预设的检索模型从预设知识库中确定出所述初始问题对应的候选答案集合，包括：

5.如权利要求1-3任一项所述的方法，其特征在于，所述调用预设的生成模型确定出所述初始问题对应的生成答案集合，包括：

6.如权利要求1-3任一项所述的方法，其特征在于，所述方法还包括：

7.如权利要求6所述的方法，其特征在于，所述根据所述第一训练数据集获取第二训练数据集，包括：

8.一种基于数据处理的答案确定装置，其特征在于，包括：

9.一种终端，其特征在于，包括输入设备、输出设备、存储器以及处理器，所述处理器、所述输入设备、所述输出设备和所述存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。