CN113377936A

CN113377936A - 智能问答方法、装置及设备

Info

Publication number: CN113377936A
Application number: CN202110570657.1A
Authority: CN
Inventors: 薛志超; 毛康
Original assignee: Hangzhou Souche Data Technology Co ltd
Current assignee: Hangzhou Souche Data Technology Co ltd
Priority date: 2021-05-25
Filing date: 2021-05-25
Publication date: 2021-09-10
Anticipated expiration: 2041-05-25
Also published as: CN113377936B

Abstract

本申请实施例提供了一种智能问答方法、装置及设备，涉及计算机技术领域。所述方法包括：获取待处理的目标问题，通过预先训练的问题处理模型对目标问题进行意图识别处理，得到目标问题的问题意图；其中，问题处理模型是基于多任务的训练方式训练所得；若确定问题意图是指定领域的事项咨询，则通过问题处理模型对目标问题和预先生成的多个标准问答模板进行匹配处理，得到目标问题的标准答案；向目标问题的提问用户返回标准答案。通过本申请实施例，提升了智能问答效率和模型训练效率，降低了模型部署难度。

Description

智能问答方法、装置及设备

技术领域

本申请涉及计算机技术领域，尤其涉及一种智能问答方法、装置及设备。

背景技术

随着人工智能技术和自然语言处理技术的不断发展，智能问答***以响应速度快、回答准确性高等特点被广泛使用。现有的智能问答***进行智能问答时，主要是基于关键词匹配、统计TF-IDF、BERT模型等方式对用户问题进行分析，然后输出答案。然而，关键词匹配和统计TF-IDF的方式虽然简单高效，但是匹配效率低；而BERT模型虽然匹配精度较高，但是召回效率低，且部署难度大。

发明内容

本申请实施例的目的是提供一种智能问答方法、装置及设备，以解决当前智能问答***的匹配效率低、部署难度大等问题。

为解决上述技术问题，本申请一个或多个实施例是这样实现的：

第一方面，本申请实施例提供了一种智能问答方法，包括：

获取待处理的目标问题；

通过预先训练的问题处理模型对所述目标问题进行意图识别处理，得到所述目标问题的问题意图；其中，所述问题处理模型是基于多任务的训练方式训练所得；

若确定所述问题意图是指定领域的事项咨询，则通过所述问题处理模型对所述目标问题和预先生成的多个标准问答模板进行匹配处理，得到所述目标问题的标准答案；

向所述目标问题的提问用户返回所述标准答案。

第二方面，本申请实施例提供了一种智能问答装置，包括：

获取模块，获取待处理的目标问题；

识别模块，通过预先训练的问题处理模型对所述目标问题进行意图识别处理，得到所述目标问题的问题意图；其中，所述问题处理模型是基于多任务的训练方式训练所得；

匹配模块，若确定所述问题意图是指定领域的事项咨询，则通过所述问题处理模型对所述目标问题和预先生成的多个标准问答模板进行匹配处理，得到所述目标问题的标准答案；

反馈模块，向所述目标问题的提问用户返回所述标准答案。

第三方面，本申请实施例提供了一种智能问答设备，包括：处理器；以及被安排成存储计算机可执行指令的存储器，所述计算机可执行指令在被执行时使所述处理器实现上述第一方面所提供的智能问答方法的步骤。

第四方面，本申请实施例提供了一种存储介质，用于存储计算机可执行指令，所述计算机可执行指令在被执行时实现上述第一方面所提供的智能问答方法的步骤。

本申请实施例提供的智能问答方法、装置及设备，预先基于多任务的训练方式训练问题处理模型，并通过该问题处理模型识别目标问题的问题意图，以及在问题意图是事项咨询时，通过该问题处理模型对目标问题和预先获取的多个标准问答模板进行匹配，得到目标问题的标准答案。由于问题意图的识别以及问题的匹配均是通过问题处理模型进行，不仅提升了识别的准确性和匹配的准确性，而且提升了智能问答效率；再者，基于多任务的训练方式训练问题处理模型，相较于多次部署多次训练而言，不仅节约了模型的部署资源，降低了部署难度，而且提高了模型训练效率；并且，由于多任务训练增加了训练的样本量，可以使得模型集中在重要的特征上，并学习出多任务间更通用的特征，因此可以防止模型过度拟合某个任务，起到了正则化的作用。

附图说明

为了更清楚地说明本申请一个或多个实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种智能问答方法的第一种流程示意图；

图2为本申请实施例提供的一种智能问答方法的第二种流程示意图；

图3为本申请实施例提供的一种智能问答方法的第三种流程示意图；

图4为本申请实施例提供的一种智能问答方法的第四种流程示意图；

图5为本申请实施例提供的一种智能问答方法的第五种流程示意图；

图6为本申请实施例提供的步骤S100-10的细化图；

图7为本申请实施例提供的步骤S100-12的细化图；

图8为本申请实施例提供的一种训练网络的结构示意图；

图9为本申请实施例提供的一种智能问答装置的模块组成示意图；

图10为本申请实施例提供的一种智能问答设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请实施例中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请的一部分实施例，而不是全部的实施例。基于本申请实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请的保护范围。

图1为本申请实施例提供的一种智能问答方法的流程示意图，图1中的方法能够由智能问答装置执行，如图1所示，该方法包括以下步骤：

步骤S102，获取待处理的目标问题；

本申请实施例提供的智能问答方法可应用于各领域，如金融领域、电商领域、汽车领域等，本申请以下实施例中以汽车领域为例进行说明。可选的，智能问答装置设置于用户的终端设备中，如设置于终端设备安装的汽车领域相关的客户端中，该客户端可以是独立的应用程序(Application，简称App)，还可以是嵌入到其他应用程序中的小程序，还可以是基于网页的应用等。当提问用户想要咨询汽车领域的相关问题时，如车辆售后保养问题，可以操作其终端设备中客户端的咨询界面进行提问，智能问答装置响应于提问用户的提问操作，获取待处理的目标问题。或者，智能询问装置设置于服务端，提问用户的终端设备中设置有相应的客户端，客户端响应于提问用户基于咨询界面执行的提问操作，获取待处理的目标问题并发送给服务端，智能问答装置获取服务端接收到目标问题。

步骤S104，通过预先训练的问题处理模型对目标问题进行意图识别处理，得到目标问题的问题意图；其中，问题处理模型是基于多任务的训练方式训练所得；

考虑到在实际应用，提问用户可能因好奇而操作咨询界面提交一些如问候语等与指定领域的事项咨询无关的文本，为了能够快速的响应提问用户，本申请一个或多个实施例中，智能问答装置在获取到目标问题后，首先通过预先训练的问题处理模型对目标问题进行意图识别处理，得到目标问题的问题意图。其中，问题处理模型是基于多任务的训练方式训练所得，因此问题处理模型可以进行多任务的相关处理，本申请实施例中，该多任务包括意图识别任务和文本匹配任务。关于问题处理模型的训练过程，在后文中进行详述。

步骤S106，若确定问题意图是指定领域的事项咨询，则通过问题处理模型对目标问题和预先生成的多个标准问答模板进行匹配处理，得到目标问题的标准答案；

其中，指定领域的事项咨询，如汽车领域的购车咨询、车辆保养咨询、车辆维修咨询等。标准问答模板中包括多个标准问题和每个标准问题的标准答案。

步骤S108，向目标问题的提问用户返回标准答案。

具体的，当智能问答装置设置于客户端时，展示标准答案，以使提问用户进行查看。当智能问答装置设置于服务端时，将标准答案发送给对应的客户端，以使客户端展示标准答案，供提问用户查看。

进一步的，若确定问题意图不是指定领域的事项咨询，则获取预设的第一应答信息，向目标问题的提问用户返回第一应答信息。其中，第一应答信息可以在实际应用中根据需要自行设定，例如第一应答信息为“您好，请问有什么可以帮到您的么？”。

本申请一个或多个实施例中，预先基于多任务的训练方式训练问题处理模型，并通过该问题处理模型识别目标问题的问题意图，以及在问题意图是事项咨询时，通过该问题处理模型对目标问题和预先获取的多个标准问答模板进行匹配，得到目标问题的标准答案。由于问题意图的识别以及问题的匹配均是通过问题处理模型进行，不仅提升了识别的准确性和匹配的准确性，而且提升了智能问答效率；再者，基于多任务的训练方式训练问题处理模型，相较于多次部署多次训练而言，不仅节约了模型的部署资源，降低了部署难度，而且提高了模型训练效率；并且，由于多任务训练增加了训练的样本量，可以使得模型集中在重要的特征上，并学习出多任务间更通用的特征，因此可以防止模型过度拟合某个任务，起到了正则化的作用。

为了实现问题意图识别，本申请一个或多个实施例中，预先对指定领域(如汽车领域)的各问题进行问题类别划分，并通过标签予以区分。相应的，如图2所示，步骤S104可以包括以下步骤S104-2：

步骤S104-2，通过预先训练的问题处理模型的意图识别任务对目标问题进行意图识别处理，得到目标问题的一级标签和二级标签；其中，一级标签和二级标签表征目标问题的问题类别，二级标签是一级标签的子标签；

需要指出的是，标签的层级可以在实际应用中根据需要自行设定，如果二级标签仍无法有效的对问题类别进行区分，还可以是设置三级标签，该三级标签是二级标签的子标签。

与步骤S104-2对应的，如图2所示，步骤S106可以包括以下步骤S106-2和步骤S106-4：

步骤S106-2，若确定目标问题的一级标签和二级标签属于预设的标签集合，则确定目标问题的问题意图是指定领域的事项咨询；

步骤S106-4，通过问题处理模型对目标问题和预先生成的多个标准问答模板进行匹配处理，得到目标问题的标准答案。

进一步的，为了提升问题处理模型的召回精度和匹配效率，从而提升标准答案的返回效率，本申请一个或多个实施例中，基于意图识别处理得到的一级标签和二级标签进行粗召回，并基于粗召回的结果进行匹配处理。具体的，如图3所示，步骤S106-4可以包括以下步骤S106-42至步骤S106-48：

步骤S106-42，从预先生成的标准问答模板中获取标注了目标问题的一级标签和二级标签的至少一个标准问题，将获取的标准问题确定为候选问题；

具体的，将目标问题的一级标签和二级标签，与标准问答模板中的标准问题的一级标签和二级标签进行匹配处理，若一级标签和二级标签均匹配成功，则将匹配成功的一级标签和二级标签对应的标准问题，确定为候选问题。

步骤S106-44，将目标问题与每个候选问题进行组合，得到待匹配的问题组合；

例如，候选问题包括问题1、问题3和问题4；则将目标问题与问题1进行组合，得到待匹配的问题组合1；将目标问题与问题3进行组合，得到待匹配的问题组合2，将目标问题与问题4进行组合，得到待匹配的问题组合3。

步骤S106-46，通过问题处理模型的文本匹配任务，对问题组合中的标目问题和候选问题进行匹配处理，得到每个问题组合中的标目问题与候选问题的第一相似度；

步骤S106-48，对第一相似度进行排序处理得到最大相似度，若最大相似度不小于预设的相似度阈值，则将最大相似度对应的候选问题的标准答案，确定为目标问题的标准答案。

具体的，对第一相似度进行排序处理得到最大相似度，确定最大相似度是否不小于预设的相似度阈值，若是，则将最大相似度对应的标准问题的标准答案，确定为目标问题的标准答案；若否，则将预设的第二应答信息确定为目标问题的标准答案。其中，当最大相似度小于相似度阈值时，表征目标问题与每个候选问题的语义均差距较大，此时，为了避免误导提问用户，将预设的第二应答信息确定为目标问题的标准答案；其中，第二应答信息如“抱歉，这个问题太难了，我还没有学会”等。

由此，根据意图识别所得的目标问题的第一标签和第二标签进行粗召回，得到候选问题，并给予候选问题进行匹配处理，极大的缩小了匹配范围，提升了匹配效率，进而提升了目标问题的响应速率。

为了有效的对提问用户的目标问题进行响应，本申请一个或多个实施例中，预先建立标准应答模板。具体的，如图4所示，步骤S102之前还可以包括步骤S100-2至步骤S100-8：

步骤S100-2，获取指定领域的历史问题和历史问题的答案；

具体的，通过预设方式从指定的网站、论坛等获取当前指定领域的相关问题和答案，并将获取的问题确定为历史问题，将获取的答案确定为历史问题的答案。其中，预设方式如爬虫等方式。

进一步的，获取到历史问题和历史问题的答案后，可以将历史问题和历史问题的答案保存至指定的用于保存原始数据的原始数据库中。

步骤S100-4，根据预设的聚类方式对历史问题进行聚类处理，得到多个问题集合；其中，问题集合之间的问题类别不同，每个问题集合中的各历史问题为相似问题；

其中，聚类方式可以在实际应用中根据需要自行设定，如采用BERT-base模型，基于feature-based方法对历史问题进行特征提取，进而对相似问题进行聚类等。可以理解的是，相似问题是语义相近或相同的问题，通过计算机处理技术对相似问题之间进行相似度计算时，其相似度大于预设的相似度阈值。

进一步的，得到问题集合之后，还可以将各问题集合以及问题集合中的各历史问题的答案，保存至指定的标注数据库中。

步骤S100-6，确定每个问题集合中的至少一个标准问题，并标注表征标准问题的问题类别的一级标签和二级标签；其中，二级标签是一级标签的子标签；

具体的，展示标注数据库中各问题集合中的历史问题，以使管理员进行人工校验，筛选出问题类别划分错误的历史问题，并标注各标准问题的一级标签和二级标签；智能问答装置在获取到基于管理员的校验操作所生成的校验信息时，将对应的历史问题从相应的问题集合中删除，并对删除的历史问题标记待标注标签；以及在获取到基于管理员的标注操作所生成的标注信息时，将该标注信息所对应的历史问题，确定为相应问题集合的标准问题。其中，标注信息包括一级标签和二级标签。

步骤S100-8，从获取的答案中确定标准问题的标准答案，根据标注后的标准问题和标准答案，生成标准问答模板。

具体的，展示标注数据库中各历史问题的答案，以使管理员选择各标准问题的标准答案；并在获取到基于管理员的提交操作所生成的选择信息时，将该选择信息所对应的答案确定为相应的标准问题的标准答案。根据每个标准问题和标准问题的标准答案，生成标准问答模板。

由此，通过线上的聚类方式对历史问题进行分类，并在得到问题集合后进行人工校验和标准问题，而不是每个历史问题都需要进行人工标注，因此在确保了各历史问题的问题类别划分准确性的基础上，极大的节省了标注的人力成本，提升了标注效率。

为了实现智能问答，提升获取的历史问题的价值，本申请一个或多个实施例中，在生成标准问答模板之后，还将各问题集合中的历史问题保存至相似问题库中，并基于相似问题库中的各问题进行问题处理模型的训练。具体的，如图5所示，步骤S102之前还可以包括以下步骤S100-10和步骤S100-12：

步骤S100-10，根据得到的问题集合生成待训练的问题样本；

具体的，如图6所示，步骤S100-10可以包括以下步骤S100-10-2至步骤S100-10-8：

步骤S100-10-2，确定各问题集合中每个历史问题的一级标签和二级标签；

具体的，将各标准问题的一级标签和二级标签，确定为各标准问题所在的问题集合中的相似问题的一级标签和二级标签。

步骤S100-10-4，将每个历史问题、历史问题的一级标签和二级标签，确定为问题处理模型中意图识别任务的待训练的第一问题样本；

例如，将历史问题1、历史问题1的一级标签和二级标签确定为一个第一问题样本；将历史问题2、历史问题2的一级标签和二级标签确定为令一个第一问题样本。

步骤S100-10-6，根据预设的采样策略，从问题集合中获取每个标准问题的非相似问题；

其中，采样策略可以在实际应用中根据需要自行设定。例如，随机采样策略，即针对一个标准问题，从其所在的问题集合之外的任意问题集合中随机选取至少一个历史问题，并将选区的历史问题确定为该标准问题的非相似问题。又如，采用杰卡德距离，欧氏距离等策略获取标准为体的非相似问题。由于杰卡德距离，欧氏距离是本领域人员熟知的技术，故这里不再赘述。

进一步的，可以理解的是，非相似问题即语义不同的问题，通过计算机处理技术对标准问题和其非相似问题进行相似性计算时，得到的相似度不大于预设的相似度阈值。

步骤S100-10-8，将每个标准问题，分别与标准问题的相似问题和非相似问题进行组合得到问题组合，并标记问题组合的相似性标签；

作为示例，标准问题1的相似问题包括问题2、问题3，非相似问题包括问题4和问题5，则将标准问题1与问题2组合，得到问题组合1，并对问题组合1标记表征标准问题1与问题2相似的标签1；将标准问题1与问题3组合，得到问题组合2，并对问题组合2标记表征标准问题1与问题3相似的标签1；将标准问题1与问题4组合，得到问题组合3，并对问题组合3标记表征标准问题1与问题4不相似的标签2；将标准问题1与问题5组合，得到问题组合4，并对问题组合4标记表征标准问题1与问题5不相似的标签2。

步骤S100-10-10，将问题组合和问题组合的相似性标签，确定为问题处理模型中文本匹配任务的待训练的第二问题样本。

如将上述问题组合1和标签1确定为一个第二问题样本，将问题组合2和标签1确定为另一个第二问题样本，以此类推。

由此，基于预设的采样策略获取标准问题的至少一个非相似问题，并基于非相似问题生成第二问题样本，从而基于第二问题样本进行训练处理，能够提升得到的问题处理模型的精度。

进一步的，考虑到随着时间的推移，新的问题可能不断产生，为了提升问题处理模型的智能问答有效性和准确性，本申请一个或多个实施例中，每隔预设的时间间隔获取新的历史问题，并在确定符合相似问题库的更新条件时，基于该新的历史问题更新相似问题库，以及进行问题处理模型的重新训练，以提升问题处理模型的精度。具体的，方法还包括以下步骤A2至步骤A8：

步骤A2，确定历史问题中需要重新分类的目标历史问题；

具体的，将标记了待标准标签的历史问题确定为需要重新分类的目标历史问题。

步骤A4，按照预设的时间间隔，获取相应时间间隔内所产生的新的历史问题和新的历史问题的答案；

其中，获取新的历史问题和新的历史问题的答案的过程，与前述获取历史问题和历史问题的答案的过程相同，这里不再赘述。

步骤A6，将目标历史问题和新的历史问题确定为待分类问题，通过问题处理模型对待分类问题和标准问题进行匹配处理，得到待分类问题与标准问题的第二相似度；

具体的，将每个待分类问题与各标准问题进行组合，得到待匹配的问题组合，并通过问题处理模型对各问题组合进行匹配处理，得到各待分类问题与标准问题的第二相似度。

步骤A8，根据第二相似度，从待分类问题中获取标准问题的相似问题。

具体的，根据预设方式基于第二相似度，确定待分类问题的衡量参数；对衡量参数进行排序处理得到第一排序结果；从第一排序结果中获取预设的第一数量的目标衡量参数；对每个标准问题对应的目标衡量参数进行加和处理；对加和处理的各结果进行排序处理，得到第二排序结果；根据第二排序结果，展示对应的待分类问题；若获取到管理员对展示的待分类问题的标注信息，则根据标注信息确定对应的待分类问题是否为相应的标准问题的相似问题；若是，则将相应的相似问题保存至标准问题对应的问题集合中。与之对应的，在重新进行模型训练时，步骤S100-10包括根据问题集合和获取的相似问题，生成待训练的问题样本。

具体而言，考虑到机器匹配的过程并不能完全等同于人的理解，对于第二相似度与0.5之间的差异较大的待分类问题，如相似度为0.9的待分类问题、相似度为0.1的待分类问题，这些与标准问题很相似或很不相似的问题，问题处理模型通常能够准确的辨别，并且这种很相似的问题通常是与先前获取的历史问题是重复的问题，无需再次收集到相似问题库。而相似度在0.5附近的待分类问题，如相似度为0.4、0.55的待分类问题，其与对应的标准问题可能是相似问题，也可能不是相似问题，为了准确的对该待分类问题进行分类，本申请一个或多个实施例中，基于目标衡量参数进行排序后展示相应的待分类问题，供管理员进行校验和标注，并以获取的管理员的标准信息为准，对待分类问题进行分类。其中，预设方式可以在实际应用中根据需要自行设定，排序处理可以是从小到大的顺序排序，也可以是从大到小的顺序排序。

作为示例，将第二相似度记为p，衡量参数的确定方式为|0.5-p|，按照从小到大的顺序进行排序，第一数量为2；标准问题1与待分类问题1、待分类问题2和待分类问题3的相似度分别为0.7、0.4、0.8，对应的衡量参数分别为0.2、0.1、0.3，对应的第一排序结果为0.1、0.2、0.3，获取的目标衡量参数为0.1和0.2，加和处理的结果为0.3；标准问题2与待分类问题4、待分类问题5、待分类问题6的相似度分别为0.2、0.6、0.9，对应的衡量参数分别为0.3、0.1、0.4，对应的第一排序结果为0.1、0.3、0.4，获取的目标衡量参数为0.1和0.3，加和处理的结果是0.4；第二排序结果是0.3、0.4，则按照待分类问题2、待分类问题1、待分类问题5、待分类问题4的顺序进行展示。根据获取到的管理员对待分类问题2、待分类问题1、待分类问题5和待分类问题4的标注信息，确定待分类问题2和待分类问题1是否为标准问题1的相似问题，以及确定待分类问题5和待分类问题4是否为标准问题2的相似问题。

步骤S100-12，按照预设的多任务的训练方式，基于问题样本进行训练处理，得到问题处理模型。

具体的，如图7所示，步骤S100-12可以包括以下步骤S100-12-2至步骤S100-12-10：

步骤S100-12-2，将第一问题样本划分为第一训练集和第一测试集，将第一训练集划分为多个第一训练子集，并对第一训练子集标注第一任务标签；其中，第一任务标签表征训练任务为意图识别训练；

步骤S100-12-4，将第二问题样本划分为第二训练集和第二测试集，将第二训练集划分为多个第二训练子集，并对第二训练子集标注第二任务标签；其中，第二任务标签表征训练任务为文本匹配训练；

步骤S100-12-6，按照预设的多任务的训练方式，迭代的基于第一训练子集和第二训练子集进行训练处理，得到问题处理模型的初始模型；

具体的，迭代的从第一训练子集中获取当前待训练的第一目标训练子集，从第二训练子集中获取当前待训练的第二目标训练子集；将第一目标训练子集和第二目标训练子集中的问题样本同时输入至训练网络，进行意图识别任务和文本匹配任务的同时训练；若确定迭代次数到达预设次数，则将当前得到的模型确定为问题处理模型的初始模型。

其中，训练网络如图8所示，从下至上可以包括共享层和特定任务层。同时输入第一目标训练子集中的第一问题样本和第二目标训练子集中的第二问题样本后，在编码层中，基于词典对各问题样本进行编码，包括字词(word)编码、位置(position)编码、分段(segment)编码等；在向量表征层(还可以称为L1层)中将问题样本表征为向量；在语境信息捕获层中，基于模型捕获每个词的语境信息；在语境嵌入向量层(还可以称为L2层)中，将捕获的语境信息嵌入至对应的向量；最后通过特定任务层，对第一问题样本进行多分类，即生成一级标签和二级标签；并对第二问题样本进行二分类，即生成表征第二问题样本中的两个问题是否相似的相似性标签；由此，最终完成意图识别任务和文本匹配任务的训练。需要指出的是，训练网络的结构不限于上述结构，可以在实际应用中根据需要自行设定。

步骤S100-12-8，基于第一测试集和第二测试集，对初始模型进行测试处理，得到测试结果信息；

步骤S100-12-10，若确定测试结果信息符合预设条件，则将当前得到的初始模型确定为问题处理模型。

具体的，若根据测试结果信息确定初始模型的问题处理准确率不小于准确率阈值，则确定测试结果信息符合预设条件，将当前得到的初始模型确定为问题处理模型。

进一步的，当确定测试结果信息不符合预设条件时，可以采用知识蒸馏和对抗训练等方式对当前的到的初始模型进行调优，直至得到最终的问题处理模型。

进一步的，本申请实施例中，可以基于TensorFlow框架进行模型训练，为了提升线上的智能问题效率，本申请一个或多个实施例中，还可以将得到的问题处理模型转换为ONNX(Open Neural Network Exchange，开放神经网络交换)格式的模型。

进一步的，对应上述描述的智能问答方法，基于相同的技术构思，本申请实施例还提供了一种智能问答装置。图9为本申请实施例提供的一种智能问答装置的模块组成示意图，如图9所示，该装置包括：

获取模块201，获取待处理的目标问题；

识别模块202，通过预先训练的问题处理模型对所述目标问题进行意图识别处理，得到所述目标问题的问题意图；其中，所述问题处理模型是基于多任务的训练方式训练所得；

匹配模块203，若确定所述问题意图是指定领域的事项咨询，则通过所述问题处理模型对所述目标问题和预先生成的多个标准问答模板进行匹配处理，得到所述目标问题的标准答案；

反馈模块204，向所述目标问题的提问用户返回所述标准答案。

可选地，所述识别模块202，通过所述问题处理模型的意图识别任务对所述目标问题进行意图识别处理，得到所述目标问题的一级标签和二级标签；其中，所述一级标签和所述二级标签表征所述目标问题的问题类别，所述二级标签是所述一级标签的子标签；

相应的，所述匹配模块203，若确定所述一级标签和所述二级标签属于预设的标签集合，则确定所述目标问题的问题意图是指定领域的事项咨询。

可选地，所述匹配模块203，从所述标准问答模板中获取标注了所述一级标签和所述二级标签的至少一个标准问题，将获取的标准问题确定为候选问题；以及，

将所述目标问题与每个所述候选问题进行组合，得到待匹配的问题组合；通过所述问题处理模型的文本匹配任务，对所述问题组合中的所述标目问题和所述候选问题进行匹配处理，得到所述问题组合中的所述标目问题与所述候选问题的第一相似度；

对所述第一相似度进行排序处理，得到最大相似度；

若所述最大相似度不小于预设的相似度阈值，则将所述最大相似度对应的所述候选问题的标准答案，确定为所述目标问题的标准答案。

可选地，所述装置还包括：第一生成模块；

所述第一生成模块，获取所述指定领域的历史问题和所述历史问题的答案；以及，

根据预设的聚类方式对所述历史问题进行聚类处理，得到多个问题集合；其中，所述问题集合之间的问题类别不同，每个所述问题集合中的各历史问题为相似问题；

确定每个所述问题集合中的至少一个标准问题，并标注表征所述标准问题的问题类别的一级标签和二级标签；其中，所述二级标签是所述一级标签的子标签；

从所述答案中确定所述标准问题的标准答案；

根据标注后的所述标准问题和所述标准答案，生成所述标准问答模板。

可选地，所述装置还包括：第二生成模块和训练模块；

所述第二生成模块，根据所述问题集合生成待训练的问题样本；

所述训练模块，按照预设的多任务的训练方式，基于所述问题样本进行训练处理，得到所述问题处理模型。

本申请一个或多个实施例提供的智能问答装置，预先基于多任务的训练方式训练问题处理模型，并通过该问题处理模型识别目标问题的问题意图，以及在问题意图是事项咨询时，通过该问题处理模型对目标问题和预先获取的多个标准问答模板进行匹配，得到目标问题的标准答案。由于问题意图的识别以及问题的匹配均是通过问题处理模型进行，不仅提升了识别的准确性和匹配的准确性，而且提升了智能问答效率；再者，基于多任务的训练方式训练问题处理模型，相较于多次部署多次训练而言，不仅节约了模型的部署资源，降低了部署难度，而且提高了模型训练效率；并且，由于多任务训练增加了训练的样本量，可以使得模型集中在重要的特征上，并学习出多任务间更通用的特征，因此可以防止模型过度拟合某个任务，起到了正则化的作用。

需要说明的是，本申请中关于智能问答装置的实施例与本申请中关于智能问答方法的实施例基于同一发明构思，因此该实施例的具体实施可以参见前述对应的智能问答方法的实施，重复之处不再赘述。

进一步的，对应上述智能问答方法，基于相同的技术构思，本申请实施例还提供一种智能问答设备，该设备用于执行上述的智能问答方法，图10为本申请实施例提供的智能问答设备的结构示意图。

如图10所示，智能问答设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上的处理器301和存储器302，存储器302中可以存储有一个或一个以上存储应用程序或数据。其中，存储器302可以是短暂存储或持久存储。存储在存储器302的应用程序可以包括一个或一个以上模块(图示未示出)，每个模块可以包括智能问答设备中的一系列计算机可执行指令。更进一步地，处理器301可以设置为与存储器302通信，在智能问答设备上执行存储器302中的一系列计算机可执行指令。智能问答设备还可以包括一个或一个以上电源303，一个或一个以上有线或无线网络接口304，一个或一个以上输入输出接口305，一个或一个以上键盘306等。

在一个具体的实施例中，智能问答设备包括有存储器，以及一个或一个以上的程序，其中一个或者一个以上程序存储于存储器中，且一个或者一个以上程序可以包括一个或一个以上模块，且每个模块可以包括对智能问答设备中的一系列计算机可执行指令，且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令：

获取待处理的目标问题；

向所述目标问题的提问用户返回所述标准答案。

本申请实施例所提供的智能问答设备，预先基于多任务的训练方式训练问题处理模型，并通过该问题处理模型识别目标问题的问题意图，以及在问题意图是事项咨询时，通过该问题处理模型对目标问题和预先获取的多个标准问答模板进行匹配，得到目标问题的标准答案。由于问题意图的识别以及问题的匹配均是通过问题处理模型进行，不仅提升了识别的准确性和匹配的准确性，而且提升了智能问答效率；再者，基于多任务的训练方式训练问题处理模型，相较于多次部署多次训练而言，不仅节约了模型的部署资源，降低了部署难度，而且提高了模型训练效率；并且，由于多任务训练增加了训练的样本量，可以使得模型集中在重要的特征上，并学习出多任务间更通用的特征，因此可以防止模型过度拟合某个任务，起到了正则化的作用。

需要说明的是，本申请中关于智能问答设备的实施例与本申请中关于智能问答方法的实施例基于同一发明构思，因此该实施例的具体实施可以参见前述对应的智能问答方法的实施，重复之处不再赘述。

进一步的，对应上述的数据处理方法，基于相同的技术构思，本申请一个或多个实施例还提供了一种存储介质，用于存储计算机可执行指令，在一个具体的实施例中，该存储介质可以为U盘、光盘、硬盘等，该存储介质存储的计算机可执行指令在被处理器执行时，能实现以下流程：

获取待处理的目标问题；

向所述目标问题的提问用户返回所述标准答案。

本申请一个或多个实施例提供的存储介质存储的计算机可执行指令在被处理器执行时，预先基于多任务的训练方式训练问题处理模型，并通过该问题处理模型识别目标问题的问题意图，以及在问题意图是事项咨询时，通过该问题处理模型对目标问题和预先获取的多个标准问答模板进行匹配，得到目标问题的标准答案。由于问题意图的识别以及问题的匹配均是通过问题处理模型进行，不仅提升了识别的准确性和匹配的准确性，而且提升了智能问答效率；再者，基于多任务的训练方式训练问题处理模型，相较于多次部署多次训练而言，不仅节约了模型的部署资源，降低了部署难度，而且提高了模型训练效率；并且，由于多任务训练增加了训练的样本量，可以使得模型集中在重要的特征上，并学习出多任务间更通用的特征，因此可以防止模型过度拟合某个任务，起到了正则化的作用。

需要说明的是，本说明书中关于存储介质的实施例与本说明书中关于智能问答方法的实施例基于同一发明构思，因此该实施例的具体实施可以参见前述对应的智能问答方法的实施，重复之处不再赘述。

本领域内的技术人员应明白，本说明书一个或多个实施例可提供为方法、***或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书的一个或多个实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于***实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本文件的实施例而已，并不用于限制本文件。对于本领域技术人员来说，本文件可以有各种更改和变化。凡在本文件的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本文件的权利要求范围之内。

Claims

1.一种智能问答方法，其特征在于，包括：

获取待处理的目标问题；

向所述目标问题的提问用户返回所述标准答案。

2.根据权利要求1所述的方法，其特征在于，所述通过预先训练的问题处理模型对所述目标问题进行意图识别处理，得到所述目标问题的问题意图，包括：

通过所述问题处理模型的意图识别任务对所述目标问题进行意图识别处理，得到所述目标问题的一级标签和二级标签；其中，所述一级标签和所述二级标签表征所述目标问题的问题类别，所述二级标签是所述一级标签的子标签；

所述确定所述问题意图是指定领域的事项咨询，包括：

若确定所述一级标签和所述二级标签属于预设的标签集合，则确定所述目标问题的问题意图是指定领域的事项咨询。

3.根据权利要求2所述的方法，其特征在于，所述通过所述问题处理模型对所述目标问题和预先生成的多个标准问答模板进行匹配处理，得到所述目标问题的标准答案，包括：

从所述标准问答模板中获取标注了所述一级标签和所述二级标签的至少一个标准问题，将获取的标准问题确定为候选问题；

将所述目标问题与每个所述候选问题进行组合，得到待匹配的问题组合；

通过所述问题处理模型的文本匹配任务，对所述问题组合中的所述标目问题和所述候选问题进行匹配处理，得到所述问题组合中的所述标目问题与所述候选问题的第一相似度；

对所述第一相似度进行排序处理，得到最大相似度；

4.根据权利要求1所述的方法，其特征在于，所述获取待处理的目标问题之前，还包括：

获取所述指定领域的历史问题和所述历史问题的答案；

从所述答案中确定所述标准问题的标准答案；

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

根据所述问题集合生成待训练的问题样本；

按照预设的多任务的训练方式，基于所述问题样本进行训练处理，得到所述问题处理模型。

6.根据权利要求5所述的方法，其特征在于，所述多任务包括意图识别任务和文本匹配任务；所述根据所述问题集合生成待训练的问题样本，包括：

确定所述问题集合中每个所述历史问题的所述一级标签和所述二级标签；

将每个所述历史问题、所述历史问题的所述一级标签和所述二级标签，确定为所述意图识别任务的待训练的第一问题样本；

根据预设的采样策略，从所述问题集合中获取每个所述标准问题的非相似问题；

将每个所述标准问题，分别与所述标准问题的相似问题和非相似问题进行组合得到问题组合，并标记所述问题组合的相似性标签；

将所述问题组合和所述相似性标签，确定为所述文本匹配任务的待训练的第二问题样本。

7.根据权利要求5所述的方法，其特征在于，所述方法包括：

确定所述历史问题中需要重新分类的目标历史问题；

按照预设的时间间隔，获取相应时间间隔内所产生的新的历史问题和所述新的历史问题的答案；

将所述目标历史问题和所述新的历史问题确定为待分类问题，通过所述问题处理模型对所述待分类问题和所述标准问题进行匹配处理，得到所述待分类问题与所述标准问题的第二相似度；

根据所述第二相似度，从所述待分类问题中获取所述标准问题的相似问题；

根据所述问题集合生成待训练的问题样本，包括：

根据所述问题集合和获取的所述相似问题，生成待训练的问题样本。

8.根据权利要求7所述的方法，其特征在于，所述根据所述第二相似度，从所述待分类问题中获取所述标准问题的相似问题，包括：

根据预设方式基于所述第二相似度，确定所述待分类问题的衡量参数；

对所述衡量参数进行排序处理得到第一排序结果；

从所述第一排序结果中获取预设的第一数量的目标衡量参数；

对每个所述标准问题对应的所述目标衡量参数进行加和处理；

对所述加和处理的各结果进行排序处理，得到第二排序结果；

根据所述第二排序结果，展示对应的所述待分类问题；

若获取到管理员对展示的所述待分类问题的标注信息，则根据所述标注信息确定所述待分类问题是否为相应的所述标准问题的相似问题；

若是，则将所述待分类问题添加至所述标准问题对应的所述问题集合中。

9.根据权利要求6所述的方法，其特征在于，所述按照预设的多任务的训练方式，基于所述问题样本进行训练处理，得到所述问题处理模型，包括：

将所述第一问题样本划分为第一训练集和第一测试集，将所述第一训练集划分为多个第一训练子集，并对所述第一训练子集标注第一任务标签；所述第一任务标签表征训练任务为意图识别训练；

将所述第二问题样本划分为第二训练集和第二测试集，将所述第二训练集划分为多个第二训练子集，并对所述第二训练子集标注第二任务标签；所述第二任务标签表征训练任务为文本匹配训练；

按照预设的多任务的训练方式，迭代的基于所述第一训练子集和所述第二训练子集进行训练处理，得到所述问题处理模型的初始模型；

基于所述第一测试集和所述第二测试集，对所述初始模型进行测试处理，得到测试结果信息；

若确定所述测试结果信息符合预设条件，则将所述初始模型确定为所述问题处理模型。

10.根据权利要求9所述的方法，其特征在于，所述按照预设的多任务的训练方式，迭代的基于所述第一训练子集和所述第二训练子集进行训练处理，得到所述问题处理模型的初始模型，包括：

迭代的从所述第一训练子集中获取当前待训练的第一目标训练子集，从所述第二训练子集中获取当前待训练的第二目标训练子集；

将所述第一目标训练子集和所述第二目标训练子集中的问题样本同时输入至训练网络，进行所述意图识别任务和所述文本匹配任务的同时训练；

若确定迭代次数到达预设次数，则将当前得到的模型确定为所述问题处理模型的初始模型。

11.根据权利要求1所述的方法，其特征在于，所述方法还包括：

若确定所述问题意图不是指定领域的事项咨询，则获取预设的第一应答信息；

向所述目标问题的提问用户返回所述第一应答信息。

12.根据权利要求1所述的方法，其特征在于，所述问题处理模型基于TensorFlow框架进行训练，所述方法还包括：

将训练得到的所述问题处理模型转换为ONNX格式。

13.一种智能问答装置，其特征在于，包括：

获取模块，获取待处理的目标问题；

反馈模块，向所述目标问题的提问用户返回所述标准答案。

14.一种智能问答设备，包括：

处理器；以及，

被安排成存储计算机可执行指令的存储器，所述计算机可执行指令在被执行时使所述处理器：

获取待处理的目标问题；

向所述目标问题的提问用户返回所述标准答案。

15.一种存储介质，用于存储计算机可执行指令，所述计算机可执行指令在被处理器执行时实现以下流程：

获取待处理的目标问题；

向所述目标问题的提问用户返回所述标准答案。