CN111241237B

CN111241237B - 一种基于运维业务的智能问答数据处理方法及装置

Info

Publication number: CN111241237B
Application number: CN201911403393.XA
Authority: CN
Inventors: 李琪; 李孔仁; 王全礼; 丁浩刚; 张杨; 王琪; 张晨
Original assignee: China Construction Bank Corp
Current assignee: China Construction Bank Corp
Priority date: 2019-12-31
Filing date: 2019-12-31
Publication date: 2023-05-23
Anticipated expiration: 2039-12-31
Also published as: CN111241237A

Abstract

本发明公开了一种基于运维业务的智能问答数据处理方法及装置。所述方法包括：获取目标对象的待处理语料数据；对所述待处理语料数据作分词处理得到分词结果，所述分词结果包括至少二个分词数据和语料分析结果；将所述分词结果输入分类模型进行业务分类，所述分类模型是通过多个业务样本数据进行机器学习训练获得的，所述业务样本数据携带对应的业务分类标注信息；当分类得到的结果指示运维业务时，将所述分词结果输入与所述运维业务相匹配的问题匹配模型，以及利用所述问题匹配模型从候选问题库中确定出与所述分词结果相匹配的目标问题；获取与所述目标问题相关联的答案，以及将所述相关联的答案作为待返回的目标答案。

Description

一种基于运维业务的智能问答数据处理方法及装置

技术领域

本发明涉及互联网通信技术领域，尤其涉及一种基于运维业务的智能问答数据处理方法及装置。

背景技术

随着互联网通信技术的快速发展，智能问答***应运而生。智能问答***可以为人们的生活和工作带来便利。基于智能问答***可以建立用户与机器之间的交流，相应的，需要机器能够理解和运用人类社会的自然语言如汉语、英语等，然后由机器根据用户输入的自然语言作出回应。

相关技术中，基于问题样本和答案样本训练长短期记忆网络(LSTM，Long Short-Term Memory)得到目标模型。当向该目标模型输入问题时，该目标模型进行答案输出。然而，这样得到的答案往往缺乏语言逻辑性，需要作进一步的处理。因此，需要更准确有效的答案返回方案。

发明内容

为了解决现有技术应用在智能问答***中，返回的答案准确率低等问题，本发明提供了一种基于运维业务的智能问答数据处理方法及装置：

一方面，本发明提供了一种基于运维业务的智能问答数据处理方法，所述方法包括：

获取目标对象的待处理语料数据；

对所述待处理语料数据作分词处理得到分词结果，所述分词结果包括至少二个分词数据和语料分析结果，所述语料分析结果包括以下至少一个：词性分析结果、语法分析结果、实体分析结果和情感分析结果；

将所述分词结果输入分类模型进行业务分类，所述分类模型是通过多个业务样本数据进行机器学习训练获得的，所述业务样本数据携带对应的业务分类标注信息；

当分类得到的结果指示运维业务时，将所述分词结果输入与所述运维业务相匹配的问题匹配模型，以及利用所述问题匹配模型从候选问题库中确定出与所述分词结果相匹配的目标问题；

获取与所述目标问题相关联的答案，以及将所述相关联的答案作为待返回的目标答案；

其中，所述问题匹配模型包括至少两个场景维度的场景问题匹配模型，所述至少两个场景维度的场景问题匹配模型基于对应的优先级序列对所述分词结果进行场景问题匹配，每个所述场景问题匹配模型配置有对应的候选问题库，每个所述场景问题匹配模型是通过所述对应的候选问题库进行机器学习训练获得的。

另一方面提供了一种基于运维业务的智能问答数据处理装置，所述装置包括：

语料数据获取模块：用于获取目标对象的待处理语料数据；

分词处理模块：用于对所述待处理语料数据作分词处理得到分词结果，所述分词结果包括至少二个分词数据和语料分析结果，所述语料分析结果包括以下至少一个：词性分析结果、语法分析结果、实体分析结果和情感分析结果；

业务分类模块：用于将所述分词结果输入分类模型进行业务分类，所述分类模型是通过多个业务样本数据进行机器学习训练获得的，所述业务样本数据携带对应的业务分类标注信息；

问题匹配模块：用于当分类得到的结果指示运维业务时，将所述分词结果输入与所述运维业务相匹配的问题匹配模型，以及利用所述问题匹配模型从候选问题库中确定出与所述分词结果相匹配的目标问题；

答案获取模块：用于获取与所述目标问题相关联的答案，以及将所述相关联的答案作为待返回的目标答案；

另一方面提供了一种电子设备，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述的基于运维业务的智能问答数据处理方法。

另一方面提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如上述的基于运维业务的智能问答数据处理方法。

本发明提供的一种基于运维业务的智能问答数据处理方法及装置，具有如下技术效果：

本发明在智能问答***中引入用于业务分类、问题匹配的机器学习模型，能够提高从问题库中为待处理语料数据选择相匹配的问题的准确性和适应性。将与该问题相关联的答案作为目标答案进行返回，能够提高确定目标答***性和效率。基于业务的不同、(业务)场景维度的不同为相关模型配置对应的问题库，提高问题匹配效率的同时也方便问题库的管理维护。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1是本发明实施例提供的一种应用环境的示意图；

图2是本发明实施例提供的一种基于运维业务的智能问答数据处理方法的流程示意图；

图3是本发明实施例提供的将所述分词结果输入与所述运维业务相匹配的问题匹配模型，以及利用所述问题匹配模型从候选问题库中确定出与所述分词结果相匹配的目标问题的一种流程示意图；

图4也是本发明实施例提供的将所述分词结果输入与所述运维业务相匹配的问题匹配模型，以及利用所述问题匹配模型从候选问题库中确定出与所述分词结果相匹配的目标问题的一种流程示意图；

图5是本发明实施例提供的采用基于变换器的双向编码表示模型(BERT模型)进行场景问题匹配的模型架构图；

图6是本发明实施例提供的将所述分词结果输入所述第二级子模型进行场景问题匹配的一种流程示意图；

图7是本发明实施例提供的当分类得到的结果指示非运维业务时，确定目标答案的流程示意图；

图8是本发明实施例提供的一种基于运维业务的智能问答数据处理装置的组成框图；

图9是本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

请参阅图1，图1是本发明实施例提供的一种应用环境的示意图，可以包括客户端01和服务器02，客户端与服务器通过网络连接。客户端将目标对象的待处理语料数据发送给服务器，服务器基于该待处理语料数据返回对应的答案。需要说明的是，图1仅仅是一种示例。

具体的，客户端01可以包括智能手机、台式电脑、平板电脑、笔记本电脑、增强现实(augmented reality，AR)/虚拟现实(virtual reality，VR)设备、数字助理、智能可穿戴设备等类型的实体设备，也可以包括运行于实体设备中的软体，比如计算机程序。客户端01上运行的操作***可以包括但不限于安卓***(Android***)、IOS***(是由苹果公司开发的移动操作***)、linux(一种操作***)、Microsoft Windows(微软视窗操作***)等。

具体的，所述服务器02可以包括一个独立运行的服务器，或者分布式服务器，或者由多个服务器组成的服务器集群。服务器02可以包括有网络通信单元、处理器和存储器等等。所述服务器02可以为上述客户端提供后台服务。

在实际应用中，用户可以通过终端设备上安装的带有智能问答功能的应用程序进行人机对话，用户在该应用程序的用户交互界面输入问题。

以下介绍本发明一种基于运维业务的智能问答数据处理方法的具体实施例，图2是本发明实施例提供的一种基于运维业务的智能问答数据处理方法的流程示意图，本说明书提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的***或服务器产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图2所示，所述方法可以包括：

S201：获取目标对象的待处理语料数据；

本发明实施例中，所述目标对象可以指示客户端(这里及下述指运行于终端设置中的软体，与服务器相对)的当前登录账号或者该客户端的标识。相应的，所述目标对象的待处理语料数据可以表征使用当前登录账号的注册用户所输入的查询问题或者基于该客户端的标识进行服务体验的游客所输入的查询问题。

所述待处理语料数据可以为文字数据，比如“A大学位于B地”、“Hello”等。所述待处理语料也可以为图像、音频或者视频等数据类型的非文字数据，可以通过语音识别技术或者图像识别技术等将非文字数据转换为文字数据。

S202：对所述待处理语料数据作分词处理得到分词结果，所述分词结果包括至少二个分词数据和语料分析结果，所述语料分析结果包括以下至少一个：词性分析结果、语法分析结果、实体分析结果和情感分析结果；

本发明实施例中，对所述待处理语料数据作分词处理中可以关注所述待处理语料数据所对应的词法和句法，并对对应的词法和句法作分析。相应的，所述分词结果包括至少二个分词数据和语料分析结果，所述语料分析结果包括以下至少一个：词性分析结果、语法分析结果、实体分析结果和情感分析结果。采用词法和句法相结合分析方式，能够使得分词结果具有关注查询问题整体句意的表现。作为后续分类模型的输入的分词结果，能够帮助分类更准确的进行业务分类。

比如，所述待处理语料数据对应“A大学位于B地”；所述至少两个分词数据对应“A大学”、“位于”、“B地”；所述词性分析结果指示：“A大学”和“B地”是名词，“位于”是介词；所述语法分析结果指示：“A大学”是主语，“位于”是谓语，“B地”是宾语；所述实体分析结果指示：“A大学”是组织名，“B地”是地名；所述情感分析结果指示：中性情感(相对于正面情感、负面情感)。

在实际应用中，对所述待处理语料数据作分词处理时可以采用Stanford(斯坦福)CoreNLP(NLP：Natural Language Processing，自然语言处理)技术(一种自然语言处理技术)，进而实现对查询问题进行分词、词性分析、语法分析和实体识别分析。基于StanfordCoreNLP技术可以给出分词的基础属性(比如公司名、人名；规范化的日期等)，根据语法来标记查询问题的句子结构，发现句子中实体之间的关系等。Stanford CoreNLP技术提供了用于处理自然语言的工具集合，该工具集合指向众多语法，可以提高基于StanfordCoreNLP技术进行分词处理的鲁棒性和高效性。

S203：将所述分词结果输入分类模型进行业务分类，所述分类模型是通过多个业务样本数据进行机器学习训练获得的，所述业务样本数据携带对应的业务分类标注信息；

本发明实施例中，训练得到的分类模型具有高泛化能力。所述多个业务样本数据可以包括正样本数据(对应运维业务)和负样本数据(对应非运维业务，比如闲聊)。比如，“邮箱如何归档”对应正样本数据，“你中午吃什么了？”对应负样本数据。

在一个具体的实施例中，在所述将所述分词结果输入分类模型进行业务分类的步骤之前，可以将所述分词结果作映射处理得到分词结果向量。具体的，可以利用训练得到的word2vec模型(一群用来产生词向量的相关模型)将所述分词结果映射成向量矩阵，也就是所述分词结果向量。其中，word2vec模型是通过大量文本数据进行机器学习训练获得的。

相应的，将所述分词结果向量输入所述分类模型；利用所述分类模型的卷积层(convolution layer)提取所述分词结果向量的业务特征；由所述分类模型的全连接层(fully connected layer)基于所述业务特征输出所述业务分类结果。具体的，所述分类模型可以是基于海量的运维问题样本和闲聊问题样本训练TextCNN网络(该网络为2014年提出的用来做文本分类的卷积神经网络)而得到的，TextCNN网络具有结构简单、分类效果好的特征，它在文本分类、推荐等NLP领域应用广泛。

在实际应用中，金融机构，比如银行、证券公司、保险公司、信托投资公司和基金管理公司等，它的正常工作对于各类交易的正常进行至关重要。金融机构涉及的运维业务能够帮助维持市场稳定等，相应的，对于与运维业务相关的查询问题的准确分类能够帮助后续及时、有效的返回目标答案。

S204：当分类得到的结果指示运维业务时，将所述分词结果输入与所述运维业务相匹配的问题匹配模型，以及利用所述问题匹配模型从候选问题库中确定出与所述分词结果相匹配的目标问题；

本发明实施例中，所述问题匹配模型包括至少两个场景维度的场景问题匹配模型，所述至少两个场景维度的场景问题匹配模型基于对应的优先级序列对所述分词结果进行场景问题匹配，每个所述场景问题匹配模型配置有对应的候选问题库，每个所述场景问题匹配模型是通过所述对应的候选问题库进行机器学习训练获得的。具体的，输入初始模型的候选问题可以携带有实际标签，所述初始模型输出针对该候选问题的预测标签。可以根据所述预测标签与实际标签的差异调整所述初始模型的模型参数，将调整后的模型参数对应的初始模型作为分类模型。

所述问题匹配模型基于(业务)场景作更细粒度的分级设置，对于与运维业务相关的查询问题能够在不同问题库中作不同场景维度的匹配。不同场景维度的优先级可以是结合实际经验(比如返回答案的历史准确性、历史效率)而设置的。每个所述场景问题匹配模型配置有对应的候选问题库，这样对于海量的候选问题，也可以基于场景维度对所述对应的候选问题库做好管理维护工作。

在一个具体的实施例中，所述至少两个场景维度的场景问题匹配模型包括多轮对话场景问题匹配模型和单轮对话场景问题匹配模型。其中，多轮对话场景问题匹配模型在确定出目标问题后，相比多轮对话场景问题匹配模型，除了返回与所述目标问题相关联的答案，还结合上下文信息、历史经验等确定相邻意图、进而将推荐问题与所述相关联的问题一道作返回。推荐问题可以以更自然且符合用户习惯的方式引导用户进行下轮对话。多轮会话的数据挖掘，能够提升运维的效率和质量，节省人力成本。

如图3所示，所述将所述分词结果输入与所述运维业务相匹配的问题匹配模型，以及利用所述问题匹配模型从候选问题库中确定出与所述分词结果相匹配的目标问题，包括：

S301：将所述分词结果输入所述多轮对话场景问题匹配模型进行场景问题匹配，所述多轮对话场景问题匹配模型对应第一候选问题库；

S302：当所述多轮对话场景问题匹配模型从所述第一候选问题库中确定出相匹配的第一候选问题时，将所述第一候选问题作为所述目标问题；

S303：当所述多轮对话场景问题匹配模型未从所述第一候选问题库中确定出相匹配的问题时，将所述分词结果输入所述单轮对话场景问题匹配模型进行场景问题匹配，所述单轮对话场景问题匹配模型对应第二候选问题库；

S304：当所述单轮对话场景问题匹配模型从所述第二候选问题库中确定出相匹配的第二候选问题时，将所述第二候选问题作为所述目标问题。

采用多轮会话引擎(对应多轮对话场景问题匹配模型)和单轮会话引擎(对应多轮对话场景问题匹配模型)两种引擎，以及在本具体的实施例中先利用对轮会话引擎再利用单轮会话引擎，这样能够提高确定用户意图的准确性，能够提高确定目标问题、进而向用户返回目标答案的效率。

另外，考虑到多轮会话引擎的返回中还可以携带推荐问题，相对于单轮会话引擎只返回目标答案，往往数据量更大。可以结合与客户端间的当前通信网络状态，当通信网络状态较差时，跳过多轮会话引擎、直接由单轮会话引擎作问题匹配。

进一步的，如图4所示，当所述单轮对话场景问题匹配模型未从所述第二候选问题库中确定出相匹配的问题时，所述方法还包括：

S305：基于所述分词结果构建问题模板；

所述问题模板通过执行下述步骤构建：首先，基于所述分词结果确定问题关键词以及为所述问题关键词配置对应的第二权重；然后，获取权重阈值，以及将所述对应的第二权重大于所述权重阈值的问题关键词作为核心关键词；接着，基于所述分词结果和所述核心关键词得到问题模板。

其中，问题关键词可以是采用Stanford CoreNLP技术对所述第二候选问题库中每个候选问题作分词处理得到的。可以利用TF-IDF(Term Frequency(词频)-InverseDocument Frequency(逆文本频率指数))技术(一种用于信息检索与数据挖掘的常用加权技术)为所述问题关键词配置对应的第二权重。在确定核心关键词时，一方面，可以直接将所述对应的第二权重大于所述第一权重阈值(比如0.6)的问题关键词作为核心关键词；一方面，当查询问题比较长时，可以结合第一权重阈值以及目标词数(比如大于1/2*所述至少两个分词数据对应的次数)来确定核心关键词，保证匹配的准确性。在确定核心关键词后，可以根据核心关键词在查询问题中的句法关系进行排列生成问题模板，问题模板格式一般为：[＄A][＄B][＄C][＄D]。

S306：基于所述第二候选问题库和同义词库对所述问题模板进行匹配。

同义词库中将词意相同的一组词归为一类，用[$X]示意。比如，[$失败]，它表示和‘失败’意思相同的一组词。

问题模板的生成，使得问题库的维护更加方便。在对问题模板进行匹配时，可以首先，解析问题模板；然后，从同义词库里的取出每个核心关键词对应的同义词；接着，利用所述对应的同义词将所述问题模板转换为完整模板；进而，基于所述第二候选问题库对所述完整模板进行匹配，若所述第二候选问题库中不存在与所述完整模板匹配度超过匹配度阈值的候选问题，则返回匹配失败；若存在，则将该候选问题确定为目标问题。

在另一个具体的实施例中，每个所述场景问题匹配模型包括第一级子模型和第二级子模型，将所述分词结果输入所述场景问题匹配模型进行场景问题匹配的过程通过执行下述步骤实现：1)将所述分词结果输入所述第一级子模型进行场景问题匹配；2)当所述第一级子模型从所述对应的候选问题库中确定出相匹配的第三候选问题时，将所述第三候选问题作为所述目标问题；3)当所述第一级子模型未从所述对应的候选问题库中确定出相匹配的问题时，将所述分词结果输入所述第二级子模型进行场景问题匹配；4)当所述第二级子模型从所述对应的候选问题库中确定出相匹配的第四候选问题时，将所述第四候选问题作为所述目标问题；5)当所述第二级子模型未从所述对应的候选问题库中确定出相匹配的问题时，将所述分词结果输入优先级低于当前场景问题匹配模型的场景问题匹配模型进行场景问题匹配。

具体的，所述第一级子模型采用基于变换器的双向编码表示模型(BERT模型)。由BERT模型所执行的短文本相似度分析任务在自然语言处理(NLP)上可以归类为分类任务，其类别主要为相似(1)和不相似(0)。基于BERT模型进行场景问题匹配，能够保证确定目标答案的精准性。

在所述将所述分词结果输入所述第一级子模型进行场景问题匹配的步骤之前，可以根据所述分词结果得到每个所述分词数据对应的词向量；根据所述分词结果对所述待处理语料数据进行句意分段得到至少一个分段数据以及所述至少一个分段数据对应的段向量；根据所述分词结果得到每个所述分词数据对应的位置向量。

第一级子模型的输入表示可以在一个词序列中表示单个文本句或一对文本(比如两个文本句)。对于给定的词，其输入表示是可以通过三部分Embedding(向量)求和组成：1)Token Embeddings：词向量，第一个单词是CLS标志(可以用于之后的分类任务；对于非分类任务，可以忽略词向量)；2)Segment Embeddings：段向量，用来区别两种句子；3)PositionEmbeddings：位置向量。

如图5所示，可以采用预训练模型对所述分词结果作预处理，该预训练模型所对应的微调(fine-tuning)基于PyTorch框架(一种神经网络框架)实现。比如，所述待处理语料数据对应：“怎么办理建行***”和“如何办理建设银行***”，所述至少两个分词数据对应：“怎么”、“办理”、“建行”、“***”和“如何”、“办理”、“建设”、“银行”、“***”。相应的，采用预训练模型对所述分词结果作预处理的结果可参见下表1：

/>

表1

其中，[CLS]为用于BERT模型的开始符号，[SEP]用于分割两个句子。当然，输入所述预训练模型的也可以是所述待处理语料数据。所述预训练模型还对以两个文本句的输入执行分类任务。

相应的，将所述对应的词向量、所述对应的段向量和所述对应的位置向量输入所述第一级子模型进行场景问题匹配。第一级子模型中取所述对应的候选问题库中与查询问题相似度最大的候选问题作为目标问题。

在训练第一级子模型时，可以用segments_ids来标注当前输入模型的问题是否属于所述对应的候选问题库，以及用tokenizer对当前输入模型的问题进行分割(可参考上述得到词向量、段向量和位置向量的处理过程)得到标识sent_token，进而将sent_token、segments_ids和当前输入模型的问题一起输入初始网络进行训练。

具体的，所述第二级子模型采用概率检索模型，所述概率检索模型可以是基于BM25算法(用于做检索相关性评分)训练得到的。利用所述概率检索模型进行场景问题匹配，能够更关注在所述对应的候选问题库中的实际检索结果，在确定出目标问题时能够更好的兼顾效率和准确性，能够在一定程度上弥补BERT模型所忽略的命中率。如图6所示，所述将所述分词结果输入所述第二级子模型进行场景问题匹配，包括：

S601：计算每个所述分词数据与所述对应的候选问题库中每个候选问题的第一相关度；

比如，所述待处理语料数据对应查询问题Query“邮箱如何归档”，所述至少两个分词数据对应“邮箱”、“如何”和“归档”，每个分词用q_i表示。所述对应的候选问题库D中每个候选问题用d_j表示。相应的，计算q_i与d_j的第一相关度，也就是q₁(对应“邮箱”)与d_j的第一相关度，q₂(对应“如何”)与d_j的第一相关度，q₃(对应“归档”)与d_j的第一相关度。

以下为q_i与d_j相关度R(q_i，d_j)的计算公式：

/>

其中，

k₁、k₂、b为调节因子，参数b用来控制文档长度对相关度取值影响程度，通常根据经验设置为k₁＝1、k₂＝2、b＝0.75；f_i为q_i在d_j中出现的频率(次数)，qf_i为q_i在Query中出现的频率(次数)。dl为d_j的文档长度，avgdl为D中所有d_j的平均文档长度。在多数情况下q_i只在Query中出现一次，qf_i＝1，所以公式可以简化为：

从K的公式中发现：b越大，文档长度对相关度取值的影响也越大；而文档长度越长，K越大，相关度取值则越小。当文档长度较长时，包含分词q_i的概率越大，因此同等频率的情况下，长文档与q_i的相关性不如短文档与q_i的相关度高。

S602：基于所述对应的候选问题库，为每个所述分词数据配置对应的第一权重；

可以基于IDF(逆文本频率指数)技术来为每个所述分词数据配置对应的第一权重：

其中，N表示所述对应的候选问题库D的文档总数(对应所有候选问题)，n(q_i)表示所述对应的候选问题库D中包含分词q_i的候选问题的文档数。从公式中可以发现当包含分词q_i的文档数越多时，q_i的权重越低，即当很多文档都有分词q_i时，说明分词q_i比较常用，没有特别代表意义，所以分词q_i拿来做相关度判断时重要性比较低。

S603：基于所述对应的第一权重和每个所述分词数据与所述对应的候选问题库中每个候选问题的第一相关度，得到所述待处理语料数据与所述对应的候选问题库中每个候选问题的第二相关度；

以下为Q与d_j相关度Score(Q，d_j)的计算公式：

由该公式得到查询问题Query与所述对应的候选问题库D中每个候选问题d_j第二相关性度。综合上述W_i和K的计算公式：

S604：从所述待处理语料数据对应的第二相关度中确定出满足相关度阈值要求的目标相关度，以及将所述目标相关度对应的候选问题作为所述目标问题。

第一级子模型中取所述对应的候选问题库中与查询问题相似度最大的候选问题作为目标问题。

在实际应用中，问题匹配模型中可以包括多轮会话引擎(对应多轮对话场景问题匹配模型)和单轮会话引擎(对应多轮对话场景问题匹配模型)。多轮会话引擎中包含BERT模型和概率检索模型：1)先利用BERT模型在多轮会话问题库中进行匹配，2)若匹配成功则基于目标问题返回对应的答案给用户，3)若匹配失败则利用概率检索模型在多轮会话问题库中进行匹配，4)若匹配成功则基于目标问题返回对应的答案给用户，5)若匹配失败则触发利用单轮会话引擎进行场景问题匹配的步骤。单轮会话引擎中包含BERT模型和概率检索模型：1)先利用BERT模型在单轮会话问题库中进行匹配，2)若匹配成功则基于目标问题返回对应的答案给用户，3)若匹配失败则利用概率检索模型在单轮会话问题库中进行匹配，4)若匹配成功则基于目标问题返回对应的答案给用户，5)若匹配失败则触发构建问题模板、基于单轮会话问题库和同义词库对所述问题模板进行匹配的步骤。

S205：获取与所述目标问题相关联的答案，以及将所述相关联的答案作为待返回的目标答案；

本发明实施例中，候选问题库中的候选问题及其相关联的答案存储于数据库中，候选问题与其相关联的答案基于关联关系存储于所述数据库中。当从候选问题库中确定出与所述分词结果相匹配的目标问题后，基于关联关系确定相关联的答案，进而将所述相关联的答案作为目标答案向用户返回。

如图7所示，当分类得到的结果指示非运维业务时，所述方法还包括：

S701：基于所述分词结果得到特征词集合；

S702：基于参考问题库，确定所述特征词集合中每个特征词对应的词频和逆文本频率指数；

S703：基于所述对应的词频和逆文本频率指数，得到每个所述特征词对应的权重值；

S704：基于所述对应的权重值和所述参考问题库的参考词集合构建第一向量；

S705：分别计算所述第一向量与所述参考问题库中每个参考问题对应的参考向量的相似度；

S706：确定最大相似度对应的参考问题，以及将所述最大相似度对应的参考问题相关联的答案作为待返回的目标答案。

当分类得到的结果指示非运维业务(比如闲聊)时，可以基于所述分词结果得到特征词集合，然后利用TF-IDF技术为所述特征词集合中每个特征词配置对应的权重值：

1)基于参考问题库D(比如闲聊问题库)，以下式确定所述特征词集合T中每个特征词t_i对应的词频：

其中，

为特征词t_i在参考问题库D中的出现次数，W_d为参考问题库D中的总词数；

2)基于参考问题库D(比如闲聊问题库)，以下式确定所述特征词集合T中每个特征词t_i对应的逆文本频率指数：

其中，N为参考问题库D的文档总数(对应所有参考问题)，

为参考问题库D中包含特征词t_i的参考问题的文档数。

3)词频可以表征该特征词描述文档内容的能力，逆文本频率指数可以表征该特征词区分文档的能力。特征词t_i的权重值＝TF(t_i，D)*IDF(t_i，D)。当某一特征词在特定参考问题中出现的频率越高，同时在参考问题中出现的次数越少，则它的权重值也越大。

接着，基于所述对应的权重值和所述参考问题库的参考词集合构建第一向量，可以为一个一维向量；再分别计算所述第一向量与所述参考问题库中每个参考问题对应的参考向量的相似度，可以采用以下之一进行相似度计算：欧式距离、余弦相似度、相对熵；最后，确定最大相似度对应的参考问题，以及将所述最大相似度对应的参考问题相关联的答案作为待返回的目标答案。

由以上本说明书实施例提供的技术方案可见，本说明书实施例中在智能问答***中引入用于业务分类、问题匹配的机器学习模型，机器学习模型对于数据表示的学习能力更强，能够提高从问题库中为待处理语料数据选择相匹配的问题的准确性和适应性。将与该问题相关联的答案作为目标答案进行返回，能够提高确定目标答***性和效率。基于业务的不同、(业务)场景维度的不同为相关模型配置对应的问题库，提高问题匹配效率的同时也方便问题库的管理维护。

本发明实施例还提供了一种基于运维业务的智能问答数据处理装置，如图8所示，所述装置包括：

语料数据获取模块810：用于获取目标对象的待处理语料数据；

分词处理模块820：用于对所述待处理语料数据作分词处理得到分词结果，所述分词结果包括至少二个分词数据和语料分析结果，所述语料分析结果包括以下至少一个：词性分析结果、语法分析结果、实体分析结果和情感分析结果；

业务分类模块830：用于将所述分词结果输入分类模型进行业务分类，所述分类模型是通过多个业务样本数据进行机器学习训练获得的，所述业务样本数据携带对应的业务分类标注信息；

问题匹配模块840：用于当分类得到的结果指示运维业务时，将所述分词结果输入与所述运维业务相匹配的问题匹配模型，以及利用所述问题匹配模型从候选问题库中确定出与所述分词结果相匹配的目标问题；

答案获取模块850：用于获取与所述目标问题相关联的答案，以及将所述相关联的答案作为待返回的目标答案；

需要说明的，所述装置实施例中的装置与方法实施例基于同样的发明构思。

本发明实施例提供了一种电子设备，该电子设备包括处理器和存储器，该存储器中存储有至少一条指令或至少一段程序，该至少一条指令或该至少一段程序由该处理器加载并执行以实现如上述方法实施例所提供的基于运维业务的智能问答数据处理方法。

进一步地，图9示出了一种用于实现本发明实施例所提供的基于运维业务的智能问答数据处理方法的电子设备的硬件结构示意图，所述电子设备可以参与构成或包含本发明实施例所提供的基于运维业务的智能问答数据处理装置。如图9所示，电子设备90可以包括一个或多个(图中采用902a、902b，……，902n来示出)处理器902(处理器902可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器904、以及用于通信功能的传输装置906。除此以外，还可以包括：显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解，图9所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，电子设备90还可包括比图9中所示更多或者更少的组件，或者具有与图9所示不同的配置。

应当注意到的是上述一个或多个处理器902和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到电子设备90(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的，该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器904可用于存储应用软件的软件程序以及模块，如本发明实施例中所述的方法对应的程序指令/数据存储装置，处理器902通过运行存储在存储器94内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的一种基于运维业务的智能问答数据处理方法。存储器904可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器904可进一步包括相对于处理器902远程设置的存储器，这些远程存储器可以通过网络连接至电子设备90。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置906用于经由一个网络接收或者发送数据。上述的网络具体实例可包括电子设备90的通信供应商提供的无线网络。在一个实例中，传输装置906包括一个网络适配器(NetworkInterfaceController，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实施例中，传输装置906可以为射频(RadioFrequency，RF)模块，其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD)，该液晶显示器可使得用户能够与电子设备90(或移动设备)的用户界面进行交互。

本发明的实施例还提供了一种存储介质，所述存储介质可设置于电子设备之中以保存用于实现方法实施例中一种基于运维业务的智能问答数据处理方法相关的至少一条指令或至少一段程序，该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述方法实施例提供的基于运维业务的智能问答数据处理方法。

可选地，在本实施例中，上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是：上述本发明实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置和电子设备实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于运维业务的智能问答数据处理方法，其特征在于，所述方法包括：

获取目标对象的待处理语料数据；

其中，所述问题匹配模型包括至少两个场景维度的场景问题匹配模型，所述至少两个场景维度的场景问题匹配模型包括多轮对话场景问题匹配模型和单轮对话场景问题匹配模型，所述至少两个场景维度的场景问题匹配模型基于对应的优先级序列对所述分词结果进行场景问题匹配，每个所述场景问题匹配模型配置有对应的候选问题库，每个所述场景问题匹配模型是通过所述对应的候选问题库进行机器学习训练获得的；每个所述场景问题匹配模型包括第一级子模型和第二级子模型，所述第一级子模型采用基于变换器的双向编码表示模型，所述第二级子模型采用概率检索模型，将所述分词结果输入所述场景问题匹配模型进行场景问题匹配的过程通过执行下述步骤实现：将所述分词结果输入所述第一级子模型进行场景问题匹配；当所述第一级子模型从所述对应的候选问题库中确定出相匹配的第三候选问题时，将所述第三候选问题作为所述目标问题；当所述第一级子模型未从所述对应的候选问题库中确定出相匹配的问题时，将所述分词结果输入所述第二级子模型进行场景问题匹配；当所述第二级子模型从所述对应的候选问题库中确定出相匹配的第四候选问题时，将所述第四候选问题作为所述目标问题；当所述第二级子模型未从所述对应的候选问题库中确定出相匹配的问题时，将所述分词结果输入优先级低于当前场景问题匹配模型的场景问题匹配模型进行场景问题匹配。

2.根据权利要求1所述的方法，其特征在于，所述将所述分词结果输入分类模型进行业务分类之前，所述方法还包括：

将所述分词结果作映射处理得到分词结果向量；

相应的，所述将所述分词结果输入分类模型进行业务分类，包括：

将所述分词结果向量输入所述分类模型；

利用所述分类模型的卷积层提取所述分词结果向量的业务特征；

由所述分类模型的全连接层基于所述业务特征输出所述业务分类结果。

3.根据权利要求1所述的方法，其特征在于，所述将所述分词结果输入与所述运维业务相匹配的问题匹配模型，以及利用所述问题匹配模型从候选问题库中确定出与所述分词结果相匹配的目标问题，包括：

将所述分词结果输入所述多轮对话场景问题匹配模型进行场景问题匹配，所述多轮对话场景问题匹配模型对应第一候选问题库；

当所述多轮对话场景问题匹配模型从所述第一候选问题库中确定出相匹配的第一候选问题时，将所述第一候选问题作为所述目标问题；

当所述多轮对话场景问题匹配模型未从所述第一候选问题库中确定出相匹配的问题时，将所述分词结果输入所述单轮对话场景问题匹配模型进行场景问题匹配，所述单轮对话场景问题匹配模型对应第二候选问题库；

当所述单轮对话场景问题匹配模型从所述第二候选问题库中确定出相匹配的第二候选问题时，将所述第二候选问题作为所述目标问题。

4.根据权利要求1所述的方法，其特征在于，所述第一级子模型采用基于变换器的双向编码表示模型，所述将所述分词结果输入所述第一级子模型进行场景问题匹配之前，所述方法还包括：

根据所述分词结果得到每个所述分词数据对应的词向量；

根据所述分词结果对所述待处理语料数据进行句意分段得到至少一个分段数据以及所述至少一个分段数据对应的段向量；

根据所述分词结果得到每个所述分词数据对应的位置向量；

相应的，所述将所述分词结果输入所述第一级子模型进行场景问题匹配，包括：

将所述对应的词向量、所述对应的段向量和所述对应的位置向量输入所述第一级子模型进行场景问题匹配。

5.根据权利要求1所述的方法，其特征在于，所述第二级子模型采用概率检索模型，所述将所述分词结果输入所述第二级子模型进行场景问题匹配，包括：

计算每个所述分词数据与所述对应的候选问题库中每个候选问题的第一相关度；

基于所述对应的候选问题库，为每个所述分词数据配置对应的第一权重；

基于所述对应的第一权重和每个所述分词数据与所述对应的候选问题库中每个候选问题的第一相关度，得到所述待处理语料数据与所述对应的候选问题库中每个候选问题的第二相关度；

从所述待处理语料数据对应的第二相关度中确定出满足相关度阈值要求的目标相关度，以及将所述目标相关度对应的候选问题作为所述目标问题。

6.根据权利要求3所述的方法，其特征在于，当所述单轮对话场景问题匹配模型未从所述第二候选问题库中确定出相匹配的问题时，所述方法还包括：

基于所述分词结果构建问题模板；

基于所述第二候选问题库和同义词库对所述问题模板进行匹配。

7.根据权利要求6所述的方法，其特征在于，所述问题模板通过执行下述步骤构建：

基于所述分词结果确定问题关键词以及为所述问题关键词配置对应的第二权重；

获取权重阈值，以及将所述对应的第二权重大于所述权重阈值的问题关键词作为核心关键词；

基于所述分词结果和所述核心关键词得到问题模板。

8.根据权利要求1所述的方法，其特征在于，当分类得到的结果指示非运维业务时，所述方法还包括：

基于所述分词结果得到特征词集合；

基于参考问题库，确定所述特征词集合中每个特征词对应的词频和逆文本频率指数；

基于所述对应的词频和逆文本频率指数，得到每个所述特征词对应的权重值；

基于所述对应的权重值和所述参考问题库的参考词集合构建第一向量；

分别计算所述第一向量与所述参考问题库中每个参考问题对应的参考向量的相似度；

确定最大相似度对应的参考问题，以及将所述最大相似度对应的参考问题相关联的答案作为待返回的目标答案。

9.一种基于运维业务的智能问答数据处理装置，其特征在于，所述装置包括：

语料数据获取模块：用于获取目标对象的待处理语料数据；

10.一种电子设备，其特征在于，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或至少一段程序由所述处理器加载并执行以实现如权利要求1-8任意一项所述的基于运维业务的智能问答数据处理方法。

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或至少一段程序由处理器加载并执行以实现如权利要求1-8任意一项所述的基于运维业务的智能问答数据处理方法。