CN113762451B

CN113762451B - 基于场景和关键词规则的任务型问答机器人

Info

Publication number: CN113762451B
Application number: CN202110995597.8A
Authority: CN
Inventors: 陈再蝶; 朱晓秋; 周杰; 樊伟东
Original assignee: Kangxu Technology Co ltd
Current assignee: Kangxu Technology Co ltd
Priority date: 2021-08-27
Filing date: 2021-08-27
Publication date: 2024-02-27
Anticipated expiration: 2041-08-27
Also published as: CN113762451A

Abstract

本发明公开了基于场景和关键词规则的任务型问答机器人，包括多轮问答树、关键词规则、文本相似度规则、是否问题情感分析机制和槽位配置机制，所述文本相似度规则包括bert模型和余弦相似度模型，所述是否问题情感分析机制包括gbdt分类器。本发明中，通过主关键词区分出了不同的场景，每个场景就是一颗独立的树，每个树配置有自己独立的辅助关键词和主关键词，在每棵树的每一个节点中，除去关键词组合规则以外，通过bert模型、余弦相似度模型和gbdt分类器添加了文本向量化、文本相似度和情感分析等算法内容，使得这套基于规则的任务型问答机器人不必完全依赖于规则配置，改善了传统规则机器人相对死板不够灵活的缺点。

Description

基于场景和关键词规则的任务型问答机器人

技术领域

本发明涉及任务型机器人技术领域，尤其涉及基于场景和关键词规则的任务型问答机器人。

背景技术

任务型机器人指特定条件下提供信息或服务的机器人。通常情况下是为了满足带有明确目的的用户，例如查流量，查话费，订餐，订票，咨询等任务型场景。由于用户的需求较为复杂，通常情况下需分多轮互动，用户也可能在对话过程中不断修改与完善自己的需求，任务型机器人需要通过询问、澄清和确认来帮助用户明确目的，目前工业界有两种实现方式：基于规则的实现方式和基于End-to-End的实现方式。

其中，基于End-to-End的多轮对话任务型机器人，试图训练一个从用户端自然语言输入到机器端自然语言输出的整体映射关系，从而提高***的灵活性与可拓展性，但该模型对数据的质量和数量要求非常高，并且存在不可解释性，因此，目前工业界大多采用基于规则的实现方式。

而基于规则的多轮对话任务型机器人，一种是基于正则匹配的规则，这种方法对于提问者的要求过于严格，比较死板；

另一种是类似商业对话***，将输入的文本映射到由多个语义槽组成的语义框架内，一个语义槽的匹配规则由多个槽值类型与连接词构成，从而表达一段完整的信息。这个方式的缺点是：(1)规则开发易出错；(2)调整规则需要多轮的迭代；(3)规则冲突的情况下较难维护；(4)完全依赖规则，不能灵活生动得理解用户的意思；

因此，本发明提出基于场景和关键词规则的任务型问答机器人，改善传统基于规则的问答机器人的缺点，如(1)用户问法较为死板；(2)应用场景比较局限；(3)规则配置容易出错，容易产生规则冲突；(4)规则定位准确率不高的问题。

发明内容

为了解决上述背景技术中所提到的技术问题，而提出的基于场景和关键词规则的任务型问答机器人。

为了实现上述目的，本发明采用了如下技术方案：

基于场景和关键词规则的任务型问答机器人，包括多轮问答树、关键词规则、文本相似度规则、是否问题情感分析机制和槽位配置机制，所述文本相似度规则包括bert模型和余弦相似度模型，所述是否问题情感分析机制包括gbdt分类器，所述bert模型经过多个场景文本数据进行微调，以适配于余弦相似度模型和gbdt分类器；

所述多轮问答树包括多个节点，所述节点配置有相应的关键词规则或者情感分析机制，所述关键词规则包括定位多轮问答树的主关键词，以及定位节点的辅助关键词，向问答机器人输入问句，通过关键词规则定位多轮问答树中的节点，并匹配相应的问题回复；

所述节点还包括上一轮节点是是否问题的节点，该节点未配置关键词规则、情感分析机制和文本相似度规则，在下一轮节点中，将本轮的问句通过是否问题情感分析机制将问句区分为是、否和没有正面回答问题三类，对于明确的是、否类别，进行相应的回复匹配，对于没有正面回答问题类别，重新进行多轮问答树和节点定位。

作为上述技术方案的进一步描述：

配置有所述关键词规则的节点同步配置有文本相似度规则，所述文本相似度规则的优先度低于关键词规则，即当关键词规则未命中任何节点的情况下，通过文本相似度规则命中对应的节点，并反向定位多轮问答树。

作为上述技术方案的进一步描述：

在通过文本相似度规则定位节点和多轮问答树的过程中，先通过bert模型将问句进行向量化，再使用余弦相似度模型进行相似度计算排序，将相似度最高且高于相似度阈值的节点作为命中的节点；

所述余弦相似度模型的公式表述如下：

其中，A和B为计算相似度的两个n维向量。

作为上述技术方案的进一步描述：

在通过是否问题情感分析机制分类问句类型的过程中，先通过bert模型对问句进行向量化，再利用gbdt分类器将问句区分为是、否和没有正面回答问题三类。

作为上述技术方案的进一步描述：

所述gbdt分类器通过多轮迭代，每轮迭代产生一个弱分类器，每个分类器在上一轮分类器的残差基础之上进行训练，最终得到的gbdt分类器是将每轮训练得到的弱分类器加权求和得到的；

所述弱分类器选择分类回归树，所述残差的公式表述如下：

其中，将数据(x_i,r_im)，i＝1,2,···,N作为下一轮分类回归树的训练数据，得到新的分类回归树，其对应的叶子节点区域为R_jm,j＝1,2,···,J，j为叶子节点个数；

所述gbdt分类器的公式表述如下：

其中，f₀(x)为初始弱分类器，γ_jm为对叶子区域计算的最佳拟合值，R_jm为叶子节点的区域，m表示迭代次数、即生成的弱分类器个数，L是损失函数，c是初始随机给定的常数，I(x∈R_jm)表示判断x是否属于叶子，属于返回1，不属于返回0。

作为上述技术方案的进一步描述：

所述bert模型从文本数据中提取特征，即单词和句子的嵌入向量，这些向量被用作余弦相似度模型或者gbdt分类器的输入特征。

作为上述技术方案的进一步描述：

所述节点均设有槽位配置机制，即每个节点的问题回复中设置有动态配置的替代符，根据不同的多轮问答树匹配具体内容。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

通过多轮问答树，将问答机器人的流程规范化的同时，通过主关键词区分出了不同的场景，每个场景就是一颗独立的树，每个树配置有自己独立的辅助关键词和主关键词，同样的词在不同场景中会体现出不同的规则，在这样的设计下，使得规则机器人的配置更加规范化，并且由于区分了场景的缘故，很大程度上避免了传统规则机器人中规则冲突的矛盾情况，使得规则配置更加简单高效以及职责分明，在每棵树的每一个节点中，除去关键词组合规则以外，通过bert模型、余弦相似度模型和gbdt分类器添加了文本向量化、文本相似度和情感分析等算法内容，使得这套基于规则的任务型问答机器人不必完全依赖于规则配置，改善了传统规则机器人相对死板不够灵活的缺点，最后将节点中的回复从固定化的回复调整成动态配置的回复，可以通过不同的场景环境，给回复中的槽位配置不同的内容。

附图说明

图1示出了根据本发明实施例提供的基于场景和关键词规则的任务型问答机器人的问答流程示意图；

图2示出了根据本发明实施例提供的基于场景和关键词规则的任务型问答机器人的场景定位流程示意图；

图3示出了根据本发明实施例提供的基于场景和关键词规则的任务型问答机器人的bert模型的结构示意图；

图4示出了根据本发明实施例提供的基于场景和关键词规则的任务型问答机器人的bert模型的句子输入示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

实施例一

请参阅图1-4，本发明提供一种技术方案：基于场景和关键词规则的任务型问答机器人，包括多轮问答树、关键词规则、文本相似度规则、是否问题情感分析机制和槽位配置机制，文本相似度规则包括bert模型和余弦相似度模型，是否问题情感分析机制包括gbdt分类器，bert模型经过多个场景文本数据进行微调，以适配于余弦相似度模型和gbdt分类器，bert模型从文本数据中提取特征，即单词和句子的嵌入向量，这些向量被用作余弦相似度模型或者gbdt分类器的输入特征；

具体的，bert模型是一种预训练语言表示的方法，可以使用该模型从文本数据中提取高质量的语言特征，也可以使用自己的数据对这些模型进行微调，以完成特定的任务(分类、实体识别、问题回答等)，从而生成最先进的预测；

我们将使用bert模型从文本数据中提取特征，即单词和句子的嵌入向量，这些向量被用作下游模型的高质量特征输入。NLP模型(如LSTMs或CNNs)需要以数字向量的形式输入，这通常意味着需要将词汇表和部分语音等特征转换为数字表示。在过去，单词被表示为惟一索引值(one-hot编码)，或者更有用的是作为神经单词嵌入，其中词汇与固定长度的特征嵌入进行匹配，这些特征嵌入是由Word2Vec或Fasttext等模型产生的。与Word2Vec之类的模型相比，bert模型提供了一个优势，因为尽管Word2Vec下的每个单词都有一个固定的表示，而与单词出现的上下文无关，bert模型生成的单词表示是由单词周围的单词动态通知的；

例如，给定两句话：“The man was accused of robbing a bank.”和“The manwent fishing by the bank of the river.”，Word2Vec将在两个句子中为单词“bank”生成相同的单词嵌入，而在bert模型中为“bank”生成不同的单词嵌入。除了捕获一词多义之类的明显差异外，上下文相关的单词embeddings还捕获其他形式的信息，这些信息可以产生更精确的特征表示，从而提高模型性能。

从原理上讲：bert模型是一个用Transformer作为特征抽取器的深度双向预训练语言理解模型。bert模型就是一个预训练模型，利用双向Transformer，通过大量数据训练一个语言表征模型，这是一个通用模型，通过对其微调来适用下游任务，包括分类，回归，机器翻译，问答***等等任务，在本实例中应用的下游模型就是余弦相似度模型或者gbdt分类器。

bert模型的结构如图3和图4所示，Transformer Encoder，也就是每时每刻的Attention计算都能够得到全部时刻的输入，bert模型的输入相较其它模型，采用了三个Embedding相加的方式，通过加入Token Embeddings，Segment Embeddings，PositionEmbeddings三个向量，以此达到预训练和预测下一句的目的；

bert模型的输入Input是两个句子："my dog is cute"，"he likes playing"。首先，会在第一句开头加上特殊Token[CLS]用于标记句子开始，用[SEP]标记句子结束，然后，对每个Token进行3个Embedding，词的Embedding(Token Embeddings)，位置Embedding(Position Embeddings)，句子Embedding(Segment Embeddings)，最终将三个Embedding求和的方式输入到下一层。

多轮问答树包括多个节点，节点配置有相应的关键词规则或者情感分析机制，关键词规则包括定位多轮问答树的主关键词，以及定位节点的辅助关键词，向问答机器人输入问句，通过关键词规则定位多轮问答树中的节点，并匹配相应的问题回复；

节点还包括上一轮节点是是否问题的节点，该节点未配置关键词规则、情感分析机制和文本相似度规则，在下一轮节点中，将本轮的问句通过是否问题情感分析机制将问句区分为是、否和没有正面回答问题三类，对于明确的是、否类别，进行相应的回复匹配，对于没有正面回答问题类别，重新进行多轮问答树和节点定位，具体的，在通过是否问题情感分析机制分类问句类型的过程中，先通过bert模型对问句进行向量化，再利用gbdt分类器将问句区分为是、否和没有正面回答问题三类；

首先，任务型问答机器人的基本框架为多轮问答树，每一棵树可以理解为一个场景或者说一个大类，比如理财、基金、存款和贷款等大类，每一棵树都配置有一些主关键词帮助定位场景，形如以下表1所示：

表1

场景	主关键词
		贷款	贷款、借钱、借款
存款	存款、存现金、存钞票、存钱······
		······	······

如图2所示，问答机器人的第一步就是定位场景，如果有问答记录的，会优先继承上一个问答的场景，如果该场景下，没有匹配到任何关键词、是否问题和文本相似度规则，就会重新定位新问句的新场景，如果没有任何主关键词的出现，则进入通用场景；

对于每一个场景或者说这棵树下的每一个节点，除了上一轮问答像客户提问的是选择性的是否问题的下轮节点，都配置有相应的关键词规则和文本相似度规则，这些节点的关键词规则中除了用来定位场景的主关键词，还有大量额外配置的辅助关键词，形如以下表2所示：

表2

场景	关键词(包括主关键词和辅助关键词)
		贷款	贷款、房贷、车贷、办理
存款	存款、存钱、怎么、办理······
		······	······

通过表2可以看出，同样的词，如“办理”或者“如何”等等会出现在多个场景中，先定位到具体场景后，再去匹配具体的节点关键词或者关键词组合，形如以下表3所示：

表3

本发明采用多轮问答树的机制，通过主关键词定位场景再由辅助关键词协助定位场景中的节点，这样一来使得问答机器人更加思路清晰、易于配置，而且极大程度上规避了规则冲突的情况，降低了配置规则的难度；

其次，对于场景中节点的是否问题，将通过是否问题情感分析机制进行分类，其规则形如以下表4所示：

表4

具体的，配置有关键词规则的节点同步配置有文本相似度规则，文本相似度规则的优先度低于关键词规则，即当关键词规则未命中任何节点的情况下，通过文本相似度规则命中对应的节点，并反向定位多轮问答树；

在每个场景的节点中，除了那些是是否问题的节点，其他配置有关键词规则的节点，都可以同步配置一些文本，通过文本相似度帮助定位节点，改善关键词规则较为死板的缺点，其规则形如以下表5所示：

表5

文本相似度规则只需要考虑节点而不需要考虑任何场景，通过命中节点以后再去定位场景，这一点与关键词规则相反。

具体的，在通过文本相似度规则定位节点和多轮问答树的过程中，先通过bert模型将问句进行向量化，再使用余弦相似度模型进行相似度计算排序，将相似度最高且高于相似度阈值的节点作为命中的节点；

余弦相似度模型的公式表述如下：

其中，A和B为计算相似度的两个n维向量；

要判断两个文本是否匹配，其实就是计算表达这两个文本语义的词向量的相似度是否接近。

在该场景下，余弦相似度模型是最合适也最泛用的一个方法，他的原理是以向量空间中两个向量夹角的余弦值作为衡量两个向量个体差异大小的度量，通过该模型，我们可以得到两个向量在维度方向上的相似性，普遍可以得到较好的应用。

具体的，gbdt分类器通过多轮迭代，每轮迭代产生一个弱分类器，每个分类器在上一轮分类器的残差基础之上进行训练，最终得到的gbdt分类器是将每轮训练得到的弱分类器加权求和得到的，对弱分类器的要求一般是足够简单，并且是低方差和高偏差的，因为训练的过程是通过降低偏差来不断提高最终分类器的精度，弱分类器选择分类回归树，由于上述低方差和高偏差的要求，每个分类回归树的深度不会很深；

残差的公式表述如下：

gbdt分类器的公式表述如下：

其中，f₀(x)为初始弱分类器，γ_jm为对叶子区域计算的最佳拟合值，R_jm为叶子节点的区域，m表示迭代次数、即生成的弱学习器个数，L是损失函数，c是初始随机给定的常数，I(x∈R_jm)表示判断x是否属于叶子，属于返回1，不属于返回0。

利用残差公式对每个样本计算负梯度，即残差，将上一轮得到的残差作为样本信的真实值，再对新的分类回归树的叶子区域计算最佳拟合值，最后，利用强分类器更新公式：f_m(x)＝f_m-1(x)+∑γ_jmI(x∈R_jm)，进一步更新回归分类树，并最终得到gbdt分类器。

本发明在关键词规则以外，加入了文本相似度规则和是否问题情感机制，帮助进行文本向量化、情感倾向性分析以及文本相似度计算，使得本问答机器人不像单纯的规则机器人那么死板，可以更准确地命中到节点。

具体的，节点均设有槽位配置机制，即每个节点的问题回复中设置有动态配置的替代符，根据不同的多轮问答树匹配具体内容，无论以何种方式，在匹配节点后，每个节点都配置有动态的槽位，针对不同的使用环境，可以由配置者去配置不同的内容，比如回答里涉及到某地点的地址，相关人员的姓名信息等，可以根据不同的环境场景去灵活回复；

例如，如果客户在2个不同的网点都定位到了“寻找客户经理”这类节点，这个节点的配置可以是“可以到大堂寻找xx经理进一步咨询”，这里“xx”这个槽位在网点A可能是“张三”，在网点B可能就是“李四”，使得问答机器人可以灵活运用于各个不同环境。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.基于场景和关键词规则的任务型问答机器人，其特征在于，包括多轮问答树、关键词规则、文本相似度规则、是否问题情感分析机制和槽位配置机制，所述文本相似度规则包括bert模型和余弦相似度模型，所述是否问题情感分析机制包括gbdt分类器，所述bert模型经过多个场景文本数据进行微调，以适配于余弦相似度模型和gbdt分类器；

所述节点还包括上一轮节点是是否问题的节点，该节点未配置关键词规则、情感分析机制和文本相似度规则，在下一轮节点中，将本轮的问句通过是否问题情感分析机制将问句区分为是、否和没有正面回答问题三类，对于明确的是、否类别，进行相应的回复匹配，对于没有正面回答问题类别，重新进行多轮问答树和节点定位；

配置有所述关键词规则的节点同步配置有文本相似度规则，所述文本相似度规则的优先度低于关键词规则，即当关键词规则未命中任何节点的情况下，通过文本相似度规则命中对应的节点，并反向定位多轮问答树；

2.根据权利要求1所述的基于场景和关键词规则的任务型问答机器人，其特征在于，在通过文本相似度规则定位节点和多轮问答树的过程中，先通过bert模型将问句进行向量化，再使用余弦相似度模型进行相似度计算排序，将相似度最高且高于相似度阈值的节点作为命中的节点；

所述余弦相似度模型的公式表述如下：

；

其中，A和B为计算相似度的两个n维向量。

3.根据权利要求1所述的基于场景和关键词规则的任务型问答机器人，其特征在于，所述gbdt分类器通过多轮迭代，每轮迭代产生一个弱分类器，每个分类器在上一轮分类器的残差基础之上进行训练，最终得到的gbdt分类器是将每轮训练得到的弱分类器加权求和得到的；

所述弱分类器选择分类回归树，所述残差的公式表述如下：

；

其中，将数据作为下一轮分类回归树的训练数据，得到新的分类回归树，其对应的叶子节点区域为/>，/>为叶子节点个数；

所述gbdt分类器的公式表述如下：

；

其中，为初始弱分类器，/>为对叶子区域计算的最佳拟合值，/>为叶子节点的区域，m表示迭代次数、即生成的弱分类器个数，/>是损失函数，c是初始随机给定的常数，表示判断x是否属于叶子，属于返回1，不属于返回0。

4.根据权利要求1所述的基于场景和关键词规则的任务型问答机器人，其特征在于，所述bert模型从文本数据中提取特征，即单词和句子的嵌入向量，这些向量被用作余弦相似度模型或者gbdt分类器的输入特征。

5.根据权利要求1所述的基于场景和关键词规则的任务型问答机器人，其特征在于，所述节点均设有槽位配置机制，即每个节点的问题回复中设置有动态配置的替代符，根据不同的多轮问答树匹配具体内容。