CN113377943B

CN113377943B - 多轮智能问答数据处理***

Info

Publication number: CN113377943B
Application number: CN202110934399.0A
Authority: CN
Inventors: 籍焱; 薄满辉; 唐红武; 王殿胜; 张丽颖; 谭智隆; 刘春磊; 张晓明
Original assignee: China Travelsky Mobile Technology Co Ltd
Current assignee: China Travelsky Mobile Technology Co Ltd
Priority date: 2021-08-16
Filing date: 2021-08-16
Publication date: 2022-03-25
Anticipated expiration: 2041-08-16
Also published as: CN113377943A

Abstract

本发明涉及一种多轮智能问答数据处理***，包括基于预设的垂直领域信息构建的知识图谱、意图分类模型，存储有计算机程序的存储器和处理器，当所述处理器在执行所述计算机程序时，基于知识图谱、意图分类模型识别用户意图，基于步骤S1‑步骤S7的多轮智能问答机制实现多轮智能问答。本发明提高了多轮智能问答的准确度。

Description

多轮智能问答数据处理***

技术领域

本发明涉及计算机技术领域，尤其涉及一种多轮智能问答数据处理***。

背景技术

智能问答是当前人工智能领域的热门研究方向，通常以一问一答的形式，向用户提供个性化的信息服务。现有的智能问答主要基于闲聊型等场景，但对于垂直领域的多是基于问答型和任务型会话场景，以民航领域为例，问答型可以涉及民航百科，任务型可以涉及订票、退改签等流程。在智能问答技术中，如何准确理解用户每一输入的意图最为关键，多轮智能问答***中更是需要结合上下文理解用户每一输入的意图。

以民航领域为例，现有的机场、航空公司智能问答***的意图识别主要从客服沿用的知识库抽象而来，语料有限，且意图之间重叠、混淆的情况时有发生，无法实现意图界限分明、场景覆盖全面。部分现有技术的意图识别主要基于规则，缺乏灵活性，仅当用户输入的问题能够命中关键规则的时候，***才能给到用户准确的意图识别结果，而用户的问题存在多样性、表述不规范及存在错别字等特点。此时，基于规则的方法则也很难准确识别用户意图。此外，现有智能问答***的意图识别技术还缺乏对垂直领域基础知识的融合，以民航领域为例，民航业有很多专业性的词汇，包括航司名称、机场名称及简称、别名；也包括很多时效性强的问题，如疫情防控政策等；甚至包括对于航班动态的掌握，目前的意图识别***对于这些背景信息及民航知识图谱信息的融入很少，因此意图识别准确度低。现有的垂直领域的智能问答***主要还是基于单轮问题进行意图识别，缺乏对上下文的理解和意图识别能力，从而缺乏对多轮智能问答的理解能力，多轮问答准确度低。由此可知，如何提高多轮智能问答的准确度成为亟待解决的技术问题。

发明内容

本发明目的在于，提供一种意图识别数据处理***，提高了多轮智能问答的准确度。

根据本发明一方面，一种多轮智能问答数据处理***，包括基于预设的垂直领域信息构建的知识图谱、意图分类模型，存储有计算机程序的存储器和处理器，当所述处理器在执行所述计算机程序时，实现以下步骤：

步骤S1、获取客户端发送的第一用户query，基于知识图谱和意图分类模型识别第一意图；

步骤S2、根据所述第一用户query判断是否存在所述第一意图对应的第一槽值，若存在，则基于所述第一意图和第一槽值生成第一回答信息发送至所述客户端，返回执行步骤S1，若不存在，则基于所述第一槽值生成第一回答信息发送至所述客户端，初始化j=2,执行步骤S3；

步骤S3、接收客户端基于第j-1回答信息发送的第j用户query，判断所述第j用户query是否存在第j-1槽值，若存在，执行步骤S4，否则，执行步骤S6；

步骤S4、判断所述第j-1槽值在所述第j用户query中的占比是否超过预设的占比阈值，若超过，则基于第j-1槽值和第j-1意图生成第j回答信息发送至所述客户端，设置j=j+1,返回执行步骤S3，否则，执行步骤S5；

步骤S5、基于知识图谱和意图分类模型识别第j用户query对应的第j意图，判断第j意图与第j-1意图是否匹配，若匹配，则基于第j-1槽值和第j-1意图生成第j回答信息发送至所述客户端，设置j=j+1,返回执行步骤S3，否则，则执行步骤S7；

步骤S6、基于知识图谱和意图分类模型识别第j用户query，若能够识别出对应的第j意图，则执行步骤S7，否则，将所述第j-1回答信息作为第j回答信息发送至所述客户端，设置j=j+1,返回执行步骤S3；

步骤S7、将第j用户query设置为第一用户query，第j意图设置为第一意图，返回执行步骤S2。

本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案，本发明提供的一种多轮智能问答数据处理***可达到相当的技术进步性及实用性，并具有产业上的广泛利用价值，其至少具有下列优点：

本发明基于设置的多轮会话机制，结合预设的垂直领域信息构建知识图谱和意图分类模型对用户意图准确识别，提高了多轮智能问答的准确性。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂，以下特举较佳实施例，并配合附图,详细说明如下。

附图说明

图1为本发明实施例提供的多轮智能问答数据处理***示意图。

具体实施方式

为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例，对依据本发明提出的一种多轮智能问答数据处理***的具体实施方式及其功效，详细说明如后。

本发明里提供了一种多轮智能问答数据处理***，如图1所示，包括基于预设的垂直领域信息构建的知识图谱、意图分类模型，存储有计算机程序的存储器和处理器，其中，垂直领域是只做细分产业，是纵向分布的，垂直领域的意图识别具有自己领域的特殊性，例如民航领域、铁路运输领域等等。垂直领域的语料相较于传统领域的语料数量少很多，因此基于垂直领域信息构建的知识图谱近似于星型拓扑结构，而非网状结构，其能够涵盖该垂直领域的所有信息，使得知识图谱具有该垂直领域的普适性和侧重性，且能起到很好的语义消歧作用，从而提高对用户意图的识别能力。仍以民航领域为例，基于民航领域信息构建的知识图谱包括涉及购票、安检及托运流程、乘机服务、出入境规定等多方面信息。民航领域信息可以通过不同的数据源来获取，例如航旅APP服务器、机场问答知识库、航空公司官网数据库信息、民航局刊发的航空旅行指南信息等等，本发明实施例对此不做限定。当所述处理器在执行所述计算机程序时，实现以下步骤：

其中，query即的查询信息，具体可以为问句、陈述句或者词语等信息。

其中，槽值指的是目标关键词。回答信息可以为问句、陈述句或者词语等信息，当第一用户query存在所述第一意图对应的第一槽值时，第一回答信息为陈述句或者词语等答案信息。当第一用户query不存在所述第一意图对应的第一槽值时，第一回答信息为问句答案信息，进一步向用户询问第一槽值对应的信息。

步骤S3、接收客户端基于第j-1回答信息发送的第j用户query，判断所述第j用户query是否存在第j-1槽值，若存在，执行步骤S4，否则，执行步骤S6，其中，j的取值范围是2到无穷大；

需要说明的是，当第j-1槽值在所述第j用户query中的占比超过预设的占比阈值时，说明是精准填槽，即用户正面回答了问题。

本发明实施例基于步骤S1-步骤S7的多轮智能问答机制，结合预设的垂直领域信息构建知识图谱和意图分类模型对用户意图准确识别，并结合上下文意图执行多轮回话机制，提高了多轮智能问答的准确性。

作为一种实施例，步骤S2中根据所述第一用户query判断是否存在所述第一意图对应的第一槽值，包括：

步骤S21、基于第一意图检索所述知识图谱，获取第一意图对应的第一槽值列表；

步骤S22、判断所述第一用户query中是否包括第一槽值列表中的第一槽值信息，若包括，则确定所述第一用户query存在所述第一意图对应的第一槽值。

可以理解的是，所述步骤S3中，判断所述第j用户query是否存在第j-1槽值，采用与步骤S21相同的方式获取，具体包括：

步骤S23、基于第j-1意图检索所述知识图谱，获取第一意图对应的第j-1槽值列表；

步骤S24、判断所述第j用户query中是否包括第j-1槽值列表中的第j-1槽值信息，若包括，则确定所述第j用户query判断存在所述第j-1意图对应的第j-1槽值。

需要说明的是，基于知识图谱能够准确快速获取到意图对应的槽值列表，具体可通过训练槽值抽取模型，将用户query输入槽值抽取模型，根据输出来判断用户query中是否存在对应的目标槽值。也可以将用户query进行分词处理，并将分词结果与槽值列表比对，判断用户query中是否存在对应的目标槽值。

本发明实施例所述的多轮智能问答***中，如何实现意图准确识别尤为关键，作为一种实施例，所述步骤S1-步骤S7中，基于知识图谱和意图分类模型识别用户query对应的意图，包括：

步骤C1、对所述用户query进行预处理，得到用户query的第一分词列表{Q₁，Q₂，…Q_M},M为用户query分词数量，Q_i为第i个第一分词，i的取值为1到M,初始化i=1,执行步骤C2；

步骤C2、基于Q_i检索所述知识图谱，判断是否存在对应标签信息，若存在，则设置Q_i’=Q_i+预设分隔符+T_i+预设分隔符,其中，T_i为Q_i对应的标签信息，否则，设置Q_i’=Q_i；

其中，通过添加分词在知识图谱上对应的标签信息可以起到语义消歧以及引入关键词信息等作用，以民航领域为例，标签信息具体可包括机场、航空公司、国内城市、机场大巴途径地点等等，本发明对具体的垂直领域以及具体标签信息不作限定。例如，地点信息，具体应该划归到酒店、机场大巴或是机场内服务设施导航往往存在歧义，知识图谱的引入可以起到消歧的作用。再如，T1、T2（航站楼），v1、v2（贵宾厅），民航领域内的很多简写，但专有名词有其特殊含义，是通用场景中无法习得的，通过知识图谱引入，可以引入其他关键信息，引导意图识别模型作出正确的意图判断。

步骤C3、判断i是否小于M，若是，则设置i=i+1,返回执行步骤C2，否则，基于所有Q_i’生成第二分词列表{ Q₁’，Q₂’，…Q_M’}；

步骤C4、将{ Q₁’，Q₂’，…Q_M’}转换为输入向量，将所述输入向量输入所述意图分类模型中，生成意图识别结果。

需要说明的是，输入向量的具体形式可根据模型框架具体确定，例如可以直接基于{ Q₁’，Q₂’，…Q_M’}中的每个分词分别转换为预设的字符构建输入向量，也可以是将{Q₁’，Q₂’，…Q_M’}中的每个字分别转换为对应的字符构建所述输入向量，其中所转换的字符具体可以为数字字符等。

作为一种实施例，所述***还包括基于预设的垂直领域信息构建的第一语料库和意图类型信息，所述第一语料库中存储有预先标注意图类型的样本用户query，所述意图类型信息包括N个意图类型，当所述处理器在执行所述计算机程序时，还实现以下步骤：

步骤C10、基于所述知识图谱、第一语料库、意图分类信息训练得到所述意图分类模型，具体可包括：

步骤C101、构建意图分类模型框架，所述意图分类模型框架的输入为输入向量信息，输出为N维向量{P₁，P₂,…P_N},其中，P_n为输入向量信息属于第n意图类型的概率值，n的取值为1到 N ,P₁+P₂+…+P_N=1;

步骤C102、基于所述第一语料库构建样本用户query集合，基于每一样本用户query执行步骤C1至步骤C3，生成样本用户query对应的第二分词列表，并转换为样本输入向量，基于训练样本实际所属意图类型构建样本输出真实值；

步骤C103、将所述样本输入向量输入所述意图分类模型框架得到样本输出预测值，基于所述样本输出真实值和所述样本输出预测值判断当前模型是否收敛，若收敛，则生成所述意图分类模型，否则，更新所述第一语料库，返回执行步骤C102。

需要说明的是，基于知识图谱生成意图分类模型的输入向量涉及异质信息融合，由于知识图谱和意图分类模型的输入是两个独立的向量空间，因此无法直接融合，本发明实施例基于知识图谱来确定标签信息，然后再添加到对应的分词上，可以理解的是，Q_i+预设分隔符+T_i+预设分隔符，包括将预设分隔符+T_i+预设分隔符添加到Q_i之前，或者将预设分隔符+T_i+预设分隔符添加到Q_i之后，但所有Q_i添加的前后位置是一致的。需要说明的是，由于本发明实施例所述的应用场景中，第一语料库中的语料数量有限，且垂直领域的语料具有侧重性，因此大多模型框架采用有监督训练的模式很难使模型收敛。作为一种优选实施例，意图分类模型框架为基于Bert调整得到的多分类模型框架，对应地，需要将{ Q₁’，Q₂’，…Q_M’}中的每个字分别转换为对应的字符构建所述输入向量，且本发明通过在原文本添加标签信息，通过无监督的方式引入知识图谱标签信息，无需进行进一步的预训练过程，直接增加知识图谱标签信息对一整句话的影响相对平缓，且能强调重点分词，对模型稍加训练即可达到收敛效果，提高了模型训练的效率，且能提升模型的鲁棒性。

由于第一语料库中样本数量有限，因此可在模型训练过程中，扩充第一语料库，提高模型训练效率，作为一种实施例，所述***还包括基于预设的垂直领域信息构建的第二语料库，所述第二语料库中存储有未标注意图类型的用户query；

所述步骤C103中，更新所述第一语料库，包括：

步骤C113、从所述第二语料库中获取第一候选用户query集合，基于每一候选用户query执行步骤C1至步骤C3，生成候选用户query对应的第二分词列表，并转换为候选输入向量；

步骤C114、将所述候选输入向量输入当前意图分类模型框架中得到候选输出预测值，将所述候选输出预测值输出至预设显示装置进行验证；

其中，具体可直接通过人工验证。

步骤C115、基于验证结果获取第一候选用户query集合得到的每一意图类型的准确率，将准确率低于预设的准确率阈值的候选用户query标注意图类型，添加到所述第一语料库中。

需要说明的是，通过步骤C115可以确定当前哪一类型的意图对应的样本用户query准确度低，并对应补充，均衡样本，提高样本精确度，进而提高意图识别模型的收敛速度。

作为一种实施例，所述步骤C103还包括：

步骤C116、获取max(P_n)小于预设的概率阈值的候选用户query构建第二候选用户query集合；

步骤C117、将所述第二候选用户query集合中的候选用户query逐一输出至预设显示装置，若接收到用户输入的意图类型标注信息，则为接收到用户query标注信息的候选用户query标注对应的意图类型标注信息，并将标注对应的意图类型标注信息后的候选用户query添加到所述第一语料库中。

需要说明的是，第二候选用户query集合中存储的是无法通过当前意图识别模型识别的候选用户query，可能是当前模型精确度不够、也可能是模型对该候选用户query对应的意图类型不敏感，因此，从第二候选用户query集合中标注意图类型，能够提高样本精确度，使得模型也能尽快学习到敏感性低的样本类型，进而提高意图识别模型的收敛速度。

作为一种实施例，所述***还包括基于预设的垂直领域信息构建的特征词映射表和分词词库，所述步骤C1中，对所述用户query进行预处理，得到用户query的第一分词列表{Q₁，Q₂，…Q_M}，包括：

步骤C11、基于预设的特征词格式对用户query进行格式转换；

其中，格式转换具体可包括字母大小写转换、全角半角转换等。

步骤C12、基于所述分词词库将格式转换后的用户query进行分词，得到待处理分词列表；

步骤C13、根据所述特征词映射表对所述待处理分词列表中的分词进行改写和/或纠错处理，生成{Q₁，Q₂，…Q_M}。

其中，分词改写处理具体包括简称改全称，别名改标准行程，也包括基于用户信息增加的默认信息等等，所述默认信息可包括用户的位置信息。分词改写还可包括对省略语句扩充等等。

分词纠错处理具体可包括基于预设的错别字词典纠错、基于编辑距离的纠错及基于模型的纠错。基于预设的错别字词典纠错通过分析历史用户问题日志里的常见错误，总结出用户易错问题，并进行纠正；编辑距离指的是在两个单词<w₁，w₂>之间，由其中一个单词w₁,转换为另一个单词w₂所需要的最少单字符编辑操作次数。

与一般场景的纠错不同，本发明实施例的分词纠错处理更关注预设的垂直领域内问题。为此，通过分析智能客服问答日志，对常见问题进行整理和总结，构建了对应垂直领域的纠错词典，实现垂直领域问题的理解和纠错，提高了用户query预处理的准确性。此外，在语音转文字的纠错中，采用拼音编辑距离对文本进行纠错，编辑距离较小的正确结果对文本进行纠错和替换；基于模型的纠错具体可引入的seq2seq模型，通过标注整理易错问题数据，训练纠错模型并完成纠错任务。

作为一种实施例，所述知识图谱包括特征词与标签信息的映射关系，所述标签信息包括共有标签信息和独有标签信息，所述独有标签信息中包括参考信息和独有标签，所述步骤C2包括：

步骤C21、基于Q_i检索所述知识图谱，若存在Q_i对应的单个标签信息，则将该标签信息确定为待处理标签信息，执行步骤C23，若存在多个标签信息，则执行步骤C22；

步骤C22、将多个标签信息呈现在预设显示装置上，若在预设时间内接收到选择信息，则将选择的标签信息确定为待处理标签信息，若超过预设时间未接收到选择信息，则将预设的默认标签信息确定为待处理标签信息，执行步骤C23；

步骤C23、若所述待处理标签信息为共有标签信息，则将所述待处理标签信息确定为Q_i的标签信息，若所述待处理标签信息为独有标签信息，则执行步骤C24；

步骤C24、提取用户query对应的参考信息，若所述query对应的参考信息与独有标签信息对应的参考信息相同，则将对应的独有标签确定为Q_i的标签信息，否则，Q_i进行分词，将每一分词作为Q_i，返回执行步骤C21。

通过步骤C21-步骤C24能够基于知识图谱快速地为每一分词确认对应的标签信息，且通过划分共有标签信息和独有标签信息进行判断，提高了标签信息的针对性，能够使得获取到的标签信息更加准确。

作为一种实施例，所述步骤C4包括：

步骤C41、将所述输入向量输入所述意图分类模型中，输出{P_i1，P_i2,…P_iN}，P_in为Q_i属于第n意图类型的概率；

步骤C42、判断max（P_in）是否小于预设的概率阈值，若大于等于，则将第X类型确定为所述意图识别结果，X=argmax（P_in），否则，将所述意图识别结果确定为除所述N个意图类型之外的其他意图类型。

通过意图分类模型能够快速获取用户query对应的意图，但部分意图类型在下基于意图分类模型的结果还无法准确获取到用户真正的意图，因此可对意图识别结果进行进一步修正，作为一种实施例，所述***还包括预设意图类型列表，所述预设意图类型列表中存储的便是需要进一步判断的意图类型，具体所述预设意图类型列表包括预设意图类型以及对应的至少一个参考信息和子意图，参考信息具体可包括位置信息、行程信息等等。所述步骤C4之后还包括：

步骤C5、判断所述意图识别结果是否属于所述预设意图类型列表，若是，则提取用户query对应的参考信息；

其中，参考信息具体可以直接基于用户query提取，若无法直接提取到，则可结合对应的背景信息进行提取，具体可以设置其他数据库，例如用户行程信息数据库等，基于其他数据库的对应信息来确定用户query对应的参考信息。

步骤C6、将所述用户query对应的参考信息与所述预设意图类型列表进行匹配，确定对应的子意图。

本发明一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，部分步骤的顺序可以被重新安排。当其操作完成时处理可以被终止，但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明,任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种多轮智能问答数据处理***，其特征在于，

包括基于预设的垂直领域信息构建的知识图谱、意图分类模型，存储有计算机程序的存储器和处理器，当所述处理器在执行所述计算机程序时，实现以下步骤：

步骤S2、根据所述第一用户query判断是否存在所述第一意图对应的第一槽值，若存在，则基于所述第一意图和第一槽值生成第一回答信息发送至所述客户端，返回执行步骤S1，若不存在，则基于所述第一槽值生成第一回答信息发送至所述客户端，j为多轮智能回答轮次标识，初始化j=2,执行步骤S3；

2.根据权利要求1所述的***，其特征在于，

步骤S2中根据所述第一用户query判断是否存在所述第一意图对应的第一槽值，包括：

3.根据权利要求1所述的***，其特征在于，

步骤S1-步骤S7中，基于知识图谱和意图分类模型识别用户query对应的意图，包括：

步骤C2、基于Q_i检索所述知识图谱，判断是否存在对应标签信息，若存在，则设置Q_i’=Q_i+预设分隔符+T_i+预设分隔符,其中，T_i为Q_i对应的标签信息，Q_i’为第i个第二分词，否则，设置Q_i’=Q_i；

4.根据权利要求3所述的***，其特征在于，

所述***还包括基于预设的垂直领域信息构建的第一语料库和意图类型信息，所述第一语料库中存储有预先标注意图类型的样本用户query，所述意图类型信息包括N个意图类型，当所述处理器在执行所述计算机程序时，还实现以下步骤：

步骤C10、基于所述知识图谱、第一语料库、意图分类信息训练得到所述意图分类模型，具体包括：

步骤C101、构建意图分类模型框架，所述意图分类模型框架的输入为向量信息，输出为N维向量{P₁，P₂,…P_N},其中，P_n为输入向量信息属于第n意图类型的概率值，n的取值为1到N ,P₁+P₂+…+P_N=1;

5.根据权利要求4所述的***，其特征在于，

所述***还包括基于预设的垂直领域信息构建的第二语料库，所述第二语料库中存储有未标注意图类型的用户query；

所述步骤C103中，更新所述第一语料库，包括：

6.根据权利要求4所述的***，其特征在于，

所述步骤C103还包括：

步骤C116、获取max(P_n)小于预设的概率阈值的候选用户query构建第二候选用户query集合，max(P_n)为P_n中的最大值；

7.根据权利要求3-6中任意一项所述的***，其特征在于，

所述***还包括基于预设的垂直领域信息构建的特征词映射表和分词词库，所述步骤C1中，对所述用户query进行预处理，得到用户query的第一分词列表{Q₁，Q₂，…Q_M}，包括：

步骤C11、基于预设的特征词格式对用户query进行格式转换；

8.根据权利要求3-6中任意一项所述的***，其特征在于，

所述知识图谱包括特征词与标签信息的映射关系，所述标签信息包括共有标签信息和独有标签信息，所述独有标签信息中包括参考信息和独有标签，所述步骤C2包括：

9.根据权利要求4所述的***，其特征在于，

所述步骤C4包括：

步骤C42、判断max（P_in）是否小于预设的概率阈值，若大于等于，则将第X类型确定为所述意图识别结果，X=argmax（P_in），否则，将所述意图识别结果确定为除所述N个意图类型之外的其他意图类型，其中，max（P_in）为P_in的最大值，X为N个意图类型中的一个意图类型号，argmax（P_in）表示使得P_in取最大值时的n的值，X=argmax（P_in）表示X等于使得P_in取最大值时的n的值。

10.根据权利要求3-6中任意一项所述的***，其特征在于，

所述***还包括预设意图类型列表，所述预设意图类型列表包括预设意图类型以及对应的至少一个参考信息和子意图，所述步骤C4之后还包括：