CN116541493A

CN116541493A - 基于意图识别的交互应答方法、装置、设备、存储介质

Info

Publication number: CN116541493A
Application number: CN202310379954.7A
Authority: CN
Inventors: 陈琦; 吴振宇; 王建明; 肖京
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2023-04-07
Filing date: 2023-04-07
Publication date: 2023-08-04

Abstract

本申请实施例提供了一种基于意图识别的交互应答方法、装置、设备、存储介质，属于人工智能技术领域。该方法包括：获取目标交互信息和历史交互信息；将目标交互信息输入意图识别模型，根据得到的目标意图分类结果确定目标数据库；根据目标交互信息从目标数据库获取参考语料信息；将历史交互信息、目标交互信息和参考语料信息输入至训练好的应答生成模型生成目标应答内容。根据本实施例的技术方案，通过引入历史交互信息扩充了模型训练的数据，确保意图识别模型具有足够的训练数据，同时根据目标交互信息的意图选取相应的目标数据库，得到更加符合用户意图的参考语料信息，使得生成的目标应答能容更加准确，提高聊天机器人获取回复内容的准确性。

Description

基于意图识别的交互应答方法、装置、设备、存储介质

技术领域

本申请涉及人工智能技术领域，尤其涉及一种基于意图识别的交互应答方法、装置、设备、存储介质。

背景技术

目前，聊天机器人成为了企业运营的重要工具，建立聊天机器人常用的方法是通过规则和深度学习两种方式。根据业务经验积累常见的问答对语料，再根据关键字或模糊搜索进行匹配，可以回答常见的相似问题。或是根据历史文本数据作为深度学习模型预训练的语料库，训练模型匹配到相似度高的问题并且将答案进行排序。准确理解用户的需求并提供相对应信息是聊天机器人首要解决的问题。但依照业务经验和历史数据的积累作为原始语料库的数据规模往往无法全面覆盖到实际业务场景中的需要，大量的长尾主题问题和行业舆论的动态变化。标注的数据量缺失和数量不够也会导致聊天机器人无法充分理解用户的问题，无法提供合适的答案和信息也会造成聊天机器人延迟回复等问题。

发明内容

本申请实施例的主要目的在于提出一种基于意图识别的交互应答方法、装置、设备、存储介质，旨在提高聊天机器人获取回复内容的准确性。

为实现上述目的，本申请实施例的第一方面提出了一种基于意图识别的交互应答方法，所述方法包括：

获取目标交互信息，从历史内容数据库中获取与所述目标交互信息相关联的历史交互信息；

将所述目标交互信息输入训练好的意图识别模型，得到目标意图分类结果；

根据所述目标意图分类结果从多个可选数据库中确定目标数据库，每个所述可选数据库所对应的意图分类结果互不相同；

根据目标交互信息从目标数据库获取参考语料信息；

将所述历史交互信息、所述目标交互信息和所述参考语料信息输入至训练好的应答生成模型生成目标应答内容。

在一些实施例，所述意图识别模型包括预训练模型，所述意图识别模型通过以下步骤训练得到：

获取语音样本，对所述语音样本进行语音识别得到文本样本；

获取多个语言样本，将每个所述语言样本翻译成目标语言，得到多个翻译样本，每个所述语言样本所对应的语言类别互不相同；

根据所述文本样本从所述历史内容数据库中获取历史样本，对所述历史样本添加与所述文本样本相关联的样本标签；

根据所述样本标签、所述历史样本、所述翻译样本和所述文本样本训练所述预训练模型。

在一些实施例，所述预训练模型还包括词嵌入模型，所述根据所述样本标签、所述历史样本、所述翻译样本和所述文本样本训练所述预训练模型，包括：

根据所述历史样本、所述翻译样本和所述文本样本构建多个词嵌入训练样本；

将每个所述词嵌入训练样本输入至所述词嵌入模型，根据每个所述词嵌入训练样本训练所述词嵌入模型至少两次，得到至少两个词嵌入数据；

根据至少两个所述词嵌入数据的平均值确定文本向量，并确定每个所述文本向量与所对应的所述样本标签之间的第一相似性；

根据全部的所述文本向量和所对应的所述第一相似性训练出文本转换矩阵。

在一些实施例，所述意图识别模型还包括微调模型，在所述根据全部的所述文本向量和所对应的所述第一相似性训练出文本转换矩阵之后，所述方法还包括：

获取测试样本，所述测试样本预先标注有测试标签；

将所述测试样本输入至所述文本转换矩阵，得到分类标签；

当所述测试标签与所述分类标签的第二相似性满足预设阈值，确定所述意图识别模型训练至收敛。

在一些实施例，所述将所述历史交互信息、所述目标交互信息和所述参考语料信息输入至训练好的应答生成模型生成目标应答内容，包括：

根据所述历史交互信息、所述目标交互信息和所述参考语料信息生成多个可选应答信息；

确定各个所述可选应答信息之间的第三相似性，根据所述第三相似性从高到低的顺序对多个所述可选应答信息进行排序；

将排好序的多个所述可选应答信息确定为所述目标应答内容。

在一些实施例，在所述将排好序的多个所述可选应答信息确定为所述目标应答内容之后，所述方法还包括：

获取应答选取信息，根据所述应答选取信息从所述可选应答信息中确定目标应答信息；

将所述目标应答信息确定为正样本，将未被选取为所述目标应答信息的所述可选应答信息确定为负样本，并将所述正样本和所述负样本保存至所述目标数据库。

在一些实施例，所述获取目标交互信息，包括：

获取查询交互信息；

当所述查询交互信息为文字信息，根据预设语法规则将所述查询交互信息调整为所述目标交互信息；

和/或当所述查询交互信息为语音信息，对所述查询交互信息进行语音识别，得到主题信息和关键词信息，并根据所述主题信息和所述关键词信息组合成所述目标交互信息。

为实现上述目的，本申请实施例的第二方面提出了一种基于意图识别的交互应答装置，所述装置包括：

信息获取模块，用于获取目标交互信息，从历史内容数据库中获取与所述目标交互信息相关联的历史交互信息；

意图识别模块，用于将所述目标交互信息输入训练好的意图识别模型，得到目标意图分类结果；

数据库选取模块，用于根据所述目标意图分类结果从多个可选数据库中确定目标数据库，每个所述可选数据库所对应的意图分类结果互不相同；

语料获取模块，用于根据目标交互信息从目标数据库获取参考语料信息；

应答生成模块，用于将所述历史交互信息、所述目标交互信息和所述参考语料信息输入至训练好的应答生成模型生成目标应答内容。

为实现上述目的，本申请实施例的第三方面提出了一种电子设备，所述电子设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述第一方面所述的方法。

为实现上述目的，本申请实施例的第四方面提出了一种存储介质，所述存储介质为计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面所述的方法。

本申请提出的基于意图识别的交互应答方法、装置、设备、存储介质,其通过获取目标交互信息，从历史内容数据库中获取与所述目标交互信息相关联的历史交互信息；将所述目标交互信息输入训练好的意图识别模型，得到目标意图分类结果；根据所述目标意图分类结果从多个可选数据库中确定目标数据库，每个所述可选数据库所对应的意图分类结果互不相同；根据目标交互信息从目标数据库获取参考语料信息；将所述历史交互信息、所述目标交互信息和所述参考语料信息输入至训练好的应答生成模型生成目标应答内容。根据本实施例的技术方案，通过引入历史交互信息扩充了模型训练的数据，确保意图识别模型具有足够的训练数据，同时根据目标交互信息的意图选取相应的目标数据库，得到更加符合用户意图的参考语料信息，从而使得生成的目标应答能容更加准确，提高聊天机器人获取回复内容的准确性。

附图说明

图1是本申请一个实施例提供的基于意图识别的交互应答方法的流程图；

图2是本申请另一个实施例中意图分类模型的训练流程图；

图3是图2中的步骤S204的流程图；

图4是图3中的步骤S304的流程图；

图5是图1中的步骤S105的流程图；

图6是图5中的步骤S503的流程图；

图7是图1中的步骤S105的流程图；

图8是本申请实施例提供的基于意图识别的交互应答装置的结构示意图；

图9是本申请实施例提供的电子设备的硬件结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

需要说明的是，虽然在装置示意图中进行了功能模块划分，在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于装置中的模块划分，或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

首先，对本申请中涉及的若干名词进行解析：

人工智能(artificial intelligence，AI)：是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学；人工智能是计算机科学的一个分支，人工智能企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家***等。人工智能可以对人的意识、思维的信息过程的模拟。人工智能还是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。

自然语言处理(natural language processing，NLP)：NLP用计算机来处理、理解以及运用人类语言(如目标语言、英文等)，NLP属于人工智能的一个分支，是计算机科学与语言学的交叉学科，又常被称为计算语言学。自然语言处理包括语法分析、语义分析、篇章理解等。自然语言处理常用于机器翻译、手写体和印刷体字符识别、语音识别及文语转换、信息意图识别、信息抽取与过滤、文本分类与聚类、舆情分析和观点挖掘等技术领域，它涉及与语言处理相关的数据挖掘、机器学习、知识获取、知识工程、人工智能研究和与语言计算相关的语言学研究等。

信息抽取(Information Extraction)：从自然语言文本中抽取指定类型的实体、关系、事件等事实信息，并形成结构化数据输出的文本处理技术。信息抽取是从文本数据中抽取特定信息的一种技术。文本数据是由一些具体的单位构成的，例如句子、段落、篇章，文本信息正是由一些小的具体的单位构成的，例如字、词、词组、句子、段落或是这些具体的单位的组合。抽取文本数据中的名词短语、人名、地名等都是文本信息抽取，当然，文本信息抽取技术所抽取的信息可以是各种类型的信息。

长短记忆神经网络(Long Short Term Memory，LSTM)：是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件，属于循环神经网络(Recurrent Neural Network，RNN)中的一种.LSTM神经网络具有“门”结构(包括输入门、遗忘门和输出门)，能够消除或者增加信息到细胞状态(Cell)的能力，使得LSTM神经网络能够记住长期的信息

BERT模型：由谷歌在2018年发布的一种语言模型，该模型通过联合所有层中的双向转换器来训练深度双向表示。BERT模型融合了众多自然语言处理模型的优点，在多项自然语言处理任务中均取得较优效果。相关技术中，BERT模型的模型输入向量为字向量(Token Embedding)、位置向量(Position Embedding)和句向量(Segment Embedding)的向量之和。其中，字向量为文字的向量化表示，位置向量用于表征字在文本中所处的位置，句向量用于表征句子在文本中的先后顺序

基于此，本申请实施例提供了一种基于意图识别的交互应答方法、装置、设备、存储介质，旨在提高聊天机器人获取回复内容的准确性。

本申请实施例提供的推荐方法和装置、电子设备及存储介质，具体通过如下实施例进行说明，首先描述本申请实施例中的基于意图识别的交互应答方法。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本申请实施例提供的基于意图识别的交互应答方法，涉及人工智能技术领域。本申请实施例提供的基于意图识别的交互应答方法可应用于终端中，也可应用于服务器端中，还可以是运行于终端或服务器端中的软件。在一些实施例中，终端可以是智能手机、平板电脑、笔记本电脑、台式计算机等；服务器端可以配置成独立的物理服务器，也可以配置成多个物理服务器构成的服务器集群或者分布式***，还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN以及大数据和人工智能平台等基础云计算服务的云服务器；软件可以是实现基于意图识别的交互应答方法的应用等，但并不局限于以上形式。

本申请可用于众多通用或专用的计算机***环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

图1是本申请实施例提供的基于意图识别的交互应答方法的一个可选的流程图，图1中的方法可以包括但不限于包括步骤S101至步骤S105。

步骤S101，获取目标交互信息，从历史内容数据库中获取与目标交互信息相关联的历史交互信息；

步骤S102，将目标交互信息输入训练好的意图识别模型，得到目标意图分类结果；

步骤S103，根据目标意图分类结果从多个可选数据库中确定目标数据库，每个可选数据库所对应的意图分类结果互不相同；

步骤S104，根据目标交互信息从目标数据库获取参考语料信息；

步骤S105，将历史交互信息、目标交互信息和参考语料信息输入至训练好的应答生成模型生成目标应答内容。

在一些实施例的步骤S101中，目标交互信息可以是语音信息也可以是文本信息，根据聊天机器人的具体类型调整即可，当目标交互信息是文本信息，可以直接应用为目标交互信息，或者通过简单的关键词提取得到目标交互信息；当目标交互信息是语音信息，可以通过简单的语音识别模型转换成文本信息，再参考上述处理方式即可。

需要说明的是，历史内容数据库可以保存有不同用户的历史聊天数据，当访问聊天机器人的用户为首次访问，为了丰富训练数据，可以根据用户信息选取可供参考的用户的历史聊天数据作为历史交互信息，可供参考的用户可以是年龄、性别等用户属性相似的用户，本实施例对此不多作限定，通过引入历史聊天数据作为历史交互信息，能够为用户的聊天习惯和用词习惯提供参考，在实时聊天数据较少的情况下实现答***生成。

在一些实施例的步骤S102中，意图识别模型的具体网络结构可以根据实际需求选取，例如为了提取信息可以设置RoBERTa模型、N-Gram模型等，为了进行分类，可以设置LSTM模型、BERT模型等，本实施例对意图识别模型的具体结构不作限定，能够在获取到目标交互信息后进行意图分类即可。

需要说明的是，意图分类结果可以根据聊天机器人的功能进行预先训练，例如对于保险行业的聊天机器人，意图分类可以包括保险类问题、金融类问题和其他问题，在获取到目标交互信息后，可以确定根据意图识别模型将确定具体的意图分类，从而得到目标意图分类结果，并且本实施例针对不同的意图分类设置有多个可选数据库，每个可选数据库存储有不同的语料信息，避免不同领域的相似词匹配出错误的语料，能够有效提高聊天机器人的准确性。

在一些实施例的步骤S103和步骤S104中，可选数据库中存储的语料信息可以通过维护人员周期性更新，以确保语料符合最新的聊天风格，避免用户使用潮流词汇时聊天机器人无法正确应答，提高聊天机器人的用户体验。

需要说明的是，在确定目标数据库之后，就可以根据目标交互信息从目标数据库中进行实体检索，从而得到参考语料信息。

在一些实施例的步骤S105中，应答生成模型可以是常见的应答生成器，例如以GPT-3模型和T5模型作为基础框架构建生成器，使其能够在输入历史交互信息、目标交互信息和参考语料信息后生成容易理解和阅读的应答内容即可。

值得注意的是，应答内容可以包括多条应答信息供客服人员选取，也可以根据一定的评分标准进行评分后，按照分数高低进行排序，本实施例对此不多作限定。

本申请实施例所示意的步骤S101至步骤S105，通过获取目标交互信息，从历史内容数据库中获取与目标交互信息相关联的历史交互信息；将目标交互信息输入训练好的意图识别模型，得到目标意图分类结果；根据目标意图分类结果从多个可选数据库中确定目标数据库，每个可选数据库所对应的意图分类结果互不相同；根据目标交互信息从目标数据库获取参考语料信息；将历史交互信息、目标交互信息和参考语料信息输入至训练好的应答生成模型生成目标应答内容。根据本实施例的技术方案，通过引入历史交互信息扩充了模型训练的数据，确保意图识别模型具有足够的训练数据，同时根据目标交互信息的意图选取相应的目标数据库，得到更加符合用户意图的参考语料信息，从而使得生成的目标应答能容更加准确，提高聊天机器人获取回复内容的准确性。

在一些实施例中，意图识别模型包括预训练模型，请参阅图2，意图识别模型的训练步骤可以包括但不限于包括步骤S201至步骤S204：

步骤S201，获取语音样本，对语音样本进行语音识别得到文本样本；

步骤S202，获取多个语言样本，将每个语言样本翻译成目标语言，得到多个翻译样本，每个语言样本所对应的语言类别互不相同；

步骤S203，根据文本样本从历史内容数据库中获取历史样本，对历史样本添加与文本样本相关联的样本标签；

步骤S204，根据样本标签、历史样本、翻译样本和文本样本训练预训练模型。

需要说明的是，为了丰富意图识别网络的可支持类型，可以同时采用语音样本和文本样本进行训练，在获取到语音样本后，通过常见的语音识别模块转换成文本样本，例如常见的HuBERT预训练模型等，再以文本样本为基础进行模型训练即可，语音识别模块为本领域技术人员熟知的技术，在此不多作限定。

需要说明的是，为了丰富训练数据，可以采用多个语言类型的语言样本，通过seq2seq和LSTM框架进行训练，从而实现机器翻译，将多个语言类型的语言样本翻译成目标语言，得到多个翻译样本，使得训练出来的意图识别网络能够支持更多的语言类型，提高聊天机器人的适用范围。

需要说明的是，历史样本可以是上述实施例中描述的历史聊天数据，通过引入历史聊天数据，能够有效增加训练样本的数量，提高意图识别网络训练的准确性。

需要说明的是，在获取到历史样本之后，可以根据back translation的方式进行聊天数据扩充，增加标签类数据，使得意图识别网络的训练能够具备标签依据，以便于后续进行相似性的计算。

在一些实施例中，预训练模型还包括词嵌入模型，请参阅图3，步骤S204可以包括但不限于包括步骤S301至步骤S304：

步骤S301，根据历史样本、翻译样本和文本样本构建多个词嵌入训练样本；

步骤S302，将每个词嵌入训练样本输入至词嵌入模型，根据每个词嵌入训练样本训练词嵌入模型至少两次，得到至少两个词嵌入数据；

步骤S303，根据至少两个词嵌入数据的平均值确定文本向量，并确定每个文本向量与所对应的样本标签之间的第一相似性；

步骤S304，根据全部的文本向量和所对应的第一相似性训练出文本转换矩阵。

需要说明的是，在得到历史样本、翻译样本和文本样本之后，可以根据每个样本构建成一个文本数据，再将文本数据进行词嵌入模型的训练，采用N-gram和RoBERTa的方式进行训练。为了增加数据的多样性，训练时将原始数据输入两次，得到两个词嵌入数据，最终结果取这两个词嵌入数据的平均。

需要说明的是，在训练过程中，由于历史样本预先扩展有样本标签，因此在计算出文本向量后，可以确定文本向量与样本标签在语义上的第一相似性，从而对训练结果进行验证，使得得到的词嵌入模型能够将文本转换成矩阵，从而在获取到目标交互信息后，通过文本转换矩阵确定与各个预设标签之间的相似性，从而根据相似性确定意图分类结果。

在一些实施例，意图识别模型还包括微调模型，请参阅图4，在执行完步骤S304之后，还可以包括但不限于包括步骤S401至步骤S403：

步骤S401，获取测试样本，测试样本预先标注有测试标签；

步骤S402，将测试样本输入至文本转换矩阵，得到分类标签；

步骤S403，当测试标签与分类标签的第二相似性满足预设阈值，确定意图识别模型训练至收敛。

需要说明的是，在完成对意图识别模型的训练之后，还需要对模型的准确性进行测试，基于此，可以获取测试样本，并且在测试样本中预先标注好测试标签，将测试样本通过文本转换矩阵输出分类标签后，通过与测试标签进行比对第二相似性，当第二相似性满足预设阈值，则可以确定意图识别模型的训练收敛，能够用于后续操作。

请参阅图5，在一些实施例中，步骤S105可以包括但不限于包括步骤S501至步骤S503：

步骤S501，根据历史交互信息、目标交互信息和参考语料信息生成多个可选应答信息；

步骤S502，确定各个可选应答信息之间的第三相似性，根据第三相似性从高到低的顺序对多个可选应答信息进行排序；

步骤S503，将排好序的多个可选应答信息确定为目标应答内容。

需要说明的是，应答生成模型可以采用GPT-3和T5作为基本框架进行初始化训练，训练的样本可以是上述实施例中获取的历史样本、翻译样本和文本样本，能够有效增加样本的数据量。

需要说明的是，在将训练样本输入至应答生成模型之后，通过应答生成模型生成的应答内容后，可以通过坐席人员手动选择是否使用应答内容，使用了记录作为正样本，未选择的作为负样本进行重复训练。在被选择使用的应答内容中，可以核对是否使用了排名第一的应答内容，若否，在下一轮排序时，可以重新根据用户的点击重新计算目标文本和生成问答对之间的相似性，这样同时保证了信息提供的准确性和生成的回复更加规范的话术风格。

需要说明的是，通过上述模型训练方式，应答生成模型在获取到历史交互信息、目标交互信息和参考语料信息之后，可以生成多个可选应答信息，为了便于用户选择，可以根据确定可选应答信息之间的第三相似性，将第三相似性最高的确定为排序第一，以此类推，使得目标应答内容的显示更加符合用户意图，提高用户体验。

请参阅图6，在一些实施例中，在执行完步骤S503之后，还可以包括但不限于包括步骤S601至步骤S602：

步骤S601，获取应答选取信息，根据应答选取信息从可选应答信息中确定目标应答信息；

步骤S602，将目标应答信息确定为正样本，将未被选取为目标应答信息的可选应答信息确定为负样本，并将正样本和负样本保存至目标数据库。

需要说明的是，根据上述实施例所述，被选取的可选应答信息可以确定是符合用户意图的，因此可以作为正样本进行后续训练，反之作为负样本，通过上述技术方案，能够在聊天机器人的使用过程中不断更新训练样本，并且训练样本能够更好地反映用户意图，在后续训练过程中能够进一步增加模型输出的准确性。

请参阅图7，在一些实施例中，步骤S105可以包括但不限于包括步骤S701至步骤S703：

步骤S701，获取查询交互信息；

步骤S702，当查询交互信息为文字信息，根据预设语法规则将查询交互信息调整为目标交互信息；

和/或步骤S703，当查询交互信息为语音信息，对查询交互信息进行语音识别，得到主题信息和关键词信息，并根据主题信息和关键词信息组合成目标交互信息。

需要说明的是，在获取到查询交互信息后，例如是用户输入至聊天机器人的一句语音或者一段文字，当交互查询信息为文字信息，可以直接作为目标交互信息进行后续识别，也可以对文字信息进行适当的预处理，对相关性较低的文字进行删除，或者根据预设的语法规则对文字信息进行重新排版，提高后匹配参考语料信息的准确性。当查询交互信息为语音信息，在进行语音识别之后，还可以对语音信息中的主题信息和关键词信息进行提取，以消除背景杂音的影响，从而组合出目标交互信息。

请参阅图8，本申请实施例还提供一种基于意图识别的交互应答装置，可以实现上述基于意图识别的交互应答方法，基于意图识别的交互应答装置800包括：

信息获取模块810，用于获取目标交互信息，从历史内容数据库中获取与所述目标交互信息相关联的历史交互信息；

意图识别模块820，用于将所述目标交互信息输入训练好的意图识别模型，得到目标意图分类结果；

数据库选取模块830，用于根据所述目标意图分类结果从多个可选数据库中确定目标数据库，每个所述可选数据库所对应的意图分类结果互不相同；

语料获取模块840，用于根据目标交互信息从目标数据库获取参考语料信息；

应答生成模块850，用于将所述历史交互信息、所述目标交互信息和所述参考语料信息输入至训练好的应答生成模型生成目标应答内容。

该基于意图识别的交互应答装置的具体实施方式与上述基于意图识别的交互应答方法的具体实施例基本相同，在此不再赘述。

本申请实施例还提供了一种电子设备，电子设备包括括存储器和处理器，存储器存储有计算机程序，处理器执行计算机程序时实现上述基于意图识别的交互应答方法。该电子设备可以为包括平板电脑、车载电脑等任意智能终端。

请参阅图9，图9示意了另一实施例的电子设备的硬件结构，电子设备包括：

处理器901，可以采用通用的中央处理器(Central Processing Unit，CPU)、微处理器、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本申请实施例所提供的技术方案；

存储器902，可以采用只读存储器(Read Only Memory，ROM)、静态存储设备、动态存储设备或者随机存取存储器(Random Access Memory，RAM)等形式实现。存储器902可以存储操作***和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器902中，并由处理器901来调用执行本申请实施例的基于意图识别的交互应答方法；

输入/输出接口903，用于实现信息输入及输出；

通信接口904，用于实现本设备与其他设备的通信交互，可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信；

总线905，在设备的各个组件(例如处理器901、存储器902、输入/输出接口903和通信接口904)之间传输信息；

其中处理器901、存储器902、输入/输出接口903和通信接口904通过总线905实现彼此之间在设备内部的通信连接。

本申请实施例还提供了一种存储介质，存储介质为计算机可读存储介质，该存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述基于意图识别的交互应答方法。

存储器作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外，存储器可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中，存储器可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

本申请实施例提供的基于意图识别的交互应答方法、装置、设备及存储介质，其通过获取目标交互信息，从历史内容数据库中获取与所述目标交互信息相关联的历史交互信息；将所述目标交互信息输入训练好的意图识别模型，得到目标意图分类结果；根据所述目标意图分类结果从多个可选数据库中确定目标数据库，每个所述可选数据库所对应的意图分类结果互不相同；根据目标交互信息从目标数据库获取参考语料信息；将所述历史交互信息、所述目标交互信息和所述参考语料信息输入至训练好的应答生成模型生成目标应答内容。根据本实施例的技术方案，通过引入历史交互信息扩充了模型训练的数据，确保意图识别模型具有足够的训练数据，同时根据目标交互信息的意图选取相应的目标数据库，得到更加符合用户意图的参考语料信息，从而使得生成的目标应答能容更加准确，提高聊天机器人获取回复内容的准确性。

本申请实施例描述的实施例是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域技术人员可知，随着技术的演变和新应用场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

本领域技术人员可以理解的是，图中示出的技术方案并不构成对本申请实施例的限定，可以包括比图示更多或更少的步骤，或者组合某些步骤，或者不同的步骤。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、***、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。

本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，上述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括多指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例的方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序的介质。

本实施例可用于众多通用或专用的计算机装置环境或配置中。例如：个人计算机、服务器计算机、手持电子设备或便携式电子设备、平板型电子设备、多处理器装置、基于微处理器的装置、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何装置或电子设备的分布式计算环境等等。本申请可以在由计算机执行的计算机程序的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理电子设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储电子设备在内的本地和远程计算机存储介质中。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

应当注意，尽管在上文详细描述中提及了用于动作执行的电子设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本申请的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本申请实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算电子设备(可以是个人计算机、服务器、触控终端、或者网络电子设备等)执行根据本申请实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的实施方式后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

以上是对本发明的较佳实施进行了具体说明，但本发明并不局限于上述实施方式，熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变形或替换，这些等同的变形或替换均包含在本发明权利要求所限定的范围内。

Claims

1.一种基于意图识别的交互应答方法，其特征在于，所述方法包括：

根据目标交互信息从目标数据库获取参考语料信息；

2.根据权利要求1所述的基于意图识别的交互应答方法，其特征在于，所述意图识别模型通过以下步骤训练得到：

3.根据权利要求2所述的基于意图识别的交互应答方法，其特征在于，所述预训练模型还包括词嵌入模型，所述根据所述样本标签、所述历史样本、所述翻译样本和所述文本样本训练所述预训练模型，包括：

4.根据权利要求3所述的基于意图识别的交互应答方法，其特征在于，所述意图识别模型还包括微调模型，在所述根据全部的所述文本向量和所对应的所述第一相似性训练出文本转换矩阵之后，所述方法还包括：

获取测试样本，所述测试样本预先标注有测试标签；

将所述测试样本输入至所述文本转换矩阵，得到分类标签；

5.根据权利要求1所述的基于意图识别的交互应答方法，其特征在于，所述将所述历史交互信息、所述目标交互信息和所述参考语料信息输入至训练好的应答生成模型生成目标应答内容，包括：

6.根据权利要求5所述的基于意图识别的交互应答方法，其特征在于，在所述将排好序的多个所述可选应答信息确定为所述目标应答内容之后，所述方法还包括：

7.根据权利要求1至6任意一项所述的基于意图识别的交互应答方法，其特征在于，所述获取目标交互信息，包括：

获取查询交互信息；

8.一种基于意图识别的交互应答装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，所述电子设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的基于意图识别的交互应答方法。

10.一种计算机可读存储介质，所述存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的基于意图识别的交互应答方法。