WO2022252636A1

WO2022252636A1 - 基于人工智能的回答生成方法、装置、设备及存储介质

Info

Publication number: WO2022252636A1
Application number: PCT/CN2022/072187
Authority: WO
Inventors: 舒畅; 万欣茹; 张梓键; 陈又新
Original assignee: 平安科技（深圳）有限公司
Priority date: 2021-06-01
Filing date: 2022-01-14
Publication date: 2022-12-08
Also published as: CN113239169B; CN113239169A

Abstract

本申请涉及人工智能领域，尤其涉及一种基于人工智能的回答生成方法、装置、设备及存储介质，实现了在用户的待回复语句信息有限的情况下，生成模型生成了更相关更准确的回答。其中基于人工智能的回答生成方法包括：接收待回复语句，将待回复语句输入检索模型；获取检索模型从预设的对话语料库中筛选出的与待回复语句匹配的相似语句，并获取相似语句在对话语料库中的回答语句。基于预设的语义对齐关键词提取模型，提取相似语句与待回复语句的差异关键词，得到差异关键词集；提取回答语句的相似关键词，得到相似关键词集。将差异关键词集和相似关键词集输入训练好的生成模型，输出回答。通过基于人工智能的自然语言处理，实现了在智能对话中，当用户问句信息有限的情况下，给出更相关更准确的回答。

Description

基于人工智能的回答生成方法、装置、设备及存储介质

本申请要求于2021年6月1日提交中国专利局、申请号为202110609412.5、发明名称为“基于人工智能的回答生成方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能领域，尤其涉及一种基于人工智能的回答生成方法、装置、设备及存储介质。

背景技术

随着社交媒体的不断发展和人工智能技术的不断进步，智能对话***在当前社会扮演了越来越重要的角色。以生成式方法为基础的问答***多以标准的问答对作为训练数据，使用自然语言处理中的生成式模型(通常是Encoder-Decoder框架)训练得到回答结果。基于生成式模型的方法能自动化生成同用户问题高度相关的回答，发明人意识到由于用户的问句所含信息有限，因此生成式模型的结果可能倾向于安全回答，如“好的”、“嗯”等，这对使用人机对话***的用户来说是没有意义且浪费时间的。

发明内容

本申请提供了一种基于人工智能的回答生成方法、装置、设备及存储介质，将，实现了在用户问句信息有限的情况下，给出更相关更准确的回答。

第一方面，本申请提供了一种基于人工智能的回答生成方法，所述回答生成方法包括：

接收待回复语句，将所述待回复语句输入检索模型；

获取所述检索模型从预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句，并获取所述相似语句在所述对话语料库中的回答语句；

基于预设的语义对齐关键词提取模型，提取所述相似语句与所述待回复语句的差异关键词，得到差异关键词集集；

提取所述回答语句的相似关键词，得到相似关键词集；

将所述差异关键词集和所述相似关键词集输入训练好的生成模型，输出回答。

第二方面，本申请还提供了一种基于人工智能的回答生成装置，所述回答生成装置包括：

语句接收模块，用于接收待回复语句，并将所述待回复语句输入检索式模型；

相似语句获取模块，用于获取所述检索式模型从预设的对话语料库中筛选出与待回复语句匹配的相似语句，并获取所述相似语句在所述对话语料库中的回答语句；

差异关键词提取模块，用于基于预设的语义对齐关键词提取模型，提取所述相似语句与待回复语句的差异关键词，得到差异关键词集；

相似关键词提取模块，用于提取所述回答语句的相似关键词，得到相似关键词集；

回答生成模块，用于将所述差异关键词集和所述相似关键词集输入训练好的生成式问答模型，输出回答。

第三方面，本申请还提供了一种计算机设备，所述计算机设备包括存储器和处理器；所述存储器用于存储计算机程序；所述处理器，用于执行所述计算机程序并在执行所述计算机程序时实现如上述的回答生成方法。

第四方面，本申请还提供了一种存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现如上述的回答生成方法。

本申请公开的回答生成方法、装置、计算机设备及存储介质，通过检索模型对用户的待回复语句检索相似语句，并获取相似语句的回答语句，进一步对相似语句提取差异关键词，对回答语句提取相似关键词，将差异关键词与相似关键词作为生成模型的输入，为生成模型增加了输入的信息。从而能够克服因用户的问句所含信息有限而导致的生成模型给出安全且没有意义的回答，实现了在用户问句信息有限的情况下，给出更相关更准确的回答。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请的实施例提供的回答生成方法的示意流程图；

图2是本申请的实施例提供的回答生成方法的网络示意图；

图3为本申请的实施例提供的回答生成装置的示意性框图；

图4为本申请的实施例涉及的一种计算机设备的结构示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

附图中所示的流程图仅是示例说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解、组合或部分合并，因此实际执行的顺序有可能根据实际情况改变。

应当理解，在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

随着社交媒体的不断发展和人工智能技术的不断进步，智能对话***在当前社会扮演了越来越重要的角色。如百度推出的小度人工智能助手、微软公司的对话***小冰都是着力于实现人机对话这一业务场景，前者使用检索式的方法来召回用户期望的回答，而后者是通过深度学习模型根据用户的问题实现自动化的回答生成。

以检索式方法为基础的问答***多应用于特定领域的智能问答***(如淘宝平台机器人客服)，此类方法通常预先维护一个可用于检索的对话语料数据库，将用户的输入问题作为问句，随后利用句子相似性计算找到与用户问句最相似的问句，随后将其对应的回答作为响应输出。数据库中的问答对通过了严格的筛选，因此返还给用户的回答是语言流畅、表达清晰。但是由于数据库规模以及语句相似性匹配方法的限制，最终的回答常常是主题无关、词不达意的。

以生成式方法为基础的问答***多以标准的问答对作为训练数据，使用自然语言处理中的生成式模型(通常是Encoder-Decoder框架)训练得到问答***，此方法能自动化生成同用户问题高度相关的回答，但是由于用户的问句所含信息有限，因此生成式问答模型的结果可能会倾向于安全回答，如“好的”、“嗯”等，这对使用人机对话***的消费者来说是没有意义且浪费时间的。

基于现有智能对话***存在的缺陷和不足，本申请提出了将检索式方法和生成式方法相结合的回答生成方法，通过检索式方法基于用户的语句增加生成式模型的输入信息，从而使生成式方法能够基于用户的语句生成更相关的回答。首先基于检索式方法对用户的语句进行检索，得到与用户的语句匹配的相似语句和相似语句所对应的答复。然后对所有相似语句和用户的语句提取差异关键词，对所有答复提取相似关键词，并将得到的差异关键词和相似关键词作为生成式方法的输入，由生成式模型输出最终的回答。从而实现在用户的语句所提供的信息有限的情况下，生成更准确更相关的回答。

本申请的实施例提供了一种基于人工智能的回答生成方法、装置、设备及存储介质。其中，该回答生成方法可以应用于服务器中，也可以应用于具体产品中的芯片，例如应用于人工智能设备中的芯片。利用检索模型基于待回复语句给生成模型增加输入的信息，实现了在用户给出的信息有限的情况下给出的回答更准确更相关。其中，该服务器可以为独立的服务器，也可以为服务器集群。

下面结合附图，对本申请的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

请参阅图1，图1是本申请的实施例提供的一种基于人工智能的回答生成方法示意流程图。该回答生成方法可应用于服务器中，以获得与用户的语句更相关更准确的回答。

如图1所示，该回答生成方法具体包括步骤S101至步骤S105。

S101、接收待回复语句，将所述待回复语句输入检索模型。

其中待回复语句包括问句或非问句；可以为语音形式或文本形式，当待回复语句为语音形式时，需先将其转换为文本形式，以输入检索模型。

S102、获取所述检索模型从预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句，并获取所述相似语句在所述对话语料库中的回答语句。

将所述待回复语句和所述预设的对话语料库中的语句输入至所述检索模型中，生成用于表征所述预设的对话语料库中的语句与待回复语句相似度的Jaccard相似系数；获取所述检索模型基于所述Jaccard相似系数从所述预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句；其中，所述相似语句与所述待回复语句的Jaccard相似系数大于第一预设阈值，且小于第二预设阈值。

在一些实施例中，将待回复语句和预设的对话预料库中的语句输入检索模型后，检索模型对预设的对话语料库中的语句和该待回复语句生成表征语句之间的文本相似度的Jaccard相似系数(Jaccard Similarity coefficient)，进而根据该Jaccard相似系数来判断语句是否为待回复语句的相似语句。语句之间的Jaccard相似系数值越高，代表语句之间具有更高的相似度，匹配度更高。检索模型将预设的对话语料库中与待回复语句的Jaccard相似系数值大于第一预设阈值，且小于第二预设阈值的语句筛选出来，并根据需求从这个筛选出来的结果中选取Jaccard相似系数值最高的预设数量个作为最终输出的相似语句，进而将这些相似语句在预设的对话预料库中对应的回答语句也获取出来，将检索模型输出的相似语句和对应的回答语句一一对应起来，组成相似问答对。

示例性的，检索模型将预设的对话语料库中与待回复语句Jaccard相似系数大于0.5小于0.9的语句筛选出来，并从中选择3个Jaccard相似系数最高的语句作为相似语句输出。

需要说明的是，第一预设阈值和第二预设阈值、以及预设数量可根据实际应用进行设置，本申请对此不做具体限定。

在另一些实施例中，检索模型还可以用于基于cosine相似度来评价语句之间的文本相似度，从而匹配出与待回复语句相似的相似语句。cosine相似度是通过计算两个语句向量之间的夹角，来评价两个语句向量的相似度。

需要说明的是，预设的对话语料库为预先维护的包含对话语句的数据库，既包括问答语句，也包括与问答语句相应的回答语句。该对话语料库可以根据应用场景的需求，可以为收录通用日常对话的对话语料，也可以为收录特定应用场景相关的对话语料。

S103、基于预设的语义对齐关键词提取模型，提取所述相似语句与所述待回复语句的差异关键词，得到差异关键词集。

本申请提出了语义对齐关键词提取模型(Semantic Alignment Keyword Extraction,SAKE)用于关键词的提取。该语义对齐关键词提取模型，基于利用跨越注意力(Cross-Attention)计算表征深层语义的注意力矩阵，并基于注意力矩阵来提取关键词。

具体的，将待回复语句转化为第一向量，将相似语句转化为第二向量，并根据第一向量和第二向量计算注意力矩阵；对注意力矩阵求极小值，得到相似语句与待回复语句的差异关键词；将差异关键词取并集，得到差异关键词集。

首先，需要将文本语句转化为向量形式，语句向量化的方法有很多种。

在一些实施例中，首先将文本语句进行one-hot编码，成为稀疏矩阵，然后通过随机初始化embedding层，通过线性变换将该稀疏矩阵变成密集矩阵，并且让相互独立的one-hot向量变成了考虑词与词之间的内在联系的关系向量。

在另一些实施例中，还可以基于神经网络语言模型(Nerual Network Language Model,NNLM)生成语句向量。

需要说明的是：所有相似语句均需向待回复语句对齐，因此将待回复语句转化为第一向量，其他相似语句转化为第二向量，依次计算每个相似语句与待回复语句之间的注意力矩阵。其中，注意力矩阵表示为：

其中，ν _A为所述待回复语句转化为第一向量，ν _B为所述相似语句转化为第二向量，d _k为归一化系数。

通过对注意力矩阵求极小值，可得到在待回复语句中存在但在相似语句中不存在的词，为两者之间的差异关键词。其中，所述差异关键词公式如下：

其中，i表示所在行，j表示所在列，L为预先确定的超参数，

表示求行和最小的L个行，对应提取出的差异关键词。

对所有相似语句与待回复语句的差异关键词取并集，即得到差异关键词集。

示例性的，例如，待回复语句为：葡萄酒和白酒哪个更好喝？假设通过检索模型得到的相似语句为：相似语句1：白酒是不是比葡萄酒好喝呢？相似语句2：有比白酒更好喝的酒吗？相似语句1与待回复语句的差异关键词为：“更”“和”“哪个”。相似语句2与待回复语句的差异关键词为：“葡萄酒”“和”，“哪个”。将差异关键词取并集，得到差异关键词集为：【“更”“和”“哪个”“葡萄酒”】。

S104、提取所述回答语句的相似关键词，得到相似关键词集。

具体的，将回答语句中的第一回答语句转化为第一回答向量，将回答语句中的其他回答语句转化为第二回答向量，并根据第一回答向量和第二回答向量计算注意力矩阵。其中，第一回答语句为与待回复语句匹配度最高的相似语句所对应的回答语句。

需要说明的是：将与待回复语句最匹配的相似语句对应的回答语句作为参照回答语句，其他回答语句均需向该参照回答语句对齐。因此将该参照回答语句转化为第一回答向量，将回答语句中的其他回答语句转化为第二回答向量，依次计算其他回答语句与该参照回答语句之间的注意力矩阵。对注意力矩阵求极大值，得到第一回答语句与回答语句中的其他回答语句的相似关键词。其中，所述相似关键词公式如下：

其中，所述相似关键词公式如下：

其中，i表示所在行，j表示所在列，L为预先确定的超参数，表示求行和最大的L个行，对应提取出的相似关键词。

将参照回答语句之外的所有其他回答语句和参照回答语句取相似关键词，并对所有相似关键词取并集，得到相似关键词集。

示例性的，例如，回答语句1为“我个人是不喜欢喝酒的”，回答语句2为“看个人品味，我更喜欢白酒”。回答语句2与回答语句1的相似关键词为：“个人”“喜欢”“酒”。因此相似关键词集为：【“个人”“喜欢”“酒”】。

本申请提出的基于语义对齐关键词提取模型，利用注意力矩阵进行规范化累加，实现了在关键词提取中考虑深层次的语义相关性和累积的语义特性，从而使提取的关键词更加准确。

S105、将所述差异关键词集和所述相似关键词集输入训练好的生成模型，输出回答。生成模型包括训练好的第一生成模型和训练好的第二生成模型。

具体的，将差异关键词集和相似关键词集输入训练好的第一生成模型，通过预测差异关键词集和相似关键词集中的词语在语句中的位置，输出有序的关键词序列；将有序的关键词序列输入训练好的第二生成模型，输出回答。

在本申请提供的实施例中，第一生成模型和第二生成模型都基于预训练语言模型BERT(Bidirectional Encoder Representation from Transformers)，但基于不同的模型参数及训练策略对两者进行训练。BERT模型不再采用传统的单向语言模型或者把两个单向语言模型进行浅层拼接的方法进行预训练，而是采用新的掩码语言模型(masked language model,MLM)生成深度的双向语言表征。BERT模型采用MLM对双向的Transformers进行预训练，以生成深层的双向语言表征。预训练后，只需要添加一个额外的输出层进行微调(fine-tune)，就可以在各种各样的下游任务中取得高水准的表现，而且不需要对BERT模型进行特定任务的结构修改。

在本申请提供的实施例中，第一生成模型的网络结构为：第一BERT模型后接第一全连接层和Softmax。第一生成模型的训练目标是基于给定的无序词集，输出预测的有序词集。具体的，将无序的关键词集输入第一BERT模型，通过transformer encoder输出词语的增强语义向量，在第一BERT模型后接第一全连接层和Softmax层，输出预测的有序的关键词集。需要说明的是，在第一生成模型的训练过程中，不对第一BERT模型的参数进行微调，而是通过调整第一全连接层的参数来得到训练好的第一生成模型。

在本申请提供的实施例中，第二生成模型的网络结构为：第二BERT模型后接第二全连接层和Softmax。第二生成模型的训练目标是基于有序的关键词集，输出预测的完整语句。第二生成模型基于上下文信息和语义的理解，在输出的语句中，可以通过预测得到关键词集中不包含的词语，也可以忽略一部分关键词集中包含的词语。需要说明的是，在第二生成模型的训练过程中，需对第二BERT模型的和第二全连接层的参数进行微调，来得到训练好的第二生成模型。

首先，将差异关键词集和相似关键词集取并集得到的无序的关键词集输入训练好的第一生成模型，生成有序的关键词集，这里的有序的关键词集相当于将离散的词语组合成了一个不完整的语句。其次，将该有序的关键词集输入训练好的第二生成模型，第二生成模型基于该有序的关键词集输出完整的语句。

通过两级生成模型输出预测的回答，其中第一生成模型预测位置信息得到有序的离散词集，第二阶段根据有序的离散词集预测最终生成的回答语句，使得生成的结果更加流畅。

本申请提供的回答生成方法，首先基于检索模型对用户的待回复语句检索相似语句，并获取相似语句的回答语句，进一步对相似语句提取差异关键词，对回答语句提取相似关键词，将差异关键词与相似关键词作为生成模型的输入，为生成模型增加了输入的信息。从而能够克服因用户的问句所含信息有限而导致的生成模型给出安全且没有意义的回答，实现了在用户问句信息有限的情况下，给出更相关更准确回答的结果。

请参阅图3，本申请的实施例提供一种回答生成装置的示意性框图，该回答生成装置可以配置于服务器。

如图3所示，该回答生成装置400包括：语句接收模块401、相似语句获取模块402、差异关键词提取模块403、相似关键词提取模块404、回答生成模块405。

语句接收模块401，用于接收待回复语句，将所述待回复语句输入检索模型；

相似语句获取模块402，用于获取所述检索模型从预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句，并获取所述相似语句在所述对话语料库中的回答语句。

差异关键词提取模块403，用于基于预设的语义对齐关键词提取模型，提取所述相似语句与所述待回复语句的差异关键词，得到差异关键词集。

相似关键词提取模块404，用于提取所述回答语句的相似关键词，得到相似关键词集。

回答生成模块405，用于将所述差异关键词集和所述相似关键词集输入训练好的生成模型，输出回答。

需要说明的是，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的装置和各模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

上述的装置可以实现为一种计算机程序的形式，该计算机程序可以在如图4所示的计算机设备上运行。

请参阅图4，图4是本申请的实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以是服务器。

参阅图4，该计算机设备包括通过***总线连接的处理器、存储器和网络接口，其中，存储器可以包括存储介质和内存储器。

存储介质可存储操作***和计算机程序。该计算机程序包括程序指令，该程序指令被执行时，可使得处理器执行任意一种回答生成方法。

处理器用于提供计算和控制能力，支撑整个计算机设备的运行。

内存储器为存储介质中的计算机程序的运行提供环境，该计算机程序被处理器执行时，可使得处理器执行任意一种回答生成方法。

该网络接口用于进行网络通信，如发送分配的任务等。本领域技术人员可以理解，图4 中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

应当理解的是，处理器可以是中央处理单元(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

其中，在一个实施例中，所述处理器用于运行存储在存储器中的计算机程序，以实现如下步骤：

接收待回复语句，将所述待回复语句输入检索模型；

基于预设的语义对齐关键词提取模型对所述相似语句与所述待回复语句提取差异关键词，得到差异关键词集；

对所述回答语句提取相似关键词，得到相似关键词集；

在一个实施例中，所述处理器在实现获取所述检索模型从预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句时，用于实现：

将所述待回复语句和所述预设的对话语料库中的语句输入至所述检索模型中，生成用于表征所述预设的对话语料库中的语句与待回复语句相似度的Jaccard相似系数；

获取所述检索模型基于所述Jaccard相似系数从所述预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句；其中，所述相似语句与所述待回复语句的Jaccard相似系数大于第一预设阈值，且小于第二预设阈值。

在一个实施例中，所述处理器在实现基于预设的语义对齐关键词提取模型，提取所述相似语句与所述待回复语句的差异关键词，得到差异关键词集时，用于实现：

将所述待回复语句转化为第一向量，将相似语句转化为第二向量，并根据所述第一向量和第二向量计算注意力矩阵；

对所述注意力矩阵求极小值，得到相似语句与待回复语句的差异关键词；

将所述差异关键词取并集，得到差异关键词集。

在一个实施例中，所述处理器在用于计算注意力矩阵时，用于实现：

其中，ν _A为所述待回复语句转化为第一向量，ν _B为所述相似语句转化为第二向量，d _k为归一化系数；

所述差异关键词公式如下：

其中，i表示所在行，j表示所在列，L为预先确定的超参数，表示求

行和最小的L个行，对应提取出的差异关键词。

在一个实施例中，所述处理器在用于提取所述回答语句的相似关键词，得到相似关键词集时，用于实现：

将所述回答语句的第一回答语句转化为第一回答向量，将所述回答语句中的其他回答语句转化为第二回答向量，并根据所述第一回答向量和第二回答向量计算注意力矩阵；其中，所述第一回答语句为与所述待回复语句匹配度最高的相似语句所对应的回答语句；

对所述注意力矩阵求极大值，得到所述第一回答语句与所述回答语句中的其他回答语句的相似关键词；

将所有相似关键词取并集，得到相似关键词集；

其中，所述相似关键词公式如下：

其中，i表示所在行，j表示所在列，L为预先确定的超参数，表示求行

和最大的L个行，对应提取出的相似关键词。

在一个实施例中，所述训练好的生成模型包括训练好的第一生成模型和训练好的第二生成模型，所述处理器在用于实现将所述差异关键词集和所述相似关键词集输入训练好的生成模型，输出回答时，用于实现：

将所述差异关键词集和所述相似关键词集输入所述训练好的第一生成模型，通过预测所述差异关键词集和相似关键词集中的词语在语句中的位置，输出有序的关键词序列；

将所述有序的关键词序列输入所述训练好的第二生成模型，输出回答。

所述训练好的生成模型基于预训练语言模型BERT得到的。

本申请的实施例中还提供一种存储介质，所述存储介质存储有计算机程序，所述计算机程序中包括程序指令，所述处理器执行所述程序指令，实现本申请实施例提供的任一项回答生成方法。

其中，所述存储介质可以是前述实施例所述的计算机设备的内部存储单元，例如所述计算机设备的硬盘或内存。所述存储介质也可以是所述计算机设备的外部存储设备，例如所述计算机设备上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。所述存储介质可以是非易失性，也可以是易失性。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

一种基于人工智能的回答生成方法，其中，包括：

接收待回复语句，将所述待回复语句输入检索模型；

获取所述检索模型从预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句，并获取所述相似语句在所述对话语料库中的回答语句；

基于预设的语义对齐关键词提取模型，提取所述相似语句与所述待回复语句的差异关键词，得到差异关键词集；

提取所述回答语句的相似关键词，得到相似关键词集；

将所述差异关键词集和所述相似关键词集输入训练好的生成模型，输出回答。
根据权利要求1所述的回答生成方法，其中，所述获取所述检索模型从预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句，包括：

将所述待回复语句和所述预设的对话语料库中的语句输入至所述检索模型中，生成用于表征所述预设的对话语料库中的语句与待回复语句相似度的Jaccard相似系数；

获取所述检索模型基于所述Jaccard相似系数从所述预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句；

其中，所述相似语句与所述待回复语句的Jaccard相似系数大于第一预设阈值，且小于第二预设阈值。
根据权利要求1所述的回答生成方法，其中，所述基于预设的语义对齐关键词提取模型，提取所述相似语句与所述待回复语句的差异关键词，得到差异关键词集包括：

将所述待回复语句转化为第一向量，将相似语句转化为第二向量，并根据所述第一向量和第二向量计算注意力矩阵；

对所述注意力矩阵求极小值，得到相似语句与待回复语句的差异关键词；

将所述差异关键词取并集，得到差异关键词集。
根据权利要求3所述的回答生成方法，其中，所述注意力矩阵表示为：

其中，ν _A为所述待回复语句转化的第一向量，ν _B为所述相似语句转化的第二向量，d _k为归一化系数；

所述差异关键词公式如下：

其中，i表示所在行，j表示所在列，L为预先确定的超参数，
表示求行和最小的L个行，对应提取出的差异关键词。
根据权利要求4所述的回答生成方法，其中，所述提取所述回答语句的相似关键词，得到相似关键词集包括：

将所述回答语句的第一回答语句转化为第一回答向量，将所述回答语句中的其他回答语句转化为第二回答向量，并根据所述第一回答向量和第二回答向量计算注意力矩阵；其中，所述第一回答语句为与所述待回复语句匹配度最高的相似语句所对应的回答语句；

对所述注意力矩阵求极大值，得到所述第一回答语句与所述回答语句中的其他回答语句的相似关键词；

将所有相似关键词取并集，得到相似关键词集；

其中，所述相似关键词公式如下：

其中，i表示所在行，j表示所在列，L为预先确定的超参数，
表示求行和最大的L个行，对应提取出的相似关键词。
根据权利要求1所述的回答生成方法，其中，所述训练好的生成模型包括训练好的第一生成模型和训练好的第二生成模型；

所述将所述差异关键词集和所述相似关键词集输入训练好的生成模型，输出回答，包括：

将所述差异关键词集和所述相似关键词集输入所述训练好的第一生成模型，通过预测所述差异关键词集和相似关键词集中的词语在语句中的位置，输出有序的关键词序列；

将所述有序的关键词序列输入所述训练好的第二生成模型，输出回答。
根据权利要求6所述的回答生成方法，其中，所述训练好的生成模型是基于预训练语言模型BERT得到的。
一种基于人工智能的回答生成装置，其中，所述装置包括：

语句接收模块，用于接收待回复语句，将所述待回复语句输入检索模型；

相似语句获取模块，用于获取所述检索模型从预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句，并获取所述相似语句在所述对话语料库中的回答语句；

差异关键词提取模块，用于基于预设的语义对齐关键词提取模型，提取所述相似语句与所述待回复语句的差异关键词，得到差异关键词集；

相似关键词提取模块，用于提取所述回答语句的相似关键词，得到相似关键词集；

回答生成模块，用于将所述差异关键词集和所述相似关键词集输入训练好的生成模型，输出回答。
一种计算机设备，其中，所述计算机设备包括存储器和处理器；

所述存储器用于存储计算机程序；

所述处理器，用于执行所述计算机程序并在执行所述计算机程序时实现如下步骤：接收待回复语句，将所述待回复语句输入检索模型；

获取所述检索模型从预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句，并获取所述相似语句在所述对话语料库中的回答语句；

基于预设的语义对齐关键词提取模型，提取所述相似语句与所述待回复语句的差异关键词，得到差异关键词集；

提取所述回答语句的相似关键词，得到相似关键词集；

将所述差异关键词集和所述相似关键词集输入训练好的生成模型，输出回答。
根据权利要求9所述的计算机设备，其中，所述处理器实现获取所述检索模型从预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句的步骤，包括：

将所述待回复语句和所述预设的对话语料库中的语句输入至所述检索模型中，生成用于表征所述预设的对话语料库中的语句与待回复语句相似度的Jaccard相似系数；

获取所述检索模型基于所述Jaccard相似系数从所述预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句；

其中，所述相似语句与所述待回复语句的Jaccard相似系数大于第一预设阈值，且小于第二预设阈值。
根据权利要求9所述的计算机设备，其中，所述处理器实现基于预设的语义对齐关键词提取模型，提取所述相似语句与所述待回复语句的差异关键词，得到差异关键词集的步骤，包括：

将所述待回复语句转化为第一向量，将相似语句转化为第二向量，并根据所述第一向量和第二向量计算注意力矩阵；

对所述注意力矩阵求极小值，得到相似语句与待回复语句的差异关键词；

将所述差异关键词取并集，得到差异关键词集。
根据权利要求9所述的计算机设备，其中，所述处理器实现计算注意力矩阵的步骤，包括：

所述注意力矩阵表示为：

其中，ν _A为所述待回复语句转化的第一向量，ν _B为所述相似语句转化的第二向量，d _k为归一化系数；

所述差异关键词公式如下：

其中，i表示所在行，j表示所在列，L为预先确定的超参数，
表示求行和最小的L个行，对应提取出的差异关键词。
根据权利要求9所述的计算机设备，其中，所述处理器实现提取所述回答语句的相似关键词，得到相似关键词集的步骤，包括：

将所述回答语句的第一回答语句转化为第一回答向量，将所述回答语句中的其他回答语句转化为第二回答向量，并根据所述第一回答向量和第二回答向量计算注意力矩阵；其中，所述第一回答语句为与所述待回复语句匹配度最高的相似语句所对应的回答语句；

对所述注意力矩阵求极大值，得到所述第一回答语句与所述回答语句中的其他回答语句的相似关键词；

将所有相似关键词取并集，得到相似关键词集；

其中，所述相似关键词公式如下：

其中，i表示所在行，j表示所在列，L为预先确定的超参数，
表示求行和最大的L个行，对应提取出的相似关键词。
根据权利要求9所述的计算机设备，其中，所述训练好的生成模型包括训练好的第一生成模型和训练好的第二生成模型，所述处理器实现将所述差异关键词集和所述相似关键词集输入训练好的生成模型，输出回答的步骤，包括：

将所述差异关键词集和所述相似关键词集输入所述训练好的第一生成模型，通过预测所述差异关键词集和相似关键词集中的词语在语句中的位置，输出有序的关键词序列；

将所述有序的关键词序列输入所述训练好的第二生成模型，输出回答；

其中，所述训练好的生成模型是基于预训练语言模型BERT得到的。
一种存储介质，其中，所述存储介质存储有计算机程序，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现如下步骤：

接收待回复语句，将所述待回复语句输入检索模型；

获取所述检索模型从预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句，并获取所述相似语句在所述对话语料库中的回答语句；

基于预设的语义对齐关键词提取模型，提取所述相似语句与所述待回复语句的差异关键词，得到差异关键词集；

提取所述回答语句的相似关键词，得到相似关键词集；

将所述差异关键词集和所述相似关键词集输入训练好的生成模型，输出回答。
根据权利要求15所述的存储介质，其中，所述处理器实现获取所述检索模型从预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句的步骤，包括：

将所述待回复语句和所述预设的对话语料库中的语句输入至所述检索模型中，生成用于表征所述预设的对话语料库中的语句与待回复语句相似度的Jaccard相似系数；

获取所述检索模型基于所述Jaccard相似系数从所述预设的对话语料库中筛选出的与所述待回复语句匹配的相似语句；

其中，所述相似语句与所述待回复语句的Jaccard相似系数大于第一预设阈值，且小于第二预设阈值。
根据权利要求15所述的计算机设备，其中，所述处理器实现基于预设的语义对齐关键词提取模型，提取所述相似语句与所述待回复语句的差异关键词，得到差异关键词集的步骤，包括：

将所述待回复语句转化为第一向量，将相似语句转化为第二向量，并根据所述第一向量和第二向量计算注意力矩阵；

对所述注意力矩阵求极小值，得到相似语句与待回复语句的差异关键词；

将所述差异关键词取并集，得到差异关键词集。
根据权利要求15所述的计算机设备，其中，所述处理器实现计算注意力矩阵的步骤，包括：

所述注意力矩阵表示为：

其中，ν _A为所述待回复语句转化的第一向量，ν _B为所述相似语句转化的第二向量，d _k为归一化系数；

所述差异关键词公式如下：

其中，i表示所在行，j表示所在列，L为预先确定的超参数，
表示求行和最小的L个行，对应提取出的差异关键词。
根据权利要求15所述的计算机设备，其中，所述处理器实现提取所述回答语句的相似关键词，得到相似关键词集的步骤，包括：

将所述回答语句的第一回答语句转化为第一回答向量，将所述回答语句中的其他回答语句转化为第二回答向量，并根据所述第一回答向量和第二回答向量计算注意力矩阵；其中，所述第一回答语句为与所述待回复语句匹配度最高的相似语句所对应的回答语句；

对所述注意力矩阵求极大值，得到所述第一回答语句与所述回答语句中的其他回答语句的相似关键词；

将所有相似关键词取并集，得到相似关键词集；

其中，所述相似关键词公式如下：

其中，i表示所在行，j表示所在列，L为预先确定的超参数，
表示求行和最大的L个行，对应提取出的相似关键词。
根据权利要求15所述的计算机设备，其中，所述训练好的生成模型包括训练好的第一生成模型和训练好的第二生成模型，所述处理器实现将所述差异关键词集和所述相似关键词集输入训练好的生成模型，输出回答的步骤，包括：

将所述差异关键词集和所述相似关键词集输入所述训练好的第一生成模型，通过预测所述差异关键词集和相似关键词集中的词语在语句中的位置，输出有序的关键词序列；

将所述有序的关键词序列输入所述训练好的第二生成模型，输出回答；

其中，所述训练好的生成模型是基于预训练语言模型BERT得到的。