WO2022198750A1

WO2022198750A1 - 语义识别方法

Info

Publication number: WO2022198750A1
Application number: PCT/CN2021/091024
Authority: WO
Inventors: 张晖; 李吉媛; 赵海涛; 孙雁飞; 朱洪波
Original assignee: 南京邮电大学
Priority date: 2021-03-26
Filing date: 2021-04-29
Publication date: 2022-09-29
Also published as: JP2023522502A; CN113204952A; CN113204952B; JP7370033B2

Abstract

一种基于聚类预分析的多意图识别与语义槽填充联合建模方法：实时获取当前用户输入的多意图文本并进行预处理（S101）；基于聚类预分析构建多意图识别模型（S102），用来识别用户的多个意图；基于Slot-Gated关联门机制构建BiLSTM-CRF语义槽填充模型（S103），充分利用意图识别的结果指导语义槽的填充；对构建的多意图识别与语义槽填充的联合模型进行优化（S104）。

Description

语义识别方法

相关申请

本申请要求于2021年3月26日提交中国专利局、申请号为202110325369X、申请名称为“一种基于聚类预分析的多意图与语义槽联合识别方法”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及自然语言处理领域，尤其涉及人机对话***中的自然语言语义分析方法。

背景技术

随着人工智能的快速发展，人们对许多应用场景中的设备智能性的要求日益增加。为了满足智能性的要求，良好的人机交互是必不可少的。目前，人机交互的方式呈现多样化，其中，最方便的方式莫过于使用自然语言。因此，利用自言语言实现人机对话的呼声也越来越高。这使得人机对话***受到了学术界和工业界的广泛关注，具有非常广泛的应用场景。

要实现人机对话***离不开自然语言语义分析技术。语义分析的好坏将直接影响人机交互的效果。由于自然语言的复杂性、抽象性以及词语的多义性等，这都增加了自然语言语义分析的难度。目前，语义分析分为意图识别与语义槽填充两个基本子任务。对于这两个子任务，传统的研究方法是将这两个任务看做两个独立的问题去解决，之后再将两个任务的结果进行连接。

发明内容

本申请各示例性实施例提供了一种语义识别方法，包括：

S101，实时获取当前用户输入的意图文本，利用BERT模型将所述意图文本进行向量化表示以获得意图文本向量；

S102，基于聚类预分析构建多意图识别模型，根据所述意图文本向量识别所述用户的多个意图；

S103，基于Slot-Gated关联门机制构建BiLSTM-CRF语义槽填充模型，利用所识别的所述多个意图来填充所述语义槽填充模型的语义槽；以及

S104，对由所述BERT模型、所述多意图识别模型以及所述语义槽填充模型构成的联合模型进行优化训练，利用优化训练完成的联合模型对输入所述联合模型的文本进行识别。

在一实施例中，所述基于所述聚类预分析构建所述多意图识别模型，识别所述用户的多个意图的步骤包括：

第一阶段：用K-means聚类算法，将输入的所述意图文本向量分为单意图类别的意图文本向量和多意图类别的意图文本向量；以及

第二阶段：对所述单意图类别的意图文本向量，通过softmax分类器进行分类以识别所述多个意图；以及对所述多意图的意图文本向量，通过sigmoid分类器进行分类以识别所述多个意图。

在一实施例中，所述K-means聚类算法中的距离函数为：

其中，f _Sim(x _i,x _j)表示意图文本向量x _i和意图文本向量x _j之间的距离，f ₁(x _i,x _j)表示意图文本向量x _i和意图文本向量x _j之间的余弦相似度，f ₂(x _i,x _j)表示意图文本向量x _i和意图文本向量x _j之间的欧氏距离。

在一实施例中，步骤S104中对所述联合模型进行优化训练包括：

①利用训练文本对所述BERT模型和所述多意图识别模型进行训练，并更新所述BERT模型和所述多意图识别模型的参数；

②将①中所述多意图识别模型的输出传送至Slot-Gated，利用与①中相同的训练文本对①中更新后的BERT模型和语义槽填充模型进行训练，并更新BERT模型和语义槽填充模型的参数；以及

③迭代执行①和②，直到达到训练目标。

在一实施例中，所述多意图识别模型的损失函数Loss _intent满足以下公式：

Loss _intent＝(Loss _multi) ^k(Loss _single) ^1-k

其中，k表示意图文本的类别，当所述意图文本包含多个意图时k为1，当意图文本为单意图时k为0；

为多意图识别的交叉熵损失，

为单意图识别的交叉熵损失，y ^I为意图的预测输出，y ^intent为真实意图，以及T是训练文本的数量。

在一实施例中，所述语义槽填充模型的损失函数Loss _slot满足以下公式：

其中，

表示训练文本序列中第i个字的语义槽预测输出，

表示训练文本序列中第i个字的真实语义槽，T是训练文本数，以及M表示训练文本序列长度。

本申请采用以上技术方案与现有技术相比，具有以下技术效果：

本申请充分考虑了意图识别与语义槽填充之间的联系，构建了联合识别模型，将两个语义分析子任务合并为一个任务，共享BERT底层语义特征。然后，利用Slot-Gated关联门生成意图-语义槽联合特征向量，再将其用于语义槽填充任务。在语义槽填充的任务中，使用BiLSTM捕获文本的语序特征，获取上下文语义信息；以及使用CRF作为解码器，考虑标签前后的依赖关系，使得语义槽标注的更合理。此外，为了提升联合模型的整体性能，在多意图识别过程中，针对用户输入意图的不确定性，提出了一种基于聚类预分析的算法，用来判断意图的数量。在该算法中对传统的语义相似度的度量方法进行了改进，提出了新的度量方式，新的度量方式可以更加有效的衡量意图文本之间的相似度，提高意图个数判断的准确度，提高算法的鲁棒性。为了提高语义分析的能力，充分利用意图语义信息指导语义槽的填充，基于迭代思想，提出一种通过分步迭代的训练方式，可以充分利用意图与语义槽之间的相互关系，在提高语义槽填充准确性的同时提高多意图识别模型的准确性，从而提高语义分析的效果。

附图说明

为了使本申请的目的、技术方案和技术效果更加清楚，本申请提供如下附图进行说明：

图1为本申请一实施例的联合建模方法整体结构框图；

图2为本申请一实施例的基于聚类预分析的多意图识别流程图；

图3为本申请一实施例的语义槽识别模型结构图；以及

图4位本申请一实施例的联合识别模型的分步迭代训练方式示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

如上所述，传统的研究方法是将意图识别与语义槽填充这两个任务看做两个独立的问题去解决，之后再将两个任务的结果进行连接。

但发明人发现，意图识别是对用户需求类型的判断，而语义槽填充是将用户需求具体化。因此，用户意图和待识别的槽位是强相关的，意图识别的目的是为了更好的进行语义槽的填充。而传统的单独建模的方法没有充分考虑两个任务之间的联系，使得语义信息没能得到有效的利用。此外，人机对话***中常面临多意图识别问题，即用户输入的意图文本可能不仅只包含一种意图，也可能会出现多种意图。目前对于意图识别问题的研究主要集中在单意图的识别上，多意图识别相对于单意图识别来说，识别起来不仅更为复杂而且对语义理解的程度要求更高。

因此，发明人发现，针对人机对话***中的语义分析问题，如何在现有技术的基础上提出有效解决多意图识别与语义槽填充的联合建模方法，是本领域内技术人员亟待解决的问题之一。

如图1所示，本申请一实施例揭示了一种基于聚类预分析的多意图与语义槽联合识别方法，包括：

步骤S101，实时获取当前用户输入的多意图文本并进行预处理；

步骤S102，基于聚类预分析构建多意图识别模型，用来识别用户的多个意图；

步骤S103，基于Slot-Gated关联门机制构建BiLSTM-CRF语义槽填充模型，充分利用意图识别的结果指导语义槽的填充；

步骤S104，对构建的多意图识别与语义槽填充的联合模型进行优化。

其中，对当前用户输入的多意图文本进行预处理，就是将多意图文本进行向量化表示，以便输入神经网络模型中进行语义特征提取。本申请实施例的向量化表示方法为，首先使用同领域海量文本(例如中文、英文及其他各种语言文本)无监督语料训练BERT(Bidirectional Encoder Representations from Transformer)模型。然后，利用得到的BERT预训练模型来对多意图文本进行向量化表示。

上述步骤S102中构建基于聚类预分析的多意图识别模型的目的是为了用于语义槽的填充。多意图识别的准确与否会直接影响语义槽的填充。

为了提高多意图识别的准确率，针对用户输入的意图的不确定性，本申请实施例提出了一种基于聚类预分析的方法，即在意图识别之前先对意图文本进行分析，判断意图属于单意图还是多意图。如图2所示，基于聚类预分析的方法的意图识别包括以下步骤。

整个意图识别分为两个阶段。

首先第一阶段用K-means聚类算法来判断输入的意图文本的类型。

一般情况下意图主要分为单意图和多意图两种，因此，K-means聚类算法的聚类中心K为两个。

第二阶段，根据判断的意图个数分别对输入的意图文本进行分类。

当判断意图文本包含多个意图时，使用多意图分类器进行分类。即在BERT预训练模型后面增加全连接层。全连接层的每一个结点都与上一层的所有结点相连，用来把前面提取的语义特征融合起来。然后将BERT模型输出的意图文本向量，输入sigmoid分类器中，用分类器在每个标签上进行二分类，输出多个意图标签。标签预测的计算公式如下所示：

y ^I＝sigmoid(W ^IC+b ^I)，

其中，y ^I为预测概率，W ^I为意图识别的权重，C为意图文本向量，以及b ^I为意图识别的偏置。

当判断意图文本为单意图时，采用softmax分类器，直接将BERT输出第一个标志为([CLS])的句向量C输入分类器中进行分类，根据下面的公式可得到预测的意图标签：

y ^I＝softmax(W ^IC+b ^I)，

在使用K-means聚类算法对多意图文本进行预分析的过程中，需要判断意图文本之间的语义相似度。语义相似度的衡量对于聚类结果的准确性至关重要。对于文本语义相似度的衡量，常用的方式是计算余弦相似度。余弦相似度可以体现空间中两个向量间的差异性。但是余弦相似度对绝对数值不敏感，无法衡量同一方向上的差异性。而欧式距离(Euclidean Metric)在计算相似度时，对绝对数值敏感，可以很好的衡量同一方向上的差异性。因此本申请在余弦相似度和欧式距离的基础上，综合二者的特点，提出了一种新的度量方法，如下所示：

其中，f ₁指余弦相似度，f ₂指欧式距离，X _i为第i个意图文本向量，X _j为第j个意图文本向量，以及e为自然常数。当计算得到的f _Sim值越大，说明数据对象之间的相似度越大，而当计算得到的f _Sim值越小，说明数据对象之间的相似度越小。使用该方法可以更好的衡量文本之间的相似度。

上述步骤S103中的填充过程，基于Slot-Gated关联门机制构建BiLSTM-CRF语义槽填充模型，充分利用意图识别的结果指导语义槽的填充。

如图3中示出了Slot-Gated关联门机制，它可以把意图识别任务与语义槽填充任务联系起来。即将意图识别的意图向量与用于语义槽填充的意图文本向量加权求和。然后通过激活函数tanh，得到意图-语义槽联合特征向量g。意图-语义槽联合特征向量g的计算方法如下：

其中，

表示语义槽向量，c ^I表示意图向量，

和c ^I的维度相同，v和W分别是可训练的向量和矩阵。

计算得到意图-语义槽联合特征向量g之后，将意图-语义槽联合特征向量g，输入BiLSTM(Bi-directional Long Short-Term Memory)神经网络中，从而提取文本的语序特征并捕获深层次的上下文语义信息。然后在BiLSTM网络后面添加一层线性层(Linear Layer)，对神经网络输出向量的维度进行映射，用于语义槽解码。最后使用CRF

(Conditional Random Field)解码层作为解码单元，输出序列中每个词对应的槽标签。计算方法如下：

其中，

表示输入文本序列中第i个字的语义槽预测输出，

为权重矩阵，以及□ _i为隐藏状态向量。图3中B-time为time槽标签的开始标记，I-time为time槽标签的后续标记。

上述步骤S104中，对构建的多意图识别与语义槽填充的联合模型进行优化。。

如图4所示，联合识别模型的性能由两个子任务共同决定。多意图识别和语义槽填充的联合概率如下所示：

其中，

表示在输入多意图文本序列x(包括x ₁，x ₂，…，x _T)的前提下，多意图识别y ^I和语义槽填充

的联合条件概率，T为输入的文本序列长度，t为文本序列中的第t个字符，

为输入序列中第t个字符的语义槽预测输出。

在图4所示的联合模型训练中，训练的目标是最大化输出多意图识别和语义槽填充的联合概率。为了提高语义分析的能力，充分利用意图语义信息用于语义槽的填充，对联合识别模型进行优化。在模型训练时，改变了传统的只是将多个任务损失函数简单相加的方式。基于迭代思想，提出了一种联合多意图识别与语义槽填充的分步迭代训练方式。如图4所示，首先，将训练数据输入联合识别模型中。训练时，先训练一轮多意图识别模型。通过反向传播更新多意图识别模型参数及底层BERT模型参数。然后利用更新过的模型将多意图识别结果的语义特征传送给Slot-Gated关联门。通过Slot-Gated关联门将意图的语义特征与采用更新过的BERT模型而生成的语义槽特征相融合，生成意图-语义槽联合特征向量。将生成的意图-语义槽联合特征向量用于语义槽填充模型的训练。训练时，通过反向传播更新语义槽填充模型参数及底层BERT模型参数。重复训练直到达到最优。

多意图识别与语义槽填充两个任务在训练时共享BERT模型底层参数，即训练一个模型时以另外一个模型的训练结果进行底层模型的初始化。而上游任务则分别训练，同时将意图识别的结果传送给语义槽填充任务。在提高语义槽填充的准确率的同时提高多意图识别模型的准确率。

损失函数对于模型参数更新非常重要。若损失函数选择的不合理，模型再强大最后的结果也不好。

联合识别模型中的多意图识别损失函数Loss _intent，计算公式如下所示：

Loss _intent＝(Loss _multi) ^k(Loss _single) ^1-k

其中，k表示意图文本的类别，当意图文本包含多个意图时k为1，当意图文本为单意图时k为0。Loss _multi为多意图识别的交叉熵，Loss _single为单意图识别的交叉熵，其具体计算如下所示：

式中，y ^I为意图的预测输出，y ^intent为真实意图，j为训练文本中的某一条文本，T ₁表示多意图识别的训练文本数。

联合识别模型中语义槽填充任务损失函数Loss _slot，其计算如下所示：

其中，

表示训练文本序列中第i个字的语义槽预测输出，

表示训练文本序列中第i个字的真实语义槽，T ₂表示语义槽填充训练文本数，M表示训练文本序列长度。

图4中，W11、W12表示多意图识别的权重，Ws1、Ws2表示语义槽填充的权重。

应该理解的是，虽然图1-4的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本申请实施例中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1-4中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

本申请还提供一种于聚类预分析的多意图与语义槽联合识别***，包括：存储器和处理器；所述存储器上存储有计算机程序，当所述计算机程序被所述处理器执行时，实现上述的多意图与语义槽联合识别方法。

本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现上述的多意图与语义槽联合识别方法的步骤。该计算机可读存储介质可以包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种语义识别方法，包括：

S101，实时获取当前用户输入的意图文本，利用BERT模型将所述意图文本进行向量化表示以获得意图文本向量；

S102，基于聚类预分析构建多意图识别模型，根据所述意图文本向量识别所述用户的多个意图；

S103，基于Slot-Gated关联门机制构建BiLSTM-CRF语义槽填充模型，利用所识别的所述多个意图来填充所述语义槽填充模型的语义槽；以及

S104，对由所述BERT模型、所述多意图识别模型以及所述语义槽填充模型构成的联合模型进行优化训练，利用优化训练完成的联合模型对输入所述联合模型的文本进行识别。
根据权利要求1所述的方法，其中，所述基于所述聚类预分析构建所述多意图识别模型，识别所述用户的多个意图的步骤包括：

第一阶段：用K-means聚类算法，将输入的所述意图文本向量分为单意图类别的意图文本向量和多意图类别的意图文本向量；以及

第二阶段：对所述单意图类别的意图文本向量，通过softmax分类器进行分类以识别所述多个意图；以及对所述多意图的意图文本向量，通过sigmoid分类器进行分类以识别所述多个意图。
根据权利要求2所述的方法，其中，所述K-means聚类算法中的距离函数为：

其中，f _Sim(x _i,x _j)表示意图文本向量x _i和意图文本向量x _j之间的距离，f ₁(x _i,x _j)表示意图文本向量x _i和意图文本向量x _j之间的余弦相似度，f ₂(x _i,x _j)表示意图文本向量x _i和意图文本向量x _j之间的欧氏距离。
根据权利要求1所述的方法，其中，步骤S104中对所述联合模型进行优化训练包括：

①利用训练文本对所述BERT模型和所述多意图识别模型进行训练，并更新所述BERT模型和所述多意图识别模型的参数；

②将①中所述多意图识别模型的输出传送至Slot-Gated，利用与①中相同的训练文本对①中更新后的BERT模型和语义槽填充模型进行训练，并更新BERT模型和语义槽填充模型的参数；以及

③迭代执行①和②，直到达到训练目标。
根据权利要求4所述的方法，其中，所述多意图识别模型的损失函数Loss _intent满足以下公式：

Loss _intent＝(Loss _multi) ^k(Loss _single) ^1-k

其中，k表示意图文本的类别，当所述意图文本包含多个意图时k为1，当意图文本为单意图时k为0；
为多意图识别的交叉熵损失，
为单意图识别的交叉熵损失，y ^I为意图的预测输出，y ^intent为真实意图，以及T是训练文本的数量。
根据权利要求4所述的方法，其中，所述语义槽填充模型的损失函数Loss _slot满足以下公式：

其中，
表示训练文本序列中第i个字的语义槽预测输出，
表示训练文本序列中第i个字的真实语义槽，T是训练文本数，以及M表示训练文本序列长度。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6中任一所述的方法。
一种语义识别***，包括：存储器和处理器；所述存储器上存储有计算机程序，当所述计算机程序被所述处理器执行时，实现如权利要求1至6中任一所述的方法。