CN111724767B

CN111724767B - 基于狄利克雷变分自编码器的口语理解方法及相关设备

Info

Publication number: CN111724767B
Application number: CN201911247568.2A
Authority: CN
Inventors: 高望; 朱珣; 邓宏涛; 王煜炜; 曾凡琮
Original assignee: Jianghan University
Current assignee: Jianghan University
Priority date: 2019-12-09
Filing date: 2019-12-09
Publication date: 2023-06-02
Anticipated expiration: 2039-12-09
Also published as: CN111724767A

Abstract

本发明公开一种基于狄利克雷变分自编码器的口语理解方法，属于计算机技术领域，该方法包括：利用狄利克雷变分自编码器对训练语料进行采样，生成采样语料集；依据所述采样语料集，进行数据增强；生成训练语料。本发明实现了将基于狄利克雷变分自编码器的半监督学习方法引入到口语理解的建模过程中，学习原始数据潜在的语义特征并生成高质量的新数据，降低了标注成本，达到了提升口语理解模型的有益效果。

Description

基于狄利克雷变分自编码器的口语理解方法及相关设备

技术领域

本发明涉及计算机技术领域，尤其涉及一种基于狄利克雷变分自编码器的口语理解方法及相关设备。

背景技术

任务型对话***是通过多轮对话帮助用户完成特定任务的人机交互***，这是一个受到广泛关注且应用前景广阔的研究方向。当前，已有众多研究机构和科技公司涉足于任务型对话***这一领域，如阿里巴巴的天猫精灵、苹果的 Siri、微软的小娜等。口语理解是构建任务型对话***的一项核心技术，用于将用户原始输入的自然语言解析为计算机可以理解的结构化语义表达。该表达包含了最能代表用户意图的语义单元，对于人机交互***的开发至关重要。

近年来，基于深度神经网络的口语理解模型取得了较大进展，特别是语义槽填充(Slot Filling)和意图识别(Intent Classifier)的联合学习模型。这种模型的基本思想是使用神经网络来学习输入语句的语义信息，而后输出整个句子的意图类别和每个词语对应的语义槽标签。在这种模型中，意图类别和语义槽标签的生成过程可以相互学习，共同提升性能。相较于传统机器学习与基于规则方法的方法，联合学习模型除了准确率更高之外，还有着无需手写模板、适应性强等优点。

但是，联合学习模型和大多数自然语言处理任务类似，面临着严重地数据稀缺性的问题。此外，口语理解数据集中接近无限的域空间与消耗大量人力的标注任务使得稀疏性问题愈加严重。而传统的数据增强与生成方法依赖于增强 /生成函数，生成的语句通常鲁棒性与多样性较差。这将导致联合学习模型存在过拟合和泛化能力欠缺等问题，从而影响口语理解效果，这也是本发明要解决的关键问题。

发明内容

本发明提供一种基于狄利克雷变分自编码器的口语理解方法及相关设备，用以解决现有技术中的上述技术问题。

第一方面，本发明实施例提供了一种基于狄利克雷变分自编码器的口语理解方法，所述方法包括：利用狄利克雷变分自编码器对训练语料进行采样，生成采样语料集；依据所述采样语料集，进行数据增强，生成训练语料。

进一步地，在第一方面中，所述利用狄利克雷变分自编码器对训练语料进行采样，生成采样语料集具体包括：给定采样语料数量n，初始化空语料集M；当所述M中的语料数量小于n时，循环S1121-S1124：S1121选取一个真实词序列w；S1122通过逆伽马分布函数近似方法推断近似后验参数

S1123通过变分分布q_φ(w|z)采样/>

S1124将采样语料

加入M中；生成所述采样语料集。

进一步地，在第一方面中，所述生成训练语料具体包括如下步骤：首先采样z～q_φ(z)，然后利用狄利克雷变分自编码器近似估计p_η(w|z)；利用p_η(w|z)采样得到生成词序列

利用生成词生成词序列/>

训练口语理解联合模型，推断 />

生成槽填充与意图识别结果/>

将/>

和/>

一起组成新的训练语料/>

并添加至生成语料集中。

进一步地，在第一方面中，所述进行数据增强具体包括：通过潜在变量z和采样语料

对语义槽填充和意图识别任务进行数据增强。

第二方面，本发明实施例提供了一种基于狄利克雷变分自编码器的口语理解***，所述***包括：采样语料集生成模块，被配置为利用狄利克雷变分自编码器对训练语料进行采样，生成采样语料集；数据增强模块，被配置为依据所述采样语料集，进行数据增强；训练语料生成模块，被配置为生成训练语料。

进一步地，在第二方面中，所述采样语料集生成模块具体包括：第一子模块，被配置为给定采样语料数量n，初始化空语料集M；第二子模块，被配置为当所述M中的语料数量小于n时，循环S1121-S1124：选取一个真实词序列w； S1122、通过逆伽马分布函数近似方法推断近似后验参数

S1123、通过变分分布q_φ(w|z)采样/>

S1124、将采样语料/>

加入M中；第三子模块，被配置为生成所述采样语料集。

进一步地，在第二方面中，所述训练语料生成模块具体包括：第一子单元，被配置为首先采样z～q_φ(z)，然后利用狄利克雷变分自编码器近似估计p_η(w|z)；第二子单元，被配置为利用p_η(w|z)采样得到生成词序列

第三子单元，被配置为利用生成词生成词序列/>

训练口语理解联合模型，推断/>

第四子单元，被配置为生成槽填充与意图识别结果/>

第五子单元，被配置为将 />

和/>

一起组成新的训练语料/>

并添加至生成语料集中。

进一步地，在第二方面中，所述数据增强模块还被具体被配置为：通过潜在变量z和采样语料

对语义槽填充和意图识别任务进行数据增强。

第三方面，本发明还提供了一种基于狄利克雷变分自编码器的口语理解的装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现以下步骤：利用狄利克雷变分自编码器对训练语料进行采样，生成采样语料集；依据所述采样语料集，进行数据增强；生成训练语料。

第四方面，本发明还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现以下步骤：利用狄利克雷变分自编码器对训练语料进行采样，生成采样语料集；依据所述采样语料集，进行数据增强；生成训练语料。

本发明实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

本发明提供的一种基于狄利克雷变分自编码器的口语理解方法，首先利用狄利克雷变分自编码器对训练语料进行采样，生成采样语料集；然后依据所述采样语料集，进行数据增强；最后生成训练语料，实现了将基于狄利克雷变分自编码器的半监督学习方法引入到口语理解的建模过程中，学习原始数据潜在的语义特征并生成高质量的新数据，降低了标注成本，达到了提升口语理解模型的有益效果。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例中基于狄利克雷变分自编码器的口语理解方法的流程图；

图2为本申请实施例中DirVAE-SLU模型的结构示意图；

图3为本申请实施例中又一结构示意图；

图4为本申请实施例中计算机可读存储介质的结构示意图。

具体实施方式

本发明提供的一种基于狄利克雷变分自编码器的口语理解方法，实现了将基于狄利克雷变分自编码器的半监督学习方法引入到口语理解的建模过程中，学习原始数据潜在的语义特征并生成高质量的新数据，降低了标注成本，达到了提升口语理解模型的有益效果。

本发明实施例中的技术方案，请参阅图1-2，总体思路如下：

S11、利用狄利克雷变分自编码器对训练语料进行采样，生成采样语料集；

S12、依据所述采样语料集，进行数据增强；

S13、生成训练语料。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明的说明书和权利要求书及上述附图中的术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

实施例一

本发明实施例一提供一种基于狄利克雷变分自编码器的口语理解方法，请参考图1，所述方法包括：

S12、依据所述采样语料集，进行数据增强；

S13、生成训练语料。

据发明人研究发现，联合学习模型和大多数自然语言处理任务类似，面临着严重地数据稀缺性的问题。此外，口语理解数据集中接近无限的域空间与消耗大量人力的标注任务使得稀疏性问题愈加严重。而传统的数据增强与生成方法依赖于增强/生成函数，生成的语句通常鲁棒性与多样性较差。这将导致联合学习模型存在过拟合和泛化能力欠缺等问题，从而影响口语理解效果。基于此，本发明提供一种基于狄利克雷变分自编码器的口语理解方法及相关设备，用以解决上述技术问题。

下面，结合图1对本发明实施例一提供的基于狄利克雷变分自编码器的口语理解方法进行详细介绍：

其中，标准的口语理解模型是一个与数据集高度相关的判别模型，一个口语理解的数据集至少应该含有输入的词序列w，语义槽填充的标签序列s，意图识别的标签y。对于训练数据集(w,s,y)，损失函数如公式(1)所示：

L(θ；w,s,y)＝-logp_θ(s,y|w) (1)

其中，θ表示模型需要求解的参数。当给定输入词序列w时，联合模型可以使用最大化对数似然的方法同时预测语义槽序列s％和识别意图

如公式(2) 所示：

采样过程是狄利克雷变分自编码器的一个关键步骤，通过采样过程可以对训练语料进行采样，从而获得句子或词汇的语义特征。一个良好的采样过程能够有效提升数据增强后的口语理解模型性能。假设从一个真实但未知的概率分布p(x)∈P中采样得到训练语料x，探索性采样过程是通过引入一个潜在变量z 来逼近真实分布p(x)的采样过程。具体来说，狄利克雷变分自编码器利用变分后验分布q(z|x)和参数(h，f)来逼近真实分布p(x)，并通过KL散度(KL divergence) 来衡量变分后验分布q(z|x)与真实后验分布p(z|x)之间差异，该模型的损失函数如公式(3)所示：

将公式(3)应用到口语理解任务中进行数据增强，则：

当求解出模型的最优化参数

后，就可以通过w的变分分布采样得到新的词序列/>

对口语理解模型进行数据增强，如公式(5)所示：

传统的变分自编码假设潜在变量的先验分布是连续随机变量，而狄利克雷变分自编码器使用与多项式分布共轭的狄利克雷分布作为潜在变量的先验分布，更适合口语理解模型，如公式(6)所示：

z～p(z)＝Dirichlet(α),w～p_η(w|z) (6)

其中，α表示狄利克雷超参数。编码器中的近似变分后验分布q_φ(z|w)采样至

近似后验参数/>

可由训练语料w和狄利克雷变分自编码器模型训练得到。本发明并不直接从狄利克雷分布采样z，而是利用狄利克雷分布可由多个独立的伽马分布组成这一特性，使用伽马合成的方法采样潜在变量。首先，采样v～MultiGamma(a,β,1_K)，其中MultiGamma(a,β,1_K)表示K个服从伽马分布的随机变量。然后，利用v的求和项∑v_i对v归一化。损失函数为：

其中，ψ是双伽马函数。对于公式(7)，逆伽马分布函数近似(Approximation withInverse Gamma Cumulative Distribution Function)方法可以使反向传播流能够通过随机梯度方法流向输入，从而推断模型参数。逆伽马分布函数近似方法指出如果X～Gamma(α,β)，并且F(x；α,β)是随机变量X的累积分布函数，则累积分布函数的逆可被近似表示为F^-1(u；α,β)≈β^-1(uaΓ(α))^1/α。因此，本发明通过引入辅助变量u～Uniform(0,1)代替v的随机性，并将Gamma采样的v作为α和β的确定值。 DirVAE-SLU的探索性采样过程具体可包括如下步骤：

S111、给定采样语料数量n，初始化空语料集M；

S112、当所述M中的语料数量小于n时，循环S1121-S1124：

S1121、选取一个真实词序列w；

S1122、通过逆伽马分布函数近似方法推断近似后验参数

S1123、通过变分分布q_φ(w|z)采样

S1124、将采样语料

加入M中；

S13、生成所述采样语料集。

然后在执行S12、依据所述采样语料集，进行数据增强；

具体而言，在得到采样语料集后，DirVAE-SLU通过潜在变量z和采样语料

对语义槽填充和意图识别任务进行数据增强，公式(1)可转化为：

其中，φ表示原有语料w的参数，ζ是采样语料

填充语义槽和识别意图的参数。综合考虑用于数据增强的狄利克雷变分自编码器与口语理解，DirVAE- SLU的联合训练损失函数如下：

从结构上看，DirVAE-SLU模型可以划分两个部分，一个是利用狄利克雷变分自编码器进行潜在变量推断并生成采样语料的数据增强部分，另一个是通过采样语料实现口语理解的部分。其中数据增强部分属于编码器，口语理解属于解码器部分，其模型结果如附图1所示。DirVAE-SLU模型编码器部分使用一个双向长短期记忆(Long Short-TermMemory，LSTM)网络，解码器部分使用三个单向LSTM网络。模型的训练过程是通过最小化损失函数(公式(9)) 来求解最优参数(η^*,φ^*,ζ^*)

η^*,φ^*,ζ^*＝argminL(η,φ,ζ；w,s,y) (10)

最后，执行S13、生成训练语料。

详细而言，在DirVAE-SLU模型生成训练语料的过程中，利用逆伽马分布函数近似方法进行采样。这一方法能够综合考虑真实数据集中的语料平衡程度、计算资源开销等因素选取数据。当选取数据后，DirVAE-SLU使用以下过程来生成足够的训练语料：

1.首先采样z～q_φ(z)，然后利用狄利克雷变分自编码器近似估计p_η(w|z)；

2.利用p_η(w|z)采样得到生成词序列

3.利用生成词生成词序列

训练口语理解联合模型，推断/>

4.生成槽填充与意图识别结果

5.将

和/>

一起组成新的训练语料/>

并添加至生成语料集中。

本发明所提出的方法通过对基准模型进行数据增强的实验比较可以验证本发明方法的高效性。本发明使用两个开源评测数据集：航空信息***数据集 ATIS(AirlineTravel Information Systems)与虚拟助手语料库Snips作为实验所用的数据集。在实验中，a＝0.99·1₁₀₀，β＝1，输入层使用Glove 300维词向量，编码器中双向LSTM的隐藏层维度为256，解码器中三个单向LSTM的隐藏层维度为1024，使用Slot-Gated模型作为基准模型。

表1不同数据集上的数据增强效果对比

从表1的实验结果可以看出，使用DirVAE-SLU进行数据增强后，在两个数据集上基准模型的口语理解性能均有所提升，从而验证本发明的先进性。

也即，本发明实施例实现了将基于狄利克雷变分自编码器的半监督学习方法引入到口语理解的建模过程中，学习原始数据潜在的语义特征并生成高质量的新数据，降低了标注成本，达到了提升口语理解模型的有益效果。

基于同一发明构思，本发明实施例还提供了与实施例一中方法对应的装置，见实施例二。

实施例二

本发明实施例二提供了一种***，所述***包括：

采样语料集生成模块，被配置为利用狄利克雷变分自编码器对训练语料进行采样，生成采样语料集；

数据增强模块，被配置为依据所述采样语料集，进行数据增强；

训练语料生成模块，被配置为生成训练语料。

在本发明实施例二中，所述采样语料集生成模块具体包括：

第一子模块，被配置为给定采样语料数量n，初始化空语料集M；第二子模块，被配置为当所述M中的语料数量小于n时，循环S1121-S1124：S1121、选取一个真实词序列w；S1122、通过逆伽马分布函数近似方法推断近似后验参数

S1123、通过变分分布q_φ(w|z)采样/>

S1124、将采样语料/>

加入M中；第三子模块，被配置为生成所述采样语料集。

在本发明实施例二中，所述训练语料生成模块具体包括：第一子单元，被配置为首先采样z～q_φ(z)，然后利用狄利克雷变分自编码器近似估计p_η(w|z)；第二子单元，被配置为利用p_η(w|z)采样得到生成词序列

第三子单元，被配置为利用生成词生成词序列/>

训练口语理解联合模型，推断/>

第四子单元，被配置为生成槽填充与意图识别结果/>

第五子单元，被配置为将 />

和/>

一起组成新的训练语料/>

并添加至生成语料集中。

在本发明实施例二中，所述数据增强模块还被具体被配置为：通过潜在变量z和采样语料

对语义槽填充和意图识别任务进行数据增强。

由于本发明实施例二所介绍的***，为实施本发明实施例一的方法所采用的装置，故而基于本发明实施例一所介绍的方法，本领域所属人员能够了解该装置的具体结构及变形，故而在此不再赘述。凡是本发明实施例一的方法所采用的装置都属于本发明所欲保护的范围。

实施例三

需要说明的是，基于上述实施例一、实施例二同样的发明沟通，本发明实施例三提供了一种装置，包括：射频(Radio Frequency，RF)电路310、存储器320、输入单元330、显示单元340、音频电路350、WiFi模块360、处理器 370、以及电源380等部件。其中，存储器320上存储有可在处理器370上运行的计算机程序，处理器370执行所述计算机程序时实现实施例一中所述的步骤S110、步骤S120、步骤S130、步骤S140和步骤S150；或者实现实施例二中所述的步骤S210、步骤S220、步骤S230、步骤S240、步骤S250和步骤S260；或者实现实施例三中所述的步骤S301、步骤S302、步骤S303和步骤S304。

在具体实施过程中，处理器执行计算机程序时，可以实现实施例一、二中的任一实施方式。

本领域技术人员可以理解，图3中示出的装置结构并不构成对装置本身的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图3对计算机设备的各个构成部件进行具体的介绍：

RF电路310可用于信号的接收和发送，特别地，将基站的下行信息接收后，给处理器370处理。通常，RF电路310包括但不限于至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier，LNA)、双工器等。

存储器320可用于存储软件程序以及模块，处理器370通过运行存储在存储器320的软件程序以及模块，从而执行计算机设备的各种功能应用以及数据处理。存储器320可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序等；存储数据区可存储根据计算机设备的使用所创建的数据等。此外，存储器320可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元330可用于接收输入的数字或字符信息，以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。具体地，输入单元330可包括键盘331以及其他输入设备332。键盘331，可收集用户在其上的输入操作，并根据预先设定的程式驱动相应的连接装置。键盘331采集到输出信息后再送给处理器370。除了键盘331，输入单元330还可以包括其他输入设备332。具体地，其他输入设备332可以包括但不限于触控面板、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元340可用于显示由用户输入的信息或提供给用户的信息以及计算机设备的各种菜单。显示单元340可包括显示面板341，可选的，可以采用液晶显示器(LiquidCrystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板341。进一步的，键盘331 可覆盖显示面板341，当键盘331检测到在其上或附近的触摸操作后，传送给处理器370以确定触摸事件的类型，随后处理器370根据输入事件的类型在显示面板341上提供相应的视觉输出。虽然在图3中键盘331与显示面板341是作为两个独立的部件来实现计算机设备的输入和输入功能，但是在某些实施例中，可以将键盘331与显示面板341集成而实现计算机设备的输入和输出功能。

音频电路350、扬声器351，传声器352可提供用户与计算机设备之间的音频接口。音频电路350可将接收到的音频数据转换后的电信号，传输到扬声器351，由扬声器351转换为声音信号输出；

WiFi属于短距离无线传输技术，计算机设备通过WiFi模块360可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图3示出了WiFi模块360，但是可以理解的是，其并不属于计算机设备的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器370是计算机设备的控制中心，利用各种接口和线路连接整个计算机设备的各个部分，通过运行或执行存储在存储器320内的软件程序和/或模块，以及调用存储在存储器320内的数据，执行计算机设备的各种功能和处理数据，从而对计算机设备进行整体监控。可选的，处理器370可包括一个或多个处理单元；优选的，处理器370可集成应用处理器，其中，应用处理器主要处理操作***、用户界面和应用程序等。

计算机设备还包括给各个部件供电的电源380(比如电源适配器)，优选的，电源可以通过电源管理***与处理器370逻辑相连。

实施例四

基于同一发明构思，如图4所示，本实施例五提供了一种计算机可读存储介质400，其上存储有计算机程序411，该计算机程序411被处理器执行时实现实施例一中所述的步骤S110、步骤S120、步骤S130、步骤S140和步骤S150；或者实现实施例二中所述的步骤S210、步骤S220、步骤S230、步骤S240、步骤S250和步骤S260；或者实现实施例三中所述的步骤S301、步骤S302、步骤S303和步骤S304。

在具体实施过程中，该计算机程序411被处理器执行时，可以实现实施例一、二和三中的任一实施方式。

本领域内的技术人员应明白，本发明的实施例可提供为方法、***、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、 CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/ 或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本发明实施例中提供的技术方案，至少具有如下技术效果或优点：

实现了将基于狄利克雷变分自编码器的半监督学习方法引入到口语理解的建模过程中，学习原始数据潜在的语义特征并生成高质量的新数据，降低了标注成本，达到了提升口语理解模型的有益效果。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/ 或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样，倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。