CN113779975B - 一种语义识别方法、装置、设备及介质 - Google Patents
一种语义识别方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN113779975B CN113779975B CN202010525122.8A CN202010525122A CN113779975B CN 113779975 B CN113779975 B CN 113779975B CN 202010525122 A CN202010525122 A CN 202010525122A CN 113779975 B CN113779975 B CN 113779975B
- Authority
- CN
- China
- Prior art keywords
- feature matrix
- matrix
- slot
- intention
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 239000011159 matrix material Substances 0.000 claims abstract description 991
- 230000003993 interaction Effects 0.000 claims description 152
- 239000013598 vector Substances 0.000 claims description 90
- 230000006870 function Effects 0.000 claims description 45
- 238000010606 normalization Methods 0.000 claims description 40
- 238000012545 processing Methods 0.000 claims description 30
- 230000015654 memory Effects 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 abstract description 23
- 230000002452 interceptive effect Effects 0.000 abstract description 12
- 238000011176 pooling Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 17
- 238000012549 training Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 230000004913 activation Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种语义识别方法、装置、设备及介质,用以解决现有没有考虑槽位填充和意图识别之间的相关性,从而使意图识别和槽位填充结果的准确率低的问题。由于本发明实施例中在确定待识别文本的语义识别结果的过程中,确定了第一特征矩阵对应的交互门矩阵,其中,该第一特征矩阵包括意图表示特征矩阵,和/或槽位表示特征矩阵,并基于该第一特征矩阵对应的交互门矩阵,来确定相互关联的目标意图和目标槽位,从而提高了确定的目标意图,和/或目标槽位的准确率,有利于准确地确定待识别文本的语义识别结果。
Description
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语义识别方法、装置、设备及介质。
背景技术
随着互联网技术的发展,使用语音进行人机交互的智能设备越来越多,人们通过语音与智能设备进行交互,从而实现订购机票,查询信息、聊天等功能,解放了人们的双手,为人们的生活带来了许多便捷。因此,人们对语音人机交互技术的要求也越来越高,智能设备如何理解人们输入的语音也成为人们日益关注的问题。
现有技术中,智能设备采集到语音信息后,将该语音信息转化成对应的待识别文本,并通过自然语言理解(Natural Language Understanding,NLU)模型识别该文本的语义,该NLU模型可以实现的功能主要包括:槽位填充以及意图识别。图1为现有语义识别流程示意图,如图1所示,NLU模型在实现意图识别时,待识别文本输入到该NLU模型后,通过NLU模型中的共享表示特征矩阵识别层中的字符嵌入网络,确定由待识别文本中的每个字符的元素向量组合成的元素矩阵,并通过共享编码器,确定该元素矩阵的共享表示特征矩阵(Shared representation of intent and slot);通过NLU模型中意图输出层的长短期记忆网络,确定共享表示特征矩阵的意图表示特征矩阵(intent representation);通过NLU模型中的意图输出层,对该意图表示特征矩阵进行最大池化等处理后,确定该意图表示特征矩阵的目标意图。而NLU模型在实现槽位填充时,在上述确定共享表示特征矩阵之后,通过NLU模型的槽位输出层中的条件随机场,确定共享表示特征矩阵的目标槽位。根据获取到目标意图以及目标槽位,确定待识别文本的语义识别结果。
由于意图识别和槽位填充之间有很强的相关性,目标槽位和目标意图的确定过程会相互依赖,而现有的基于该NLU模型确定目标槽位以及目标意图的过程中,槽位填充和意图识别均是分别确定的,使意图识别和槽位填充结果的准确率低。
发明内容
本发明实施例提供了一种语义识别方法、装置、设备及介质,用以解决现有没有考虑槽位填充和意图识别之间的相关性,从而使意图识别和槽位填充结果的准确率低的问题。
本发明实施例还提供了一种语义识别方法,所述方法包括:
确定待识别文本的共享表示特征矩阵;
根据所述共享表示特征矩阵,分别确定所述待识别文本对应的意图表示特征矩阵和槽位表示特征矩阵;
确定第一特征矩阵对应的交互门矩阵,其中,所述第一特征矩阵包括意图表示特征矩阵,和/或槽位表示特征矩阵;
根据所述第一特征矩阵及所述第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵;
根据所述第一目标特征矩阵,确定目标意图和目标槽位;
根据所述目标意图和所述目标槽位,确定所述待识别文本的语义识别结果。
本发明实施例还提供了一种语义识别装置,所述装置包括:
第一确定模块,用于确定待识别文本的共享表示特征矩阵;
第二确定模块,用于根据所述共享表示特征矩阵,分别确定所述待识别文本对应的意图表示特征矩阵和槽位表示特征矩阵;
第一处理模块,用于确定第一特征矩阵对应的交互门矩阵,其中,所述第一特征矩阵包括所述意图表示特征矩阵,和/或所述槽位表示特征矩阵;
第三确定模块,用于根据所述第一特征矩阵及所述第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵;
第二处理模块,用于根据所述第一目标特征矩阵,确定目标意图和目标槽位;
语义确定模块,用于根据所述目标意图和所述目标槽位,确定所述待识别文本的语义识别结果。
本发明实施例还提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如上述所述语义识别方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述语义识别方法的步骤。
由于本发明实施例中在确定待识别文本的语义识别结果的过程中,确定了第一特征矩阵对应的交互门矩阵,其中,该第一特征矩阵包括意图表示特征矩阵,和/或槽位表示特征矩阵,并基于该第一特征矩阵对应的交互门矩阵,来确定相互关联的目标意图和目标槽位,从而提高了确定的目标意图,和/或目标槽位的准确率,有利于准确地确定待识别文本的语义识别结果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为现有语义识别流程示意图;
图2为本发明实施例提供的一种语义识别过程示意图;
图3为本发明实施例提供的具体的确定待识别文本的目标意图和目标槽位流程示意图;
图4为本发明实施例提供的语义识别方法实施流程示意图;
图5为本发明实施例提供的一种语义识别装置结果示意图;
图6为本发明实施例提供的一种电子设备结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
为了提高确定的目标意图和目标槽位的准确率,本发明实施例提供了一种语义识别方法、装置、设备及介质。
实施例1:图2为本发明实施例提供的一种语义识别过程示意图,该过程包括以下步骤:
S201:确定待识别文本的共享表示特征矩阵。
本发明实施例提供的语义识别方法应用于电子设备,该电子设备可以是智能设备,也可以是服务器。
待识别文本可以是根据智能设备采集到的语音信息识别得到的文本信息,也可以是智能设备通过自身的显示界面接收到的用户输入的文本信息。其中,将采集的语音信息转化为对应的文本的过程属于现有技术,在此不再赘述。
为了方便对待识别文本的语义识别,当电子设备获取到待识别文本后,先确定该待识别文本的共享表示特征矩阵。其中,确定共享表示特征矩阵的方法属于现有技术。具体如下,可以通过现有的NLU模型中的共享表示特征矩阵识别层中的字符嵌入网络,确定待识别文本中包含的每个字符的元素向量,电子设备可以根据该元素向量识别出对应的字符。然后根据每个元素向量确定待识别文本的元素矩阵。当获取到待识别文本的元素矩阵后,继续通过该共享表示特征矩阵识别层中的共享编码器,确定该元素矩阵的共享表示特征矩阵,即确定待识别文本的共享表示特征矩阵。
其中,待识别文本中包含的一个字符可以是一个字、一个字母、或一个数字,比如“明”、“a”、“0”等,也可以是单词,比如“like”、“plane”等。每个字符对应的元素向量的长度是固定维数的,比如一个字符的元素向量为50维,64维等。根据该待识别文本中的字符的个数,以及每个元素向量的维数,可以确定待识别文本的元素矩阵的维数。比如,待识别文本为“明天北京的天气”,该待识别文本中包含的字符分别为“明”、“天”、“北”、“京”、“的”、“天”、“气”,每个字符对应的元素向量的维数为64维(也可以是其他维数,如128维、256维等,可以根据预先训练该字符嵌入网络时为了区分不同字符所需的维数确定,本发明实施例中不对元素向量的维数进行限定),则最后确定的待识别文本的元素矩阵的维数为7*64。由于该共享编码器可以双向学习输入的元素矩阵中意图识别的特征以及槽位填充的特征,因此,通过该共享编码器确定的共享表示特征矩阵的维数为7*128。
S202:根据所述共享表示特征矩阵,分别确定所述待识别文本对应的意图表示特征矩阵和槽位表示特征矩阵。
为了充分学习到共享表示特征矩阵中的意图特征以及槽位特征,提高后续识别的目标意图以及目标槽位的鲁棒性,在本发明实施例中,获取到待识别文本的共享表示特征矩阵之后,根据该共享表示特征矩阵,进行相应的处理,以分别学习该共享表示特征矩阵中的意图特征和槽位特征,从而分别确定待识别文本对应的意图表示特征矩阵和槽位表示特征矩阵(Slot Representation)。
示例性的,可以根据基于现有的NLU模型中意图输出层的长短期记忆网络,根据输入的共享表示特征矩阵,获取待识别文本对应的意图表示特征矩阵。而对于待识别文本对应的槽位表示特征矩阵,则可以在获取到共享表示特征矩阵之后,通过串联的两个长短期记忆网络,获取待识别文本对应的槽位表示特征矩阵。
需要说明的是,为了充分学习到共享表示特征矩阵中的意图特征和槽位特征,获取意图表示特征矩阵所需的长短期记忆网络与获取槽位表示特征矩阵所需的串联的两个长短期记忆网络的网络参数是不同的。
S203:确定第一特征矩阵对应的交互门矩阵,其中,所述第一特征矩阵包括所述意图表示特征矩阵,和/或所述槽位表示特征矩阵。
在本发明实施例中,为了可以使确定的待识别文本的目标意图,和/或,目标槽位更准确,可以在学习到的意图特征中结合槽位特征,和/或,在学习到的槽位特征中结合意图特征,从而确定第一特征矩阵对应的交互门矩阵。其中,第一特征矩阵包括意图表示特征矩阵,和/或槽位表示特征矩阵。
具体实施过程中,可以只确定意图表示特征矩阵对应的交互门矩阵;也可以只确定槽位表示特征矩阵对应的交互门矩阵;当然还可以分别确定意图表示特征矩阵对应的交互门矩阵、以及槽位表示特征矩阵对应的交互门矩阵。并且,意图表示特征矩阵对应的交互门矩阵和槽位表示特征矩阵对应的交互门矩阵可以相同,也可以不同。
其中,交互门矩阵的维数由第一特征矩阵的维数确定。
例如,若待识别文本中包含的字符的数量为20,且确定的待识别文本的共享表示特征矩阵的维数为20*128,则待识别文本对应的意图表示特征矩阵和槽位表示特征矩阵的维数也均为20*128,因此,第一特征矩阵对应的交互门矩阵的维数也为20*128。
S204:根据所述第一特征矩阵及所述第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵。
为了使确定的待识别文本的目标意图,和/或,目标槽位更准确,在本发明实施例中,当确定了第一特征矩阵对应的交互门矩阵之后,根据该第一特征矩阵对应的交互门矩阵,对该第一特征矩阵进行调整,以确定第一目标特征矩阵。
具体的,若第一特征矩阵包括意图表示特征矩阵,则将根据该意图表示特征矩阵以及该意图表示特征矩阵对应的交互门矩阵,确定的第一目标意图特征矩阵作为第一目标特征矩阵;
若第一特征矩阵包括槽位表示特征矩阵,则将根据该槽位表示特征矩阵以及该槽位表示特征矩阵对应的交互门矩阵,确定的第一目标槽位特征矩阵作为第一目标特征矩阵;
若第一特征矩阵包括意图表示特征矩阵和槽位表示特征矩阵,则将根据意图表示特征矩阵及其对应的交互门矩阵确定的第一目标意图特征矩阵,以及根据槽位表示特征矩阵及其对应的交互门矩阵确定的第一目标槽位特征矩阵,均作为第一目标特征矩阵。
其中,该交互门矩阵中包含的每个元素(为了便于描述,交互门矩阵中包含的每个元素定义为门元素),表征第一特征矩阵中对应元素在第一目标特征矩阵中对应位置的元素(为了便于描述,第一目标特征矩阵中包含的每个元素定义为特征元素)中的概率,比如,若第一特征矩阵包括槽位表示特征矩阵,则该槽位表示特征矩阵对应的交互门矩阵中包含的每个门元素,可以表示为槽位表示特征矩阵中每个槽位特征元素,在确定第一目标特征矩阵中对应位置的特征元素中的概率;若第一特征矩阵包括意图表示特征矩阵,则该意图表示特征矩阵对应的交互门矩阵中包含的每个门元素,可表示为意图表示特征矩阵中每个意图特征元素,在确定第一目标特征矩阵中对应位置的特征元素中的概率。
S205:根据所述第一目标特征矩阵,确定目标意图和目标槽位。
为了确定待识别文本的目标意图和目标槽位,基于上述实施例获取到第一目标特征矩阵之后,对该第一目标特征矩阵进行相应的处理,从而获取待识别文本的目标意图和目标槽位。
具体实施中,若第一特征矩阵仅包括意图表示特征矩阵,则该第一目标特征矩阵即为意图特征矩阵(为了便于描述,这里的意图特征矩阵定义为第一目标意图特征矩阵),进一步的,根据该第一目标意图特征矩阵,确定目标意图,根据槽位表示特征矩阵,确定目标槽位;
若第一特征矩阵仅包括槽位表示特征矩阵,则该第一目标特征矩阵即为槽位特征矩阵(为了便于描述,这里的槽位特征矩阵定义为第一目标槽位特征矩阵),进一步的,根据该第一目标槽位特征矩阵,确定目标槽位,根据意图表示特征矩阵,确定目标意图;
若第一特征矩阵包括意图表示特征矩阵和槽位表示特征矩阵,则该第一目标特征矩阵即为第一目标意图特征矩阵和第一目标槽位特征矩阵,进一步的,根据该第一目标意图特征矩阵,确定目标意图,根据第一目标槽位特征矩阵,确定目标槽位。
S206:根据所述目标意图和所述目标槽位,确定所述待识别文本的语义识别结果。
基于上述实施例获取到待识别文本的目标意图以及目标槽位之后,将该目标意图以及目标槽位结合,确定待识别文本的语义识别结果。
后续电子设备根据确定的待识别文本的语义识别结果,执行相应的操作。比如,输出“北京明天的天气晴,温度15-23℃”的回复信息。
由于本发明实施例中在确定待识别文本的语义识别结果的过程中,确定了第一特征矩阵对应的交互门矩阵,其中,该第一特征矩阵包括意图表示特征矩阵,和/或槽位表示特征矩阵,并基于该第一特征矩阵对应的交互门矩阵,来确定相互关联的目标意图和目标槽位,从而提高了确定的目标意图,和/或目标槽位的准确率,有利于准确地确定待识别文本的语义识别结果。
实施例2:
为了提高确定的目标意图和目标槽位的准确率,在上述实施例的基础上,在本发明实施例中,若所述第一特征矩阵包括所述意图表示特征矩阵和所述槽位表示特征矩阵,所述确定第一特征矩阵对应的交互门矩阵,包括:
基于所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定所述意图表示特征矩阵和所述槽位表示特征矩阵分别对应的交互门矩阵。
在实际应用过程中,意图识别和槽位填充之间有很强的相关性,目标槽位会依赖目标意图,而目标意图也会依赖目标槽位,如果在分别确定目标意图和目标槽位时,均充分考虑槽位填充和意图识别的相关性,则会进一步提高识别的待识别文本的语义识别结果。因此,为了提高确定的目标意图和目标槽位的准确率,在本发明实施例中,若第一特征矩阵包括意图表示特征矩阵和槽位表示特征矩阵,在获取第一特征矩阵对应的交互门矩阵时,分别获取意图表示特征矩阵对应的交互门矩阵、以及槽位表示特征矩阵对应的交互门矩阵。
为了分别确定意图表示特征矩阵和槽位表示特征矩阵对应的交互门矩阵,在本发明实施例中,预先分别针对意图表示特征矩阵和槽位表示特征矩阵配置对应的权重矩阵。并且,该意图表示特征矩阵对应的权重矩阵和槽位表示特征矩阵对应的权重矩阵可以相同,也可以不同。
其中,权重矩阵的维数由第一特征矩阵的维数确定。当获取到意图表示特征矩阵和槽位表示特征矩阵之后,基于该意图表示特征矩阵、槽位表示特征矩阵及其分别对应的权重矩阵,电子设备进行相应的处理,从而确定意图表示特征矩阵和槽位表示特征矩阵分别对应的交互门矩阵。
具体的,该意图表示特征矩阵和槽位表示特征矩阵分别对应的交互门矩阵可以相同,也可以不同。下面将针对意图表示特征矩阵和槽位表示特征矩阵分别对应的交互门矩阵的两种确定过程进行说明:
方式一:意图表示特征矩阵和槽位表示特征矩阵对应的交互门矩阵相同。
在一种可能的实施方式中,所述基于所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定所述意图表示特征矩阵和所述槽位表示特征矩阵分别对应的交互门矩阵,包括:
根据所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定子矩阵;以及
根据所述子矩阵以及预设的第一归一化函数,确定所述交互门矩阵。
首先,预先配置有意图表示特征矩阵对应的权重矩阵和槽位表示特征矩阵对应的权重矩阵,将意图表示特征矩阵与其对应的权重矩阵叉乘,并将槽位表示特征矩阵与其对应的权重矩阵叉乘,根据上述两个叉乘后的矩阵的和,确定一个子矩阵。然后将该子矩阵与预设的第一归一化函数相乘,从而确定出意图表示特征矩阵和槽位表示特征矩阵分别对应的交互门矩阵,其中,该预设的第一归一化函数为可以将子矩阵中的元素的值映射到-1到1之间的激活函数,比如,sigmoid激活函数,tanh激活函数等。
一种可能的实施方式中,可以通过如下公式确定交互门矩阵:
g=σ(ωi×ri+ωs×rs)
其中,g为意图表示特征矩阵ri和槽位表示特征矩阵rs分别对应的交互门矩阵;σ是预设的第一归一化函数;ωi为意图表示特征矩阵ri对应的权重矩阵;ωs为槽位表示特征矩阵rs对应的权重矩阵。
在另一种可能的实施方式中,为了进一步提高确定的目标意图和目标槽位的准确率,在本发明实施例还可以预先设置参数调整矩阵。当确定了子矩阵之后,基于该预设的参数调整矩阵,对该子矩阵进行相应的调整,以便后续确定交互门矩阵。具体的,所述根据所述子矩阵以及预设的第一归一化函数,确定所述交互门矩阵,包括:
根据所述子矩阵、所述预设的第一归一化函数以及预设的参数调整矩阵,确定所述交互门矩阵。
当基于上述实施例确定了子矩阵之后,通过预设的参数调整矩阵对该子矩阵进行调整,即将该子矩阵与预设的参数调整矩阵相加,以获得调整后的子矩阵。然后根据预设的第一归一化函数对该调整后的子矩阵进行归一化,从而确定意图表示特征矩阵和槽位表示特征矩阵分别对应的交互门矩阵。
一种可能的实施方式中,可以通过如下公式确定交互门矩阵:
g=σ(ωi×ri+ωs×rs)
其中,g为意图表示特征矩阵ri和槽位表示特征矩阵rs分别对应的交互门矩阵;σ是预设的第一归一化函数;ωi为意图表示特征矩阵ri对应的权重矩阵;ωs为槽位表示特征矩阵rs对应的权重矩阵;b为预设的参数调整矩阵。
方式二:意图表示特征矩阵和槽位表示特征矩阵对应不同的交互门矩阵。
在一种可能的实施方式中,所述基于所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定所述意图表示特征矩阵和所述槽位表示特征矩阵分别对应的交互门矩阵,包括:
根据所述意图表示特征矩阵中包含的每个意图特征向量,确定平均意图特征向量,其中,所述每个意图特征向量对应所述待识别文本中包含的一个字符;根据所述平均意图特征向量、以及对应的权重向量,确定加权后的平均意图特征向量;并根据所述槽位表示特征矩阵以及对应的第一权重矩阵,确定第一槽位矩阵;根据所述第一槽位矩阵中的每个子槽位特征向量与所述加权后的平均意图特征向量,确定第二槽位矩阵,其中,所述每个子槽位特征向量对应所述待识别文本中包含的一个字符;根据所述第二槽位矩阵及预设的第二归一化函数,确定所述槽位表示特征矩阵对应的交互门矩阵;
根据所述意图表示特征矩阵以及所述意图表示特征矩阵对应的第二权重矩阵、和所述槽位表示特征矩阵以及所述槽位表示特征矩阵对应的第三权重矩阵,确定意图矩阵;根据所述意图矩阵及预设的第二归一化函数,确定所述意图表示特征矩阵对应的交互门矩阵。
在本发明实施例中,针对待识别文本中包含的每个字符,意图表示特征矩阵中均包含有与该字符对应的意图特征向量,即意图表示特征矩阵中包含的每个意图特征向量均对应待识别文本中包含的一个字符。例如,待识别文本中包含的字符的数量为20,且确定的待识别文本的共享表示特征矩阵的维数为20*128,获取到的该共享表示特征矩阵的意图表示特征矩阵也为20*128,其中该意图表示特征矩阵中包含有20个1*128的意图特征向量,每个1*128的意图特征向量对应待识别文本中包含的一个字符。根据该意图表示特征矩阵中包含的每个意图特征向量,确定一个平均意图特征向量。
在本发明实施例中,为了使后续确定的目标槽位中考虑槽位填充和意图识别的相关性,预先设置有平均意图特征向量对应的权重向量,以及槽位表示特征矩阵对应的第一权重矩阵。当基于上述实施例确定了平均意图特征向量后,将平均意图特征向量与其对应的权重向量叉乘,确定加权后的平均意图特征向量,并将槽位表示特征矩阵与其对应的第一权重矩阵叉乘,确定第一槽位矩阵。后续基于该第一槽位矩阵以及加权后的平均意图特征向量,进行相应的处理,从而确定槽位表示特征矩阵对应的交互门矩阵。
具体实施中,为了方便对第一槽位矩阵以及加权后的平均意图特征向量进行相应的处理,可以将加权后的平均意图特征向量扩展为与第一槽位矩阵的维数相同的平均意图矩阵,该平均意图矩阵中包含的每一维向量均为该加权后的平均意图特征向量。比如,第一槽位矩阵的维数为20*128,加权后的平均意图特征向量的维数为1*128,将20个相同的加权后的平均意图特征向量1*128组合成一个20*128维的矩阵,该20*128维的矩阵即为平均意图矩阵。
当基于上述实施例获取到平均意图矩阵之后,将该平均意图矩阵与第一槽位矩阵相加,即将第一槽位矩阵中的每个子槽位特征向量与该加权后的平均意图特征向量相加,确定第二槽位矩阵。其中,该第一槽位矩阵中包含的每个子槽位特征向量也分别对应待识别文本中包含的一个字符。例如,待识别文本中包含的字符的数量为20,且确定的待识别文本的共享表示特征矩阵的维数为20*128,获取到的该共享表示特征矩阵的槽位表示特征矩阵也为20*128,基于该槽位表示特征矩阵确定的第一槽位矩阵也为20*128,该第一槽位矩阵中包含有20个1*128的子槽位特征向量,每个1*128的子槽位特征向量对应待识别文本中包含的一个字符。
当基于上述实施例确定了第二槽位矩阵后,根据该第二槽位矩阵以及预设的第二归一化函数,确定槽位表示特征矩阵对应的交互门矩阵。其中,该预设的第二归一化函数与上述实施例中的第一归一化函数可以相同,也可以不同,在此不再赘述。
在一种可能的实施方式中,可以通过如下公式确定槽位表示特征矩阵对应的交互门矩阵:
其中,1≤j≤n;/>为平均意图向量;n为待识别文本中包含的字符的数量;/>为待识别文本中包含的第j个字符对应的意图特征向量;gslot为槽位表示特征矩阵对应的交互门矩阵;tanh是预设的第二归一化函数;/>为平均意图特征向量/>对应的权重向量;/>为槽位表示特征矩阵rs对应的第一权重矩阵。
相应的,为了确定意图表示特征矩阵对应的交互门矩阵,在本发明实施例中,预先保存有意图表示特征矩阵对应的权重矩阵(为了便于描述,意图表示特征矩阵对应的权重矩阵定义为第二权重矩阵)、以及槽位表示特征矩阵对应的权重矩阵(为了便于描述,槽位表示特征矩阵对应的权重矩阵定义为第三权重矩阵)。当基于上述实施例确定了意图表示特征矩阵和槽位表示特征矩阵后,将该意图表示特征矩阵与其对应的第二权重矩阵叉乘,并将槽位表示特征矩阵与其对应的第三权重矩阵叉乘,根据两个叉乘的和,确定意图矩阵。然后根据预设的第二归一化函数,对该意图矩阵进行归一化,从而确定意图表示特征矩阵对应的交互门矩阵。
一种可能的实施方式中,确定意图表示特征矩阵对应的交互门矩阵,可以通过如下公式确定:
其中,gintent为意图表示特征矩阵ri对应的交互门矩阵;tanh是预设的第二归一化函数;为意图表示特征矩阵ri对应的第二权重矩阵;/>为槽位表示特征矩阵rs对应的第三权重矩阵。
由于本发明实施例基于意图表示特征矩阵、槽位表示特征矩阵及其分别对应的权重矩阵,确定意图表示特征矩阵和槽位表示特征矩阵分别对应的交互门矩阵,通过意图表示特征矩阵和槽位表示特征矩阵分别对应的交互门矩阵将意图表示特征矩阵以及槽位表示特征矩阵结合,实现了槽位填充的特征信息和意图识别的特征信息之间的相互结合,考虑了槽位填充和意图识别之间的相关性,从而帮助后续提高确定的目标意图和目标槽位的准确率。
在另一种可能的实施方式中,若第一特征矩阵包括意图表示特征矩阵,可以根据上述的方式一或方式二中任一种方法确定意图表示特征矩阵对应的交互门矩阵;若第一特征矩阵包括槽位表示特征矩阵,可以根据上述的方式一或方式二中任一种方法确定槽位表示特征矩阵对应的交互门矩阵。具体的确定过程,与上述实施例相同,在此不再赘述。
实施例3:为了进一步有效地将意图识别的特征信息与槽位填充的特征信息结合,在本发明实施例中,若所述第一特征矩阵为意图表示特征矩阵,所述根据所述第一特征矩阵及所述第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵,包括:
根据所述意图表示特征矩阵以及所述意图表示特征矩阵对应的交互门矩阵的克罗内克乘积,确定所述意图表示特征矩阵对应的第一目标特征矩阵。
一种可能的实施方式中,当基于上述实施例中的方法获取到第一特征矩阵对应的交互门矩阵之后,根据该第一特征矩阵及其对应的交互门矩阵,确定第一目标特征矩阵。具体的,若第一特征矩阵为意图表示特征矩阵,则可以求取意图表示特征矩阵与其对应的交互门矩阵的克罗内克乘积,将该克罗内克乘积确定为意图表示特征矩阵对应的第一目标特征矩阵。
具体的确定意图表示特征矩阵对应的第一目标特征矩阵,可以通过如下公式确定:
其中,为意图表示特征矩阵ri对应的第一目标特征矩阵;gintent为意图表示特征矩阵ri对应的交互门矩阵。
在另一种可能的实施方式中,获取到意图表示特征矩阵对应的交互门矩阵与意图表示特征矩阵的克罗内克乘积之后,将该克罗内克乘积与意图表示特征矩阵相加后得到的矩阵,确定为意图表示特征矩阵对应的第一目标特征矩阵。
具体的,确定意图表示特征矩阵对应的第一目标特征矩阵,可以通过如下公式确定:
其中,为意图表示特征矩阵ri对应的第一目标特征矩阵;gintent为意图表示特征矩阵ri对应的交互门矩阵。
基于上述任一实施例,获取到意图表示特征矩阵对应的第一目标特征矩阵之后,为了降低确定的意图表示特征矩阵对应的第一目标特征矩阵的维度,加快确定目标意图的速度,以及保留意图表示特征矩阵对应的第一目标特征矩阵中的有效特征,对该意图表示特征矩阵对应的第一目标特征矩阵进行最大池化处理,以获取最大池化处理后的第一目标特征矩阵,即池化意图表示特征矩阵。
具体实施过程中,在获取到意图表示特征矩阵对应的第一目标特征矩阵后,先确定池化窗口的大小,以对该意图表示特征矩阵对应的第一目标特征矩阵进行最大池化处理,其中,该池化窗口的大小是根据待识别文本中包含的字符的数量确定的。具体的,按照上述确定的池化窗口大小,以步长为1,在该意图表示特征矩阵对应的第一目标特征矩阵上滑动,针对每次滑动,确定当次滑动该第一目标特征矩阵与该池化窗口重叠区域为池化区域,并获取该池化区域中最大的特征元素。根据每个池化区域中最大的特征元素的值,确定池化意图表示特征矩阵。
例如,在获取到维数为8*6的意图表示特征矩阵对应的第一目标特征矩阵后,获取待识别文本中包含的字符的数量,该待识别文本中字符的数量为8,则确定的池化窗口的大小为1*8。按照确定的池化窗口大小,以步长为1,在该意图表示特征矩阵对应的第一目标特征矩阵上滑动,针对每次滑动,确定当次滑动该第一目标特征矩阵与该池化窗口重叠的池化区域中最大的特征元素。假设通过在该第一目标特征矩阵上滑动池化窗口,确定的每个池化区域中最大的特征元素分别为0.7,5,1,0.6,-2,6。根据每个池化区域中最大的特征元素的值,确定池化意图表示特征矩阵具体为[0.7,5,1,0.6,-2,6]。
当池化意图表示特征矩阵后,将池化意图表示特征矩阵映射为候选意图向量,该候选意图向量中的每个向量元素对应一种候选意图。比如,假设有10种候选意图,池化意图表示特征矩阵的维度为1*128,将该池化意图表示特征矩阵映射为1*10的候选意图向量,该候选意图向量中的每个向量元素对应一种候选意图。
对获取到候选意图向量进行归一化处理,即对每种候选意图进行归一化处理,以获取待识别文本的意图为每种候选意图的概率,将概率最大对应的候选意图确定为待识别文本的目标意图。
其中,具体的对每种候选意图进行归一化处理的过程属于现有技术,在此不做具体限定。
基于上述任一实施例,为了进一步有效地将意图识别的特征信息与槽位填充的特征信息结合,在本发明实施例中,若所述第一特征矩阵为所述槽位表示特征矩阵,所述根据所述第一特征矩阵及所述第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵,包括:
根据所述槽位表示特征矩阵以及所述槽位表示特征矩阵对应的交互门矩阵的克罗内克乘积,确定所述槽位表示特征矩阵对应的第一目标特征矩阵。
一种可能的实施方式中,若第一特征矩阵为槽位表示特征矩阵,则当基于上述实施例中的方法获取到槽位表示特征矩阵对应的交互门矩阵之后,可以求取槽位表示特征矩阵与其对应的交互门矩阵的克罗内克乘积,将该克罗内克乘积确定为槽位表示特征矩阵对应的第一目标特征矩阵。
具体的确定槽位表示特征矩阵对应的第一目标特征矩阵,可以通过如下公式确定:
其中,为槽位表示特征矩阵rs对应的第一目标特征矩阵,gslot槽位表示特征矩阵rs对应的交互门矩阵。
在另一种可能的实施方式中,获取到槽位表示特征矩阵对应的交互门矩阵与槽位表示特征矩阵的克罗内克乘积之后,将该克罗内克乘积与槽位表示特征矩阵相加后得到的矩阵,确定为槽位表示特征矩阵对应的第一目标特征矩阵。
具体的,确定槽位表示特征矩阵对应的第一目标特征矩阵,可以通过如下公式确定:
其中,为槽位表示特征矩阵rs对应的第一目标特征矩阵,gslot槽位表示特征矩阵rs对应的交互门矩阵。
由于基于上述两种可能的实施方式获取的槽位表示特征矩阵对应的第一目标特征矩阵,该第一目标特征矩阵中的每个特征元素均结合了意图识别的特征信息,因此,根据该槽位表示特征矩阵对应的第一目标特征矩阵,确定待识别文本的目标槽位会更准确。具体的,根据预先保存的条件随机场,根据该槽位表示特征矩阵对应的第一目标特征矩阵,解码出待识别文本的目标槽位。
由于本发明实施例根据意图表示特征矩阵对应的交互门矩阵以及意图表示特征矩阵,确定的意图表示特征矩阵对应的第一目标特征矩阵更有利于后续的目标意图的确定,根据槽位表示特征矩阵对应的交互门以及槽位表示特征矩阵,确定的槽位表示特征矩阵对应的第一目标特征矩阵也更有利于后续的目标槽位的确定,从而帮助后续提高确定的目标意图和目标槽位的准确率。
实施例4:
为了准确获取到目标意图和目标槽位,在上述实施例的基础上,在本发明实施例中,上述确定待识别文本的目标槽位和目标意图的步骤可以是电子设备通过本地保存的联合识别模型确定的,即通过本地保存的联合识别模型,确定待识别文本的目标槽位和目标意图。具体的,通过本地保存的联合识别模型,确定待识别文本的目标槽位和目标意图,包括:
通过联合识别模型中的共享表示特征矩阵识别层,确定待识别文本的共享表示特征矩阵;
通过所述联合识别模型中的自注意力层,根据所述共享表示特征矩阵,分别确定所述待识别文本对应的意图表示特征矩阵和槽位表示特征矩阵;
通过所述联合识别模型中的交互网络层,确定第一特征矩阵对应的交互门矩阵,其中,所述第一特征矩阵包括所述意图表示特征矩阵,和/或所述槽位表示特征矩阵;根据所述第一特征矩阵及所述第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵;
通过所述联合识别模型中的输出层,根据所述第一目标特征矩阵,确定所述目标意图和所述目标槽位。
具体的通过本地保存的联合识别模型,确定待识别文本的目标槽位和目标意图的方法,与上述实施例中的语义识别的方法中的技术构思相同,在此不再赘述。
图3为本发明实施例提供的具体的确定待识别文本的目标意图和目标槽位流程示意图,具体包括:
首先,通过联合识别模型中的共享表示特征矩阵识别层的字符嵌入网络,确定输入的待识别文本中包含的每个字符的元素向量组合成的元素矩阵,假设该元素矩阵的维数为20*64。
然后,通过联合识别模型中的共享表示特征矩阵识别层的共享编码器,确定元素矩阵的共享表示特征矩阵。例如,输入的元素矩阵的维数为20*64,输出的共享表示特征矩阵的维数为20*128。
联合识别模型中自注意力层中,包含有意图特征识别网络和槽位特征识别网络,通过意图特征识别网络和槽位特征识别网络,分别获取共享表示特征矩阵对应的意图表示特征矩阵和槽位表示特征矩阵。
通过联合识别模型中的交互门网络层,确定第一特征矩阵对应的交互门矩阵,其中,该第一特征矩阵包括该意图表示特征矩阵和该槽位表示特征矩阵;根据该第一特征矩阵及该第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵。
最后,对于上述获取的意图表示特征矩阵对应的第一目标特征矩阵,通过联合识别模型中的输出层,先对将意图表示特征矩阵对应的第一目标特征矩阵进行最大池化处理,获取池化意图表示特征矩阵;然后将池化意图表示特征矩阵映射为每种候选意图,最后对每种候选意图进行归一化处理,获取每种候选意图的概率,将概率最大对应的候选意图确定为待识别文本的目标意图。
对于上述获取到的槽位表示特征矩阵对应的第一目标特征矩阵,通过联合识别模型中的输出层,根据该槽位表示特征矩阵对应的第一目标特征矩阵以及保存的条件随机场,解码出待识别文本的目标槽位。
其中,通过预先保存的条件随机场,可以对该第一目标特征矩阵中包含的每一行特征元素进行解码,解码出该行特征元素所对应的每个槽位;然后根据每行特征元素对应的每个槽位,确定待识别文本对应的每个槽位序列;最后对每个槽位序列进行打分,将分值最高的槽位序列作为目标槽位。
而为了通过联合识别模型,确定待识别文本的目标槽位和目标意图,在本发明实施例中,需要根据预先获取的样本集中的文本样本,对原始联合识别模型进行训练。其中,该样本集中的文本样本可以是针对某一领域中的文本,比如音乐领域、出行领域、视频领域等,也可以是所有领域中的文本。具体的,可以根据实际需求进行灵活设置,在此不做具体限定。
具体的,联合识别模型的训练过程如下:
获取样本集中的任一文本样本,其中,所述文本样本对应有意图标注以及槽位标注;
通过原始联合识别模型中的共享表示特征矩阵识别层,确定所述文本样本的样本共享表示特征矩阵;
通过所述原始联合识别模型中的自注意力层,根据所述样本共享表示特征矩阵,分别确定所述文本样本对应的样本意图表示特征矩阵和样本槽位表示特征矩阵;
通过所述原始联合识别模型中的交互网络层,确定样本特征矩阵对应的交互门矩阵,其中,所述样本特征矩阵包括所述样本意图表示特征矩阵,和/或所述样本槽位表示特征矩阵;根据所述样本特征矩阵及所述样本特征矩阵对应的交互门矩阵,确定目标样本特征矩阵;
通过所述原始联合识别模型中的输出层,根据所述目标样本特征矩阵,确定识别意图和识别槽位;
比对所述意图标注和所述识别意图,得到意图比对结果,并比对所述槽位标注和所述识别槽位,得到槽位比对结果,根据所述意图比对结果和所述槽位比对结果,对所述原始联合识别模型进行训练,得到所述联合识别模型。
在本发明实施例中,任一文本样本都有其对应的意图标注以及槽位标注,该意图标注用于标识每一文本样本的意图。例如,文本样本“明天飞往北京的机票价格”对应的意图标注为“查询价格”,槽位标注为“明天、北京、机票”,文本样本“订购一张明天飞往北京的机票”对应的意图标注为“订购机票”,槽位标注为“明天、北京”。
在具体实施中,原始联合识别模型中的参数均是随机初始化,比如,用于确定文本样本的共享表示特征矩阵的共享编码器的参数、确定文本样本对应的意图表示特征矩阵的意图特征识别网络中的参数、意图表示特征矩阵、槽位表示特征矩阵分别对应的权重矩阵的参数均是随机初始化的。任一文本样本通过该原始联合识别模型后,可以获得上述文本样本的识别意图以及识别槽位,根据意图标注、识别意图、槽位标注以及识别槽位,对原始联合识别模型进行训练,以调整原始联合识别模型中的各参数的参数值。
具体实施中,若样本特征矩阵仅包括样本意图表示特征矩阵,则通过原始联合识别模型中的交互网络层,确定样本意图表示特征矩阵对应的交互门矩阵;根据该样本意图表示特征矩阵及其对应的交互门矩阵,确定该目标样本特征矩阵即为样本意图特征矩阵。进一步地,后续原始联合识别模型的输出层,根据该样本意图特征矩阵确定待识别文本的目标意图,根据样本槽位表示特征矩阵,确定待识别文本的目标槽位。
具体实施中,若样本特征矩阵仅包括样本槽位表示特征矩阵,则通过原始联合识别模型中的交互网络层,确定样本槽位表示特征矩阵对应的交互门矩阵;根据该样本槽位表示特征矩阵及其对应的交互门矩阵,确定该目标样本特征矩阵即为样本槽位特征矩阵。进一步地,后续原始联合识别模型的输出层,根据该样本槽位特征矩阵确定待识别文本的目标槽位,根据样本意图表示特征矩阵,确定待识别文本的目标意图。
具体实施中,若样本特征矩阵包括样本意图表示特征矩阵和样本槽位表示特征矩阵,则通过原始联合识别模型中的交互网络层,确定样本意图表示特征矩阵和样本槽位表示特征矩阵分别对应的交互门矩阵;根据该样本意图表示特征矩阵及其对应的交互门矩阵,确定样本意图特征矩阵,根据样本槽位表示特征矩阵及其对应的交互门矩阵,确定样本槽位特征矩阵。进一步地,后续原始联合识别模型的输出层,根据该样本槽位特征矩阵确定待识别文本的目标槽位,根据样本意图特征矩阵,确定待识别文本的目标意图。
对原始联合识别模型训练的样本集中包含大量的文本样本,对每个文本样本都进行上述操作,当满足预设的收敛条件时,该原始联合识别模型训练完成。
其中,满足预设的收敛条件可以为样本集中的文本样本通过该原始联合识别模型训练后得到的识别意图与意图标注一致的文本样本个数大于设定第一数量,且识别槽位与槽位标注一致的文本样本个数大于设定第二数量,也可以为对原始联合识别模型进行训练的迭代次数达到设置的最大迭代次数等。具体实施中可以灵活进行设置,在此不做具体限定。
作为一种可能的实施方式,在进行联合识别模型训练时,可以把样本集中的文本样本分训练样本和测试样本,先基于训练样本对原始联合识别模型进行训练,再基于测试样本对上述已训练的联合识别模型的可靠程度进行验证。
图4为本发明实施例提供的语义识别方法实施流程示意图,包括模型训练、联合识别这2个部分,下面针对每个部分进行详细的说明:
第一部分模型训练包括如下步骤:
S401:根据样本集中的文本样本以及每个文本样本对应的意图标注和槽位标注,对原始联合识别模型进行训练。
在进行联合识别模型训练的过程中,一般采用离线的方式,预先通过第一服务器对样本集中的文本样本进行训练,以获得训练完成的联合识别模型。
第二部分是联合识别,该过程可以是离线方式,也可以是在线方式。第二服务器基于上述训练完成的联合识别模型,进行语义识别,具体包括如下步骤:
S402:获取待识别文本。
S403:通过联合识别模型,确定待识别文本的目标意图和目标槽位。
S404:根据该目标意图和该目标槽位,确定该待识别文本的语义识别结果。
当然,语义识别也可以在第一服务器中完成,本实施例中不对语义识别的执行主体进行限定。
实施例5:图5为本发明实施例提供的一种语义识别装置结果示意图,该装置包括:
第一确定模块51,用于确定待识别文本的共享表示特征矩阵;
第二确定模块52,用于根据所述共享表示特征矩阵,分别确定所述待识别文本对应的意图表示特征矩阵和槽位表示特征矩阵;
第一处理模块53,用于确定第一特征矩阵对应的交互门矩阵,其中,所述第一特征矩阵包括所述意图表示特征矩阵,和/或所述槽位表示特征矩阵;
第三确定模块54,用于根据所述第一特征矩阵及所述第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵;
第二处理模块55,用于根据所述第一目标特征矩阵,确定目标意图和目标槽位;
语义确定模块56,用于根据所述目标意图和所述目标槽位,确定所述待识别文本的语义识别结果。
在一种可能的实施方式中,所述第一处理模块53,具体用于:若所述第一特征矩阵包括所述意图表示特征矩阵和所述槽位表示特征矩阵,基于所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定所述意图表示特征矩阵和所述槽位表示特征矩阵分别对应的交互门矩阵。
在一种可能的实施方式中,第一处理模块53具体用于:根据所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定子矩阵;根据所述子矩阵以及预设的第一归一化函数,确定所述交互门矩阵。
在一种可能的实施方式中,第一处理模块53具体用于:根据所述子矩阵、预设的第一归一化函数及预设的参数调整矩阵,确定所述交互门矩阵。
在一种可能的实施方式中,所述第一处理模块53,具体用于:
根据所述意图表示特征矩阵中包含的每个意图特征向量,确定平均意图特征向量,其中,所述每个意图特征向量对应所述待识别文本中包含的一个字符;根据所述平均意图特征向量、以及对应的权重向量,确定加权后的平均意图特征向量;并根据所述槽位表示特征矩阵以及对应的第一权重矩阵,确定第一槽位矩阵;根据所述第一槽位矩阵中的每个子槽位特征向量与所述加权后的平均意图特征向量,确定第二槽位矩阵,其中,所述每个子槽位特征向量对应所述待识别文本中包含的一个字符;根据所述第二槽位矩阵及预设的第二归一化函数,确定所述槽位表示特征矩阵对应的交互门矩阵;根据所述意图表示特征矩阵以及所述意图表示特征矩阵对应的第二权重矩阵、和所述槽位表示特征矩阵以及所述槽位表示特征矩阵对应的第三权重矩阵,确定意图矩阵;根据所述意图矩阵及预设的第二归一化函数,确定所述意图表示特征矩阵对应的交互门矩阵。
在一种可能的实施方式中,所述第三确定模块54,具体用于:
若所述第一特征矩阵为所述意图表示特征矩阵,根据所述意图表示特征矩阵以及所述意图表示特征矩阵对应的交互门矩阵的克罗内克乘积,确定所述意图表示特征矩阵对应的第一目标特征矩阵。
在一种可能的实施方式中,所述第三确定模块54,具体用于:
若所述第一特征矩阵为所述意图表示特征矩阵,根据所述意图表示特征矩阵以及所述意图表示特征矩阵对应的交互门矩阵的克罗内克乘积,确定所述意图表示特征矩阵对应的第一目标特征矩阵。
由于本发明实施例中在确定待识别文本的语义识别结果的过程中,确定了第一特征矩阵对应的交互门矩阵,其中,该第一特征矩阵包括意图表示特征矩阵,和/或槽位表示特征矩阵,并基于该第一特征矩阵对应的交互门矩阵,来确定相互关联的目标意图和目标槽位,从而提高了确定的目标意图,和/或目标槽位的准确率,有利于准确地确定待识别文本的语义识别结果。
实施例7:如图6为本发明实施例提供的一种电子设备结构示意图,在上述各实施例的基础上,本发明实施例还提供了一种电子设备,如图6所示,包括:处理器61、通信接口62、存储器63和通信总线64,其中,处理器61,通信接口62,存储器63通过通信总线64完成相互间的通信;
所述存储器63中存储有计算机程序,当所述程序被所述处理器61执行时,使得所述处理器61执行如下步骤:
确定待识别文本的共享表示特征矩阵;根据所述共享表示特征矩阵,分别确定所述待识别文本对应的意图表示特征矩阵和槽位表示特征矩阵;确定第一特征矩阵对应的交互门矩阵,其中,所述第一特征矩阵包括意图表示特征矩阵,和/或槽位表示特征矩阵;根据所述第一特征矩阵及所述第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵;根据所述第一目标特征矩阵,确定目标意图和目标槽位;根据所述目标意图和所述目标槽位,确定所述待识别文本的语义识别结果。
在一种可能的实施方式中,所述处理器61,具体用于:若所述第一特征矩阵包括所述意图表示特征矩阵和所述槽位表示特征矩阵,基于所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定所述意图表示特征矩阵和所述槽位表示特征矩阵分别对应的交互门矩阵。
在一种可能的实施方式中,所述处理器61,具体用于:根据所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定子矩阵;以及根据所述子矩阵以及预设的第一归一化函数,确定所述交互门矩阵。
在一种可能的实施方式中,所述处理器61,具体用于:根据所述子矩阵、所述预设的第一归一化函数以及预设的参数调整矩阵,确定所述交互门矩阵。
在一种可能的实施方式中,所述处理器61,具体用于:
根据所述意图表示特征矩阵中包含的每个意图特征向量,确定平均意图特征向量,其中,每个意图特征向量对应所述待识别文本中包含的一个字符;根据所述平均意图特征向量、以及对应的权重向量,确定加权后的平均意图特征向量;并根据所述槽位表示特征矩阵以及对应的第一权重矩阵,确定第一槽位矩阵;根据所述第一槽位矩阵中的每个子槽位特征向量与所述加权后的平均意图特征向量,确定第二槽位矩阵,其中,所述每个子槽位特征向量对应所述待识别文本中包含的一个字符;根据所述第二槽位矩阵及预设的第二归一化函数,确定所述槽位表示特征矩阵对应的交互门矩阵;根据所述意图表示特征矩阵以及所述意图表示特征矩阵对应的第二权重矩阵、和所述槽位表示特征矩阵以及所述槽位表示特征矩阵对应的第三权重矩阵,确定意图矩阵;根据所述意图矩阵及预设的第二归一化函数,确定所述意图表示特征矩阵对应的交互门矩阵。
在一种可能的实施方式中,所述处理器61,具体用于:
若所述第一特征矩阵为所述意图表示特征矩阵,根据所述意图表示特征矩阵以及所述意图表示特征矩阵对应的交互门矩阵的克罗内克乘积,确定所述意图表示特征矩阵对应的第一目标特征矩阵。
在一种可能的实施方式中,所述处理器61,具体用于:
若所述第一特征矩阵为所述意图表示特征矩阵,根据所述意图表示特征矩阵以及所述意图表示特征矩阵对应的交互门矩阵的克罗内克乘积,确定所述意图表示特征矩阵对应的第一目标特征矩阵。
由于上述电子设备解决问题的原理与语义识别方法相似,因此上述电子设备的实施可以参见方法的实施,重复之处不再赘述。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口62用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括中央处理器、网络处理器(NetworkProcessor,NP)等;还可以是数字指令处理器(Digital Signal Processing,DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
由于本发明实施例中在确定待识别文本的语义识别结果的过程中,确定了第一特征矩阵对应的交互门矩阵,其中,该第一特征矩阵包括意图表示特征矩阵,和/或槽位表示特征矩阵,并基于该第一特征矩阵对应的交互门矩阵,来确定相互关联的目标意图和目标槽位,从而提高了确定的目标意图,和/或目标槽位的准确率,有利于准确地确定待识别文本的语义识别结果。
实施例8:在上述各实施例的基础上,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有可由处理器执行的计算机程序,当所述程序在所述处理器上运行时,使得所述处理器执行时实现如下步骤:
确定待识别文本的共享表示特征矩阵;根据所述共享表示特征矩阵,分别确定所述待识别文本对应的意图表示特征矩阵和槽位表示特征矩阵;确定第一特征矩阵对应的交互门矩阵,其中,所述第一特征矩阵包括意图表示特征矩阵,和/或槽位表示特征矩阵;根据所述第一特征矩阵及所述第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵;根据所述第一目标特征矩阵,确定目标意图和目标槽位;根据所述目标意图和所述目标槽位,确定所述待识别文本的语义识别结果。
在一种可能的实施方式中,若所述第一特征矩阵包括意图表示特征矩阵和槽位表示特征矩阵,确定第一特征矩阵对应的交互门矩阵,包括:基于所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定所述意图表示特征矩阵和所述槽位表示特征矩阵分别对应的交互门矩阵。
在一种可能的实施方式中,所述基于所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定所述意图表示特征矩阵和所述槽位表示特征矩阵分别对应的交互门矩阵,包括:根据所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定子矩阵;以及根据所述子矩阵以及预设的第一归一化函数,确定所述交互门矩阵。
在一种可能的实施方式中,所述根据所述子矩阵以及预设的第一归一化函数,确定所述交互门矩阵,包括:根据所述子矩阵、所述预设的第一归一化函数以及预设的参数调整矩阵,确定所述交互门矩阵。
在一种可能的实施方式中,所述基于所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定所述意图表示特征矩阵和所述槽位表示特征矩阵分别对应的交互门矩阵,包括:
根据所述意图表示特征矩阵中包含的每个意图特征向量,确定平均意图特征向量,其中,所述每个意图特征向量对应所述待识别文本中包含的一个字符;根据所述平均意图特征向量、以及对应的权重向量,确定加权后的平均意图特征向量;并根据所述槽位表示特征矩阵以及对应的第一权重矩阵,确定第一槽位矩阵;根据所述第一槽位矩阵中的每个子槽位特征向量与所述加权后的平均意图特征向量,确定第二槽位矩阵,其中,所述每个子槽位特征向量对应所述待识别文本中包含的一个字符;根据所述第二槽位矩阵及预设的第二归一化函数,确定所述槽位表示特征矩阵对应的交互门矩阵;
根据所述意图表示特征矩阵以及所述意图表示特征矩阵对应的第二权重矩阵、和所述槽位表示特征矩阵以及所述槽位表示特征矩阵对应的第三权重矩阵,确定意图矩阵;根据所述意图矩阵及预设的第二归一化函数,确定所述意图表示特征矩阵对应的交互门矩阵。
在一种可能的实施方式中,若第一特征矩阵为意图表示特征矩阵,根据所述第一特征矩阵及所述第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵,包括:根据所述意图表示特征矩阵以及所述意图表示特征矩阵对应的交互门矩阵的克罗内克乘积,确定所述意图表示特征矩阵对应的第一目标特征矩阵。
在一种可能的实施方式中,若第一特征矩阵为槽位表示特征矩阵,根据所述第一特征矩阵及所述第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵,包括:根据所述槽位表示特征矩阵以及所述槽位表示特征矩阵对应的交互门矩阵的克罗内克乘积,确定所述槽位表示特征矩阵对应的第一目标特征矩阵。
上述计算机可读存储介质可以是电子设备中的处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器如软盘、硬盘、磁带、磁光盘(MO)等、光学存储器如CD、DVD、BD、HVD等、以及半导体存储器如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD)等。
由于本发明实施例中在确定待识别文本的语义识别结果的过程中,确定了第一特征矩阵对应的交互门矩阵,其中,该第一特征矩阵包括意图表示特征矩阵,和/或槽位表示特征矩阵,并基于该第一特征矩阵对应的交互门矩阵,来确定相互关联的目标意图和目标槽位,从而提高了确定的目标意图,和/或目标槽位的准确率,有利于准确地确定待识别文本的语义识别结果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (8)
1.一种语义识别方法,其特征在于,所述方法包括:
确定待识别文本的共享表示特征矩阵;
根据所述共享表示特征矩阵,分别确定所述待识别文本对应的意图表示特征矩阵和槽位表示特征矩阵;
确定第一特征矩阵对应的交互门矩阵,其中,所述第一特征矩阵包括所述意图表示特征矩阵,和/或所述槽位表示特征矩阵;
根据所述第一特征矩阵及所述第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵;
根据所述第一目标特征矩阵,确定目标意图和目标槽位;
根据所述目标意图和所述目标槽位,确定所述待识别文本的语义识别结果;
其中,若所述第一特征矩阵包括所述意图表示特征矩阵和所述槽位表示特征矩阵,所述确定第一特征矩阵对应的交互门矩阵,包括:
基于所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定所述意图表示特征矩阵和所述槽位表示特征矩阵分别对应的交互门矩阵;
其中,所述基于所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定所述意图表示特征矩阵和所述槽位表示特征矩阵分别对应的交互门矩阵,包括:
根据所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定子矩阵;以及根据所述子矩阵以及预设的归一化函数,确定所述交互门矩阵。
2.根据权利要求1所述的方法,其特征在于,所述根据所述子矩阵以及预设的归一化函数,确定所述交互门矩阵,包括:
根据所述子矩阵、所述预设的归一化函数以及预设的参数调整矩阵,确定所述交互门矩阵。
3.根据权利要求1所述的方法,其特征在于,所述根据所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定子矩阵;以及根据所述子矩阵以及预设的归一化函数,确定所述交互门矩阵,包括:
根据所述意图表示特征矩阵中包含的每个意图特征向量,确定平均意图特征向量,其中,所述每个意图特征向量对应所述待识别文本中包含的一个字符;根据所述平均意图特征向量、以及对应的权重向量,确定加权后的平均意图特征向量;并根据所述槽位表示特征矩阵以及对应的第一权重矩阵,确定第一槽位矩阵;根据所述第一槽位矩阵中的每个子槽位特征向量与所述加权后的平均意图特征向量,确定第二槽位矩阵,其中,所述每个子槽位特征向量对应所述待识别文本中包含的一个字符;根据所述第二槽位矩阵及预设的归一化函数,确定所述槽位表示特征矩阵对应的交互门矩阵;
根据所述意图表示特征矩阵以及所述意图表示特征矩阵对应的第二权重矩阵、和所述槽位表示特征矩阵以及所述槽位表示特征矩阵对应的第三权重矩阵,确定意图矩阵;根据所述意图矩阵及预设的归一化函数,确定所述意图表示特征矩阵对应的交互门矩阵。
4.根据权利要求1所述的方法,其特征在于,若所述第一特征矩阵为所述意图表示特征矩阵,所述根据所述第一特征矩阵及所述第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵,包括:
根据所述意图表示特征矩阵以及所述意图表示特征矩阵对应的交互门矩阵的克罗内克乘积,确定所述意图表示特征矩阵对应的第一目标特征矩阵。
5.根据权利要求1所述的方法,其特征在于,若所述第一特征矩阵为所述槽位表示特征矩阵,所述根据所述第一特征矩阵及所述第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵,包括:
根据所述槽位表示特征矩阵以及所述槽位表示特征矩阵对应的交互门矩阵的克罗内克乘积,确定所述槽位表示特征矩阵对应的第一目标特征矩阵。
6.一种语义识别装置,其特征在于,所述装置包括:
第一确定模块,用于确定待识别文本的共享表示特征矩阵;
第二确定模块,用于根据所述共享表示特征矩阵,分别确定所述待识别文本对应的意图表示特征矩阵和槽位表示特征矩阵;
第一处理模块,用于确定第一特征矩阵对应的交互门矩阵,其中,所述第一特征矩阵包括所述意图表示特征矩阵,和/或所述槽位表示特征矩阵;
第三确定模块,用于根据所述第一特征矩阵及所述第一特征矩阵对应的交互门矩阵,确定第一目标特征矩阵;
第二处理模块,用于根据所述第一目标特征矩阵,确定目标意图和目标槽位;
语义确定模块,用于根据所述目标意图和所述目标槽位,确定所述待识别文本的语义识别结果;
所述第一处理模块,具体用于若所述第一特征矩阵包括所述意图表示特征矩阵和所述槽位表示特征矩阵,基于所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定所述意图表示特征矩阵和所述槽位表示特征矩阵分别对应的交互门矩阵;
所述第一处理模块,具体用于根据所述意图表示特征矩阵、所述槽位表示特征矩阵及其分别对应的权重矩阵,确定子矩阵;根据所述子矩阵以及预设的归一化函数,确定所述交互门矩阵。
7.一种电子设备,其特征在于,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5中任一所述语义识别方法的步骤。
8.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5中任一所述语义识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010525122.8A CN113779975B (zh) | 2020-06-10 | 2020-06-10 | 一种语义识别方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010525122.8A CN113779975B (zh) | 2020-06-10 | 2020-06-10 | 一种语义识别方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113779975A CN113779975A (zh) | 2021-12-10 |
CN113779975B true CN113779975B (zh) | 2024-03-01 |
Family
ID=78834818
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010525122.8A Active CN113779975B (zh) | 2020-06-10 | 2020-06-10 | 一种语义识别方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113779975B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019084810A1 (zh) * | 2017-10-31 | 2019-05-09 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及终端、计算机存储介质 |
CN109785833A (zh) * | 2019-01-02 | 2019-05-21 | 苏宁易购集团股份有限公司 | 用于智能设备的人机交互语音识别方法及*** |
CN109949805A (zh) * | 2019-02-21 | 2019-06-28 | 江苏苏宁银行股份有限公司 | 基于意图识别及有限状态自动机的智能催收机器人及催收方法 |
CN110309514A (zh) * | 2019-07-09 | 2019-10-08 | 北京金山数字娱乐科技有限公司 | 一种语义识别方法及装置 |
WO2019210820A1 (zh) * | 2018-05-03 | 2019-11-07 | 华为技术有限公司 | 一种信息输出方法及装置 |
CN110532355A (zh) * | 2019-08-27 | 2019-12-03 | 华侨大学 | 一种基于多任务学习的意图与槽位联合识别方法 |
CN110853626A (zh) * | 2019-10-21 | 2020-02-28 | 成都信息工程大学 | 基于双向注意力神经网络的对话理解方法、装置及设备 |
CN111104495A (zh) * | 2019-11-19 | 2020-05-05 | 深圳追一科技有限公司 | 基于意图识别的信息交互方法、装置、设备和存储介质 |
-
2020
- 2020-06-10 CN CN202010525122.8A patent/CN113779975B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019084810A1 (zh) * | 2017-10-31 | 2019-05-09 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及终端、计算机存储介质 |
WO2019210820A1 (zh) * | 2018-05-03 | 2019-11-07 | 华为技术有限公司 | 一种信息输出方法及装置 |
CN109785833A (zh) * | 2019-01-02 | 2019-05-21 | 苏宁易购集团股份有限公司 | 用于智能设备的人机交互语音识别方法及*** |
CN109949805A (zh) * | 2019-02-21 | 2019-06-28 | 江苏苏宁银行股份有限公司 | 基于意图识别及有限状态自动机的智能催收机器人及催收方法 |
CN110309514A (zh) * | 2019-07-09 | 2019-10-08 | 北京金山数字娱乐科技有限公司 | 一种语义识别方法及装置 |
CN110532355A (zh) * | 2019-08-27 | 2019-12-03 | 华侨大学 | 一种基于多任务学习的意图与槽位联合识别方法 |
CN110853626A (zh) * | 2019-10-21 | 2020-02-28 | 成都信息工程大学 | 基于双向注意力神经网络的对话理解方法、装置及设备 |
CN111104495A (zh) * | 2019-11-19 | 2020-05-05 | 深圳追一科技有限公司 | 基于意图识别的信息交互方法、装置、设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
Slot-Gated Modeling for Joint Slot Filling and Intent Prediction;Chih-Wen Goo等;《Association for Computational Linguistics》;753-757 * |
基于深度学习的领域问答***的设计与实现;胡婕等;《成都信息工程大学学报》;第34卷(第3期);232-237 * |
Also Published As
Publication number | Publication date |
---|---|
CN113779975A (zh) | 2021-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108846077B (zh) | 问答文本的语义匹配方法、装置、介质及电子设备 | |
WO2021114840A1 (zh) | 基于语义分析的评分方法、装置、终端设备及存储介质 | |
CN113220839B (zh) | 一种意图识别方法、电子设备及计算机可读存储介质 | |
CN111739520B (zh) | 一种语音识别模型训练方法、语音识别方法、装置 | |
CN114254660A (zh) | 多模态翻译方法、装置、电子设备及计算机可读存储介质 | |
JP2020004382A (ja) | 音声対話方法及び装置 | |
CN113326702B (zh) | 语义识别方法、装置、电子设备及存储介质 | |
CN111737990B (zh) | 一种词槽填充方法、装置、设备及存储介质 | |
CN111339308B (zh) | 基础分类模型的训练方法、装置和电子设备 | |
CN113239702A (zh) | 意图识别方法、装置、电子设备 | |
CN112329454A (zh) | 语种识别方法、装置、电子设备及可读存储介质 | |
CN114360502A (zh) | 语音识别模型的处理方法、语音识别方法及装置 | |
CN113609819B (zh) | 标点符号确定模型及确定方法 | |
CN112084301A (zh) | 文本修正模型的训练方法及装置、文本修正方法及装置 | |
CN113220828B (zh) | 意图识别模型处理方法、装置、计算机设备及存储介质 | |
CN112183513B (zh) | 一种图像中文字的识别方法、装置、电子设备及存储介质 | |
CN113051384A (zh) | 基于对话的用户画像抽取方法及相关装置 | |
CN112133291B (zh) | 一种语种识别模型训练、语种识别的方法和相关装置 | |
CN113779975B (zh) | 一种语义识别方法、装置、设备及介质 | |
CN110210035B (zh) | 序列标注方法、装置及序列标注模型的训练方法 | |
CN116844573A (zh) | 基于人工智能的语音情感识别方法、装置、设备及介质 | |
CN116151236A (zh) | 文本处理模型的训练方法、文本处理方法及相关设备 | |
CN111401069A (zh) | 会话文本的意图识别方法、意图识别装置及终端 | |
CN117830790A (zh) | 多任务模型的训练方法、多任务处理方法及装置 | |
CN114566156A (zh) | 一种关键词的语音识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |