CN112732882A - 用户意图识别方法、装置、设备及计算机可读存储介质 - Google Patents
用户意图识别方法、装置、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN112732882A CN112732882A CN202011631344.4A CN202011631344A CN112732882A CN 112732882 A CN112732882 A CN 112732882A CN 202011631344 A CN202011631344 A CN 202011631344A CN 112732882 A CN112732882 A CN 112732882A
- Authority
- CN
- China
- Prior art keywords
- intention
- preset
- node
- label
- success rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Abstract
本申请涉及智能决策技术领域,提供一种用户意图识别方法、装置、设备及计算机可读存储介质,该方法包括:获取用户输入的语音数据对应的文本信息,并将文本信息输入至预设意图分类模型,得到用于表示语音意图的多个预设意图标签的输出概率;然后根据每个预设意图标签的输出概率,从多个预设意图标签中确定预设数量个候选意图标签;之后确定预设意图知识图谱中的每个意图节点的对话成功率;再根据每个意图节点的对话成功率确定每个候选意图标签的对话成功率;并将对话成功率最高的候选意图标签确定为用户输入的语音数据的意图标签。本方法通过预设意图分类模型结合预设意图知识图谱中的每个意图节点的对话成功率,能够确定用户的目标意图标签。
Description
技术领域
本申请涉及智能决策技术领域,尤其涉及一种用户意图识别方法、装置、设备及计算机可读存储介质。
背景技术
对话***是是一种基于自然语言的人机交互***,意图识别是人机交互***的重要部分,它将用户对话的内容转化成计算机可以理解的方式,识别的意图会直接影响到机器人下一句说的内容是否和用户表达的相关,是否让客户满意。其中,意图识别主要包括两个部分:意图检测和提取语义槽。传统上做意图识别的方法从隐形马尔科夫模型(HiddenMarkov Model,HMM)、条件随机场(conditional random fields,CRF)、支持向量机(Support Vector Machine,SVM),而到近十年比较流行的卷积神经网络和循环神经网络,都有不错的实验结果。但是,这些模型只能在较少的上下文输入和大规模训练语料上才能得到比较好的效果。而且,传统的意图识别是通过分类器选择概率最大的那个意图作为最终意图,这样的结果在实际应用场景中,会因为偶尔的语音识别错误导致一些意图的识别错误,因此,如何根据用户的语音数据,准确的确定用户的目标意图是目前亟待解决的问题。
发明内容
本申请的主要目的在于提供一种用户意图识别方法、装置、设备及计算机可读存储介质,旨在准确的确定用户输入的语音数据的意图。
第一方面,本申请提供一种用户意图识别方法,包括:
获取用户输入的语音数据对应的文本信息,并将所述文本信息输入至预设意图分类模型,得到用于表示语音意图的多个预设意图标签的输出概率;
根据每个所述预设意图标签的输出概率,从多个所述预设意图标签中确定预设数量个候选意图标签;
确定预设意图知识图谱中的每个意图节点的对话成功率,其中,所述预设意图知识图谱是根据历史对话数据生成的;
根据每个所述意图节点的对话成功率确定每个所述候选意图标签的对话成功率;
将对话成功率最高的候选意图标签确定为所述用户输入的语音数据的意图标签。
第二方面,本申请还提供一种用户意图识别装置,所述用户意图识别装置包括获取模块、生成模块、筛选模块、第一确定模块、第二确定模块和第三确定模块,其中:
所述获取模块,用于获取用户输入的语音数据对应的文本信息;
所述生成模块,用于将所述文本信息输入至预设意图分类模型,得到用于表示语音意图的多个预设意图标签的输出概率;
所述筛选模块,用于根据每个所述预设意图标签的输出概率,从多个所述预设意图标签中确定预设数量个候选意图标签;
所述第一确定模块,用于确定预设意图知识图谱中的每个意图节点的对话成功率,其中,所述预设意图知识图谱是根据历史对话数据生成的;
所述第二确定模块,用于根据每个所述意图节点的对话成功率确定每个所述候选意图标签的对话成功率;
所述第三确定模块,用于将对话成功率最高的候选意图标签确定为所述用户输入的语音数据的意图标签。
第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的用户意图识别方法的步骤。
第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的用户意图识别方法的步骤。
本申请提供一种用户意图识别方法、装置、设备及计算机可读存储介质,本申请通过获取用户输入的语音数据对应的文本信息,并将文本信息输入至预设意图分类模型,得到用于表示语音意图的多个预设意图标签的输出概率;然后根据每个预设意图标签的输出概率,从多个预设意图标签中确定预设数量个候选意图标签;之后确定预设意图知识图谱中的每个意图节点的对话成功率;再根据每个意图节点的对话成功率确定每个候选意图标签的对话成功率;并将对话成功率最高的候选意图标签确定为用户输入的语音数据的意图标签。本方法通过预设意图分类模型可以得到多个预设意图标签的输出概率,结合多个预设意图标签的输出概率和预设意图知识图谱中的每个意图节点的对话成功率,可以准确的确定用户的目标意图标签。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种用户意图识别方法的步骤流程示意图;
图2为本申请实施例提供的预设意图分类模型的一示意性框图;
图3为图1中的用户意图识别方法的子步骤流程示意图;
图4为本申请实施例提供的预设意图知识图谱的一场景示意图;
图5为本申请实施例提供的一种用户意图识别装置的示意性框图;
图6为图5中的用户意图识别装置的子模块的示意性框图;
图7为本申请实施例提供的一种计算机设备的结构示意性框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本申请实施例提供一种用户意图识别方法、装置、设备及计算机可读存储介质。其中,该用户意图识别方法可应用于终端设备中,该终端设备可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参照图1,图1为本申请实施例提供的一种用户意图识别方法的步骤流程示意图。
如图1所示,该用户意图识别方法包括步骤S101至步骤S105。
步骤S101、获取用户输入的语音数据对应的文本信息,并将所述文本信息输入至预设意图分类模型,得到用于表示语音意图的多个预设意图标签的输出概率。
其中,预设意图分类模型为预先训练好的模型,该预设意图分类模型包括多个神经网络层,该神经网络层至少包括以下至少一种:向量提取层、时延神经网络层、ReLU层、残差网络层、加和层、循环神经网络层、dropout层和Solfmaxlayer层。
具体地,如图2所示,获取用户的用户输入的语音数据对应的文本信息,将该文本信息输入至向量提取层,得到多个词向量,将多个词向量输入至时延神经网络层,提取到多个词向量特征,将多个词向量特征输入至ReLU层,以对多个词向量特征进行处理,减少词向量特征的梯度消失,得到语义标签向量,将该语义标签向量和多个词向量输入至加和层,得到多个初步意图标签向量,将多个该初步意图标签向量输入至循环神经网络层,得到多个候选意图标签向量,将多个候选意图标签向量输入至dropout层,得到多个预设意图标签向量,将多个意图标签向量输入至Solfmaxlayer层,得到预设意图标签的输出概率。
需要说明的是,向量提取层可以根据实际情况进行选择,例如,该向量提取层为Word2Vec模型,时延神经网络层和ReLU层还包括残差网络层,该残差网络层使时延神经网络层和ReLU层的参数处理更加准确,通过该dropout层可以防止候选意图标签向量过拟合化,提高输出的意图标签向量的准确性。
其中,该预设意图分类模型的训练方式可以为:获取样本文本信息,根据预设意图标签的输出概率对应的类别标识对该样本文本信息进行标注,以构建样本数据,基于该样本数据对神经网络模型进行迭代训练,直到神经网络模式收敛,从而得到该预设意图分类模型。上述神经网络模型包括卷积神经网络模型、循环神经网络模型和循环卷积神经网络模型,当然也可以采用其他网络模型训练得到预设意图分类模型,本申请对此不作具体限定。
在一实施例中,获取用户输入的语音数据对应的文本信息,并将该文本信息输入至预设意图分类模型,得到多个预设意图标签的输出概率。通过该预设意图分类模型准确且快速的确定多个预设意图标签的输出概率,极大地提高了用户的使用体验。
在一实施例中,获取用户输入的语音数据对应的文本信息的方式为:获取用户输入的语音,并将该语音输入至预设语音识别模型,得到文本信息。其中,该预设语音识别模型为预先训练好的神经网络模型,本申请对此不做具体限定。在另一些实施例中,获取其他设备传输的语音数据对应的文本信息,得到用户输入的语音数据对应的文本信息。可以理解的是,还有其他获取用户数据语音数据对应的文本信息的方式,本申请对此不做具体限定。
步骤S102、根据每个所述预设意图标签的输出概率,从多个所述预设意图标签中确定预设数量个候选意图标签。
其中,候选意图标签为意图越接近用户意图的意图标签。
在一实施例中,对多个所述预设意图标签按照输出概率的从大到小进行排序,得到意图标签队列;依次从所述意图标签队列选择所述预设意图标签,直至得到预设数量个所述候选意图标签。其中,预设意图标签可以根据实际情况进行设置,本申请对此不做具体限定,例如,预设意图标签可以设置为5。通过排列预设意图标签的意图标签队列,然后根据概率大小进行选择候选意图标签,可以提高选择候选意图标签的准确度和效率。
示例性的,预设意图标签1的输出概率为10%、预设意图标签2的输出概率为20%、预设意图标签3的输出概率为5%、预设意图标签4的输出概率为12%、预设意图标签5的输出概率为7%、预设意图标签6的输出概率为18%、预设意图标签7的输出概率为25%、预设意图标签8的输出概率为14%、预设意图标签9的输出概率为4%和预设意图标签10的输出概率为28%,根据每个预设意图标签的概率对该10个意图标签从大到小依次进行排序,得到意图标签队列为[预设意图标签10、预设意图标签7、预设意图标签2、预设意图标签6、预设意图标签8、预设意图标签4、预设意图标签1、预设意图标签5、预设意图标签3、预设意图标签9],获取预设意图标签的数量为5,从该意图标签队列中选择前5个候选意图标签,得到候选意图标签为预设意图标签10、预设意图标签7、预设意图标签2、预设意图标签6和预设意图标签8。通过对预设意图标签进行排序,可以快速的选出候选意图标签。
步骤S103、确定预设意图知识图谱中的每个意图节点的对话成功率,其中,所述预设意图知识图谱是根据历史对话数据生成的。
其中,预设意图知识图谱是根据历史对话数据生成的,具体地,收集所有的历史对话数据,对历史对话数据进行分类,以及将相关联的对话数据进行关联,得到预设意图知识图谱。
在一实施例中,获取预设意图知识图谱,其中,该预设意图知识图谱是根据历史对话数据生成的;将所述预设意图知识图谱中与每个意图节点相对应的意图节点的成功率作为每个意图节点的对话成功率。通过预设意图知识图谱可以准确的确定每个意图节点的对话成功率。
在一实施例中,如图3所示,步骤S103包括子步骤S1031至子步骤S1034。
子步骤S1031、从所述预设意图知识图谱中获取每个意图节点的多个流转路径,并统计所述多个流转路径的数量,其中,每个流转路径包括多个意图节点。
其中,每个流转路径包括多个意图节点。
示例性的,如图4所示,该预设意图知识图谱包括意图节点a、意图节点b、意图节点c、意图节点d、意图节点e、意图节点f和意图节点g,意图节点a的流转路径包括意图节点a连接意图节点b连接意图节点c的流转路径、意图节点a连接意图节点b连接意图节点e连接意图节点f的流转路径、意图节点a连接意图节点b连接意图节点e连接意图节点a的流转路径、意图节点a连接意图节点b连接意图节点e连接意图节点g的流转路径、意图节点a连接意图节点b连接意图节点e连接意图节点f的流转路径和意图节点a连接意图节点d连接意图节点g流转路径,意图节点b的流转路径包括意图节点b连接意图节点c的流转路径、意图节点b连接意图节点e连接意图节点f的流转路径、意图节点b连接意图节点e连接意图节点g的流转路径和意图节点b连接意图节点e连接意图节点a的流转路径,意图节点e的流转路径包括意图节点e连接意图节点a的流转路径、意图节点e连接意图节点f的流转路径和意图节点e连接意图节点g的流转路径,意图节点d的流转路径包括意图节点连接意图节点g的流转路径,意图节点c和意图节点f没有流转路径。
示例性的,如图4所示,意图节点a的流转路径的路径条数为5条,意图节点b的流转路径的路径条数为4条,意图节点c的流转路径的路径条数为0条,意图节点d的流转路径的路径条数为1条,意图节点e的流转路径的路径条数为3条,意图节点f的流转路径的路径条数为0条,意图节点g的流转路径的路径条数为0条。
子步骤S1032、将最后一个意图节点的属性标识为预设属性标识的流转路径确定为流转成功路径。
其中,意图节点的属性标识为根据实际情况设置的关键词,例如,时间,地点和事件等等关键词。
在一实施例中,将流转路径中最后一个意图节点的属性为为预设属性标识的流转路径确定为流转成功路径。例如,预设属性标识为时间,若流转路径中最后一个意图节点为时间的流转路径,则该流转路径为流转成功路径。
子步骤S1033、统计每个所述意图节点的多个流转路径中的流转成功路径的数量。
具体地,根据预设意图知识图谱确定每个意图节点的多个流转路径的路径条数。
示例性的,如图4所示,当意图节点的预设属性标识为g时,从预设意图知识图谱中查询每个意图节点的多个流转路径中的最后一个意图节点的属性标识为g的数量,其中,意图节点a多个流转路径中的最后一个意图节点的属性标识为g的数量为2,意图节点b多个流转路径中的最后一个意图节点的属性标识为g的数量为1,意图节点c多个流转路径中的最后一个意图节点的属性标识为g的数量为0,意图节点d多个流转路径中的最后一个意图节点的属性标识为g的数量为1,意图节点e多个流转路径中的最后一个意图节点的属性标识为g的数量为1,意图节点f多个流转路径中的最后一个意图节点的属性标识为g的数量为0,意图节点g多个流转路径中的最后一个意图节点的属性标识为g的数量为1,因此,得到意图节点a的流转成功次数为2次,得到意图节点b的流转成功次数为1次,得到意图节点c的流转成功次数为0次,得到意图节点d的流转成功次数为1次,得到意图节点e的流转成功次数为1次,得到意图节点f的流转成功次数为0次,得到意图节点f的流转成功次数为1次。
子步骤S1034、计算每个所述意图节点的多个流转路径中的流转成功路径的数量占所有流转路径数量的百分比,并将计算得到百分比作为每个意图节点的对话成功率。
在一实施例中,确定每个意图节点的流转成功次数占对应的路径条数的百分比;将每个意图节点的流转成功次数占对应的路径条数的百分比,确定为预设意图知识图谱中的每个意图节点的对话成功率。
示例性的,意图节点a的流转成功次数2次,意图节点b的流转成功次数1次,意图节点c的流转成功次数0次,意图节点d的流转成功次数1次,意图节点e1的流转成功次数2次,意图节点f的流转成功次数0次,意图节点g的流转成功次数0次,意图节点a的流转路径的路径条数为5条,意图节点b的流转路径的路径条数为4条,意图节点c的流转路径的路径条数为0条,意图节点d的流转路径的路径条数为1条,意图节点e的流转路径的路径条数为3条,意图节点f的流转路径的路径条数为0条,意图节点g的流转路径的路径条数为0条,得到意图节点a的流转成功次数占对应的路径条数的40%,意图节点b的流转成功次数占对应的路径条数的25%,意图节点c的流转成功次数占对应的路径条数的0%,意图节点d的流转成功次数占对应的路径条数的100%,意图节点e的流转成功次数占对应的路径条数的33.3%,意图节点f的流转成功次数占对应的路径条数的0%,意图节点g的流转成功次数占对应的路径条数的100%,根据意图节点a、b、c、d、e、f和g的流转成功次数占对应的路径条数,确定意图节点a的对话成功率为40%,确定意图节点b的对话成功率为25%,确定意图节点c的对话成功率为0%,确定意图节点d的对话成功率为100%,确定意图节点e的对话成功率为33.3%,确定意图节点f的对话成功率为0%,确定意图节点g的对话成功率为100%。
步骤S104、根据每个所述意图节点的对话成功率确定每个所述候选意图标签的对话成功率。
其中,候选意图标签的成功率处于0到100%之间,候选意图标签越大,候选意图标签的对话成功的概率越高。
在一实施例中,将每个意图节点的对话成功率和每个意图节点对应的预设意图标签的相映射,得到每个预设意图标签的对话成功率;将候选意图标签与预设意图标签相映射,并将相映射的预设意图标签的对话成功率作为候选意图标签的对话成功率。
步骤S105、将对话成功率最高的候选意图标签确定为所述用户输入的语音数据的意图标签。
其中,目标意图标签为最接近用户意图的意图标签。
在一实施例中,根据每个候选意图标签的对话成功率对多个候选意图标签进行排序,得到候选意图标签队列,从该候选意图标签队列选取对话成功率最大的候选意图标签作为用户的目标意图标签。通过成功率对候选意图标签进行排序并选取成功率最大的候选意图标签作为用户的目标意图标签,极大地提高了确定用户意图的准确性。
示例性的,候选意图标签1的对话成功率为50%,候选意图标签2的对话成功率为25%,候选意图标签3的对话成功率为15%,候选意图标签4的对话成功率为60%,候选意图标签5的对话成功率为40%,根据候选意图标签对话成功率对候选意图标签1、候选意图标签2、候选意图标签3、候选意图标签4和候选意图标签5进行排序,得到候选意图标签队列为,[候选意图标签4、候选意图标签1、候选意图标5、候选意图标签2、候选意图标签3],从该候选意图标签队列选取对话成功率最大的候选意图标签4作为用户的目标意图标签。
上述实施例提供的用户意图识别方法,通过获取用户输入的语音数据对应的文本信息,并将文本信息输入至预设意图分类模型,得到用于表示语音意图的多个预设意图标签的输出概率;然后根据每个预设意图标签的输出概率,从多个预设意图标签中确定预设数量个候选意图标签;之后确定预设意图知识图谱中的每个意图节点的对话成功率;再根据每个意图节点的对话成功率确定每个候选意图标签的对话成功率;并将对话成功率最高的候选意图标签确定为用户输入的语音数据的意图标签。本方法通过预设意图分类模型可以得到多个预设意图标签的输出概率,结合多个预设意图标签的输出概率和预设意图知识图谱中的每个意图节点的对话成功率,可以准确的确定用户的目标意图标签。
请参阅图5,图5为本申请实施例提供的一种用户意图识别装置的示意性框图。
如图5所示,用户意图识别装置200包括获取模块210、生成模块220、筛选模块230、第一确定模块240、第二确定模块250和第三确定模块260,其中,
所述获取模块210,用于获取用户输入的语音数据对应的文本信息;
所述生成模块220,用于将所述文本信息输入至预设意图分类模型,得到用于表示语音意图的多个预设意图标签的输出概率;
所述筛选模块230,用于根据每个所述预设意图标签的输出概率,从多个所述预设意图标签中确定预设数量个候选意图标签;
所述第一确定模块240,用于确定预设意图知识图谱中的每个意图节点的对话成功率,其中,所述预设意图知识图谱是根据历史对话数据生成的;
所述第二确定模块250,用于根据每个所述意图节点的对话成功率确定每个所述候选意图标签的对话成功率;
所述第三确定模块260,用于将对话成功率最高的候选意图标签确定为所述用户输入的语音数据的意图标签。
在一实施例中,所述筛选模块230还用于:
对多个所述预设意图标签按照输出概率的从大到小进行排序,得到意图标签队列;
依次从所述意图标签队列选择所述预设意图标签,直至得到预设数量个所述候选意图标签。
在一实施例中,所述第一确定模块240还用于:
获取所述预设意图知识图谱;
将所述预设意图知识图谱中与每个意图节点相对应的意图节点的成功率作为每个意图节点的对话成功率。
在一实施例中,如图6所示,所述第一确定模块240包括获取子模块241、统计模块242、确定子模块243和计算模块244,其中:
所述获取子模块241、用于从所述预设意图知识图谱中获取每个意图节点的多个流转路径;
所述统计模块242、用于统计所述多个流转路径的数量,其中,每个流转路径包括多个意图节点;
所述确定子模块243,用于将最后一个意图节点的属性标识为预设属性标识的流转路径确定为流转成功路径;
所述统计模块242,还用于统计每个所述意图节点的多个流转路径中的流转成功路径的数量;
所述计算模块244,用于计算每个所述意图节点的多个流转路径中的流转成功路径的数量占所有流转路径数量的百分比,并将计算得到百分比作为每个意图节点的对话成功率。
在一实施例中,所述第二确定模块250还用于:
将每个所述意图节点的对话成功率和每个所述意图节点对应的预设意图标签的相映射,得到每个预设意图标签的对话成功率;
将所述候选意图标签与所述预设意图标签相映射,并将相映射的所述预设意图标签的对话成功率作为所述候选意图标签的对话成功率。
在一实施例中,所述生成模块220还用于:
将所述文本信息输入至所述向量提取层,得到多个词向量;
将多个所述词向量输入至所述时延神经网络层,提取到多个词向量特征;
将多个所述词向量特征输入至所述ReLU层,得到语义标签向量;
将所述语义标签向量和多个所述词向量输入至所述加和层,得到多个初步意图标签向量;
将多个所述初步意图标签向量输入至所述循环神经网络层,得到多个候选意图标签向量;
将多个所述候选意图标签向量输入至所述dropout层,得到多个预设意图标签向量;
将多个所述意图标签向量输入至所述Solfmaxlayer层,得到预设意图标签的输出概率。
上述实施例提供的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图7所示的计算机设备上运行。
请参阅图7,图7为本申请实施例提供的一种计算机设备的结构示意性框图。
如图7所示,该计算机设备包括通过***总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作***和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种用户意图识别方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种用户意图识别方法。
该网络接口用于通信。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,该总线比如为I2C(Inter-integrated Circuit)总线,存储器可以是Flash芯片、只读存储器(ROM,Read-Only Memory)磁盘、光盘、U盘或移动硬盘等,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
获取用户输入的语音数据对应的文本信息,并将所述文本信息输入至预设意图分类模型,得到用于表示语音意图的多个预设意图标签的输出概率;
根据每个所述预设意图标签的输出概率,从多个所述预设意图标签中确定预设数量个候选意图标签;
确定预设意图知识图谱中的每个意图节点的对话成功率,其中,所述预设意图知识图谱是根据历史对话数据生成的;
根据每个所述意图节点的对话成功率确定每个所述候选意图标签的对话成功率;
将对话成功率最高的候选意图标签确定为所述用户输入的语音数据的意图标签。
在一个实施例中,所述处理器在实现所述根据每个所述预设意图标签的输出概率,从多个所述预设意图标签中确定预设数量个候选意图标签时,用于实现:
对多个所述预设意图标签按照输出概率的从大到小进行排序,得到意图标签队列;
依次从所述意图标签队列选择所述预设意图标签,直至得到预设数量个所述候选意图标签。
在一个实施例中,所述处理器在实现所述确定预设意图知识图谱中的每个意图节点的对话成功率时,用于实现:
获取所述预设意图知识图谱;
将所述预设意图知识图谱中与每个意图节点相对应的意图节点的成功率作为每个意图节点的对话成功率。
在一个实施例中,所述处理器在实现所述确定预设意图知识图谱中的每个意图节点的对话成功率时,用于实现:
从所述预设意图知识图谱中获取每个意图节点的多个流转路径,并统计所述多个流转路径的数量,其中,每个流转路径包括多个意图节点;
将最后一个意图节点的属性标识为预设属性标识的流转路径确定为流转成功路径;
统计每个所述意图节点的多个流转路径中的流转成功路径的数量;
计算每个所述意图节点的多个流转路径中的流转成功路径的数量占所有流转路径数量的百分比,并将计算得到百分比作为每个意图节点的对话成功率。
在一个实施例中,所述处理器在实现所述根据每个所述意图节点的对话成功率确定每个所述候选意图标签的对话成功率时,用于实现:
将每个所述意图节点的对话成功率和每个所述意图节点对应的预设意图标签的相映射,得到每个预设意图标签的对话成功率;
将所述候选意图标签与所述预设意图标签相映射,并将相映射的所述预设意图标签的对话成功率作为所述候选意图标签的对话成功率。
在一个实施例中,所述处理器在实现所述预设意图分类模型包括向量提取层、时延神经网络层、ReLU层、残差网络层、加和层、循环神经网络层、dropout层和Solfmaxlayer层;所述将所述文本信息输入至预设意图分类模型,得到N个预设意图标签的输出概率时,用于实现:
将所述文本信息输入至所述向量提取层,得到多个词向量;
将多个所述词向量输入至所述时延神经网络层,提取到多个词向量特征;
将多个所述词向量特征输入至所述ReLU层,得到语义标签向量;
将所述语义标签向量和多个所述词向量输入至所述加和层,得到多个初步意图标签向量;
将多个所述初步意图标签向量输入至所述循环神经网络层,得到多个候选意图标签向量;
将多个所述候选意图标签向量输入至所述dropout层,得到多个预设意图标签向量;
将多个所述意图标签向量输入至所述Solfmaxlayer层,得到预设意图标签的输出概率。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述计算机设备的具体工作过程,可以参考前述用户意图识别方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参照本申请用户意图识别方法的各个实施例。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种用户意图识别方法,其特征在于,包括:
获取用户输入的语音数据对应的文本信息,并将所述文本信息输入至预设意图分类模型,得到用于表示语音意图的多个预设意图标签的输出概率;
根据每个所述预设意图标签的输出概率,从多个所述预设意图标签中确定预设数量个候选意图标签;
确定预设意图知识图谱中的每个意图节点的对话成功率,其中,所述预设意图知识图谱是根据历史对话数据生成的;
根据每个所述意图节点的对话成功率确定每个所述候选意图标签的对话成功率;
将对话成功率最高的候选意图标签确定为所述用户输入的语音数据的意图标签。
2.如权利要求1所述的用户意图识别方法,其特征在于,所述根据每个所述预设意图标签的输出概率,从多个所述预设意图标签中确定预设数量个候选意图标签,包括:
对多个所述预设意图标签按照输出概率的从大到小进行排序,得到意图标签队列;
依次从所述意图标签队列选择所述预设意图标签,直至得到预设数量个所述候选意图标签。
3.如权利要求1所述的用户意图识别方法,其特征在于,所述确定预设意图知识图谱中的每个意图节点的对话成功率,包括:
获取所述预设意图知识图谱;
将所述预设意图知识图谱中与每个意图节点相对应的意图节点的成功率作为每个意图节点的对话成功率。
4.如权利要求1所述的用户意图识别方法,其特征在于,所述确定预设意图知识图谱中的每个意图节点的对话成功率,包括:
从所述预设意图知识图谱中获取每个意图节点的多个流转路径,并统计所述多个流转路径的数量,其中,每个流转路径包括多个意图节点;
将最后一个意图节点的属性标识为预设属性标识的流转路径确定为流转成功路径;
统计每个所述意图节点的多个流转路径中的流转成功路径的数量;
计算每个所述意图节点的多个流转路径中的流转成功路径的数量占所有流转路径数量的百分比,并将计算得到百分比作为每个意图节点的对话成功率。
5.如权利要求1-4中任一项所述的用户意图识别方法,其特征在于,所述根据每个所述意图节点的对话成功率确定每个所述候选意图标签的对话成功率,包括:
将每个所述意图节点的对话成功率和每个所述意图节点对应的预设意图标签的相映射,得到每个预设意图标签的对话成功率;
将所述候选意图标签与所述预设意图标签相映射,并将相映射的所述预设意图标签的对话成功率作为所述候选意图标签的对话成功率。
6.如权利要求1-4中任一项所述的用户意图识别方法,其特征在于,所述预设意图分类模型包括向量提取层、时延神经网络层、ReLU层、残差网络层、加和层、循环神经网络层、dropout层和Solfmaxlayer层;所述将所述文本信息输入至预设意图分类模型,得到N个预设意图标签的输出概率,包括:
将所述文本信息输入至所述向量提取层,得到多个词向量;
将多个所述词向量输入至所述时延神经网络层,提取到多个词向量特征;
将多个所述词向量特征输入至所述ReLU层,得到语义标签向量;
将所述语义标签向量和多个所述词向量输入至所述加和层,得到多个初步意图标签向量;
将多个所述初步意图标签向量输入至所述循环神经网络层,得到多个候选意图标签向量;
将多个所述候选意图标签向量输入至所述dropout层,得到多个预设意图标签向量;
将多个所述意图标签向量输入至所述Solfmaxlayer层,得到预设意图标签的输出概率。
7.一种用户意图识别装置,其特征在于,所述用户意图识别装置包括获取模块、生成模块、筛选模块、第一确定模块、第二确定模块和第三确定模块,其中:
所述获取模块,用于获取用户输入的语音数据对应的文本信息;
所述生成模块,用于将所述文本信息输入至预设意图分类模型,得到用于表示语音意图的多个预设意图标签的输出概率;
所述筛选模块,用于根据每个所述预设意图标签的输出概率,从多个所述预设意图标签中确定预设数量个候选意图标签;
所述第一确定模块,用于确定预设意图知识图谱中的每个意图节点的对话成功率,其中,所述预设意图知识图谱是根据历史对话数据生成的;
所述第二确定模块,用于根据每个所述意图节点的对话成功率确定每个所述候选意图标签的对话成功率;
所述第三确定模块,用于将对话成功率最高的候选意图标签确定为所述用户输入的语音数据的意图标签。
8.如权利要求7所述的用户意图识别装置,其特征在于,所述第一确定模块包括获取子模块、统计模块、确定子模块和计算模块,其中:
所述获取子模块、用于从所述预设意图知识图谱中获取每个意图节点的多个流转路径;
所述统计模块、用于统计所述多个流转路径的数量,其中,每个流转路径包括多个意图节点;
所述确定子模块,用于将最后一个意图节点的属性标识为预设属性标识的流转路径确定为流转成功路径;
所述统计模块,还用于统计每个所述意图节点的多个流转路径中的流转成功路径的数量;
所述计算模块,用于计算每个所述意图节点的多个流转路径中的流转成功路径的数量占所有流转路径数量的百分比,并将计算得到百分比作为每个意图节点的对话成功率。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至6中任一项所述的用户意图识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至6中任一项所述的用户意图识别方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011631344.4A CN112732882A (zh) | 2020-12-30 | 2020-12-30 | 用户意图识别方法、装置、设备及计算机可读存储介质 |
PCT/CN2021/084250 WO2022141875A1 (zh) | 2020-12-30 | 2021-03-31 | 用户意图识别方法、装置、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011631344.4A CN112732882A (zh) | 2020-12-30 | 2020-12-30 | 用户意图识别方法、装置、设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112732882A true CN112732882A (zh) | 2021-04-30 |
Family
ID=75608457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011631344.4A Pending CN112732882A (zh) | 2020-12-30 | 2020-12-30 | 用户意图识别方法、装置、设备及计算机可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112732882A (zh) |
WO (1) | WO2022141875A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113377969A (zh) * | 2021-08-16 | 2021-09-10 | 中航信移动科技有限公司 | 意图识别数据处理*** |
CN113593533A (zh) * | 2021-09-10 | 2021-11-02 | 平安科技(深圳)有限公司 | 基于意图识别的流程节点跳转方法、装置、设备及介质 |
CN114090755A (zh) * | 2021-11-30 | 2022-02-25 | 平安科技(深圳)有限公司 | 基于知识图谱的回复语句确定方法、装置及电子设备 |
CN114860912A (zh) * | 2022-05-20 | 2022-08-05 | 马上消费金融股份有限公司 | 数据处理方法、装置、电子设备和存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9720981B1 (en) * | 2016-02-25 | 2017-08-01 | International Business Machines Corporation | Multiple instance machine learning for question answering systems |
CN110377911B (zh) * | 2019-07-23 | 2023-07-21 | 中国工商银行股份有限公司 | 对话框架下的意图识别方法和装置 |
CN111695352A (zh) * | 2020-05-28 | 2020-09-22 | 平安科技(深圳)有限公司 | 基于语义分析的评分方法、装置、终端设备及存储介质 |
CN111897935B (zh) * | 2020-07-30 | 2023-04-07 | 中电金信软件有限公司 | 基于知识图谱的话术路径选择方法、装置和计算机设备 |
CN111949787B (zh) * | 2020-08-21 | 2023-04-28 | 平安国际智慧城市科技股份有限公司 | 基于知识图谱的自动问答方法、装置、设备及存储介质 |
-
2020
- 2020-12-30 CN CN202011631344.4A patent/CN112732882A/zh active Pending
-
2021
- 2021-03-31 WO PCT/CN2021/084250 patent/WO2022141875A1/zh active Application Filing
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113377969A (zh) * | 2021-08-16 | 2021-09-10 | 中航信移动科技有限公司 | 意图识别数据处理*** |
CN113377969B (zh) * | 2021-08-16 | 2021-11-09 | 中航信移动科技有限公司 | 意图识别数据处理*** |
CN113593533A (zh) * | 2021-09-10 | 2021-11-02 | 平安科技(深圳)有限公司 | 基于意图识别的流程节点跳转方法、装置、设备及介质 |
WO2023035524A1 (zh) * | 2021-09-10 | 2023-03-16 | 平安科技(深圳)有限公司 | 基于意图识别的流程节点跳转方法、装置、设备及介质 |
CN113593533B (zh) * | 2021-09-10 | 2023-05-02 | 平安科技(深圳)有限公司 | 基于意图识别的流程节点跳转方法、装置、设备及介质 |
CN114090755A (zh) * | 2021-11-30 | 2022-02-25 | 平安科技(深圳)有限公司 | 基于知识图谱的回复语句确定方法、装置及电子设备 |
CN114860912A (zh) * | 2022-05-20 | 2022-08-05 | 马上消费金融股份有限公司 | 数据处理方法、装置、电子设备和存储介质 |
CN114860912B (zh) * | 2022-05-20 | 2023-08-29 | 马上消费金融股份有限公司 | 数据处理方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2022141875A1 (zh) | 2022-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112732882A (zh) | 用户意图识别方法、装置、设备及计算机可读存储介质 | |
CN108847241B (zh) | 将会议语音识别为文本的方法、电子设备及存储介质 | |
CN109299344B (zh) | 排序模型的生成方法、搜索结果的排序方法、装置及设备 | |
JP2020520492A (ja) | 文書要約自動抽出方法、装置、コンピュータ機器及び記憶媒体 | |
CN110853626B (zh) | 基于双向注意力神经网络的对话理解方法、装置及设备 | |
CN109800307B (zh) | 产品评价的分析方法、装置、计算机设备及存储介质 | |
CN112395506A (zh) | 一种资讯推荐方法、装置、电子设备和存储介质 | |
CN110019742B (zh) | 用于处理信息的方法和装置 | |
CN108027814B (zh) | 停用词识别方法与装置 | |
CN110890088B (zh) | 语音信息反馈方法、装置、计算机设备和存储介质 | |
CN111274797A (zh) | 用于终端的意图识别方法、装置、设备及存储介质 | |
JP2010537321A (ja) | 統計的分類のための最適な選択方略の方法及びシステム | |
CN111046656A (zh) | 文本处理方法、装置、电子设备及可读存储介质 | |
CN112036168B (zh) | 事件主体识别模型优化方法、装置、设备及可读存储介质 | |
CN108227564A (zh) | 一种信息处理方法、终端及计算机可读介质 | |
CN112183106A (zh) | 一种基于音素联想及深度学习的语义理解方法及装置 | |
CN111400340A (zh) | 一种自然语言处理方法、装置、计算机设备和存储介质 | |
CN109726386B (zh) | 一种词向量模型生成方法、装置和计算机可读存储介质 | |
CN114722832A (zh) | 一种摘要提取方法、装置、设备以及存储介质 | |
CN105810192A (zh) | 语音识别方法及其*** | |
CN114266252A (zh) | 命名实体识别方法、装置、设备及存储介质 | |
CN113569021A (zh) | 用户分类的方法、计算机设备和可读存储介质 | |
CN110874408B (zh) | 模型训练方法、文本识别方法、装置及计算设备 | |
CN113139368B (zh) | 一种文本编辑方法及*** | |
CN111680514A (zh) | 信息处理和模型训练方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |