CN111309383B - 指令识别方法、装置、设备及存储介质 - Google Patents
指令识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111309383B CN111309383B CN202010129986.8A CN202010129986A CN111309383B CN 111309383 B CN111309383 B CN 111309383B CN 202010129986 A CN202010129986 A CN 202010129986A CN 111309383 B CN111309383 B CN 111309383B
- Authority
- CN
- China
- Prior art keywords
- instruction
- target
- formatting
- score
- target reference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/30025—Format conversion instructions, e.g. Floating-Point to Integer, decimal conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30145—Instruction analysis, e.g. decoding, instruction word fields
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种指令识别方法、装置、设备及存储介质,其中,所述方法包括:获取输入的待识别指令,对所述待识别指令进行识别,获取与所述待识别指令对应的至少一个目标关键词;在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令;按照预设的指令评分算法分别计算每一个所述目标参考指令对应的指令得分;根据所述指令得分在至少一个目标参考指令中确定与所述待识别指令对应的目标指令。采用本发明,可以提高指令识别的准确性。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种指令识别方法、装置、计算机设备及计算机可读存储介质。
背景技术
随着计算机技术的发展以及智能家居的普及,越来越多的家电产品可以通过语音进行智能控制,以提高产品控制的交互性和智能性。
一般情况下,针对家电产品的控制是通过用户输入语音,然后对用户输入的自然语音进行语音识别和语义识别,将其转换成机器可理解可执行的指令。一般情况下,指令的识别是通过关键词匹配进行的。即针对预设的控制指令,定义其相关的关键词,然后在指令识别的场景下,根据用户输入的语音所对应的关键词来匹配对应的控制指令。
但是,如果用户输入的关键词不准确、或者用户输入的关键词匹配的指令有多个的情况下,会存在无法根据关键词匹配来确定对应的控制指令的情况,导致指令识别失败或者错误。尤其是在多个指令的关键词上有包含关系的情况下,会出现匹配的指令有多个但是无法确定指令的情况。例如,指令A={打开空调}={打开,空调}和指令B={空调打开左右摆风}={打开,空调,左右,摆风},指令A的关键词被包含在指令B的关键词中,在用户的输入的语音对应的关键词为“打开”、“空调”的情况下,无法确定与匹配的指令为A还是B,出现指令识别失败的情况。
综上,现有的指令指令识别技术对用户指令识别的不够准确,基于这种不够准确的分析、识别技术所得到的结论进行的后期控制也会产生较大的偏差。
发明内容
基于此,有必要针对上述问题,提出了一种指令识别方法、装置、计算机设备及计算机可读存储介质。
一种指令识别方法,所述方法包括:
获取输入的待识别指令,对所述待识别指令进行识别,获取与所述待识别指令对应的至少一个目标关键词;
在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令;
按照预设的指令评分算法分别计算每一个所述目标参考指令对应的指令得分;
根据所述指令得分在至少一个目标参考指令中确定与所述待识别指令对应的目标指令。
可选的,所述对所述待识别指令进行识别,获取与所述待识别指令对应的至少一个目标关键词,还包括:
根据预设的关键词数据库,确定与所述待识别指令对应的初始关键词;
根据预设的同义词数据库,获取与所述待识别指令对应的同义词,并确定与所述同义词对应的同义关键词;
根据所述初始关键词及同义关键词确定所述目标关键词。
可选的,所述预设的格式化指令数据库包括指令索引,所述指令索引包括与每一个格式化指令对应的索引标识;
所述在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令,还包括:
将每一个所述目标关键词分别与所述基指令索引包含的索引标识进行比对,以确定与每一个所述目标关键词对应的目标索引标识;
将与查找到的目标索引标识对应的格式化指令作为所述目标参考指令。
可选的,所述预设的格式化指令数据库中包含的每一个格式化指令分别设置有对应的至少一个指令参考词;
所述在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令,还包括:
遍历所述格式化指令数据库;
对于遍历到的格式化指令,判断所述遍历到的格式化指令对应的指令参考词是否与所述目标关键词匹配;
若是,则将所述遍历到的格式化指令作为所述目标参考指令。
可选的,所述预设的格式化指令数据库中包含的每一个格式化指令还分别设置有对应的缺省向量,所述缺省向量用于标识所述格式化指令对应的每一个指令参考词是否可以缺省;
所述按照预设的指令评分算法分别计算每一个所述目标参考指令对应的指令得分,还包括:
针对每一个目标参考指令:
确定与所述目标参考指令对应的指令覆盖向量,根据所述指令覆盖向量计算与所述目标参考指令对应的第一得分,所述指令覆盖向量的元素值为0或1;
确定与所述目标参考指令对应的加减分覆盖向量,根据所述加减分覆盖向量和所述目标参考指令对应的缺省向量计算与所述目标参考指令对应的第二得分,所述加减分覆盖向量的元素值为1或-1;
根据所述第一得分和第二得分,确定与所述目标参考指令对应的指令得分。
可选的,所述确定与该目标参考指令对应的指令覆盖向量,还包括:
判断该目标参考指令对应的每一个指令参考词是否存在匹配的目标关键词,根据判断结果确定与该目标参考指令对应的指令覆盖向量。
可选的,所述根据所述指令得分在至少一个目标参考指令中确定与所述待识别指令对应的目标指令,还包括:
确定至少一个目标参考指令的指令得分中的最高值,将所述最高值对应的目标参考指令作为所述目标指令。
可选的,所述将所述最高值对应的目标参考指令作为所述目标指令之前,还包括:
确定所述最高值对应的指令得分是否大于或等于预设的分值阈值;
在所述最高值对应的指令得分大于或等于预设的分值阈值的情况下,将所述最高值对应的目标参考指令作为所述目标指令。
一种指令识别装置,所述装置包括:
目标关键词获取模块,用于获取输入的待识别指令,对所述待识别指令进行识别,获取与所述待识别指令对应的至少一个目标关键词;
目标参考指令确定模块,用于在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令;
指令得分计算模块,用于按照预设的指令评分算法分别计算每一个所述目标参考指令对应的指令得分;
目标指令确定模块,用于根据所述指令得分在至少一个目标参考指令中确定与所述待识别指令对应的目标指令。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取输入的待识别指令,对所述待识别指令进行识别,获取与所述待识别指令对应的至少一个目标关键词;
在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令;
按照预设的指令评分算法分别计算每一个所述目标参考指令对应的指令得分;
根据所述指令得分在至少一个目标参考指令中确定与所述待识别指令对应的目标指令。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取输入的待识别指令,对所述待识别指令进行识别,获取与所述待识别指令对应的至少一个目标关键词;
在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令;
按照预设的指令评分算法分别计算每一个所述目标参考指令对应的指令得分;
根据所述指令得分在至少一个目标参考指令中确定与所述待识别指令对应的目标指令。
采用本发明实施例,具有如下有益效果:
采用上述指令识别方法、装置、计算机设备及计算机可读存储介质之后,在用户输入指令之后,对指令进行识别并确定对应的目标关键词,然后在指令数据库中查找与目标关键词对应的多个目标参考指令,并且计算每一个目标参考指令对应的指令得分;最后根据指令得分来确定目标参考指令中的目标指令,目标指令用于发送给对应的控制设备并对控制设备进行控制。也就是说,针对用户输入的指令不是直接根据关键词匹配确定对应的目标指令,避免该种方案下可能存在的关键词匹配不准确的情况;通过关键词查找确定目标参考指令保证了所有关联的指令被考虑,然后通过指令得分的计算在目标参考指令中确定与用户输入的指令最为匹配的目标指令,从而提高了指令识别的准确性,提高了后续控制的准确性,提升了用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中一种指令识别方法的流程示意图;
图2为一个实施例中同义词表的示意图;
图3为一个实施例中目标关键词确定的流程示意图;
图4为一个实施例中指令数据库的示意图;
图5为一个实施例中格式化指令的示意图;
图6为一个实施例中目标参考指令确定的流程示意图;
图7为一个实施例中索引表的示意图;
图8为一个实施例中指令得分计算的流程示意图;
图9为一个实施例中目标指令确定的流程示意图;
图10为一个实施例中目标参考指令的指令得分计算的示意图;
图11为一个实施例中一种指令识别装置的结构框图;
图12为一个实施例中指令得分计算模块的结构框图;
图13为一个实施例中运行上述指令识别方法的计算机设备的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,在一个实施例中,提供了一种指令识别方法。该方法用于对用户输入语音或文字的指令进行识别,并确定用于控制的机器可识别的目标指令,以实现对目标设备的控制。
需要说明的是,在本实施例中,基于本发明实施例提供的指令识别方法识别的目标指令所控制的目标设备,可以是任意基于计算机***的设备,例如空调等家电设备。
上述指令识别方法的运行可以是基于上述目标设备的计算机***(即在目标设备中设置有计算机***,并基于该计算机***进行指令的识别),还可以是基于与上述目标设备连接的外部计算机设备,例如智能手机、个人电脑、服务器等设备。具体的,在接收到用户输入的指令之后,对指令进行分析和识别,以确定对应的目标指令,该目标指令用于控制对目标设备的控制,以实现对应的控制效果。
在本实施例中,以目标设备(例如,智能空调)与一控制设备(例如,智能音箱)连接,控制设备连接服务器为例进行说明。
其中,控制设备用于接收用户输入的指令,并发送给服务器,以使得服务器对接收到的指令进行识别并确定对应的目标指令,然后返回给控制设备,由控制设备发送对应的目标指令给目标设备,以实现对目标设备的控制。
在一个具体的实施例中,上述指令识别方法具体包括如下步骤:
步骤S102:获取输入的待识别指令,对所述待识别指令进行识别,获取与所述待识别指令对应的至少一个目标关键词。
在本实施例中,用户输入的待识别指令可以是通过语音输入的,例如,通过智能音箱这一控制设备的麦克风装置输入的;在其它应用场景中,可以是通过其它设备上的麦克风装置输入的。
在用户输入待识别指令是通过语音的方式输入的情况下,还需要将对应的语音进行语音识别。具体的,上述步骤S102中,获取输入的待识别指令的过程还包括:获取输入的待识别语音,按照预设的语音识别算法将所述待识别语音转换成对应的文字,根据转换成的文字确定与输入的待识别语音对应的待识别指令。
例如,待识别指令可以是“请打开空调的制冷模式”。
在另一个实施例中,用户输入的待识别指令还可以是通过文字输入的,例如,用户可以通过手机上输入文字来输入待识别指令。在这种情况下,直接对用户输入的文字确定对应的待识别指令。
在本实施例中,确定与待识别指令对应的关键词的过程,可以是根据预设的关键词数据库来确定待识别指令中的关键词的过程。
具体的,预先对目标设备对应的控制指令所可能对应的关键词进行定义,确定对应的关键词数据库。然后在确定与待识别指令对应的目标关键词的过程中,是将待识别指令与该关键词数据库之间进行匹配的过程,从所述待识别指令中提取与所述关键词数据库中包含的关键词匹配的关键词,从而确定目标关键词。在一个具体的实施例中,在待识别指令中查找与关键词数据库中包含的关键词对应的字或词,如果查找到,则将查找到的字或词作为从待识别指令中提取出来的关键词,并根据该提取出来关键词来确定目标关键词。
还需要考虑,不同的用户在输入指令的过程中的用词可能不一样,在本实施例中,在确定目标关键词的过程中,还需要考虑每一个关键词是否存在对应的同义词。具体实施例中,需要预先对对目标设备对应的控制指令所可能对应的关键词所可能存在的同义词进行定义,确定与关键词数据库对应的同义词数据库。然后,在确定目标关键词的过程中,还需要根据同义词数据库来确定是否存在匹配的关键词。
具体的,如图2所示,给出了同义词数据库的一个示例。
具体的,如图3所示,上述对所述待识别指令进行识别,获取与所述待识别指令对应的至少一个目标关键词,还包括:
步骤S201:根据预设的关键词数据库,确定与所述待识别指令对应的初始关键词;
步骤S202:根据预设的同义词数据库,获取与所述待识别指令对应的同义词,并确定与所述同义词对应的同义关键词;
步骤S203:将所述初始关键词及同义关键词作为所述目标关键词。
也就是说,在确定目标关键词的过程中,还需要考虑待识别指令中是否存在与关键词数据库中包括的关键词对应的同义词。具体的,需要根据同义词数据库确定待识别指令中对应的同义词,然后根据同义词数据库确定该同义词对应的关键词,即为同义词关键词,其中,同义词关键词也包含在关键词数据库钟。
在本实施例中,为了提高关键词提取的准确性,在提取关键词的过程中,需要以长关键词优先为提取原则。例如,在控制指令为“请打开卧室空调”的情况下,关键词数据库中包含的关键词包括卧室、空调、卧室空调这3个关键词的情况下,因为卧室空调对应的长度最长,在长关键词优先的原则下,提取的关键词为“卧室空调”,而不是卧室或者空调,避免了因为关键词提取失败导致的控制失误。
步骤S104:在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令。
在本实施例中,需要预先针对目标设备对应的所有控制指令构建指令数据库。
具体的,例如指令open_air_conditioner对应了控制指令“打开空调”,指令set_air_conditioner_mode{value=hot}对应了控制指令“空调打开左右摆风”。
在格式化指令数据库中,针对目标设备对应的所有控制指令进行标准的处理,针对标准的控制指令(在本实施例中为“格式化指令”)构建格式化指令数据库。具体的,针对每一个格式化指令,构建了对应的四段式指令参考词的组合,即4个指令参考词的组合。具体的,指令参考词包括:“device”(设备名称)、“function”(目标功能)、“operation”(目标操作)、“value”(附加信息)。4个指令参考词的组合确定了唯一的格式化指令。
例如,图4给出了针对智能空调的格式化指令对应的格式化指令数据库。
进一步的,在某些格式化指令中,上述4个指令参考词中某一个或多个指令参考词可以缺省,部分是不可缺省的。在指令格式化数据库中,还包括了与每一个格式化指令对应的缺省向量,用来标注(device,function,operation,value)4个指令参考词是否可缺省,0表示该位置的指令参考词可缺省,1表示不可缺省,标注值之间用逗号隔开。例如,缺省向量为“1,0,0,0”时,表示device不可缺省,但其他三段都可缺省。
具体实施中,根据与待识别指令对应的多个目标关键词,在格式化指令数据库中查找与该多个目标关键词对应的格式化指令作为目标参考指令,目标参考指令为与目标关键词关联的所有格式化指令。
例如,在待识别指令对应的目标关键词为“打开、空调”的情况下,目标参考指令包括了与目标关键词中的一个或多个匹配的所有格式化指令,即包括了与目标关键词“空调”和/或“打开”匹配的所有格式化指令。也就是说,在本实施例中,通过查找与目标关键词匹配的所有格式化指令,避免了可能与待识别指令相关的格式化指令被漏掉,提高了待识别指令识别的全面性和准确性。
具体实施中,确定目标参考指令的过程中,在预设的格式化指令数据库中,查找与目标关键词中的一个或多个目标关键词匹配的格式化指令作为目标参考指令。
如图5所示,给出了目标关键词为“打开、空调”的情况下对应的目标参考指令的例子。
如前所述,预先构建的格式化指令数据库中包含的每一个格式化指令包含了device、function、operation、value等多个指令参考词,在具体根据目标关键词进行目标参考指令的查找和确定的过程中,是分别对每一个目标关键词分别进行查找和匹配的过程,以确保目标参考指令能全面包括所有关联的格式化指令。
具体的,如图6所示,所述在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令,还包括:
步骤S301:遍历所述格式化指令数据库;
步骤S302:对于遍历到的格式化指令,判断所述遍历到的格式化指令对应的指令参考词是否与所述目标关键词匹配;
若是,则执行步骤S303:将所述遍历到的格式化指令作为所述目标参考指令;
若否,则继续执行上述步骤S301;
循环执行上述步骤S301-S303,直至所述格式化指令数据库中的所有格式化指令均遍历完毕。
通过上述步骤S301-S303,可以查找与待识别指令对应的所有目标关键词中的一个或者多个匹配的所有格式化指令作为目标参考指令,保障了目标参考指令确定过程中的全面性,提高了后续的目标指令确定的准确性。
在一个实施例中,为了提高目标参考指令查找的查找效率,在本实施例中,在需要针对预设的格式化指令数据库构建索引,以通过索引来提高查找效率。
具体的,在预设的格式化指令数据库中,根据格式化指令数据库包含的所有的格式化指令对应的指令参考词,构建“指令参考词-指令”的指令索引表,该指令索引表即为基于指令参考词的指令索引,通过指令索引中包含的指令参考词(即为对应的索引标识)以确定对应的指令(即对应的格式化指令)。例如,如图7所示,给出了指令索引表的示例。
在一个具体的实施例中,上述确定目标参考指令的过程中,还包括:将每一个所述目标关键词分别与所述指令索引包含的索引标识进行比对,确定与每一个所述目标关键词对应的目标索引标识;将与所述查找到的目标索引标识对应的格式化指令作为所述目标参考指令。
具体的,针对每一个目标关键词,根据指令索引,确定匹配的所有格式化指令作为目标参考指令。其中,上述指令索引的引入,可以加快目标参考指令的查找过程中的匹配速度,不需要每次查找都查找整个格式化指令数据库,可以根据指令索引仅查找与相应的目标关键词对应的格式化指令即可。
步骤S106:按照预设的指令评分算法分别计算每一个所述目标参考指令对应的指令得分。
在本实施例中,针对与目标关键词相关的所有的目标参考指令,按照预设的指令评分算法,确定该目标参考指令对应的指令得分,其中,指令得分用于标识该目标参考指令与待识别指令的匹配程度,从而可以确定目标参考指令中哪一个指令与待识别指令最为匹配。
具体的,如前所述,预设的格式化指令数据库中包含的格式化指令还设置有对应的缺省向量,用于标识该格式化指令对应的至少一个指令参考词是否可以缺省。根据缺省向量可以确定每一个不可缺省的指令参考词是否存在对应的目标关键词。
具体的,如图8所示,上述步骤S106还包括:
步骤S401:确定与该目标参考指令对应的指令覆盖向量,根据所述指令覆盖向量计算与该目标参考指令对应的第一得分。
针对每一个目标参考指令,根据该条目标参考指令中,每一个指令参考词是否存在匹配的目标关键词,并根据匹配结果确定对应的第一得分S,其中S可以根据每一个指令参考词中是否存在匹配的目标关键词来确定每一个指令参考词的得分s_i,i表示第i个指令参考词,然后根据s_i计算对应的第一得分S。
具体的,可以根据每一个指令参考词中是否存在匹配的目标关键词来确定与目标参考指令对应的指令覆盖向量s。在一个具体的实施例中,s={s_i,i表示第i个指令参考词},S=Σs_i。具体的,指令覆盖向量的元素值取值为0或1。对于每一个指令参考词,确定待识别指令提取出来的目标关键词中是否包含了该指令参考词,如果存在,则对应的指令覆盖向量的元素值为1,反之,则为0。也就是说,在指令参考词存在对应的目标关键词的情况下,对应在第一得分中的得分为1,反之不得分。根据第一得分可以确定待识别指令与目标参考指令之间的匹配程度。
步骤S402:根据所述指令覆盖向量和所述目标参考指令对应的缺省向量确定与该目标参考指令对应的加减分向量,根据所述加减分向量,计算与该目标参考指令对应的第二得分。
将目标参考指令对应的缺省向量记为v2,v2={v2_i,i表示第i个指令参考词},v2_i为第i个指令参考词是否可以缺省。
另外,针对目标参考指令的每一个指令参考词,根据该指令参考词是否存在对应的目标关键词确定加减分覆盖向量v1。具体的,如果对应的指令参考词存在对应的目标关键词,则对应的加减分覆盖向量中的覆盖值为1,否则为-1,即v1={v1_i,i表示第i个指令参考词},v1_i为第i个指令参考词对应的覆盖值。
根据每一个目标参考指令对应的缺省向量,确定不可缺省的关键词是否抽取到,来增减初始得分,即确定对应的第二得分。
具体通过与目标参考指令对应的加减分覆盖向量v1和缺省向量v2的点积,确定与目标参考指令对应的第二得分delta。
即:
delta=v1·v2,
delta_i=v1_i×v2_i,i表示第i个指令参考词。
也就是说,加减分覆盖为1的位置,表示当该位置的指令参考词如果是不可缺省的话,那么可以用来加分,而加减分覆盖为1的位置,表示当该位置的指令参考词为不可缺省的话,那么可以用来减分。而某个位置的指令参考词为可缺省时,缺省向量中该位置为0,所以加减分覆盖中该位置的元素值就可以忽略了。如果某个位置的指令参考词为不可缺省的,当该指令参考词在用户输入的待识别指令中出现时,则加分,未出现,则减分;如果该位置的指令参考词为可缺省的话,该指令参考词在用户输入的待识别指令中出现或不出现对最终指令得分都没有影响。
步骤S403:根据所述第一得分和第二得分,确定与该目标参考指令对应的指令得分。
第一得分与第二得分均标识了目标参考指令是否与待识别指令匹配,在本实施例中,为了提高目标指令确定的准确性,每一个目标参考指令的最终的指令得分综合考虑第一得分和第二得分得到,例如,按照预设的公式进行计算。
在一个具体发实施例中,根据第一得分与第二得分的和,确定与该目标参考指令对应的指令得分。
即,根据下述公式
Sorce=S+delta
计算目标参考指令对应的指令得分。
上述针对目标参考指令的指令得分的计算方法更加灵活,可以准确的对待识别指令对应的关键词是否与预设的格式化指令之间的匹配程度进行计算,提高指令识别的准确性。
例如,在图5的基础上,在目标关键词为“打开、空调”的情况下,以图5所包含的目标参考指令对应的得分的计算为例进行说明。
如图5中的第1条目标参考指令:
第1条目标参考指令对应的指令覆盖向量为:s=[1,0,1,0],第一得分为S=1+0+1+0=2。
加减分覆盖指令v1=[1,-1,1,-1],其预设的缺省向量为v2=[1,0,1,0],对应的第二得分为delta=v1·v2=1*1+-1*0+1*1+-1*0=2。
所以第1条目标参考指令对应的指令得分为Sorce=S+delta=2+2=4。
如图5中的第5条目标参考指令:
第5条目标参考指令对应的指令覆盖向量为:s=[1,0,1,0],第一得分为S=1+0+1+0=2。
加减分覆盖指令v1=[1,-1,1,-1],其预设的缺省向量为v2=[1,0,0,1],对应的第二得分为delta=v1·v2=1*1+-1*0+1*0+-1*1=0。
所以第5条目标参考指令对应的指令得分为Sorce=S+delta=2+0=0。
在另一个实施例中,若待识别指令为“温度调高一点”,用户并没有在待识别指令中指定设备对象,在这种情况下,可以通过预设格式化指令“device=空调,function=温度设置,operation=调高,value=1度”对应的缺省向量的device这个指令参考词对应位置的元素值为0,即device位置的指令参考词可以缺省,也就是说默认调高温度就是指调高空调的温度,从而使得该待识别指令对应的指令得分会升高,提高后续确定目标指令的准确性。在其他实施例中,针对格式化指令来讲,如果对应的缺省向量中指令参考词device对应位置的元素值设为1,那么其他格式化指令的指令得分会降低,这样即使在缺失控制设备名称的情况下,也可以正确的对待识别指令进行识别,提高指令识别的准确性。
也就是说,根据上述针对目标参考指令的指令得分的计算方法,可以在各指令之间有包含关系的情况下、或待识别指令存在缺失或模糊的情况下,也可以对格式化指令与待识别指令之间的匹配程度进行准确的计算,从而提高了指令识别的准确性。
如图10所示,给出了图10所示的目标参考指令对应的所有指令的指令得分计算结果。
步骤S108:根据所述指令得分在至少一个目标参考指令中确定与所述待识别指令对应的目标指令。
在确定了每一个目标参考指令对应的指令得分之后,即可根据指令得分确定在所有目标参考指令中与待识别指令最为匹配的指令作为目标指令。在一个具体的实施例中,可以是将指令得分中的最高值来确定目标指令,即,如图9所示,步骤S108还包括:
步骤S1081:确定至少一个目标参考指令的指令得分中的最高值;
步骤S1083:将所述最高值对应的目标参考指令作为所述目标指令。
进一步的,为了保证目标指令的有效性,还需要考虑确定的目标指令对应的指令得分是否满足预设的条件,例如,是否大于或等于预设的分值阈值。只有在相应的指令得分大于或等于预设的分值阈值的情况下,才将对应的指令作为目标指令,从而确保指令的有效性,避免了指令得分较低的指令被确认为目标指令。
具体的,上述步骤S1081之后,还包括:
步骤S1082:确定最高值对应的指令得分是否大于或等于预设的分值阈值;
若是,则执行步骤S1083:将最高值对应的目标参考指令作为目标指令;
若否,则执行步骤S1084:返回指令识别失败的消息。
例如,在上述图9所示的指令得分中,预设的分值阈值为2分。而根据图9所示的目标参考指令对应的得分中,指令得分的最高值为4分,因为4分>2分,则将该最高值指令得分对应的指令作为目标指令,即控制指令为“打开空调”的情况下所对应的目标指令为open_air_conditioner,对应的指令参考词为“device=空调,function=开关机,operation=打开,value=”。
在一个实施例中,如图11所示,还提供了一种指令识别装置。
具体的,如图11所示,上述指令识别装置包括:
目标关键词获取模块102,用于获取输入的待识别指令,对所述待识别指令进行识别,获取与所述待识别指令对应的至少一个目标关键词;
目标参考指令确定模块104,用于在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令;
指令得分计算模块106,用于按照预设的指令评分算法分别计算每一个所述目标参考指令对应的指令得分;
目标指令确定模块108,用于根据所述指令得分在至少一个目标参考指令中确定与所述待识别指令对应的目标指令。
可选的,在一个实施例中,目标关键词获取模块102还用于:根据预设的关键词数据库,确定与所述待识别指令对应的初始关键词;根据预设的同义词数据库,获取与所述待识别指令对应的同义词,并确定与所述同义词对应的同义关键词;根据所述初始关键词及同义关键词确定所述目标关键词。
可选的,在一个实施例中,所述预设的格式化指令数据库中包含的每一个格式化指令分别设置有对应的至少一个指令参考词;目标参考指令确定模块104还用于遍历所述格式化指令数据库;对于遍历到的格式化指令,判断所述遍历到的格式化指令对应的指令参考词是否与所述目标关键词匹配;若是,则将所述遍历到的格式化指令作为所述目标参考指令。
可选的,在一个实施例中,所述预设的格式化指令数据库包括指令索引,所述指令索引包括与每一个格式化指令对应的索引标识;目标参考指令确定模块104还用于将每一个所述目标关键词分别与所述指令索引包含的索引标识进行比对,以确定与每一个所述目标关键词对应的目标索引标识;将与查找到的目标索引标识对应的格式化指令作为所述目标参考指令。
可选的,在一个实施例中,所述预设的格式化指令数据库中包含的每一个格式化指令还分别设置有对应的缺省向量,所述缺省向量用于标识该格式化指令对应的每一个指令参考词是否可以缺省;如图12所述,指令得分计算模块106还包括第一得分计算单元1061、第二得分计算单元1062和目标得分计算单元1063;
第一得分计算单元1061用于分别根据与每一个目标参考指令对应的指令覆盖向量,根据所述指令覆盖向量计算与所述目标参考指令对应的第一得分,所述指令覆盖向量的元素值为0或1;
第二得分计算单元1062用于分别根据与每一个目标参考指令对应的加减分覆盖向量,根据所述加减分覆盖向量和所述目标参考指令对应的缺省向量计算与该目标参考指令对应的第二得分,所述加减分覆盖向量的元素值为1或-1;
目标得分计算单元1063用于根据所述第一得分和第二得分,确定与该目标参考指令对应的指令得分。
可选的,在一个实施例中,目标指令确定模块108还用于判断该目标参考指令对应的每一个指令参考词是否存在匹配的目标关键词,根据判断结果确定与该目标参考指令对应的指令覆盖向量。
可选的,在一个实施例中,目标指令确定模块108还用于确定至少一个目标参考指令的指令得分中的最高值,将所述最高值对应的目标参考指令作为所述目标指令。
图13示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图13所示,该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作***,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现指令识别方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行年龄识别方法。本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取输入的待识别指令,对所述待识别指令进行识别,获取与所述待识别指令对应的至少一个目标关键词;
在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令;
按照预设的指令评分算法分别计算每一个所述目标参考指令对应的指令得分;
根据所述指令得分在至少一个目标参考指令中确定与所述待识别指令对应的目标指令。
在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取输入的待识别指令,对所述待识别指令进行识别,获取与所述待识别指令对应的至少一个目标关键词;
在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令;
按照预设的指令评分算法分别计算每一个所述目标参考指令对应的指令得分;
根据所述指令得分在至少一个目标参考指令中确定与所述待识别指令对应的目标指令。
采用上述指令识别方法、装置、计算机设备及计算机可读存储介质之后,在用户输入指令之后,对指令进行识别并确定对应的目标关键词,然后在指令数据库中查找与目标关键词对应的多个目标参考指令,并且计算每一个目标参考指令对应的指令得分;最后根据指令得分来确定目标参考指令中的目标指令,目标指令用于发送给对应的控制设备并对控制设备进行控制。也就是说,针对用户输入的指令不是直接根据关键词匹配确定对应的目标指令,避免该种方案下可能存在的关键词匹配不准确的情况;通过关键词查找确定目标参考指令保证了所有关联的指令被考虑,然后通过指令得分的计算在目标参考指令中确定与用户输入的指令最为匹配的目标指令,从而提高了指令识别的准确性,提高了后续控制的准确性,提升了用户体验。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (8)
1.一种指令识别方法,所述方法包括:
获取输入的待识别指令,对所述待识别指令进行识别,获取与所述待识别指令对应的至少一个目标关键词;
在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令;
按照预设的指令评分算法分别计算每一个所述目标参考指令对应的指令得分;
根据所述指令得分在至少一个目标参考指令中确定与所述待识别指令对应的目标指令;
所述预设的格式化指令数据库中包含的每一个格式化指令分别设置有对应的至少一个指令参考词;所述在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令,还包括:遍历所述格式化指令数据库;对于遍历到的格式化指令,判断所述遍历到的格式化指令对应的指令参考词是否与所述目标关键词匹配;若是,则将所述遍历到的格式化指令作为所述目标参考指令;
所述预设的格式化指令数据库中包含的每一个格式化指令还分别设置有对应的缺省向量,所述缺省向量用于标识所述格式化指令对应的每一个指令参考词是否可以缺省;所述按照预设的指令评分算法分别计算每一个所述目标参考指令对应的指令得分,还包括:针对每一个目标参考指令:确定与所述目标参考指令对应的指令覆盖向量,根据所述指令覆盖向量计算与所述目标参考指令对应的第一得分,所述指令覆盖向量的元素值为0或1;确定与所述目标参考指令对应的加减分覆盖向量,根据所述加减分覆盖向量和所述目标参考指令对应的缺省向量计算与所述目标参考指令对应的第二得分,所述加减分覆盖向量的元素值为1或-1;根据所述第一得分和第二得分,确定与所述目标参考指令对应的指令得分。
2.根据权利要求1所述的指令识别方法,其特征在于,所述对所述待识别指令进行识别,获取与所述待识别指令对应的至少一个目标关键词,还包括:
根据预设的关键词数据库,确定与所述待识别指令对应的初始关键词;
根据预设的同义词数据库,获取与所述待识别指令对应的同义词,并确定与所述同义词对应的同义关键词;
根据所述初始关键词及同义关键词确定所述目标关键词。
3.根据权利要求1所述的指令识别方法,其特征在于,所述预设的格式化指令数据库包括指令索引,所述指令索引包括与每一个格式化指令对应的索引标识;
所述在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令,还包括:
将每一个所述目标关键词分别与所述指令索引包含的索引标识进行比对,以确定与每一个所述目标关键词对应的目标索引标识;
将与查找到的目标索引标识对应的格式化指令作为所述目标参考指令。
4.根据权利要求1所述的指令识别方法,其特征在于,所述根据所述指令得分在至少一个目标参考指令中确定与所述待识别指令对应的目标指令,还包括:
确定至少一个目标参考指令的指令得分中的最高值,将所述最高值对应的目标参考指令作为所述目标指令。
5.根据权利要求4所述的指令识别方法,其特征在于,所述将所述最高值对应的目标参考指令作为所述目标指令之前,还包括:
确定所述最高值对应的指令得分是否大于或等于预设的分值阈值;
在所述最高值对应的指令得分大于或等于预设的分值阈值的情况下,将所述最高值对应的目标参考指令作为所述目标指令。
6.一种指令识别装置,其特征在于,所述装置包括:
目标关键词获取模块,用于获取输入的待识别指令,对所述待识别指令进行识别,获取与所述待识别指令对应的至少一个目标关键词;
目标参考指令确定模块,用于在预设的格式化指令数据库中,查找与所述至少一个目标关键词对应的至少一个格式化指令作为目标参考指令;
指令得分计算模块,用于按照预设的指令评分算法分别计算每一个所述目标参考指令对应的指令得分;
目标指令确定模块,用于根据所述指令得分在至少一个目标参考指令中确定与所述待识别指令对应的目标指令;
所述预设的格式化指令数据库中包含的每一个格式化指令分别设置有对应的至少一个指令参考词;目标参考指令确定模块,具体用于遍历所述格式化指令数据库;对于遍历到的格式化指令,判断所述遍历到的格式化指令对应的指令参考词是否与所述目标关键词匹配;若是,则将所述遍历到的格式化指令作为所述目标参考指令;
所述预设的格式化指令数据库中包含的每一个格式化指令还分别设置有对应的缺省向量,所述缺省向量用于标识所述格式化指令对应的每一个指令参考词是否可以缺省;指令得分计算模块,具体用于:针对每一个目标参考指令:确定与所述目标参考指令对应的指令覆盖向量,根据所述指令覆盖向量计算与所述目标参考指令对应的第一得分,所述指令覆盖向量的元素值为0或1;确定与所述目标参考指令对应的加减分覆盖向量,根据所述加减分覆盖向量和所述目标参考指令对应的缺省向量计算与所述目标参考指令对应的第二得分,所述加减分覆盖向量的元素值为1或-1;根据所述第一得分和第二得分,确定与所述目标参考指令对应的指令得分。
7.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至5中任一项所述方法的步骤。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至5中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010129986.8A CN111309383B (zh) | 2020-02-28 | 2020-02-28 | 指令识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010129986.8A CN111309383B (zh) | 2020-02-28 | 2020-02-28 | 指令识别方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111309383A CN111309383A (zh) | 2020-06-19 |
CN111309383B true CN111309383B (zh) | 2022-05-20 |
Family
ID=71156636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010129986.8A Active CN111309383B (zh) | 2020-02-28 | 2020-02-28 | 指令识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111309383B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109815314A (zh) * | 2019-01-04 | 2019-05-28 | 平安科技(深圳)有限公司 | 一种意图识别方法、识别设备及计算机可读存储介质 |
CN110135692A (zh) * | 2019-04-12 | 2019-08-16 | 平安普惠企业管理有限公司 | 智能评级控制方法、装置、计算机设备及存储介质 |
CN110675870A (zh) * | 2019-08-30 | 2020-01-10 | 深圳绿米联创科技有限公司 | 一种语音识别方法、装置、电子设备及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8788260B2 (en) * | 2010-05-11 | 2014-07-22 | Microsoft Corporation | Generating snippets based on content features |
US10452842B2 (en) * | 2017-06-07 | 2019-10-22 | International Business Machines Corporation | Cognitive learning to counter security threats for kinematic actions in robots |
CN107995376A (zh) * | 2017-11-07 | 2018-05-04 | 平安科技(深圳)有限公司 | 一种用户报案处理方法及终端设备 |
CN109872053A (zh) * | 2019-01-28 | 2019-06-11 | 平安科技(深圳)有限公司 | 资产建议生成方法、装置、计算机设备和存储介质 |
CN109767787B (zh) * | 2019-01-28 | 2023-03-10 | 腾讯科技(深圳)有限公司 | 情绪识别方法、设备及可读存储介质 |
-
2020
- 2020-02-28 CN CN202010129986.8A patent/CN111309383B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109815314A (zh) * | 2019-01-04 | 2019-05-28 | 平安科技(深圳)有限公司 | 一种意图识别方法、识别设备及计算机可读存储介质 |
CN110135692A (zh) * | 2019-04-12 | 2019-08-16 | 平安普惠企业管理有限公司 | 智能评级控制方法、装置、计算机设备及存储介质 |
CN110675870A (zh) * | 2019-08-30 | 2020-01-10 | 深圳绿米联创科技有限公司 | 一种语音识别方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
Automatic Lecture Video Content Summarizationwith Attention-based Recurrent Neural Network;M. B. Andra;《2019 International Conference of Artificial Intelligence and Information Technology (ICAIIT)》;20190912;54-59 * |
语音关键词检索若干问题的研究;***;《中国博士学位论文全文数据库 信息科技辑》;20140115(第01期);I136-16 * |
Also Published As
Publication number | Publication date |
---|---|
CN111309383A (zh) | 2020-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10847146B2 (en) | Multiple voice recognition model switching method and apparatus, and storage medium | |
CN111325037B (zh) | 文本意图识别方法、装置、计算机设备和存储介质 | |
CN108595695B (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN111104495A (zh) | 基于意图识别的信息交互方法、装置、设备和存储介质 | |
CN110413730B (zh) | 文本信息匹配度检测方法、装置、计算机设备和存储介质 | |
CN108427707B (zh) | 人机问答方法、装置、计算机设备和存储介质 | |
CN110689881B (zh) | 语音识别方法、装置、计算机设备和存储介质 | |
CN112668313A (zh) | 句子智能纠错方法、装置、计算机设备及存储介质 | |
CN110688853B (zh) | 序列标注方法、装置、计算机设备和存储介质 | |
CN112446218A (zh) | 长短句文本语义匹配方法、装置、计算机设备及存储介质 | |
WO2022052505A1 (zh) | 基于依存句法的句子主干抽取方法、设备和可读存储介质 | |
CN111737987B (zh) | 意图识别方法、装置、设备及存储介质 | |
US20190095447A1 (en) | Method, apparatus, device and storage medium for establishing error correction model based on error correction platform | |
CN109614627B (zh) | 一种文本标点预测方法、装置、计算机设备及存储介质 | |
CN113506574A (zh) | 自定义命令词的识别方法、装置和计算机设备 | |
CN110970022B (zh) | 一种终端控制方法、装置、设备以及可读介质 | |
CN111191032A (zh) | 语料扩充方法、装置、计算机设备和存储介质 | |
CN111368061B (zh) | 短文本过滤方法、装置、介质及计算机设备 | |
CN112766319A (zh) | 对话意图识别模型训练方法、装置、计算机设备及介质 | |
CN114678027A (zh) | 语音识别结果的纠错方法、装置、终端设备及存储介质 | |
CN111309383B (zh) | 指令识别方法、装置、设备及存储介质 | |
CN116644183B (zh) | 文本分类方法、装置及存储介质 | |
CN113160800A (zh) | 语音数据标注方法及电子设备、存储装置 | |
CN115858776B (zh) | 一种变体文本分类识别方法、***、存储介质和电子设备 | |
CN110764423A (zh) | 家电设备的控制方法及装置、家电设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |