CN109063221A - 基于混合策略的查询意图识别方法和装置 - Google Patents
基于混合策略的查询意图识别方法和装置 Download PDFInfo
- Publication number
- CN109063221A CN109063221A CN201811301126.7A CN201811301126A CN109063221A CN 109063221 A CN109063221 A CN 109063221A CN 201811301126 A CN201811301126 A CN 201811301126A CN 109063221 A CN109063221 A CN 109063221A
- Authority
- CN
- China
- Prior art keywords
- query
- intended
- candidate
- semantic
- candidate query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提出一种基于混合策略的查询意图识别方法和装置,方法包括:获取用户的查询语句;根据用户的查询语句,利用语义规则模板获取第一候选查询意图;根据用户的查询语句,利用机器学习模型获取第二候选查询意图;将第一候选查询意图与第二候选查询意图进行匹配;若第一候选查询意图与第二候选查询意图匹配成功,则作为语义查询意图输出;第一候选查询意图、第二候选查询意图以及语义查询意图均至少为一个。本发明实施例通过将语义规则模板和机器学习模型两种识别方式结合进行查询意图识别,能够更好的对用户的查询语句的查询意图进行理解,提高了语义识别能力和理解效果。
Description
技术领域
本发明涉及语音识别技术领域,尤其涉及一种基于混合策略的查询意图识别方法和装置。
背景技术
目前,对于用户的语义查询意图的识别方法主要为利用规则模板或机器学习模型进行识别。但是,使用规则模板虽然对查询语句中的词槽识别效果较好,但是对于意图的泛化识别效果有限,不能够准确的识别出用户的查询意图。而使用机器学习模型虽然对于意图分类识别效果较好,但对于词槽的识别效果不理想。并且,机器学习模型需要几十万的标注样本才能训练出有较好识别效果的模型,但是一般用户并不能够提供如此多的标注数据,且如此构建模型成本较高。另一方面,用户的查询语言通常更偏于口语化,与传统搜索场景的语言特征差别较大,如果无法准确的获取语义特征,则无法很好的识别出用户的查询意图。
在背景技术中公开的上述信息仅用于加强对本发明的背景的理解,因此其可能包含没有形成为本领域普通技术人员所知晓的现有技术的信息。
发明内容
本发明实施例提供一种基于混合策略的查询意图识别方法和装置,以解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种基于混合策略的查询意图识别方法,包括:
获取用户的查询语句;
根据所述用户的查询语句,利用语义规则模板获取第一候选查询意图;
根据所述用户的查询语句,利用机器学习模型获取第二候选查询意图;
将所述第一候选查询意图与所述第二候选查询意图进行匹配;
若所述第一候选查询意图与所述第二候选查询意图匹配成功,则作为语义查询意图输出;
其中,所述第一候选查询意图、所述第二候选查询意图以及所述语义查询意图均至少为一个。
在一个实施方式中,还包括:
若所述第一候选查询意图与所述第二候选查询意图匹配失败,则降低所述语义规则模板的查询覆盖率;
利用降低查询覆盖率的语义规则模板重新获取所述第一候选查询意图;
将重新获取的所述第一候选查询意图与所述第二候选查询意图进行匹配;
若重新获取的所述第一候选查询意图与所述第二候选查询意图匹配成功,则作为所述语义查询意图输出。
在一个实施方式中,当所述第一候选查询意图和所述第二候选查询意图均为多个时,将所述第一候选查询意图与所述第二候选查询意图进行匹配,包括:
将各所述第一候选查询意图和各所述第二候选查询意图根据置信度进行排序;
将所述置信度高于阈值置信度的各所述第一候选查询意图和各所述第二候选查询意图筛选出并进行匹配。
在一个实施方式中,根据所述用户的查询语句,利用语义规则模板获取第一候选查询意图,包括:
对所述用户的查询语句进行解析,提取出多个语义特征;
将各所述语义特征与预设的语义片段规则进行匹配,得到多个语义片段;
基于各所述语义片段,从所述语义规则模板的各预存查询意图中筛选出至少一个所述第一候选查询意图;其中,所述第一候选查询意图中包含所述语义片段。
在一个实施方式中,基于各所述语义片段,从所述语义规则模板的各预存查询意图中筛选出至少一个所述第一候选查询意图,包括:
根据预定义筛选规则,从所述语义规则模板的各预存查询意图中筛选出至少一个所述第一候选查询意图。
在一个实施方式中,所述预定义筛选规则包括:是否满足所述预存查询意图中的各语义片段的排列规则、是否具有所述预存查询意图中的关键语义片段、是否达到所述预存查询意图中的语义片段覆盖率的阈值要求中的至少一个。
在一个实施方式中,根据所述用户的查询语句,利用机器学习模型获取第二候选查询意图,包括:
提取出所述用户的查询语句中的特征数据;
将所述特征数据转化为特征向量,并输入到所述机器学习模型中进行处理;
根据处理结果确定所述第二候选查询意图。
在一个实施方式中,所述特征数据包括:基本分词特征、词性特征以及命名实体标注特征。
第二方面,本发明实施例提供了一种基于混合策略的查询意图识别装置,包括:
获取模块,用于获取用户的查询语句;
第一模板模块,用于根据所述用户的查询语句,利用语义规则模板获取第一候选查询意图;
学习模型模块,用于根据所述用户的查询语句,利用机器学习模型获取第二候选查询意图;
第一匹配模块,用于将所述第一候选查询意图与所述第二候选查询意图进行匹配;若所述第一候选查询意图与所述第二候选查询意图匹配成功,则作为语义查询意图输出。
在一个实施方式中,还包括:
覆盖率调整模块,用于若所述第一候选查询意图与所述第二候选查询意图匹配失败,则降低所述语义规则模板的查询覆盖率;
第二模板模块,用于利用降低查询覆盖率的语义规则模板重新获取所述第一候选查询意图;
第二匹配模块,用于将重新获取的所述第一候选查询意图与所述第二候选查询意图进行匹配;若重新获取的所述第一候选查询意图与所述第二候选查询意图匹配成功,则作为所述语义查询意图输出。
在一个实施方式中,所述第一模板模块包括:
特征子模块,用于对所述用户的查询语句进行解析,提取出多个语义特征;
匹配子模块,用于将各所述语义特征与预设的语义片段规则进行匹配,得到多个语义片段;
筛选子模块,用于基于各所述语义片段,从所述语义规则模板的各预存查询意图中筛选出至少一个所述第一候选查询意图;其中,所述第一候选查询意图中包含所述语义片段。
在一个实施方式中,所述学习模型模块包括:
提取子模块,用于提取出所述用户的查询语句中的特征数据;
处理子模块,用于将所述特征数据转化为特征向量,并输入到所述机器学习模型中进行处理;
确定子模块,用于根据处理结果确定所述第二候选查询意图。
第三方面,本发明实施例提供了一种基于混合策略的查询意图识别的终端,包括:
所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,基于混合策略的查询意图识别的终端的结构中包括处理器和存储器,所述存储器用于存储支持基于混合策略的查询意图识别的终端执行上述第一方面中基于混合策略的查询意图识别方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。基于混合策略的查询意图识别的终端还可以包括通信接口,用于基于混合策略的查询意图识别的终端与其他设备或通信网络通信。
第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储基于混合策略的查询意图识别的终端所用的计算机软件指令,其包括用于执行上述第一方面中基于混合策略的查询意图识别方法为基于混合策略的查询意图识别的终端所涉及的程序。
上述技术方案中的一个技术方案具有如下优点或有益效果:通过将语义规则模板和机器学习模型两种识别方式结合进行查询意图识别,能够更好的对用户的查询语句的查询意图进行理解,提高了语义识别能力和理解效果。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1为本发明实施方式提供的基于混合策略的查询意图识别方法的流程图。
图2为本发明另一实施方式提供的基于混合策略的查询意图识别方法的流程图。
图3为本发明实施方式的步骤S200的流程图。
图4为本发明实施方式提供的天气查询意图的示意图。
图5为本发明实施方式提供的根据语义规则模板获取第一候选查询意图的流程框图。
图6为本发明实施方式的步骤S300的流程图。
图7为本发明实施方式的机器学习模型获取第二候选查询意图的流程框图。
图8为本发明实施方式提供的基于混合策略的查询意图识别方法的流程框图。
图9为本发明实施方式提供的基于混合策略的查询意图识别装置的结构示意图。
图10为本发明另一实施方式提供的基于混合策略的查询意图识别装置的结构示意图。
图11为本发明实施方式提供的基于混合策略的查询意图识别终端结构示意图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
本发明实施例提供了一种基于混合策略的查询意图识别方法,如图1所示,包括以下步骤:
S100:获取用户的查询语句。
S200:根据用户的查询语句,利用语义规则模板获取第一候选查询意图。第一候选查询意图为一个或多个。当第一候选查询意图为多个时,可按候选列表的方式排列,且可按一定规则进行排序。例如,按各第一候选查询意图的置信度进行排序。
S300:根据用户的查询语句,利用机器学习模型获取第二候选查询意图。第二候选查询意图为一个或多个。当第二候选查询意图为多个时,各第二候选查询意图可按置信度进行排序。
S400:将第一候选查询意图与第二候选查询意图进行匹配。
S500:若第一候选查询意图与第二候选查询意图匹配成功,则作为语义查询意图输出。匹配成功可以理解为第一候选意图与第二候选意图相同或相近似,则将相同的候选意图或是相近似的两个候选意图作为语义查询意图输出。其中,相近似的候选意图可以理解为,第一候选意图和第二候选意图均为询问某时某地的天气情况,但是两个候选意图的答复语句可能略有不同,但是均能够满足用户的查询语句要求。
在一个实施例中,如图2所示,若第一候选查询意图与第二候选查询意图匹配失败,包括步骤:
S600:降低语义规则模板的查询覆盖率。本实施例中的语义规则模板可以是可动态变化查询覆盖率的无序规则模板。查询覆盖率可以理解为用户的查询语句中的字、词或句子与语义规则模板中预定义的字、词或句子的重复度。
S700:利用降低查询覆盖率的语义规则模板重新获取第一候选查询意图。
S800:将重新获取的第一候选查询意图与第二候选查询意图进行匹配。
S900:若重新获取的第一候选查询意图与第二候选查询意图匹配成功,则作为语义查询意图输出。
在一个应用示例中,当调高语义规则模板的查询覆盖率时,由于对字、词或句子的重复度要求较高,因此能够筛选出的第一候选查询意图会相对较少。若能够从语义规则模板中匹配到对应的一候选查询结果,则可以认为该第一候选查询结果与用户的查询语句的语义匹配度或置信度高。当调低语义规则模板的查询覆盖率时,由于对字、词或句子的重复度要求较低,因此能够筛选出的第一候选查询意图会相对较多,从而增加了与第二候选查询意图匹配成功的机率。
在一个实施例中,根据用户的查询语句,利用语义规则模板获取第一候选查询意图,包括:
若获取不到第一候选查询意图时,则降低语义规则模板的覆盖率。
利用降低覆盖率的语义规则模板重新根据用户的查询语句获取第一候选查询意图。
在一个实施例中,当第一候选查询意图和第二候选查询意图均为多个时,将第一候选查询意图与第二候选查询意图进行匹配,包括:
将各第一候选查询意图和各第二候选查询意图根据置信度进行排序。
将置信度高于阈值置信度的各第一候选查询意图和各第二候选查询意图筛选出并进行匹配。这样可以提高匹配效率,并且提高匹配准确度。
在一个可变化的实施例中,若第一候选查询意图和第二候选查询意图均为多个,但是数量较少时,也可将所有的第一候选查询意图和第二候选查询意图进行匹配。从而提高第一候选查询意图和第二候选查询意图匹配成功的机率。
在一个实施例中,如图3所示,根据用户的查询语句,利用语义规则模板获取第一候选查询意图,包括:
S210:对用户的查询语句进行解析,提取出多个语义特征。
S220:将各语义特征与预设的语义片段规则进行匹配,得到多个语义片段。
S230:基于各语义片段,从语义规则模板的各预存查询意图中筛选出至少一个第一候选查询意图;其中,第一候选查询意图中包含语义片段。
在一个实施例中,基于各语义片段,从语义规则模板的各预存查询意图中筛选出至少一个第一候选查询意图,包括:
根据预定义筛选规则,从语义规则模板的各预存查询意图中筛选出至少一个第一候选查询意图。预定义筛选规则可根据工作需要进行选择。
例如,预定义筛选规则可以包括:是否满足预存查询意图中的各语义片段的排列规则。用户可以预先指定预存查询意图中各语义片段之间的顺序。顺序可以用非负整数来表示。如果一个语义片段的顺序字段为0,表明它的位置不受任何限制。如果一个语义片段的顺序字段为一个正整数,那么解析算法会要求位置数小的语义片段在query(查询)中位于位置数大的语义片段的前面。如果两个语义片段的位置值是相同的正整数,那么它们之间的相对顺序不受限制。
预定义筛选规则还可以包括:是否具有预存查询意图中的关键语义片段,和/或,是否达到预存查询意图中的语义片段覆盖率的阈值要求中的至少一个。用户可以定义语义片段的必要性(关键性)、可识别部分覆盖率。用户可以指定哪个语义片段对于识别意图是必须的,比如“天气”这个关键词是识别询问天气意图所必须的,只有在query中可以匹配到这个语义片段的时候,才可以识别出这个意图。当我们完成对一个query的解析之后,它的槽位、query中已识别的口语化片段、已知的停用词共同构成了这条query的可识别部分,剩余的则为不可识别的部分。不可识别部分占比越高,该结果也越不可信。因此,用户(或开发者)可以指定一个可识别部分覆盖率的阈值,算法只有在覆盖率高于这个阈值的时候,才会输出解析结果,否则算法会认为该query无法解析。通过控制这个阈值,用户也可以在精确率和召回率之间进行调控。
在一个应用示例中,语义规则模板的各预存查询意图的语义片段匹配规则可自行定义。如图4所示,一个预存的天气查询意图的语义片段匹配规则可以包括语义片段的槽位,例如,[D:loc](匹配地点槽位,如“北京”)、[D:time](匹配时间槽位,如“今天”)。还可以包括关键词,例如,“天气”的是否必要的字段为1,匹配地点槽位、匹配时间槽位的是否必要的字段为0,则认为“天气”为天气查询意图中的关键词,即必须存在。还可以包括槽位顺序,例如,匹配地点槽位、匹配时间槽位和关键词三者的顺序位字段均为0,表示三者顺序不受限制。还可以包括覆盖率阈值,只有用户查询语句的覆盖率大于0.9时才可以将该天气查询意图作为第一候选查询意图筛选出。
需要说明的是,语义片段匹配规则可以是一段具体的文本、一个槽位,也可以是槽位、通配、文字的组合,如“从[D:start][W:0-4]到[D:arrival]”([D:start]是出发地槽位,[D:arrival]是到达地槽位,[W:0-4]是通配)。语义规则模板的算法将会尝试用这些规则与query(可以理解为用户的查询语句)中的一部分进行匹配,匹配到的部分即为局部语义片段。如在query“从北京出发到上海的路线”中,规则“从[D:start][W:0-4]到[D:arrival]”可以匹配到局部语义片段“从北京出发到上海”。
在一个实施方式中,在对用户的查询语句进行解析,提取出多个语义特征后,还可以包括以下步骤:
对于每一条输入的query,首先使用命名实体识别工具(NER,named entityrecognition)识别其中的命名实体。用口语化识别工具、通用片段词典等识别其中的口语化片段、通用的无意义片段,如“我想要”、“帮我查”、“肯德基评价咋样啊”中的“咋样啊”等。然后在使用语义规则模板进行局部匹配,将定义的语义片段规则与query进行匹配,获得语义片段的候选结果。在此基础上,我们基于语义片段-意图的倒排索引,获取所有可能的意图,构成意图候选列表。最后,基于开发者所编写的规则,我们计算一系列的启发式特征,如片段顺序评分、片段必要性是否满足、可识别部分的覆盖率等,基于它们来对候选的结果进行评分,从而获取最优的解析结果。这种启发式的结果调节方式的复杂度相比人工调整模板优先级有了显著下降。
在一个应用示例中,如图5所示,当用户的查询语句为“今天北京天气咋样”时,可先通过通过对用户的查询语句进行解析,将该查询语句拆分为“今天”、“北京”、“天气”和“咋样”四部分。通过命名实体识别工具、口语片段预测、通用片段词典和规则匹配识别出其中的口语化片段和语义片段。即“咋样”为口语化片段,“今天”与时间语义片段规则匹配,“北京”与地点语义片段规则匹配,“天气”与关键词语义片段规则匹配。基于语义片段的筛选结果,利用倒排索引从预存查询意图中筛选出了天气(WEATHER)查询意图和下雨(RAIN)查询意图。进一步的,基于覆盖率,将天气查询意图作为优选的第一候选查询意图。
在一个实施例中,如图6所示,根据用户的查询语句,利用机器学习模型获取第二候选查询意图,包括:
S310:提取出用户的查询语句中的特征数据。
S320:将特征数据转化为特征向量,并输入到机器学习模型中进行处理。其中,机器学习模型是提前训练好的学习模型。
S330:根据处理结果确定第二候选查询意图。
在一个实施例中,特征数据至少包括:基本分词特征、词性特征以及命名实体标注特征。
在一个应用示例中,如图7所示,机器学习模型是基于深度神经网络的分类模型,由两部分构成,位于下端的基于卷积神经网络的Query表示学习模块,以及位于上端的Query意图分类模块。机器学习模型的输入是用户查询Query,输出是该Query的意图。具体的,机器学习模型通过提取用户输入Query中的特征数据,例如,基本分词信息、词性信息和命名实体词性标注信息,将这些作为Query的特征表示并进行融合,并转化为卷积神经网络对应的输入层数据,通过计算最后得到用户领域意图分类(识别)并输出分类(识别)结果。
在一个应用示例中,机器学习模型进行训练时,首先需要构造训练语料,具体的方式为标注一定数量的领域内的带有意图标签的训练语料。接着对训练语料进行分词和特征抽取,Query中的每个词共抽取三种特征:基本分词特征、词性特征和命名实体标注特征。之后通过词嵌入表示层把三种特征分别转换为特征向量,再把这三种特征向量进行拼接融合作为Query中每个词的特征表示。然后使用卷积神经网络和MaxPooling(最大池化)进一步提取特征。最后通过Softmax层使用多分类常用的交叉熵损失,通过端到端的模式训练整个神经网络模型的参数,得到最终模型。预测时,对于每一条查询输入Query,同样经过分词、特征提取、词向量、卷积神经网络和Softmax的过程后,得到Query最终的领域意图分类结果。
在一个应用示例中,如图8所示,首先,采用L1级别,通过user(用户)模式的语义规则模板以较高的COVER率进行处理,若得到对应的第一候选查询意图,则可以直接作为语义查询意图进行输出,也可将其作为优选语义查询意图供后续机器学习模型以匹配拼接的方式择优。然后,采用L2级别,降低user语义规则模板的COVER率进行处理,再次筛选多个第一候选查询意图作为候选列表,供机器学习模型以匹配拼接的方式择优。如无结果则采用L3级别,改用具有更强大召回能力的Schema(对象集合)模式的语义规则模板以0覆盖率进行处理,并得到多个第一候选查询意图作为获得候选列表,供机器学习***以匹配拼接方式择优输出。通过将语义规则模板的结果和机器学习模型的结果逐级融合的方式,提高了用户的查询语句的语义理解准确率。
在一个可变化的应用示例中,可采用一个能够动态调节覆盖率的语义规则模板代替user模式的语义规则模板和Schema模式的语义规则模板相结合的方式。
本发明实施例提供了一种基于混合策略的查询意图识别装置,如图9所示,包括以下步骤:
获取模块10,用于获取用户的查询语句。
第一模板模块20,用于根据用户的查询语句,利用语义规则模板获取第一候选查询意图。
学习模型模块30,用于根据用户的查询语句,利用机器学习模型获取第二候选查询意图。
第一匹配模块40,用于将第一候选查询意图与第二候选查询意图进行匹配;若第一候选查询意图与第二候选查询意图匹配成功,则作为语义查询意图输出。
在一个实施例中,如图10所示,还包括:
覆盖率调整模块50,用于若第一候选查询意图与第二候选查询意图匹配失败,则降低语义规则模板的查询覆盖率。
第二模板模块60,用于利用降低查询覆盖率的语义规则模板重新获取第一候选查询意图。
第二匹配模块70,用于将重新获取的第一候选查询意图与第二候选查询意图进行匹配;若重新获取的第一候选查询意图与第二候选查询意图匹配成功,则作为语义查询意图输出。
在一个实施例中,第一模板模块包括:
特征子模块,用于对用户的查询语句进行解析,提取出多个语义特征;
匹配子模块,用于将各语义特征与预设的语义片段规则进行匹配,得到多个语义片段;
筛选子模块,用于基于各语义片段,从语义规则模板的各预存查询意图中筛选出至少一个第一候选查询意图;其中,第一候选查询意图中包含语义片段。
在一个实施例中,学习模型模块包括:
提取子模块,用于提取出用户的查询语句中的特征数据;
处理子模块,用于将特征数据转化为特征向量,并输入到机器学习模型中进行处理;
确定子模块,用于根据处理结果确定第二候选查询意图。
本发明实施例提供了一种基于混合策略的查询意图识别的终端,如图11所示,包括:
存储器910和处理器920,存储器910内存储有可在处理器920上运行的计算机程序。处理器920执行计算机程序时实现上述实施例中的基于混合策略的查询意图识别方法。存储器910和处理器920的数量可以为一个或多个。
通信接口930,用于存储器910和处理器920与外部进行通信。
存储器910可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器910、处理器920、以及通信接口930独立实现,则存储器910、处理器920以及通信接口930可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent Interconnect)总线或扩展工业标准体系结构(EISA,Extended IndustryStandard Component)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图11中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器910、处理器920以及通信接口930集成在一块芯片上,则存储器910、处理器920及通信接口930可以通过内部接口完成相互间的通信。
本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现如实施例一包括的任一所述的基于混合策略的查询意图识别方法。
本发明实施例具有以下优点:通过将机器学习模型和语义模板规则技术相融合,(模板规则负责擅长的词槽识别,机器学习负责擅长的意图识别),在保证询问理解的稳定效果前提下,使得机器学习模型和模板规则的模板在利用较少的训练数据(即冷启动时)的情况下,还能够取得更好的询问意图理解效果。更好的利用了机器学习模型和模板规则各自的优势,能够使得人们根据领域知识快速的构建并具有意图泛化识别能力,随时改进询问理解效果。对于询问语义理解来说是重要的技术储备和前瞻探索。
为了证明本发明实施例的技术效果,我们选取了天气、美食、电影、电视盒子、订餐、客服、导航等场景,对于只标注实例、只标注模板、标注实例和模板这三种类型的数据进行验证,其中既有值标注意图未标注槽位,也有标注了意图和槽位的,还有标注模板的多种组合方式的数据,代表了目前平台能够提供的所有组合标注方式。
口语理解的评价采用两种维度,一种是针对口语理解本身的评价,一种是针对口语理解在对话***中应用效果的评价。针对口语理解本身的评价采用常见的准确率(Precison),召回率(Precall)和F值(F-measure)指标。评价所基于的数据集有两种,目标集和随机集。目标集仅包括含有用户意图的查询语句即正例,目标集还要包括不含用户意图的查询语句即负例。在目标集上,意图分类精度用准确率衡量;在随机集上,意图分类精度用准确率和召回率衡量;在目标集和随机集上,词槽识别精度用准确率、召回率和F值来衡量。针对口语理解在对话***中应用效果的评价,我们采用考虑召回的准确率(R-Precison:从召回的前N个数据中,计算正确的结果占N个数据的百分比)来衡量。
整体效果在电影、导航、电视盒子、订票、天气等垂类上,在同样的近1000条较少的训练数据下,单轮R-Precision从83%提升到88%;比单独使用模板规则、单独使用机器学***均提升7%。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (14)
1.一种基于混合策略的查询意图识别方法,其特征在于,包括:
获取用户的查询语句;
根据所述用户的查询语句,利用语义规则模板获取第一候选查询意图;
根据所述用户的查询语句,利用机器学习模型获取第二候选查询意图;
将所述第一候选查询意图与所述第二候选查询意图进行匹配;
若所述第一候选查询意图与所述第二候选查询意图匹配成功,则作为语义查询意图输出;
其中,所述第一候选查询意图、所述第二候选查询意图以及所述语义查询意图均至少为一个。
2.如权利要求1所述的方法,其特征在于,还包括:
若所述第一候选查询意图与所述第二候选查询意图匹配失败,则降低所述语义规则模板的查询覆盖率;
利用降低查询覆盖率的语义规则模板重新获取所述第一候选查询意图;
将重新获取的所述第一候选查询意图与所述第二候选查询意图进行匹配;
若重新获取的所述第一候选查询意图与所述第二候选查询意图匹配成功,则作为所述语义查询意图输出。
3.如权利要求1所述的方法,其特征在于,当所述第一候选查询意图和所述第二候选查询意图均为多个时,将所述第一候选查询意图与所述第二候选查询意图进行匹配,包括:
将各所述第一候选查询意图和各所述第二候选查询意图根据置信度进行排序;
将所述置信度高于阈值置信度的各所述第一候选查询意图和各所述第二候选查询意图筛选出并进行匹配。
4.如权利要求1所述的方法,其特征在于,根据所述用户的查询语句,利用语义规则模板获取第一候选查询意图,包括:
对所述用户的查询语句进行解析,提取出多个语义特征;
将各所述语义特征与预设的语义片段规则进行匹配,得到多个语义片段;
基于各所述语义片段,从所述语义规则模板的各预存查询意图中筛选出至少一个所述第一候选查询意图;其中,所述第一候选查询意图中包含所述语义片段。
5.如权利要求4所述的方法,其特征在于,基于各所述语义片段,从所述语义规则模板的各预存查询意图中筛选出至少一个所述第一候选查询意图,包括:
根据预定义筛选规则,从所述语义规则模板的各预存查询意图中筛选出至少一个所述第一候选查询意图。
6.如权利要求5所述的方法,其特征在于,所述预定义筛选规则包括:是否满足所述预存查询意图中的各语义片段的排列规则、是否具有所述预存查询意图中的关键语义片段、是否达到所述预存查询意图中的语义片段覆盖率的阈值要求中的至少一个。
7.如权利要求1所述的方法,其特征在于,根据所述用户的查询语句,利用机器学习模型获取第二候选查询意图,包括:
提取出所述用户的查询语句中的特征数据;
将所述特征数据转化为特征向量,并输入到所述机器学习模型中进行处理;
根据处理结果确定所述第二候选查询意图。
8.如权利要求7所述的方法,其特征在于,所述特征数据包括:基本分词特征、词性特征以及命名实体标注特征。
9.一种基于混合策略的查询意图识别装置,其特征在于,包括:
获取模块,用于获取用户的查询语句;
第一模板模块,用于根据所述用户的查询语句,利用语义规则模板获取第一候选查询意图;
学习模型模块,用于根据所述用户的查询语句,利用机器学习模型获取第二候选查询意图;
第一匹配模块,用于将所述第一候选查询意图与所述第二候选查询意图进行匹配;若所述第一候选查询意图与所述第二候选查询意图匹配成功,则作为语义查询意图输出。
10.如权利要求9所述的装置,其特征在于,还包括:
覆盖率调整模块,用于若所述第一候选查询意图与所述第二候选查询意图匹配失败,则降低所述语义规则模板的查询覆盖率;
第二模板模块,用于利用降低查询覆盖率的语义规则模板重新获取所述第一候选查询意图;
第二匹配模块,用于将重新获取的所述第一候选查询意图与所述第二候选查询意图进行匹配;若重新获取的所述第一候选查询意图与所述第二候选查询意图匹配成功,则作为所述语义查询意图输出。
11.如权利要求9所述的装置,其特征在于,所述第一模板模块包括:
特征子模块,用于对所述用户的查询语句进行解析,提取出多个语义特征;
匹配子模块,用于将各所述语义特征与预设的语义片段规则进行匹配,得到多个语义片段;
筛选子模块,用于基于各所述语义片段,从所述语义规则模板的各预存查询意图中筛选出至少一个所述第一候选查询意图;其中,所述第一候选查询意图中包含所述语义片段。
12.如权利要求9所述的装置,其特征在于,所述学习模型模块包括:
提取子模块,用于提取出所述用户的查询语句中的特征数据;
处理子模块,用于将所述特征数据转化为特征向量,并输入到所述机器学习模型中进行处理;
确定子模块,用于根据处理结果确定所述第二候选查询意图。
13.一种基于混合策略的查询意图识别终端,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至8中任一项所述的方法。
14.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811301126.7A CN109063221B (zh) | 2018-11-02 | 2018-11-02 | 基于混合策略的查询意图识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811301126.7A CN109063221B (zh) | 2018-11-02 | 2018-11-02 | 基于混合策略的查询意图识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109063221A true CN109063221A (zh) | 2018-12-21 |
CN109063221B CN109063221B (zh) | 2021-04-09 |
Family
ID=64789049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811301126.7A Active CN109063221B (zh) | 2018-11-02 | 2018-11-02 | 基于混合策略的查询意图识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109063221B (zh) |
Cited By (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109948155A (zh) * | 2019-03-12 | 2019-06-28 | 广东小天才科技有限公司 | 一种多意图的选择方法及装置、终端设备 |
CN110008319A (zh) * | 2019-02-27 | 2019-07-12 | 百度在线网络技术(北京)有限公司 | 基于对话模板的模型训练方法和装置 |
CN110046346A (zh) * | 2019-03-18 | 2019-07-23 | 广东小天才科技有限公司 | 一种语料意图监控的方法和装置、终端设备 |
CN110096595A (zh) * | 2019-05-06 | 2019-08-06 | 上海互问信息科技有限公司 | 一种基于混合策略的复句用户查询语句的意图识别方法 |
CN110162538A (zh) * | 2019-04-19 | 2019-08-23 | 平安科技(深圳)有限公司 | 自动生成通用查询语言cql的方法、装置和计算机设备 |
CN110245348A (zh) * | 2019-05-17 | 2019-09-17 | 北京百度网讯科技有限公司 | 一种意图识别方法及*** |
CN110334340A (zh) * | 2019-05-06 | 2019-10-15 | 北京泰迪熊移动科技有限公司 | 基于规则融合的语义分析方法、装置以及可读存储介质 |
CN110377911A (zh) * | 2019-07-23 | 2019-10-25 | 中国工商银行股份有限公司 | 对话框架下的意图识别方法和装置 |
CN110502608A (zh) * | 2019-07-05 | 2019-11-26 | 平安科技(深圳)有限公司 | 基于知识图谱的人机对话方法及人机对话装置 |
CN110543633A (zh) * | 2019-08-29 | 2019-12-06 | 腾讯科技(深圳)有限公司 | 语句意图识别方法、装置 |
CN110674259A (zh) * | 2019-09-27 | 2020-01-10 | 北京百度网讯科技有限公司 | 意图理解方法和装置 |
CN110704641A (zh) * | 2019-10-11 | 2020-01-17 | 零犀(北京)科技有限公司 | 一种万级意图分类方法、装置、存储介质及电子设备 |
CN110795547A (zh) * | 2019-10-18 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 文本识别方法和相关产品 |
CN110825949A (zh) * | 2019-09-19 | 2020-02-21 | 平安科技(深圳)有限公司 | 基于卷积神经网络的信息检索方法、及其相关设备 |
CN110827831A (zh) * | 2019-11-15 | 2020-02-21 | 广州洪荒智能科技有限公司 | 基于人机交互的语音信息处理方法、装置、设备及介质 |
CN111400607A (zh) * | 2020-06-04 | 2020-07-10 | 浙江口碑网络技术有限公司 | 搜索内容输出方法、装置、计算机设备及可读存储介质 |
CN111523311A (zh) * | 2020-04-21 | 2020-08-11 | 上海优扬新媒信息技术有限公司 | 一种搜索意图识别方法及装置 |
CN111680517A (zh) * | 2020-06-10 | 2020-09-18 | 北京百度网讯科技有限公司 | 用于训练模型的方法、装置、设备以及存储介质 |
CN111813903A (zh) * | 2020-05-25 | 2020-10-23 | 车智互联(北京)科技有限公司 | 一种问句匹配方法和计算设备 |
CN111832305A (zh) * | 2020-07-03 | 2020-10-27 | 广州小鹏车联网科技有限公司 | 一种用户意图识别方法、装置、服务器和介质 |
CN111858900A (zh) * | 2020-09-21 | 2020-10-30 | 杭州摸象大数据科技有限公司 | 问句语义解析规则模板的生成方法、装置、设备及存储介质 |
CN111966781A (zh) * | 2020-06-28 | 2020-11-20 | 北京百度网讯科技有限公司 | 数据查询的交互方法及装置、电子设备和存储介质 |
CN112149429A (zh) * | 2020-10-21 | 2020-12-29 | 成都小美伴旅信息技术有限公司 | 一种基于词槽序模型的高准确度语义理解识别方法 |
CN112364659A (zh) * | 2020-07-08 | 2021-02-12 | 西湖大学 | 一种无监督的语义表示自动识别方法及装置 |
CN112380973A (zh) * | 2020-11-12 | 2021-02-19 | 深兰科技(上海)有限公司 | 交通信号灯的识别方法和*** |
CN112395394A (zh) * | 2020-11-27 | 2021-02-23 | 安徽迪科数金科技有限公司 | 短文本语义理解模板检验方法、模板生成方法及装置 |
CN112560425A (zh) * | 2020-12-24 | 2021-03-26 | 北京百度网讯科技有限公司 | 模板生成方法、装置、电子设备及存储介质 |
WO2021057250A1 (zh) * | 2019-09-24 | 2021-04-01 | 苏宁云计算有限公司 | 一种商品搜索的查询策略的生成方法及装置 |
CN112988784A (zh) * | 2021-04-26 | 2021-06-18 | 广州思迈特软件有限公司 | 数据查询方法、查询语句生成方法及其装置 |
CN113010768A (zh) * | 2019-12-19 | 2021-06-22 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN113449089A (zh) * | 2021-06-11 | 2021-09-28 | 车智互联(北京)科技有限公司 | 一种查询语句的意图识别方法、问答方法及计算设备 |
CN113901837A (zh) * | 2021-10-19 | 2022-01-07 | 斑马网络技术有限公司 | 一种意图理解方法、装置、设备及存储介质 |
US11436528B2 (en) | 2019-08-16 | 2022-09-06 | International Business Machines Corporation | Intent classification distribution calibration |
CN115168436A (zh) * | 2022-07-20 | 2022-10-11 | 贝壳找房(北京)科技有限公司 | 查询信息处理方法、电子设备及可读存储介质 |
CN116244413A (zh) * | 2022-12-27 | 2023-06-09 | 北京百度网讯科技有限公司 | 新意图确定方法、设备和存储介质 |
CN116542136A (zh) * | 2023-04-13 | 2023-08-04 | 南京大学 | 一种通用的学件查搜与复用的方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101770453A (zh) * | 2008-12-31 | 2010-07-07 | 华建机器翻译有限公司 | 基于领域本体结合机器学习模型的汉语文本共指消解方法 |
CN106156003A (zh) * | 2016-06-30 | 2016-11-23 | 北京大学 | 一种问答***中的问句理解方法 |
CN107220235A (zh) * | 2017-05-23 | 2017-09-29 | 北京百度网讯科技有限公司 | 基于人工智能的语音识别纠错方法、装置及存储介质 |
CN108304466A (zh) * | 2017-12-27 | 2018-07-20 | ***股份有限公司 | 一种用户意图识别方法以及用户意图识别*** |
CN108549656A (zh) * | 2018-03-09 | 2018-09-18 | 北京百度网讯科技有限公司 | 语句解析方法、装置、计算机设备及可读介质 |
-
2018
- 2018-11-02 CN CN201811301126.7A patent/CN109063221B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101770453A (zh) * | 2008-12-31 | 2010-07-07 | 华建机器翻译有限公司 | 基于领域本体结合机器学习模型的汉语文本共指消解方法 |
CN106156003A (zh) * | 2016-06-30 | 2016-11-23 | 北京大学 | 一种问答***中的问句理解方法 |
CN107220235A (zh) * | 2017-05-23 | 2017-09-29 | 北京百度网讯科技有限公司 | 基于人工智能的语音识别纠错方法、装置及存储介质 |
CN108304466A (zh) * | 2017-12-27 | 2018-07-20 | ***股份有限公司 | 一种用户意图识别方法以及用户意图识别*** |
CN108549656A (zh) * | 2018-03-09 | 2018-09-18 | 北京百度网讯科技有限公司 | 语句解析方法、装置、计算机设备及可读介质 |
Cited By (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008319A (zh) * | 2019-02-27 | 2019-07-12 | 百度在线网络技术(北京)有限公司 | 基于对话模板的模型训练方法和装置 |
CN109948155A (zh) * | 2019-03-12 | 2019-06-28 | 广东小天才科技有限公司 | 一种多意图的选择方法及装置、终端设备 |
CN109948155B (zh) * | 2019-03-12 | 2023-06-30 | 广东小天才科技有限公司 | 一种多意图的选择方法及装置、终端设备 |
CN110046346A (zh) * | 2019-03-18 | 2019-07-23 | 广东小天才科技有限公司 | 一种语料意图监控的方法和装置、终端设备 |
CN110162538B (zh) * | 2019-04-19 | 2024-03-01 | 平安科技(深圳)有限公司 | 自动生成通用查询语言cql的方法、装置和计算机设备 |
CN110162538A (zh) * | 2019-04-19 | 2019-08-23 | 平安科技(深圳)有限公司 | 自动生成通用查询语言cql的方法、装置和计算机设备 |
CN110334340A (zh) * | 2019-05-06 | 2019-10-15 | 北京泰迪熊移动科技有限公司 | 基于规则融合的语义分析方法、装置以及可读存储介质 |
CN110334340B (zh) * | 2019-05-06 | 2021-08-03 | 北京泰迪熊移动科技有限公司 | 基于规则融合的语义分析方法、装置以及可读存储介质 |
CN110096595A (zh) * | 2019-05-06 | 2019-08-06 | 上海互问信息科技有限公司 | 一种基于混合策略的复句用户查询语句的意图识别方法 |
CN110245348A (zh) * | 2019-05-17 | 2019-09-17 | 北京百度网讯科技有限公司 | 一种意图识别方法及*** |
CN110245348B (zh) * | 2019-05-17 | 2023-11-24 | 北京百度网讯科技有限公司 | 一种意图识别方法及*** |
CN110502608A (zh) * | 2019-07-05 | 2019-11-26 | 平安科技(深圳)有限公司 | 基于知识图谱的人机对话方法及人机对话装置 |
WO2021003819A1 (zh) * | 2019-07-05 | 2021-01-14 | 平安科技(深圳)有限公司 | 基于知识图谱的人机对话方法及人机对话装置 |
CN110502608B (zh) * | 2019-07-05 | 2023-10-10 | 平安科技(深圳)有限公司 | 基于知识图谱的人机对话方法及人机对话装置 |
CN110377911B (zh) * | 2019-07-23 | 2023-07-21 | 中国工商银行股份有限公司 | 对话框架下的意图识别方法和装置 |
CN110377911A (zh) * | 2019-07-23 | 2019-10-25 | 中国工商银行股份有限公司 | 对话框架下的意图识别方法和装置 |
US11436528B2 (en) | 2019-08-16 | 2022-09-06 | International Business Machines Corporation | Intent classification distribution calibration |
CN110543633A (zh) * | 2019-08-29 | 2019-12-06 | 腾讯科技(深圳)有限公司 | 语句意图识别方法、装置 |
CN110543633B (zh) * | 2019-08-29 | 2021-06-29 | 腾讯科技(深圳)有限公司 | 语句意图识别方法、装置 |
CN110825949A (zh) * | 2019-09-19 | 2020-02-21 | 平安科技(深圳)有限公司 | 基于卷积神经网络的信息检索方法、及其相关设备 |
WO2021057250A1 (zh) * | 2019-09-24 | 2021-04-01 | 苏宁云计算有限公司 | 一种商品搜索的查询策略的生成方法及装置 |
CN110674259A (zh) * | 2019-09-27 | 2020-01-10 | 北京百度网讯科技有限公司 | 意图理解方法和装置 |
CN110704641A (zh) * | 2019-10-11 | 2020-01-17 | 零犀(北京)科技有限公司 | 一种万级意图分类方法、装置、存储介质及电子设备 |
CN110704641B (zh) * | 2019-10-11 | 2023-04-07 | 零犀(北京)科技有限公司 | 一种万级意图分类方法、装置、存储介质及电子设备 |
CN110795547A (zh) * | 2019-10-18 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 文本识别方法和相关产品 |
CN110795547B (zh) * | 2019-10-18 | 2023-04-07 | 腾讯科技(深圳)有限公司 | 文本识别方法和相关产品 |
CN110827831A (zh) * | 2019-11-15 | 2020-02-21 | 广州洪荒智能科技有限公司 | 基于人机交互的语音信息处理方法、装置、设备及介质 |
CN113010768B (zh) * | 2019-12-19 | 2024-03-19 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN113010768A (zh) * | 2019-12-19 | 2021-06-22 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN111523311A (zh) * | 2020-04-21 | 2020-08-11 | 上海优扬新媒信息技术有限公司 | 一种搜索意图识别方法及装置 |
CN111523311B (zh) * | 2020-04-21 | 2023-10-03 | 度小满科技(北京)有限公司 | 一种搜索意图识别方法及装置 |
CN111813903A (zh) * | 2020-05-25 | 2020-10-23 | 车智互联(北京)科技有限公司 | 一种问句匹配方法和计算设备 |
CN111400607A (zh) * | 2020-06-04 | 2020-07-10 | 浙江口碑网络技术有限公司 | 搜索内容输出方法、装置、计算机设备及可读存储介质 |
CN111680517B (zh) * | 2020-06-10 | 2023-05-16 | 北京百度网讯科技有限公司 | 用于训练模型的方法、装置、设备以及存储介质 |
CN111680517A (zh) * | 2020-06-10 | 2020-09-18 | 北京百度网讯科技有限公司 | 用于训练模型的方法、装置、设备以及存储介质 |
CN111966781B (zh) * | 2020-06-28 | 2024-02-20 | 北京百度网讯科技有限公司 | 数据查询的交互方法及装置、电子设备和存储介质 |
CN111966781A (zh) * | 2020-06-28 | 2020-11-20 | 北京百度网讯科技有限公司 | 数据查询的交互方法及装置、电子设备和存储介质 |
CN111832305B (zh) * | 2020-07-03 | 2023-08-25 | 北京小鹏汽车有限公司 | 一种用户意图识别方法、装置、服务器和介质 |
CN111832305A (zh) * | 2020-07-03 | 2020-10-27 | 广州小鹏车联网科技有限公司 | 一种用户意图识别方法、装置、服务器和介质 |
CN112364659A (zh) * | 2020-07-08 | 2021-02-12 | 西湖大学 | 一种无监督的语义表示自动识别方法及装置 |
CN112364659B (zh) * | 2020-07-08 | 2024-05-03 | 西湖大学 | 一种无监督的语义表示自动识别方法及装置 |
CN111858900A (zh) * | 2020-09-21 | 2020-10-30 | 杭州摸象大数据科技有限公司 | 问句语义解析规则模板的生成方法、装置、设备及存储介质 |
CN112149429A (zh) * | 2020-10-21 | 2020-12-29 | 成都小美伴旅信息技术有限公司 | 一种基于词槽序模型的高准确度语义理解识别方法 |
CN112380973B (zh) * | 2020-11-12 | 2023-06-23 | 深兰科技(上海)有限公司 | 交通信号灯的识别方法和*** |
CN112380973A (zh) * | 2020-11-12 | 2021-02-19 | 深兰科技(上海)有限公司 | 交通信号灯的识别方法和*** |
CN112395394A (zh) * | 2020-11-27 | 2021-02-23 | 安徽迪科数金科技有限公司 | 短文本语义理解模板检验方法、模板生成方法及装置 |
CN112395394B (zh) * | 2020-11-27 | 2024-04-26 | 安徽迪科数金科技有限公司 | 短文本语义理解模板检验方法、模板生成方法及装置 |
CN112560425A (zh) * | 2020-12-24 | 2021-03-26 | 北京百度网讯科技有限公司 | 模板生成方法、装置、电子设备及存储介质 |
CN112560425B (zh) * | 2020-12-24 | 2024-04-09 | 北京百度网讯科技有限公司 | 模板生成方法、装置、电子设备及存储介质 |
CN112988784A (zh) * | 2021-04-26 | 2021-06-18 | 广州思迈特软件有限公司 | 数据查询方法、查询语句生成方法及其装置 |
CN113449089A (zh) * | 2021-06-11 | 2021-09-28 | 车智互联(北京)科技有限公司 | 一种查询语句的意图识别方法、问答方法及计算设备 |
CN113449089B (zh) * | 2021-06-11 | 2023-12-01 | 车智互联(北京)科技有限公司 | 一种查询语句的意图识别方法、问答方法及计算设备 |
CN113901837A (zh) * | 2021-10-19 | 2022-01-07 | 斑马网络技术有限公司 | 一种意图理解方法、装置、设备及存储介质 |
CN115168436A (zh) * | 2022-07-20 | 2022-10-11 | 贝壳找房(北京)科技有限公司 | 查询信息处理方法、电子设备及可读存储介质 |
CN115168436B (zh) * | 2022-07-20 | 2023-08-08 | 贝壳找房(北京)科技有限公司 | 查询信息处理方法、电子设备及可读存储介质 |
CN116244413B (zh) * | 2022-12-27 | 2023-11-21 | 北京百度网讯科技有限公司 | 新意图确定方法、设备和存储介质 |
CN116244413A (zh) * | 2022-12-27 | 2023-06-09 | 北京百度网讯科技有限公司 | 新意图确定方法、设备和存储介质 |
CN116542136A (zh) * | 2023-04-13 | 2023-08-04 | 南京大学 | 一种通用的学件查搜与复用的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109063221B (zh) | 2021-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109063221A (zh) | 基于混合策略的查询意图识别方法和装置 | |
CN109800284B (zh) | 一种面向任务的非结构化信息智能问答***构建方法 | |
WO2021203581A1 (zh) | 基于精标注文本的关键信息抽取方法、装置及存储介质 | |
US8170969B2 (en) | Automated computation of semantic similarity of pairs of named entity phrases using electronic document corpora as background knowledge | |
US7739257B2 (en) | Search engine | |
US7428487B2 (en) | Semi-automatic construction method for knowledge base of encyclopedia question answering system | |
CN110909725A (zh) | 识别文本的方法、装置、设备及存储介质 | |
CN110674252A (zh) | 一种面向司法领域的高精度语义搜索*** | |
CN111144723A (zh) | 人岗匹配推荐方法及***、存储介质 | |
CN106202380B (zh) | 一种分类语料库的构建方法、***及具有该***的服务器 | |
CN111159385A (zh) | 一种基于动态知识图谱的无模板通用智能问答方法 | |
CN110619050B (zh) | 意图识别方法及设备 | |
CN106844341A (zh) | 基于人工智能的新闻摘要提取方法及装置 | |
CN108959559A (zh) | 问答对生成方法和装置 | |
CN112559656A (zh) | 基于水文事件的事理图谱构建方法 | |
CN112328800A (zh) | 自动生成编程规范问题答案的***及方法 | |
CN113157859A (zh) | 一种基于上位概念信息的事件检测方法 | |
US11321531B2 (en) | Systems and methods of updating computer modeled processes based on real time external data | |
CN114357125A (zh) | 任务型对话***中的自然语言识别方法、装置及设备 | |
CN108932233A (zh) | 翻译文生成方法、翻译文生成装置以及翻译文生成程序 | |
CN105260396A (zh) | 字词检索方法和装置 | |
CN117473054A (zh) | 基于知识图谱的通用智能问答方法及装置 | |
WO2023103914A1 (zh) | 文本情感分析方法、装置及计算机可读存储介质 | |
CN110008352A (zh) | 实体发现方法及装置 | |
CN115335819A (zh) | 用于搜索和检索信息的方法和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |