CN111159363A - 一种基于知识库的问题答案确定方法及装置 - Google Patents
一种基于知识库的问题答案确定方法及装置 Download PDFInfo
- Publication number
- CN111159363A CN111159363A CN201811312047.6A CN201811312047A CN111159363A CN 111159363 A CN111159363 A CN 111159363A CN 201811312047 A CN201811312047 A CN 201811312047A CN 111159363 A CN111159363 A CN 111159363A
- Authority
- CN
- China
- Prior art keywords
- question
- answer
- similarity
- questions
- pairs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000015654 memory Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 11
- 238000003860 storage Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 description 19
- 230000008569 process Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 12
- 230000011218 segmentation Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 238000005520 cutting process Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008909 emotion recognition Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于知识库的问题答案确定方法及装置,用于提升智能客服中问答***输出的答***度。所述方法包括:接收用户输入的问题,抽取所述问题中的关键词,从知识库中获取与所述关键词对应的多组问答对,其中,问答对包括预先设置的问题以及与其对应的答案,针对所述多组问答对中的一组问答对,计算所述一组问答对与所述问题的相似度,获得多个相似度,根据所述多个相似度,确定出所述多组问答对中相似度最大的一组问答对为目标问答对,并确定所述目标问答对中的答案为所述问题的答案。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于知识库的问题答案确定方法及装置。
背景技术
目前,智能客服向用户提供服务的核心是问答***,现有的问答***是基于模板和规则的,即对用户的问题的答复是对应到相应的模板,若用户输入的问句形式发生变化,问答***可能不会很好的理解问句,从而导致获得的答***性较低,甚至可能是错误的答案,因此,如何提升智能客服中问答***输出的答***度,是一个需要解决的技术问题。
发明内容
本发明实施例提供一种基于知识库的问题答案确定方法及装置,用于提升智能客服中问答***输出的答***度。
第一方面,本发明实施例提供一种基于知识库的问题答案确定方法,包括:
接收用户输入的问题,抽取所述问题中的关键词;
从知识库中获取与所述关键词对应的多组问答对,其中,问答对包括预先设置的问题以及与其对应的答案;
针对所述多组问答对中的一组问答对,计算所述一组问答对与所述问题的相似度,获得多个相似度;
根据所述多个相似度,确定出所述多组问答对中相似度最大的一组问答对为目标问答对,并确定所述目标问答对中的答案为所述问题的答案。
可选的,所述抽取所述问题的关键词之后,还包括:
根据所述关键词对所述问题进行分类,不同类型的问题包括不同的关键词;
其中,若分类结果为所述问题属于业务类的问题,则从所述知识库中获取与所述关键词对应的多组问答对。
可选的,若分类结果为所述问题属于闲聊类的问题,则从闲聊类对应的答案生成模型中获取与所述问答对应的答案。
可选的,针对所述多组问答对中的一组问答对,计算所述一组问答对与所述问题的相似度,获得多个相似度,具体为:
针对所述多组问答对中的一组问答对,计算所述一组问答对中的问题与所述问题的相似度,从而获得多个相似度;或者
针对所述多组问答对中的一组问答对,计算所述一组问答对中的答案与所述问题的相似度,从而获得多个相似度。
可选的,所述根据所述多个相似度,确定出所述多组问答对中相似度最大的一组目标问答对,具体包括:
从所述多个相似度中,确定出相似度大于预设范围的至少一个相似度;
计算所述至少一个相似度对应的至少一组问答对中的每一组问答对与所述问题的第二相似度,获得所述至少一组问答对的至少一个第二相似度;
根据所述至少一个第二相似度,从所述至少一组问答对中确定出第二相似度最大的一组问答对为目标问答对。
第二方面,提供一种基于知识库的问题答案确定装置,包括:
接收单元,用于接收用户输入的问题,抽取所述问题中的关键词;
获取单元,用于从知识库中获取与所述关键词对应的多组问答对,其中,问答对包括预先设置的问题以及与其对应的答案;
处理单元,用于针对所述多组问答对中的一组问答对,计算所述一组问答对与所述问题的相似度,获得多个相似度;
确定单元,用于根据所述多个相似度,确定出所述多组问答对中相似度最大的一组问答对为目标问答对,并确定所述目标问答对中的答案为所述问题的答案。
可选的,所述接收单元,用于:
根据所述关键词对所述问题进行分类,不同类型的问题包括不同的关键词;
其中,若分类结果为所述问题属于业务类的问题,则从所述知识库中获取与所述关键词对应的多组问答对。
可选的,所述接收单元,还用于若分类结果为所述问题属于闲聊类的问题,则从闲聊类对应的答案生成模型中获取与所述问答对应的答案。
可选的,所述处理单元,具体用于:
针对所述多组问答对中的一组问答对,计算所述一组问答对中的问题与所述问题的相似度,从而获得多个相似度;或者
针对所述多组问答对中的一组问答对,计算所述一组问答对中的答案与所述问题的相似度,从而获得多个相似度。
可选的,所述确定单元,具体用于:
从所述多个相似度中,确定出相似度大于预设范围的至少一个相似度;
计算所述至少一个相似度对应的至少一组问答对中的每一组问答对与所述问题的第二相似度,获得所述至少一组问答对的至少一个第二相似度;
根据所述至少一个第二相似度,从所述至少一组问答对中确定出第二相似度最大的一组问答对为目标问答对。
第三方面,提供一种终端设备,该终端设备包括:
至少一个处理器,以及
与所述至少一个处理器连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令实现如第一方面任一项所述的方法。
第四方面,提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项所述的方法。
在本发明实施例中提供的基于知识库的问题答案确定方法,在接收用户输入的问题时,会抽取问题的关键词,然后利用抽取获得的关键词从知识库中获取与关键词对应的多组问答对,然后针对多组问答对中的每组问答对,计算每组问答对与问题的相似度,获得每组问答对的相似度,共获得多个相似度,进而根据多个相似度,确定出多组问答对中相似度最大的一组问答对为目标问答对,进而确定该目标问答对中的答案为回答用户输入问题的答案,所以,实现了提升智能客服中问答***输出的答***度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
图1为本发明实施例提供的一种基于知识库的问题答案确定方法的***结构图;
图2为本发明实施例提供的一种基于知识库的问题答案确定方法的流程图;
图3为本发明实施例提供的对输入问题进行抽取关键词处理的过程示意图;
图4为本发明实施例提供的一种基于知识库的问题答案确定装置的结构示意图;
图5为本发明实施例提供的一种基于知识库的问题答案确定装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明技术方案的一部分实施例,而不是全部的实施例。基于本申请文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明技术方案保护的范围。
目前,可以通过向智能客服输入问题,智能客服输出答案的方式来满足用户办理相关业务的需求,例如,用户可以向智能客服输入“办理新卡”这一问题,那么智能客服会根据规则和模板来匹配出“办理新卡”的相关答案,进而回答用户的问题。然而,在实际应用中,可能会因为智能客服对问题理解不准确而不能得到正确的答案,影响用户的使用,从而降低了用户体验。
为此,本发明实施例提供一种基于知识库的问题答案确定方法,能够识别用户不同形式的问句,以提升对用户的问题的理解的准确度,通过对问题进行关键词的抽取,然后根据抽取到的关键词在预先构建的知识库中进行检索获取多组问答对,然后对多组问答对与问题进行相似度的计算,从而获得多个相似度,进而根据多个相似度,确定出多组问答对中相似度最大的一组问答对为目标问答对,该目标问答对中的答案即为用户问题的答案,所以,提高了问题答案确定的准确性,提升用户体验。
下面结合说明书附图介绍本发明实施例提供的技术方案。
本发明实施例中提供的一种基于知识库的问题答案确定方法可应用于智能客服设备中,这样的智能客服设备如客服机器人等,本发明实施例中的基于知识库的问题答案确定方法对应的智能客服设备的问答***可以如图1所示,包括问题处理模块、检索模块、匹配模块、答案处理模块。其中,问题处理模块将用户输入的问题进行处理,并将处理结果发送给检索模块,检索模块根据处理结果在之前构建的知识库中进行检索从而确定出问答对,匹配模块根据问答对确定出匹配问答对选集,然后答案处理模块对匹配问答对选集中的问答对进行处理,从而将处理获得的问答对的答案输出,以实现对用户输入问题的回答。
需要说明的是,在实际应用中,智能客服设备的问答***还可以为其他结构,上述图1所示的智能客服设备的问答***仅仅是示例。
下面结合图1所示的智能客服设备的问答***对本发明实施例提供的一种基于知识库的问题答案确定方法进行说明。
请参见图2,为本发明实施例提供了一种基于知识库的问题答案确定方法,包括:
步骤201:接收用户输入的问题,抽取问题中的关键词。
本发明实施例中,具体以智能客服设备为客服机器人为例,通常,客服机器人的服务类型有政府机关、商家以及银行等,具有不同服务类型的客服机器人需要的具体的业务知识也不同,因此,可以根据服务类型,预先在客服机器人中设置对应的业务知识语料库,同时建立知识库。
其中,知识库的建立是使用知识抽取技术来建立的,在本发明实施例中,知识抽取是指把蕴含于信息源中的知识经过识别、理解、筛选、归纳等过程抽取出来,形成问答对并存储于知识库中,具体的,信息源来源于各个客服领域,信息源主要有结构化文本、半结构化文本、非结构化文本,其中,结构化文本包括词典、主题词表、本体、大百科全书等;半结构化文本主要是指标记文本,包括HTML(超文本标记语言)标记文本与XML(可扩展标记语言)标记文本;非结构化文本主要指图书、论文等传统文献。
在具体的实践过程中,当用户需要进行智能客服服务时,用户可以向客服机器人输入问题,输入的问题的方式可以是语音输入,也可以是文字输入。
在客服机器人接收到用户输入的问题之后,可抽取问题中的关键词,关键词的抽取过程请结合图3进行操作,即首先需要对输入的问题31进行预处理,在具体的实践过程中,用户输入的问题的形式是不一样的,为了更好的识别并理解问题,需要结合问题的上下文对问句进行理解并结合正则匹配技术,将用户输入的问题与知识库中的问题进行匹配,从而获得预处理后的问题32。例如,用户输入的问题为:“怎么可以更改密码?”通过与知识库中的问题进行匹配,预处理后的问题为:“怎样更改密码?”。
在本发明实施例中,在获得预处理后的问题32之后,可以对预处理后的问题32进行切词处理,从而获得切词结果33,在具体的实践过程中,可以使用基于词典的方法对预处理后的问题32进行切词处理,具体的,可以是对预处理后的问题32从右向左进行扫描,也可以是从左到右进行扫描,还可以是双向扫描,从而将能够与词库中匹配到的最长的词作为一个切出来的单词,进而获得对预处理后的问题32的切词结果33,还可以是基于统计的方法来对预处理后的问题32进行切词处理,获得切词结果33,当然,也可以是使用基于机器学习的方法来对预处理后的问题32进行切词处理,从而获得切词结果33,在具体的实践过程中,可以根据实践需要选择合适的方法对预处理后的问题进行切词处理,本发明实施例中不做限制。
在本发明实施例中,在获得切词结果33之后,可以对切词结果33进行词性标注,从而获得词性标注集34,在具体的实践过程中,可以是使用基于字符串匹配的词典查找算法对切词结果33中的词进行词性标注处理,具体的,将获得的切词结果33中的每个词与词典中的词进行匹配,确定出在词典中该词的词性,进而根据确定的词性标注对应的词,从而获得词性标注集34,也可以是基于统计的词性标注算法对切词结果33进行处理,得到词性标注集34。
在具体的实践过程中,当获得词性标注集34之后,抽取词性标注集中具体特定词性的词为关键词34,其中,特定词性可以是名词,也可是名称以及动词等,本领域的技术人员可以根据需要设置特定词性,在本发明实施例中具体以特征词性为名称和动词,那么,就可以从词性标注集抽取词性为名词和动词的词作为关键词34。
例如,假设获得的对用户输入的问题进行预处理后的问题为:怎样更改密码?以基于词典的方法对该问题进行预处理为例,那么对“怎样更改密码”从左到右进行扫描,将能够匹配到词典中的最长的一个词作为一个切出来的单词,那么获得的切词结果为:怎样、更改、密码,然后基于词典中每个词的词性进行标注,获得词性标注集为怎样(代词)、更改(动词)、密码(名词),然后抽取词性标注集中的名词和动词,则获得的该问题的关键词为:更改、密码。
步骤202:根据关键词对问题进行分类,若分类结果为问题属于闲聊类的问题,则执行步骤203,若分类结果为问题属于业务类的问题,则执行步骤204。
在本发明实施例中,抽取关键词之后,还可以根据抽取的关键词与预先储存在属性分类词库中的词进行匹配,以获得关键词的属性,其中,属性分类词库包括预先设置的多个词,每个词标注有该词所属的属性,在本发明实施例中,词所属的属性分为业务类和闲聊类。然后根据获得的关键词的属性,确定用户输入的问题的类型。
例如,用户输入的问题为:如何开心?抽取的关键词为“开心”,假设在属性分类词库中“开心”的属性为闲聊类,那么,利用“如何开心”这个问题中抽取的关键词“开心”确定该问题为闲聊类问题,当确定用户输入的问题为闲聊类的问题,可以执行如下步骤203,从而获得用户输入问题的答案。
步骤203:从闲聊类对应的答案生成模型中获取与所述问答对应的答案。
在本发明实施例中,当确定出问题为闲聊类问题之后,客服机器人内部会将问题输入答案生成模型,在本发明实施例中具体以答案生成模型为Seq2Seq模型为例,Seq2Seq模型会预先对已有的语料和词库进行训练,从而得到一个对输入问题的词序有良好的建模能力的模型,然后该模型对输入的问题进行处理,从而生成的问题的回复,进而从闲聊类对应的Seq2Seq模型中获取与问答对应的答案。
若步骤202中分类结果为问题属于业务类的问题,则执行步骤204,例如当用户输入的问题为:“怎样更改密码?”抽取的关键词为“更改”和“密码”,若属性分类词库中“更改”和“密码”的属性为业务类,那么,根据关键词“更改”和“密码”能够确定“怎样更改密码?”这个问题为业务类问题,当确定用户输入问题的类型为业务类问题时,则执行步骤204:从知识库中获取与所述关键词对应的多组问答对。其中,问答对包括预先设置的问题以及与其对应的答案。
在本发明实施例中,确定出问题为业务类问题之后,可以根据抽取的问题的关键词,在知识库中进行检索,将知识库中所有的与关键词相关的问答对都检索出来,其中,每个问答对都是预先设置在知识库中的,且都包含有一个问题以及该问答对应的答案。
例如,以对用户输入的问题进行预处理后的问题为“怎样更改密码?”、获得的关键词为“更改”和“密码”为例,将获得的“更改”和“密码”这两个关键词与属性分类词库中的词进行匹配,匹配到的“更改”和“密码”这两个词,且在属性分类词库中这两个词的属性为业务类的词汇,那么,进而可以确定出“怎样更改密码”这个问题为业务类问题。在确定出“怎样更改密码”为业务型问题之后,根据抽取的“更改”和“密码”这两个关键词在预先构建的知识库中进行检索,将知识库中所有的与“更改”和“密码”有关的问答对都检索出来。
步骤205:针对多组问答对中的一组问答对,计算一组问题与所述问题的相似度,获得多个相似度。
在本发明实施例中,确定出问题为业务类问题之后,可以根据抽取的关键词,在知识库中进行检索,将知识库中所有的与关键词相关的问答对都检索出来,然后可以对问答对中的问题进行处理,获得问答对问题的关键词,根据词库中的关键词的权值,计算问题的关键词与问答对的关键词的第一相似度。
在具体的实践过程中,确定出问题为业务型问题之后,可以是根据切词结果在知识库中进行检索,从而获得该检索方式检索出的问答对,当然,还可以是将切词结果和关键词结合来进行检索,从而获得问答对,进一步的,可以根据实际情况选择合适的检索方法。然后可以对问答对中的问题进行处理,获得问答对问题的关键词,根据词库中的关键词的权值,计算问题的关键词与问答对的关键词的第一相似度。
例如,假设关键词为“更改、密码”,那么以根据关键词进行检索,得到的问答对有5个分别为问答对A、问答对B、问答对C、问答对D、问答对E为例,那么可以对问答对中的问题进行处理,获得问答对中问题的关键词,根据词库中的关键词的权值,计算问题的关键词与问答对的关键词的相似度,获得问答对A的第一相似度为30%、问答对B的第一相似度为51%、问答对C的第一相似度为28%、问答对D的第一相似度为70%、问答对E的第一相似度为80%。
在本发明实施例中,为了更好的确定问答对与问题的匹配度,在获得问答对的相似度后,判断获得的问答对的相似度是否满足第一预设范围,对满足预设范围的问答对使用TF-IDF模型进行相似度的计算,获得第二相似度。
在具体的实践过程中,针对满足预设范围的问答对,可以计算问答对中问题与预处理后的问题的相似度,从而获得第二相似度,还可以计算问答对中的答案与预处理后的问题的相似度,从而获得第二相似度,具体选择哪种计算原理不做限制,根据实际需要进行选择。
这里继续以上面的例子为例,假设预设范围为30%-50%,那么,满足大于预设范围的问答对为问答对B、问答对D、问答对E。然后对问答对B、问答对D、问答对E进行相似度的计算,获得问答对B、问答对D、问答对E的第二相似度。
步骤206:根据多个相似度,确定出多组问答对中相似度最大的一组目标问答对,并确定目标问答对中的答案为问题的答案。
在本发明实施例中,根据对满足预设范围的问答对进行相似度计算获得的第二相似度进行排序,确定出问答对中第二相似度最大的一组目标问答对,并确定出目标问答对中的答案。
在具体的实践过程中,在根据对满足预设范围的问答对进行相似度计算获得的第二相似度进行排序后,还可以通过对预处理后的问题进行情感识别,进而更好的确定出目标问答对中的答案,以提升用户体验。
所以,通过上述的问题答案确定方法,接收用户输入的问题,然后抽取问题的关键词,通过抽取获得的关键词从知识库中获取与关键词对应的多组问答对,其中,问答对包括预先设置的问题以及与其对应的答案,使用关键词抽取问答对可以获得多组问答对,从而可以对问题有更准确的理解性与扩展性,然后针对多组问答对中的一组问答对,计算一组问答对与问题的相似度,获得多个相似度,进而根据获得的多个相似度,确定出多组问答对中相似度最大的一组目标问答对,并确定目标问答对中的答案为用户输入问题的答案,通过对问答对与问题进行相似度的计算,来确定问答对与问题的匹配程度,确定出相似度最大的目标问答对,即提高了问题答***性。
作为一种可选的方式,在本发明实施例中,可以对预处理后的问题进行抽取判定词处理,从而确定问题的类型和答案的类型,具体的,将经过预处理的问题,进行切词处理,然后对切词处理的获得的词进行词性标注,从而获得词集,进而筛选出词集中的根据抽取的词集中的疑问代词、副词作为判定词,根据获得的问题的判定词的属性确定问题的类型及其答案对应的类型,例如,用户输入的问题为:是否使用这个方式?那根据抽取的判定词为是,从而确定的该问题的类型为是否类,答案的类型为是否类。
在具体的实践过程中,在通过抽取的问题的关键词进行检索获得问答对之后,还可以根据获得的问题的类型和答案的类型对问答对进行筛选,判断问答对的问题的类型和答案的类型是否相同,若是相同则进行第一相似度的计算,可以提高问题的答案,获得准确性较高的答案,以提升用户的体验。
下面结合说明书附图介绍本发明实施例提供的装置。
请参见图4,基于同一发明构思,本发明实施例提供了一种基于知识库的问题答案确定装置。该装置包括:接收单元41、获取单元42、处理单元43、确定单元44。其中,接收单元41用于接收用户输入的问题,抽取所述问题中的关键词获取单元42用于从知识库中获取与所述关键词对应的多组问答对,其中,问答对包括预先设置的问题以及与其对应的答案;处理单元43,用于针对所述多组问答对中的一组问答对,计算所述一组问答对与所述问题的相似度,获得多个相似度;确定单元44,用于根据所述多个相似度,确定出所述多组问答对中相似度最大的一组问答对为目标问答对,并确定所述目标问答对中的答案为所述问题的答案。
可选的,所述接收单元41,用于:
根据所述关键词对所述问题进行分类,不同类型的问题包括不同的关键词;
其中,若分类结果为所述问题属于业务类的问题,则从所述知识库中获取与所述关键词对应的多组问答对。
可选的,所述接收单元41,还用于若分类结果为所述问题属于闲聊类的问题,则从闲聊类对应的答案生成模型中获取与所述问答对应的答案。
可选的,所述处理单元43,具体用于:
针对所述多组问答对中的一组问答对,计算所述一组问答对中的问题与所述问题的相似度,从而获得多个相似度;或者
针对所述多组问答对中的一组问答对,计算所述一组问答对中的答案与所述问题的相似度,从而获得多个相似度。
可选的,所述确定单元44,具体用于:
从所述多个相似度中,确定出相似度大于预设范围的至少一个相似度;
计算所述至少一个相似度对应的至少一组问答对中的每一组问答对与所述问题的第二相似度,获得所述至少一组问答对的至少一个第二相似度;
根据所述至少一个第二相似度,从所述至少一组问答对中确定出第二相似度最大的一组问答对为目标问答对。
请参见图5,基于同一发明构思,本发明实施例提供了一种基于知识库的问题答案确定装置,该问题答案确定装置可以是具有智能的电子设备,例如客服机器人等。该问题答案确定装置包括:至少一个处理器501和与至少一个处理器连接的存储器502。存储器501可以通过总线500与处理器502相连接(图5以此为例),或者也可以通过专门的连接线与处理器502连接。
其中,存储器502可以用于存储指令,处理器502可以用于调用存储器存储的指令,在执行存储器502中存储的计算机程序时实现本发明实施例提供的如图2所示的基于知识库的问答方法的步骤:
接收用户输入的问题,抽取所述问题中的关键词;
从知识库中获取与所述关键词对应的多组问答对,其中,问答对包括预先设置的问题以及与其对应的答案;
针对所述多组问答对中的一组问答对,计算所述一组问答对与所述问题的相似度,获得多个相似度;
根据所述多个相似度,确定出所述多组问答对中相似度最大的一组问答对为目标问答对,并确定所述目标问答对中的答案为所述问题的答案。
可选的,处理器501用于:
根据所述关键词对所述问题进行分类,不同类型的问题包括不同的关键词;
其中,若分类结果为所述问题属于业务类的问题,则从所述知识库中获取与所述关键词对应的多组问答对。
可选的,处理器501用于:
若分类结果为所述问题属于闲聊类的问题,则从闲聊类对应的答案生成模型中获取与所述问答对应的答案。
可选的,处理器501还用于:
针对所述多组问答对中的一组问答对,计算所述一组问答对中的问题与所述问题的相似度,从而获得多个相似度;或者
针对所述多组问答对中的一组问答对,计算所述一组问答对中的答案与所述问题的相似度,从而获得多个相似度。
可选的,处理器501还用于:
从所述多个相似度中,确定出相似度大于预设范围的至少一个相似度;
计算所述至少一个相似度对应的至少一组问答对中的每一组问答对与所述问题的第二相似度,获得所述至少一组问答对的至少一个第二相似度;
根据所述至少一个第二相似度,从所述至少一组问答对中确定出第二相似度最大的一组问答对为目标问答对。
可选的,处理器501具体可以是中央处理器、特定应用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC),可以是一个或多个用于控制程序执行的集成电路。
可选的,存储器502可以包括只读存储器(英文:Read Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)和磁盘存储器。存储器502用于存储处理器501运行时所需的数据,即存储有可被至少一个处理器501执行的指令,至少一个处理器501通过执行存储器502存储的指令,执行如图2所示的方法。其中,存储器502的数量为一个或多个。其中,存储器502在图5中一并示出。
其中,接收单元41、获取单元42、处理单元43、确定单元44所对应的实体设备均可以是前述的处理器501。该终端设备可以用于执行图2所示的实施例所提供的方法。因此关于该设备中各功能模块所能够实现的功能,可参考图2所示的实施例中的相应描述,不多赘述。
本发明实施例还提供一种计算机存储介质,其中,计算机存储介质存储有计算机指令,当计算机指令在计算机上运行时,使得计算机执行本发明实施例提供的家电设备的控制方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种基于知识库的问题答案确定方法,其特征在于,包括:
接收用户输入的问题,抽取所述问题中的关键词;
从知识库中获取与所述关键词对应的多组问答对,其中,问答对包括预先设置的问题以及与其对应的答案;
针对所述多组问答对中的一组问答对,计算所述一组问答对与所述问题的相似度,获得多个相似度;
根据所述多个相似度,确定出所述多组问答对中相似度最大的一组问答对为目标问答对,并确定所述目标问答对中的答案为所述问题的答案。
2.如权利要求1所述的方法,其特征在于,所述抽取所述问题的关键词之后,还包括:
根据所述关键词对所述问题进行分类,不同类型的问题包括不同的关键词;
其中,若分类结果为所述问题属于业务类的问题,则从所述知识库中获取与所述关键词对应的多组问答对。
3.如权利要求2所述的方法,其特征在于,若分类结果为所述问题属于闲聊类的问题,则从闲聊类对应的答案生成模型中获取与所述问答对应的答案。
4.如权利要求1或2所述的方法,其特征在于,针对所述多组问答对中的一组问答对,计算所述一组问答对与所述问题的相似度,获得多个相似度,具体为:
针对所述多组问答对中的一组问答对,计算所述一组问答对中的问题与所述问题的相似度,从而获得多个相似度;或者
针对所述多组问答对中的一组问答对,计算所述一组问答对中的答案与所述问题的相似度,从而获得多个相似度。
5.如权利要求3所述的方法,其特征在于,所述根据所述多个相似度,确定出所述多组问答对中相似度最大的一组目标问答对,具体包括:
从所述多个相似度中,确定出相似度大于预设范围的至少一个相似度;
计算所述至少一个相似度对应的至少一组问答对中的每一组问答对与所述问题的第二相似度,获得所述至少一组问答对的至少一个第二相似度;
根据所述至少一个第二相似度,从所述至少一组问答对中确定出第二相似度最大的一组问答对为目标问答对。
6.一种基于知识库的问题答案确定装置,其特征在于,包括:
接收单元,用于接收用户输入的问题,抽取所述问题中的关键词;
获取单元,用于从知识库中获取与所述关键词对应的多组问答对,其中,问答对包括预先设置的问题以及与其对应的答案;
处理单元,用于针对所述多组问答对中的一组问答对,计算所述一组问答对与所述问题的相似度,获得多个相似度;
确定单元,用于根据所述多个相似度,确定出所述多组问答对中相似度最大的一组问答对为目标问答对,并确定所述目标问答对中的答案为所述问题的答案。
7.如权利要求6所述的装置,其特征在于,所述接收单元,用于:
根据所述关键词对所述问题进行分类,不同类型的问题包括不同的关键词;
其中,若分类结果为所述问题属于业务类的问题,则从所述知识库中获取与所述关键词对应的多组问答对。
8.如权利要求6所述的装置,其特征在于,所述接收单元,还用于:
若分类结果为所述问题属于闲聊类的问题,则从闲聊类对应的答案生成模型中获取与所述问答对应的答案。
9.一种终端设备,其特征在于,包括:
至少一个处理器,以及
与所述至少一个处理器连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令实现如权利要求1-5任一项所述的方法。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811312047.6A CN111159363A (zh) | 2018-11-06 | 2018-11-06 | 一种基于知识库的问题答案确定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811312047.6A CN111159363A (zh) | 2018-11-06 | 2018-11-06 | 一种基于知识库的问题答案确定方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111159363A true CN111159363A (zh) | 2020-05-15 |
Family
ID=70554446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811312047.6A Pending CN111159363A (zh) | 2018-11-06 | 2018-11-06 | 一种基于知识库的问题答案确定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111159363A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737437A (zh) * | 2020-06-30 | 2020-10-02 | 北京捷通华声科技股份有限公司 | 问答知识的提取方法、提取装置与计算机可读存储介质 |
CN111782785A (zh) * | 2020-06-30 | 2020-10-16 | 北京百度网讯科技有限公司 | 自动问答方法、装置、设备以及存储介质 |
CN112036906A (zh) * | 2020-07-31 | 2020-12-04 | 苏宁金融科技(南京)有限公司 | 一种数据处理方法、装置、设备 |
CN112052323A (zh) * | 2020-05-27 | 2020-12-08 | 支付宝(杭州)信息技术有限公司 | 群聊机器人自主应答的方法和*** |
CN112307164A (zh) * | 2020-10-15 | 2021-02-02 | 江苏常熟农村商业银行股份有限公司 | 信息推荐方法、装置、计算机设备和存储介质 |
CN112527965A (zh) * | 2020-12-18 | 2021-03-19 | 国家电网有限公司客户服务中心 | 基于专业库和闲聊库相结合的自动问答实现方法和装置 |
CN112632255A (zh) * | 2020-12-29 | 2021-04-09 | 海信视像科技股份有限公司 | 一种获取问答结果的方法及装置 |
CN113360626A (zh) * | 2021-07-02 | 2021-09-07 | 北京容联七陌科技有限公司 | 一种智能客服机器人的多场景混合问答推荐方法 |
CN113515932A (zh) * | 2021-07-28 | 2021-10-19 | 北京百度网讯科技有限公司 | 处理问答信息的方法、装置、设备和存储介质 |
CN113656566A (zh) * | 2021-08-18 | 2021-11-16 | 中国平安人寿保险股份有限公司 | 智能对话处理方法、装置、计算机设备及存储介质 |
CN113836284A (zh) * | 2021-09-26 | 2021-12-24 | 北京京东拓先科技有限公司 | 知识库构建、生成应答语句的方法和装置 |
CN113836287A (zh) * | 2021-10-11 | 2021-12-24 | 深圳追一科技有限公司 | 问答结果的确定方法、装置、计算机设备及存储介质 |
CN114490965A (zh) * | 2021-12-23 | 2022-05-13 | 北京百度网讯科技有限公司 | 问题处理方法、装置、电子设备和存储介质 |
CN111737437B (zh) * | 2020-06-30 | 2024-06-28 | 北京捷通华声科技股份有限公司 | 问答知识的提取方法、提取装置与计算机可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102236677A (zh) * | 2010-04-28 | 2011-11-09 | 北京大学深圳研究生院 | 一种基于问答***的信息匹配方法及*** |
CN105786875A (zh) * | 2014-12-23 | 2016-07-20 | 北京奇虎科技有限公司 | 提供问答对数据搜索结果的方法和装置 |
CN107247868A (zh) * | 2017-05-18 | 2017-10-13 | 深思考人工智能机器人科技(北京)有限公司 | 一种人工智能辅助问诊*** |
CN107977415A (zh) * | 2017-11-22 | 2018-05-01 | 北京寻领科技有限公司 | 自动问答方法及装置 |
CN107980130A (zh) * | 2017-11-02 | 2018-05-01 | 深圳前海达闼云端智能科技有限公司 | 自动回答方法、装置、存储介质及电子设备 |
CN108121800A (zh) * | 2017-12-21 | 2018-06-05 | 北京百度网讯科技有限公司 | 基于人工智能的信息生成方法和装置 |
CN108491433A (zh) * | 2018-02-09 | 2018-09-04 | 平安科技(深圳)有限公司 | 聊天应答方法、电子装置及存储介质 |
-
2018
- 2018-11-06 CN CN201811312047.6A patent/CN111159363A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102236677A (zh) * | 2010-04-28 | 2011-11-09 | 北京大学深圳研究生院 | 一种基于问答***的信息匹配方法及*** |
CN105786875A (zh) * | 2014-12-23 | 2016-07-20 | 北京奇虎科技有限公司 | 提供问答对数据搜索结果的方法和装置 |
CN107247868A (zh) * | 2017-05-18 | 2017-10-13 | 深思考人工智能机器人科技(北京)有限公司 | 一种人工智能辅助问诊*** |
CN107980130A (zh) * | 2017-11-02 | 2018-05-01 | 深圳前海达闼云端智能科技有限公司 | 自动回答方法、装置、存储介质及电子设备 |
CN107977415A (zh) * | 2017-11-22 | 2018-05-01 | 北京寻领科技有限公司 | 自动问答方法及装置 |
CN108121800A (zh) * | 2017-12-21 | 2018-06-05 | 北京百度网讯科技有限公司 | 基于人工智能的信息生成方法和装置 |
CN108491433A (zh) * | 2018-02-09 | 2018-09-04 | 平安科技(深圳)有限公司 | 聊天应答方法、电子装置及存储介质 |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052323A (zh) * | 2020-05-27 | 2020-12-08 | 支付宝(杭州)信息技术有限公司 | 群聊机器人自主应答的方法和*** |
CN111782785A (zh) * | 2020-06-30 | 2020-10-16 | 北京百度网讯科技有限公司 | 自动问答方法、装置、设备以及存储介质 |
CN111737437A (zh) * | 2020-06-30 | 2020-10-02 | 北京捷通华声科技股份有限公司 | 问答知识的提取方法、提取装置与计算机可读存储介质 |
CN111737437B (zh) * | 2020-06-30 | 2024-06-28 | 北京捷通华声科技股份有限公司 | 问答知识的提取方法、提取装置与计算机可读存储介质 |
CN111782785B (zh) * | 2020-06-30 | 2024-04-19 | 北京百度网讯科技有限公司 | 自动问答方法、装置、设备以及存储介质 |
CN112036906B (zh) * | 2020-07-31 | 2022-08-19 | 苏宁金融科技(南京)有限公司 | 一种数据处理方法、装置、设备 |
CN112036906A (zh) * | 2020-07-31 | 2020-12-04 | 苏宁金融科技(南京)有限公司 | 一种数据处理方法、装置、设备 |
CN112307164A (zh) * | 2020-10-15 | 2021-02-02 | 江苏常熟农村商业银行股份有限公司 | 信息推荐方法、装置、计算机设备和存储介质 |
CN112527965A (zh) * | 2020-12-18 | 2021-03-19 | 国家电网有限公司客户服务中心 | 基于专业库和闲聊库相结合的自动问答实现方法和装置 |
CN112632255A (zh) * | 2020-12-29 | 2021-04-09 | 海信视像科技股份有限公司 | 一种获取问答结果的方法及装置 |
CN113360626A (zh) * | 2021-07-02 | 2021-09-07 | 北京容联七陌科技有限公司 | 一种智能客服机器人的多场景混合问答推荐方法 |
CN113515932A (zh) * | 2021-07-28 | 2021-10-19 | 北京百度网讯科技有限公司 | 处理问答信息的方法、装置、设备和存储介质 |
CN113515932B (zh) * | 2021-07-28 | 2023-11-10 | 北京百度网讯科技有限公司 | 处理问答信息的方法、装置、设备和存储介质 |
CN113656566A (zh) * | 2021-08-18 | 2021-11-16 | 中国平安人寿保险股份有限公司 | 智能对话处理方法、装置、计算机设备及存储介质 |
CN113836284A (zh) * | 2021-09-26 | 2021-12-24 | 北京京东拓先科技有限公司 | 知识库构建、生成应答语句的方法和装置 |
CN113836287A (zh) * | 2021-10-11 | 2021-12-24 | 深圳追一科技有限公司 | 问答结果的确定方法、装置、计算机设备及存储介质 |
CN114490965A (zh) * | 2021-12-23 | 2022-05-13 | 北京百度网讯科技有限公司 | 问题处理方法、装置、电子设备和存储介质 |
CN114490965B (zh) * | 2021-12-23 | 2022-11-08 | 北京百度网讯科技有限公司 | 问题处理方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111159363A (zh) | 一种基于知识库的问题答案确定方法及装置 | |
Bennani-Smires et al. | Simple unsupervised keyphrase extraction using sentence embeddings | |
CN109635273B (zh) | 文本关键词提取方法、装置、设备及存储介质 | |
US9424524B2 (en) | Extracting facts from unstructured text | |
JP5936698B2 (ja) | 単語意味関係抽出装置 | |
CN105095204B (zh) | 同义词的获取方法及装置 | |
CN111767716B (zh) | 企业多级行业信息的确定方法、装置及计算机设备 | |
CN112667794A (zh) | 一种基于孪生网络bert模型的智能问答匹配方法及*** | |
CN108038096A (zh) | 知识库文档快速检索方法、应用服务器计算机可读存储介质 | |
KR20160026892A (ko) | 논팩토이드형 질의 응답 시스템 및 방법 | |
KR102138130B1 (ko) | 개념 그래프 기반 질의응답 장치 및 방법 | |
CN110134777B (zh) | 问题去重方法、装置、电子设备和计算机可读存储介质 | |
CN112035599B (zh) | 基于垂直搜索的查询方法、装置、计算机设备及存储介质 | |
CN108875065B (zh) | 一种基于内容的印尼新闻网页推荐方法 | |
CN111611356A (zh) | 信息查找方法、装置、电子设备及可读存储介质 | |
CN110096572B (zh) | 一种样本生成方法、装置及计算机可读介质 | |
CN112989208B (zh) | 一种信息推荐方法、装置、电子设备及存储介质 | |
CN111309916B (zh) | 摘要抽取方法和装置、存储介质和电子装置 | |
CN110866102A (zh) | 检索处理方法 | |
US11227183B1 (en) | Section segmentation based information retrieval with entity expansion | |
CN112182145A (zh) | 文本相似度确定方法、装置、设备和存储介质 | |
CN111325033B (zh) | 实体识别方法、装置、电子设备及计算机可读存储介质 | |
WO2015084757A1 (en) | Systems and methods for processing data stored in a database | |
CN111814476A (zh) | 一种实体关系的抽取方法和装置 | |
Thalib et al. | A review on question analysis, document retrieval and answer extraction method in question answering system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200515 |