CN109063000A - 问句推荐方法、客服***以及计算机可读存储介质 - Google Patents
问句推荐方法、客服***以及计算机可读存储介质 Download PDFInfo
- Publication number
- CN109063000A CN109063000A CN201810744322.5A CN201810744322A CN109063000A CN 109063000 A CN109063000 A CN 109063000A CN 201810744322 A CN201810744322 A CN 201810744322A CN 109063000 A CN109063000 A CN 109063000A
- Authority
- CN
- China
- Prior art keywords
- question sentence
- answered
- similar
- sentence
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种问句推荐方法、客服***以及计算机可读存储介质,该方法包括步骤:在根据待回答问句输出答案之后,在语料库中查找与所述待回答问句相似的各个相似问句;根据相似度计算算法,将所述待回答问句与所述语料库中的各个相似问句进行相似度计算,得到各个相似度值;根据每个相似问句的相似度值和预存反馈数据,计算每个相似问句相对于所述待回答问句的推荐得分,将得分高于给定值的相似问句作为推荐问句;输出所述推荐问句。本发明提高了客服***推荐问句的准确率。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种问句推荐方法、客服***以及计算机可读存储介质。
背景技术
随着经济的发展,人工智能技术也越来越成熟,人机交互的场景也越来越多,常见的人机交互场景是输入语句之后,通过关键词匹配得到推荐语句。
由于现有技术在识别用户问句时,仅仅采用关键词匹配的方式得到推荐语句,存在较大的误差,当用户输入的问句过短而存在歧义时,往往得到的推荐语句也不够准确。
发明内容
本发明的主要目的在于提供一种问句推荐方法、客服***以及计算机可读存储介质,旨在解决现有客服***推荐问句的准确率低下的技术问题。
为实现上述目的,本发明提供一种问句推荐方法,所述问句推荐方法包括步骤:
在根据待回答问句输出答案之后,在语料库中查找与所述待回答问句相似的各个相似问句;
根据相似度计算算法,将所述待回答问句与所述语料库中的各个相似问句进行相似度计算,得到各个相似度值;
根据每个相似问句的相似度值和预存反馈数据,计算每个相似问句相对于所述待回答问句的推荐得分,将得分高于给定值的相似问句作为推荐问句;
输出所述推荐问句。
优选地,所述根据每个相似问句的相似度值和预存反馈数据,计算每个相似问句相对于所述待回答问句的推荐得分,将得分高于给定值的相似问句作为推荐问句的步骤包括:
在所述反馈数据中确定与所述待回答问句相似的下一问句,以统计每个下一问句出现的次数,获取所有与所述待回答问句相似的下一问句在所述反馈数据中出现的总次数;
计算所述每个下一问句出现的次数在所述总次数中的占比;
根据每个下一问句对应的相似度值、预设的相似度权重值、在所述总次数中的占比以及预设的占比权重值,计算每个相似问句相对于所述待回答问句的推荐得分,将得分高于给定值的相似问句作为推荐问句。
优选地,所述反馈数据中,为语料库的各个预存问句建立两两之间的关系,并设置预存问句两两之间关系的权重值,表现为(A←B:a,b),表示问句B在同一用户会话中出现为问句A的下一问句的次数为a,而问句A和B之间这一关系的权重为b。
优选地,所述在根据待回答问句输出答案之后,在语料库中查找与所述待回答相似的各个相似问句的步骤之前,所述方法还包括:
在接收到用户输入的用户问句后,判断所述用户问句是否有歧义;
若所述用户问句有歧义,则将所述用户问句与语料库中的预存问句进行比较;
在所述语料库中匹配到至少两条预存问句时,根据所述反馈数据,判断匹配到的所述预存问句是否满足预设条件;
若存在满足所述预设条件的预存问句,则将满足所述预设条件的预存问句作为待回答问句替换所述用户问句。
优选地,所述在所述语料库中匹配到至少两条预存问句时,根据所述反馈数据,判断匹配到的所述预存问句是否满足预设条件的步骤包括:
当匹配到至少两条预存问句时,获取匹配到的每条预存问句在所述反馈数据中出现的次数,并获取匹配到的所有预存问句在所述反馈数据中出现的总次数;
计算所述每条预存问句出现的次数在所述总次数中的占比;
根据所述每条预存问句出现的次数和在所述总次数中的占比,判断每条预存语句是否满足预设条件;
其中,当预存问句在所述反馈数据出现的次数大于预设次数,且所述预存问句出现的次数在总次数中的占比大于目标值时,则确定所述预存问句满足预设条件。
优选地,所述在所述语料库中匹配到至少两条预存问句时,根据所述反馈数据,判断匹配到的所述预存问句是否满足预设条件的步骤之后,所述方法还包括:
若不存在满足所述预设条件的预存问句,则输出匹配到的所有预存问句以供用户选择。
优选地,所述在根据待回答问句输出答案之后,在语料库中查找与所述待回答问句相似的各个相似问句的步骤之后,所述方法还包括:
根据所述待回答问句和所述反馈数据,获取与所述待回答问句关联的下一问句;
将获取的下一问句作为推荐问句进行输出。
优选地,所述根据所述待回答问句和所述反馈数据,获取与所述待回答问句关联的下一问句的步骤包括:
在预存的反馈数据中,查询所述待回答问句的下一问句,若下一问句存在多个问句,则获取出现次数最多的问句作为所述待回答问句关联的下一问句。
此外,为实现上述目的,本发明还提供一种客服***,所述客服***包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的问句推荐程序,所述问句推荐程序被所述处理器执行时实现如上所述的问句推荐方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有问句推荐程序,所述问句推荐程序被处理器执行时实现如上所述的问句推荐方法的步骤。
本发明在根据待回答问句输出答案之后,在语料库中查找与所述待回答问句相似的各个相似问句,然后根据相似度计算算法,将所述待回答问句与所述语料库中的各个相似问句进行相似度计算,得到各个相似度值,再根据每个相似问句的相似度值和预存反馈数据,计算每个相似问句相对于所述待回答问句的推荐得分,将得分高于给定值的相似问句作为推荐问句,最终输出所述推荐问句。本发明在推荐语句时,是先在语料库中筛选出与待回答问句相似的各个相似问句,再结合预存的反馈数据计算每个相似问句的推荐得分,以将得分高于给定值的相似问句作为推荐问句,相比现有技术仅通过关键词推荐问句,本发明提高了客服***推荐问句的准确率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的***结构示意图;
图2为本发明问句推荐方法第一实施例的流程示意图;
图3为本发明实施例中一种反馈矩阵示意图;
图4为本发明实施例中根据相似度计算算法,将所述待回答问句与所述语料库中的各个相似问句进行相似度计算,得到各个相似度值的步骤的细化流程图;
图5为本发明问句推荐方法第二实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的解决方案主要是:在根据待回答问句输出答案之后,在语料库中查找与所述待回答问句相似的各个相似问句,然后根据相似度计算算法,将所述待回答问句与所述语料库中的各个相似问句进行相似度计算,得到各个相似度值,再根据每个相似问句的相似度值和预存反馈数据,计算每个相似问句相对于所述待回答问句的推荐得分,将得分高于给定值的相似问句作为推荐问句,最终输出所述推荐问句。以解决客服***推荐问句的准确率低下的问题。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的客服***结构示意图。
如图1所示,该客服***可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元,比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,客服***还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。
本领域技术人员可以理解,图1中示出的客服***结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作***以及问句推荐程序。其中,操作***是管理和控制客服***硬件和软件资源的程序,支持问句推荐程序以及其它软件和/或程序的运行。
在图1所示的客服***中,网络接口1004主要用于接入网络;用户接口1003主要用于获取待回答问句,而处理器1001可以用于调用存储器1005中存储的问句推荐程序,并执行下文所述的问句推荐方法的步骤。
基于上述的硬件结构,提出问句推荐方法的各个实施例。
本发明实施例中的客服***可以是PC,也可以是智能手机、平板电脑、便携计算机等终端设备。
参照图2,图2为本发明问句推荐方法第一实施例的流程示意图。
在本实施例中,提供了问句推荐方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
所述问句推荐方法包括:
步骤S10,在根据待回答问句输出答案之后,在语料库中查找与所述待回答问句相似的各个相似问句;
步骤S20,根据相似度计算算法,将所述待回答问句与所述语料库中的各个相似问句进行相似度计算,得到各个相似度值;
步骤S30,根据每个相似问句的相似度值和预存反馈数据,计算每个相似问句相对于所述待回答问句的推荐得分,将得分高于给定值的相似问句作为推荐问句;
步骤S40,输出所述推荐问句。
以下详述本发明问句推荐方法的各个步骤:
步骤S10,在根据待回答问句输出答案之后,在语料库中查找与所述待回答问句相似的各个相似问句;
在本实施例中,先接收用户输入的用户问句,然后根据用户问句的关键词查看语料库中是否存储有对应的待回答问句,若有,则根据该待回答问句输出答案,应理解,语料库中的各个问句都对应有答案,因此确定待回答问句之后,即可输出待回答问句对应的答案。
之后,针对该待回答问句,在语料库中进一步查找是否存在与该待回答问句相似的各个相似问句,本实施例中,可选通过待回答问句的关键词在语料库中进行查找,将与待回答问句的相似度达到预设阈值的预存问句作为待回答问句的相似问句。
当客服***在语料库中查找与待回答问句相似的相似问句之后,在客服***根据待回答问句输出对应的答案的同时,将相似度较高的N条相似问句作为推荐问句在答案显示页面显示,其中N可以根据实际需求设置为五条或十条。在本实施例中,客服***将匹配到的相似问句显示于答案显示页面的下方,具体的,位于答案的下方。
步骤S20,根据相似度计算算法,将所述待回答问句与所述语料库中的各个相似问句进行相似度计算,得到各个相似度值;
客服***将待回答问句与语料库中其他各个相似问句进行相似度计算,得到每条相似问句与待回答问句的相似度值,其中,计算每条相似问句与待回答问句的相似度值的方法可以是雅可比相似度算法,余弦相似度算法,带TF-IDF的余弦相似度算法中的一种或几种,在此不做限定。
步骤S30,根据每个相似问句的相似度值和预存反馈数据,计算每个相似问句相对于所述待回答问句的推荐得分,将得分高于给定值的相似问句作为推荐问句;
客服***根据每条相似问句与待回答问句的相似度值,结合反馈数据和预设得分推荐公式,计算每条相似问句的推荐得分,客服***根据得分高低,选取高于给定值的相似问句作为推荐问句。
在本实施例中,反馈数据可选是一个反馈矩阵,用于收集用户和客服***之间的会话信息,参照图3,具体表现为:在反馈矩阵中,客服***为语料库中的各个预存问句建立两两之间的关系,并设置预存问句两两之间关系的权重值,表现为(A←B:a,b),表示问句B在同一用户会话中出现为问句A的下一问句的次数为a,而问句A和B之间这一关系的权重为b,例如(A←B:10,1),表示问句B在同一用户会话中出现为问句A的下一问句的次数为10,而问句A和B之间这一关系的权重为1,其中,权重值的赋值可选根据出现次数来定,如本实施例中1-99次的权重值为1。当用户在同一会话中提出问句A后,若下一问句为问句B,客服***则会在反馈矩阵中将(A←B)关系的次数增加1。在用户会话中,问句B既可以是用户自主输入,也可以是用户在问句A的推荐问句中选择的。
具体地,参照图4,所述步骤S20包括:
步骤S21,在所述反馈数据中确定与所述待回答问句相似的下一问句,以统计每个下一问句出现的次数,获取所有与所述待回答问句相似的下一问句在所述反馈数据中出现的总次数;
步骤S22,计算所述每个下一问句出现的次数在所述总次数中的占比;
步骤S23,根据每个下一问句对应的相似度值、预设的相似度权重值、在所述总次数中的占比以及预设的占比权重值,计算每个相似问句相对于所述待回答问句的推荐得分,将得分高于给定值的相似问句作为推荐问句。
客服***在计算每条相似问句的推荐得分的过程中,客服***获取在反馈数据中与待回答问句相似的下一问句,统计每条下一问句在反馈数据中出现的次数,并获取所有下一问句在反馈数据中出现的总次数,计算每条下一问句出现的次数与总次数的比值,根据计算得出的每条下一问句相似度值、预设的相似度权重值、每条下一问句出现次数在总次数的占比以及预设的占比权重值,计算每条相似问句的推荐得分,将高于给定值的相似问句作为输出对象。本实施例中,得分公式具体表现为:
其中,sim_scorex为相似问句x与待回答问句y的相似度值,sim_weightx为相似度得分的权重值,county←x为待回答问句y出现下一问句为相似问句x的次数,为出现相似问句x的次数在y问句出现下一问句的总次数的占比权重值,相似度权重值与占比权重值的取值范围为0-1,且两者
为问句y的下一问句的权重值,sta_weighty←x和sta_weighty←i可根据实际情况人为赋值,在本实施例中,两者固定取值为1。预设一个给定值β,当客服***计算得到推荐得分α>给定值β时,输出该相似问句,在本实施例中β可选设置为0.5。
需要说明的是,在本实施例中,可以不设给定值β,在客服***计算得到每条相似问句的推荐得分后,按照得分高低,选取得分高的前五条或者前十条作为推荐语句。
为避免马太效应,除了计算得到的相似问句,客服***还会从与待回答问句相似的问句中随机挑选一个相似问句作为输出问句进而使得所有相似问句均有被展示的可能。
步骤S40,输出所述推荐问句。
本实施例中,在根据待回答问句输出答案之后,在语料库中查找与所述待回答问句相似的各个相似问句,然后根据相似度计算算法,将所述待回答问句与所述语料库中的各个相似问句进行相似度计算,得到各个相似度值,再根据每个相似问句的相似度值和预存反馈数据,计算每个相似问句相对于所述待回答问句的推荐得分,将得分高于给定值的相似问句作为推荐问句,最终输出所述推荐问句。本发明在推荐语句时,是先在语料库中筛选出与待回答问句相似的各个相似问句,再结合预存的反馈数据计算每个相似问句的推荐得分,以将得分高于给定值的相似问句作为推荐问句,相比现有技术仅通过关键词推荐问句,本发明提高了客服***推荐问句的准确率。
进一步地,提出本发明问句推荐方法第二实施例。
所述问句推荐方法第二实施例与所述问句推荐方法第一实施例的区别在于,参照图5,步骤S10之前,问句推荐方法还包括:
步骤S50,在接收到用户输入的用户问句后,判断所述用户问句是否有歧义;
用户可以在客服***显示界面中手动输入用户问句,用户也可以通过语音的方式输入用户问句,当客服***获取到语音形式的用户问句时,会将语音形式的用户问句转换为文字形式的用户问句,当客服***接收到用户输入的用户问句时,判断所述用户问句是否有歧义,判断用户问句是否有歧义,就是看用户问句的关键词是否在语料库中匹配到多个语句,例如用户问句的关键词为“额度”,通过该关键词,在语料库中匹配到两个语句,“贷款额度是多少“,“还款的额度是多少”,此时,认为用户语句有歧义。
步骤S60,若所述用户问句有歧义,则将所述用户问句与语料库中的预存问句进行比较;
若所述用户问句有歧义,客服***将用户问句与语料库中的预存问句进行比较,其中,客服***包含语料库,语料库中有预存问句。
具体的,客服***将用户问句与语料库中的预存问句进行比较的过程为:当客服***获取到用户问句时,对用户问句进行分词处理,其中,客服***可通过开源分词工具对用户问句进行分词处理,得到分词后的待回答问句。当客服***得到分词后的用户问句后,客服***提取用户问句中的关键词,将提取的关键词与语料库中预存问句中的关键词进行比较,从而计算用户问句与语料库中预存问句的相似度,其中,计算相似度的方法可以是雅可比相似度算法,余弦相似度算法,带TF-IDF(term frequency–inverse documentfrequency,一种用于信息检索与数据挖掘的常用加权技术)的余弦相似度算法中的一种或几种,在此不做限定。
当计算得到用户问句与预存问句之间相似度大于预设值时,则说明用户问句与语料库中的预存问句匹配,预设值可根据具体需要而设置,如可设置为60%,或者设置为76%等。
需要说明的是,客服***在对用户问句进行分词处理时,会过滤无意义词汇,如“谢谢”、“人工服务”、“没了”、“你好”、“转人工”和“的问题”等词组。如当用户问句为“贷款是什么东西,谢谢”时,对用户问句进行分词处理后,得到的词汇为“贷款”、“是”、“什么”、“东西”和“谢谢”,首先过滤掉无意义词组“谢谢”。
进一步地,客服***在对用户问句进行分词处理之前,客服***先检测用户问句中是否存在数字或标点符号,客服***若检测到用户问句中存在数字或标点符号,则删除用户问句中的数字或标点符号;客服***若在用户问句中未检测到数字或标点符号,则对用户问句进行分词处理。
步骤S70,在所述语料库中匹配到至少两条预存问句时,根据所述反馈数据,判断匹配到的所述预存问句是否满足预设条件;
客服***将接收到的用户问句与语料库中预存问句进行匹配,若得到匹配到至少两条预存问句的结果,说明用户问句存在歧义,客服***根据预存的反馈数据,判断匹配到的预存问句是否满足预设条件,其中,反馈数据在上文实施例中已经详述,此处不做赘述。
进一步地,步骤S70的实施方式包括:
1)方式一、所述步骤S70包括:
步骤a1,当匹配到至少两条预存问句时,获取匹配到的每条预存问句在所述反馈数据中出现的次数,并获取匹配到的所有预存问句在所述反馈数据中出现的总次数;
步骤b1,计算所述每条预存问句出现的次数在所述总次数中的占比;
步骤c1,根据所述每条预存问句在所述总次数中的占比,判断每条预存语句是否满足预设条件;
其中,当所述预存问句出现的次数在总次数中的占比大于目标值时,则确定所述预存问句满足预设条件。
2)方式二、所述步骤S70包括:
步骤a2,当匹配到至少两条预存问句时,获取匹配到的每条预存问句在所述反馈数据中出现的次数,并获取匹配到的所有预存问句在所述反馈数据中出现的总次数;
步骤b2,计算所述每条预存问句出现的次数在所述总次数中的占比;
步骤c2,根据所述每条预存问句出现的次数和在所述总次数中的占比,判断每条预存语句是否满足预设条件;
其中,当预存问句在所述反馈数据出现的次数大于预设次数,且所述预存问句出现的次数在总次数中的占比大于目标值时,则确定所述预存问句满足预设条件。
判断匹配到的所述预存问句是否满足预设条件的具体过程为:当用户问句在语料库中匹配到至少两条预存问句时,客服***获取匹配到的每条预存问句在反馈数据中出现的次数,并计算所有匹配到的预存问句在反馈数据中出现的次数之和,得到所有匹配到的预存问句在反馈数据中出现的总次数,然后,计算匹配到的每条预存问句出现的次数与总次数的比值,得到每条预存问句出现的次数在总次数中的占比。根据每条预存问句在反馈数据出现的次数,和在总次数中的占比,判断每条预存语句是否满足预设条件。
具体判断依据为:当预存问句在反馈数据中出现的次数大于给定阈值,且预存问句在反馈数据中出现的次数在总次数中的占比大于目标值时,则确定该预存问句满足预设条件,本实施例中,客服***预设条件具体表现为公式:
其中,count1为预存问句在反馈数据中出现的次数,θ为给定阈值,θ可以根据实际情况设置为100,或者500,目标值设置为γ,取值为[0.5,1),因此,满足预设条件的预存问句最多只有一条。
步骤S80,若存在满足所述预设条件的预存问句,则将满足所述预设条件的预存问句作为待回答问句替换所述用户问句。
若客服***判断有预存问句满足预设条件,则客服***从语料库中获取满足预设条件的预存问句,将满足预设条件的预存问句作为客服***的待回答问句,即后续客服***只需对满足预设条件的预存问句进行答复。
进一步地,当客服***在语料库中获取到满足预设条件的预存问句,并将满足预设条件的预存问句作为待回答问句后,客服***在语料库中获取与该待回答问句对应的答案,并将该答案输出至显示界面中,以供用户查看。需要说明的是,在语料库中,每个预存问句都与其对应的答案关联存储。因此,当确定语料库中的某个预存问句后,即可确定其对应的答案并输出。
本实施例实现了在获取到待回答问句时,先在语料库中筛选出与待回答问句匹配的预存问句,再结合预存的反馈数据对预存问句进行进一步筛选,以查找筛选出的待回答问句,提高了客服***推荐问句的准确率。
进一步地,提出本发明问句推荐方法第三实施例。
所述问句推荐方法第三实施例与所述问句推荐方法第二实施例的区别在于,步骤S70之后,问句推荐方法还包括:
步骤A,若不存在满足所述预设条件的预存问句,则输出匹配到的所有预存问句以供用户选择。
若语料库中不存在满足预设条件的预存问句,则客服***输出匹配到的所有预存问句以供用户手动选择预存问句作为输入问句。
具体的,若不存在满足预设条件的预存问句,则客服***弹出弹窗,将匹配到的所有预存问句在弹窗中以列表的形式排列输出,其中,排列的依据可选地根据相似度从高到低,按序排列,用户选择某序号的问句则表示该序号对应的问句作为客服***接收问句。
当用户选定某预存问句作为输入问句时,客户原先输入的待回答问句作废,客服***根据用户选定的预存问句,在语料库中查找该预存问句对应的答案作为本次问句推荐的最终答案,并输出该答案。
需要说明的是,弹窗除了列有客服***匹配到的所有预存问句之外,还设置有返回键,当用户对客服***输出的所有预存问句都不满意时,点击返回键,此时客服***输出默认答案,本次问句推荐结束,其中默认答案可根据实际情况设置,如可设置为“很抱歉未找到符合要求的答案,我们会持续学习”。
本实施例当在语料库中不存在满足预设条件的预存问句时,输出匹配到的所有预存问句以供用户选择,以将用户选择的预存问句作为客服***接收问句,并输出接收问句对应的答案,提高了客服***回答用户问句的成功率。
进一步地,提出本发明问句推荐方法第四实施例。
所述问句推荐方法第四实施例与所述问句推荐方法第一实施例至第三实施例的区别在于,步骤S10之后,所述问句推荐方法还包括:
步骤B,根据所述待回答问句和所述反馈数据,获取与所述待回答问句关联的下一问句;
步骤C,将获取的下一问句作为推荐问句进行输出。
进一步地,步骤B包括:
在预存的反馈数据中,查询所述待回答问句的下一问句,若下一问句存在多个问句,则获取出现次数最多的问句作为所述待回答问句关联的下一问句。
当客服***根据待回答问句,在语料库中查找到对应的答案后,客服***根据反馈数据查询与待回答问句关联的下一问句,其中,与待回答问句关联的下一问句是客服***将收集到的与用户会话中的待回答问句,通过关联规则的挖掘算法找出的频繁项集。若与待回答问句关联的下一问句存在多个问句,则获取在反馈数据中出现次数最多的与待回答问句关联的下一问句,将获取的下一问句作为推荐问句,并在答案显示界面上输出该推荐问句。
需要说明的是,本实施例与第三实施例不同的地方在于,本实施例仅通过查询反馈数据中与待回答问句关联的下一问句在反馈数据中出现的次数来筛选推荐问句,而不需要通过计算相似度,即推荐问句跟待回答问句可以没有相似关系。
当反馈数据集较小时,为了保证推荐的准确率,通过算法挖掘出的频繁项集需要进行人工审核后方能作为推荐问句。
本实施例提出一种仅通过查询反馈数据中与接收问句关联的下一问句在反馈数据中出现的次数来筛选推荐问句,而不需要通过计算相似度,实现了用户在获取自己输入问句对应的答案过程中,可在客服***的显示界面直接选择与其输入的问句相关联的下一问句,提高了客服***的智能性。
进一步地,问句推荐方法还包括:
步骤D,根据所述待回答问句,更新反馈数据中待回答问句在反馈数据中出现的次数。
当客服***得到待回答问句后,客服***将待回答问句在反馈数据中出现的次数加1,以更新反馈数据。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有问句推荐程序,所述问句推荐程序被处理器执行时实现如上文所述的问句推荐方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种问句推荐方法,其特征在于,所述问句推荐方法包括以下步骤:
在根据待回答问句输出答案之后,在语料库中查找与所述待回答问句相似的各个相似问句;
根据相似度计算算法,将所述待回答问句与所述语料库中的各个相似问句进行相似度计算,得到各个相似度值;
根据每个相似问句的相似度值和预存反馈数据,计算每个相似问句相对于所述待回答问句的推荐得分,将得分高于给定值的相似问句作为推荐问句;
输出所述推荐问句。
2.如权利要求1所述的问句推荐方法,其特征在于,所述根据每个相似问句的相似度值和预存反馈数据,计算每个相似问句相对于所述待回答问句的推荐得分,将得分高于给定值的相似问句作为推荐问句的步骤包括:
在所述反馈数据中确定与所述待回答问句相似的下一问句,以统计每个下一问句出现的次数,获取所有与所述待回答问句相似的下一问句在所述反馈数据中出现的总次数;
计算所述每个下一问句出现的次数在所述总次数中的占比;
根据每个下一问句对应的相似度值、预设的相似度权重值、在所述总次数中的占比以及预设的占比权重值,计算每个相似问句相对于所述待回答问句的推荐得分,将得分高于给定值的相似问句作为推荐问句。
3.如权利要求1所述的问句推荐方法,其特征在于,所述反馈数据中,为语料库的各个预存问句建立两两之间的关系,并设置预存问句两两之间关系的权重值,表现为(A←B:a,b),表示问句B在同一用户会话中出现为问句A的下一问句的次数为a,而问句A和B之间这一关系的权重为b。
4.如权利要求3所述的问句推荐方法,其特征在于,所述在根据待回答问句输出答案之后,在语料库中查找与所述待回答相似的各个相似问句的步骤之前,所述方法还包括:
在接收到用户输入的用户问句后,判断所述用户问句是否有歧义;
若所述用户问句有歧义,则将所述用户问句与语料库中的预存问句进行比较;
在所述语料库中匹配到至少两条预存问句时,根据所述反馈数据,判断匹配到的所述预存问句是否满足预设条件;
若存在满足所述预设条件的预存问句,则将满足所述预设条件的预存问句作为待回答问句替换所述用户问句。
5.如权利要求4所述的问句推荐方法,其特征在于,所述在所述语料库中匹配到至少两条预存问句时,根据所述反馈数据,判断匹配到的所述预存问句是否满足预设条件的步骤包括:
当匹配到至少两条预存问句时,获取匹配到的每条预存问句在所述反馈数据中出现的次数,并获取匹配到的所有预存问句在所述反馈数据中出现的总次数;
计算所述每条预存问句出现的次数在所述总次数中的占比;
根据所述每条预存问句出现的次数和在所述总次数中的占比,判断每条预存语句是否满足预设条件;
其中,当预存问句在所述反馈数据出现的次数大于预设次数,且所述预存问句出现的次数在总次数中的占比大于目标值时,则确定所述预存问句满足预设条件。
6.如权利要求4所述的问句推荐方法,其特征在于,所述在所述语料库中匹配到至少两条预存问句时,根据所述反馈数据,判断匹配到的所述预存问句是否满足预设条件的步骤之后,所述方法还包括:
若不存在满足所述预设条件的预存问句,则输出匹配到的所有预存问句以供用户选择。
7.如权利要求1-6任一项所述问句推荐方法,其特征在于,所述在根据待回答问句输出答案之后,在语料库中查找与所述待回答问句相似的各个相似问句的步骤之后,所述方法还包括:
根据所述待回答问句和所述反馈数据,获取与所述待回答问句关联的下一问句;
将获取的下一问句作为推荐问句进行输出。
8.如权利要求7所述的问句推荐方法,其特征在于,所述根据所述待回答问句和所述反馈数据,获取与所述待回答问句关联的下一问句的步骤包括:
在预存的反馈数据中,查询所述待回答问句的下一问句,若下一问句存在多个问句,则获取出现次数最多的问句作为所述待回答问句关联的下一问句。
9.一种客服***,其特征在于,所述客服***包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的问句推荐程序,所述问句推荐程序被所述处理器执行时实现如权利要求1至8中任一项所述的问句推荐方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有问句推荐程序,所述问句推荐程序被处理器执行时实现如权利要求1至8中任一项所述的问句推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810744322.5A CN109063000B (zh) | 2018-07-06 | 2018-07-06 | 问句推荐方法、客服***以及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810744322.5A CN109063000B (zh) | 2018-07-06 | 2018-07-06 | 问句推荐方法、客服***以及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109063000A true CN109063000A (zh) | 2018-12-21 |
CN109063000B CN109063000B (zh) | 2022-02-01 |
Family
ID=64819591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810744322.5A Active CN109063000B (zh) | 2018-07-06 | 2018-07-06 | 问句推荐方法、客服***以及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109063000B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109766013A (zh) * | 2018-12-28 | 2019-05-17 | 北京金山安全软件有限公司 | 诗词语句输入推荐方法、装置和电子设备 |
CN110008322A (zh) * | 2019-03-25 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 多轮对话场景下的话术推荐方法和装置 |
CN110765247A (zh) * | 2019-09-30 | 2020-02-07 | 支付宝(杭州)信息技术有限公司 | 一种用于问答机器人的输入提示方法及装置 |
CN111353015A (zh) * | 2018-12-24 | 2020-06-30 | 阿里巴巴集团控股有限公司 | 众包题目推荐方法、装置、设备及存储介质 |
CN111475632A (zh) * | 2020-04-09 | 2020-07-31 | 深圳追一科技有限公司 | 问句处理方法、装置、电子设备及存储介质 |
CN111737449A (zh) * | 2020-08-03 | 2020-10-02 | 腾讯科技(深圳)有限公司 | 相似问题的确定方法和装置、存储介质及电子装置 |
CN112541069A (zh) * | 2020-12-24 | 2021-03-23 | 山东山大鸥玛软件股份有限公司 | 一种结合关键词的文本匹配方法、***、终端及存储介质 |
CN113139034A (zh) * | 2020-01-17 | 2021-07-20 | 深圳市优必选科技股份有限公司 | 一种语句匹配方法、语句匹配装置及智能设备 |
CN117132392A (zh) * | 2023-10-23 | 2023-11-28 | 蓝色火焰科技成都有限公司 | 车辆贷款欺诈风险预警方法及*** |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6519578B1 (en) * | 1999-08-09 | 2003-02-11 | Mindflow Technologies, Inc. | System and method for processing knowledge items of a knowledge warehouse |
CN102722558A (zh) * | 2012-05-29 | 2012-10-10 | 百度在线网络技术(北京)有限公司 | 一种为用户推荐提问的方法和装置 |
US8700558B1 (en) * | 2007-03-06 | 2014-04-15 | Patrick Laughlin Kelly | User interface for entering and viewing quantitatively weighted factors for decision choices |
CN105653671A (zh) * | 2015-12-29 | 2016-06-08 | 畅捷通信息技术股份有限公司 | 相似信息推荐方法及*** |
CN107220380A (zh) * | 2017-06-27 | 2017-09-29 | 北京百度网讯科技有限公司 | 基于人工智能的问答推荐方法、装置和计算机设备 |
CN107704563A (zh) * | 2017-09-29 | 2018-02-16 | 广州多益网络股份有限公司 | 一种问句推荐方法及*** |
-
2018
- 2018-07-06 CN CN201810744322.5A patent/CN109063000B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6519578B1 (en) * | 1999-08-09 | 2003-02-11 | Mindflow Technologies, Inc. | System and method for processing knowledge items of a knowledge warehouse |
US8700558B1 (en) * | 2007-03-06 | 2014-04-15 | Patrick Laughlin Kelly | User interface for entering and viewing quantitatively weighted factors for decision choices |
CN102722558A (zh) * | 2012-05-29 | 2012-10-10 | 百度在线网络技术(北京)有限公司 | 一种为用户推荐提问的方法和装置 |
CN105653671A (zh) * | 2015-12-29 | 2016-06-08 | 畅捷通信息技术股份有限公司 | 相似信息推荐方法及*** |
CN107220380A (zh) * | 2017-06-27 | 2017-09-29 | 北京百度网讯科技有限公司 | 基于人工智能的问答推荐方法、装置和计算机设备 |
CN107704563A (zh) * | 2017-09-29 | 2018-02-16 | 广州多益网络股份有限公司 | 一种问句推荐方法及*** |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111353015A (zh) * | 2018-12-24 | 2020-06-30 | 阿里巴巴集团控股有限公司 | 众包题目推荐方法、装置、设备及存储介质 |
CN111353015B (zh) * | 2018-12-24 | 2024-03-15 | 阿里巴巴集团控股有限公司 | 众包题目推荐方法、装置、设备及存储介质 |
CN109766013A (zh) * | 2018-12-28 | 2019-05-17 | 北京金山安全软件有限公司 | 诗词语句输入推荐方法、装置和电子设备 |
CN110008322B (zh) * | 2019-03-25 | 2023-04-07 | 创新先进技术有限公司 | 多轮对话场景下的话术推荐方法和装置 |
CN110008322A (zh) * | 2019-03-25 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 多轮对话场景下的话术推荐方法和装置 |
CN110765247B (zh) * | 2019-09-30 | 2022-10-25 | 支付宝(杭州)信息技术有限公司 | 一种用于问答机器人的输入提示方法及装置 |
CN110765247A (zh) * | 2019-09-30 | 2020-02-07 | 支付宝(杭州)信息技术有限公司 | 一种用于问答机器人的输入提示方法及装置 |
CN113139034A (zh) * | 2020-01-17 | 2021-07-20 | 深圳市优必选科技股份有限公司 | 一种语句匹配方法、语句匹配装置及智能设备 |
CN111475632A (zh) * | 2020-04-09 | 2020-07-31 | 深圳追一科技有限公司 | 问句处理方法、装置、电子设备及存储介质 |
CN111737449A (zh) * | 2020-08-03 | 2020-10-02 | 腾讯科技(深圳)有限公司 | 相似问题的确定方法和装置、存储介质及电子装置 |
CN112541069A (zh) * | 2020-12-24 | 2021-03-23 | 山东山大鸥玛软件股份有限公司 | 一种结合关键词的文本匹配方法、***、终端及存储介质 |
CN117132392A (zh) * | 2023-10-23 | 2023-11-28 | 蓝色火焰科技成都有限公司 | 车辆贷款欺诈风险预警方法及*** |
CN117132392B (zh) * | 2023-10-23 | 2024-01-30 | 蓝色火焰科技成都有限公司 | 车辆贷款欺诈风险预警方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN109063000B (zh) | 2022-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109063000A (zh) | 问句推荐方法、客服***以及计算机可读存储介质 | |
CN107832286B (zh) | 智能交互方法、设备及存储介质 | |
CN107609101B (zh) | 智能交互方法、设备及存储介质 | |
JP6440732B2 (ja) | 機械学習に基づく自動タスク分類 | |
US11556572B2 (en) | Systems and methods for coverage analysis of textual queries | |
CN104836720A (zh) | 交互式通信中进行信息推荐的方法及装置 | |
CN108681970A (zh) | 基于大数据的理财产品推送方法、***及计算机存储介质 | |
CN104899315A (zh) | 推送用户信息的方法和装置 | |
CN110472008B (zh) | 智能交互方法以及装置 | |
CN107562939A (zh) | 垂直领域新闻推荐方法、装置及可读储存介质 | |
CN112912873A (zh) | 动态地抑制搜索中的查询答复 | |
CN110134845A (zh) | 项目舆情监控方法、装置、计算机设备及存储介质 | |
CN109542956A (zh) | 报表生成方法、装置、计算机设备和存储介质 | |
US20230244862A1 (en) | Form processing method and apparatus, device, and storage medium | |
US20160253313A1 (en) | Updating language databases using crowd-sourced input | |
CN110175264A (zh) | 视频用户画像的构建方法、服务器及计算机可读存储介质 | |
JP2020135135A (ja) | 対話コンテンツ作成支援方法およびシステム | |
CN104077327B (zh) | 核心词重要性识别方法和设备及搜索结果排序方法和设备 | |
CN107315833A (zh) | 基于应用程序的检索与下载的方法和装置 | |
CN111666513A (zh) | 页面处理方法、装置、电子设备及可读存储介质 | |
CN116681561A (zh) | 一种政策匹配方法、装置、电子设备及存储介质 | |
Wei et al. | Online education recommendation model based on user behavior data analysis | |
CN106919593B (zh) | 一种搜索的方法和装置 | |
CN114253990A (zh) | 数据库查询方法、装置、计算机设备和存储介质 | |
CN110389963A (zh) | 基于大数据的渠道效果识别方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |