CN110110049A - 服务咨询方法、装置、***、服务机器人及存储介质 - Google Patents
服务咨询方法、装置、***、服务机器人及存储介质 Download PDFInfo
- Publication number
- CN110110049A CN110110049A CN201711469814.XA CN201711469814A CN110110049A CN 110110049 A CN110110049 A CN 110110049A CN 201711469814 A CN201711469814 A CN 201711469814A CN 110110049 A CN110110049 A CN 110110049A
- Authority
- CN
- China
- Prior art keywords
- word
- template
- search
- answer
- matching degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于分布式搜索的服务咨询方法、装置、***、服务机器人及存储介质,用于机器人咨询问题的自动回复。本发明提供的方法包括:获取咨询问题;对所述咨询问题进行分词处理,以得到各个词语;查询所述词语预设的权重;将预设有权重的所述词语确定为问题关键词;利用分布式搜索方式搜索与所述问题关键词相关的模板问题;计算所述模板问题与所述问题关键词的匹配度;将具有最高匹配度的所述模板问题的模板答案确定为所述咨询问题的咨询答案。本发明通过设置词语预设的权重来准确确定问题关键词,可以提高搜索结果的准确性。同时,利用分布式搜索方式搜索模板问题,可有效提高搜索效率,并使得搜索操作简单、方便、快捷。
Description
技术领域
本发明涉及智能机器人领域,尤其涉及一种基于分布式搜索的服务咨询方法、装置、***、服务机器人及存储介质。
背景技术
在传统的服务行业,如银行、机场、医疗等服务行业,随着业务种类和业务复杂度的不断增加,用户群体的不断扩大,广大用户对用户咨询等方面的服务需求也在随之加大,而这些不断加大的服务需求往往需要不同的业务人员来解答,使得传统服务行业需在咨询人员培训和管理方面投入大量的成本。因而,为降低投入成本,传统服务行业越来越多开始通过智能机器人进行咨询问题的答复,但现有技术中的智能机器人在进行咨询回复中往往存在准确率不高、效率较低的问题。
综上,如何提高机器人咨询回复的准确性和效率性成为本领域技术人员亟待解决的问题。
发明内容
本发明实施例提供了一种基于分布式搜索的服务咨询方法、装置、***、服务机器人及存储介质,能够提高咨询回复的准确性和效率。
本发明实施例的第一方面提供了一种基于分布式搜索的服务咨询方法,包括:
获取咨询问题;
对所述咨询问题进行分词处理,以得到各个词语;
查询所述词语预设的权重;
将预设有权重的所述词语确定为问题关键词;
利用分布式搜索方式搜索与所述问题关键词相关的模板问题;
计算所述模板问题与所述问题关键词的匹配度;
将具有最高匹配度的所述模板问题的模板答案确定为所述咨询问题的咨询答案。
本发明实施例的第二方面提供了一种基于分布式搜索的服务咨询装置,包括:
咨询问题获取模块,用于获取咨询问题;
分词模块,用于对所述咨询问题进行分词,以得到各个词语;
权重查询模块,用于查询所述词语预设的权重;
问题关键词确定模块,用于将预设有权重的所述词语确定为问题关键词;
模板问题搜索模块,用于利用分布式搜索方式搜索与所述问题关键词相关的模板问题;
匹配度计算模块,用于计算所述模板问题与所述问题关键词的匹配度;
咨询答案确定模块,用于将具有最高匹配度的所述模板问题的模板答案确定为所述咨询问题的咨询答案。
本发明实施例的第三方面提供了一种基于分布式搜索的服务机器人,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前述第一方面所述服务咨询方法的步骤。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如前述第一方面所述服务咨询方法的步骤。
本发明实施例的第五方面提供了一种基于分布式搜索的服务咨询***,包括服务机器人、搜索微服务器、问题检索服务器和数据库;
所述服务机器人,用于获取用户的咨询问题,并将获取的所述咨询问题发送给所述搜索微服务器,在所述搜索微服务器返回咨询答案后,将所述咨询答案反馈给所述用户;
所述搜索微服务器,用于接收所述服务机器人发送的所述咨询问题,对所述咨询问题进行分词处理,分词处理完获得各个词语后,在所述数据库中根据场景类别查询所述词语预设的权重,并将查询到权重的所述词语确定为问题关键词发送至所述问题检索服务器,在获得所述问题检索服务器返回的模板问题与所述问题关键词的匹配度后,确定具有最高匹配度的所述模板问题的模板答案为所述咨询问题的咨询答案,并将所述咨询答案发送给所述服务机器人;
所述问题检索服务器,用于接收所述搜索微服务器发送的所述问题关键词,并利用分布式搜索方式搜索与所述问题关键词相关的所述模板问题,在搜索到所述模板问题后,计算所述模板问题与所述问题关键词的匹配度,并将所述模板问题及对应的匹配度发送给所述搜索微服务器。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例中,在获取咨询问题后,首先对该咨询问题进行分词以得到各个词语,并查询各个词语预设的权重后,将预设有权重的词语确定为问题关键词,即通过设置词语预设的权重来准确确定问题关键词,从而提高搜索结果的准确性。随后,利用分布式搜索方式搜索与问题关键词相关的模板问题,并根据模板问题与问题关键词的匹配度确定咨询答案,以进一步提高咨询答***性,同时,通过分布式搜索方式进行模板问题的搜索可有效提高搜索效率,并且使得搜索操作简单、方便、快捷。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的基于分布式搜索的服务咨询方法的方法流程图;
图2为本发明实施例一中的服务咨询方法步骤S170在一个应用场景下的流程示意图;
图3为本发明实施例二提供的基于分布式搜索的服务咨询装置的示意图;
图4为本发明实施例三提供的基于分布式搜索的服务机器人的示意图;
图5为本发明实施例四提供的基于分布式搜索的服务咨询***的结构示意图。
具体实施方式
本发明实施例提供了一种基于分布式搜索的服务咨询方法、装置、***、服务机器人及存储介质,能够提高服务咨询回复的准确性和效率。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例一提供了一种基于分布式搜索的服务咨询方法,包括步骤S110:获取咨询问题;步骤S120:对所述咨询问题进行分词处理,以得到各个词语;步骤S130:查询所述词语预设的权重;步骤S140:将预设有权重的所述词语确定为问题关键词;步骤S150:利用分布式搜索方式搜索与所述问题关键词相关的模板问题;步骤S160:计算所述模板问题与所述问题关键词的匹配度;步骤S170:将具有最高匹配度的所述模板问题的模板答案确定为所述咨询问题的咨询答案。
具体地,步骤S110:获取咨询问题。
在此,获取的咨询问题可以直接是文本格式的咨询问题,如咨询对象通过人机交互界面或者键盘等输入的咨询问题,也可以是语音格式的咨询问题,如咨询对象直接以语音或者声音输入的方式提问。
当咨询对象以语音或声音输入的方式提问时,步骤S110具体包括:采集咨询对象所输入的语音信息;对所述语音信息进行语音识别,得到文本格式的咨询问题。
在本实施例中,对所采集的语音信息进行NLP处理(自然语言处理),以识别所述语音信息,并对识别后的语音信息进行格式转换,以得到文本格式的咨询问题,从而便于后续的分词处理。
步骤S120:对所述咨询问题进行分词处理,以得到各个词语。
本实施例中,通过采用通用分词器对所述咨询问题进行分词处理,从而将所述咨询问题分成若干个单独词语,如对于“请问在哪开户”,经过分词处理后,则会得到“请问”、“在哪”、“开户”三个词语。
步骤S130:查询所述词语预设的权重。
在本实施例中,查询所述词语预设的权重,具体包括:获取所述语音信息所在地点的场景类别;根据所述场景类别与所述词语权重的预设对应关系查询所述词语预设的权重。
在此,在不同的服务场景中,首先预设可能咨询到的问题,并对该问题进行分词处理,根据分词处理后的各个词语在该问题中的重要性确定各个词语的初始权重并保存于数据库中,随后,可根据多次咨询问题中词语与数据库中保存词语的匹配关系,调整词语的权重,也就是说,如果咨询问题中出现了数据库中保存的词语,则相应地增加该词语的权重。比如,数据库中,“开户”初始权重为1,而某一咨询问题为“请问在哪开户”,即咨询问题中出现了“开户”词语,则可相应的增加数据库中“开户”的权重,如增加至1.1或者2等等,以此训练确定各词语预设的权重。
但某一预设词语的权重往往跟具体的场景类别相对应,如在银行场景中,“开户”可能是权重较大的词语,而在机场场景或者药店场景中,“开户”的权重则相应的会小很多,甚至是没有权重。也就是说,对于不同的服务场景,在数据库中均有与之相对应词语的权重信息,如可针对不同的场景类别,在数据库中创建不同的词语索引文件,从而使得可以根据场景的不同选择不同的索引文件进行词语的匹配。
具体地,场景类别的选择可以在实际应用中预先设置,如要咨询服务的地点为银行,则可通过人为将场景类别设置为银行场景,当在该场景下需进行词语预设的权重查询时,则直接到与银行相对应的银行索引文件中进行查询;如果要咨询服务的地点为机场的话,则同样可通过人为将场景类别设置为机场场景,当需在该场景下进行词语预设的权重查询时,则直接到与机场相对应的机场索引文件中进行查询;如果要咨询服务的地点为药店的话,通过人为将场景类别设置为药店场景,当需在该场景下进行词语预设的权重查询时,则直接到与药店相对应的药店索引文件中进行查询。当然,本实施例中,也可以通过咨询问题的语音信息自动确定所在地点的场景类别,例如咨询问题为“请问在哪开户”的话,则往往自动确定服务场景为银行场景。
步骤S140:将预设有权重的所述词语确定为问题关键词。
在本实施例中,对那些在咨询语句中重要的词语往往会预先设置权重,而那些不重要的词语则往往不会预设权重,因而,对于咨询问题而言,并非所有的词语都会有权重,故本实施例中,将提取那些预设有权重的词语作为问题搜索的问题关键词。例如,某一咨询问题为“请问在哪值机”,分词处理后得到“请问”、“在哪”、“值机”三个词语,“在哪”和“值机”均预设有权重,而“请问”无预设权重,则将“在哪”和“值机”确定为问题搜索的问题关键词。
步骤S150:利用分布式搜索方式搜索与所述问题关键词相关的模板问题。
在确定问题关键词以后,将所确定的所有问题关键词一起发送至服务器,由服务器利用分布式搜索方式搜索与所有问题关键词均相关的模板问题。比如说,在某一场景中,所确定的问题关键词为“在哪”和“值机”,则将“在哪”和“值机”均发送至服务器,服务器利用分布式搜索方式搜索与“在哪”和“值机”均相关的模板问题。当无与“在哪”和“值机”均相关的模板问题时,则搜索与“在哪”相关或者与“值机”相关的模板问题。
在搜索与“在哪”相关或者与“值机”相关的模板问题时,具体包括:根据所述权重的大小确定所述问题关键词的重要等级;依照所述重要等级确定各个问题关键词的搜索顺序;按照各个问题关键词的搜索顺序依次搜索与各个问题关键词相关的模板问题。
即根据“在哪”与“值机”的权重大小确定两者在咨询问题中的重要等级,然后根据在咨询问题中的重要等级来确定两者的搜索顺序,并依照该搜索顺序依次进行搜索。在此,假设“值机”的权重为3,“在哪”的权重为2,则确定“值机”在咨询问题中的重要性高于“在哪”在咨询问题中的重要性,因而利用分布式搜索方式首先搜索与“值机”相关的模板问题,然后搜索与“在哪”相关的模板问题。如果“请问在哪值机”经分词处理后的“请问”、“在哪”和“值机”都没有预设权重的话,则根据分词顺序依次进行搜索,即先搜索与“请问”相关的模板问题,然后搜索与“在哪”相关的模板问题,最后搜索与“值机”相关的模板问题。
步骤S160:计算所述模板问题与所述问题关键词的匹配度。
在搜索与所述问题关键词相关的模板问题时,可能会搜索到多个相关的模板问题,因此,本实施例中,通过模板问题中问题关键词的重合度来计算该模板问题的得分,从而确定模板问题与问题关键词的匹配度,并根据匹配度的大小来确定与咨询问题最接近的模板问题。
步骤S170:将具有最高匹配度的所述模板问题的模板答案确定为所述咨询问题的咨询答案。
在获取模板问题与所述问题关键词的匹配度后,将其中匹配度最高的模板问题确定为与所述咨询问题最相关的模板问题,然后将该最相关的模板问题所对应的模板答案确定为所述咨询问题的咨询答案,并将所述咨询答案反馈给咨询对象,以完成咨询回复。当然,也可以按照匹配度的高低顺序进行排序反馈,即首先反馈匹配度最高的模板问题的模板答案,再反馈次高的模板问题的模板答案,依次类推。
请参阅图2,在一个具体应用场景中,步骤S170:将具有最高匹配度的所述模板问题的模板答案确定为所述咨询问题的咨询答案,具体包括:
步骤S171:判断所述最高匹配度是否大于预设匹配阈值;
步骤S172:若所述最高匹配度大于所述预设匹配阈值,则将具有所述最高匹配度的所述模板问题的模板答案确定为所述咨询问题的咨询答案;
步骤S173:若所述最高匹配度小于所述预设匹配阈值,则确定未搜索到所述咨询问题的咨询答案。
即在该应用场景中,并不是直接将具有最高匹配度的模板问题的模板答案确定为所述咨询问题的咨询答案,而是要判断所述最高匹配度是否大于预设匹配阈值,如果大于所述预设匹配阈值的话,才表明该具有最高匹配度的模板问题与所述咨询问题基本等同或基本相似,此时才可以将该具有该最高匹配度的模板问题所对应的模板答案返回给咨询对象,以完成咨询答复;如果所述最高匹配度小于所述预设匹配阈值的话,则表明虽然检索到与某些问题关键词相关的模板问题,但是该模板问题与所述咨询问题的相关性不高,因而,该模板问题的模板答案不能作为所述咨询问题的咨询答案,则可向咨询对象发送无咨询答案的回复,并可提醒咨询对象具体描述咨询问题或者重新进行咨询问题的提问。在此,通过设置预设匹配阈值来判断模板问题与咨询问题的相似性,可以进一步提高问题回复的准确性,提升用户的使用体感。
本发明实施例中,在获取咨询问题后,首先对该咨询问题进行分词以得到各个词语,并查询各个词语预设的权重后,将预设有权重的词语确定为问题关键词,即通过设置词语预设的权重来准确确定问题关键词,从而提高搜索结果的准确性。随后,利用分布式搜索方式搜索与问题关键词相关的模板问题,并根据模板问题与问题关键词的匹配度确定咨询答案,以进一步提高咨询答***性,同时,通过分布式搜索方式进行模板问题的搜索可有效提高搜索效率,并且使得搜索操作简单、方便、快捷。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
上面主要描述了一种基于分布式搜索的服务咨询方法,下面将对一种基于分布式搜索的服务咨询装置进行详细描述。
请参阅图3,本发明实施例二提供了一种基于分布式搜索的服务咨询装置,包括:
咨询问题获取模块210,用于获取咨询问题;
分词模块220,用于对所述咨询问题进行分词,以得到各个词语;
权重查询模块230,用于查询所述词语预设的权重;
问题关键词确定模块240,用于将预设有权重的所述词语确定为问题关键词;
模板问题搜索模块250,用于利用分布式搜索方式搜索与所述问题关键词相关的模板问题;
匹配度计算模块260,用于计算所述模板问题与所述问题关键词的匹配度;
咨询答案确定模块270,用于将具有最高匹配度的所述模板问题的模板答案确定为所述咨询问题的咨询答案。
进一步地,所述咨询问题获取模块210具体包括:语音采集单元,用于采集咨询对象所输入的语音信息;格式转换单元,用于对所述语音信息进行语音识别,得到文本格式的咨询问题。
更进一步地,所述权重查询模块230具体包括:场景类别获取单元,用于获取所述语音信息所在地点的场景类别;预设权重查询单元,用于根据所述场景类别与所述词语权重的预设对应关系查询所述词语预设的权重。
优选地,所述模板问题搜索模块250具体包括:等级确定单元,用于根据所述权重的大小确定所述问题关键词的重要等级;搜索顺序确定单元,用于依照所述重要等级确定各个问题关键词的搜索顺序;搜索单元,用于按照各个问题关键词的搜索顺序依次搜索与各个问题关键词相关的模板问题。
进一步地,所述咨询答案确定模块270具体包括:阈值判断单元,用于判断所述最高匹配度是否大于预设匹配阈值;第一咨询答案确定单元,用于若所述最高匹配度大于所述预设匹配阈值,则将具有所述最高匹配度的所述模板问题的模板答案确定为所述咨询问题的咨询答案;第二咨询答案确定单元,用于若所述最高匹配度小于所述预设匹配阈值,则确定未搜索到所述咨询问题的咨询答案。
请参阅图4,本发明实施例三提供了一种基于分布式搜索的服务机器人,所述服务机器人300包括:处理器310、存储器320以及存储在所述存储器320中并可在所述处理器310上运行的计算机程序330,例如基于分布式搜索的服务咨询程序。所述处理器310执行所述计算机程序330时实现上述各个基于分布式搜索的服务咨询方法实施例中的步骤,例如图1所示的步骤S110至S170。或者,所述处理器310执行所述计算机程序330时实现上述各装置实施例中各模块/单元的功能,例如图3所示模块210至270的功能。
示例性的,所述计算机程序330可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器320中,并由所述处理器310执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序330在所述服务机器人300中的执行过程。例如,所述计算机程序330可以被分割成咨询问题获取模块、分词模块、权重查询模块、问题关键词确定模块、模板问题搜索模块、匹配度计算模块、咨询答案确定模块,各模块具体功能如下:
咨询问题获取模块,用于获取咨询问题。
分词模块,用于对所述咨询问题进行分词,以得到各个词语。
权重查询模块,用于查询所述词语预设的权重。
问题关键词确定模块,用于将预设有权重的所述词语确定为问题关键词。
模板问题搜索模块,用于利用分布式搜索方式搜索与所述问题关键词相关的模板问题。
匹配度计算模块,用于计算所述模板问题与所述问题关键词的匹配度。
咨询答案确定模块,用于将具有最高匹配度的所述模板问题确定为所述咨询问题的咨询答案。
所述服务机器人300可包括,但不仅限于,处理器310、存储器320。本领域技术人员可以理解,图3仅仅是服务机器人300的示例,并不构成对机器人300的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述服务机器人300还可以包括输入输出设备、网络接入设备、总线等。
所述处理器310可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器320可以是所述服务机器人300的内部存储单元,例如服务机器人300的硬盘或内存。所述存储器320也可以是所述服务机器人300的外部存储设备,例如所述服务机器人300上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器320还可以既包括所述服务机器人300的内部存储单元也包括外部存储设备。所述存储器320用于存储所述计算机程序以及所述服务机器人所需的其他程序和数据。所述存储器320还可以用于暂时地存储已经输出或者将要输出的数据。
请参阅图5,本发明实施例四提供了一种基于分布式搜索的服务咨询***,所述服务咨询***包括服务机器人300、搜索微服务器410、问题检索服务器420和数据库430。
具体地,所述服务机器人300,用于获取用户的咨询问题,并将获取的所述咨询问题发送给所述搜索微服务器410,在所述搜索微服务器410返回咨询答案后,将所述咨询答案反馈给所述用户;
所述搜索微服务器410,用于接收所述服务机器人300发送的所述咨询问题,对所述咨询问题进行分词处理,分词处理完获得各个词语后,在所述数据库430中根据场景类别查询所述词语预设的权重,并将查询到权重的所述词语确定为问题关键词发送至所述问题检索服务器420,在获得所述问题检索服务器420返回的模板问题与所述问题关键词的匹配度后,确定具有最高匹配度的所述模板问题的模板答案为所述咨询问题的咨询答案,并将所述咨询答案发送给所述服务机器人300;
所述问题检索服务器420,用于接收所述搜索微服务器410发送的所述问题关键词,并利用分布式搜索方式搜索与所述问题关键词相关的所述模板问题,在搜索到所述模板问题后,计算所述模板问题与所述问题关键词的匹配度,并将所述模板问题及对应的匹配度发送给所述搜索微服务器410。
进一步地,所述服务咨询***还包括负载均衡器440,所述负载均衡器440用于接收所述咨询问题,并将所述咨询问题发送至所述搜索微服务器410,待所述搜索微服务器410返回所述咨询答案后,将所述咨询答案发送给所述服务机器人300。
本实施例中,负载均衡器440优选为集群部署的nginx,搜索微服务器410和问题检索服务器420也均为集群部署的服务器。当服务机器人300的访问量增加时,搜索微服务器410可动态增加节点,以扩展数据访问能力,提高可用性。同样地,集群部署的问题检索服务器420可动态扩展,并可动态迁移、备份节点信息,使得单台问题检索服务器宕机时,不会影响其他问题检索服务器的正常使用,从而提高***可用性。另外,在数据库430中,针对不同的服务场景创建有不同的索引文件,服务机器人300可根据场景类别的不同选择不同的索引文件进行搜索,并可以根据场景类别的转换,切换索引文件。
本实施例中,服务咨询***的具体工作过程为:服务机器人300接收到用户的咨询问题后,将所述咨询问题发送给nginx,nginx则将所述咨询问题发送给多个搜索微服务器410,搜索微服务器410进而对所述咨询问题进行分词处理,并在分词处理得到各个词语后,根据所述咨询问题所在地点的场景类别,选择对应的索引文件在数据库430中查询各个词语的预设权重,查询完毕后,将预设有权重的词语确定为所述咨询问题的问题关键词,并将所述问题关键词发送给问题检索服务器420,问题检索服务器420则可利用ElasticSearch集群进行分布式搜索,以搜索与所述问题关键词相关的模板问题,并对搜索到的每一个模板问题进行匹配度的评分,然后将评分后的模板问题及对应的匹配度发送给搜索微服务器410,搜索微服务器410则根据匹配度来确定最终的咨询答案。具体地,搜索微服务器410判断最高匹配度是否超过预设匹配阈值,如果超过的话,则将具有最高匹配度的模板问题所对应的模板答案确定为所述咨询问题的咨询答案,并发送给负载均衡器440,负载均衡器440随之将所述咨询答案反馈给服务机器人300,由服务机器人300向用户作出回答;如果最高匹配度未超过所述预设匹配阈值的话,则搜索微服务器410反馈至服务机器人300的回复信息为空,服务机器人300则对用户做出无相应咨询答案的回复。
本实施例中的服务咨询***,针对常用的咨询问答,可以通过搜索引擎服务器直接对问题进行搜索,并返回答案信息,构建简单、容易实现,并且检索高效快速,同时针对不同的场景创建有不同的索引文件,可根据场景转换动态切换索引。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各实施例的模块、单元和/或方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于分布式搜索的服务咨询方法,其特征在于,包括:
获取咨询问题;
对所述咨询问题进行分词处理,以得到各个词语;
查询所述词语预设的权重;
将预设有权重的所述词语确定为问题关键词;
利用分布式搜索方式搜索与所述问题关键词相关的模板问题;
计算所述模板问题与所述问题关键词的匹配度;
将具有最高匹配度的所述模板问题的模板答案确定为所述咨询问题的咨询答案。
2.根据权利要求1所述的服务咨询方法,其特征在于,所述获取咨询问题,包括:
采集咨询对象所输入的语音信息;
对所述语音信息进行语音识别,得到文本格式的咨询问题。
3.根据权利要求2所述的服务咨询方法,其特征在于,所述查询词语预设的权重,包括:
获取所述语音信息所在地点的场景类别;
根据所述场景类别与所述词语权重的预设对应关系查询所述词语预设的权重。
4.根据权利要求1所述的服务咨询方法,其特征在于,所述利用分布式搜索方式搜索与所述问题关键词相关的模板问题,包括:
根据所述权重的大小确定所述问题关键词的重要等级;
依照所述重要等级确定各个问题关键词的搜索顺序;
按照各个问题关键词的搜索顺序依次搜索与各个问题关键词相关的模板问题。
5.根据权利要求1至4中任一所述的服务咨询方法,其特征在于,所述将具有最高匹配度的所述模板问题的模板答案确定为所述咨询问题的咨询答案,包括:
判断所述最高匹配度是否大于预设匹配阈值;
若所述最高匹配度大于所述预设匹配阈值,则将具有所述最高匹配度的所述模板问题的模板答案确定为所述咨询问题的咨询答案;
若所述最高匹配度小于所述预设匹配阈值,则确定未搜索到所述咨询问题的咨询答案。
6.一种基于分布式搜索的服务咨询装置,其特征在于,包括:
咨询问题获取模块,用于获取咨询问题;
分词模块,用于对所述咨询问题进行分词,以得到各个词语;
权重查询模块,用于查询所述词语预设的权重;
问题关键词确定模块,用于将预设有权重的所述词语确定为问题关键词;
模板问题搜索模块,用于利用分布式搜索方式搜索与所述问题关键词相关的模板问题;
匹配度计算模块,用于计算所述模板问题与所述问题关键词的匹配度;
咨询答案确定模块,用于将具有最高匹配度的所述模板问题的模板答案确定为所述咨询问题的咨询答案。
7.一种基于分布式搜索的服务机器人,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述服务咨询方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述服务咨询方法的步骤。
9.一种基于分布式搜索的服务咨询***,其特征在于,包括服务机器人、搜索微服务器、问题检索服务器和数据库;
所述服务机器人,用于获取用户的咨询问题,并将获取的所述咨询问题发送给所述搜索微服务器,在所述搜索微服务器返回咨询答案后,将所述咨询答案反馈给所述用户;
所述搜索微服务器,用于接收所述服务机器人发送的所述咨询问题,对所述咨询问题进行分词处理,分词处理完获得各个词语后,在所述数据库中根据场景类别查询所述词语预设的权重,并将查询到权重的所述词语确定为问题关键词发送至所述问题检索服务器,在获得所述问题检索服务器返回的模板问题与所述问题关键词的匹配度后,确定具有最高匹配度的所述模板问题的模板答案为所述咨询问题的咨询答案,并将所述咨询答案发送给所述服务机器人;
所述问题检索服务器,用于接收所述搜索微服务器发送的所述问题关键词,并利用分布式搜索方式搜索与所述问题关键词相关的所述模板问题,在搜索到所述模板问题后,计算所述模板问题与所述问题关键词的匹配度,并将所述模板问题及对应的匹配度发送给所述搜索微服务器。
10.根据权利要求9所述的服务咨询***,其特征在于,还包括负载均衡器;
所述负载均衡器用于接收所述咨询问题,并将所述咨询问题发送至所述搜索微服务器,待所述搜索微服务器返回所述咨询答案后,将所述咨询答案发送给所述服务机器人。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711469814.XA CN110110049A (zh) | 2017-12-29 | 2017-12-29 | 服务咨询方法、装置、***、服务机器人及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711469814.XA CN110110049A (zh) | 2017-12-29 | 2017-12-29 | 服务咨询方法、装置、***、服务机器人及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110110049A true CN110110049A (zh) | 2019-08-09 |
Family
ID=67482988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711469814.XA Pending CN110110049A (zh) | 2017-12-29 | 2017-12-29 | 服务咨询方法、装置、***、服务机器人及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110110049A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110597624A (zh) * | 2019-08-13 | 2019-12-20 | 深圳壹账通智能科技有限公司 | 通信建立方法和*** |
CN111104506A (zh) * | 2019-12-30 | 2020-05-05 | 深圳追一科技有限公司 | 人机交互的答复结果确定方法、装置及电子设备 |
CN111191018A (zh) * | 2019-12-30 | 2020-05-22 | 华为技术有限公司 | 对话***的应答方法和装置、电子设备、智能设备 |
CN111274490A (zh) * | 2020-03-26 | 2020-06-12 | 北京百度网讯科技有限公司 | 咨询信息的处理方法和装置 |
CN111300443A (zh) * | 2020-02-29 | 2020-06-19 | 重庆百事得大牛机器人有限公司 | 基于法律咨询机器人的情绪安抚方法 |
CN111797205A (zh) * | 2020-06-30 | 2020-10-20 | 百度在线网络技术(北京)有限公司 | 一种词表检索方法、装置、电子设备及存储介质 |
CN113010654A (zh) * | 2021-03-17 | 2021-06-22 | 北京十一贝科技有限公司 | 应用于保险行业的问题回复方法、装置、电子设备和介质 |
CN115016946A (zh) * | 2022-08-03 | 2022-09-06 | 深圳市星卡软件技术开发有限公司 | 用户咨询处理方法和*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090083039A1 (en) * | 2007-09-21 | 2009-03-26 | Hon Hai Precision Industry Co., Ltd. | Robot apparatus with vocal interactive function and method therefor |
CN106021463A (zh) * | 2016-05-17 | 2016-10-12 | 北京百度网讯科技有限公司 | 基于人工智能提供智能服务的方法、智能服务***及智能终端 |
CN106356056A (zh) * | 2016-10-28 | 2017-01-25 | 腾讯科技(深圳)有限公司 | 语音识别方法和装置 |
CN106649868A (zh) * | 2016-12-30 | 2017-05-10 | 首都师范大学 | 问答匹配方法及装置 |
-
2017
- 2017-12-29 CN CN201711469814.XA patent/CN110110049A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090083039A1 (en) * | 2007-09-21 | 2009-03-26 | Hon Hai Precision Industry Co., Ltd. | Robot apparatus with vocal interactive function and method therefor |
CN106021463A (zh) * | 2016-05-17 | 2016-10-12 | 北京百度网讯科技有限公司 | 基于人工智能提供智能服务的方法、智能服务***及智能终端 |
CN106356056A (zh) * | 2016-10-28 | 2017-01-25 | 腾讯科技(深圳)有限公司 | 语音识别方法和装置 |
CN106649868A (zh) * | 2016-12-30 | 2017-05-10 | 首都师范大学 | 问答匹配方法及装置 |
Non-Patent Citations (1)
Title |
---|
俞传正 等: "《图书馆实用信息技术》", 30 April 2014, 海洋出版社 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110597624A (zh) * | 2019-08-13 | 2019-12-20 | 深圳壹账通智能科技有限公司 | 通信建立方法和*** |
CN111104506A (zh) * | 2019-12-30 | 2020-05-05 | 深圳追一科技有限公司 | 人机交互的答复结果确定方法、装置及电子设备 |
CN111191018A (zh) * | 2019-12-30 | 2020-05-22 | 华为技术有限公司 | 对话***的应答方法和装置、电子设备、智能设备 |
CN111104506B (zh) * | 2019-12-30 | 2024-02-20 | 深圳追一科技有限公司 | 人机交互的答复结果确定方法、装置及电子设备 |
CN111191018B (zh) * | 2019-12-30 | 2023-10-20 | 华为技术有限公司 | 对话***的应答方法和装置、电子设备、智能设备 |
CN111300443B (zh) * | 2020-02-29 | 2020-11-13 | 重庆百事得大牛机器人有限公司 | 基于法律咨询机器人的情绪安抚方法 |
CN111300443A (zh) * | 2020-02-29 | 2020-06-19 | 重庆百事得大牛机器人有限公司 | 基于法律咨询机器人的情绪安抚方法 |
CN111274490B (zh) * | 2020-03-26 | 2024-01-19 | 北京百度网讯科技有限公司 | 咨询信息的处理方法和装置 |
CN111274490A (zh) * | 2020-03-26 | 2020-06-12 | 北京百度网讯科技有限公司 | 咨询信息的处理方法和装置 |
CN111797205A (zh) * | 2020-06-30 | 2020-10-20 | 百度在线网络技术(北京)有限公司 | 一种词表检索方法、装置、电子设备及存储介质 |
CN111797205B (zh) * | 2020-06-30 | 2024-03-12 | 百度在线网络技术(北京)有限公司 | 一种词表检索方法、装置、电子设备及存储介质 |
CN113010654A (zh) * | 2021-03-17 | 2021-06-22 | 北京十一贝科技有限公司 | 应用于保险行业的问题回复方法、装置、电子设备和介质 |
CN115016946A (zh) * | 2022-08-03 | 2022-09-06 | 深圳市星卡软件技术开发有限公司 | 用户咨询处理方法和*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110110049A (zh) | 服务咨询方法、装置、***、服务机器人及存储介质 | |
US11645517B2 (en) | Information processing method and terminal, and computer storage medium | |
CN110335595A (zh) | 基于语音识别的插问对话方法、装置及存储介质 | |
CN110941698B (zh) | 一种基于bert下卷积神经网络的服务发现方法 | |
CN109033277A (zh) | 基于机器学习的类脑***、方法、设备及存储介质 | |
CN107436916B (zh) | 智能提示答案的方法及装置 | |
CN114090755B (zh) | 基于知识图谱的回复语句确定方法、装置及电子设备 | |
WO2020151170A1 (zh) | 一种岗位画像设置方法、岗位画像设置装置及终端设备 | |
CN107958059B (zh) | 智能问答方法、装置、终端和计算机可读存储介质 | |
CA2823835A1 (en) | Voice search and response based on relevancy | |
CN112035599A (zh) | 基于垂直搜索的查询方法、装置、计算机设备及存储介质 | |
CN111309916B (zh) | 摘要抽取方法和装置、存储介质和电子装置 | |
CN109885651B (zh) | 一种问题推送方法和装置 | |
CN109508367A (zh) | 自动提取问答语料的方法、在线智能客服***及电子设备 | |
CA3153056A1 (en) | Intelligently questioning and answering method, device, computer, equipment and storage medium | |
CN116882372A (zh) | 文本生成方法、装置、电子设备以及存储介质 | |
CN112632248A (zh) | 问答方法、装置、计算机设备和存储介质 | |
TW202123026A (zh) | 資料歸檔方法、裝置、電腦裝置及存儲介質 | |
CN111831286B (zh) | 一种用户投诉处理方法和设备 | |
CN116910201A (zh) | 一种对话数据生成方法及其相关设备 | |
CN116956068A (zh) | 基于规则引擎的意图识别方法、装置、电子设备及介质 | |
CN116521832A (zh) | 对话交互方法、装置及***、电子设备和存储介质 | |
CN115630147A (zh) | 应答方法、装置、电子设备及存储介质 | |
US12039447B2 (en) | Information processing method and terminal, and computer storage medium | |
CN110222930A (zh) | 客服辅助方法、设备及客服***和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190809 |