CN105760399A - 一种数据检索方法及设备 - Google Patents
一种数据检索方法及设备 Download PDFInfo
- Publication number
- CN105760399A CN105760399A CN201410799739.3A CN201410799739A CN105760399A CN 105760399 A CN105760399 A CN 105760399A CN 201410799739 A CN201410799739 A CN 201410799739A CN 105760399 A CN105760399 A CN 105760399A
- Authority
- CN
- China
- Prior art keywords
- text
- participle
- call center
- retrieval
- center server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种数据检索方法及设备,涉及通信技术领域,用以提高检索结果的准确性,并提高检索效率。具体方案为:呼叫中心服务器接收用户终端发送的语音信息,并获取对语音信息进行文本转换得到的文本信息;获取对文本信息进行文本分析识别出的第一分词集合,第一分词集合中包含至少一个文本分词;从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,关键字索引列表中包含至少一个关键字索引项,关键字索引项中包含检索关键字和与检索关键字对应的检索数据的标识;从知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。本发明用于数据检索过程中。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种数据检索方法及设备。
背景技术
随着信息化高速发展,各个行业或者领域的信息储备量也越来越多。例如,为用户提供通信服务的运营商为了能够向用户提供较为全面、快速、准确的业务咨询和资费查询等服务,构建了该电信运营商的客服人员能够进行数据检索的知识数据库。
其中,客服人员在通过呼叫中心服务器接通与用户的语音通信后,则可以根据个人的业务经验和技能从用户语音信息中识别出检索关键字;然后将检索关键字输入知识数据库,由知识数据库匹配出与检索关键字匹配的信息作为检索数据,并向客服人员展示检索数据;客服人员还需要根据个人的业务经验和技能从知识数据库展示的检索数据中提取与用户语音信息关联度较高的检索数据,并根据提取出的检索数据为用户做出答复,或者将提取出的检索数据反馈给用户。
但是,上述数据检索过程中客服人员从知识数据库中检索时,若要快速的检索到与用户语音信息之间的匹配度和关联度较高的检索数据,则需要客服人员具备丰富的个人的业务经验和较高的个人的业务技能,检索结果的准确性过分依赖于客服人员的个人的业务经验和技能;并且,客服人员在检索过程中不可避免的会由于疏忽或者大意出现一些检索错误,则会影响检索的准确性和检索效率,导致检索结果的准确性和检索效率较低。
发明内容
本发明的实施例提供一种数据检索方法及设备,用以提高检索结果的准确性,并提高检索效率。
为达到上述目的,本发明的实施例采用如下技术方案:
本发明实施例的第一方面,提供一种数据检索方法,包括:
呼叫中心服务器接收用户终端发送的语音信息,并获取对所述语音信息进行文本转换得到的文本信息;
所述呼叫中心服务器获取对所述文本信息进行文本分析识别出的第一分词集合,所述第一分词集合中包含至少一个文本分词;
所述呼叫中心服务器从知识数据库中存储的检索数据的关键字索引列表中,查找与所述第一分词集合中的文本分词匹配的检索关键字,所述关键字索引列表中包含至少一个关键字索引项,所述关键字索引项中包含检索关键字和与所述检索关键字对应的检索数据的标识,所述知识数据库中存储有至少一个检索数据和所述检索数据的标识;
所述呼叫中心服务器从所述知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
结合第一方面,在第一种可能的实现方式中,在所述呼叫中心服务器从知识数据库中存储的检索数据的关键字索引列表中的关键字索引项中,查找与所述第一分词集合中的文本分词匹配的检索关键字之前,所述方法还包括:
所述呼叫中心服务器读取所述知识数据库中存储的第一检索数据,所述第一检索数据为所述知识数据库中存储的任意一个检索数据;
所述呼叫中心服务器获取对所述第一检索数据进行文本分析识别出的第二分词集合,所述第二分词集合中包含至少一个文本分词;
所述呼叫中心服务器根据所述第二分词集合中的文本分词,生成所述第一检索数据的检索关键字;
所述呼叫中心服务器根据所述第一检索数据的检索关键字和所述第一检索数据的标识生成一个所述关键字索引项,生成包含至少一个所述关键字索引项的所述关键字索引列表。
结合第一方面,在第二种可能的实现方式中,在所述呼叫中心服务器从所述知识数据库中存储的检索数据的关键字索引列表中的关键字索引项中,查找与所述第一分词集合中的文本分词匹配的检索关键字之前,所述方法还包括:
接收文本分析服务器发送的所述关键字索引列表。
结合第一方面、第一种可能的实现方式和第二种可能的实现方式中的任意一项,在第三种可能的实现方式中,所述呼叫中心服务器获取对所述文本信息进行文本分析识别出的第一分词集合,包括:
所述呼叫中心服务器对所述文本信息进行文本分析,识别出第三分词集合,所述第三分词集合中包含至少一个文本分词;
所述呼叫中心服务器过滤所述第三分词集合中包含的无意义文本分词,得到所述第一分词集合,所述无意义文本分词包括:惊叹词和语气词。
结合第一方面、第一种可能的实现方式和第二种可能的实现方式中的任意一项,在第四种可能的实现方式中,所述呼叫中心服务器获取对所述文本信息进行文本分析识别出的第一分词集合,包括:
所述呼叫中心服务器对所述文本信息进行文本分析,识别出第三分词集合,所述第三分词集合中包含至少一个文本分词;
所述呼叫中心服务器过滤所述第三分词集合中包含的第一文本分词,得到所述第一分词集合,所述第一文本分词为所述第三分词集合中与所述关键字索引列表中的任意一个检索关键字均不匹配的文本分词。
结合第一方面或第二种可能的实现方式,在第五种可能的实现方式中,所述语音信息由以句子为维度的至少一个语音片段构成,所述文本信息由至少一个文本片段构成;
所述呼叫中心服务器接收用户终端发送的语音信息,并获取对所述语音信息进行文本转换得到的文本信息,包括:
所述呼叫中心服务器接收所述用户终端发送的所述语音片段;
所述呼叫中心服务器在接收到一个所述语音片段后,向语音分析服务器发送所述语音片段,以使得所述语音分析服务器将所述语音片段转换为所述文本片段;
所述呼叫中心服务器接收所述语音分析服务器发送的所述文本片段。
结合第一方面或第二种可能的实现方式,在第六种可能的实现方式中,所述呼叫中心服务器获取对所述文本信息进行文本分析识别出的第一分词集合,包括:
所述呼叫中心服务器向所述文本分析服务器发送所述文本信息,以使得所述文本分析服务器对所述文本信息进行文本分析,识别出所述第一分词集合;
所述呼叫中心服务器接收所述文本分析服务器发送的所述第一分词集合。
本发明实施例的第二方面,提供一种数据检索方法,包括:
文本分析服务器接收呼叫中心服务器发送的文本信息,所述文本信息为所述呼叫中心服务器根据语音信息转换得到的;
所述文本分析服务器对所述文本信息进行文本分析,识别出所述第一分词集合,所述第一分词集合中包含至少一个文本分词;
所述文本分析服务器向所述呼叫中心服务器发送所述第一分词集合,以使得所述呼叫中心服务器根据所述第一分词集合中的文本分词从知识数据库中检索数据。
结合第二方面,在第一种可能的实现方式中,所述知识数据库中存储有至少一个检索数据和所述检索数据的标识;
所述方法还包括:
所述文本分析服务器读取所述知识数据库中存储的第一检索数据,所述第一检索数据为所述知识数据库中存储的任意一个检索数据;
所述文本分析服务器对所述第一检索数据进行文本分析,识别出第二分词集合,所述第二分词集合中包含至少一个文本分词;
所述文本分析服务器根据所述第二分词集合中的文本分词,生成所述第一检索数据的检索关键字;
所述文本分析服务器根据所述第一检索数据的检索关键字和所述第一检索数据的标识生成一个所述关键字索引项,生成包含至少一个所述关键字索引项的所述关键字索引列表;
所述文本分析服务器向所述呼叫中心服务器发送所述关键字索引列表。
本发明实施例的第三方面,提供一种呼叫中心服务器,包括:
接收单元,用于接收用户终端发送的语音信息;
文本转换单元,用于获取对所述接收单元接收的所述语音信息进行文本转换得到的文本信息;
文本分析单元,用于获取对所述文本转换单元获得的所述文本信息进行文本分析识别出的第一分词集合,所述第一分词集合中包含至少一个文本分词;
关键字查找单元,用于从知识数据库中存储的检索数据的关键字索引列表中,查找与所述文本分析单元获得的所述第一分词集合中的文本分词匹配的检索关键字,所述关键字索引列表中包含至少一个关键字索引项,所述关键字索引项中包含检索关键字和与所述检索关键字对应的检索数据的标识,所述知识数据库中存储有至少一个检索数据和所述检索数据的标识;
检索单元,用于从所述知识数据库中,检索所述关键字查找单元查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
结合第三方面,在第一种可能的实现方式中,所述呼叫中心服务器,还可以包括:
读取单元,用于在所述关键字查找单元从所述知识数据库中存储的检索数据的关键字索引列表中的关键字索引项中,查找与所述第一分词集合中的文本分词匹配的检索关键字之前,读取所述知识数据库中存储的第一检索数据,所述第一检索数据为所述知识数据库中存储的任意一个检索数据;
所述文本分析单元,还用于获取对所述读取单元读取的所述第一检索数据进行文本分析识别出的第二分词集合,所述第二分词集合中包含至少一个文本分词;
生成单元,用于根据所述文本分析单元获得的所述第二分词集合中的文本分词,生成所述第一检索数据的检索关键字;根据所述第一检索数据的检索关键字和所述第一检索数据的标识生成一个所述关键字索引项。
结合第三方面,在第二种可能的实现方式中,所述接收单元,还用于在所述关键字查找单元从所述知识数据库中存储的检索数据的关键字索引列表中的关键字索引项中,查找与所述第一分词集合中的文本分词匹配的检索关键字之前,接收文本分析服务器发送的所述关键字索引列表。
结合第三方面、第一种可能的实现方式和第二种可能的实现方式中的任意一项,在第三种可能的实现方式中,所述文本分析单元,包括:
文本分析模块,用于对所述文本信息进行文本分析,识别出第三分词集合,所述第三分词集合中包含至少一个文本分词;
第一过滤模块,用于过滤所述文本分析模块识别出的所述第三分词集合中包含的无意义文本分词,得到所述第一分词集合,所述无意义文本分词包括:惊叹词和语气词。
结合第三方面、第一种可能的实现方式和第二种可能的实现方式中的任意一项,在第四种可能的实现方式中,所述文本分析单元,包括:
文本分析模块,用于对所述文本信息进行文本分析,识别出第三分词集合,所述第三分词集合中包含至少一个文本分词;
第二过滤模块,用于过滤所述文本分析模块识别出的所述第三分词集合中包含的第一文本分词,得到所述第一分词集合,所述第一文本分词为所述第三分词集合中与所述关键字索引列表中的任意一个检索关键字均不匹配的文本分词。
结合第三方面或第二种可能的实现方式,在第五种可能的实现方式中,所述语音信息由以句子为维度的至少一个语音片段构成,所述文本信息由至少一个文本片段构成;
所述接收单元,具体用于接收所述用户终端发送的所述语音片段;
所述文本转换单元,具体用于在所述接收单元接收到一个所述语音片段后,向语音分析服务器发送所述语音片段,以使得所述语音分析服务器将所述语音片段转换为所述文本片段;接收所述语音分析服务器发送的所述文本片段。
结合第三方面或第二种可能的实现方式,在第六种可能的实现方式中,所述文本分析单元,具体用于向所述文本分析服务器发送所述文本信息,以使得所述文本分析服务器对所述文本信息进行文本分析,识别出所述第一分词集合;接收所述文本分析服务器发送的所述第一分词集合。
本发明实施例的第四方面,提供一种文本分析服务器,包括:
接收单元,用于接收呼叫中心服务器发送的文本信息,所述文本信息为所述呼叫中心服务器根据语音信息转换得到的;
文本分析单元,用于对所述接收单元接收的所述文本信息进行文本分析,识别出所述第一分词集合,所述第一分词集合中包含至少一个文本分词;
发送单元,用于向所述呼叫中心服务器发送所述文本分析单元分析得到的所述第一分词集合,以使得所述呼叫中心服务器根据所述第一分词集合中的文本分词从知识数据库中检索数据。
结合第四方面,在第一种可能的实现方式中,所述知识数据库中存储有至少一个检索数据和所述检索数据的标识;
所述文本分析服务器,还包括:
读取单元,用于读取所述知识数据库中存储的第一检索数据,所述第一检索数据为所述知识数据库中存储的任意一个检索数据;
所述文本分析单元,还用于对所述读取单元读取的所述第一检索数据进行文本分析,识别出第二分词集合,所述第二分词集合中包含至少一个文本分词;
生成单元,用于根据所述文本分析单元分析得到的所述第二分词集合中的文本分词,生成所述第一检索数据的检索关键字;根据所述第一检索数据的检索关键字和所述第一检索数据的标识生成一个所述关键字索引项,生成包含至少一个所述关键字索引项的所述关键字索引列表;
所述发送单元,还用于向所述呼叫中心服务器发送所述生成单元生成的所述关键字索引列表。
本发明实施例提供的数据检索方法及设备,呼叫中心服务器接收用户终端发送的语音信息,并获取对语音信息进行文本转换得到的文本信息;呼叫中心服务器获取对文本信息进行文本分析识别出的第一分词集合,第一分词集合中包含至少一个文本分词;呼叫中心服务器从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,关键字索引列表中包含至少一个关键字索引项,关键字索引项中包含检索关键字和与检索关键字对应的检索数据的标识,知识数据库中存储有至少一个检索数据和所述检索数据的标识;呼叫中心服务器从所述知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
与现有技术中从知识数据库检索数据时,过分依赖于客服人员的个人的业务经验和技能,检索结果的准确性和检索效率较低相比,通过本方案,呼叫中心服务器在接收到用户终端发送的语音信息后,可以通过对语音信息进行文本分析得到分析结果(第一分词集合),然后从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,不需要客服人员根据其个人的业务经验和技能从用户语音信息中识别出检索关键字,并且呼叫中心服务器自动进行检索关键字的识别相较于客服人员根据其个人的业务经验和技能进行检索关键字的识别,可以提高检索关键字的识别效率,并避免由于客服人员由于疏忽或者大意出现的检索错误,提高识别检索关键字的准确性,在高效、准确地获取到检索关键字后,则可以快速、准确地获取到检索结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种数据检索方法流程图;
图2为本发明实施例二提供的一种数据检索方法流程图;
图3为本发明实施例三提供的一种数据检索方法流程图;
图4为本发明实施例四提供的一种数据检索方法流程图;
图5为本发明实施例五提供的一种呼叫中心服务器的结构组成示意图;
图6为本发明实施例五提供的另一种呼叫中心服务器的结构组成示意图;
图7为本发明实施例五提供的另一种呼叫中心服务器的结构组成示意图;
图8为本发明实施例五提供的另一种呼叫中心服务器的结构组成示意图;
图9为本发明实施例六提供的一种文本分析服务器的结构组成示意图;
图10为本发明实施例六提供的另一种文本分析服务器的结构组成示意图;
图11为本发明实施例七提供的一种呼叫中心服务器的结构组成示意图;
图12为本发明实施例七提供的另一种呼叫中心服务器的结构组成示意图;
图13为本发明实施例七提供的另一种呼叫中心服务器的结构组成示意图;
图14为本发明实施例八提供的一种文本分析服务器的结构组成示意图;
图15为本发明实施例八提供的一种数据检索***的结构组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本文中描述的各种技术可用于各种无线通信***,例如当前2G,3G通信***和下一代通信***,例如全球移动通信***(GSM,GlobalSystemforMobilecommunications),码分多址(CDMA,CodeDivisionMultipleAccess)***,时分多址(TDMA,TimeDivisionMultipleAccess)***,宽带码分多址(WCDMA,WidebandCodeDivisionMultipleAccessWireless),频分多址(FDMA,FrequencyDivisionMultipleAddressing)***,正交频分多址(OFDMA,OrthogonalFrequency-DivisionMultipleAccess)***,单载波FDMA(SC-FDMA)***,通用分组无线业务(GPRS,GeneralPacketRadioService)***,长期演进(LTE,LongTermEvolution)***,以及其他此类通信***。
本文中结合终端和/或基站和/或基站控制器来描述各种方面。
用户终端,可以是无线终端也可以是有线终端,无线终端可以是指向用户提供语音和/或数据连通性的设备,具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备。无线终端可以经无线接入网(例如,RAN,RadioAccessNetwork)与一个或多个核心网进行通信,无线终端可以是移动终端,如移动电话(或称为“蜂窝”电话)和具有移动终端的计算机,例如,可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们与无线接入网交换语言和/或数据。例如,个人通信业务(PCS,PersonalCommunicationService)电话、无绳电话、会话发起协议(SIP)话机、无线本地环路(WLL,WirelessLocalLoop)站、个人数字助理(PDA,PersonalDigitalAssistant)等设备。无线终端也可以称为***、订户单元(SubscriberUnit)、订户站(SubscriberStation),移动站(MobileStation)、移动台(Mobile)、远程站(RemoteStation)、接入点(AccessPoint)、远程终端(RemoteTerminal)、接入终端(AccessTerminal)、用户终端(UserTerminal)、用户代理(UserAgent)、用户设备(UserDevice)、或用户装备(UserEquipment)。
另外,本文中术语“***”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本发明实施例的方法应用于呼叫中心***中,呼叫中心***是充分利用现代通讯与计算机技术,如互动式语音应答(英文:InteractiveVoiceResponse,简称:IVR)、自动呼叫分配(英文:AutomaticCallDistributor,简称:ACD)等技术,可以自动灵活地处理大量各种不同的电话呼入和呼出业务和服务的运营操作***。
其中,现有的呼叫中心***主要由呼叫中心服务器和知识数据库构成。以通信运营商(为用户提供通信服务的运营商)的呼叫中心***处理用户查询呼叫为例,客服人员在通过呼叫中心***中的呼叫中心服务器接通与用户的语音通信后,则可以根据个人的业务经验和技能从用户语音信息中识别出检索关键字;然后将检索关键字输入知识数据库,由知识数据库匹配出与检索关键字匹配的信息作为检索数据,并向客服人员展示检索数据;客服人员还需要根据个人的业务经验和技能从知识数据库展示的检索数据中提取与用户语音信息关联度较高的检索数据,并根据提取出的检索数据为用户做出答复,或者将提取出的检索数据反馈给用户。
与现有技术不同的是,本发明实施例中的呼叫中心***在处理用户查询呼叫时,则可以通过呼叫中心服务器实现对语音信息进行文本转换的文本转换和对文本信息进行文本分析代替客服人员在处理用户查询过程中进行的信息识别和分析工作,可以提高检索结果的准确性,并提高检索效率。现以下列具体实施例对本发明提供的数据检索方法以及实现该数据检索方法的设备进行说明:
实施例一
本发明实施例提供一种数据检索方法,如图1所示,包括:
S101、呼叫中心服务器接收用户终端发送的语音信息,并获取对语音信息进行文本转换得到的文本信息。
其中,用户可以通过用户终端向呼叫中心服务器发起语音通信请求,以建立用户终端与呼叫中心服务器之间的语音通信链路后,向呼叫中心服务器发送的语音信息。其中,用户终端发送的语音信息由以句子为维度的至少一个语音片段构成。
需要说明的是,本发明实施例中的呼叫中心服务器可以为能够为用户提供通信服务的运营商接收用户呼叫的呼叫中心管理服务器。
S102、呼叫中心服务器获取对文本信息进行文本分析识别出的第一分词集合,第一分词集合中包含至少一个文本分词。
其中,呼叫中心服务器获取对文本信息进行文本分析识别出的第一分词集合的方法具体可以包括:呼叫中心服务器对文本信息进行断句、分词,以获取至少一个文本分词。
示例性的,呼叫中心服务器可以对文本信息进行文本分析,识别出第三分词集合(第三分词集合中包含至少一个文本分词),然后过滤第三分词集合中包含的无意义文本分词,得到第一分词集合,无意义文本分词包括:惊叹词和语气词。
示例性的,呼叫中心服务器对文本信息进行文本分析,识别出第三分词集合(第三分词集合中包含至少一个文本分词),然后过滤第三分词集合中包含的第一文本分词,得到第一分词集合,第一文本分词为第三分词集合中与关键字索引列表中的任意一个检索关键字均不匹配的文本分词。
进一步的,在本发明实施例的一种应用场景中,呼叫中心服务器可以向文本分析服务器发送文本信息,由文本分析服务器对文本信息进行文本分析,识别出第一分词集合;然后接收文本分析服务器发送的第一分词集合。
S103、呼叫中心服务器从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字。
其中,关键字索引列表中包含至少一个关键字索引项,关键字索引项中包含检索关键字和与检索关键字对应的检索数据的标识,知识数据库中存储有至少一个检索数据和检索数据的标识。
在本发明实施例的一种应用场景中,关键字索引项可以为呼叫中心服务器对知识数据库中存储的每一个检索数据进行文本分析,得到的每一个检索数据的检索关键字和检索关键字对应的检索数据的标识构成。
其中,呼叫中心服务器对知识数据库中存储的每一个检索数据进行文本分析,得到每一个检索数据的检索关键字的具体方法可以包括:呼叫中心服务器读取所述知识数据库中存储的第一检索数据,所述第一检索数据为所述知识数据库中存储的任意一个检索数据;获取对所述第一检索数据进行文本分析识别出的第二分词集合,所述第二分词集合中包含至少一个文本分词;根据所述第二分词集合中的文本分词,生成所述第一检索数据的检索关键字。
进一步的,在本发明实施例的另一种应用场景中,呼叫中心服务器可以接收文本分析服务器发送的关键字索引列表。其中,文本分析服务器生成关键字索引列表的方法与呼叫中心服务器生成的关键字索引列表的方法类似,本实施例这里不再赘述。
S104、呼叫中心服务器从知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
其中,呼叫中心服务器在查找到与第一分词集合中的文本分词匹配的检索关键字后,则可以从知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
本发明实施例提供的数据检索方法,呼叫中心服务器接收用户终端发送的语音信息,并获取对语音信息进行文本转换得到的文本信息;呼叫中心服务器获取对文本信息进行文本分析识别出的第一分词集合,第一分词集合中包含至少一个文本分词;呼叫中心服务器从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,关键字索引列表中包含至少一个关键字索引项,关键字索引项中包含检索关键字和与检索关键字对应的检索数据的标识,知识数据库中存储有至少一个检索数据和所述检索数据的标识;呼叫中心服务器从所述知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
与现有技术中从知识数据库检索数据时,过分依赖于客服人员的个人的业务经验和技能,检索结果的准确性和检索效率较低相比,通过本方案,呼叫中心服务器在接收到用户终端发送的语音信息后,可以通过对语音信息进行文本分析得到分析结果(第一分词集合),然后从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,不需要客服人员根据其个人的业务经验和技能从用户语音信息中识别出检索关键字,并且呼叫中心服务器自动进行检索关键字的识别相较于客服人员根据其个人的业务经验和技能进行检索关键字的识别,可以提高检索关键字的识别效率,并避免由于客服人员由于疏忽或者大意出现的检索错误,提高识别检索关键字的准确性,在高效、准确地获取到检索关键字后,则可以快速、准确地获取到检索结果。
实施例二
本发明实施例提供一种数据检索方法,如图2所示,包括:
S201、文本分析服务器接收呼叫中心服务器发送的文本信息,文本信息为呼叫中心服务器根据语音信息转换得到的。
其中,文本信息由至少一个文本片段构成,语音信息由以句子为维度的至少一个语音片段构成。
呼叫中心服务器可以在与用户终端进行语音通信的过程中,在接收到用户终端发送的一个语音片段后,则向语音分析服务器发送语音片段,以使得语音分析服务器将语音片段转换为文本片段;呼叫中心服务器在接收语音分析服务器发送的文本片段后,则可以向文本分析服务器发送文本片段。
S202、文本分析服务器对文本信息进行文本分析,识别出第一分词集合,第一分词集合中包含至少一个文本分词。
其中,文本分析服务器对文本信息进行文本分析识别出的第一分词集合的方法具体可以包括:文本分析服务器对文本信息进行断句、分词,以识别出至少一个文本分词。
示例性的,文本分析服务器可以对文本信息进行文本分析,识别出第三分词集合(第三分词集合中包含至少一个文本分词),然后过滤第三分词集合中包含的无意义文本分词,得到第一分词集合,无意义文本分词包括:惊叹词和语气词。
示例性的,文本分析服务器可以对文本信息进行文本分析,识别出第三分词集合(第三分词集合中包含至少一个文本分词),然后过滤第三分词集合中包含的第一文本分词,得到第一分词集合,第一文本分词为第三分词集合中与关键字索引列表中的任意一个检索关键字均不匹配的文本分词。
S203、文本分析服务器向呼叫中心服务器发送第一分词集合,以使得呼叫中心服务器根据第一分词集合中的文本分词从知识数据库中检索数据。
进一步的,文本分析服务器可以对知识数据库中存储的每一个检索数据进行文本分析,得到每一个检索数据的检索关键字,然后生成包含第一检索数据的检索关键字和第一检索数据的标识的关键字索引项,并生成包含至少一个关键字索引项的关键字索引列表,然后向呼叫中心服务器发送关键字索引列表,以便于呼叫中心服务器可以从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,并从知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
可以理解的是,本实施例的方法还可以包括:文本分析服务器读取知识数据库中存储的第一检索数据,第一检索数据为知识数据库中存储的任意一个检索数据;文本分析服务器对所述第一检索数据进行文本分析,识别出第二分词集合,第二分词集合中包含至少一个文本分词;文本分析服务器根据第二分词集合中的文本分词,生成第一检索数据的检索关键字;文本分析服务器根据第一检索数据的检索关键字和第一检索数据的标识生成一个关键字索引项;文本服务器生成包含至少一个关键字索引项的关键字索引列表;文本分析服务器向呼叫中心服务器发送关键字索引列表。
本发明实施例提供的数据检索方法,文本分析服务器接收呼叫中心服务器发送的文本信息,所述文本信息为所述呼叫中心服务器根据语音信息转换得到的;所述文本分析服务器对所述文本信息进行文本分析,识别出所述第一分词集合,所述第一分词集合中包含至少一个文本分词;所述文本分析服务器向所述呼叫中心服务器发送所述第一分词集合,以使得所述呼叫中心服务器根据所述第一分词集合中的文本分词从知识数据库中检索数据。
与现有技术中从知识数据库检索数据时,过分依赖于客服人员的个人的业务经验和技能,检索结果的准确性和检索效率较低相比,通过本方案,文本分析服务器可以对呼叫中心服务器发送的文本信息进行文本分析得到分析结果(第一分词集合),并将第一分词集合发送至呼叫中心服务器,由呼叫中心服务器从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,不需要客服人员根据其个人的业务经验和技能从用户语音信息中识别出检索关键字,并且呼叫中心服务器自动进行检索关键字的识别相较于客服人员根据其个人的业务经验和技能进行检索关键字的识别,可以提高检索关键字的识别效率,并避免由于客服人员由于疏忽或者大意出现的检索错误,提高识别检索关键字的准确性,在高效、准确地获取到检索关键字后,则可以快速、准确地获取到检索结果。
实施例三
本发明实施例提供一种数据检索方法,应用于当呼叫中心服务器集成有能够实现对语音信息进行文本转换的文本转换模块和能够实现对文本转换模块对语音信息进行文本转换得到的文本信息进行文本分析的文本分析模块,即呼叫中心服务器可实现对语音信息进行文本转换,进而对进行文本转换得到的文本信息进行文本分析的功能的具体场景中。
在这种应用场景中,如图3所示,该数据检索方法,可以包括:
S301、呼叫中心服务器读取知识数据库中存储的第一检索数据,第一检索数据为知识数据库中存储的任意一个检索数据。
S302、呼叫中心服务器获取对第一检索数据进行文本分析,识别出的第二分词集合,第二分词集合中包含至少一个文本分词。
其中,呼叫中心服务器可以对知识数据库中存储的任意一个检索数据进行文本分析,识别出的一个第二分词集合,第二分词集合中包含至少一个文本分词。呼叫中心服务器对知识数据库中存储的检索数据进行文本分析的方法与呼叫中心服务器对文本信息进行文本分析的方法类似,呼叫中心服务器对知识数据库中存储的检索数据进行文本分析的方法可以参考本发明实施例中呼叫中心服务器对文本信息进行文本分析的具体方法,本发明实施例这里不再赘述。
S303、呼叫中心服务器根据第二分词集合中的文本分词,生成第一检索数据的检索关键字。
S304、呼叫中心服务器根据第一检索数据的检索关键字和第一检索数据的标识生成一个关键字索引项。
S305、呼叫中心服务器生成包含至少一个关键字索引项的关键字索引列表。
示例性的,本发明实施例以表1为例,给出了一个关键字索引列表的实例:
表1:
S306、呼叫中心服务器接收用户终端发送的语音信息,并获取对语音信息进行文本转换得到的文本信息。
其中,呼叫中心服务器可以对语音信息进行文本转换,以得到文本信息。呼叫中心服务器可以对语音信息进行文本转换得到文本信息的方法可以参考现有技术中实现语音转换文本的具体方法,本发明实施例这里不再赘述。
示例性的,呼叫中心服务器中可以安装具备语音转换文本功能的应用程序,以实现语音信息到文本信息的转换。
S307、呼叫中心服务器获取对文本信息进行文本分析识别出的第一分词集合,第一分词集合中包含至少一个文本分词。
其中,呼叫中心服务器获取对文本信息进行文本分析识别出的第一分词集合的方法具体可以包括:呼叫中心服务器对文本信息进行断句、分词,以获取至少一个文本分词。
示例性的,呼叫中心服务器在获取到对语音信息进行文本转换得到的文本信息:“麻烦帮我查一下套餐A的资费情况”后,则可以对文本信息:“麻烦帮我查一下套餐A的资费情况”进行断句、分词,则可以获取到由文本分词:“查”、“套餐A”和“资费情况”构成的第一分词集合。
进一步的,呼叫中心服务器在对文本信息进行文本分析得到文本分词后,还可以过滤掉分析得到的文本分词中的无意义文本分词,以提高数据检索效率。其中,本发明实施例中的无意义文本分词可以包括:惊叹词和语气词;无意义文本分词还可以包括问候语和礼貌用语等。
示例性的,假设呼叫中心服务器获取到的文本信息为“您好,请帮我查一下套餐A的资费情况,谢谢啦”后,则可以对文本信息:“您好,请帮我查一下套餐A的资费情况,谢谢啦”进行断句、分词,则可以获取到由文本分词:“您好”(问候语)、“请”(礼貌用语)、“查”、“套餐A”、“资费情况”、“谢谢”(礼貌用语)和“啦”(惊叹词/语气词)构成的第三分词集合;呼叫中心服务器可以过滤第三分词集合中的问候语:“您好”、礼貌用语:“请”和“谢谢”以及惊叹词/语气词:“啦”,得到由文本分词:“查”、“套餐A”和“资费情况”构成的第一分词集合。
进一步的,呼叫中心服务器还可以在获取到第三分词集合后,从关键字索引列表中查找与第三分词集合中的每一个文本分词匹配的检索关键字;若关键字索引列表中的任意一个检索关键字均与第三分词集合中的一个文本分词不匹配,呼叫中心服务器则可以过滤该文本分词。
本实施例的方法还可以包括:呼叫中心服务器对文本信息进行文本分析,识别出第三分词集合(第三分词集合中包含至少一个文本分词),然后过滤第三分词集合中包含的第一文本分词,得到第一分词集合,第一文本分词为第三分词集合中与关键字索引列表中的任意一个检索关键字均不匹配的文本分词。
基于上述实例,假设关键字索引列表中的任意一个检索关键字均与文本分词:“查”不匹配,呼叫中心服务器则可以过滤文本分词:“查”,得到由文本分词:“套餐A”和“资费情况”构成的第一分词集合。
需要说明的是,在本发明实施例中可以先执行S301-S305,再执行S306-S307;也可以先执行S306-S307,再执行S301-S305。本发明实施例对于S301-S305和S306-S307执行的先后顺序不做限制。
S308、呼叫中心服务器从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字。
S309、呼叫中心服务器从知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
其中,知识数据库中存储有至少一个检索数据和检索数据的标识。
示例性的,本发明实施例以表2为例,知识数据库可以采用列表的方式存储多个检索数据和每一个检索数据的标识:
表2:
本发明实施例提供的数据检索方法,呼叫中心服务器接收用户终端发送的语音信息,并获取对语音信息进行文本转换得到的文本信息;呼叫中心服务器获取对文本信息进行文本分析识别出的第一分词集合,第一分词集合中包含至少一个文本分词;呼叫中心服务器从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,关键字索引列表中包含至少一个关键字索引项,关键字索引项中包含检索关键字和与检索关键字对应的检索数据的标识,知识数据库中存储有至少一个检索数据和所述检索数据的标识;呼叫中心服务器从所述知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
与现有技术中从知识数据库检索数据时,过分依赖于客服人员的个人的业务经验和技能,检索结果的准确性和检索效率较低相比,通过本方案,呼叫中心服务器在接收到用户终端发送的语音信息后,可以通过对语音信息进行文本分析得到分析结果(第一分词集合),然后从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,不需要客服人员根据其个人的业务经验和技能从用户语音信息中识别出检索关键字,并且呼叫中心服务器自动进行检索关键字的识别相较于客服人员根据其个人的业务经验和技能进行检索关键字的识别,可以提高检索关键字的识别效率,并避免由于客服人员由于疏忽或者大意出现的检索错误,提高识别检索关键字的准确性,在高效、准确地获取到检索关键字后,则可以快速、准确地获取到检索结果。
实施例四
本发明实施例提供一种数据检索方法,应用于呼叫中心服务器不具备对语音信息进行文本转换和对文本信息进行文本分析的功能的具体场景中。
在这种应用场景中,如图4所示,该数据检索方法,可以包括:
S401、文本分析服务器读取知识数据库中存储的第一检索数据,第一检索数据为知识数据库中存储的任意一个检索数据。
示例性的,知识数据库可以采用列表的方式存储多个检索数据和每一个检索数据的标识,知识数据库的具体形式和内容可以参考本发明实施例表2中所示的知识数据库的列表形式实例。
S402、文本分析服务器对第一检索数据进行文本分析,识别出第二分词集合,第二分词集合中包含至少一个文本分词。
其中,第一检索数据为知识数据库中存储的任意一个检索数据。文本分析服务器可以对知识数据库中存储的任意一个检索数据进行文本分析,识别出的一个第二分词集合,第二分词集合中包含至少一个文本分词。文本分析服务器对知识数据库中存储的检索数据进行文本分析的方法与呼叫中心服务器对文本信息进行文本分析的方法类似,文本分析服务器对知识数据库中存储的检索数据进行文本分析的方法可以参考本发明实施例中呼叫中心服务器对文本信息进行文本分析的具体方法,本发明实施例这里不再赘述。
S403、文本分析服务器根据第二分词集合中的文本分词,生成第一检索数据的检索关键字。
S404、文本分析服务器根据第一检索数据的检索关键字和第一检索数据的标识生成一个关键字索引项。
S405、文本服务器生成包含至少一个关键字索引项的关键字索引列表,并向呼叫中心服务器发送至少一个关键字索引项构成的关键字索引列表。
关键字索引列表的具体形式和内容可以参考本发明实施例表1中所示的关键字索引列表。并且,文本服务器生成关键字索引列表的方法可以参考本发明实施例中对呼叫中心服务器生成关键字索引列表方法的具体描述,本发明实施例这里不再赘述。
S406、呼叫中心服务器接收用户终端发送的语音信息,并获取对语音信息进行文本转换得到的文本信息。
其中,语音信息由以句子为维度的至少一个语音片段构成。
如图4所示,S406具体可以包括:S406a-S406d:
S406a、呼叫中心服务器接收用户终端发送的语音片段。
S406b、呼叫中心服务器在接收到一个语音片段后,向语音分析服务器发送语音片段。
S406c、语音分析服务器将语音片段转换为文本片段。
其中,语音分析服务器将语音片段转换为文本片段的方法与呼叫中心服务器将语音片段转换为文本片段的方法类似,本发明实施例这里不再赘述。
S406d、呼叫中心服务器接收语音分析服务器发送的文本片段。
S407、呼叫中心服务器向文本分析服务器发送文本信息。
其中,文本信息由至少一个文本片段构成,呼叫中心服务器可以在接收到语音分析服务器发送的一个文本片段后,则向文本分析服务器发送该文本片段;当然,呼叫中心服务器也可以在接收到语音分析服务器发送的构成文本信息的所有文本片段后,则向文本分析服务器发送该文本信息。
S408、文本分析服务器对文本信息进行文本分析,识别出第一分词集合。
需要说明的是,文本分析服务器对文本信息进行文本分析,识别出第一分词集合的方法可以参考呼叫中心服务器对文本信息进行文本分析,识别出第一分词集合的具体方法,本发明实施例这里不再赘述。
S409、文本分析服务器向呼叫中心服务器发送第一分词集合。
需要说明的是,在本发明实施例中可以先执行S401-S405,再执行S406-S409;也可以先执行S406-S409,再执行S401-S405。本发明实施例对于S401-S405和S406-S409执行的先后顺序不做限制。
S410、呼叫中心服务器从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字。
S411、呼叫中心服务器从知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
本发明实施例提供的数据检索方法,呼叫中心服务器接收用户终端发送的语音信息后可以将语音信息发送至语音分析服务器,由语音分析服务器对语音信息进行文本转换得到的文本信息,并经由呼叫中心服务器将文本信息转发至文本分析服务器,由文本分析服务器对文本信息进行文本分析识别出的第一分词集合,第一分词集合中包含至少一个文本分词;呼叫中心服务器再从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,关键字索引列表中包含至少一个关键字索引项,所述关键字索引项中包含检索关键字和与所述检索关键字对应的检索数据的标识,所述知识数据库中存储有至少一个检索数据和所述检索数据的标识;呼叫中心服务器从知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
与现有技术中从知识数据库检索数据时,过分依赖于客服人员的个人的业务经验和技能,检索结果的准确性和检索效率较低相比,通过本方案,呼叫中心服务器在接收到用户终端发送的语音信息后,可以通过对语音信息进行文本分析得到分析结果(第一分词集合),然后从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,不需要客服人员根据其个人的业务经验和技能从用户语音信息中识别出检索关键字,并且呼叫中心服务器自动进行检索关键字的识别相较于客服人员根据其个人的业务经验和技能进行检索关键字的识别,可以提高检索关键字的识别效率,并避免由于客服人员由于疏忽或者大意出现的检索错误,提高识别检索关键字的准确性,在高效、准确地获取到检索关键字后,则可以快速、准确地获取到检索结果。
实施例五
本发明实施例提供一种呼叫中心服务器,用以执行图1所示的数据检索方法,如图5所示,该呼叫中心服务器包括:接收单元51、文本转换单元52、文本分析单元53、关键字查找单元54和检索单元55。
接收单元51,用于接收用户终端发送的语音信息。
文本转换单元52,用于获取对所述接收单元接收的所述语音信息进行文本转换得到的文本信息。
文本分析单元53,用于获取对所述文本转换单元52获得的所述文本信息进行文本分析识别出的第一分词集合,所述第一分词集合中包含至少一个文本分词。
关键字查找单元54,用于从知识数据库中存储的检索数据的关键字索引列表中,查找与所述文本分析单元53获得的所述第一分词集合中的文本分词匹配的检索关键字,所述关键字索引列表中包含至少一个关键字索引项,所述关键字索引项中包含检索关键字和与所述检索关键字对应的检索数据的标识,所述知识数据库中存储有至少一个检索数据和所述检索数据的标识。
检索单元55,用于从所述知识数据库中,检索所述关键字查找单元54查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
其中,所述接收单元51接收到的所述语音信息为:用户终端向呼叫中心服务器发起语音通信请求后,以建立用户终端与呼叫中心服务器之间的语音通信链路后,接收自用户终端的。其中,用户终端发送的语音信息由以句子为维度的至少一个语音片段构成。
其中,文本分析单元53可以对文本信息进行断句、分词,以获取至少一个文本分词。
进一步的,如图6所示,所述呼叫中心服务器,还可以包括:读取单元56和生成单元57。
读取单元56,用于在所述关键字查找单元54从所述知识数据库中存储的检索数据的关键字索引列表中的关键字索引项中,查找与所述第一分词集合中的文本分词匹配的检索关键字之前,读取所述知识数据库中存储的第一检索数据,所述第一检索数据为所述知识数据库中存储的任意一个检索数据。
所述文本分析单元53,还用于获取对所述读取单元56读取的所述第一检索数据进行文本分析识别出的第二分词集合,所述第二分词集合中包含至少一个文本分词。
生成单元57,用于根据所述文本分析单元53获得的所述第二分词集合中的文本分词,生成所述第一检索数据的检索关键字;根据所述第一检索数据的检索关键字和所述第一检索数据的标识生成一个所述关键字索引项,生成包含至少一个所述关键字索引项的所述关键字索引列表。
进一步的,所述接收单元51,还用于在所述关键字查找单元54从所述知识数据库中存储的检索数据的关键字索引列表中的关键字索引项中,查找与所述第一分词集合中的文本分词匹配的检索关键字之前,接收文本分析服务器发送的所述关键字索引列表。
进一步的,在本发明实施例的一种应用场景中,如图7所示,所述文本分析单元53,包括:文本分析模块531和第一过滤模块532。
文本分析模块531,用于对所述文本信息进行文本分析,识别出第三分词集合,所述第三分词集合中包含至少一个文本分词。
第一过滤模块532,用于过滤所述文本分析模块531识别出的所述第三分词集合中包含的无意义文本分词,得到所述第一分词集合,所述无意义文本分词包括:惊叹词和语气词。
进一步的,在本发明实施例的另一种应用场景中,如图8所示,所述文本分析单元,包括:文本分析模块531和第二过滤模块533。
文本分析模块531,用于对所述文本信息进行文本分析,识别出第三分词集合,所述第三分词集合中包含至少一个文本分词。
第二过滤模块533,用于过滤所述文本分析模块识531别出的所述第三分词集合中包含的第一文本分词,得到所述第一分词集合,所述第一文本分词为所述第三分词集合中与所述关键字索引列表中的任意一个检索关键字均不匹配的文本分词。
进一步的,在本发明实施例的另一种应用场景中,所述文本分析单元,包括:文本分析模块531、第一过滤模块532和第二过滤模块533。
在这种应用场景中,在第一过滤模块532过滤所述文本分析模块531识别出的所述第三分词集合中包含的无意义文本分词的同时,第二过滤模块533过滤所述文本分析模块识531别出的所述第三分词集合中包含的第一文本分词;此时,第一过滤模块532过滤得到的分词集合与第二过滤模块533过滤得到的分词集合的交集则可以作为所述第一分词集合。
进一步的,所述语音信息由以句子为维度的至少一个语音片段构成,所述文本信息由至少一个文本片段构成。
所述接收单元51,具体用于接收所述用户终端发送的所述语音片段。
所述文本转换单元52,具体用于在所述接收单元51接收到一个所述语音片段后,向语音分析服务器发送所述语音片段,以使得所述语音分析服务器将所述语音片段转换为所述文本片段;接收所述语音分析服务器发送的所述文本片段。
进一步的,所述文本分析单元53,具体用于向所述文本分析服务器发送所述文本信息,以使得所述文本分析服务器对所述文本信息进行文本分析,识别出所述第一分词集合;接收所述文本分析服务器发送的所述第一分词集合。
需要说明的是,本发明实施例中的呼叫中心服务器可以为能够为用户提供通信服务的运营商接收用户呼叫的呼叫中心管理服务器。本发明实施例提供的呼叫中心服务器中部分功能模块的具体描述可以参考方法实施例中的对应内容,本实施例这里不再详细赘述。
本发明实施例提供的呼叫中心服务器,呼叫中心服务器接收用户终端发送的语音信息,并获取对语音信息进行文本转换得到的文本信息;呼叫中心服务器获取对文本信息进行文本分析识别出的第一分词集合,第一分词集合中包含至少一个文本分词;呼叫中心服务器从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,关键字索引列表中包含至少一个关键字索引项,关键字索引项中包含检索关键字和与检索关键字对应的检索数据的标识,知识数据库中存储有至少一个检索数据和所述检索数据的标识;呼叫中心服务器从所述知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
与现有技术中从知识数据库检索数据时,过分依赖于客服人员的个人的业务经验和技能,检索结果的准确性和检索效率较低相比,通过本方案,呼叫中心服务器在接收到用户终端发送的语音信息后,可以通过对语音信息进行文本分析得到分析结果(第一分词集合),然后从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,不需要客服人员根据其个人的业务经验和技能从用户语音信息中识别出检索关键字,并且呼叫中心服务器自动进行检索关键字的识别相较于客服人员根据其个人的业务经验和技能进行检索关键字的识别,可以提高检索关键字的识别效率,并避免由于客服人员由于疏忽或者大意出现的检索错误,提高识别检索关键字的准确性,在高效、准确地获取到检索关键字后,则可以快速、准确地获取到检索结果。
实施例六
本发明实施例提供一种文本分析服务器,用以执行图2所示的数据检索方法,如图9所示,该文本分析服务器包括:接收单元61、文本分析单元62和发送单元63。
接收单元61,用于接收呼叫中心服务器发送的文本信息,所述文本信息为所述呼叫中心服务器根据语音信息转换得到的。
文本分析单元62,用于对所述接收单元61接收的所述文本信息进行文本分析,识别出所述第一分词集合,所述第一分词集合中包含至少一个文本分词。
发送单元63,用于向所述呼叫中心服务器发送所述文本分析单元62分析得到的所述第一分词集合,以使得所述呼叫中心服务器根据所述第一分词集合中的文本分词从知识数据库中检索数据。
其中,文本分析单元62可以对文本信息进行断句、分词,以识别出至少一个文本分词。
进一步的,所述知识数据库中存储有至少一个检索数据和所述检索数据的标识。
如图10所示,所述文本分析服务器,还可以包括:读取单元64和生成单元65。
读取单元64,用于读取所述知识数据库中存储的第一检索数据,所述第一检索数据为所述知识数据库中存储的任意一个检索数据。
所述文本分析单元63,还用于对所述读取单元读取的所述第一检索数据进行文本分析,识别出第二分词集合,所述第二分词集合中包含至少一个文本分词。
生成单元65,用于根据所述文本分析单元63分析得到的所述第二分词集合中的文本分词,生成所述第一检索数据的检索关键字;根据所述第一检索数据的检索关键字和所述第一检索数据的标识生成一个所述关键字索引项,生成包含至少一个所述关键字索引项的所述关键字索引列表。
所述发送单元63,还用于向所述呼叫中心服务器发送所述生成单元65生成的所述关键字索引列表。
需要说明的是,本发明实施例提供的文本分析服务器中部分功能模块的具体描述可以参考方法实施例中的对应内容,本实施例这里不再详细赘述。
本发明实施例提供的文本分析服务器,可以接收呼叫中心服务器发送的文本信息,所述文本信息为所述呼叫中心服务器根据语音信息转换得到的;所述文本分析服务器对所述文本信息进行文本分析,识别出所述第一分词集合,所述第一分词集合中包含至少一个文本分词;所述文本分析服务器向所述呼叫中心服务器发送所述第一分词集合,以使得所述呼叫中心服务器根据所述第一分词集合中的文本分词从知识数据库中检索数据。
与现有技术中从知识数据库检索数据时,过分依赖于客服人员的个人的业务经验和技能,检索结果的准确性和检索效率较低相比,通过本方案,文本分析服务器可以对呼叫中心服务器发送的文本信息进行文本分析得到分析结果(第一分词集合),并将第一分词集合发送至呼叫中心服务器,由呼叫中心服务器从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,不需要客服人员根据其个人的业务经验和技能从用户语音信息中识别出检索关键字,并且呼叫中心服务器自动进行检索关键字的识别相较于客服人员根据其个人的业务经验和技能进行检索关键字的识别,可以提高检索关键字的识别效率,并避免由于客服人员由于疏忽或者大意出现的检索错误,提高识别检索关键字的准确性,在高效、准确地获取到检索关键字后,则可以快速、准确地获取到检索结果。
实施例七
在硬件实现上,实施例五中的各个单元可以以硬件形式内嵌于或独立于呼叫中心服务器的处理器中,也可以以软件形式存储于呼叫中心服务器的存储器中,以便于处理器调用执行以上各个单元对应的操作,该处理器可以为中央处理单元(CPU)、微处理器、单片机等。
本发明实施例提供一种呼叫中心服务器,如图11所示,该呼叫中心服务器包括:接收器71和处理器72。
接收器71,用于接收用户终端发送的语音信息。
处理器72,用于获取对所述接收器71接收的所述语音信息进行文本转换得到的文本信息;获取对所述文本信息进行文本分析识别出的第一分词集合,所述第一分词集合中包含至少一个文本分词;从知识数据库中存储的检索数据的关键字索引列表中,查找与所述第一分词集合中的文本分词匹配的检索关键字,所述关键字索引列表中包含至少一个关键字索引项,所述关键字索引项中包含检索关键字和与所述检索关键字对应的检索数据的标识,所述知识数据库中存储有至少一个检索数据和所述检索数据的标识;从所述知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
进一步的,在本发明实施例的一种应用场景中,所述处理器72,还用于在从知识数据库中存储的检索数据的关键字索引列表中的关键字索引项中,查找与所述第一分词集合中的文本分词匹配的检索关键字之前,读取所述知识数据库中存储的第一检索数据,所述第一检索数据为所述知识数据库中存储的任意一个检索数据;获取对所述第一检索数据进行文本分析识别出的第二分词集合,所述第二分词集合中包含至少一个文本分词;根据所述第二分词集合中的文本分词,生成所述第一检索数据的检索关键字;根据所述第一检索数据的检索关键字和所述第一检索数据的标识生成一个所述关键字索引项;生成包含至少一个所述关键字索引项的所述关键字索引列表。
在本发明实施例的另一种应用场景中,所述接收器71,还用于在所述处理器72从所述知识数据库中存储的检索数据的关键字索引列表中的关键字索引项中,查找与所述第一分词集合中的文本分词匹配的检索关键字之前,接收文本分析服务器发送的所述关键字索引列表。
在上述两种应用场景中,如图12所示,所述呼叫中心服务器,还可以包括:存储器73。
存储器73,用于存储所述处理器72生成的所述关键字索引列表;或者,存储器73,用于存储所述接收器71接收到的所述关键字索引列表。
进一步的,所述处理器72,具体用于对所述文本信息进行文本分析,识别出第三分词集合,所述第三分词集合中包含至少一个文本分词;过滤所述第三分词集合中包含的无意义文本分词,得到所述第一分词集合,所述无意义文本分词包括:惊叹词和语气词。
进一步的,所述处理器72,具体用于对所述文本信息进行文本分析,识别出第三分词集合,所述第三分词集合中包含至少一个文本分词;过滤所述第三分词集合中包含的第一文本分词,得到所述第一分词集合,所述第一文本分词为所述第三分词集合中与所述关键字索引列表中的任意一个检索关键字均不匹配的文本分词。
进一步的,所述语音信息由以句子为维度的至少一个语音片段构成,所述文本信息由至少一个文本片段构成。
所述接收器71,还用于接收所述用户终端发送的所述语音片段。
如图13所示,所述呼叫中心服务器,还可以包括:发送器74。
发送器74,用于在所述接收器71接收到一个所述语音片段后,向语音分析服务器发送所述语音片段,以使得所述语音分析服务器将所述语音片段转换为所述文本片段。
所述接收器71,还用于接收所述语音分析服务器发送的所述文本片段。
进一步的,所述发送器74,还用于向所述文本分析服务器发送所述文本信息,以使得所述文本分析服务器对所述文本信息进行文本分析,识别出所述第一分词集合。
所述接收器71,还用于接收所述文本分析服务器发送的所述第一分词集合。
在本发明实施例中,接收器71、处理器72、存储器73和发送器74通过总线连接并完成相互间的通信。
其中,总线可以是工业标准体系结构(IndustryStandardArchitecture,ISA)总、外部设备互连(PeripheralComponentInterconnect,PCI)总线或扩展工业标准体系结构(ExtendedIndustryStandardArchitecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图11-图13中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
处理器72可以为中央处理器(CentralProcessingUnit,CPU),也可以为CPU、数字信号处理器(DigitalSignalProcessor,DSP)以及通信单元中的控制芯片(例如基带芯片)的组合。在本发明实施例中,CPU可以是单运算核心,也可以包括多运算核心。
接收器71和发送器74可以为通过天线发送和接收无线信号的装置,也可以为其他提供信号发送和接收接口的装置。
需要说明的是,本发明实施例提供的呼叫中心服务器中部分功能模块的具体描述可以参考方法实施例中的对应内容,本实施例这里不再详细赘述。
本发明实施例提供的呼叫中心服务器,可以接收用户终端发送的语音信息,并获取对语音信息进行文本转换得到的文本信息;呼叫中心服务器获取对文本信息进行文本分析识别出的第一分词集合,第一分词集合中包含至少一个文本分词;呼叫中心服务器从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,关键字索引列表中包含至少一个关键字索引项,关键字索引项中包含检索关键字和与检索关键字对应的检索数据的标识,知识数据库中存储有至少一个检索数据和所述检索数据的标识;呼叫中心服务器从所述知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
与现有技术中从知识数据库检索数据时,过分依赖于客服人员的个人的业务经验和技能,检索结果的准确性和检索效率较低相比,通过本方案,呼叫中心服务器在接收到用户终端发送的语音信息后,可以通过对语音信息进行文本分析得到分析结果(第一分词集合),然后从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,不需要客服人员根据其个人的业务经验和技能从用户语音信息中识别出检索关键字,并且呼叫中心服务器自动进行检索关键字的识别相较于客服人员根据其个人的业务经验和技能进行检索关键字的识别,可以提高检索关键字的识别效率,并避免由于客服人员由于疏忽或者大意出现的检索错误,提高识别检索关键字的准确性,在高效、准确地获取到检索关键字后,则可以快速、准确地获取到检索结果。
实施例八
在硬件实现上,实施例六中的各个单元可以以硬件形式内嵌于或独立于文本分析服务器的处理器中,也可以以软件形式存储于文本分析服务器的存储器中,以便于处理器调用执行以上各个单元对应的操作,该处理器可以为中央处理单元(CPU)、微处理器、单片机等。
本发明实施例提供一种文本分析服务器,如图14所示,包括:接收器81、处理器82和发送器83。
接收器81,用于接收呼叫中心服务器发送的文本信息,所述文本信息为所述呼叫中心服务器根据语音信息转换得到的。
处理器82,用于对所述接收器81接收的所述文本信息进行文本分析,识别出所述第一分词集合,所述第一分词集合中包含至少一个文本分词。
发送器83,用于向所述呼叫中心服务器发送所述处理器82识别出的所述第一分词集合,以使得所述呼叫中心服务器根据所述第一分词集合中的文本分词从知识数据库中检索数据。
进一步的,所述知识数据库中存储有至少一个检索数据和所述检索数据的标识。
所述处理器82,还用于读取所述知识数据库中存储的第一检索数据,所述第一检索数据为所述知识数据库中存储的任意一个检索数据;对所述第一检索数据进行文本分析,识别出第二分词集合,所述第二分词集合中包含至少一个文本分词;根据所述第二分词集合中的文本分词,生成所述第一检索数据的检索关键字;根据所述第一检索数据的检索关键字和所述第一检索数据的标识生成一个所述关键字索引项;生成包含至少一个所述关键字索引项的所述关键字索引列表。
所述发送器83,还用于向所述呼叫中心服务器发送所述处理器82生成的所述关键字索引列表。
在本发明实施例中,接收器81、处理器82、发送器83通过总线连接并完成相互间的通信。
其中,总线可以是工业标准体系结构(IndustryStandardArchitecture,ISA)总、外部设备互连(PeripheralComponentInterconnect,PCI)总线或扩展工业标准体系结构(ExtendedIndustryStandardArchitecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图14中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
处理器82可以为中央处理器(CentralProcessingUnit,CPU),也可以为CPU、数字信号处理器(DigitalSignalProcessor,DSP)以及通信单元中的控制芯片(例如基带芯片)的组合。在本发明实施例中,CPU可以是单运算核心,也可以包括多运算核心。
接收器81和发送器82可以为通过天线发送和接收无线信号的装置,也可以为其他提供信号发送和接收接口的装置。
需要说明的是,本发明实施例提供的文本分析服务器中部分功能模块的具体描述可以参考方法实施例中的对应内容,本实施例这里不再详细赘述。
本发明实施例提供的文本分析服务器,可以接收呼叫中心服务器发送的文本信息,所述文本信息为所述呼叫中心服务器根据语音信息转换得到的;所述文本分析服务器对所述文本信息进行文本分析,识别出所述第一分词集合,所述第一分词集合中包含至少一个文本分词;所述文本分析服务器向所述呼叫中心服务器发送所述第一分词集合,以使得所述呼叫中心服务器根据所述第一分词集合中的文本分词从知识数据库中检索数据。
与现有技术中从知识数据库检索数据时,过分依赖于客服人员的个人的业务经验和技能,检索结果的准确性和检索效率较低相比,通过本方案,文本分析服务器可以对呼叫中心服务器发送的文本信息进行文本分析得到分析结果(第一分词集合),并将第一分词集合发送至呼叫中心服务器,由呼叫中心服务器从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,不需要客服人员根据其个人的业务经验和技能从用户语音信息中识别出检索关键字,并且呼叫中心服务器自动进行检索关键字的识别相较于客服人员根据其个人的业务经验和技能进行检索关键字的识别,可以提高检索关键字的识别效率,并避免由于客服人员由于疏忽或者大意出现的检索错误,提高识别检索关键字的准确性,在高效、准确地获取到检索关键字后,则可以快速、准确地获取到检索结果。
需要说明的是,在本发明实施例的第一种应用场景中,呼叫中心服务器中可以集成有能够实现对语音信息进行文本转换的文本转换模块和能够实现对文本转换模块对语音信息进行文本转换得到的文本信息进行文本分析的文本分析模块,即呼叫中心服务器内部即可实现对语音信息进行文本转换,进而对进行文本转换得到的文本信息进行文本分析的功能。
在本发明实施例的第二种应用场景中,呼叫中心服务器需要向语音分析服务器发送语音信息,由语音分析服务器实现对语音信息进行文本转换,得到文本信息,然后接收语音分析服务器发送的文本信息;呼叫中心服务器需要向文本分析服务器发送文本信息,由文本分析服务器实现对文本信息进行文本分析,得到分析结果,然后接收文本分析服务器发送的分析结果。
对应于第二种应用场景,本发明实施例提供一种数据检索***,如图15所示,该数据检索***包括:呼叫中心服务器91、语音分析服务器92、文本分析服务器93和知识数据库94。
所述呼叫中心服务器91,用于接收用户终端发送的语音信息,并向所述语音分析服务器92发送所述语音信息,所述语音信息由以句子为维度的至少一个语音片段构成。
所述语音分析服务器92,用于将所述语音片段转换为所述文本片段,并向所述呼叫中心服务器91发送文本信息,所述文本信息由至少一个文本片段构成。
所述呼叫中心服务器91,还用于向所述文本分析服务器93发送所述文本信息。
所述文本分析服务器93,用于对所述文本信息进行文本分析,识别出第一分词集合,所述第一分词集合中包含至少一个文本分词。
所述呼叫中心服务器91,还用于从知识数据库中存储的检索数据的关键字索引列表中,查找与所述第一分词集合中的文本分词匹配的检索关键字,所述关键字索引列表中包含至少一个关键字索引项,所述关键字索引项中包含检索关键字和与所述检索关键字对应的检索数据的标识,所述知识数据库中存储有至少一个检索数据和所述检索数据的标识;从所述知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
进一步的,所述文本分析服务器93,还用于向所述呼叫中心服务器91发送所述关键字索引列表。
进一步的,所述文本分析服务器93,还用于在向所述呼叫中心服务器91发送所述关键字索引列表之前,读取所述知识数据库中存储的第一检索数据,所述第一检索数据为所述知识数据库中存储的任意一个检索数据;对所述第一检索数据进行文本分析,识别出第二分词集合,所述第二分词集合中包含至少一个文本分词;根据所述第二分词集合中的文本分词,生成所述第一检索数据的检索关键字;根据所述第一检索数据的检索关键字和所述第一检索数据的标识生成一个所述关键字索引项;生成包含至少一个所述关键字索引项的所述关键字索引列表。
本发明实施例提供的数据检索***,与现有技术中从知识数据库检索数据时,过分依赖于客服人员的个人的业务经验和技能,检索结果的准确性和检索效率较低相比,通过本方案,呼叫中心服务器在接收到用户终端发送的语音信息后,可以通过对语音信息进行文本分析得到分析结果(第一分词集合),然后从知识数据库中存储的检索数据的关键字索引列表中,查找与第一分词集合中的文本分词匹配的检索关键字,不需要客服人员根据其个人的业务经验和技能从用户语音信息中识别出检索关键字,并且呼叫中心服务器自动进行检索关键字的识别相较于客服人员根据其个人的业务经验和技能进行检索关键字的识别,可以提高检索关键字的识别效率,并避免由于客服人员由于疏忽或者大意出现的检索错误,提高识别检索关键字的准确性,在高效、准确地获取到检索关键字后,则可以快速、准确地获取到检索结果。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (18)
1.一种数据检索方法,其特征在于,包括:
呼叫中心服务器接收用户终端发送的语音信息,并获取对所述语音信息进行文本转换得到的文本信息;
所述呼叫中心服务器获取对所述文本信息进行文本分析识别出的第一分词集合,所述第一分词集合中包含至少一个文本分词;
所述呼叫中心服务器从知识数据库中存储的检索数据的关键字索引列表中,查找与所述第一分词集合中的文本分词匹配的检索关键字,所述关键字索引列表中包含至少一个关键字索引项,所述关键字索引项中包含检索关键字和与所述检索关键字对应的检索数据的标识,所述知识数据库中存储有至少一个检索数据和所述检索数据的标识;
所述呼叫中心服务器从所述知识数据库中,检索查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
2.根据权利要求1所述的方法,其特征在于,在所述呼叫中心服务器从知识数据库中存储的检索数据的关键字索引列表中的关键字索引项中,查找与所述第一分词集合中的文本分词匹配的检索关键字之前,所述方法还包括:
所述呼叫中心服务器读取所述知识数据库中存储的第一检索数据,所述第一检索数据为所述知识数据库中存储的任意一个检索数据;
所述呼叫中心服务器获取对所述第一检索数据进行文本分析识别出的第二分词集合,所述第二分词集合中包含至少一个文本分词;
所述呼叫中心服务器根据所述第二分词集合中的文本分词,生成所述第一检索数据的检索关键字;
所述呼叫中心服务器根据所述第一检索数据的检索关键字和所述第一检索数据的标识生成一个所述关键字索引项;
所述呼叫中心服务器生成包含至少一个所述关键字索引项的所述关键字索引列表。
3.根据权利要求1所述的方法,其特征在于,在所述呼叫中心服务器从所述知识数据库中存储的检索数据的关键字索引列表中的关键字索引项中,查找与所述第一分词集合中的文本分词匹配的检索关键字之前,所述方法还包括:
所述呼叫中心服务器接收文本分析服务器发送的所述关键字索引列表。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述呼叫中心服务器获取对所述文本信息进行文本分析识别出的第一分词集合,包括:
所述呼叫中心服务器对所述文本信息进行文本分析,识别出第三分词集合,所述第三分词集合中包含至少一个文本分词;
所述呼叫中心服务器过滤所述第三分词集合中包含的无意义文本分词,得到所述第一分词集合,所述无意义文本分词包括:惊叹词和语气词。
5.根据权利要求1-3中任一项所述的方法,其特征在于,所述呼叫中心服务器获取对所述文本信息进行文本分析识别出的第一分词集合,包括:
所述呼叫中心服务器对所述文本信息进行文本分析,识别出第三分词集合,所述第三分词集合中包含至少一个文本分词;
所述呼叫中心服务器过滤所述第三分词集合中包含的第一文本分词,得到所述第一分词集合,所述第一文本分词为所述第三分词集合中与所述关键字索引列表中的任意一个检索关键字均不匹配的文本分词。
6.根据权利要求1或3所述的方法,其特征在于,所述语音信息由以句子为维度的至少一个语音片段构成,所述文本信息由至少一个文本片段构成;
所述呼叫中心服务器接收用户终端发送的语音信息,并获取对所述语音信息进行文本转换得到的文本信息,包括:
所述呼叫中心服务器接收所述用户终端发送的所述语音片段;
所述呼叫中心服务器在接收到一个所述语音片段后,向语音分析服务器发送所述语音片段,以使得所述语音分析服务器将所述语音片段转换为所述文本片段;
所述呼叫中心服务器接收所述语音分析服务器发送的所述文本片段。
7.根据权利要求1或3所述的方法,其特征在于,所述呼叫中心服务器获取对所述文本信息进行文本分析识别出的第一分词集合,包括:
所述呼叫中心服务器向所述文本分析服务器发送所述文本信息,以使得所述文本分析服务器对所述文本信息进行文本分析,识别出所述第一分词集合;
所述呼叫中心服务器接收所述文本分析服务器发送的所述第一分词集合。
8.一种数据检索方法,其特征在于,包括:
文本分析服务器接收呼叫中心服务器发送的文本信息,所述文本信息为所述呼叫中心服务器根据语音信息转换得到的;
所述文本分析服务器对所述文本信息进行文本分析,识别出所述第一分词集合,所述第一分词集合中包含至少一个文本分词;
所述文本分析服务器向所述呼叫中心服务器发送所述第一分词集合,以使得所述呼叫中心服务器根据所述第一分词集合中的文本分词从知识数据库中检索数据。
9.根据权利要求8所述的方法,其特征在于,所述知识数据库中存储有至少一个检索数据和所述检索数据的标识;
所述方法还包括:
所述文本分析服务器读取所述知识数据库中存储的第一检索数据,所述第一检索数据为所述知识数据库中存储的任意一个检索数据;
所述文本分析服务器对所述第一检索数据进行文本分析,识别出第二分词集合,所述第二分词集合中包含至少一个文本分词;
所述文本分析服务器根据所述第二分词集合中的文本分词,生成所述第一检索数据的检索关键字;
所述文本分析服务器根据所述第一检索数据的检索关键字和所述第一检索数据的标识生成一个所述关键字索引项;
所述文本服务器生成包含至少一个所述关键字索引项的所述关键字索引列表;
所述文本分析服务器向所述呼叫中心服务器发送所述关键字索引列表。
10.一种呼叫中心服务器,其特征在于,包括:
接收单元,用于接收用户终端发送的语音信息;
文本转换单元,用于获取对所述接收单元接收的所述语音信息进行文本转换得到的文本信息;
文本分析单元,用于获取对所述文本转换单元获得的所述文本信息进行文本分析识别出的第一分词集合,所述第一分词集合中包含至少一个文本分词;
关键字查找单元,用于从知识数据库中存储的检索数据的关键字索引列表中,查找与所述文本分析单元获得的所述第一分词集合中的文本分词匹配的检索关键字,所述关键字索引列表中包含至少一个关键字索引项,所述关键字索引项中包含检索关键字和与所述检索关键字对应的检索数据的标识,所述知识数据库中存储有至少一个检索数据和所述检索数据的标识;
检索单元,用于从所述知识数据库中,检索所述关键字查找单元查找到的检索关键字所对应的检索的数据的标识所指示的检索数据。
11.根据权利要求10所述的呼叫中心服务器,其特征在于,还包括:
读取单元,用于在所述关键字查找单元从所述知识数据库中存储的检索数据的关键字索引列表中的关键字索引项中,查找与所述第一分词集合中的文本分词匹配的检索关键字之前,读取所述知识数据库中存储的第一检索数据,所述第一检索数据为所述知识数据库中存储的任意一个检索数据;
所述文本分析单元,还用于获取对所述读取单元读取的所述第一检索数据进行文本分析识别出的第二分词集合,所述第二分词集合中包含至少一个文本分词;
生成单元,用于根据所述文本分析单元获得的所述第二分词集合中的文本分词,生成所述第一检索数据的检索关键字;根据所述第一检索数据的检索关键字和所述第一检索数据的标识生成一个所述关键字索引项,生成包含至少一个所述关键字索引项的所述关键字索引列表。
12.根据权利要求10所述的呼叫中心服务器,其特征在于,所述接收单元,还用于在所述关键字查找单元从所述知识数据库中存储的检索数据的关键字索引列表中的关键字索引项中,查找与所述第一分词集合中的文本分词匹配的检索关键字之前,接收文本分析服务器发送的所述关键字索引列表。
13.根据权利要求10-12中任一项所述的呼叫中心服务器,其特征在于,所述文本分析单元,包括:
文本分析模块,用于对所述文本信息进行文本分析,识别出第三分词集合,所述第三分词集合中包含至少一个文本分词;
第一过滤模块,用于过滤所述文本分析模块识别出的所述第三分词集合中包含的无意义文本分词,得到所述第一分词集合,所述无意义文本分词包括:惊叹词和语气词。
14.根据权利要求10-12中任一项所述的呼叫中心服务器,其特征在于,所述文本分析单元,包括:
文本分析模块,用于对所述文本信息进行文本分析,识别出第三分词集合,所述第三分词集合中包含至少一个文本分词;
第二过滤模块,用于过滤所述文本分析模块识别出的所述第三分词集合中包含的第一文本分词,得到所述第一分词集合,所述第一文本分词为所述第三分词集合中与所述关键字索引列表中的任意一个检索关键字均不匹配的文本分词。
15.根据权利要求10或12所述的呼叫中心服务器,其特征在于,所述语音信息由以句子为维度的至少一个语音片段构成,所述文本信息由至少一个文本片段构成;
所述接收单元,具体用于接收所述用户终端发送的所述语音片段;
所述文本转换单元,具体用于在所述接收单元接收到一个所述语音片段后,向语音分析服务器发送所述语音片段,以使得所述语音分析服务器将所述语音片段转换为所述文本片段;接收所述语音分析服务器发送的所述文本片段。
16.根据权利要求10或12所述的呼叫中心服务器,其特征在于,所述文本分析单元,具体用于向所述文本分析服务器发送所述文本信息,以使得所述文本分析服务器对所述文本信息进行文本分析,识别出所述第一分词集合;接收所述文本分析服务器发送的所述第一分词集合。
17.一种文本分析服务器,其特征在于,包括:
接收单元,用于接收呼叫中心服务器发送的文本信息,所述文本信息为所述呼叫中心服务器根据语音信息转换得到的;
文本分析单元,用于对所述接收单元接收的所述文本信息进行文本分析,识别出所述第一分词集合,所述第一分词集合中包含至少一个文本分词;
发送单元,用于向所述呼叫中心服务器发送所述文本分析单元分析得到的所述第一分词集合,以使得所述呼叫中心服务器根据所述第一分词集合中的文本分词从知识数据库中检索数据。
18.根据权利要求17所述的文本分析服务器,其特征在于,所述知识数据库中存储有至少一个检索数据和所述检索数据的标识;
所述文本分析服务器,还包括:
读取单元,用于读取所述知识数据库中存储的第一检索数据,所述第一检索数据为所述知识数据库中存储的任意一个检索数据;
所述文本分析单元,还用于对所述读取单元读取的所述第一检索数据进行文本分析,识别出第二分词集合,所述第二分词集合中包含至少一个文本分词;
生成单元,用于根据所述文本分析单元分析得到的所述第二分词集合中的文本分词,生成所述第一检索数据的检索关键字;根据所述第一检索数据的检索关键字和所述第一检索数据的标识生成一个所述关键字索引项,生成包含至少一个所述关键字索引项的所述关键字索引列表;
所述发送单元,还用于向所述呼叫中心服务器发送所述生成单元生成的所述关键字索引列表。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410799739.3A CN105760399A (zh) | 2014-12-19 | 2014-12-19 | 一种数据检索方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410799739.3A CN105760399A (zh) | 2014-12-19 | 2014-12-19 | 一种数据检索方法及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105760399A true CN105760399A (zh) | 2016-07-13 |
Family
ID=56339936
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410799739.3A Pending CN105760399A (zh) | 2014-12-19 | 2014-12-19 | 一种数据检索方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105760399A (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108172304A (zh) * | 2017-12-18 | 2018-06-15 | 广州七乐康药业连锁有限公司 | 一种基于用户医疗反馈的医疗信息可视化处理方法及*** |
CN108228657A (zh) * | 2016-12-22 | 2018-06-29 | 沈阳美行科技有限公司 | 一种关键字检索的实现方法及装置 |
WO2018144465A1 (en) * | 2017-01-31 | 2018-08-09 | Interactive Intelligence Group, Inc. | System and method for speech-based interaction resolution |
CN108563788A (zh) * | 2018-04-27 | 2018-09-21 | 腾讯科技(深圳)有限公司 | 基于区块链的数据查询方法、装置、服务器及存储介质 |
CN108831452A (zh) * | 2018-04-27 | 2018-11-16 | 合肥尧威智能科技有限公司 | 一种智能语音识别装修服务管理*** |
CN109376224A (zh) * | 2018-10-24 | 2019-02-22 | 深圳市壹鸽科技有限公司 | 语料过滤方法与装置 |
CN110020002A (zh) * | 2018-08-21 | 2019-07-16 | 平安普惠企业管理有限公司 | 事件处理方案的查询方法、装置、设备和计算机存储介质 |
CN110265032A (zh) * | 2019-06-05 | 2019-09-20 | 平安科技(深圳)有限公司 | 会议数据分析处理方法、装置、计算机设备和存储介质 |
CN110347784A (zh) * | 2019-05-23 | 2019-10-18 | 深圳壹账通智能科技有限公司 | 报表查询方法、装置、存储介质及电子设备 |
CN110580276A (zh) * | 2018-06-08 | 2019-12-17 | 百度在线网络技术(北京)有限公司 | 用于处理信息的方法和装置 |
CN110750702A (zh) * | 2019-09-11 | 2020-02-04 | 中国科学院上海微***与信息技术研究所 | 一种微服务检索方法、装置、电子设备及存储介质 |
CN110781676A (zh) * | 2019-09-30 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置、***、电子设备及存储介质 |
CN111306709A (zh) * | 2020-01-20 | 2020-06-19 | 海信视像科技股份有限公司 | 一种空调 |
CN112527973A (zh) * | 2020-12-25 | 2021-03-19 | 北京博瑞彤芸科技股份有限公司 | 一种搜索疾病信息的方法和*** |
CN112650878A (zh) * | 2019-10-11 | 2021-04-13 | 北京声智科技有限公司 | 一种检索方法、***、设备及介质 |
CN112735475A (zh) * | 2020-12-25 | 2021-04-30 | 北京博瑞彤芸科技股份有限公司 | 一种通过语音搜索疾病知识的方法和*** |
CN112735413A (zh) * | 2020-12-25 | 2021-04-30 | 浙江大华技术股份有限公司 | 一种基于摄像装置的指令分析方法、电子设备和存储介质 |
CN114697286A (zh) * | 2022-04-18 | 2022-07-01 | 上海迎盾科技有限公司 | 即时通信数据的处理方法及装置、计算机可读存储介质 |
CN116126896A (zh) * | 2022-09-30 | 2023-05-16 | 中电金信软件有限公司 | 数据检索方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101510222A (zh) * | 2009-02-20 | 2009-08-19 | 北京大学 | 一种多层索引语音文档检索方法及其*** |
CN101996195A (zh) * | 2009-08-28 | 2011-03-30 | ***通信集团公司 | 音频文件中语音信息的搜索方法、装置及设备 |
CN102591932A (zh) * | 2011-12-23 | 2012-07-18 | 优视科技有限公司 | 语音搜索方法及***、移动终端、中转服务器 |
CN102750365A (zh) * | 2012-06-14 | 2012-10-24 | 华为软件技术有限公司 | 即时语音消息的检索方法和***,以及用户设备和服务器 |
CN103440253A (zh) * | 2013-07-25 | 2013-12-11 | 清华大学 | 语音检索方法及*** |
US20140172868A1 (en) * | 2012-12-17 | 2014-06-19 | General Electric Company | System and method for storage, querying, and analysis service for time series data |
CN103885949A (zh) * | 2012-12-19 | 2014-06-25 | 中国科学院声学研究所 | 一种基于歌词的歌曲检索***及其检索方法 |
-
2014
- 2014-12-19 CN CN201410799739.3A patent/CN105760399A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101510222A (zh) * | 2009-02-20 | 2009-08-19 | 北京大学 | 一种多层索引语音文档检索方法及其*** |
CN101996195A (zh) * | 2009-08-28 | 2011-03-30 | ***通信集团公司 | 音频文件中语音信息的搜索方法、装置及设备 |
CN102591932A (zh) * | 2011-12-23 | 2012-07-18 | 优视科技有限公司 | 语音搜索方法及***、移动终端、中转服务器 |
CN102750365A (zh) * | 2012-06-14 | 2012-10-24 | 华为软件技术有限公司 | 即时语音消息的检索方法和***,以及用户设备和服务器 |
US20140172868A1 (en) * | 2012-12-17 | 2014-06-19 | General Electric Company | System and method for storage, querying, and analysis service for time series data |
CN103885949A (zh) * | 2012-12-19 | 2014-06-25 | 中国科学院声学研究所 | 一种基于歌词的歌曲检索***及其检索方法 |
CN103440253A (zh) * | 2013-07-25 | 2013-12-11 | 清华大学 | 语音检索方法及*** |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108228657A (zh) * | 2016-12-22 | 2018-06-29 | 沈阳美行科技有限公司 | 一种关键字检索的实现方法及装置 |
CN108228657B (zh) * | 2016-12-22 | 2022-05-27 | 沈阳美行科技股份有限公司 | 一种关键字检索的实现方法及装置 |
WO2018144465A1 (en) * | 2017-01-31 | 2018-08-09 | Interactive Intelligence Group, Inc. | System and method for speech-based interaction resolution |
CN108172304A (zh) * | 2017-12-18 | 2018-06-15 | 广州七乐康药业连锁有限公司 | 一种基于用户医疗反馈的医疗信息可视化处理方法及*** |
CN108172304B (zh) * | 2017-12-18 | 2021-04-02 | 广州七乐康药业连锁有限公司 | 一种基于用户医疗反馈的医疗信息可视化处理方法及*** |
CN108563788A (zh) * | 2018-04-27 | 2018-09-21 | 腾讯科技(深圳)有限公司 | 基于区块链的数据查询方法、装置、服务器及存储介质 |
CN108831452A (zh) * | 2018-04-27 | 2018-11-16 | 合肥尧威智能科技有限公司 | 一种智能语音识别装修服务管理*** |
CN110580276A (zh) * | 2018-06-08 | 2019-12-17 | 百度在线网络技术(北京)有限公司 | 用于处理信息的方法和装置 |
CN110580276B (zh) * | 2018-06-08 | 2022-06-28 | 百度在线网络技术(北京)有限公司 | 用于处理信息的方法和装置 |
CN110020002A (zh) * | 2018-08-21 | 2019-07-16 | 平安普惠企业管理有限公司 | 事件处理方案的查询方法、装置、设备和计算机存储介质 |
CN110020002B (zh) * | 2018-08-21 | 2024-01-12 | 山西掌柜鼎科技有限公司 | 事件处理方案的查询方法、装置、设备和计算机存储介质 |
CN109376224A (zh) * | 2018-10-24 | 2019-02-22 | 深圳市壹鸽科技有限公司 | 语料过滤方法与装置 |
CN110347784A (zh) * | 2019-05-23 | 2019-10-18 | 深圳壹账通智能科技有限公司 | 报表查询方法、装置、存储介质及电子设备 |
CN110265032A (zh) * | 2019-06-05 | 2019-09-20 | 平安科技(深圳)有限公司 | 会议数据分析处理方法、装置、计算机设备和存储介质 |
CN110750702B (zh) * | 2019-09-11 | 2023-03-31 | 中国科学院上海微***与信息技术研究所 | 一种微服务检索方法、装置、电子设备及存储介质 |
CN110750702A (zh) * | 2019-09-11 | 2020-02-04 | 中国科学院上海微***与信息技术研究所 | 一种微服务检索方法、装置、电子设备及存储介质 |
CN110781676A (zh) * | 2019-09-30 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置、***、电子设备及存储介质 |
CN112650878A (zh) * | 2019-10-11 | 2021-04-13 | 北京声智科技有限公司 | 一种检索方法、***、设备及介质 |
CN111306709B (zh) * | 2020-01-20 | 2021-09-07 | 海信视像科技股份有限公司 | 一种空调 |
CN111306709A (zh) * | 2020-01-20 | 2020-06-19 | 海信视像科技股份有限公司 | 一种空调 |
CN112735413A (zh) * | 2020-12-25 | 2021-04-30 | 浙江大华技术股份有限公司 | 一种基于摄像装置的指令分析方法、电子设备和存储介质 |
CN112527973A (zh) * | 2020-12-25 | 2021-03-19 | 北京博瑞彤芸科技股份有限公司 | 一种搜索疾病信息的方法和*** |
CN112735475B (zh) * | 2020-12-25 | 2023-02-21 | 北京博瑞彤芸科技股份有限公司 | 一种通过语音搜索疾病知识的方法和*** |
CN112735475A (zh) * | 2020-12-25 | 2021-04-30 | 北京博瑞彤芸科技股份有限公司 | 一种通过语音搜索疾病知识的方法和*** |
CN112735413B (zh) * | 2020-12-25 | 2024-05-31 | 浙江大华技术股份有限公司 | 一种基于摄像装置的指令分析方法、电子设备和存储介质 |
CN114697286A (zh) * | 2022-04-18 | 2022-07-01 | 上海迎盾科技有限公司 | 即时通信数据的处理方法及装置、计算机可读存储介质 |
CN114697286B (zh) * | 2022-04-18 | 2024-04-26 | 上海迎盾科技有限公司 | 即时通信数据的处理方法及装置、计算机可读存储介质 |
CN116126896A (zh) * | 2022-09-30 | 2023-05-16 | 中电金信软件有限公司 | 数据检索方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105760399A (zh) | 一种数据检索方法及设备 | |
US8892572B2 (en) | Video search system and method of use | |
US11275728B2 (en) | Processing method and device of the user input information | |
CN103488796B (zh) | 根据上下文输入的方法及移动终端 | |
CN103024169A (zh) | 一种通讯终端应用程序的语音启动方法和装置 | |
CN110941708B (zh) | 智能问答库建立方法、智能问答方法及装置、计算机设备 | |
CN104104778A (zh) | 一种移动终端的短消息处理方法和装置 | |
CN101963976A (zh) | 一种用于移动终端的信息搜索方法及移动终端 | |
CN104468941A (zh) | 信息显示方法和装置 | |
CN102857917A (zh) | 一种基于信令分析的手机连接pc上网识别方法 | |
CN101847146A (zh) | 一种搜索方法、***及搜索服务器 | |
CN110784591A (zh) | 智能语音自动化探测方法、装置及*** | |
CN103002103A (zh) | 一种***方法和装置 | |
US11388457B2 (en) | Radio station provider management systems and methods | |
CN111159334A (zh) | 用于房源跟进信息处理的方法及*** | |
CN103389976A (zh) | 用于终端的搜索方法及*** | |
CN103514303A (zh) | 电气元件接线图识别方法及*** | |
CN107506407B (zh) | 一种文件分类、调用的方法及装置 | |
CN110442696B (zh) | 查询处理方法及装置 | |
CN105187607A (zh) | 一种消息处理方法及*** | |
CN110445934A (zh) | 通话信息处理方法、***、终端及可读存储介质 | |
CN102547678B (zh) | 一种携号转网短消息日志获取存储方法、***及装置 | |
CN104702758A (zh) | 一种终端及其管理多媒体记事本的方法 | |
CN103474063B (zh) | 语音辨识***以及方法 | |
CN103874014A (zh) | 基于终端位置信息的业务服务方法、服务提供装置及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160713 |