CN111382234A - 一种基于客服的答复提供方法及装置 - Google Patents
一种基于客服的答复提供方法及装置 Download PDFInfo
- Publication number
- CN111382234A CN111382234A CN201811513766.4A CN201811513766A CN111382234A CN 111382234 A CN111382234 A CN 111382234A CN 201811513766 A CN201811513766 A CN 201811513766A CN 111382234 A CN111382234 A CN 111382234A
- Authority
- CN
- China
- Prior art keywords
- question
- identified
- customer service
- feature vector
- semantic information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000004044 response Effects 0.000 claims abstract description 73
- 238000003909 pattern recognition Methods 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims description 46
- 230000008569 process Effects 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 23
- 238000010586 diagram Methods 0.000 description 12
- 230000011218 segmentation Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000012423 maintenance Methods 0.000 description 7
- 238000007726 management method Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 210000004556 brain Anatomy 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000006854 communication Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012827 research and development Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于客服的答复提供方法及装置,所述方法包括:接收用户输入的第一问题;按照预设的模式识别规则,识别所述第一问题中包括的第一实体词、第一属性词以及第一语义信息,其中所述第一实体词为所述第一问题中包含的第一名词,所述第一属性词为对每个第一名词进行修饰的形容词;根据识别到的第一实体词集合、第一属性词集合、第一语义信息集合及所述第一问题,构成第一特征向量;将所述第一特征向量输入到预先训练的识别模型中,确定所述第一问题的答复并提供;从而提高了智能客服机器人提供答复的准确率,进而提高用户体验。
Description
技术领域
本发明涉及智能客服领域,尤其涉及一种基于客服的答复提供方法及装置。
背景技术
企业客服作为企业用户与企业服务的交互入口,承担着企业相关业务咨询、业务办理、问题解答以及投诉建议等服务业务。随着智能客服机器人的发展,越来越多的企业选择智能客服机器人来代替人工客服来完成一定的客户服务业务。
这些智能客服机器人虽然可以及时地完成服务业务,但是在完成的过程中还是存在很多局限性。比如这些智能客服机器人只能识别纯文本数据的业务咨询问题中的关键词,再依据该关键词及设定的问答匹配规则,去答复该业务咨询问题。由于相同的关键词在不同的场景下产生的语义是不同的,但现有的智能客服机器人识别不出相同的关键词中携带的不同语义,故对于用户咨询的业务咨询问题的答复准确度不高,这导致用户对智能客服机器人的服务不满,导致企业的客服服务质量下降,进而极大地降低了用户对于企业的相关产品的购买意愿,甚至放弃购买该产品,带来更多的负面影响,如企业口碑下降等。
发明内容
本发明实施例提供了一种基于客服的答复提供方法及装置,用以现有技术中智能客服机器人答复用户咨询的业务问题准确度低,导致用户体验效果差的问题。
本发明实施例提供了一种基于客服的答复提供方法,所述方法包括:
接收用户输入的第一问题;
按照预设的模式识别规则,识别所述第一问题中包括的第一实体词、第一属性词以及第一语义信息,其中所述第一实体词为所述第一问题中包含的第一名词,所述第一属性词为对每个第一名词进行修饰的形容词;
根据识别到的第一实体词集合、第一属性词集合、第一语义信息集合及所述第一问题,构成第一特征向量;
将所述第一特征向量输入到预先训练的识别模型中,确定所述第一问题的答复并提供。
进一步地,所述识别模型的训练过程为:
针对训练样本集中的每个第一样本子集,其中每个第一样本子集中包含一个答复,及关于所述答复的每个问题,按照预设的模式识别规则,识别所述第一样本子集中答复及每个问题包括的第二实体词、第二属性词以及第二语义信息;
根据识别到的第二实体词集合、第二属性词集合、第二语义信息以及问题的集合,构成第二特征向量;
根据每个第一样本子集对应的第二特征向量和对应的答复,对所述识别模型进行训练。
进一步地,所述样本子集中包括以基本数据类型表示的结构化数据、用图片和语音表示的非结构化数据,以及采用相应的处理工具解析后得到的半结构化数据。
进一步地,所述方法还包括:
保存所述第一问题及针对所述第一问题的答复。
进一步地,所述方法还包括:
按照设定的时间间隔,根据保存的每个第一问题及针对第一问题的答复,确定每个第二样本子集,其中每个第二样本子集中包含一个答复,及关于所述答复的每个第一问题;
针对每个第二样本子集,按照预设的模式识别规则,识别所述第二样本子集中的答复及每个第一问题包括的第三实体词、第三属性词以及第三语义信息;
根据识别到的第三实体词集合、第三属性词集合、第三语义信息以及所述第一问题的集合,构成第三特征向量;
根据每个第二样本子集对应的第三特征向量和答复,对所述识别模型进行训练。
本发明实施例提供了一种基于客服的答复提供装置,所述装置包括:
接收模块,用于接收用户输入的第一问题;
客服模块,用于按照预设的模式识别规则,识别所述第一问题中包括的第一实体词、第一属性词以及第一语义信息,其中所述第一实体词为所述第一问题中包含的第一名词,所述第一属性词为对每个第一名词进行修饰的形容词;根据识别到的第一实体词集合、第一属性词集合、第一语义信息集合及所述第一问题,构成第一特征向量;
确定模块,用于将所述第一特征向量输入到预先训练的识别模型中,确定所述第一问题的答复并提供。
进一步地,所述装置还包括:
第一训练模块,用于针对训练样本集中的每个第一样本子集,其中每个第一样本子集中包含一个答复,及关于所述答复的每个问题,按照预设的模式识别规则,识别所述第一样本子集中答复及每个问题包括的第二实体词、第二属性词以及第二语义信息;根据识别到的第二实体词集合、第二属性词集合、第二语义信息以及问题的集合,构成第二特征向量;根据每个第一样本子集对应的第二特征向量和对应的答复,对所述识别模型进行训练。
进一步地,所述装置还包括:
存储模块,用于保存所述第一问题及针对所述第一问题的答复。
进一步地,所述装置还包括:
第二训练模块,用于按照设定的时间间隔,根据保存的每个第一问题及针对第一问题的答复,确定每个第二样本子集,其中每个第二样本子集中包含一个答复,及关于所述答复的每个第一问题;针对每个第二样本子集,按照预设的模式识别规则,识别所述第二样本子集中的答复及每个第一问题包括的第三实体词、第三属性词以及第三语义信息;根据识别到的第三实体词集合、第三属性词集合、第三语义信息以及所述第一问题的集合,构成第三特征向量;根据每个第二样本子集对应的第三特征向量和答复,对所述识别模型进行训练。
进一步地,所述客服模块包括:路由单元和至少两个客服单元,
路由单元,用于根据保存的每个客服单元对应的负载信息,确定负载最小的客服单元,将所述第一问题发送给所述负载最小的客服单元;
每个客服单元,用于按照预设的模式识别规则,识别所述第一问题中包括的第一实体词、第一属性词以及第一语义信息,其中所述第一实体词为所述第一问题中包含的第一名词,所述第一属性词为对每个第一名词进行修饰的形容词;根据识别到的第一实体词集合、第一属性词集合、第一语义信息集合及所述第一问题,构成第一特征向量;将所述第一特征向量输入到预先训练的识别模型中,确定所述第一问题的答复并提供。
进一步地,所述客服模块包括:
路由单元和至少两个客服单元,
路由单元,用于根据所述第一问题识别所述第一问题对应的目标问题种类,根据保存的问题种类与客服单元的对应关系,确定所述目标问题种类对应的目标客服单元,将所述第一问题发送给所述目标客服单元;
所述目标客服单元,用于按照预设的模式识别规则,识别所述第一问题中包括的第一实体词、第一属性词以及第一语义信息,其中所述第一实体词为所述第一问题中包含的第一名词,所述第一属性词为对每个第一名词进行修饰的形容词;根据识别到的第一实体词集合、第一属性词集合、第一语义信息集合及所述第一问题,构成第一特征向量;将所述第一特征向量输入到预先训练的识别模型中,确定所述第一问题的答复并提供。
本发明实施例提供了一种基于客服的答复提供方法及装置,所述方法包括接收用户输入的第一问题;按照预设的模式识别规则,识别所述第一问题中包括的第一实体词、第一属性词以及第一语义信息,其中所述第一实体词为所述第一问题中包含的第一名词,所述第一属性词为对每个第一名词进行修饰的形容词;根据识别到的第一实体词集合、第一属性词集合、第一语义信息及所述第一问题,构成第一特征向量;将所述第一特征向量输入到预先训练的识别模型中,确定所述第一问题的答复并提供。
由于本发明实施例中根据识别到用户输入的第一问题中的第一实体词集合、第一属性词集合、第一语义信息及所述第一问题,构成第一特征向量;将该第一特征向量输入到预先训练的识别模型中,确定该第一问题的答复并提供,从而提高了智能客服机器人提供答复的准确率,进而提高用户体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1提供的一种基于客服的答复提供方法的流程图;
图2为本发明实施例4提供的一种基于客服的答复提供装置的结构示意图;
图3为本发明实施例4提供的一种训练智能客服机器人中的识别模型的过程示意图。
具体实施方式
下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例1:
图1为本发明实施例提供的一种基于客服的答复提供方法的流程图,所述方法包括:
S101:接收用户输入的第一问题。
用户可以在对应的业务咨询网页页面上的咨询入口,输入想要咨询的第一问题。
S102:按照预设的模式识别规则,识别所述第一问题中包括的第一实体词、第一属性词以及第一语义信息,其中所述第一实体词为所述第一问题中包含的第一名词,所述第一属性词为对每个第一名词进行修饰的形容词。
接收到第一问题后,为了确定该第一问题对应的答复,在本发明实施例中对该第一问题进行分词处理,基于得到的每个分词,进行词性的识别,根据识别出来的每个分词的词性,确定该第一问题中包含的每个名词,将该名词作为实体词,针对每个名词,如果存在对该名词进行修饰的形容词,则将该形容词确定为属性词。因为已经通过分词处理得到该第一问题的每个分词,因此可以基于每个分词,识别该分词的语义信息。
具体地,第一实体词可以是与产品信息相关的名词,如购买的衣服名称,而第一属性词则是修饰第一实体词的形容词,如形容衣服的颜色、大小等的词汇,而第一语义信息可以通过相应的语义处理工具进行处理得到的。
具体的分词处理、词性识别以及语义分析的过程是现有技术,在此不再赘述。
S103:根据识别到的第一实体词集合、第一属性词集合、第一语义信息集合及所述第一问题,构成第一特征向量。
分析得到该第一问题中包含的每个名词,即每个实体词后,将所有实体词构成的集合称为第一实体词集合,将所有属性词构成的集合称为第一属性词集合,将所有的语义信息构成的集合称为第一语义信息集合。
根据得到的第一实体词集合、第一属性词集合、第一语义信息集合以及该第一问题,构成第一特征向量。
具体的,还可以根据预设的每个集合对应的权重值,确定包含权重值和每个集合的第一特征向量。
S104:将所述第一特征向量输入到预先训练的识别模型中,确定所述第一问题的答复并提供。
本发明实施例采用预先训练的识别模型,对上述第一特征向量进行处理,从而完成智能客服问答过程以及答复推理,进而确定该第一问题的答复并提供给用户。
由于本发明实施例中根据识别到用户输入的第一问题中的第一实体词集合、第一属性词集合、第一语义信息及所述第一问题,构成第一特征向量;将该第一特征向量输入到预先训练的识别模型中,确定该第一问题的答复并提供,从而提高了智能客服机器人提供答复的准确率,进而提高用户体验。
实施例2:
为了提高智能客服机器人答复用户咨询的业务问题准确度,基于上述实施例,所述识别模型的训练过程为:
针对训练样本集中的每个第一样本子集,其中每个第一样本子集中包含一个答复,及关于所述答复的每个问题,按照预设的模式识别规则,识别所述第一样本子集中答复及每个问题包括的第二实体词、第二属性词以及第二语义信息;
根据识别到的第二实体词集合、第二属性词集合、第二语义信息以及问题的集合,构成第二特征向量;
根据每个第一样本子集对应的第二特征向量和对应的答复,对所述识别模型进行训练。
所述样本子集中包括以基本数据类型表示的结构化数据、不以基本数据类型表示的非结构化数据,以及采用相应的处理工具解析后得到的半结构化数据,其中,不以基本数据类型表示的非结构化数据具体包括用图片和语音表示的数据。
为了提高智能客服机器人答复用户咨询的业务问题准确度,智能客服机器人中保存了训练样本集,该训练样本集是由研发人员收集并进行归一化整合后的问答数据构成的。其中训练样本集中包含多个样本子集,每个样本子集中包含预先收集的一个答复以及关于所述答复的每个问题,这样便于智能客服机器人可以基于样本子集中的答复及每个问题对识别模型进行训练。
其中,样本子集中包括以基本数据类型表示的结构化数据、用图片和语音表示的非结构化数据,以及采用相应的处理工具解析后得到的半结构化数据。具体的,结构化数据可以是字符型数据、整型数据、浮点型数据,这些数据可以用于存储产品信息、客户信息、企业信息;非结构化数据主要以问答数据中图片、语音、文本数据为主;半结构化数据一般为网页数据,需要借助于浏览器对网页数据进行解析后得到相应的数据,该网页数据例如可以为html数据,或者XML数据等。
为了提高智能客服机器人中识别模型的训练效率,在对识别模块进行训练之前,研发人员需要对收集到的问答数据进行有效地组织、提取、和处理,例如对收集到的问答数据进行分类处理,比如分为结构化数据、非结构化数据、半结构化数据,并将这些数据归一化整合,即异构数据整合,得到整合后的问答数据,也就是说整合后的数据中包括了上述三种类型的数据,这样构建统一的数据表示形式,并应用到识别模型中。
为了对识别模型进行训练,在本发明实施例中,对每一个第一样本子集中的答复及关于该答复的每个问题进行分词处理,基于得到的每个分词,进行词性的识别,根据识别出来的每个分词的词性,确定每一个第一样本子集中答复及每个问题包括的每个名词,将该名词作为实体词,针对每个名词,如果存在对该名词进行修饰的形容词,则将该形容词确定为属性词,由于通过上述的分词处理已经得到每一个第一样本子集中答复及每个问题中的每个分词,因此,可以该每个分词,识别该分词的语义信息。
具体地,按照预设的模式识别规则,识别分析第一样本子集中答复及每个问题包括的第二实体词、第二属性词以及第二语义信息;其中,第二实体词可以是与产品信息相关的名词,而第二属性词则是修饰第二实体词的形容词,而第二语义信息可以通过相应的语义处理工具进行处理得到的。
具体的分词处理、词性识别以及语义分析的过程是现有技术,在此不再赘述。
分析得到第一样本子集中答复及每个问题包括的每个名词,即每个实体词后,将所有实体词构成的集合称为第二实体词集合,将所有属性词构成的集合称为第二属性词集合,将所有的语义信息构成的集合称为第二语义信息集合。
根据得到的第二实体词集合、第二属性词集合、第二语义信息以及每个问题的集合,构成第二特征向量。
具体的,还可以根据预设的每个集合对应的权重值,确定包含权重值和每个集合的第二特征向量。
具体的,在对识别模型进行训练时,针对每个第一样本子集,获取了第二实体词集合、第二属性词集合、第二语义信息以及问题的集合,将每个集合分别与对应的预设的权重值组合,并按照顺序依次排列构成第二特征向量,将每个第二特征向量与对应每个第一样本子集中的答复输入到识别模型中,从而完成对识别模型的训练,具体的公式为:
Q={E:We;K:Wk;S:Ws;R:Wr}
其中,Q为第一样本子集中的答复,E为第二实体词集合,We为第二实体词集合对应的权重值集合,K为第二属性词集合,Wk为第二属性词集合对应的权重值集合,S为第二语义信息集合,Ws为第二语义信息集合对应的权重值集合,R为问题集合,Wr为问题集合对应的权重值集合。
由于本发明实施例中针对训练样本集中的每个第一样本子集,其中每个第一样本子集中包含一个答复,及关于所述答复的每个问题,按照预设的模式识别规则,识别所述第一样本子集中答复及每个问题包括的第二实体词、第二属性词以及第二语义信息;根据识别到的第二实体词集合、第二属性词集合、第二语义信息以及问题的集合,构成第二特征向量;根据每个第一样本子集对应的第二特征向量和对应的答复,对所述识别模型进行训练,这样可以提高智能客服机器人答复用户咨询的业务问题准确度。
本发明实施例还提供了一种基于客服的答复提供的客服***构架,该***构架是由不同的技术组件构成,并将这些技术组件通过容器引擎Docker或容器集群管理***Kubernetes中分布式云端部署方式部署,来实现上述客服问答方法。具体的各个技术组件之间的通信通过各个技术组件上的接口完成,遵循着Docker或Kubernetes的通信规则,由于该过程是现有技术,在此不再赘述。
从基础设施和业务应用模块两大方面来介绍一下关键技术组件的作用:
可以高效地完成数据存储、消息调用等操作的技术组件可以理解为客服***构架的基础设施。例如,键值对存储数据库组件Redis,用于存储每次客服问答过程中如问答缓存Session-cache数据一样的缓存信息、识别模型训练的标记信息如训练锁;文本搜索引擎组件ES,用于每次客服问答过程中的语音信息检索及问答过程中的对话记录检索;分布式应用程序协调服务组件ZooKeeper,用于问答过程中的对话记录的消息队列管理;消息队列模型组件NSQ,用来协助ZooKeeper进行消息队列管理;存储***组件Minio,用于存储富文本数据,主要用来存储识别模型。
针对不同的服务业务进行处理的技术组件可以理解为客服***构架中业务应用模块,主要是用于对用户咨询的业务问题进行相应的答复。例如,浏览器网页更新Web-adapter组件,用于适配网页Web端的消息格式,可以将Web端的用户咨询的问题转化为标准的用户消息格式,也可以将标准的答复转化为Web端的答复数据,其中,用户咨询的问题和答复的消息格式转化是由相应的消息处理的中间技术组件完成的;超文本传输协议客户端Heimdall组件,是用户咨询业务问题过程中产生的消息的整体出入口,提供同步和异步两种对话方式,可以通过符合***架构的约束原则的应用程序接口REST API接收标准格式的用户消息、训练识别模型的消息并返回标准格式的机器人消息,还可以通过回调注册的应用程序接口API发送标准格式的机器人消息实现异步对话。
具体的,在本发明实施例中通过客服机器人提供答复。为了同时为多个用户提供答复,本发明实施例基于多个并行的智能客服机器人Brain可以构成智能客服机器人集合EinBot,其中,每个智能客服机器人对应一个实例集合。这样便于同时给不同的用户咨询的问题提供答复,具体的过程为:
当多个用户通过各自对应的浏览器输入咨询的问题,该浏览器将这些问题发送到服务器,具体的服务器中包含有路由单元,路由单元接收到这些问题后,根据自身保存的各个智能客服机器人Brain的负载信息,即每个智能客服机器人目前解决的问题的数量等信息,通过负载均衡技术分配给与之关联的智能客服机器人集合EinBot中的智能客服机器人,每个接收到分配的问题的智能客服机器人根据实施例1中的方法确定对应问题的答复,并提供给咨询该问题的用户。
例如,若有用户在浏览器上输入第一问题,浏览器将第一问题发送到服务器,服务器中的路由单元接收到该第一问题后,可以根据自身保存的各个智能客服机器人Brain的负载信息,确定负载最小的智能客服机器人,将该第一问题发送给该智能客服机器人,该智能客服机器人根据实施例1中所述的方法确定第一问题对应的答复,并提供给咨询该问题的用户;路由单元还可以根据该第一问题,进行意图识别,从而识别该第一问题对应的目标问题种类,然后根据自身保存的问题种类与智能客服机器人的对应关系,确定所述目标问题种类对应的目标智能客服机器人,将该第一问题发送给该目标智能客服机器人,该目标智能客服机器人根据实施例1中所述的方法确定第一问题对应的答复,并提供给咨询该问题的用户。具体的用于每种问题种类的智能客服机器人也包括多台,路由单元当确定了目标问题种类后,确定的该目标问题种类对应的目标智能客服机器人也可能包括多个,再根据该确定的每个目标智能客服机器人的负载,将该第一问题发送给负载最小的目标智能客服机器人。
客服机器人EinBot,用于针对进行消费的用户咨询业务的内容,进行消息队列管理,根据用户的身份信息,通过相应的路由给提供相应的服务业务咨询的智能客服机器人Brains,同时也可以将智能客服机器人的答复消息提供给用户。
另外,1个智能客服机器人Brain是由1个意图识别模块RouteBot和多个用户消息的最小的处理单元Botlet组成,负责接收用户咨询业务问题并生成相应的机器人消息,同时还可以根据样本训练集生成训练结果,不断优化自己的服务能力,其中,一个Botlet只负责处理一种类型的信息(例如问答、寒暄),并返回处理结果,即RouteBot识别出用户咨询业务问题的类型后,将该问题通过路由分到对应的Botlet进行处理,为了应对不同场景下问答过程,可以根据描述的文件管理信息调节Brain各个Botlet之间的处理顺序;计算组件Actury可以实现问答过程中的数据信息的统计与查询功能。
此外,不仅仅智能客服机器人可以给用户提供该用户咨询的业务问题的答复,该客服***构架中的一些技术组件集合也可以给用户提供该用户咨询的业务问题的答复,也就是客服机器人是包括技术组件集合的,具体地过程为:不同类型的用户可以通过浏览器上对应的访问界面输入咨询的问题,浏览器将这些的问题发送给服务器,服务器中的路由单元接收到这些问题后,可以根据自身保存的各个关于服务业务咨询的技术组件集合的负载信息,以及用户的身份信息,针对每个咨询业务问题的内容,进行消息队列管理,并通过负载均衡技术将这些问题分配给对应的服务业务咨询的技术组件集合,每个技术组件集合根据实施例1中的方法确定自身接收到的问题的答复,并提供给咨询该问题的用户,具体地,技术组件集合中的各个技术组件间通信的过程遵循着Docker或Kubernetes的通信规则,在此不再赘述。
另外,为了提高智能客服机器人的可维护性,降低运维难度和研发成本,客服***架构中还可以添加一些与后期运维、研发有关的技术组件,例如,关系型数据库组件Mysql,用于存储每个智能客服机器人中的语料数据、账号数据、每个智能客服机器人信息、数据统计信息及部分运维数据,该部分运维数据主要指的是实时的事件日志和聚合平台Sentry中的数据及开源的图表可视化***Grafana中的数据;程序异常收集***组件Sentry,用于实现实时异常信息监控,比如利用预先保存的运维管理人员的邮箱号进行异常通知;***监控程序组件Monitor,用于有效的保证了***的高可用性;运维工具集合组件Satools,可以用于对于一定的***故障进行维护,这样使得智能客服机器人可以更适用于缺乏针对智能客服机器人的运维人员的企业;控制台Economist/控制台用户界面Economist-UI组件,用于对智能客服机器人集合中的各个智能客服机器人进行控制,对智能客服机器人集合内部的信息管理、数据管理和统计分析管理等;管理员界面Admin-UI组件,用于提供超级管理员服务,管理用户权限及众多的用户信息等。
本发明实施例提供了基于微服务架构的客服***架构,实现消息中心化管理,高可用性及按需索取,并且应用于智能客服机器人中的客服***,实现智能客服机器人自动学习和处理知识,有效保证了该智能客服机器人的知识学习有效率及知识纯度,为精准客服问答提供了基础。
本发明实施例提供的客服***架构不仅仅可以应用于不同行业的智能客服机器人,还可以应用到其他可用微服务架构的***设计中,是一种具备高可用性和高拓展性的***架构。
实施例3:
为了进一步提高智能客服机器人答复用户咨询的业务问题准确度,在上述实施例的基础上,保存所述第一问题及针对所述第一问题的答复。
按照设定的时间间隔,根据保存的每个第一问题及针对第一问题的答复,确定每个第二样本子集,其中每个第二样本子集中包含一个答复,及关于所述答复的每个第一问题;
针对每个第二样本子集,按照预设的模式识别规则,识别所述第二样本子集中的答复及每个第一问题包括的第三实体词、第三属性词以及第三语义信息;
根据识别到的第三实体词集合、第三属性词集合、第三语义信息以及所述第一问题的集合,构成第三特征向量;
根据每个第二样本子集对应的第三特征向量和答复,对所述识别模型进行训练。
为了进一步提高答复用户咨询的业务问题准确度,智能客服机器人每答复完一次客户咨询的业务问题,都需要对本次业务咨询中咨询的问题以及该问题相应的答复予以保存,定期对问答数据库进行更新,以便于后续对识别模型进行新的训练,进而提高后续答复用户咨询的业务问题准确度。具体地,基于上述实施例,则智能客服机器人保存的是第一问题及针对第一问题的答复。
为了可以持久稳定地利用识别模型对于用户咨询的业务问题进行准确答复,还需要对识别模型定期进行新的训练,不断完善识别模型,以上述实施例中的第一问题及其对应的答复为例,具体的过程为:按照设定的时间间隔,研发人员会保存的每一个第一问题及针对第一问题的答复的数据进行相应的处理,如归一化整合,然后根据处理后的数据确定每一个第二样本子集,每一个第二样本子集均包含一个答复以及关于该答复的每一个第一问题,其中,时间间隔可以根据实际情况进行设置,比如客服访问量多的时候,设定的时间间隔可以稍微长些,客服访问量少的时候,设定的时间间隔可以短些。
当确定了每一个第二样本子集后,可以针对每个第二样本子集,按照预设的模式识别规则,识别所述第二样本子集中的答复及每个第一问题包括的第三实体词、第三属性词以及第三语义信息,该识别过程与上述实施例中的第一实体词、第一属性词以及第一语义信息的识别过程类似,在此不再赘述。
同样,根据识别到的第三实体词集合、第三属性词集合、第三语义信息以及所述第一问题的集合,构成第三特征向量,具体的构成第三特征向量的过程与构成第一特征向量的过程类似,在此不再赘述。同理,根据每个第二样本子集对应的第三特征向量和答复,对所述识别模型进行训练的过程与上述实施例对识别模块进行训练的过程类似,在此不再赘述。
由于本发明实施例中根据保存第一问题及针对第一问题的答复,按照设定的时间间隔,对所述识别模型进行训练,这样定期地完善识别模型,可以进一步提高智能客服机器人答复用户咨询的业务问题准确度。
实施例4:
在上述各个实施例的基础上,图2为本发明实施例提供了一种基于客服的答复提供装置的结构示意图,所述装置包括:
接收模块201,用于接收用户输入的第一问题;
客服模块202,用于按照预设的模式识别规则,识别所述第一问题中包括的第一实体词、第一属性词以及第一语义信息,其中所述第一实体词为所述第一问题中包含的第一名词,所述第一属性词为对每个第一名词进行修饰的形容词;根据识别到的第一实体词集合、第一属性词集合、第一语义信息集合及所述第一问题,构成第一特征向量;将所述第一特征向量输入到预先训练的识别模型中,确定所述第一问题的答复并提供。
进一步地,所述装置还包括:
第一训练模块,用于针对训练样本集中的每个第一样本子集,其中每个第一样本子集中包含一个答复,及关于所述答复的每个问题,按照预设的模式识别规则,识别所述第一样本子集中答复及每个问题包括的第二实体词、第二属性词以及第二语义信息;根据识别到的第二实体词集合、第二属性词集合、第二语义信息以及问题的集合,构成第二特征向量;根据每个第一样本子集对应的第二特征向量和答复,对所述识别模型进行训练。
进一步地,所述装置还包括:
存储模块,用于保存所述第一问题及针对所述第一问题的答复。
进一步地,所述装置还包括:
第二训练模块,用于按照设定的时间间隔,根据保存的每个第一问题及针对第一问题的答复,确定每个第二样本子集,其中每个第二样本子集中包含一个答复,及关于所述答复的每个第一问题;针对每个第二样本子集,按照预设的模式识别规则,识别所述第二样本子集中的答复及每个第一问题包括的第三实体词、第三属性词以及第三语义信息;根据识别到的第三实体词集合、第三属性词集合、第三语义信息以及所述第一问题的集合,构成第三特征向量;根据每个第二样本子集对应的第三特征向量和答复,对所述识别模型进行训练。
进一步地,所述客服模块包括:路由单元和至少两个客服单元,
路由单元,用于根据保存的每个客服单元对应的负载信息,确定负载最小的客服单元,将所述第一问题发送给所述负载最小的客服单元;
每个客服单元,用于按照预设的模式识别规则,识别所述第一问题中包括的第一实体词、第一属性词以及第一语义信息,其中所述第一实体词为所述第一问题中包含的第一名词,所述第一属性词为对每个第一名词进行修饰的形容词;根据识别到的第一实体词集合、第一属性词集合、第一语义信息集合及所述第一问题,构成第一特征向量;将所述第一特征向量输入到预先训练的识别模型中,确定所述第一问题的答复并提供。
进一步地,所述客服模块包括:路由单元和至少两个客服单元,
路由单元,用于根据所述第一问题识别所述第一问题对应的目标问题种类,根据保存的问题种类与客服单元的对应关系,确定所述目标问题种类对应的目标客服单元,将所述第一问题发送给所述目标客服单元;
所述目标客服单元,用于按照预设的模式识别规则,识别所述第一问题中包括的第一实体词、第一属性词以及第一语义信息,其中所述第一实体词为所述第一问题中包含的第一名词,所述第一属性词为对每个第一名词进行修饰的形容词;根据识别到的第一实体词集合、第一属性词集合、第一语义信息集合及所述第一问题,构成第一特征向量;将所述第一特征向量输入到预先训练的识别模型中,确定所述第一问题的答复并提供。
当接收到用户输入的第一问题时,路由单元,可以根据预先保存的每个客服单元对应的负载信息,确定负载最小的客服单元,并将第一问题发送给负载最小的客服单元。该客服单元可以根据实施例1中所述的方法确定该第一问题的答复并提供给该用户;路由单元还可以根据该第一问题,进行意图识别,从而识别出该第一问题对应的目标问题种类,然后根据自身保存的问题种类与客服单元的对应关系,确定该目标问题种类对应的目标客服单元,将该第一问题发送给该目标客服单元,该目标客服单元可以实施例1中所述的方法确定该第一问题的答复并提供给该用户。具体的用于每种问题种类的客服单元也可以包括多个,路由单元当确定了目标问题种类后,确定的该目标问题种类对应的目标客服单元也可能包括多个,再根据该确定的每个目标客服单元的负载,将该第一问题发送给负载最小的目标客服单元。
基于上述各个实施例,图3为本发明实施例提供的一种训练智能客服机器人中的识别模型的过程示意图,如图3所示:
研发人员将保存的数据资料进行分类处理,分为结构化数据、半结构化数据和非结构化数据,针对分类后的数据,智能客服机器人对半结构化数据进行解析抽取半结构化信息,识别非结构化数据中的实体词、属性词,将结构化数据、抽取的半结构化信息、识别的实体词和属性词进行归一化整合,即异构数据整合,得出整合后的数据信息,并从该整合后的数据信息中得到符合标准机器人信息的实体词、属性词、语义信息,以及问题,然后针对整合后的数据进行训练,具体的过程为:将全部的实体词构成实体词集合,将全部属性词构成属性词集合、将全部的语义信息构成语义信息集合,将全部的问题构成问题集合,再根据每个集合对应的权重值,确定包含权重值和每个集合的特征向量,将该特征向量与分类后的数据中的答复输入到识别模型中,从而完成智能客服机器人中识别模型的训练。
由于本发明实施例中客服模块根据识别到用户输入的第一问题中的第一实体词集合、第一属性词集合、第一语义信息及所述第一问题,构成第一特征向量;将该第一特征向量输入到预先训练的识别模型中,确定该第一问题的答复并提供,从而提高了智能客服机器人提供答复的准确率,进而提高用户体验。
对于***/装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者一个操作与另一个实体或者另一个操作区分开来,而不一定要求或者暗示这些实体或者操作之间存在任何这种实际的关系或者顺序。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全应用实施例、或结合应用和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (11)
1.一种基于客服的答复提供方法,其特征在于,所述方法包括:
接收用户输入的第一问题;
按照预设的模式识别规则,识别所述第一问题中包括的第一实体词、第一属性词以及第一语义信息,其中所述第一实体词为所述第一问题中包含的第一名词,所述第一属性词为对每个第一名词进行修饰的形容词;
根据识别到的第一实体词集合、第一属性词集合、第一语义信息集合及所述第一问题,构成第一特征向量;
将所述第一特征向量输入到预先训练的识别模型中,确定所述第一问题的答复并提供。
2.如权利要求1所述的方法,其特征在于,所述识别模型的训练过程为:
针对训练样本集中的每个第一样本子集,其中每个第一样本子集中包含一个答复,及关于所述答复的每个问题,按照预设的模式识别规则,识别所述第一样本子集中答复及每个问题包括的第二实体词、第二属性词以及第二语义信息;
根据识别到的第二实体词集合、第二属性词集合、第二语义信息以及问题的集合,构成第二特征向量;
根据每个第一样本子集对应的第二特征向量和对应的答复,对所述识别模型进行训练。
3.如权利要求2所述的方法,其特征在于,所述样本子集中包括以基本数据类型表示的结构化数据、用图片和语音表示的非结构化数据,以及采用相应的处理工具解析后得到的半结构化数据。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
保存所述第一问题及针对所述第一问题的答复。
5.如权利要求4所述的方法,其特征在于,所述方法还包括:
按照设定的时间间隔,根据保存的每个第一问题及针对第一问题的答复,确定每个第二样本子集,其中每个第二样本子集中包含一个答复,及关于所述答复的每个第一问题;
针对每个第二样本子集,按照预设的模式识别规则,识别所述第二样本子集中的答复及每个第一问题包括的第三实体词、第三属性词以及第三语义信息;
根据识别到的第三实体词集合、第三属性词集合、第三语义信息以及所述第一问题的集合,构成第三特征向量;
根据每个第二样本子集对应的第三特征向量和答复,对所述识别模型进行训练。
6.一种基于客服的答复提供装置,其特征在于,所述装置包括:
接收模块,用于接收用户输入的第一问题;
客服模块,用于按照预设的模式识别规则,识别所述第一问题中包括的第一实体词、第一属性词以及第一语义信息,其中所述第一实体词为所述第一问题中包含的第一名词,所述第一属性词为对每个第一名词进行修饰的形容词;根据识别到的第一实体词集合、第一属性词集合、第一语义信息集合及所述第一问题,构成第一特征向量;将所述第一特征向量输入到预先训练的识别模型中,确定所述第一问题的答复并提供。
7.如权利要求6所述的装置,其特征在于,所述装置还包括:
第一训练模块,用于针对训练样本集中的每个第一样本子集,其中每个第一样本子集中包含一个答复,及关于所述答复的每个问题,按照预设的模式识别规则,识别所述第一样本子集中答复及每个问题包括的第二实体词、第二属性词以及第二语义信息;根据识别到的第二实体词集合、第二属性词集合、第二语义信息以及问题的集合,构成第二特征向量;根据每个第一样本子集对应的第二特征向量和对应的答复,对所述识别模型进行训练。
8.如权利要求6所述的装置,其特征在于,所述装置还包括:
存储模块,用于保存所述第一问题及针对所述第一问题的答复。
9.如权利要求8所述的装置,其特征在于,所述装置还包括:
第二训练模块,用于按照设定的时间间隔,根据保存的每个第一问题及针对第一问题的答复,确定每个第二样本子集,其中每个第二样本子集中包含一个答复,及关于所述答复的每个第一问题;针对每个第二样本子集,按照预设的模式识别规则,识别所述第二样本子集中的答复及每个第一问题包括的第三实体词、第三属性词以及第三语义信息;根据识别到的第三实体词集合、第三属性词集合、第三语义信息以及所述第一问题的集合,构成第三特征向量;根据每个第二样本子集对应的第三特征向量和答复,对所述识别模型进行训练。
10.如权利要求6所述的装置,其特征在于,所述客服模块包括:路由单元和至少两个客服单元,
路由单元,用于根据保存的每个客服单元对应的负载信息,确定负载最小的客服单元,将所述第一问题发送给所述负载最小的客服单元;
每个客服单元,用于按照预设的模式识别规则,识别所述第一问题中包括的第一实体词、第一属性词以及第一语义信息,其中所述第一实体词为所述第一问题中包含的第一名词,所述第一属性词为对每个第一名词进行修饰的形容词;根据识别到的第一实体词集合、第一属性词集合、第一语义信息集合及所述第一问题,构成第一特征向量;将所述第一特征向量输入到预先训练的识别模型中,确定所述第一问题的答复并提供。
11.如权利要求6或10所述的装置,其特征在于,所述客服模块包括:
路由单元和至少两个客服单元,
路由单元,用于根据所述第一问题识别所述第一问题对应的目标问题种类,根据保存的问题种类与客服单元的对应关系,确定所述目标问题种类对应的目标客服单元,将所述第一问题发送给所述目标客服单元;
所述目标客服单元,用于按照预设的模式识别规则,识别所述第一问题中包括的第一实体词、第一属性词以及第一语义信息,其中所述第一实体词为所述第一问题中包含的第一名词,所述第一属性词为对每个第一名词进行修饰的形容词;根据识别到的第一实体词集合、第一属性词集合、第一语义信息集合及所述第一问题,构成第一特征向量;将所述第一特征向量输入到预先训练的识别模型中,确定所述第一问题的答复并提供。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811513766.4A CN111382234A (zh) | 2018-12-11 | 2018-12-11 | 一种基于客服的答复提供方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811513766.4A CN111382234A (zh) | 2018-12-11 | 2018-12-11 | 一种基于客服的答复提供方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111382234A true CN111382234A (zh) | 2020-07-07 |
Family
ID=71219174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811513766.4A Pending CN111382234A (zh) | 2018-12-11 | 2018-12-11 | 一种基于客服的答复提供方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111382234A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598445A (zh) * | 2013-11-01 | 2015-05-06 | 腾讯科技(深圳)有限公司 | 自动问答***和方法 |
US9262406B1 (en) * | 2014-05-07 | 2016-02-16 | Google Inc. | Semantic frame identification with distributed word representations |
CN107301213A (zh) * | 2017-06-09 | 2017-10-27 | 腾讯科技(深圳)有限公司 | 智能问答方法及装置 |
CN108052577A (zh) * | 2017-12-08 | 2018-05-18 | 北京百度网讯科技有限公司 | 一种通用文本内容挖掘方法、装置、服务器及存储介质 |
CN108632137A (zh) * | 2018-03-26 | 2018-10-09 | 平安科技(深圳)有限公司 | 应答模型训练方法、智能聊天方法、装置、设备及介质 |
-
2018
- 2018-12-11 CN CN201811513766.4A patent/CN111382234A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598445A (zh) * | 2013-11-01 | 2015-05-06 | 腾讯科技(深圳)有限公司 | 自动问答***和方法 |
US9262406B1 (en) * | 2014-05-07 | 2016-02-16 | Google Inc. | Semantic frame identification with distributed word representations |
CN107301213A (zh) * | 2017-06-09 | 2017-10-27 | 腾讯科技(深圳)有限公司 | 智能问答方法及装置 |
CN108052577A (zh) * | 2017-12-08 | 2018-05-18 | 北京百度网讯科技有限公司 | 一种通用文本内容挖掘方法、装置、服务器及存储介质 |
CN108632137A (zh) * | 2018-03-26 | 2018-10-09 | 平安科技(深圳)有限公司 | 应答模型训练方法、智能聊天方法、装置、设备及介质 |
Non-Patent Citations (2)
Title |
---|
李德毅等: "《中国科协新一代信息技术系列丛书 人工智能导论》", 31 August 2018, 北京:中国科学技术出版社, pages: 191 - 192 * |
陈明志等: "《管理信息***》", 31 July 2009, 武汉:华中科技大学出版社, pages: 201 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11004013B2 (en) | Training of chatbots from corpus of human-to-human chats | |
US20190272269A1 (en) | Method and system of classification in a natural language user interface | |
US11223723B2 (en) | Call center system having reduced communication latency | |
US12010268B2 (en) | Partial automation of text chat conversations | |
KR20180022762A (ko) | 실시간 답변 메시지 생성을 이용한 고객 상담 서비스 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 | |
KR20170137419A (ko) | 실시간 답변 메시지 생성을 이용한 고객 상담 서비스 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 | |
CN107784033B (zh) | 一种基于会话进行推荐的方法和装置 | |
CN108268450B (zh) | 用于生成信息的方法和装置 | |
WO2012011092A1 (en) | System, method and device for intelligent textual conversation system | |
US10614377B2 (en) | Method and system for using existing models in connection with new model development | |
US20190354557A1 (en) | System and Method For Providing Intelligent Customer Service | |
CN113076423A (zh) | 数据处理方法及装置、数据查询方法及装置 | |
CN109766451A (zh) | 一种云计算平台及其调度、数据分析方法 | |
CN113505606B (zh) | 一种培训信息获取方法、装置、电子设备及存储介质 | |
CN111523328A (zh) | 一种智能客服语义处理方法 | |
CN113987151A (zh) | 智能客服回复方法及装置 | |
Aattouri et al. | Modeling of an artificial intelligence based enterprise callbot with natural language processing and machine learning algorithms | |
US20210406973A1 (en) | Intelligent inquiry resolution control system | |
CN116881730A (zh) | 基于语境的聊天场景匹配***、方法、设备及存储介质 | |
CN111382234A (zh) | 一种基于客服的答复提供方法及装置 | |
CN112287104A (zh) | 一种自然语言处理方法和装置 | |
Koch et al. | A reference architecture for on-premises chatbots in banks and public institutions | |
Shayegan et al. | A lexicon weighted sentiment analysis approach on Twitter | |
CN116561288B (zh) | 事件查询方法、装置、计算机设备、存储介质及程序产品 | |
CN114818740B (zh) | 一种基于领域知识图谱的人机协同方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |