用于客服派单的方法、装置和计算设备
技术领域
本说明书的实施例涉及互联网技术领域,并且具体地,涉及用于客服派单的方法、装置和计算设备。
背景技术
目前针对各种不同的业务都有专门的客服工作。客服工作主要是对用户所提出的问题或需求等进行回应。传统的客服工作是由人工来完成。为了降低客服工作的人工成本,现有技术中已提出了智能客服***。
用户可以通过电话或在线的方式来向智能客服***发起客服请求。在接收到用户的请求之后,该***可以将该用户分配给合适的客服技能组来对用户进行回应。那么,如何确定合适的客服技能组成为需要关注的问题之一。
发明内容
考虑到现有技术的上述问题,本说明书的实施例提供了用于客服派单的方法、装置和计算设备。
一方面,本说明书的实施例提供了一种用于客服派单的方法,包括:获取发起客服请求的用户的综合信息,其中,所述综合信息至少包括用于描述所述用户的问题的文本信息;利用客服派单模型对所述综合信息进行处理,以确定所述客服请求对应的客服技能组;其中,所述客服派单模型至少包括M个文本预处理工具和文本处理模块,M为正整数,所述M个文本预处理工具分别用于对所述文本信息进行预处理,以得到M个中间输出结果,所述M个中间输出结果中的每一者包括由相应的文本预处理工具生成的隐藏层向量,所述文本处理模块用于对文本输入向量进行处理,以得到用于确定所述客服技能组的文本特征向量,其中,所述文本输入向量是基于与所述文本信息对应的词向量和所述M个中间输出结果来得到的。
另一方面,本说明书的实施例提供了一种用于客服派单的装置,包括:获取单元,用于获取发起客服请求的用户的综合信息,其中,所述综合信息至少包括用于描述所述用户的问题的文本信息;确定单元,用于利用客服派单模型对所述综合信息进行处理,以确定所述客服请求对应的客服技能组;其中,所述客服派单模型至少包括M个文本预处理工具和文本处理模块,M为正整数,所述M个文本预处理工具分别用于对所述文本信息进行预处理,以得到M个中间输出结果,所述M个中间输出结果中的每一者包括由相应的文本预处理工具生成的隐藏层向量,所述文本处理模块用于对文本输入向量进行处理,以得到用于确定所述客服技能组的文本特征向量,其中,所述文本输入向量是基于与所述文本信息对应的词向量和所述M个中间输出结果来得到的。
另一方面,本说明书的实施例提供了一种计算设备,包括:至少一个处理器;与所述至少一个处理器进行通信的存储器,其上存储有可执行指令,所述可执行指令在被所述至少一个处理器执行时使得所述至少一个处理器实现上述方法。
在该技术方案中,由于文本输入向量是基于与文本信息对应的词向量和文本预处理工具的中间输出结果得到的,而文本预处理工具的中间输出结果与文本预处理工具的最终输出结果相比能够保留更为完整的信息,所以对文本输入向量进行处理得到的文本特征向量也能够保留更为完整的信息,这样,基于文本特性向量确定的客服技能组也将更为匹配用户的需求。另外,在该技术方案中,由于将文本预处理工具整合在客服派单模型中,而非将其分开运行,从而能够提高响应速度。由此,能够极大地改善用户对客服响应的体验。
附图说明
通过结合附图对本说明书的实施例的更详细的描述,本说明书的实施例的上述以及其它目的、特征和优势将变得更加明显,其中,在本说明书的实施例中,相同的附图标记通常指代相同的元素。
图1是根据一个实施例的客服派单模型的示意性结构图。
图2是根据一个实施例的用于客服派单的方法的示意性流程图。
图3是根据一个实施例的用于客服派单的装置的示意性框图。
图4是根据一个实施例的用于客服派单的计算设备的硬件结构图。
具体实施方式
现在将参考各实施例讨论本文描述的主题。应当理解的是,讨论这些实施例仅是为了使得本领域技术人员能够更好地理解并且实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离权利要求书的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个实施例可以根据需要,省略、替换或者添加各种过程或组件。
目前,为了有效地提供客户服务以及降低人工成本,已经提出了智能客服***。用户可以通过电话或在线的方式来向智能客服***发起客服请求。在接收到用户的客服请求之后,智能客服***可以确定能够对用户的请求进行响应的客服技能组。可见,实现智能客服***的关键点之一是如何确定匹配的客服技能组。
对此,本说明书的实施例提供了一种用于客服派单的技术方案。在该技术方案中,可以获取发起客服请求的用户的综合信息。该综合信息可以至少包括用于描述该用户提出的问题的文本信息。然后,可以利用客服派单模型对综合信息进行处理,来确定该客服请求对应的客服技能组。
客服派单模型可以至少包括M个文本预处理工具和文本处理模块,其中M可以为正整数。
每个文本预处理工具可以对文本信息进行预处理,以得到中间输出结果。中间输出结果可以包括隐藏层向量。
基于中间输出结果和文本信息对应的词向量,可以得到文本输入向量。文本处理模块可以对文本输入向量进行处理,得到文本特征向量。之后,可以至少基于文本特征向量,来对客服请求进行分类,从而确定相应的客服技能组。
在该技术方案中,由于文本输入向量是基于与文本信息对应的词向量和文本预处理工具的中间输出结果得到的,而文本预处理工具的中间输出结果与文本预处理工具的最终输出结果相比能够保留更为完整的信息,所以对文本输入向量进行处理得到的文本特征向量也能够保留更为完整的信息,这样,基于文本特性向量确定的客服技能组也将更为匹配用户的需求。
另外,在该技术方案中,由于将文本预处理工具整合在客服派单模型中,而非将其分开运行,从而能够提高响应速度。由此,能够极大地改善用户对客服响应的体验。
下面将结合具体实施例来对本说明书的技术方案进行描述。首先,结合图1描述了客服派单模型的各个组成部分以及各个组成部分的功能。
图1是根据一个实施例的客服派单模型的示意性结构图。
如图1所示,客服派单模型100至少可以包括文本处理模块110和M个文本预处理工具。
例如,M个文本预处理工具可以包括以下各项中的至少一项:命名实体识别(NamedEntity Recognition,NER)工具、词性标注(Part-Of-Speech tagging,POS tagging)(在本文中简写为POS)工具、句法分析器。例如,句法分析器可以包括依存句法分析器(Dependency Parser)或者语法分析器(Syntactic Parser)。此外,根据具体应用、实际需求等,M个文本预处理工具还可以包括本领域中任何其它适用的工具,本文对此不作限定。
此处,为了便于说明,在图1中仅示出了NER工具120a和POS工具120b。
在用户发起客服请求时,可以获得用户的综合信息,并且可以将该综合信息提供给客服派单模型100。例如,综合信息至少可以包括用于描述用户提出的问题的文本信息。
M个文本预处理工具可以对文本信息进行预处理。例如,M个文本预处理工具可以并行地对文本信息进行处理,从而能够节省处理时间,提高整个客服派单模型的响应速度。在进行预处理之后,可以获得每个文本预处理工具的中间输出结果。中间输出结果可以包括隐藏层向量。
例如,NER工具120a可以采用长短期记忆(Long Short Term Memory,LSTM)模型、双向LSTM模型、循环神经网络(Recurrent Neural Network,RNN)、门控循环单元(GatedRecurrent Unit,GRU)等各种适用的算法模型,来对文本信息进行处理,从而可以得到中间输出结果。比如,在NER工具120a采用上述算法模型中的任一种对文本信息进行处理时,可以得到多个隐藏状态向量,这些隐藏状态向量即为中间输出结果。
POS工具120b可以采用LSTM模型、双向LSTM模型、RNN、GRU等各种适用的算法模型来对文本信息进行处理,从而可以得到中间输出结果。比如,在POS工具120b采用上述算法模型中的任一种对文本信息进行处理时,可以得到多个隐藏状态向量,这些隐藏状态向量即为中间输出结果。
另外,客服派单模型还可以包括嵌入(Embedding)层130。在嵌入层130处,可以将文本信息转换为词向量。此外,各个文本预处理工具可以将中间输出结果提供给嵌入层130。在嵌入层130处,可以将各个文本预处理工具的中间输出结果中包括的隐藏层向量和词向量进行链接,从而形成文本输入向量。此处,可以采用本领域中任何适用的算法来将隐藏层向量和词向量进行链接。
文本处理模块110可以对文本输入向量进行处理,从而得到文本特征向量。由此,文本特征向量可以被用于确定合适的客服技能组。
从上述可以看出,本说明书中的客服派单模型100实际上是整合了至少一个文本预处理工具的模型。
在现有的一些实现方式中,文本预处理工具与派单模型是分开运行的。比如,先以流水线(pipeline)的方式运行NER工具和POS工具,然后再将这两个工具的最终输出结果作为派单模型的输入,由派单模型进行处理。由于每个工具都会消耗一定的时间,这样会造成派单模型的响应速度受到限制。此外,文本预处理工具的最终输出结果是经过决策的结果,所以可能会丢失一些中间信息,这样,通过派单模型所确定的客服技能组对于用户而言可能不太合适。
相比而言,客服派单模型100将至少一个文本预处理工具整合在一起运行,从而能够有效地提高响应速度。此外,客服派单模型100利用的是文本预处理工具的中间输出结果,而中间输出结果与最终输出结果相比能够保留更为完整的信息,这样通过客服派单模型100确定的客服技能组也将更为匹配用户的需求,从而能够改善用户体验。
在一个实施例中,文本处理模块110可以包括第一处理层、第二处理层和第三处理层。这三个处理层可以分别对文本输入向量进行处理。
例如,第一处理层可以采用卷积神经网络(Convolutional Neural Network,CNN)。第二处理层可以采用深度神经网络(Deep Neural Network,DNN)。第三处理层可以采用以下各项中的一项:LSTM模型、RNN或GRU。
在一些情况下,用户可能并不喜欢对着机器描述问题,或者可能并不清楚自己的问题重点,这样导致得到的文本信息可能并不够准确。因此,为了确定与用户需求更为匹配的客服技能组,可以将其它信息考虑进来。例如,上述用户的综合信息还可以包括用户的因子信息和用户的行为轨迹信息。
例如,因子信息可以包括彼此之间不具有时间先后顺序的用户特征。比如,因子信息可以包括:用户账号绑定的银行卡数量、用户的订单状态信息、用户最近是否有提现操作、用户最近是否使用过客户服务、本月是否还清信用借款等等。因子信息可以看作离散数据。
行为轨迹信息可以包括具有时间先后顺序的连续行为的信息。比如,行为轨迹信息可以包括用户对某个手机应用的浏览轨迹、远程调用接口行为等等。行为轨迹信息可以看作序列数据。
相应地,客服派单模型100还可以包括因子处理模块140。因子处理模块140可以对用户的因子信息进行处理,以得到因子特征向量。例如,因子处理模块140可以采用DNN来处理因子信息。
在具体实现时,客服派单模型100还可以包括嵌入层170。嵌入层170可以将因子信息转换为与因子信息对应的向量,然后可以将得到的向量提供给因子处理模块140,以便因子处理模块140进行处理得到因子特征向量。
此外,客服派单模型100还可以包括行为轨迹处理模块150。行为轨迹处理模块150可以对用户的行为轨迹信息进行处理,以得到轨迹特征向量。例如,行为轨迹处理模块150可以采用LSTM模型、RNN或GRU等适用的算法模型来处理行为轨迹信息。
在具体实现时,客服派单模型100还可以包括嵌入层180。嵌入层180可以将行为轨迹信息转换为与行为轨迹信息相对应的向量,然后可以将得到的向量提供给行为轨迹处理模块150,以便行为轨迹处理模块150进行处理得到轨迹特征向量。
此外,客服派单模型100还可以包括分类预测模块160。分类预测模块160可以基于文本特征向量、因子特征向量和轨迹特征向量,来确定要对用户的客服请求进行响应的客服技能组。
在一些情况下,用户可能在客服请求中提出多个问题,由此可能需要多个客服技能组来回应用户的所有问题。因此,分类预测模块160可以确定多个客服技能组。可见,客服派单模型100可以是多模态多分类的模型,从而能够高效地解决智能派单问题。
在一个实施例中,分类预测模块160可以对文本特征向量、因子特征向量和轨迹特征向量进行合并或链接等操作。
之后,分类预测模块160可以基于经合并或链接的向量来确定合适的客服技能组。比如,分类预测模块160可以对经合并或链接的向量进行Softmax处理,来确定各个客服技能组的概率。然后,可以选择概率最高的客服技能组。或者,可以按照概率从高到低将客服技能组进行排名,并且选择前N个客服技能组。这可以根据实际需求或应用场景来设定,本文对此不作限定。
应当理解的是,客服技能组可以是根据实际需求来预先设定的。例如,客服技能组可以包括网商银行组、支付宝应用组、理财组等等。
应当理解的是,在具体实现时,客服派单模型100可以是基于历史客服数据训练得到的。在训练时,用于训练文本预处理工具的数据和用于训练客服派单模型100的各个模块的数据是不同的,所以可以先完成对文本预处理工具的训练。例如,可以通过对历史文本信息进行标注(比如,进行实体标注和词性标注)得到训练数据,通过训练数据来对NER工具和POS工具进行训练。
然后,基于训练完成的文本预处理工具的中间输出结果和历史文本信息(比如,将二者的向量链接在一起)来训练文本处理模块。此外,可以基于历史因子信息来训练因子处理模块,以及可以基于历史行为轨迹信息来训练行为轨迹处理模块。之后,分类预测模块可以结合各个模块的训练结果来完成整个客服派单模型的训练。
图2是根据一个实施例的用于客服派单的方法的示意性流程图。
如图2所示,在步骤202中,可以获取发起客服请求的用户的综合信息。该综合信息至少可以包括用于描述用户的问题的文本信息。
在步骤204中,可以利用客服派单模型(例如,上述客服派单模型100)对综合信息进行处理,以确定客服请求对应的客服技能组。
客服派单模型至少可以包括M个文本预处理工具和文本处理模块,M为正整数。
M个文本预处理工具可以分别用于对文本信息进行预处理,以得到M个中间输出结果,M个中间输出结果中的每一者包括由相应的文本预处理工具生成的隐藏层向量。
文本处理模块可以用于对文本输入向量进行处理,以得到用于确定客服技能组的文本特征向量。文本输入向量可以是基于与文本信息对应的词向量和M个中间输出结果来得到的。
在该技术方案中,由于文本输入向量是基于与文本信息对应的词向量和文本预处理工具的中间输出结果得到的,而文本预处理工具的中间输出结果与文本预处理工具的最终输出结果相比能够保留更为完整的信息,所以对文本输入向量进行处理得到的文本特征向量也能够保留更为完整的信息,这样,基于文本特性向量确定的客服技能组也将更为匹配用户的需求。另外,在该技术方案中,由于在客服派单模型中整合了文本预处理工具,而非将其分开运行,从而能够提高响应速度。由此,能够极大地改善用户对客服响应的体验。
在一个实施例中,用户可以通过电话或在线的方式来发起客服请求。例如,用户可以在电话中描述其问题,在这种情况下,上述文本信息可以是通过将用户的语音转化为文本而得到的。再例如,用户可以访问在线客服的页面,通过输入文字来描述其问题,在这种情况下,上述文本信息可以是根据用户输入的文字得到的。
在某些情况下,在用户拨通电话或访问在线客服页面时,可以首先通过若干轮机器对话来分析用户的意图,从而形成上述文本信息。比如,用户可以通过回答“是”或“否”、或者补充部分描述,来与机器对话。可以基于用户的答案进行分析,来形成上述文本信息。
在一个实施例中,客服派单模型可以包括嵌入层。在嵌入层处,文本信息被处理为词向量,并且词向量与M个中间输出结果中的隐藏层向量被链接在一起,从而得到文本输入向量。在该实施例中,由于文本预处理工具的隐藏层向量能够保留更为完整的信息,这样通过将文本信息的词向量和隐藏层向量链接在一起形成文本输入向量,有助于提升客服技能组的分类预测结果的准确性。
在一个实施例中,M个文本预处理工具可以包括以下各项中的至少一项:NER工具、POS工具、句法分析器。在该实施例中,可以根据实际需求来灵活地添加或删除客服派单模型中的文本预处理工具,从而能够提升客服派单模型的适用范围。
在一个实施例中,M个文本预处理工具可以并行地对文本信息进行预处理。这样,能够有效地提升整个客服派单模型的响应速度。
在一个实施例中,文本处理模块可以包括对文本输入向量进行处理的第一处理层、第二处理层和第三处理层。
第一处理层可以采用CNN。第二处理层可以采用DNN。第三处理层可以采用以下各项中的一项:LSTM模型、RNN、GRU。
可见,通过多个处理层来对文本输入向量进行处理,能够提升整个模型的预测准确性。
在一个实施例中,如上所述,用户的综合信息还可以包括因子信息和行为轨迹信息。
例如,在用户发起客服请求时,可以基于客服请求来获得用户的身份或相关标识信息。比如,用户在拨通电话时,可以根据用户使用的电话号码来确定用户的身份。比如,用户在访问在线客服的页面时,可以根据用户使用的账号来确定用户的身份。
这样,可以基于用户的身份或相关标识信息来获得因子信息和行为轨迹信息。比如,可以从存储用户信息的服务器或数据库来获得这样的信息。
客服派单模块还可以包括:因子处理模块、行为轨迹处理模块、分类预测模块;因子处理模块可以用于对因子信息进行处理,以得到因子特征向量;行为轨迹处理模块可以用于对行为轨迹信息进行处理,以得到轨迹特征向量;分类预测模块可以用于基于文本特征向量、因子特征向量和轨迹特征向量,来确定客服技能组。
这样,通过结合文本信息、因子信息和行为轨迹信息等多维度的信息,能够高效且准确地确定相匹配的客服技能组,从而极大地改善用户体验。
在一个实施例中,因子处理模块可以采用DNN,行为轨迹处理模块可以采用LSTM模型、RNN和GRU中的一者。
另外,还可以在文本处理模块、因子处理模块和行为轨迹处理模型中的一者或多者中进一步并入注意力(Attention)机制,有助于提升整个客服派单模型的预测效果。
图3是根据一个实施例的用于客服派单的装置的示意性框图。
如图3所示,装置300可以包括获取单元302和确定单元304。
获取单元302可以获取发起客服请求的用户的综合信息,其中,综合信息至少包括用于描述用户的问题的文本信息。确定单元304可以利用客服派单模型对综合信息进行处理,以确定客服请求对应的客服技能组。
客服派单模型至少可以包括M个文本预处理工具和文本处理模块,M为正整数。M个文本预处理工具可以分别用于对文本信息进行预处理,以得到M个中间输出结果,M个中间输出结果中的每一者包括由相应的文本预处理工具生成的隐藏层向量。文本处理模块可以用于对文本输入向量进行处理,以得到用于确定客服技能组的文本特征向量,其中,文本输入向量是基于与文本信息对应的词向量和M个中间输出结果来得到的。
在该技术方案中,由于文本输入向量是基于与文本信息对应的词向量和文本预处理工具的中间输出结果得到的,而文本预处理工具的中间输出结果与文本预处理工具的最终输出结果相比能够保留更为完整的信息,所以对文本输入向量进行处理得到的文本特征向量也能够保留更为完整的信息,这样,基于文本特性向量确定的客服技能组也将更为匹配用户的需求。
另外,在该技术方案中,由于将文本预处理工具整合在客服派单模型中,而非将其分开运行,从而能够提高响应速度。由此,能够极大地改善用户对客服响应的体验。
在一个实施例中,客服派单模型可以包括嵌入层。在嵌入层处,文本信息可以被处理为词向量,并且词向量与M个中间输出结果中的隐藏层向量可以被链接在一起,从而得到文本输入向量。
在另一实施例中,M个文本预处理工具可以包括以下各项中的至少一项:命名实体识别工具、词性标注工具、句法分析器。
在另一实施例中,M个文本预处理工具可以并行地对文本信息进行预处理。
在另一实施例中,文本处理模块可以包括分别对文本输入向量进行处理的第一处理层、第二处理层和第三处理层。
第一处理层可以采用CNN。第二处理层可以采用DNN。第三处理层可以采用以下各项中的一项:LSTM模型、RNN、GRU。
在另一实施例中,综合信息还可以包括用户的因子信息和用户的行为轨迹信息。
客服派单模型还可以包括:因子处理模块、行为轨迹处理模块、分类预测模块。
因子处理模块可以用于对因子信息进行处理,以得到因子特征向量。行为轨迹处理模块可以用于对行为轨迹信息进行处理,以得到轨迹特征向量。分类预测模块可以用于基于文本特征向量、因子特征向量和轨迹特征向量,来确定客服技能组。
在另一实施例中,因子处理模块可以采用DNN。行为轨迹处理模块可以采用以下各项中的一项:LSTM模型、RNN、GRU。
装置300的各个单元可以执行图1至2的实施例中的相应过程,因此,为了描述的简洁,装置300的各个单元的具体操作和功能此处不再赘述。
上述装置300可以采用硬件实现,也可以采用软件实现,或者可以通过软硬件的组合来实现。例如,装置300在采用软件实现时,其可以通过其所在设备的处理器将存储器(比如非易失性存储器)中对应的可执行指令读取到内存中运行来形成。
图4是根据一个实施例的用于客服派单的计算设备的硬件结构图。如图4所示,计算设备400可以包括至少一个处理器402、存储器404、内存406和通信接口408,并且至少一个处理器402、存储器404、内存406和通信接口408经由总线410连接在一起。至少一个处理器402执行在存储器404中存储或编码的至少一个可执行指令(即,上述以软件形式实现的元素)。
在一个实施例中,在存储器404中存储的可执行指令在被至少一个处理器402执行时,使得计算设备实现以上结合图1-2描述的各种过程。
计算设备400可以采用本领域任何适用的形式来实现,例如,其包括但不限于台式计算机、膝上型计算机、智能电话、平板计算机、消费电子设备、可穿戴智能设备等等。
本说明书的实施例还提供了一种机器可读存储介质。该机器可读存储介质可以存储有可执行指令,可执行指令在被机器执行时使得机器实现上面参照图1-2描述的实施例的具体过程。
例如,机器可读存储介质可以包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、电可擦除可编程只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、静态随机存取存储器(Static Random Access Memory,SRAM)、硬盘、闪存等等。
应当理解的是,本说明书中的各个实施例均采用递进的方式来描述,各个实施例之间相同或相似的部分相互参见即可,每个实施例重点说明的都是与其它实施例的不同之处。例如,对于上述关于装置的实施例、关于计算设备的实施例以及关于机器可读存储介质的实施例而言,由于它们基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上文对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
应当理解的是,对于本领域普通技术人员来说,对本说明书中的实施例进行的各种修改将是显而易见的,并且可以在不脱离权利要求书的保护范围的情况下,将本文所定义的一般性原理应用于其它变型。