机器人客服转人工客服的方法和装置
技术领域
本说明书涉及数据处理技术领域,尤其涉及一种机器人客服转人工客服的方法和装置。
背景技术
随着互联网的发展,基于人工智能技术的虚拟机器人在企业用户服务领域的应用越来越广泛。机器人客服不需要休息,可以更加快速和标准化的响应用户的问题,以语音对话或文字聊天的形式与用户进行沟通,将人工客服从大量重复性问答中解放出来。
对一些非常规的用户问题,机器人客服往往难以给出令用户满意的答复。目前客服中心最为常用的架构是机器人客服与人工客服并存,缺省由机器人客服先接待用户,当机器人客服不解决用户的问题时,转接人工客服。出人工点(即以人工客服代替机器人客服为用户服务的时点)是否适当对客服中心的运营效率和用户的满意度都有重要的影响。
发明内容
有鉴于此,本说明书提供一种机器人客服转人工客服的方法,包括:
从机器人客服与用户的至少一轮会话中获取会话特征;
获取用户的状态特征;
将所述会话特征和状态特征输入信心分评估模型,得到当前信心分评估值;所述信心分评估模型为机器学习模型,采用标记有出人工点的机器人客服与用户的会话样本、以及用户的状态特征样本进行训练;
在当前信心分评估值满足预定出人工条件时,将用户转接人工客服。
本说明书还提供了一种机器人客服转人工客服的装置,包括:
会话特征获取单元,用于从机器人客服与用户的至少一轮会话中获取会话特征;
状态特征获取单元,用于获取用户的状态特征;
信心分评估单元,用于将所述会话特征和状态特征输入信心分评估模型,得到当前信心分评估值;所述信心分评估模型为机器学习模型,采用标记有出人工点的机器人客服与用户的会话样本、以及用户的状态特征样本进行训练;
转接判断单元,用于在当前信心分评估值满足预定出人工条件时,将用户转接人工客服。
本说明书提供的一种计算机设备,包括:存储器和处理器;所述存储器上存储有可由处理器运行的计算机程序;所述处理器运行所述计算机程序时,执行上述机器人客服转人工客服的方法所述的步骤。
本说明书提供的一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时,执行上述机器人客服转人工客服的方法所述的步骤。
由以上技术方案可见,本说明书的实施例中,以从机器人与用户的会话中获取的会话特征和用户的状态特征作为信心分评估机器学习模型的输入,得到当前信心分评估值,并根据当前信心分评估值来判断是否需要转接人工客服,由于用户的状态特征常常能够体现其具体需求和迫切程度,应用本说明书的实施例后可以提高出人工点的准确性,在提升客服中心服务效率的同时使用户对服务更加满意。
附图说明
图1是本说明书实施例中一种机器人客服转人工客服的方法的流程图;
图2是本说明书应用示例中一种Wide and Deep模型的结构示意图;
图3是本说明书应用示例中一次客户服务的处理流程图;
图4是运行本说明书实施例的设备的一种硬件结构图;
图5是本说明书实施例中一种机器人客服转人工客服的装置的逻辑结构图。
具体实施方式
在用户接受机器人客服服务的过程中,用户与机器人客服的交互过程能够体现机器人客服的服务效果。例如,如果用户在交互中重复着同样的问题,或者表达了不满情绪,通常意味着机器人客服对用户问题的解决能力欠佳,需要人工客服处理。因此,用户与机器人客服的会话通常会被用来作为判断是否需要转接人工客服的依据。
另一方面,用户的自身因素也会影响对人工客户的需求程度。例如,账户被盗的用户通常都有较强的人工客服需求,而查询账单的用户一般有更好的耐心与机器人客服沟通。此外,不同年龄、职业、教育背景的用户,对机器人客服的接受度也不尽相同,青年用户能较快理解机器人客服的回答,而老年用户常常需要人工客服的详细指导。
本说明书的实施例提出一种新的机器人客服转人工客服的方法,采用用户的状态特征来描述用户的自身因素,利用以机器人客服与用户会话中提取的会话特征和用户的状态特征训练完成的信心分评估模型,得到当前信心分评估值,在当前信心分评估值满足预定出人工条件时转接人工客服,由于信心分评估模型不仅基于机器人客服与用户的会话过程,并且基于用户状态特征体现的用户对人工客服的需求程度和迫切程度来给出当前信心分评估值,本说明书的实施例能够对出人工点给出更加准确的判断,不仅能够提高客服中心的服务效率,而且还能够提高用户对服务的满意程度。
本说明书的实施例可以运行在任何具有计算和存储能力的设备上,如手机、平板电脑、PC(Personal Computer,个人电脑)、笔记本、服务器等设备;还可以由运行在两个或两个以上设备的逻辑节点来实现本说明书实施例中的各项功能。
本说明书的实施例中,采用从机器人客服与用户的会话中提取的会话特征、和用户的状态特征来建立机器学习模型,本说明书中称之为信心分评估模型。其中,从机器人客服与用户的会话中提取的会话特征可以是以机器人客服与用户的会话为基础,采用NLP(Natural Language Processing,自然语言处理)方法能够获取的任何特征,即NLP特征。具体而言,可以是用户提问与机器人回答的关联度、问答轮数、答案类型(机器人客服的答案是陈述还是提问、答案是具体问题的答案还是兜底答案等等)、答案重复次数、用户是否提出换人工、用户是否在解释自己的问题等特征中的任意个数。会话特征的确定和从会话中获取会话特征的具体方式均可参照现有技术实现,不再赘述。
除与机器人客服的会话以外,其他能够体现用户当前对人工客服的需求程度以及解决问题的迫切程度的用户信息都可以用来作为用户的状态特征,本说明书的实施例对具体的状态特征以及状态特征的数量均不做限定。以下举例说明。
第一个例子:用户的行为记录特征。用户的行为记录特征包括用户在预定时间段内对客服中心咨询服务范围内所有产品的访问记录、和/或功能使用记录等。例如,可以是过去72小时内在某个App(应用程序)内打开哪些页面、进行哪些功能操作等。用户的行为记录特征反映了短期内用户对被咨询产品的使用情况;如果某个用户在该时间段内频繁使用客服功能,并且查询了同一个知识点,那么该用户很可能遇到了机器人客服解决不了的问题,需要人工服务;如果某个用户尝试了某个功能操作很多遍,该用户对人工客服有的需求往往更为迫切。
第二个例子:用户的业务状态特征。用户的业务状态特征体现了用户在被咨询产品上所开设账户的信息,可以包括用户账户的业务开通状态、账户认证状态、账户登录状态、和/或账户异常状态等。用户的业务状态特征常常能够体现用户解决问题的迫切程度,如果用户账户处在“被冻结”(一种账户异常状态)、“异地登录”(一种账户登录状态)等状态时,用户很可能遇到了被盗被骗等问题,对人工客服会有很迫切的需求。
第三个例子:用户的身份信息特征。用户的身份信息特征是用户作为自然人的信息,可以包括用户的性别、年龄、常驻地域、和/或教育程度等。不同身份信息特征的用户对机器人客服的接受程度通常不同,如年轻的用户、教育程度高的用户更习惯机器人客服的问答模式,年长的用户、教育程度较低的用户对人工客服更加偏爱。
如前所述,信心分评估模型的输入包括从机器人客服与用户的会话中获取会话特征、以及用户的状态特征,其输出包括信心分评估值。信心分评估模型采用标记有出人工点的机器人客服与用户的会话样本、以及用户的状态特征样本进行训练,其中,出人工点是在与用户的会话过程中,以人工客服代替机器人客服的适当时点。在训练信心分评估模型时,可以在会话样本中标记了出人工点和会话特征后输入信心分评估模型进行训练;也可以只在会话样本中标记出人工点,由计算机程序自动对会话样本进行NLP处理后得到会话特征,再输入信心分评估模型进行训练。
信心分评估模型所采用的机器学习算法可以根据实际应用场景的特点来选择,不做限定。信心分评估模型可以是基于支持向量机的机器学习模型,如SVC(Support VectorMachine,支持向量机)等;可以是基于树型的机器学习模型,如GBDT(Gradient BoostingDecision Tree,梯度提升决策树)等;可以是线性模型,如LR(Logistic Regression,逻辑回归)等;也可以是神经网络模型,如DNN(Deep Neural Networks,深度神经网络)、RNN(Recurrent Neural Networks,循环神经网络)、CNN(Convolutional Neural Networks,卷积神经网络)等。
在一种实现方式中,采用Wide and Deep(深度和广度)模型来建立信心分评估模型。Wide and Deep模型包括线性子模型和深度神经网络子模型,采用将深度神经网络子模型与浅层线性子模型相结合的训练模式。通过结合线性子模型的记忆能力(memorization)和深度神经网络子模型的泛化能力(generalization),并且采用联合训练(jointtraining),将整体模型的训练误差同时反馈到线性子模型和深度神经网络子模型中进行参数更新,同时优化2个子模型的参数,从而达到整体Wide and Deep模型的预测能力最优。
在用户与机器人客服的问答过程中,会话特征直接体现了用户对人工客服的需求,属于强相关特征;而用户的状态特征与问答过程没有直接的关联,只是间接影响着用户对人工客服的需求,属于弱相关特征。为了体现这两类特征对结果的影响,可以采用Wideand Deep learning模型中不同的子模型来处理这两类特征。具体而言,以会话特征作为线性子模型的输入,经线性子模型处理后得到线性子模型的输出向量;以用户的状态特征作为深度神经网络子模型的输入,经深度神经网络子模型处理后得到深度神经网络子模型的输出向量;然后将两个子模型的输出向量拼起来,经过一个神经元计算输出。
在Wide and Deep learning模型训练阶段,可以将是否标记为出人工点作为输出(假设信心分评估值分别为1或0);在使用训练后的模型进行预测时,输出可以视为该时点是出人工点的可能性(信心分评估值为0到1之间的浮点数)。
本说明书的实施例中,机器人客服转人工客服的方法的流程如图1所示。
步骤110,从机器人客服与用户的至少一轮会话中获取会话特征。
在信心分评估模型训练完成后,可以在实时的机器人客服与用户的会话过程中,利用信心分评估模型来判断在会话中用户发言后的时点,是否需要切换为人工客服。
本说明书的实施例中,以一次用户发言、或者一次机器人客服发言和一次用户发言为一个轮次。通常机器人客服与用户的会话的第一轮是用户发言,第二轮及后续轮次是一次机器人客服发言和一次用户发言。每个轮次以用户发言来结束,该时点也即是可以由人工客服代替机器人客服的时点,或者说是可能的出人工点。
可以将机器人客服与用户会话的一个到多个轮次来作为获取会话特征的基础。例如将当前时点前预定轮次数目的会话作为获取会话特征的基础,如果当前时点已经进行的会话轮次小于预定轮次数目,则整个会话作为获取会话特征的基础;再如,始终将已经进行的整个会话作为获取会话特征的基础。
步骤120,获取用户的状态特征。
根据实际应用场景中客服中心和所咨询服务产品服务端的具体实现,可以从保存用户状态特征的预定网络位置、预定数据库表等处读取到用户的状态特征,不做限定。
需要说明的是,步骤110和步骤120之间没有时序关系。机器人客服与用户的会话通常随着会话过程的继续不断更新,而用户的状态特征则一般在一次客户服务过程中不会发生变化,因此步骤110在一次客户服务过程中可能执行多次,而步骤120则通常执行一次。
步骤130,将会话特征和状态特征输入信心分评估模型,得到当前信心分评估值。
将从当前时点前若干轮次的机器人客服与用户的会话中提取的会话特征、用户的状态特征输入到信心分评估模型中,得到在会话中用户最后一次发言后的当前时点(即当前轮次会话的用户发言后时点)的信心分评估值。
步骤140,在当前信心分评估值满足预定出人工条件时,将用户转接人工客服。
如果当前信心分评估值满足预定出人工条件,则认为当前时点需要人工客服介入,将用户转接至人工客服。
预定出人工条件可以是当前信心分评估值大于或小于预定信心分阈值,视实际应用场景中当前信心分评估值更高是代表更强的对人工客服的需求程度,还是更弱的对人工客服的需求程度。预定信心分阈值可以综合考虑训练后信心评估分模型与会话样本的拟合程度、实际应用场景中的用户与人工客服的数量比例等因素来确定。也可以由设置一定的标准,由程序根据所设置的标准自动确定预定信心分阈值。例如,可以将会话样本输入到训练后的信心评估模型中,得到会话样本中对应于出人工点的样本信心分评估值;设定一系列不同的预定信心分阈值的具体数值,计算当选择不同数值的预定信心分阈值时样本信心分评估值的覆盖率和准确率,设定针对覆盖率和准确率的评判标准,按照评判标准的评价最好的覆盖率和准确率对应的数值作为预定信心分阈值。
可见,本说明书的实施例中,采用用户的状态特征来描述用户的自身因素,以从机器人与用户的会话中获取的会话特征和用户的状态特征作为信心分评估机器学习模型的输入,得到当前信心分评估值,在当前信心分评估值满足预定出人工条件时转接人工客服,由于信心分评估模型基于用户状态特征体现的用户对人工客服的需求程度和迫切程度来给出当前信心分评估值,应用本说明书的实施例后可以增加出人工点的准确性,不仅能够提高客服中心的服务效率,而且还能够提高用户对服务的满意程度。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在本说明书的一个应用示例中,第三方支付平台的客服中心为使用其客户端App的用户提供在线服务。客户中心的技术人员采用从机器人客服与用户的会话中提取的会话特征、以及用户的状态特征,建立Wide and Deep模型,作为信心分评估模型。本应用示例中,用户的状态特征包括用户的行为记录特征、业务状态特征和身份信息特征。
Wide and Deep模型的结构如图2所示,以会话特征作为线性子模型的输入,以用户的状态特征作为深度神经网络子模型的输入。通常Wide and Deep模型中深度神经网络子模型的各层神经层均为Dense(紧密)神经层,即该神经层采用若干个Dense神经元进行数据处理。本应用示例中,深度神经网络子模型采用Dense神经层处理业务状态特征,采用Dense神经层处理身份信息特征,采用LSTM(Long Short-Term Memory,长短期记忆网络)神经层处理行为记录特征;上述三个神经层的输出经Dense神经层将三种用户状态特征的处理结果综合为一个深度神经网络子模型的输出向量,再由一个Dense神经层将两个子模型的输出向量综合为整个模型的输出,即信心分评估值。经本申请的发明人在试验中发现,图2所示的神经层结构能够达到更好的效果。
技术人员在若干机器人客服与用户的会话的历史记录中标注出人工点后,将其作为会话样本,并将这些用户的状态特征作为状态特征样本,由程序自动从会话样本中提取出会话特征后,将会话样本的会话特征和状态特征样本输入到Wide and Deep模型中进行训练。
当客服中心接到用户的服务请求时,其处理过程如图3所示。
步骤305,接收用户的输入。
步骤310,由机器人客服根据用户的问题给出回复。
步骤315,获取用户的行为记录特征、业务状态特征和身份信息特征。
步骤320,判断是否收到用户的下一次输入,如果未收到,流程结束;如果收到,执行步骤325。
步骤325,从机器人客服与用户在本次服务的所有会话中提取会话特征。
步骤330,将会话特征和用户的状态特征输入到训练完成的Wide and Deep信心分评估模型中,模型的输出为当前信心分评估值。
步骤335,判断当前信心分评估值是否满足预定出人工条件,如果是,执行步骤340;如果否,执行步骤345。
步骤340,转接人工客服,流程结束。
步骤345,由机器人客服给出用户回复,转步骤320。
与上述流程实现对应,本说明书的实施例还提供了一种机器人客服转人工客服的装置。该装置均可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为逻辑意义上的装置,是通过所在设备的CPU(Central Process Unit,中央处理器)将对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,除了图4所示的CPU、内存以及存储器之外,机器人客服转人工客服的装置所在的设备通常还包括用于进行无线信号收发的芯片等其他硬件,和/或用于实现网络通信功能的板卡等其他硬件。
图5所示为本说明书实施例提供的一种机器人客服转人工客服的装置,包括会话特征获取单元、状态特征获取单元、信心分评估单元和转接判断单元,其中:会话特征获取单元用于从机器人客服与用户的至少一轮会话中获取会话特征;状态特征获取单元用于获取用户的状态特征;信心分评估单元用于将所述会话特征和状态特征输入信心分评估模型,得到当前信心分评估值;所述信心分评估模型为机器学习模型,采用标记有出人工点的机器人客服与用户的会话样本、以及用户的状态特征样本进行训练;转接判断单元用于在当前信心分评估值满足预定出人工条件时,将用户转接人工客服。
一个例子中,所述信心分评估模型为深度和广度Wide and Deep模型,所述Wideand Deep模型包括线性子模型和深度神经网络子模型,以会话特征作为线性子模型的输入,以状态特征作为深度神经网络子模型的输入。
上述例子中,所述状态特征可以包括以下至少一项:用户的行为记录特征、业务状态特征和身份信息特征;所述深度神经网络子模型采用Dense紧密神经层处理业务状态特征,采用Dense神经层处理身份信息特征,采用长短期记忆网络LSTM神经层处理行为记录特征。
可选的,所述会话特征为自然语言处理NLP特征,包括以下的一项到多项:用户提问与机器人回答的关联度、问答轮数、答案类型。
可选的,所述状态特征包括以下至少一项:用户的行为记录特征、业务状态特征和身份信息特征;所述行为记录特征包括以下至少一项:用户在预定时间段内的访问记录、操作记录;所述业务状态特征包括以下至少一项:用户账户的业务开通状态、账户认证状态、账户登录状态、账户异常状态;所述身份信息特征包括以下至少一项:用户的性别、年龄、常驻地域。
可选的,所述信心分评估模型包括:基于支持向量机的机器学习模型、基于树型的机器学习模型、线性模型、神经网络模型。
可选的,所述预定出人工条件包括:当前信心分评估值大于或小于预定信心分阈值。
本说明书的实施例提供了一种计算机设备,该计算机设备包括存储器和处理器。其中,存储器上存储有能够由处理器运行的计算机程序;处理器在运行存储的计算机程序时,执行本说明书实施例中机器人客服转人工客服的方法的各个步骤。对机器人客服转人工客服的方法的各个步骤的详细描述请参见之前的内容,不再重复。
本说明书的实施例提供了一种计算机可读存储介质,该存储介质上存储有计算机程序,这些计算机程序在被处理器运行时,执行本说明书实施例中机器人客服转人工客服的方法的各个步骤。对机器人客服转人工客服的方法的各个步骤的详细描述请参见之前的内容,不再重复。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、***或计算机程序产品。因此,本说明书的实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书的实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。