CN106997375A - 基于深度学习的客服回复推荐方法 - Google Patents

基于深度学习的客服回复推荐方法 Download PDF

Info

Publication number
CN106997375A
CN106997375A CN201710112855.7A CN201710112855A CN106997375A CN 106997375 A CN106997375 A CN 106997375A CN 201710112855 A CN201710112855 A CN 201710112855A CN 106997375 A CN106997375 A CN 106997375A
Authority
CN
China
Prior art keywords
customer service
vector
dialogue
sentence
replied
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710112855.7A
Other languages
English (en)
Other versions
CN106997375B (zh
Inventor
王东辉
梁建增
庄越挺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201710112855.7A priority Critical patent/CN106997375B/zh
Publication of CN106997375A publication Critical patent/CN106997375A/zh
Application granted granted Critical
Publication of CN106997375B publication Critical patent/CN106997375B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于深度学习的客服回复推荐方法,通过直接从客服的对话记录中学习对话模型,来进行客服回复推荐;该方法通过端到端的训练方式进行模型构建,相比传统基于规则和人工特征的方法构建速度快;该方法提升了客服回复推荐***中回复内容的覆盖范围;同时本发明可应用于各种垂直领域的客服服务中,包括但不限于:电商、医药、法律等。

Description

基于深度学习的客服回复推荐方法
技术领域
本发明属于客服辅助技术领域,具体涉及一种基于深度学习的客服回复推荐方法。
背景技术
随着互联网经济的不断发展,提供在线商品和服务选购的电商平台的规模和成交量也在日益增大,这种改变的潮流对在线客服的服务效率提出更高要求。同时一些新的客服场景,如在线健康咨询、在线法律咨询,涉及知识较多,对从业人员专业要求较高。
现有的解决思路有两种:一种是利用智能客服机器人直接替代人工承接一部分咨询任务;另一种是利用计算机来辅助人工客服以提升其工作效率。常见的智能客服机器人通常以手工构建的知识库作为核心引擎,替代人工完成一些常见的简单咨询服务。这种方法的不足之处主要有:机器人通常只能处理常见的标准问题,对于一些个性化较强或出现频次较低的问题则较难处理;复杂知识库的建立需要极大成本;用户对机器人的接受程度不如人工客服。计算机辅助人工客服,通常可以完成一些不直接和用户交互的任务如:标准回复推荐、常用问答对推荐。现有的客服辅助***主要针对所需专业知识相对较少的场景设计,如交易纠纷、商品信息咨询等。
现有解决方案需要人工进行前期知识库或语料的建立和整理,成本较高。同时知识库和标准回复存在覆盖率问题,通常针对一些出现次数较多的问题设计,对于个性化较强的问题则覆盖较少。传统在线客服场景问题分布比较集中、涉及专业知识相对较少,因此知识库和语料的构建成本和覆盖率问题比较容易解决。但是在对专业要求较高的场景下,由于涉及知识的深度和广度增加,知识库和对应语料的构建难度也随之增加,实现较高问题覆盖率较难。
发明内容
针对现有技术所存在的问题,本发明提出了一种基于深度学习的客服回复推荐方法,其能够根据客服咨询过程中的对话记录,为客服推荐其当前可能需要的回复文本,从而减少客服在工作过程中的输入量,提升客服工作效率。
本发明的技术方案如下:
这种基于深度学习的客服回复推荐方法,其特征在于,包含如下步骤:
(1)对聊天语料库中所有的客服回复进行聚类并构建候选客服回复集合;
(2)在客服聊天语料库上训练词向量;
(3)对客服聊天语料库的对话记录进行标准化处理;
(4)在处理后的语料集上训练对话模型;
(5)将客服当前的对话记录输入模型,获取取该时刻的推荐回复。
所述的步骤(1)中对所有回复进行聚类的步骤如下:
1.1使用中文分词器对语料进行处理,获取其分词结果;
1.2在分词结果上的运行LDA主题生成模型,并计算每个回复向量表示;
1.3在所有回复的向量表示上运行k-means聚类算法,距离度量函数使用欧几里得距离,完成对回复文本的聚类,得到n个簇:{c1,…,cn}
其中:d()为计算距离的函数,X,Y为两个回复的向量表示,xi,yi分别为X,Y的分量;
1.4设定一个阈值m,从{c1,…,cn}对应的每个类簇中分别随机抽样m个句子组成候选回复集合C;
所述的步骤(2)中训练词向量的步骤如下:
2.1使用中文分词器对所有语料进行分词处理;
2.2使用词向量训练工具在分好词的语料上训练词向量,获得词向量矩阵。
所述的步骤(3)中对语料的标准化处理步骤如下:
3.1删除对全部聊天记录中无意义的格式控制符号,以及非人工产生的对话;
3.2将聊天记录中的对话按照产生对话的角色分为:用户的对话和客服的对话两种,在此基础上将每次服务的多条对话记录处理为:{用户,客服,用户,客服,…}的次序,即每组对话均以用户的对话开始,用户和客服的对话严格交替出现;
3.3对过长的对话单句对话,和过场的对话序列做截断处理。
所述的步骤(4)中训练深度对话模型的步骤如下:
4.1从数据集中随机选取一批样本,每个样本均为的一组对话序列可以表示为:{(u0,h0,u1,h1,…),…}其中ui表示对话序列中用户的第i句话,hi表示对话序列中客服的第i句对话;
4.2为样本中的每个客服对话均选从语料库中随机选取一条客服对话作为负样本
4.3对样本中的所有对话:均使用本发明中提出的单句编码器(Utterance Encoder)进行编码,分别获得各个句子的向量表达:
4.4将一个样本表示为向量序列:在此基础上使用上下文编码器(Context Encoder)对该序列进行编码,获得一个向量输出序列,表示对话对各个时刻对话历史的编码结果:
4.5在客服对话的每个时间刻,均使用对应时间刻的作为输入,使用如下公式计算局部损失函数值:
其中margin为手工设定的阈值,其中Sim(x,y)为相似度函数,其计算方法如下面公式所示:
4.6将当前批次样本中所有的局部损耗进行相加,得到本次更新所需的损失函数值,计算公式如下:
其中:n为当前批次所含样本的数量,mi为第i个样本中所含的客服对话数量,lossi,j为第i个样本中第j句客服对应时刻的局部损失值;
4.7使用梯度下降对对话模型中的所有参数进行更新;
4.8如果迭代次数达到阈值(该阈值可根据需要自行设定),则保存模型,结束迭代,否则返回步骤4.1。
在所述步骤4.3中单句编码器对单个句子进行编码的流程如下:
4.3.1根据产生句子的角色不同,为每个句子分配一个角色标志,对于用户产生的句子,设定其角色标记为0,对于客服产生的句子或候选回复,设定其角色标记为1,使用符号r来表示角色标记;
4.3.2通过查找在步骤(2)中训练的词向量矩阵,将句子中的每个词均替换为与其对应的词向量表示形式,表示为
4.3.3并将角色标同句子中的每个词向量分别进行级联,其过程可表示为:vw′=[vw;];
4.3.4使用一个两层GRU网络读入处理后的词向量序列,并获取最后时刻的输出作为Utterance Encoder的编码结果,其中每个GRU单元的更新方式如下面公式所示:
zt=σ(Wz·[ht-1,xt])
rt=δ(Wr·[ht-1,xt])
ht=(1-zt)*ht-1+zt*ht
其中xt表示某一时间刻的输入,ht表示对应时间刻的输出。
在所述步骤4.4中上下文编码器对对话记录序列进行编码的流程如下:
4.4.1读入对话记录里各个句子的向量表示:
4.4.2在向量序列的头部***一个同样长度的全零向量:
4.4.3使用长度为2的滑动窗口对序列中的向量进行拼接,得到输出为:
4.4.4将拼接后的向量序列作为输入,使用一个双层GRU网络对其进行编码,取其每个时刻的输出并表示为:其中表示第i个时间刻的输出;
4.4.5将每个时刻的上下文表示向量同该时刻对应的句子向量进行级联组合,在第i时刻获得输出为:其中表示GRU网络第i时刻的输出,表示在对话序列中用户的第i句话的向量编码,表示在对话序列中客服的第i句话的向量编码;
4.4.6利用线性层对拼接后的向量进行重新映射,其计算过程如下面公式
Vi′=WT·Vi
其中WT为线性层权值矩阵,通过训练得到,Vi为拼接后的向量,Vi 为context在对该时刻上下文的向量表示结果。
在所述步骤(5)中根据进行当前客服对话历史选取回复的流程如下:
5.1将步骤(1)中构造的候选回复集合表示为:A={a0,a1,…,an}其中ai表示一条候选回复文本;
5.2使用单句编码器将每个候选回复句子表示成为向量形式,其处理过程同步骤4.3相同,将其输出表示为:
5.3使用Utterance Encoder对将当前对话记录中的各条对话进行编码,其处理步骤与4.3相同,将其处理结果表示为:
5.4使用作为上下文编码器的输入,其编码过程同步骤4.4相同,并取出最后时刻的输出作为当前上下文向量编码结果:Vc
5.5遍历所有候选回复的向量编码,计算各个候选回复同当前上下文的匹配程度,计算方法如下面公式所示:
5.6对比所有候选回复的匹配程度得分,取其中得分最高的作为推荐回复。
本发明利用了客服在服务过程中产生的聊天对话记录,提出了一种基于深度模型的客服回复推荐方法,并提出了将其应用于实际场景中的方法。由此,本发明方法与传统方法相比具有以下有益效果:
(1)本发明方法通过端到端的训练方式进行模型构建,构建速度更快;
(2)本发明方法提升了客服回复推荐***中回复内容的覆盖范围;
(3)本发明方法使得客服回复推荐***的构建不需要精通专业知识的人员参与;
(4)本发明方法可应用于各种垂直领域的客服服务中,包括但不限于:电商、医药、法律等。
附图说明
图1为本发明的主要流程示意图。
图2为本发明中提出的单句编码器的结构示意图。
图3为本发明中提出的上下文编码器的结构示意图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
本发明的方法流程具体包括以下步骤:
(1)从客服聊天语料中提取筛选候选回复集;
(2)利用客服聊天语料训练词向量;
(3)对客服聊天语料进行标准化处理;
(4)训练客服对话模型;
(5)根据当前对话记录使用对话模型选取推荐的回复内容
步骤(1)分为以下步骤:
1-1:从语料中筛选出所有由客服说出的对话;
1-2:使用结巴分词工具对筛选出的对话进行分词;
1-3:使用LDA主题模型对分词后的对话进行主题建模,并获取其向量表示;
1-4:使用k-means聚类算法对筛选出的回复在向量空间上进行聚类;
1-5:在每个类簇中均随机选取等量的回复,对其进行去重操作后构成候选回复集。
步骤(2)分为以下步骤:
2-1使用结巴分词工具对所有对话记录进行分词;
2-2在分好词的对话记录上训练词向量,具体使用的工具是:word2vec。
步骤(3)分为以下步骤:
3-1删除对聊天记录中所有格式控制符号以及非人工产生的对话;
3-2将聊天记录中的对话按照产生对话的角色分为:用户的对话和客服的对话两种,在此基础上将每次服务的多条对话记录处理为:{user,host,user,host,…}的次序,即每组对话均以用户的对话开始,用户和客服的对话严格交替出现,其中user代表用户,host代表客服。
步骤(4)分为以下步骤:
4-1初始化模型参数,其中词向量权值矩阵使用预训练的词向量初始化,其余参数使用符合高斯分布的随机数初始化;
4-2使用随机抽样的方法从数据中抽取n个样本,作为当前训练的batch;
4-3为样本中所有客服的回复均从语料集中随机选取一条客服对话作为负样本回复;
4-4如图1所示,使用单句编码器对样本中的所有句子进行编码,获取他们所对应的向量表示,具体过程为:设定各个句子的角色编码、将所有单词转换为词向量表示、对角色编码和词向量进行拼接、使用双层GRU对向量序列进行编码、获取最后时刻的输出作为编码结果;
4-5如图2所示,针对每个样本,将其中全部句子的向量表示作为输入,使用上下文编码器分别对这些向量序列进行编码,获取不同时刻的对话上下文表示结果,具体过程为:在向量序列的首部填充一个同样长度的全零向量、使用长度为2的滑动窗口对向量序列中的相邻向量进行拼接、使用双层GRU网络读入拼接后的向量序列并计算各个时刻的输出、在各个时刻将GRU网络的输出同该时刻原始句子的向量编码进行级联、使用线性层进行线性变换降维、取出输出作为该时刻的上下文编码结果;
4-6针对每个样本,在客服进行回复的所有时间刻,分别计算原始回复和负样本回复同该时刻上下文编码的相似程度,使用hinge损耗函数计算局部损失值;
4-7将当前batch中所有样本的所有局部损失值进行相加,获取全局损失值;
4-8使用梯度下降方法对模型中所有参数进行更新,学习率设为0.01;
4-9判断迭代次数和全局损失值的变化程度是否达到阈值,若达到则停止训练保存模型,若未达到,则返回步骤4-2。
步骤(5)分为以下步骤:
5-1使用单句编码器将候选集中的所有句子编码成为向量形式;
5-2使用单句编码器将当前对话记录中的各条对话进行编码;
5-3使用上下文编码器读入当前对话中各个句子的向量表示,并取其最后时刻的输出作为当前上下文表示结果;
5-4遍历所有候选回复,使用cosine相似性计算其与当前上下文的相似程度,并从中选出得分最高的回复推荐给客服。
上述实例并非是对于本发明的限制,本发明并非仅限于上述实施例,只要符合本发明要求,均属于本发明的保护范围。

Claims (7)

1.一种基于深度学习的客服回复推荐方法,包含以下步骤:
(1)对聊天语料库中所有的客服回复进行聚类并构建候选客服回复集合;
并在客服聊天语料库上训练词向量;
(3)对客服聊天语料库的对话记录进行标准化处理;
(4)在经标准化处理后的语料集上训练对话模型;
(5)将客服当前的对话记录输入上述对话模型,获取相应的推荐回复。
2.根据权利要求1所述的客服回复推荐方法,其特征在于:所述的步骤(1)具体包括如下步骤:
1.1使用中文分词器对语料中所有的客服回复进行处理,获取其分词结果;
1.2使用LDA主题模型对分词后的对话进行主题建模,并获取其向量表示;
1.3使用k-means聚类算法对客服回复在向量空间上进行聚类;
1.4在每个类簇中均随机选取等量的回复,对其进行去重操作后构成候选回复集。
3.根据权利要求1所述的客服回复推荐方法,其特征在于:所述的步骤(3)中对话记录的标准化处理的具体步骤如下:
3.1删除对话记录中所有的格式控制符号及非人工产生的对话;
3.2将对话按照产生对话的角色分为:用户的对话和客服的对话两种,在此基础上将每次服务的多条对话记录处理为:{user,host,user,host,…}的次序,即每组对话均以用户的对话开始,用户和客服的对话严格交替出现,其中user代表用户,host代表客服。
4.根据权利要求1所述的客服回复推荐方法,其特征在于:所述的步骤(4)中对话模型训练的具体步骤如下:
4.1从数据集中随机选取一批样本,每个样本均为多组对话序列可以表示为:{(u0,h0,u1,h1,…),…},其中ui表示对话序列中用户的第i句话,hi表示对话序列中客服的第i句对话;
4.2为样本中的每个客服对话均从语料库中随机选取一条客服对话作为负样本
4.3对样本中每组对话序列的所有对话:均使用单句编码器进行编码,将各个句子均编码成为定长向量,分别获得各个句子的向量表达:
4.4将每组对话序列表示为向量序列:在此基础上使用上下文编码器对该序列进行编码,其可以获取每条对话出现时已产生的对话记录的编码结果,用户和客服的每条对话都各自对应一个时刻,编码后获得一个向量输出序列,表示对各个时刻对话历史的编码结果:其中k为该组对话序列中所含对话数量;
4.5在客服对话的每个时间刻,均使用对应时间刻i的作为输入,使用如下公式计算局部损失函数值:
其中margin为手工设定的阈值,其中Sim(x,y)为相似度函数,其计算方法如下面公式所示:
4.6将当前批次样本中所有局部损耗进行相加,得到本次更新所需的损失函数值,计算公式如下:
其中:n为当前批次所含样本的数量,mi为第i个样本中所含的客服回复数量,lossi,j为第i个样本中第j句客服回复对应时刻的局部损失值;
4.7使用梯度下降对对话模型中的所有参数进行更新;
4.8如果迭代次数达到阈值,则保存模型,结束迭代,否则返回步骤4.1。
5.根据权利要求4所述的客服回复推荐方法,其特征在于:所述的步骤4.3中采用单句编码器对单个句子进行编码的具体步骤如下:
5.1根据产生句子的角色不同,为每个句子分配一个角色标志,对于用户产生的句子,设定其角色标记为0,对于客服产生的句子或候选回复,设定其角色标记为1,使用符号r来表示角色标记;
5.2通过查找在步骤(2)中训练的词向量矩阵,将句子中的每个词均替换为与其对应的词向量表示形式,表示为
5.3并将角色标记同句子中的每个词向量分别进行级联,其过程可表示为:vw′=[vw;r];
5.4使用一个两层GRU网络读入处理后的词向量序列,并获取最后时刻的输出作为单句编码器的编码结果。
6.根据权利要求4所述的客服回复推荐方法,其特征在于:所述的步骤4.4中采用上下文编码器对对话序列进行编码的具体步骤如下:
6.1读入对话记录里各个句子的向量表示:
6.2在向量序列的头部***一个同样长度的全零向量:
6.3使用长度为2的滑动窗口对序列中的向量进行拼接,得到输出为:6.4将拼接后的向量序列作为输入,使用一个双层GRU网络对其进行编码,取其每个时刻的输出并表示为:其中表示第i个时间刻的输出;
6.5将每个时刻的上下文表示向量同该时刻对应的句子向量进行级联组合,在第i时刻获得输出为:其中表示GRU网络第i时刻的输出,表示在对话序列中用户说的第i句话的向量编码,表示在对话序列中客服说的第i句话的向量编码;
6.6利用线性层对每个拼接后的向量进行重新映射,其计算过程如下面公式
Vi′=WT·Vi
其中WT为线性层权值矩阵,Vi为拼接后的向量,Vi′为对该时刻上下文的向量表示结果。
7.根据权利要求1所述的客服回复推荐方法,其特征在于:所述的步骤(5)中根据当前对话历史选取推荐回复的具体步骤如下:
7.1将步骤(1)中构造的候选回复集合表示为:A={a0,a1,…,an}其中ai表示一条候选回复文本;
7.2使用单句编码器将每个候选回复句子表示成为向量形式,将其输出表示为:
7.3使用单句编码器将当前对话记录中的各条对话进行编码,将其处理结果表示为:
7.4使用作为上下文编码器的输入,取出最后时刻的输出作为当前上下文向量编码结果:Vc
7.5遍历所有候选回复的向量编码Va,计算各个候选回复同当前上下文的匹配程度;
7.6对比所有候选回复的匹配程度得分,取其中得分最高的作为推荐回复。
CN201710112855.7A 2017-02-28 2017-02-28 基于深度学习的客服回复推荐方法 Expired - Fee Related CN106997375B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710112855.7A CN106997375B (zh) 2017-02-28 2017-02-28 基于深度学习的客服回复推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710112855.7A CN106997375B (zh) 2017-02-28 2017-02-28 基于深度学习的客服回复推荐方法

Publications (2)

Publication Number Publication Date
CN106997375A true CN106997375A (zh) 2017-08-01
CN106997375B CN106997375B (zh) 2020-08-18

Family

ID=59431014

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710112855.7A Expired - Fee Related CN106997375B (zh) 2017-02-28 2017-02-28 基于深度学习的客服回复推荐方法

Country Status (1)

Country Link
CN (1) CN106997375B (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330130A (zh) * 2017-08-29 2017-11-07 北京易掌云峰科技有限公司 一种向人工客服推荐回复内容的对话机器人的实现方法
CN107368524A (zh) * 2017-06-07 2017-11-21 阿里巴巴集团控股有限公司 一种对话生成方法、装置以及电子设备
CN107679231A (zh) * 2017-10-24 2018-02-09 济南浪潮高新科技投资发展有限公司 一种垂直领域与开放领域混合型智能问答***的实现方法
CN108038230A (zh) * 2017-12-26 2018-05-15 北京百度网讯科技有限公司 基于人工智能的信息生成方法和装置
CN108763477A (zh) * 2018-05-29 2018-11-06 厦门快商通信息技术有限公司 一种短文本分类方法及***
CN108804611A (zh) * 2018-05-30 2018-11-13 浙江大学 一种基于自我评论序列学习的对话回复生成方法及***
CN108920715A (zh) * 2018-07-26 2018-11-30 百度在线网络技术(北京)有限公司 客服的智能化辅助方法、装置、服务器和存储介质
CN109062951A (zh) * 2018-06-22 2018-12-21 厦门快商通信息技术有限公司 基于意图分析和对话聚类的对话流程抽取方法、设备及存储介质
CN109189931A (zh) * 2018-09-05 2019-01-11 腾讯科技(深圳)有限公司 一种目标语句的筛选方法及装置
CN109189901A (zh) * 2018-08-09 2019-01-11 北京中关村科金技术有限公司 一种智能客服***中自动发现新分类以及对应语料的方法
CN109543177A (zh) * 2018-10-19 2019-03-29 中国平安人寿保险股份有限公司 消息数据处理方法、装置、计算机设备和存储介质
CN109615009A (zh) * 2018-12-12 2019-04-12 广东小天才科技有限公司 一种学习内容推荐方法及电子设备
CN109977194A (zh) * 2019-03-20 2019-07-05 华南理工大学 基于无监督学习的文本相似度计算方法、***、设备及介质
CN110019700A (zh) * 2017-09-13 2019-07-16 阿里巴巴集团控股有限公司 数据处理方法和设备
WO2019150222A1 (en) * 2018-02-01 2019-08-08 International Business Machines Corporation Dynamically constructing and configuring a conversational agent learning model
CN110196930A (zh) * 2019-05-22 2019-09-03 山东大学 一种多模态客服自动回复方法及***
WO2020024455A1 (zh) * 2018-08-01 2020-02-06 平安科技(深圳)有限公司 基于上下文的输入方法、装置、存储介质及计算机设备
CN110825852A (zh) * 2019-11-07 2020-02-21 四川长虹电器股份有限公司 面向长文本的语义匹配方法及***
CN111199325A (zh) * 2018-11-19 2020-05-26 阿里巴巴集团控股有限公司 在线客服的分配方法和装置以及电子设备
CN111324704A (zh) * 2018-12-14 2020-06-23 阿里巴巴集团控股有限公司 话术知识库构建的方法、装置和客服机器人
CN111368531A (zh) * 2020-03-09 2020-07-03 腾讯科技(深圳)有限公司 翻译文本处理方法、装置、计算机设备和存储介质
CN111985934A (zh) * 2020-07-30 2020-11-24 浙江百世技术有限公司 智能客服对话模型构建方法及应用
WO2021144638A1 (en) * 2020-01-15 2021-07-22 International Business Machines Corporation Searching conversation logs of virtual agent dialog system for contrastive temporal patterns
CN113239157A (zh) * 2021-03-31 2021-08-10 北京百度网讯科技有限公司 对话模型的训练方法、装置、设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425635A (zh) * 2012-05-15 2013-12-04 北京百度网讯科技有限公司 一种答案推荐方法和装置
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和***
CN105072173A (zh) * 2015-08-03 2015-11-18 谌志群 自动客服和人工客服自动切换的客服方法及***
CN105787560A (zh) * 2016-03-18 2016-07-20 北京光年无限科技有限公司 基于循环神经网络的对话数据交互处理方法及装置
CN105955965A (zh) * 2016-06-21 2016-09-21 上海智臻智能网络科技股份有限公司 问句信息处理方法及装置
CN106448670A (zh) * 2016-10-21 2017-02-22 竹间智能科技(上海)有限公司 基于深度学习和强化学习的自动回复对话***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425635A (zh) * 2012-05-15 2013-12-04 北京百度网讯科技有限公司 一种答案推荐方法和装置
CN105072173A (zh) * 2015-08-03 2015-11-18 谌志群 自动客服和人工客服自动切换的客服方法及***
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和***
CN105787560A (zh) * 2016-03-18 2016-07-20 北京光年无限科技有限公司 基于循环神经网络的对话数据交互处理方法及装置
CN105955965A (zh) * 2016-06-21 2016-09-21 上海智臻智能网络科技股份有限公司 问句信息处理方法及装置
CN106448670A (zh) * 2016-10-21 2017-02-22 竹间智能科技(上海)有限公司 基于深度学习和强化学习的自动回复对话***

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LI J等: "Deep Reinforcement Learning for Dialogue", 《AIXIV PREPRINT ARXIV》 *
SUTSKEVERI等: "Sequence to sequence learning with neural", 《ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS》 *
XING C等: "Topic Aware Neural Response Generation", 《ARXIV PREPRINT ARXIV》 *

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107368524A (zh) * 2017-06-07 2017-11-21 阿里巴巴集团控股有限公司 一种对话生成方法、装置以及电子设备
US11354512B2 (en) 2017-06-07 2022-06-07 Advanced New Technologies Co., Ltd. Method and device for generating dialog using trained dialog model
US10747959B2 (en) 2017-06-07 2020-08-18 Alibaba Group Holding Limited Dialog generation method, apparatus, and electronic device
CN107330130B (zh) * 2017-08-29 2020-10-20 北京易掌云峰科技有限公司 一种向人工客服推荐回复内容的对话机器人的实现方法
CN107330130A (zh) * 2017-08-29 2017-11-07 北京易掌云峰科技有限公司 一种向人工客服推荐回复内容的对话机器人的实现方法
CN110019700A (zh) * 2017-09-13 2019-07-16 阿里巴巴集团控股有限公司 数据处理方法和设备
CN110019700B (zh) * 2017-09-13 2023-01-17 阿里巴巴集团控股有限公司 数据处理方法和设备
CN107679231A (zh) * 2017-10-24 2018-02-09 济南浪潮高新科技投资发展有限公司 一种垂直领域与开放领域混合型智能问答***的实现方法
CN108038230A (zh) * 2017-12-26 2018-05-15 北京百度网讯科技有限公司 基于人工智能的信息生成方法和装置
US11886823B2 (en) 2018-02-01 2024-01-30 International Business Machines Corporation Dynamically constructing and configuring a conversational agent learning model
GB2584239A (en) * 2018-02-01 2020-11-25 Ibm Dynamically constructing and configuring a conversational agent learning model
WO2019150222A1 (en) * 2018-02-01 2019-08-08 International Business Machines Corporation Dynamically constructing and configuring a conversational agent learning model
GB2584239B (en) * 2018-02-01 2022-03-02 Ibm Dynamically constructing and configuring a conversational agent learning model
CN108763477A (zh) * 2018-05-29 2018-11-06 厦门快商通信息技术有限公司 一种短文本分类方法及***
CN108804611A (zh) * 2018-05-30 2018-11-13 浙江大学 一种基于自我评论序列学习的对话回复生成方法及***
CN109062951A (zh) * 2018-06-22 2018-12-21 厦门快商通信息技术有限公司 基于意图分析和对话聚类的对话流程抽取方法、设备及存储介质
CN109062951B (zh) * 2018-06-22 2021-04-06 厦门快商通信息技术有限公司 基于意图分析和对话聚类的对话流程抽取方法、设备及存储介质
CN108920715A (zh) * 2018-07-26 2018-11-30 百度在线网络技术(北京)有限公司 客服的智能化辅助方法、装置、服务器和存储介质
WO2020024455A1 (zh) * 2018-08-01 2020-02-06 平安科技(深圳)有限公司 基于上下文的输入方法、装置、存储介质及计算机设备
CN109189901A (zh) * 2018-08-09 2019-01-11 北京中关村科金技术有限公司 一种智能客服***中自动发现新分类以及对应语料的方法
CN109189931B (zh) * 2018-09-05 2021-05-11 腾讯科技(深圳)有限公司 一种目标语句的筛选方法及装置
CN109189931A (zh) * 2018-09-05 2019-01-11 腾讯科技(深圳)有限公司 一种目标语句的筛选方法及装置
CN109543177B (zh) * 2018-10-19 2022-04-12 中国平安人寿保险股份有限公司 消息数据处理方法、装置、计算机设备和存储介质
CN109543177A (zh) * 2018-10-19 2019-03-29 中国平安人寿保险股份有限公司 消息数据处理方法、装置、计算机设备和存储介质
CN111199325A (zh) * 2018-11-19 2020-05-26 阿里巴巴集团控股有限公司 在线客服的分配方法和装置以及电子设备
CN111199325B (zh) * 2018-11-19 2023-12-26 阿里巴巴集团控股有限公司 在线客服的分配方法和装置以及电子设备
CN109615009A (zh) * 2018-12-12 2019-04-12 广东小天才科技有限公司 一种学习内容推荐方法及电子设备
CN111324704A (zh) * 2018-12-14 2020-06-23 阿里巴巴集团控股有限公司 话术知识库构建的方法、装置和客服机器人
CN111324704B (zh) * 2018-12-14 2023-05-02 阿里巴巴集团控股有限公司 话术知识库构建的方法、装置和客服机器人
CN109977194A (zh) * 2019-03-20 2019-07-05 华南理工大学 基于无监督学习的文本相似度计算方法、***、设备及介质
CN110196930B (zh) * 2019-05-22 2021-08-24 山东大学 一种多模态客服自动回复方法及***
CN110196930A (zh) * 2019-05-22 2019-09-03 山东大学 一种多模态客服自动回复方法及***
CN110825852A (zh) * 2019-11-07 2020-02-21 四川长虹电器股份有限公司 面向长文本的语义匹配方法及***
WO2021144638A1 (en) * 2020-01-15 2021-07-22 International Business Machines Corporation Searching conversation logs of virtual agent dialog system for contrastive temporal patterns
US11409965B2 (en) 2020-01-15 2022-08-09 International Business Machines Corporation Searching conversation logs of a virtual agent dialog system for contrastive temporal patterns
GB2607482A (en) * 2020-01-15 2022-12-07 Ibm Searching conversation logs of virtual agent dialog system for contrastive temporal patterns
CN111368531A (zh) * 2020-03-09 2020-07-03 腾讯科技(深圳)有限公司 翻译文本处理方法、装置、计算机设备和存储介质
CN111368531B (zh) * 2020-03-09 2023-04-14 腾讯科技(深圳)有限公司 翻译文本处理方法、装置、计算机设备和存储介质
CN111985934A (zh) * 2020-07-30 2020-11-24 浙江百世技术有限公司 智能客服对话模型构建方法及应用
CN111985934B (zh) * 2020-07-30 2024-07-12 浙江百世技术有限公司 智能客服对话模型构建方法及应用
CN113239157B (zh) * 2021-03-31 2022-02-25 北京百度网讯科技有限公司 对话模型的训练方法、装置、设备和存储介质
CN113239157A (zh) * 2021-03-31 2021-08-10 北京百度网讯科技有限公司 对话模型的训练方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN106997375B (zh) 2020-08-18

Similar Documents

Publication Publication Date Title
CN106997375A (zh) 基于深度学习的客服回复推荐方法
CN112000791B (zh) 一种电机故障知识抽取***及方法
CN107818164A (zh) 一种智能问答方法及其***
CN110188272B (zh) 一种基于用户背景的社区问答网站标签推荐方法
CN111666761B (zh) 细粒度情感分析模型训练方法及装置
CN106448670A (zh) 基于深度学习和强化学习的自动回复对话***
CN111177310B (zh) 电力服务机器人智能场景会话方法及装置
CN109446416B (zh) 基于词向量模型的法条推荐方法
CN109271493A (zh) 一种语言文本处理方法、装置和存储介质
CN110929034A (zh) 一种基于改进lstm的商品评论细粒度情感分类方法
CN112712118A (zh) 一种面向医疗文本数据的过滤方法及***
CN104951433A (zh) 基于上下文进行意图识别的方法和***
CN110414009B (zh) 基于BiLSTM-CNN的英缅双语平行句对抽取方法及装置
CN110532355A (zh) 一种基于多任务学习的意图与槽位联合识别方法
CN109460457A (zh) 文本语句相似度计算方法、智能政务辅助解答***及其工作方法
CN109658271A (zh) 一种基于保险专业场景的智能客服***及方法
CN111309887B (zh) 一种训练文本关键内容提取模型的方法和***
CN107679031B (zh) 基于堆叠降噪自编码机的广告博文识别方法
CN108846047A (zh) 一种基于卷积特征的图片检索方法及***
CN111078834B (zh) 基于深度森林的文本对象推荐方法
CN109918681A (zh) 一种基于汉字-拼音的融合问题语义匹配方法
CN107967302A (zh) 基于深度神经网络的游戏客服对话***
CN114818703B (zh) 基于BERT语言模型和TextCNN模型的多意图识别方法及***
CN112287106A (zh) 一种基于双通道混合神经网络的在线评论情感分类方法
CN111523328B (zh) 一种智能客服语义处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200818

CF01 Termination of patent right due to non-payment of annual fee