CN111813910A - 客服问题的更新方法、***、终端设备及计算机存储介质 - Google Patents
客服问题的更新方法、***、终端设备及计算机存储介质 Download PDFInfo
- Publication number
- CN111813910A CN111813910A CN202010595834.7A CN202010595834A CN111813910A CN 111813910 A CN111813910 A CN 111813910A CN 202010595834 A CN202010595834 A CN 202010595834A CN 111813910 A CN111813910 A CN 111813910A
- Authority
- CN
- China
- Prior art keywords
- customer service
- question
- clustering
- training
- questions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000012549 training Methods 0.000 claims abstract description 190
- 230000014509 gene expression Effects 0.000 claims description 15
- 238000004891 communication Methods 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 7
- 230000008569 process Effects 0.000 description 12
- 239000000284 extract Substances 0.000 description 7
- 230000008859 change Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0281—Customer communication at a business location, e.g. providing product or service information, consulting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Accounting & Taxation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Finance (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Medical Informatics (AREA)
- Entrepreneurship & Innovation (AREA)
- Computing Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及客服机器人技术领域,公开了一种客服问题的更新方法、***、终端设备及计算机存储介质,该客服问题的更新方法包括:根据预设客服问题集中的客服问题构建问题对,并将所述问题对组合为训练数据;基于所述训练数据训练相似度模型,并利用训练收敛的相似度模型计算未响应客服问题的聚类参数;基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果;根据所述聚类结果生成新的客服问题以对所述预设客服问题集进行更新。此外,本发明还涉及区块链技术,训练收敛的相似度模型可存储在区块链中。本发明能够在聚类时得到更加具有价值的高质量问题来更新客服问题集,提高了智能客服机器人的问题回答效率。
Description
技术领域
本发明涉及客服机器人技术领域,尤其涉及一种客服问题的更新方法、***、终端设备以及计算机存储介质。
背景技术
智能客服机器人通常由语音识别(Automatic Speech Recognition,ASR)、意图识别、问答模块、知识库管理、知识图谱、对话管理、文本生成、语音合成(Text to Speech,TTS)等模块构成。其中,基于知识库的FAQ(Frequently Asked Questions,常见的问题项目与对应问题的解答)问答模块通过在知识库中查询与用户问题相匹配的标准问题,为用户提供满意的答案,是智能客服机器人中最重要的模块。而知识库是FAQ问答模块重要的组成部分,它由用户高频问到的问题和对应的答案对构成,为了适应不同用户对同一问题的不同问法,每个标准问题都会泛化几个相似问题。随着业务的发展,知识库的问题集需要不断更新以提高客服机器人的回答率。
目前,为了减少维护运营人员的工作量,一般是通过聚类技术把最近机客服机器人未响应的问题进行聚类,然后由运营人员依赖聚类结果和知识库的情况,整理出新的标准问题和对应的相似问题加入到该知识库中以对问题集进行更新。然而,随着业务的发展会持续不断的涌现出大量新的业务问题,仅基于聚类算法针对未响应问题进行聚类的方式,已经无法聚类得出高质量的问题来对问题集进行更新。
发明内容
本发明的主要目的在于提供一种客服问题的更新方法、***、终端设备及计算机存储介质,旨在解决现有仅基于聚类算法针对未响应问题进行聚类的方式,无法聚类得出高质量的问题对智能客服机器人的问题集进行更新的技术问题。
为实现上述目的,本发明实施例提供一种客服问题的更新方法,所述客服问题的更新方法包括:
根据预设客服问题集中的客服问题构建问题对,并将所述问题对组合为训练数据;
基于所述训练数据训练相似度模型,并利用训练收敛的相似度模型计算未响应客服问题的聚类参数;
基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果;
根据所述聚类结果生成新的客服问题以对所述客服问题集进行更新。
优选地,所述客服问题包括标准问题和相似问题,所述根据预设客服问题集中的客服问题构建问题对,并将所述问题对组合为训练数据的步骤,包括:
从预设客服问题集中提取各标准问题和各所述标准问题各自对应的各相似问题;
根据各所述标准问题中的第一标准问题,和所述第一标准问题对应的各相似问题构建得到各相似问题对;
根据所述第一标准问题,和各所述标准问题中的第二标准问题对应的各相似问题构建得到各非相似问题对,其中,所述第一标准问题与所述第二标准问题不相同;
将各所述相似问题对与各所述非相似问题对进行对应组合形成各训练数据。
优选地,所述基于所述训练数据训练相似度模型的步骤,包括:
将所述训练数据切分为第一数据集和第二数据集;
利用所述第一数据集对所述相似度模型进行训练,并利用所述第二数据集对经过训练的相似度模型进行验证;
将通过验证的相似度模型标记为训练收敛的相似度模型,并将训练收敛的相似度模型存储在区块链中。
优选地,所述聚类参数包括:问题句子的向量表示和相似度值,
所述利用训练收敛的相似度模型计算未响应客服问题的聚类参数的步骤,包括:
获取所述未响应客服问题的问题句子和所述问题句子的复制句子,并将所述问题句子和所述复制句子输入训练收敛的相似度模型;
获取训练收敛的相似度模型计算所述问题句子和所述复制句子之间的相似度值的向量平均值;
将所述向量平均值作为所述问题句子的向量表示;
或者,遍历所述问题句子构建句子对,并将所述句子对输入训练收敛的相似度模型;
获取训练收敛的相似度模型对所述句子对进行相似度值计算后输出的相似度值,并将所述相似度值作为所述问题句子的相似度值。
优选地,所述基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果的步骤,包括:
调用预设基于距离的聚类算法,利用所述相似度值对所述未响应客服问题进行聚类得到所述未响应客服问题的聚类结果;
或者,调用预设基于句子表示的聚类算法,利用所述向量表示对所述未响应客服问题进行聚类得到所述未响应客服问题的聚类结果。
优选地,所述根据所述聚类结果生成新的客服问题以对所述预设客服问题集进行更新的步骤,包括:
根据所述聚类结果和所述客服问题集生成新的标准问题和所述新的标准问题对应的相似问题;
为所述新的标准问题和所述新的标准问题对应的相似问题配置各自对应的服务答案;
将所述新的标准问题、所述新的标准问题对应的相似问题以及所述服务答案,添加至所述预设客服问题集以对所述预设客服问题集进行更新。
优选地,所述客服问题的更新方法,还包括:
间隔预设时长采集所述未响应客服问题,并将采集到的所述未响应客服问题存储在区块链中。
此外,为实现上述目的,本发明还提供一种客服问题的更新***,所述客服问题的更新***包括:存储器、处理器,通信总线以及存储在所述存储器上的客服问题的更新程序,
所述通信总线用于实现处理器与存储器间的通信连接;
所述处理器用于执行所述客服问题的更新程序,以实现以下步骤:
根据预设客服问题集中的客服问题构建问题对,并将所述问题对组合为训练数据;
基于所述训练数据训练相似度模型,并利用训练收敛的相似度模型计算未响应客服问题的聚类参数;
基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果;
根据所述聚类结果生成新的客服问题以对所述预设客服问题集进行更新。
优选地,所述客服问题包括标准问题和相似问题,所述根据预设客服问题集中的客服问题构建问题对,并将所述问题对组合为训练数据的步骤,包括:
从预设客服问题集中提取各标准问题和各所述标准问题各自对应的各相似问题;
根据各所述标准问题中的第一标准问题,和所述第一标准问题对应的各相似问题构建得到各相似问题对;
根据所述第一标准问题,和各所述标准问题中的第二标准问题对应的各相似问题构建得到各非相似问题对,其中,所述第一标准问题与所述第二标准问题不相同;
将各所述相似问题对与各所述非相似问题对进行对应组合形成各训练数据。
优选地,所述基于所述训练数据训练相似度模型的步骤,包括:
将所述训练数据切分为第一数据集和第二数据集;
利用所述第一数据集对所述相似度模型进行训练,并利用所述第二数据集对经过训练的相似度模型进行验证;
将通过验证的相似度模型标记为训练收敛的相似度模型,并将训练收敛的相似度模型存储在区块链中。
优选地,所述聚类参数包括:问题句子的向量表示和相似度值,
所述利用训练收敛的相似度模型计算未响应客服问题的聚类参数的步骤,包括:
获取所述未响应客服问题的问题句子和所述问题句子的复制句子,并将所述问题句子和所述复制句子输入训练收敛的相似度模型;
获取训练收敛的相似度模型计算所述问题句子和所述复制句子之间的相似度值的向量平均值;
将所述向量平均值作为所述问题句子的向量表示;
或者,遍历所述问题句子构建句子对,并将所述句子对输入训练收敛的相似度模型;
获取训练收敛的相似度模型对所述句子对进行相似度值计算后输出的相似度值,并将所述相似度值作为所述问题句子的相似度值。
优选地,所述基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果的步骤,包括:
调用预设基于距离的聚类算法,利用所述相似度值对所述未响应客服问题进行聚类得到所述未响应客服问题的聚类结果;
或者,调用预设基于句子表示的聚类算法,利用所述向量表示对所述未响应客服问题进行聚类得到所述未响应客服问题的聚类结果。
优选地,所述根据所述聚类结果生成新的客服问题以对所述预设客服问题集进行更新的步骤,包括:
根据所述聚类结果和所述客服问题集生成新的标准问题和所述新的标准问题对应的相似问题;
为所述新的标准问题和所述新的标准问题对应的相似问题配置各自对应的服务答案;
将所述新的标准问题、所述新的标准问题对应的相似问题以及所述服务答案,添加至所述预设客服问题集以对所述预设客服问题集进行更新。
优选地,所述客服问题的更新方法,还包括:
间隔预设时长采集所述未响应客服问题,并将采集到的所述未响应客服问题存储在区块链中。
此外,为实现上述目的,本发明还提供一种计算机存储介质,所述计算机存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序可被一个或者一个以上的处理器执行以用于:
根据预设客服问题集中的客服问题构建问题对,并将所述问题对组合为训练数据;
基于所述训练数据训练相似度模型,并利用训练收敛的相似度模型计算未响应客服问题的聚类参数;
基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果;
根据所述聚类结果生成新的客服问题以对所述客服问题集进行更新。
本发明提供的客服问题的更新方法、***、终端设备以及计算可读存储介质,通过根据预设客服问题集中的客服问题构建问题对,并将所述问题对组合为训练数据;基于所述训练数据训练相似度模型,并利用训练收敛的相似度模型计算未响应客服问题的聚类参数;基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果;根据所述聚类结果生成新的客服问题以对所述预设客服问题集进行更新。
本发明基于智能客服机器人从预设客服问题集提取客服问题来构建问题对,然后基于问题对进行对应组合得到训练数据,利用该训练数据对相似度模型进行训练,然后基于训练收敛的相似度模型计算客服机器人未响应客服问题的聚类参数,以基于该聚类参数针对该未响应客服问题进行聚类后进行后续更新客服问题集的过程,从而实现了,在简单聚类问题得到新问题的基础上,针对知识库客服问题的变化动态的对未响应客服问题的聚类参数进行自适应学习,从而在聚类时得到更加具有价值的高质量问题来更新客服问题集,提高了智能客服机器人的问题回答效率。
附图说明
图1为本发明实施例方法涉及的终端设备硬件运行环境的结构示意图;
图2为本发明客服问题的更新方法一实施例的流程示意图;
图3为本发明客服问题的更新***的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:根据预设客服问题集中的客服问题构建问题对,并将所述问题对组合为训练数据;基于所述训练数据训练相似度模型,并利用训练收敛的相似度模型计算未响应客服问题的聚类参数;基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果;根据所述聚类结果生成新的客服问题以对所述预设客服问题集进行更新。
由于随着智能客服机器人技术业务的发展,智能客服机器人所依赖FAQ问答模块的重要组成部分-知识库,需要不断更新问题集以提高客服机器人的问题回答效率。而现有技术中为了减少维护运营人员的工作量,一般是通过聚类技术把最近机客服机器人未响应的问题进行聚类,然后由运营人员依赖聚类结果和知识库的情况,整理出新的标准问题和对应的相似问题加入到该知识库中以对问题集进行更新。然而,随着业务的发展会持续不断的涌现出大量新的业务问题,仅基于聚类算法针对未响应问题进行聚类的方式,已经无法聚类得出高质量的问题来对问题集进行更新。
本发明提供的解决方案,基于智能客服机器人从预设客服问题集提取客服问题来构建问题对,然后基于问题对进行对应组合得到训练数据,利用该训练数据对相似度模型进行训练,然后基于训练收敛的相似度模型计算客服机器人未响应客服问题的聚类参数,以基于该聚类参数针对该未响应客服问题进行聚类后进行后续更新客服问题集的过程,从而实现了,在简单聚类问题得到新问题的基础上,针对知识库客服问题的变化动态的对未响应客服问题的聚类参数进行自适应学习,从而在聚类时得到更加具有价值的高质量问题来更新客服问题集,提高了智能客服机器人的问题回答效率。
如图1所示,图1是本发明实施例方案涉及的终端设备硬件运行环境的设备结构示意图。
本发明实施例终端设备可以是智能客服机器人,也可以是PC、智能手机、平板电脑和便携计算机等终端设备。
如图1所示,该终端设备可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选的用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,该终端设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在设备移动到耳边时,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别设备姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;当然,移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的设备结构并不构成对终端设备的限定,在其它实施方式当中,终端设备还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及客服问题的更新程序。
在图1所示的终端设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的客服问题的更新程序,并执行以下步骤:
根据预设客服问题集中的客服问题构建问题对,并将所述问题对组合为训练数据;
基于所述训练数据训练相似度模型,并利用训练收敛的相似度模型计算未响应客服问题的聚类参数;
基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果;
根据所述聚类结果生成新的客服问题以对所述预设客服问题集进行更新。
进一步地,所述客服问题包括标准问题和相似问题,处理器1001可以用于调用存储器1005中存储的客服问题的更新程序,还执行以下步骤:
从预设客服问题集中提取各标准问题和各所述标准问题各自对应的各相似问题;
根据各所述标准问题中的第一标准问题,和所述第一标准问题对应的各相似问题构建得到各相似问题对;
根据所述第一标准问题,和各所述标准问题中的第二标准问题对应的各相似问题构建得到各非相似问题对,其中,所述第一标准问题与所述第二标准问题不相同;
将各所述相似问题对与各所述非相似问题对进行对应组合形成各训练数据。
进一步地,处理器1001可以用于调用存储器1005中存储的客服问题的更新程序,还执行以下步骤:
将所述训练数据切分为第一数据集和第二数据集;
利用所述第一数据集对所述相似度模型进行训练,并利用所述第二数据集对经过训练的相似度模型进行验证;
将通过验证的相似度模型标记为训练收敛的相似度模型,并将训练收敛的相似度模型存储在区块链中。
进一步地,所述聚类参数包括:问题句子的向量表示和相似度值,处理器1001可以用于调用存储器1005中存储的客服问题的更新程序,还执行以下步骤:
获取所述未响应客服问题的问题句子和所述问题句子的复制句子,并将所述问题句子和所述复制句子输入训练收敛的相似度模型;
获取训练收敛的相似度模型计算所述问题句子和所述复制句子之间的相似度值的向量平均值;
将所述向量平均值作为所述问题句子的向量表示;
或者,遍历所述问题句子构建句子对,并将所述句子对输入训练收敛的相似度模型;
获取训练收敛的相似度模型对所述句子对进行相似度值计算后输出的相似度值,并将所述相似度值作为所述问题句子的相似度值。
进一步地,处理器1001可以用于调用存储器1005中存储的客服问题的更新程序,还执行以下步骤:
调用预设基于距离的聚类算法,利用所述相似度值对所述未响应客服问题进行聚类得到所述未响应客服问题的聚类结果;
或者,调用预设基于句子表示的聚类算法,利用所述向量表示对所述未响应客服问题进行聚类得到所述未响应客服问题的聚类结果。
进一步地,处理器1001可以用于调用存储器1005中存储的客服问题的更新程序,还执行以下步骤:
根据所述聚类结果和所述客服问题集生成新的标准问题和所述新的标准问题对应的相似问题;
为所述新的标准问题和所述新的标准问题对应的相似问题配置各自对应的服务答案;
将所述新的标准问题、所述新的标准问题对应的相似问题以及所述服务答案,添加至所述预设客服问题集以对所述预设客服问题集进行更新。
进一步地,处理器1001可以用于调用存储器1005中存储的客服问题的更新程序,还执行以下步骤:
间隔预设时长采集所述未响应客服问题,并将采集到的所述未响应客服问题存储在区块链中。
本发明客服问题的更新方法所涉及终端设备的具体实施例与下述客服问题的更新方法的各具体实施例基本相同,在此不作赘述。
本发明提供一种客服问题的更新方法。
请参照图2,图2为本发明客服问题的更新方法第一实施例的流程示意图,本发明客服问题的更新方法第一实施例应用于智能客服机器人,在本实施例中,该客服问题的更新方法包括:
步骤S100,根据预设客服问题集中的客服问题构建问题对,并将所述问题对组合为训练数据;
智能客服机器人从预设客服问题集中提取客服问题,然后基于该客服问题构建各问题对,最后将该各问题对进行一对一的对应组合形成训练数据。
需要说明的是,在本实施例中,智能客服机器人中的FAQ问答模块具有知识库,该知识库为FAQ问答模块重要的组成部分。预设客服问题集即为该知识库中保存着的客服问题集,该客服问题集由众多标准问题和各标准问题各自对应的一个或者多个相似问题所组成,从而,智能客服机器人通过FAQ问答模块在该知识库中查询与用户提出的客服问题相匹配的标准问题,从而为用户提供满意的答案。此外,智能客服机器人将各问题对进行一对一的对应组合形成的训练数据可以为一个数据集,该数据集由多条训练数据组成。
具体地,例如,智能客服机器人定期或者随机的发起针对客服问题集进行更新的操作,智能客服机器人访问FAQ问答模块的知识库,从该知识库中所存贮的客服问题集中提取标准问题和相似问题,然后基于该标准问题和相似问题构建问题对,最后按照一对一的规则通过对该问题对进行对应组合形成多条训练数据以组成数据集。
进一步地,在一种实施例中,步骤S100中,可以包括:
步骤S101,从预设客服问题集中提取各标准问题和各所述标准问题各自对应的各相似问题;
步骤S102,根据各所述标准问题中的第一标准问题,和所述第一标准问题对应的各相似问题构建得到各相似问题对;
具体地,例如,智能客服机器人在发起针对客服问题集进行更新的操作之后,基于访问FAQ问答模块的知识库,以从该知识库中所存贮的客服问题集中提取多个标准问题和该多个标准问题各自所对应的相似问题,然后,智能客服机器人将该多个标准问题当中的任意一个标准问题与该标准问题的多个相似问题进行随机组合,从而组件得到多个相似问题对。
步骤S103,根据所述第一标准问题,和各所述标准问题中的第二标准问题对应的各相似问题构建得到各非相似问题对;
需要说明的是,在本实施例中,其中,第一标准问题与所述第二标准问题不相同。
具体地,例如,在智能客服机器人基于访问FAQ问答模块的知识库,并从该知识库中所存贮的客服问题集中提取多个标准问题和该多个标准问题各自所对应的相似问题之后,智能客服机器人可以在组建得到相似问题对的同时,同步执行(当然也可以异步执行)组建非相似问题对的操作,即,智能客服机器人将多个标准问题当中的任意一个标准问题,与该多个标准问题当中除该标准问题之外的其他任意一个标准问题的多个相似问题进行随机组合,从而得到多个非相似问题对。
步骤S104,将各所述相似问题对与各所述非相似问题对进行对应组合形成各训练数据。
具体地,例如,智能客服机器人将组合形成的该多个相似问题对和多个非相似问题对,按照一个相似问题对和一个非相似问题对的规则进行对应组合从而形成一条训练数据,然后将按照上述规则构建得到的多条训练数据组成数据集。
进一步地,在另一种实施例中,智能客服机器人在基于多个相似问题对和多个非相似问题对组合形成训练数据时,还可以按照一个相似问题对和多个非相似问题对来组合形成一条训练数据,从而构建得到多条训练数据以组成数据集。
需要说明的是,在本实施例中,组成同一条训练数据的相似问题对和非相似问题对各自的标准问题相同,可以理解的时,基于实际应用的不同设计需要,组成同一条训练数据的相似问题对和非相似问题对各自的标准问题也可以不相同,本发明客服问题的更新方法并不对该训练数据中相似问题对和非相似问题对的组合形式进行具体限定。
步骤S200,基于所述训练数据训练相似度模型,并利用训练收敛的相似度模型计算未响应客服问题的聚类参数;
智能客服机器人在从预设知识库中提取客服问题集,然后基于该客服问题集构建得到训练数据之后,智能客服机器人利用该训练数据对相似度模型进行训练直到该相似度模型收敛,然后,智能客服机器人利用基于该训练数据训练到收敛的相似度模型,针对未作出回答的未响应客服问题进行计算得到后续针对该未响应客服问题进行聚类的聚类参数。
需要说明的是,在本实施例中,相似度模型具体可以为bert模型(BidirectionalEncoder Representations from Transformers,是近期Google提出的效果非常好的通用预训练语言表示模型)、xlnet(一种通用的自回归预训练方法)模型、siamesecnn(孪生卷积)网络、siameselstm(孪生)网络等模型中的任意一种。此外,未响应客服问题为智能客服机器人在整个运行过程中,针对用户所提出的客服问题未能够成功匹配到标准问题,从而没有得到答案以向用户输出时,智能客服机器人记录的该客服问题(即,未响应客服问题为智能客服机器人未做出回答的客服问题)。
具体地,例如,智能客服机器人以bert模型作为相似度模型,智能客服机器人在基于多个相似问题对和多个非相似问题对构建得到多条训练数据之后,将该多条训练数据中的部分训练数据作为训练样本输入至bert模型以对该bert模型进行训练,直到智能客服机器人校验到该bert模型收敛之后,利用已经训练收敛的该bert模型,计算预先记录的一个或者多个未响应客服问题的聚类参数,以便后续基于该聚类参数对该未响应客服问题进行聚类运算。
步骤S300,基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果;
智能客服机器人通过调用现有成熟的聚类算法,在基于训练收敛的相似度模型计算输出未响应客服问题的聚类参数之后,利用该距离参数对该未响应客服问题进行聚类运算,从而得到该未响应客服问题的聚类结果。
步骤S400,根据所述聚类结果生成新的客服问题以对所述客服问题集进行更新。
智能客服机器人在通过聚类运算得到未响应客服问题的聚类结果之后,自动根据该聚类结果和FAQ问答模块的知识库中贮存的客服问题集,整理得到新的客服问题,然后将该新的客服问题添加至该知识库中的客服问题集当中,从而完成对该客服问题集的更新。
需要说明的是,在本实施例中,智能客服机器人还可以在通过聚类运算得到未响应客服问题的聚类结果之后,将该聚类结果输出至该智能客服机器人的运营人员,从而辅助该运营人员根据该聚类结果和FAQ问答模块的知识库中贮存的客服问题集,整理得到新的客服问题,然后智能客服机器人接收运营人员输入的新的客服问题,并将该新的客服问题添加至该知识库中的客服问题集当中,从而完成对该客服问题集的更新。
在本实施例中,通过智能客服机器人从预设知识库中提取客服问题集,然后基于该客服问题集构建训练数据;在从预设知识库中提取客服问题集,然后基于该客服问题集构建得到训练数据之后,智能客服机器人利用该训练数据对相似度模型进行训练直到该相似度模型收敛,然后,智能客服机器人利用基于该训练数据训练到收敛的相似度模型,针对未作出回答的未响应客服问题进行计算得到后续针对该未响应客服问题进行聚类的聚类参数;在基于训练收敛的相似度模型计算输出未响应客服问题的聚类参数之后,智能客服机器人利用该距离参数对该未响应客服问题进行聚类运算,从而得到该未响应客服问题的聚类结果;最后,智能客服机器人自动根据该聚类结果和FAQ问答模块的知识库中贮存的客服问题集,整理得到新的客服问题,然后将该新的客服问题添加至该知识库中的客服问题集当中,从而完成对该客服问题集的更新。
实现了基于智能客服机器人从预设客服问题集提取客服问题来构建问题对,然后基于问题对进行对应组合得到训练数据,利用该训练数据对相似度模型进行训练,然后基于训练收敛的相似度模型计算客服机器人未响应客服问题的聚类参数,以基于该聚类参数针对该未响应客服问题进行聚类后进行后续更新客服问题集的过程,从而实现了,在简单聚类问题得到新问题的基础上,针对知识库客服问题的变化动态的对未响应客服问题的聚类参数进行自适应学习,从而在聚类时得到更加具有价值的高质量问题来更新客服问题集,提高了智能客服机器人的问题回答效率。
进一步地,在本发明客服问题的更新方法第一实施例的基础上,提出客服问题的更新方法第二实施例,在本实施例中,上述步骤S200中,“基于所述训练数据训练相似度模型”的步骤,可以包括:
步骤S201,将所述训练数据切分为第一数据集和第二数据集;
智能客服机器人在基于预设知识库,以从该预设知识库中所存贮的客服问题集中提取标准问题和该标准问题各自所对应的相似问题,然后组合得到相似问题对以及非相似问题对,并将该相似问题对和非相似问题对构建得到训练数据的数据集之后,智能客服机器人按照预设比例或者随机对该数据集进行切分,从而得到第一数据集和第二数据集。
需要说明的是,在本实施例中,预设比例可以为运营人员基于设计需要设置的比例,应当理解的是,基于实际应用的不同设计需要,该预设比例可以被设置为任意数值的比例,本发明客服问题的更新方法并不对该预设比例的大小进行具体的限定。
步骤S202,利用所述第一数据集对所述相似度模型进行训练,并利用所述第二数据集对经过训练的相似度模型进行验证;
智能客服机器人在按照预设比例或者随机的将训练数据的数据集切分为第一数据集和第二数据集之后,智能客服机器人将第一数据集中的训练数据输入至相似度模型以对该相似度模型进行训练,并在利用该训练数据针对相似度模型的每一轮训练结束之后,随即将第二数据集中的训练数据输入至该相似度训练模型,以根据该相似度模型的输出结果验证该相似度模型是否在当前轮的训练结束之后即已经收敛。
进一步地,在另一种实施例中,智能客服机器人也可以将第二数据集中的训练数据输入至相似度模型以对该相似度模型进行训练,并在利用该训练数据针对相似度模型的每一轮训练结束之后,随即将第一数据集中的训练数据输入至该相似度训练模型,以根据该相似度模型的输出结果验证该相似度模型是否在当前轮的训练结束之后即已经收敛。
步骤S203,将通过验证的相似度模型标记为训练收敛的相似度模型,并将训练收敛的相似度模型存储在区块链中。
若智能客服机器人在将第二数据集中的训练数据,输入至经过训练之后的相似度训练模型,并根据该相似度模型的输出结果验证该相似度模型已经训练收敛之后,确认利用第二数据集针对该相似度模型的验证已经通过,并即时将该相似度模型标记为训练收敛的相似度模型,然后将该训练收敛的相似度模型存储在一区块链的节点当中。
需要说明的是,在本实施例中,为了保证训练收敛的相似度模型不会被错误修改或者移除,可以将训练收敛的相似度模型存储于一区块链的节点中,确保了该索引标签的安全性,更确保了后续在基于训练收敛的相似度模型针对智能客服机器人的未响应客服问题进行聚类参数计算的准确性,进一步提升了智能客服机器人自适应学习新业务问题的效率。
在本实施例中,智能客服机器人通过将构建得到的训练数据的数据集切分为第一数据集和第二数据集;然后,利用第一数据集中的训练数据对相似度模型进行训练,并在每一轮次的训练结束之后,利用第二数据集中的训练数据对经过训练的相似度模型进行验证;最后,将通过验证的相似度模型标记为训练收敛的相似度模型,并将该训练收敛的相似度模型存储在区块链中以供后续调用。实现了,根据目前FAQ问答模块的知识库中贮存的客服问题集(标准问题+标准问题的相似问题)构建由相似问题对和非相似问题对组成的数据集,然后在该数据集的基础上训练相似度模型以用以后续自适应学习未响应客服问题的聚类参数,从而保证在针对该未响应客服问题进行聚类时,能够得到更有价值的新问题以对客服问题集进行更新,提高了智能客服机器人的问题回答效率。
进一步地,在本发明客服问题的更新方法第一实施例的基础上,提出本发明客服问题的更新方法的第三实施例,在本实施例中,本发明客服问题的更新方法,还可以包括:
步骤A,间隔预设时长采集所述未响应客服问题,并将采集到的所述未响应客服问题存储在区块链中。
需要说明的是,在本实施例中,智能客服机器人在持续运营的过程中会遭遇到无法向用户输出答案的未响应客服问题,从而智能客服机器人可以预先建立一个临时的存储空间,一旦在遭遇到无法向用户输出答案的未响应客服问题时,便将该未响应客服问题缓存至该存储空间当中。此外,预设时长具体可以为24小时,应当理解的是,基于实际应用的不同设计需要,该预设时长当然也可以为其它任意时长,本发明客服问题的更新方法并不对该预设时长进行具体地限定。
具体地,例如,智能客服机器人在每天的凌晨0:00,从预先建立的临时存储空间中,获取自该0:00之前的24小时内,智能客服机器人在运营过程中所记录的为对用户所提出的客服问题输出答案的未响应客服问题,然后将该未响应客服问题存储在一区块链的节点当中以供后续调用。
进一步地,在另一种实施例中,智能客服机器人还可以直接在预先建立的临时存储空间中,对0:00之前的24小时内,智能客服机器人在运营过程中所记录的为对用户所提出的客服问题输出答案的未响应客服问题,进行持久化缓存,以供后续计算该未响应客服问题的聚类参数和进行聚类运算时直接调用。
进一步地,在本实施例中,智能客服机器人利用已经训练收敛的相似度模型计算得到的未响应客服问题的聚类参数,包括但不限于:未响应客服问题的问题句子的向量表示,和该问题句子的相似度值,上述步骤S200中,“利用训练收敛的相似度模型计算未响应客服问题的聚类参数”的步骤,可以包括:
步骤S204,获取所述未响应客服问题的问题句子和所述问题句子的复制句子,并将所述问题句子和所述复制句子输入训练收敛的相似度模型;
智能客服机器人在获取得到未响应客服问题之后,通过现有成熟的语言处理技术读取该未响应客服问题的问题句子,并对该问题句子进行复制得到该问题句子的复制句子,然后,智能客服机器人将该问题句子和该问题句子的复制句子输入至训练收敛的相似度模型当中。
具体地,例如,在智能客服机器人将从区块链的节点中获取到一个或者多个未响应客服问题之后,调用现有任意成熟的自然语言处理技术,逐一读取该未响应客服问题的文本作为问题句子,并继续针对该问题句子进行复制得到各问题句子对应的复制句子,然后,智能客服机器人逐一将该问题句子和该问题句子所对应的复制句子,输入到同样从区块链的节点中获取到的已经训练收敛的相似度模型当中。
步骤S205,获取训练收敛的相似度模型计算所述问题句子和所述复制句子之间的相似度值的向量平均值;
步骤S206,将所述向量平均值作为所述问题句子的向量表示;
智能客服机器人在将未响应客服问题的问题句子和问题句子对应的复制句子输入至已经训练收敛的相似度模型当中之后,在该相似度模型计算该问题句子与复制句子之间相似度值时,获取该问题句子的向量与复制句子的向量,然后计算该问题句子的向量与复制句子的向量的向量平均值,并将该向量平均值作为未响应客服问题的问题句子的向量表示。
进一步地,在另一种实施例中,上述步骤上述步骤S200中,“利用训练收敛的相似度模型计算未响应客服问题的聚类参数”的步骤,还可以包括:
步骤S207,遍历所述问题句子构建句子对,并将所述句子对输入训练收敛的相似度模型;
步骤S208,获取训练收敛的相似度模型对所述句子对进行相似度值计算后输出的相似度值,并将所述相似度值作为所述问题句子的相似度值。
智能客服机器人在获取得到未响应客服问题,并通过现有成熟的语言处理技术读取该未响应客服问题的问题句子,遍历该问题句子以按照当前问题句子和与当前问题句子相似的其他问题句子来构建句子对,然后将该句子对输入到已经训练收敛的相似度模型当中,以供该相似度模型针对该句子对计算问题句子与问题句子相似的其他问题句子之间的相似度值。最后,智能客服机器人将该相似度模型基于输入的句子对进行相似度值计算后输出的该相似度值,并将该相似度值作为未响应客服问题的问题句子的相似度值。
进一步地,在本实施例中,上述步骤S300,基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果,可以包括:
步骤S301,调用预设基于距离的聚类算法,利用所述相似度值对所述未响应客服问题进行聚类得到所述未响应客服问题的聚类结果;
智能客服机器人针对利用已经训练收敛的相似度模型输出的未响应客服问题的问题句子的相似度值,调用现有成熟的预设基于距离的聚类算法利用该相似度值对该未响应客服问题机型聚类运算,从而得到该未响应客服问题的聚类结果。
需要说明的是,在本实施例中,预设基于距离的聚类算法包括但不限于:affinitypropagation(一种AP聚类算法,从广义的角度说,affinity propagation属于message-passing algorithms(消息传递算法)的一种)、spectral clustering(谱聚类算法)。
进一步地,在本实施例中,上述步骤S300,还可以包括:
步骤S302,调用预设基于句子表示的聚类算法,利用所述向量表示对所述未响应客服问题进行聚类得到所述未响应客服问题的聚类结果。
智能客服机器人针对利用已经训练收敛的相似度模型,在该相似度模型计算该问题句子与复制句子之间相似度值时,获取该问题句子的向量与复制句子的向量,并计算得到的未响应客服问题的问题句子的向量表示,调用现有成熟的预设基于句子表示的聚类算法利用该向量表示对该未响应客服问题机型聚类运算,从而得到该未响应客服问题的聚类结果。
需要说明的是,在本实施例中,预设基于句子表示的聚类算法包括但不限于:k-means(k-means clustering algorithm:k均值聚类算法,是一种迭代求解的聚类分析算法)、dbscan(DBSCAN(Density-Based Spatial Clustering of Applications withNoise,是一个比较有代表性的基于密度的聚类算法)以及层次聚类算法。
在本实施例中,智能客服机器人间隔预设时长采集未响应客服问题,并将采集到的未响应客服问题存储在区块链中或者直接针对该未响应客服问题做持久缓存。
在智能客服机器人计算该未响应客服问题的聚类参数(未响应客服问题的问题句子的向量表示和相似度值)时,获取该未响应客服问题的问题句子和问题句子的复制句子,并将问题句子和复制句子输入训练收敛的相似度模型;然后获取训练收敛的相似度模型在计算该问题句子和该复制句子之间的相似度值的向量平均值;并将该向量平均值作为向量表示;或者,通过遍历问题句子以构建句子对,并将句子对输入训练收敛的相似度模型;然后获取训练收敛的相似度模型对句子对进行相似度值计算后输出的相似度值,并将该相似度值作为问题句子的相似度值。此外,
在智能客服机器人针对该未响应客服问题进行聚类操作时,调用预设基于距离的聚类算法,利用问题句子的相似度值对未响应客服问题进行聚类得到该未响应客服问题的聚类结果;或者,调用预设基于句子表示的聚类算法,利用问题句子的向量表示对未响应客服问题进行聚类得到该未响应客服问题的聚类结果。
实现了,在传统简单针对未响应客服问题进行聚类得到新问题的基础上,进一步针对知识库客服问题的变化动态的对未响应客服问题的聚类参数进行自适应学习,从而在针对针对未响应客服问题进行聚类时能够得到更加具有价值的高质量问题来更新客服问题,提高了智能客服机器人的问题回答效率。
进一步地,在本发明客服问题的更新方法第一实施例的基础上,提出本发明客服问题的更新方法第四实施例,在本实施例中,上述步骤S400,根据所述聚类结果生成新的客服问题以对所述客服问题集进行更新,可以包括:
步骤S401,根据所述聚类结果和所述客服问题集生成新的标准问题和所述新的标准问题对应的相似问题;
智能客服机器人在针对未响应客服问题进行聚类得到聚类结果之后,结合该聚类结果,和FAQ问答模块的知识库中贮存的客服问题集中现有的标准问题和相似问题,整理生成新的标准问题和该新的标准问题的相似问题。
步骤S402,为所述新的标准问题和所述新的标准问题对应的相似问题配置各自对应的服务答案;
步骤S403,将所述新的标准问题、所述新的标准问题对应的相似问题以及所述服务答案,添加至所述客服问题集以对所述客服问题集进行更新。
智能客服机器人在整理生成新的标准问题以及该新的标准问题对应的相似问题之后,智能客服机器人分别针对该新的标准问题和该相似问题配置不同场景下各自对应的服务答案,然后,智能客服机器人建立该新的标准问题与其对应的服务答案之间、该新的标准问题的相似问题与其对应的服务答案之间的关联关系,然后将新的标准问题和其对应的服务答案、新的标准问题的相似问题与其对应的服务答案,添加至FAQ问答模块的知识库中贮存的客服问题集中,以实现对该客服问题集的更新。
进一步地,在一种实施例中,智能客服机器人在针对未响应客服问题进行聚类得到聚类结果之后,还可以将该聚类结果直接面向运营人员进行输出,以辅助运营人员根据该聚类结果和FAQ问答模块的知识库中贮存的客服问题集中现有的标准问题和相似问题,整理生成新的标准问题和该新的标准问题的相似问题,并由该运营人员执行后续为新的标准问题和该新的标准问题的相似问题配置各自对应的服务答案的过程,然后接收运营人员所输入的新的标准问题和其对应的服务答案、新的标准问题的相似问题与其对应的服务答案,并将该新的标准问题和其对应的服务答案、新的标准问题的相似问题与其对应的服务答案,添加至FAQ问答模块的知识库中贮存的客服问题集中,以实现对该客服问题集的更新。
在本实施例中,根据利用训练收敛的相似度模型所计算得到的未响应客服问题的聚类参数,针对未响应客服问题进行聚类运算得到聚类结果,然后基于该聚类结果和现有的客服问题集,整理生成新的标准问题和该新的标准问题对应的相似问题;然后为该新的标准问题和该新的标准问题对应的相似问题配置各自对应的服务答案;最后将新的标准问题、新的标准问题对应的相似问题以及各自对应的服务答案,添加至现有的客服问题集以对客服问题集进行更新。实现了利用机器学习模型动态的对未响应客服问题的聚类参数进行自适应学习,从而在针对针对未响应客服问题进行聚类时能够得到更加具有价值的高质量问题来更新客服问题,提高了智能客服机器人的问题回答效率。
此外,本发明还提供了客服问题的更新***,请参照图3,图3为本发明客服问题的更新***的功能模块示意图,该客服问题的更新***包括:
构建模块101,用于根据预设客服问题集中的客服问题构建问题对,并将所述问题对组合为训练数据;
学习模块102,用于基于所述训练数据训练相似度模型,并利用训练收敛的相似度模型计算未响应客服问题的聚类参数;
聚类模块103,用于基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果;
更新模块104,用于根据所述聚类结果生成新的客服问题以对所述预设客服问题集进行更新。
优选地,所述客服问题包括标准问题和相似问题,构建模块101,包括:
提取单元,用于从预设客服问题集中提取各标准问题和各所述标准问题各自对应的各相似问题;
第一构建单元,用于根据各所述标准问题中的第一标准问题,和所述第一标准问题对应的各相似问题构建得到各相似问题对;
第一构建单元,用于根据所述第一标准问题,和各所述标准问题中的第二标准问题对应的各相似问题构建得到各非相似问题对,其中,所述第一标准问题与所述第二标准问题不相同;
数据组合单元,用于将各所述相似问题对与各所述非相似问题对进行对应组合形成各训练数据。
优选地,学习模块102,包括:
切分单元,用于将所述训练数据切分为第一数据集和第二数据集;
模型训练单元,用于利用所述第一数据集对所述相似度模型进行训练,并利用所述第二数据集对经过训练的相似度模型进行验证;
存储单元,用于将通过验证的相似度模型标记为训练收敛的相似度模型,并将训练收敛的相似度模型存储在区块链中。
优选地,所述聚类参数包括:问题句子的向量表示和相似度值,学习模块102,还包括:
获取单元,用于获取所述未响应客服问题的问题句子和所述问题句子的复制句子,并将所述问题句子和所述复制句子输入训练收敛的相似度模型;
计算单元,用于获取训练收敛的相似度模型计算所述问题句子和所述复制句子之间的相似度值的向量平均值;
第一标记单元,用于将所述向量平均值作为所述问题句子的向量表示;
输入单元,用于遍历所述问题句子构建句子对,并将所述句子对输入训练收敛的相似度模型;
第二标记单元,用于获取训练收敛的相似度模型对所述句子对进行相似度值计算后输出的相似度值,并将所述相似度值作为所述问题句子的相似度值。
优选地,聚类模块103,包括:
第一聚类运算单元,用于调用预设基于距离的聚类算法,利用所述相似度值对所述未响应客服问题进行聚类得到所述未响应客服问题的聚类结果;
第二聚类运算单元,用于调用预设基于句子表示的聚类算法,利用所述向量表示对所述未响应客服问题进行聚类得到所述未响应客服问题的聚类结果。
优选地,更新模块104,包括:
整理单元,用于根据所述聚类结果和所述客服问题集生成新的标准问题和所述新的标准问题对应的相似问题;
配置单元,用于为所述新的标准问题和所述新的标准问题对应的相似问题配置各自对应的服务答案;
更新单元,用于将所述新的标准问题、所述新的标准问题对应的相似问题以及所述服务答案,添加至所述预设客服问题集以对所述预设客服问题集进行更新。
优选地,本发明客服问题的更新***,还包括:
采集模块,用于间隔预设时长采集所述未响应客服问题,并将采集到的所述未响应客服问题存储在区块链中。
本发明客服问题的更新***的具体实施方式与上述客服问题的更新方法各实施例基本相同,在此不再赘述。
此外,本发明还提供了一种计算机存储介质,该计算机存储介质存储有一个或者一个以上程序,该一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于:
根据预设客服问题集中的客服问题构建问题对,并将所述问题对组合为训练数据;
基于所述训练数据训练相似度模型,并利用训练收敛的相似度模型计算未响应客服问题的聚类参数;
基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果;
根据所述聚类结果生成新的客服问题以对所述预设客服问题集进行更新。
此外,该一个或者一个以上程序还可被一个或者一个以上的处理器执行还用于:
间隔预设时长采集所述未响应客服问题,并将采集到的所述未响应客服问题存储在区块链中。
本发明计算机存储介质具体实施方式与上述客服问题的更新方法各实施例基本相同,在此不再赘述。
需要说明的是,本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。此外,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种客服问题的更新方法,其特征在于,所述客服问题的更新方法包括:
根据预设客服问题集中的客服问题构建问题对,并将所述问题对组合为训练数据;
基于所述训练数据训练相似度模型,并利用训练收敛的相似度模型计算未响应客服问题的聚类参数;
基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果;
根据所述聚类结果生成新的客服问题以对所述预设客服问题集进行更新。
2.如权利要求1所述的客服问题的更新方法,其特征在于,所述客服问题包括标准问题和相似问题,所述根据预设客服问题集中的客服问题构建问题对,并将所述问题对组合为训练数据的步骤,包括:
从预设客服问题集中提取各标准问题和各所述标准问题各自对应的各相似问题;
根据各所述标准问题中的第一标准问题,和所述第一标准问题对应的各相似问题构建得到各相似问题对;
根据所述第一标准问题,和各所述标准问题中的第二标准问题对应的各相似问题构建得到各非相似问题对,其中,所述第一标准问题与所述第二标准问题不相同;
将各所述相似问题对与各所述非相似问题对进行对应组合形成各训练数据。
3.如权利要求1所述的客服问题的更新方法,其特征在于,所述基于所述训练数据训练相似度模型的步骤,包括:
将所述训练数据切分为第一数据集和第二数据集;
利用所述第一数据集对所述相似度模型进行训练,并利用所述第二数据集对经过训练的相似度模型进行验证;
将通过验证的相似度模型标记为训练收敛的相似度模型,并将训练收敛的相似度模型存储在区块链中。
4.如权利要求1所述的客服问题的更新方法,其特征在于,所述聚类参数包括:问题句子的向量表示和相似度值,
所述利用训练收敛的相似度模型计算未响应客服问题的聚类参数的步骤,包括:
获取所述未响应客服问题的问题句子和所述问题句子的复制句子,并将所述问题句子和所述复制句子输入训练收敛的相似度模型;
获取训练收敛的相似度模型计算所述问题句子和所述复制句子之间的相似度值的向量平均值;
将所述向量平均值作为所述问题句子的向量表示;
或者,遍历所述问题句子构建句子对,并将所述句子对输入训练收敛的相似度模型;
获取训练收敛的相似度模型对所述句子对进行相似度值计算后输出的相似度值,并将所述相似度值作为所述问题句子的相似度值。
5.如权利要求4所述的客服问题的更新方法,其特征在于,所述基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果的步骤,包括:
调用预设基于距离的聚类算法,利用所述相似度值对所述未响应客服问题进行聚类得到所述未响应客服问题的聚类结果;
或者,调用预设基于句子表示的聚类算法,利用所述向量表示对所述未响应客服问题进行聚类得到所述未响应客服问题的聚类结果。
6.如权利要求1所述的客服问题的更新方法,其特征在于,所述根据所述聚类结果生成新的客服问题以对所述预设客服问题集进行更新的步骤,包括:
根据所述聚类结果和所述客服问题集生成新的标准问题和所述新的标准问题对应的相似问题;
为所述新的标准问题和所述新的标准问题对应的相似问题配置各自对应的服务答案;
将所述新的标准问题、所述新的标准问题对应的相似问题以及所述服务答案,添加至所述预设客服问题集以对所述预设客服问题集进行更新。
7.如权利要求1所述的客服问题的更新方法,其特征在于,所述客服问题的更新方法,还包括:
间隔预设时长采集所述未响应客服问题,并将采集到的所述未响应客服问题存储在区块链中。
8.一种客服问题的更新***,其特征在于,所述客服问题的更新***包括:
构建模块,用于根据预设客服问题集中的客服问题构建问题对,并将所述问题对组合为训练数据;
学习模块,用于基于所述训练数据训练相似度模型,并利用训练收敛的相似度模型计算未响应客服问题的聚类参数;
聚类模块,用于基于所述聚类参数进行聚类运算得到所述未响应客服问题的聚类结果;
更新模块,用于根据所述聚类结果生成新的客服问题以对所述预设客服问题集进行更新。
9.一种终端设备,其特征在于,所述终端设备包括:存储器、处理器,通信总线以及存储在所述存储器上的客服问题的更新程序,
所述通信总线用于实现处理器与存储器间的通信连接;
所述处理器用于执行所述基于互联网的客服问题的更新程序,以实现如权利要求1至7中任一项所述的客服问题的更新方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有客服问题的更新程序,所述客服问题的更新程序被处理器执行时实现如权利要求1至7中任一项所述的客服问题的更新方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010595834.7A CN111813910B (zh) | 2020-06-24 | 2020-06-24 | 客服问题的更新方法、***、终端设备及计算机存储介质 |
PCT/CN2020/118487 WO2021114834A1 (zh) | 2020-06-24 | 2020-09-28 | 客服问题的更新方法、***、终端设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010595834.7A CN111813910B (zh) | 2020-06-24 | 2020-06-24 | 客服问题的更新方法、***、终端设备及计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111813910A true CN111813910A (zh) | 2020-10-23 |
CN111813910B CN111813910B (zh) | 2024-05-31 |
Family
ID=72855522
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010595834.7A Active CN111813910B (zh) | 2020-06-24 | 2020-06-24 | 客服问题的更新方法、***、终端设备及计算机存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111813910B (zh) |
WO (1) | WO2021114834A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112328748A (zh) * | 2020-11-11 | 2021-02-05 | 上海昌投网络科技有限公司 | 一种用于保险配置意图识别的方法 |
CN112541360A (zh) * | 2020-12-07 | 2021-03-23 | 国泰君安证券股份有限公司 | 利用超参自适用dbscan聚类的跨平台异常识别转译方法、装置、处理器及存储介质 |
CN112988999A (zh) * | 2021-03-17 | 2021-06-18 | 平安科技(深圳)有限公司 | 佛学问答对的构建方法、装置、设备及存储介质 |
CN116910259A (zh) * | 2023-09-12 | 2023-10-20 | 深圳须弥云图空间科技有限公司 | 一种知识库的知识诊断方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100262568A1 (en) * | 2009-04-10 | 2010-10-14 | Microsoft Corporation | Scalable Clustering |
US20190102652A1 (en) * | 2016-08-31 | 2019-04-04 | Tencent Technology (Shenzhen) Company Limited | Information pushing method, storage medium and server |
CN110032632A (zh) * | 2019-04-04 | 2019-07-19 | 平安科技(深圳)有限公司 | 基于文本相似度的智能客服问答方法、装置及存储介质 |
CN110263141A (zh) * | 2019-06-25 | 2019-09-20 | 杭州微洱网络科技有限公司 | 一种基于bert的客服问答*** |
CN110825866A (zh) * | 2020-01-13 | 2020-02-21 | 江苏联著实业股份有限公司 | 一种基于深度网络和文本相似度的自动问答***及装置 |
CN111125334A (zh) * | 2019-12-20 | 2020-05-08 | 神思电子技术股份有限公司 | 一种基于预训练的搜索问答*** |
US20200151395A1 (en) * | 2017-10-23 | 2020-05-14 | Alibaba Group Holding Limited | Cluster-based word vector processing method, device, and apparatus |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102903008B (zh) * | 2011-07-29 | 2016-05-18 | 国际商业机器公司 | 用于计算机问答的方法及*** |
CN105975460A (zh) * | 2016-05-30 | 2016-09-28 | 上海智臻智能网络科技股份有限公司 | 问句信息处理方法及装置 |
CN107562789A (zh) * | 2017-07-28 | 2018-01-09 | 深圳前海微众银行股份有限公司 | 知识库问题更新方法、客服机器人以及可读存储介质 |
CN108804567A (zh) * | 2018-05-22 | 2018-11-13 | 平安科技(深圳)有限公司 | 提高智能客服应答率的方法、设备、存储介质及装置 |
CN110555101A (zh) * | 2019-09-09 | 2019-12-10 | 浙江诺诺网络科技有限公司 | 一种客服知识库更新方法、装置、设备及存储介质 |
CN110909165B (zh) * | 2019-11-25 | 2022-09-13 | 杭州网易再顾科技有限公司 | 数据处理方法、装置、介质及电子设备 |
CN110955766A (zh) * | 2019-11-29 | 2020-04-03 | 支付宝(杭州)信息技术有限公司 | 一种自动扩充智能客服标准问题对的方法和*** |
-
2020
- 2020-06-24 CN CN202010595834.7A patent/CN111813910B/zh active Active
- 2020-09-28 WO PCT/CN2020/118487 patent/WO2021114834A1/zh active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100262568A1 (en) * | 2009-04-10 | 2010-10-14 | Microsoft Corporation | Scalable Clustering |
US20190102652A1 (en) * | 2016-08-31 | 2019-04-04 | Tencent Technology (Shenzhen) Company Limited | Information pushing method, storage medium and server |
US20200151395A1 (en) * | 2017-10-23 | 2020-05-14 | Alibaba Group Holding Limited | Cluster-based word vector processing method, device, and apparatus |
CN110032632A (zh) * | 2019-04-04 | 2019-07-19 | 平安科技(深圳)有限公司 | 基于文本相似度的智能客服问答方法、装置及存储介质 |
CN110263141A (zh) * | 2019-06-25 | 2019-09-20 | 杭州微洱网络科技有限公司 | 一种基于bert的客服问答*** |
CN111125334A (zh) * | 2019-12-20 | 2020-05-08 | 神思电子技术股份有限公司 | 一种基于预训练的搜索问答*** |
CN110825866A (zh) * | 2020-01-13 | 2020-02-21 | 江苏联著实业股份有限公司 | 一种基于深度网络和文本相似度的自动问答***及装置 |
Non-Patent Citations (2)
Title |
---|
梁敬东;崔丙剑;姜海燕;沈毅;谢元澄;: "基于word2vec和LSTM的句子相似度计算及其在水稻FAQ问答***中的应用", 南京农业大学学报, no. 05 * |
王瑞;向新;肖冰松;: "聚簇的分布式SVM算法优化", 空军工程大学学报(自然科学版), no. 02 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112328748A (zh) * | 2020-11-11 | 2021-02-05 | 上海昌投网络科技有限公司 | 一种用于保险配置意图识别的方法 |
CN112541360A (zh) * | 2020-12-07 | 2021-03-23 | 国泰君安证券股份有限公司 | 利用超参自适用dbscan聚类的跨平台异常识别转译方法、装置、处理器及存储介质 |
CN112988999A (zh) * | 2021-03-17 | 2021-06-18 | 平安科技(深圳)有限公司 | 佛学问答对的构建方法、装置、设备及存储介质 |
CN116910259A (zh) * | 2023-09-12 | 2023-10-20 | 深圳须弥云图空间科技有限公司 | 一种知识库的知识诊断方法及装置 |
CN116910259B (zh) * | 2023-09-12 | 2024-04-16 | 深圳须弥云图空间科技有限公司 | 一种知识库的知识诊断方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111813910B (zh) | 2024-05-31 |
WO2021114834A1 (zh) | 2021-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7104683B2 (ja) | 情報を生成する方法および装置 | |
CN111813910B (zh) | 客服问题的更新方法、***、终端设备及计算机存储介质 | |
CN109684047A (zh) | 事件处理方法、装置、设备和计算机存储介质 | |
CN114787814A (zh) | 指代解析 | |
CN110933225B (zh) | 通话信息获取方法、装置、存储介质及电子设备 | |
CN115512005A (zh) | 一种数据处理方法及其装置 | |
CN114357278B (zh) | 一种话题推荐方法、装置及设备 | |
CN111651989B (zh) | 命名实体识别方法和装置、存储介质及电子装置 | |
CN113822460A (zh) | 一种交通流量预测方法、装置、电子设备和存储介质 | |
CN112084959A (zh) | 一种人群图像处理方法及装置 | |
CN112862021B (zh) | 一种内容标注方法和相关装置 | |
US20210357682A1 (en) | Artificial intelligence driven image retrieval | |
CN110392115B (zh) | 区块链节点管理方法、装置和可读存储介质 | |
CN116910201A (zh) | 一种对话数据生成方法及其相关设备 | |
CN116910202A (zh) | 一种数据处理方法及相关设备 | |
CN113486260B (zh) | 互动信息的生成方法、装置、计算机设备及存储介质 | |
US20230306602A1 (en) | Information generation method and apparatus, electronic device, and computer readable medium | |
WO2021098876A1 (zh) | 一种基于知识图谱的问答方法及装置 | |
CN112307186A (zh) | 基于情绪识别的问答服务方法、***、终端设备及介质 | |
CN113628080B (zh) | 一种分数预测方法、装置、存储介质和电子设备 | |
CN114722234B (zh) | 基于人工智能的音乐推荐方法、装置、存储介质 | |
CN117059082B (zh) | 基于大模型的外呼通话方法、装置、介质和计算机设备 | |
CN118035945B (zh) | 一种标签识别模型的处理方法和相关装置 | |
US20230316138A1 (en) | Sharing ai-chat bot context | |
CN117493594A (zh) | 游戏资源的查询方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |