CN109344227A - 工单处理方法、***和电子设备 - Google Patents

工单处理方法、***和电子设备 Download PDF

Info

Publication number
CN109344227A
CN109344227A CN201810682171.5A CN201810682171A CN109344227A CN 109344227 A CN109344227 A CN 109344227A CN 201810682171 A CN201810682171 A CN 201810682171A CN 109344227 A CN109344227 A CN 109344227A
Authority
CN
China
Prior art keywords
work order
type
answer
classification
order problem
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810682171.5A
Other languages
English (en)
Inventor
邹斯韬
汪博
刘远浩
鹿江锋
胡汝坤
邵小亮
徐文静
汪平
谢隆飞
郑坚钢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN201810682171.5A priority Critical patent/CN109344227A/zh
Publication of CN109344227A publication Critical patent/CN109344227A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种工单处理方法、***和电子设备,涉及工单报错处理的技术领域,包括通过接收用户上报的咨询请求,咨询请求中携带有工单问题,工单问题中至少包括以下内容之一:菜单码、交易码、报错码和工单问题描述,确定工单问题的问题类型,问题类型包括第一问题类型和第二问题类型,第一问题类型是包括以下内容之一菜单码、交易码、报错码的问题类型,第二问题类型是至少包括工单问题描述的问题类型,基于问题类型,得到推荐答案,推送给用户,本发明通过将工单问题进行分类,并基于不同的问题类型,得到推送答案,推送给用户,提高了答案的匹配精度,增强了用户的体验感。

Description

工单处理方法、***和电子设备
技术领域
本发明涉及工单报错处理技术领域,尤其是涉及一种工单处理方法、***和电子设备。
背景技术
一个业务***中包含了很多菜单,每个菜单会发出多个服务请求,当工作人员使用该业务***时,在某个菜单的某个服务请求发生错误时,如果该业务人员认为该错误为正常报错或无法理解的报错时,就会提交这个报错问题到工单处理***查询答案。
现有的工单处理***一般会根据报错问题的关键词查询答案。然而,由业务人员上报的报错问题是多种多样的,例如:可能是菜单码、和/或者交易码、和/或者报错码的报错问题,还可以仅仅针对一个问题描述的报错问题,所以,仅仅凭借报错问题的关键词查询答案,对于答案的匹配度往往很低,用户体验感不高。
发明内容
有鉴于此,本发明的目的在于提供工单处理方法、***和电子设备,提高了答案的匹配精度,增强了用户的体验感。
第一方面,本发明实施例提供了一种工单处理方法,包括:
接收用户上报的咨询请求,所述咨询请求中携带有工单问题,所述工单问题中至少包括以下内容之一:菜单码、交易码、报错码和工单问题描述;
确定所述工单问题的问题类型;所述问题类型包括第一问题类型和第二问题类型;所述第一问题类型是至少包括以下内容之一菜单码、交易码、报错码的问题类型,所述第二问题类型是至少包括工单问题描述的问题类型;
基于所述问题类型,得到推荐答案,推送给所述用户。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,基于所述问题类型,得到推荐答案,推送给所述用户,包括:
在确定所述问题类型为第一问题类型后,从三码答案库中对比是否有解决方案与所述第一问题类型相匹配;
如果是,则提取出与所述第一问题类型相匹配的解决方案,将所述解决方案作为推荐答案推送给所述用户。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,基于所述问题类型,得到推荐答案,推送给所述用户,包括:
在确定所述问题类型为第二问题类型后,提取内容特征;所述内容特征为从工单问题中的工单问题描述中提取出来的;
基于所述内容特征,确定所述工单问题所属的类别;每一种类别对应有类别答案库;
将所述工单问题逐一与所述类别对应的类别答案库中的每一个存量工单问题进行相似度比较;所述类别答案库至少包括一个存量工单问题;
确定相似度最大值对应的存量工单问题的解决方案为推荐答案,推送给所述用户。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,提取内容特征,包括:
从工单问题中的工单问题描述中提取多个文本分词;
利用TF-IDF,从所述多个文本分词中提取所述内容特征。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,在所述从工单问题中的工单问题描述中提取多个文本分词的步骤之后,在所述利用TF-IDF,从所述多个文本分词中提取所述内容特征的步骤之前,所述方法还包括:
对所述多个初始文本分词进行过滤处理,以过滤掉低频词、停用词、标记信息、同义词。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,基于所述内容特征,确定所述工单问题所属的类别,包括:
确定所述工单问题的工单业务类型;
根据所述工单业务类型,获取逆向分类器;
将所述内容特征输入到所述逆向分类器中,确定所述工单问题所属的类别。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述逆向分类器是通过以下方法得到的:
对多个存量工单问题的类别和多个存量工单问题的内容特征进行自动聚类,得到逆向分类器;
和/或者,接收人工指令,基于所述人工指令,优化所述逆向分类器。
结合第一方面,本发明实施例提供了第一方面的第七种可能的实施方式,其中,将所述工单问题逐一与所述类别对应的类别答案库中的每一个存量工单问题进行相似度比较,包括:
获取所述类别答案库中的每一个存量工单问题的存量内容特征;
基于余弦定理,将所述内容特征与所述存量内容特征进行相似度比较。
第二方面,本发明实施例还提供一种工单处理***,包括:
接收单元,用于接收用户上报的咨询请求,所述咨询请求中携带有工单问题,所述工单问题中至少包括以下内容之一:菜单码、交易码、报错码和工单问题描述;
确定单元,用于确定所述工单问题的问题类型;所述问题类型包括第一问题类型和第二问题类型;所述第一问题类型是包括以下内容之一菜单码、交易码、报错码的问题类型,所述第二问题类型是至少包括工单问题描述的问题类型;
推送单元,用于基于所述问题类型,得到推荐答案,推送给所述用户。
第三方面,本发明实施例还提供一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例任一项所述的方法的步骤。
本发明实施例带来了以下有益效果:通过接收用户上报的咨询请求,咨询请求中携带有工单问题,工单问题中至少包括以下内容之一:菜单码、交易码、报错码和工单问题描述,确定工单问题的问题类型,问题类型包括第一问题类型和第二问题类型,第一问题类型是包括以下内容之一菜单码、交易码、报错码的问题类型,第二问题类型是至少包括工单问题描述的问题类型,基于问题类型,得到推荐答案,推送给用户,本发明通过将工单问题进行分类,并基于不同的问题类型,得到推送答案,推送给用户,提高了答案的匹配精度,增强了用户的体验感。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例提供的工单处理方法的流程图;
图2为本发明另一个实施例提供的工单处理方法的流程图;
图3为本发明实施例提供的在第二问题类型时的工单处理方法的流程图;
图4为本发明实施例提供的机器学习的流程图;
图5为本发明实施例提供的待测工单问题和工单问题分类比较的示意图;
图6为本发明实施例提供的机器自主学习的流程图;
图7为本发明实施例提供的逆向分类器训练的示意图;
图8为本发明实施例提供的逆向分类器构建和工单问题识别的示意图;
图9为本发明实施例提供的工单分类成多层网络的示意图;
图10为本发明实施例提供的利用多层分类网络对工单问题进行识别的示意图;
图11为本发明实施例提供的基于业务类型对内容特征的维护的流程图;
图12为本发明实施例提供的内容特征与答案映射关系维护的流程图;
图13为本发明实施例提供的工单处理***的结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种工单处理方法进行详细介绍,
结合图1所示,示出了一种工单处理方法的流程图,所述方法包括:
S110:接收用户上报的咨询请求,所述咨询请求中携带有工单问题,工单问题中至少包括以下内容之一:菜单码、交易码、报错码和工单问题描述;
具体来说,当用户使用该业务***时,在某个菜单的某个服务请求发生错误时,该用户认为该错误为正常报错或无法理解的报错时,就会提交这个报错问题(咨询请求)到工单处理***上,这时,工单处理***就会接收用户上报的咨询请求。在这种情况下,咨询请求中携带有工单问题,工单问题中可能包括:菜单码、和/或者交易码、和/或者报错码。
另外,用户对某个业务有疑问时,可以将这个疑问提交到工单处理***来咨询,用户也可以向工单处理***上报咨询请求,这时,咨询请求中携带有工单问题,该工单问题可以只包括工单问题描述。
S120:确定工单问题的问题类型;问题类型包括第一问题类型和第二问题类型;第一问题类型是至少包括以下内容之一菜单码、交易码、报错码的问题类型,第二问题类型是至少包括工单问题描述的问题类型;
具体来说,当工单问题中至少包含以下内容之一菜单码、交易码、报错码时,确定该工单问题的问题类型为第一问题类型,当工单问题中至少包括工单问题描述时,确定该工单工单问题的问题类型为第二问题类型。
具体确定方式可以为,首先可以检测工单问题是否编码,如果有编码,则可以确定工单问题中包含菜单码、和/或者交易码、和/或者报错码。如果工单问题没有编码,则可以确定工单问题的问题类型为第二问题类型。
S130:基于问题类型,得到推荐答案,推送给用户。
结合图2所示,当用户提交工单问题时,首先确定工单问题是否包含三码,其中,三码包括菜单码、交易码、报错码。如果有,则可以从三码答案库中去匹配答案,输出推荐答案。如果否,则需要进行语义分析,去类别数据库中匹配答案,输出推荐答案。
对于图2具体来说,在确定问题类型为第一问题类型后,从三码答案库中对比是否有解决方案与第一问题类型相匹配;
如果是,则提取出与第一问题类型相匹配的解决方案,将解决方案作为推荐答案推送给用户。
具体来说,当用户提交***的报错问题时,报错问题中携带有当前报错界面的三码信息,并与三码答案库进行比对。当三码答案库比对成功,问题已有解决方案的,***直接在当前界面即时返回解决方案,即推荐答案,给用户。当三码答案库比对失败时,即***没有给出问题的解决方案,用户可以根据上次的回答的内容来补充完善工单问题后提交咨询请求,用户可在当前界面提起工单二次咨询请求。
另外,基于工单的三码的识别,可以进行同类工单的批量处理。
将工单问题与当前未解决标杆工单问题进行三码对比;比对成功,且同类问题已有其他员工提出的,自动将两个工单问题进行归类,待标杆工单问题的解决方案确定后,按同一方案批量解决。其中,标杆工单问题为在三码答案库中确认该问题的解决方案为标准解决方案的工单问题。
当比对失败,且同类问题尚无解决方案的,自动将该工单问题设置为标杆工单问题,以便归类处理后续提交工单。
专岗人员可对自动设置的标杆工单问题进行人工调整;如此类标杆工单问题下有工单归类的,可对标杆工单问题进行一键替换。
三码答案库在建立和后期管理期间,可以通过定向学习与更新的方式进行管理。
具体来说,带有“三码”信息的标杆工单问题取得解决方案后,智能库库对工单问题进行定向学习,提取“三码”信息和解决方案,经专岗人员调整、确认后,纳入三码答案库。
定向学习过程中提取的“三码”信息与三码答案库既有内容重复的,***自动进行提示;经专岗人员整合、确认后,更新三码答案库。
对于图2具体来说,在确定问题类型为第二问题类型后,结合图3 所示,
S310:提取内容特征;内容特征为从工单问题中的工单问题描述中提取出来的;
步骤S310包括:
从工单问题中的工单问题描述中提取多个文本分词;
对所述多个初始文本分词进行过滤处理,以过滤掉低频词、停用词、标记信息、同义词;
利用TF-IDF,从经过过滤处理的多个文本分词中提取内容特征。
具体来说,对于工单问题进行处理,首先要将文本内容表示成为数学上可分析处理的形式,即建立文本特征,以一定的特征项来表征文本信息。即,首先提取工单问题中的多个文本分词,并且有词性标注和未登录词识别。
在完成分词后,还需要对文本分词集进行一些处理,过滤掉无用的信息,以减少文本特征组成的向量的维数,减少不必要的运算。具体过滤处理包括:
(1)过滤低频词,比如某些单词只在一两个文本中出现过,这些词留在集合中会导致大部分文本的该属性值为0。考虑到文本分类,仅过滤掉词频为1的词语。
(2)过滤停用词,一般这种词几乎不携带任何信息。例如:“的”、“地”、“得”这些助词,以及“既然”、“但是”等反映语法结构的词语,它们既不能反映文本的语义,还会对关键词的抽取造成干扰,需要将其过滤。建立停用词库,包含所有虚词以及标点符号。
(3)过滤标记信息,如文本中证件号码、账号、手机号等数据信息。
(4)过滤同义词,建立同义词库,如“支付款项”为“付款”为同义词,如果文本中包含“付款”,则将其转换为同义标准词“支付款项”。
在完成多个文本分词过滤后,利用TF-IDF,从多个文本分词中提取内容特征。
具体来说,对于文本特征化就是要对分词的结果进行计算,常用的计算方法有TF-IDF。其中TF称为词频,用于表征该词描述文档内容的能力; IDF称为反文档频率,用于表征该词区分文档的能力。文本特征化包括:
(1)计算词频
文本有长短之分,为了便于不同文本的比较,词频需要标准化
其中,为词在文档中的出现次数,wd为文档中的总词数。
(2)计算逆文档频率(词的表征能力)
IDF(t)=log(N/nc+1)
为答案库训练集的文本数,为答案库训练集中词出现的文本数。
(3)计算TF-IDF
TFIDF(t,d)=TF(t,d)*IDF(t,d)
TF-IDF与一个词在文档中的出现次数成正比,与该词在整个语言中的出现次数成反比。用TF-IDF算法来计算特征词的权重值是表示当一个词在这个文档中出现的频率越高,同时在其他文档中出现的次数越少,则表明该词对于表示该文档的区分能力越强,所以其权重值就应该越大。将所有词的权值排序,根据需要可以有两种选择方式:
(1)选择权值最大的某一固定数的n个关键词;
(2)选择权值大于某一阈值的关键词。
本发明中采用第一种方式,并将n值设置为1000,每一条答案或者问题的文本对应一个1000维度的空间向量,即特征向量。每一个特征向量标识一个文本,后面将通过这些对特征向量来计算相似度和文本聚类。
S320:基于内容特征,确定工单问题咨询所属的类别;每一种类别对应有类别答案库;
具体来说,
确定工单问题中的工单业务类型;
根据工单业务类型,获取逆向分类器;
将内容特征输入到逆向分类器中,确定工单问题所属的类别。
其中,逆向分类器是通过以下方法得到的:
对多个存量工单问题的类别和多个存量工单问题的内容特征进行自动聚类,得到逆向分类器;
和/或者,接收人工指令,基于人工指令,优化逆向分类器。
具体来说,在本发明中,结合图4所示,会对既有的存量工单问题的工单库进行机器学习,构建类别特征库、答案库及其映射关系,然后由工单咨询上报的待测工单问题进行特征化提取,与类别特征库比对,在答案库中巡查答案。
步骤S320的主要手段是把用户上报的工单问题(以下称为待测工单问题)与库中已解决的存量工单问题进行比较,找到待测工单问题与库中最接近的存量工单问题,将最接近的存量工单问题对应的工单答案,作为推荐答案推荐给用户。
然而,由于工单数据量大,且随时间增加,所以如果将待测工单问题与库中所有工单问题进行比较,则需要极其庞大的计算,不具有应用价值。为了减少比较次数,提高匹配效率,结合图5所示,需要对存量工单问题进行分类,将工单问题类似的归为一类。这样,首先判断待测工单问题所属的类别,后期,待测工单问题只需要与各个类别对应的存量工单问题进行比较就可以在存量工单问题中找到待测工单问题所述的类别,在类别中的多个具有答案的存量工单问题中找到最相近的存量工单问题,将最相近的存量工单问题对应的答案作为推荐答案推送给用户。
由于类别数远小于总工单数,所以在找到最相似的存量工单问题时,先进行分类,使得后期比较的次数有效减少,大幅提高***识别效率。由于通过分类已将类似的工单集中在一体,避免识别过程中的二义性。
另外,本发明中根据工单问题进行分类和类特征提取,而工单的数量是不断增加的,所以需要进行自我学习,将待测工单问题包含到分类体系中。结合图6所示,通过对比待测工单问题与类别工单问题的特征进行对比,如果相似度高于阈值,则待测工单问题划分到已知的类别,并对其归属的类别进行更新,如果不能与已知的类别相合,则可以新建一个类别,所以自主学习的代价是工单问题类别数目的增长。
对于如何对工单问题进行分类,本发明采用逆向分类器对工单问题进行分类。其中,逆向分类器的训练策略为:结合图7所示,在分类器训练过程中,先确定答案(某类别),再确定类特征,其中,答案可以对应多个工单问题,例如,A类答案可以对应A1~An类工单问题,即当用户提交 A1~An类工单问题时,推荐给用户的推荐答案均为A类答案。所以先对答案进行特征提取与分类,确定答案类别和每个类别的标准答案,然后再对同一类答案对应的工单问题进行特征提取,确定类特征。通过该方法训练出来的分类器,与直接通过问题特征进行分类得到的分类器相比,粒度更细,精度更高。
其中,分类器训练的本质是一个无监督的聚类过程,具体过程如下:
1、假设当前有[G1,G2,G3...,Gm]共n条有答案的存量工单问题记录,则代表当前库中有m个类别,对应集合[G1,G2,...,Gm];
2、任选一条工单问题Gx,对其答案进行特征提取得到答案描述特征集合[DTx1,DTx2,...,DTxo],该答案特征集合代表该类Cx当前的答案特征集合;
3、现定义相似度函数fn(Cx,Gy)=||Gy-Cx||,和相似度阈值miu,如果一个工单问题Gy与类Cx的相似度大于阈值miu,则判定工单问题Gy属于Cx类,否则Gy仍然属于独立类;
4、如果工单问题Gy属于Cx类,则利用工单问题Gy的答案特征集合 [DTy1,DTy2,...,DTyp]修正原来Cx类的答案特征集合[DTx1,DTx2,...,DTxo],得到新的Cx类的答案特征集合[DTx1,DTx2,...,DTxo,DTxo+1,...DTyq];
5、通过判断所有工单问题[G1,G2,G3...,Gm]是否属于类C1,得到新的类别集合[C1,G1,....,Gm-n1];
6、对剩下的工单问题[G1,....,Gm-n]重复上述步骤1-5,得到新的类别集合[C1,C2,G1,....,Gm-n1-n2];
7、重复步骤6,得到新的类别集合[C1,C2,....,Ck](k<=m)。
通过上述逆向分类器训练策略对答案特征进行分类,提取出答案类特征和对应的备选答案后,需要基于答案特征的分类结果,对同一类答案对应的工单问题进行特征提取和分类,得到内聚性更高的工单内容特征类。特征类的内聚性越高,结合图8所示,示出了逆向分类器与工单问题匹配之间的关系,对新工单问题的识别就会越精确,推荐的答案就越准确。
同理,在该类答案对应的工单内容特征提取过程中,也采用相同的文本特征提取方法和相似度计算方法,能明显提高工单识别精度,提高推荐答***度。
然而,对于一个工单问题来说,工单问题中的内容包含很多要素,工单问题属性中包含有一级业务类型和二级业务类型,可直接用于工单问题分类的依据。所以在设计分类器时,采用逐级分类的方式,这主要包含两个方面:
1、结合图9所示,示出了工单的分类,在利用存量工单问题训练分类器时,对存量工单先根据一二级业务类型进行分类,然后针对每个小类,再利用上述的逆向分类器训练策略进行训练,得到更精确的类别。通过这个方法,就可以得到一个3层拓扑结构的分类网络。
2、结合图10所示,示出了如何确定工单问题所属的类别,当需要为新工单问题推荐答案时,工单问题经过特征提取和上述的3层网络的判断,最后可以得到该工单问题所属的类别,快速推荐出最好的答案结果。
工单***的工单问题数量是随时间推移而逐渐增加的,相应的答案自动搜寻***也必须是一个可以自主学习,能对新工单问题做出正确判断和答案推荐的***。所以当工单***中有一笔新的工单问题被归档后,需要根据该工单问题的内容特征和答案特征,更新现有的答案库信息:
1、如果该工单问题的答案与已有工单的答案一致,则更新该答案对应的内容特征集合;
2、如果该工单问题的答案与已有工单问题的答案不一致,则新增一个答案分类以及对应的内容特征集合。
然而,通过上述步骤,可以实现对工单答案的自动聚类。根据答案特征的自动聚类来构造分类器仍然存在以下问题:
(1)每个工单问题都有各自对应的答案,即使两个工单问题的答案实际含义一致,但由于描述的文字不同,会导致对答案进行特征提取时得到完全不同的特征词,机器在学习过程中可能就会将这两个工单问题作为两个类别的工单。
(2)被分到一类的答案有很多个,机器无法智能综合优化给出这类问题的最优答案。
针对这两个问题,在机器学习过程中,需要加入一些人工干预,接收人工指令,基于人工指令,优化逆向分类器,从而可以提高分类和问题答案准确性。
人工干预机制是对机器学习和智能处理机制的补充,智能的处理过程可简单描述为根据工单问题的内容,匹配到其对应的内容特征类,再根据内容特征类与答案的映射关系,找到此工单问题对应的答案。针对这个过程中的重要环节,设计了人工干预机制,通过对机器学习的结果进行微调,从而保证达到最佳的匹配效果。人工干预主要包括以下几个方面:内容特征维护、答案维护和内容特征与答案映射关系维护。
对于内容特征维护:对于工单问题的内容特征类的定位,采用逐级分类的方式。为了保证对于内容特征集合的快速高效检索,将在工单问题的一、二级业务类型的基础上对于特征进行分类,某一种特定类型的工单提交以后,只针对该种类型的特征子集进行检索匹配。相当于可以将业务类型作为KEY,在O(1)的时间复杂度内定位到其所属的内容特征子集。具体的流程如图11所示:对于一个新工单问题而言,对其进行业务类型分类,则可以通过人工确定他的业务类型,从而,进一步的,可以修改该内容特征子集中的内容特征类。
由于内容特征的分类对于匹配效率有至关重要的重用,因而***需要提供对内容分类的人工调整。当业务产生变更,需要对业务分类进行调整时,可以灵活地进行调整。
对于答案内容维护:答案的内容是从已有工单解决方案中提取,然后作为一个标准的答案,用于解决其他同类的所有工单问题。可能需要对答案内容进行人工干预,使其标准化和规范化。***提供了对于答案的查询和维护机制。
对于答案聚类的阈值维护:无监督的聚类算法中,同一业务类型下的答案通过该算法来进行答案的聚类,其中涉及到相似度阈值miu。因此,可以通过维护阈值miu来控制答案分类的过程,如果阈值设置较高,则会产生较多的分类,每个分类内部的工单问题数量较少;如果阈值设置较低,则会产生较少的分类,每个分内内部的工单问题数量较多。
对于内容特征与答案映射关系维护:通过***跑批以后,每一条答案都会产生其所对应的内容特征向量,特征向量是作为工单问题与答案相匹配的依据,因而至关重要。***提供了对于特征词向量与答案映射关系的维护功能,实现在***中构建新的特征词到答案的映射关系,从而最大限度地准确匹配到答案。
结合图12所示,具体流程如下:查询特征向量,向用户展示特征向量的详情,并且展示该特征向量所对应的答案,然后调整特征向量与答案映射关系,其中,调整可以为人工干涉特征或者机器学习调整,判断是否有人工干预,如果有人工干预,则以人工干预为准,如果没有人工干预,以机器学习的结果为准。
S330:将工单问题逐一与类别对应的类别答案库中的每一个存量工单问题进行相似度比较;类别答案库至少包括一个存量工单问题;
具体来说,
获取类别对应的类别答案库中的每一个存量工单的存量内容特征;
基于余弦定理,将内容特征与存量内容特征进行相似度比较。
具体来说,上文提到,将用户上报的工单问题提取体征,其中,特征以向量形式存在,同样的,对于存量工单问题的特征,以向量形成存在,对于两个n维度(n>1)的空间向量,其余弦相似度为:
S340:确定相似度最大值对应的存量工单问题的解决方案为推荐答案,推送给用户。
具体来说,余弦值的取值范围是,越接近1,就表明夹角越接近 0度,也就是两个文本的特征向量越相似,找到余弦值的结构越接近 1的即为相似度最大值,则该相似度最大值对应的存量工单问题的解决方案,为推荐答案,推送给用户。
本发明实施例的工单处理方法,可以通过接收用户上报的咨询请求,咨询请求中携带有工单问题,工单问题中至少包括以下内容之一:菜单码、交易码、报错码和工单问题描述,确定工单问题的问题类型,问题类型包括第一问题类型和第二问题类型,第一问题类型是包括以下内容之一菜单码、交易码、报错码的问题类型,第二问题类型是至少包括工单问题描述的问题类型,基于问题类型,得到推荐答案,推送给用户,本发明通过将工单问题进行分类,并基于不同的问题类型,得到推送答案,推送给用户,提高了答案的匹配精度,增强了用户的体验感。
结合图13所示,示出了一种工单处理***的结构图,所述***包括:接收单元510、确定单元520和推送单元530。
其中,接收单元510,用于用于接收用户上报的咨询请求,所述咨询请求中携带有工单问题,所述工单问题中至少包括以下内容之一:菜单码、交易码、报错码和工单问题描述;
确定单元520,用于确定所述工单问题的问题类型;所述问题类型包括第一问题类型和第二问题类型;所述第一问题类型是包括以下内容之一菜单码、交易码、报错码的问题类型,所述第二问题类型是至少包括工单问题描述的问题类型;
推送单元530,用于基于问题类型,得到推荐答案,推送给用户。
本发明实施例的工单处理***,可以通过接收单元接收用户上报的咨询请求,咨询请求中携带有工单问题,工单问题中至少包括以下内容之一:菜单码、交易码、报错码和工单问题描述,确定单元确定工单问题的问题类型,问题类型包括第一问题类型和第二问题类型,第一问题类型是包括以下内容之一菜单码、交易码、报错码的问题类型,第二问题类型是至少包括工单问题描述的问题类型,推送单元基于问题类型,得到推荐答案,推送给用户,本发明通过将工单问题进行分类,并基于不同的问题类型,得到推送答案,推送给用户,提高了答案的匹配精度,增强了用户的体验感。
可选的,推送单元530具体用于在确定所述问题类型为第一问题类型后,从三码答案库中对比是否有解决方案与所述第一问题类型相匹配;
如果是,则提取出与所述第一问题类型相匹配的解决方案,将所述解决方案作为推荐答案推送给所述用户。
可选的,推送单元530具体用于在确定所述问题类型为第二问题类型后,提取内容特征;所述内容特征为从工单问题中的工单问题描述中提取出来的;
基于所述内容特征,确定所述工单问题所属的类别;每一种类别对应有类别答案库;
将所述工单问题逐一与所述类别对应的类别答案库中的每一个存量工单问题进行相似度比较;所述类别答案库至少包括一个存量工单问题;
确定相似度最大值对应的存量工单问题的解决方案为推荐答案,推送给所述用户。
可选的,推送单元530中的提取内容特征,包括:
从工单问题中的工单问题描述中提取多个文本分词;
利用TF-IDF,从所述多个文本分词中提取所述内容特征
可选的,推送单元530中的在所述从工单问题中的工单问题描述中提取多个文本分词的步骤之后,在所述利用TF-IDF,从所述多个文本分词中提取所述内容特征的步骤之前,具体还用于:
对所述多个初始文本分词进行过滤处理,以过滤掉低频词、停用词、标记信息、同义词。
可选的,推送单元530中的基于所述内容特征,确定所述工单问题所属的类别,包括:
确定所述工单问题的工单业务类型;
根据所述工单业务类型,获取逆向分类器;
将所述内容特征输入到所述逆向分类器中,确定所述工单问题所属的类别。
可选的,推送单元530中的逆向分类器是通过以下方法得到的:
对多个存量工单问题的类别和多个存量工单问题的内容特征进行自动聚类,得到逆向分类器;
和/或者,接收人工指令,基于所述人工指令,优化所述逆向分类器。
可选的,推送单元530中的将所述工单问题逐一与所述类别对应的类别答案库中的每一个存量工单问题进行相似度比较,包括:
获取所述类别答案库中的每一个存量工单问题的存量内容特征;
基于余弦定理,将所述内容特征与所述存量内容特征进行相似度比较。
本发明实施例所提供的***,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,***实施例部分未提及之处,可参考前述方法实施例中相应内容。
本发明实施例所提供的进行工单处理方法的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例任一项所述的方法的步骤。
其中,存储器可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器 (Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称 NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。
在这里示出和描述的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制,因此,示例性实施例的其他示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
附图中的流程图和框图显示了根据本发明的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/ 或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种工单处理方法,其特征在于,包括:
接收用户上报的咨询请求,所述咨询请求中携带有工单问题,所述工单问题中至少包括以下内容之一:菜单码、交易码、报错码和工单问题描述;
确定所述工单问题的问题类型;所述问题类型包括第一问题类型和第二问题类型;所述第一问题类型是至少包括以下内容之一菜单码、交易码、报错码的问题类型,所述第二问题类型是至少包括工单问题描述的问题类型;
基于所述问题类型,得到推荐答案,推送给所述用户。
2.根据权利要求1所述的方法,其特征在于,基于所述问题类型,得到推荐答案,推送给所述用户,包括:
在确定所述问题类型为第一问题类型后,从三码答案库中对比是否有解决方案与所述第一问题类型相匹配;
如果是,则提取出与所述第一问题类型相匹配的解决方案,将所述解决方案作为推荐答案推送给所述用户。
3.根据权利要求1所述的方法,其特征在于,基于所述问题类型,得到推荐答案,推送给所述用户,包括:
在确定所述问题类型为第二问题类型后,提取内容特征;所述内容特征为从工单问题中的工单问题描述中提取出来的;
基于所述内容特征,确定所述工单问题所属的类别;每一种类别对应有类别答案库;
将所述工单问题逐一与所述类别对应的类别答案库中的每一个存量工单问题进行相似度比较;所述类别答案库至少包括一个存量工单问题;
确定相似度最大值对应的存量工单问题的解决方案为推荐答案,推送给所述用户。
4.根据权利要求3所述的方法,其特征在于,提取内容特征,包括:
从工单问题中的工单问题描述中提取多个文本分词;
利用TF-IDF,从所述多个文本分词中提取所述内容特征。
5.根据权利要求4所述的方法,其特征在于,在所述从工单问题中的工单问题描述中提取多个文本分词的步骤之后,在所述利用TF-IDF,从所述多个文本分词中提取所述内容特征的步骤之前,所述方法还包括:
对所述多个初始文本分词进行过滤处理,以过滤掉低频词、停用词、标记信息、同义词。
6.根据权利要求3所述的方法,其特征在于,基于所述内容特征,确定所述工单问题所属的类别,包括:
确定所述工单问题的工单业务类型;
根据所述工单业务类型,获取逆向分类器;
将所述内容特征输入到所述逆向分类器中,确定所述工单问题所属的类别。
7.根据权利要求6所述的方法,其特征在于,所述逆向分类器是通过以下方法得到的:
对多个存量工单问题的类别和多个存量工单问题的内容特征进行自动聚类,得到逆向分类器;
和/或者,接收人工指令,基于所述人工指令,优化所述逆向分类器。
8.根据权利要求3所述的方法,其特征在于,将所述工单问题逐一与所述类别对应的类别答案库中的每一个存量工单问题进行相似度比较,包括:
获取所述类别答案库中的每一个存量工单问题的存量内容特征;
基于余弦定理,将所述内容特征与所述存量内容特征进行相似度比较。
9.一种工单处理***,其特征在于,包括:
接收单元,用于接收用户上报的咨询请求,所述咨询请求中携带有工单问题,所述工单问题中至少包括以下内容之一:菜单码、交易码、报错码和工单问题描述;
确定单元,用于确定所述工单问题的问题类型;所述问题类型包括第一问题类型和第二问题类型;所述第一问题类型是包括以下内容之一菜单码、交易码、报错码的问题类型,所述第二问题类型是至少包括工单问题描述的问题类型;
推送单元,用于基于所述问题类型,得到推荐答案,推送给所述用户。
10.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至8任一项所述的方法的步骤。
CN201810682171.5A 2018-06-27 2018-06-27 工单处理方法、***和电子设备 Pending CN109344227A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810682171.5A CN109344227A (zh) 2018-06-27 2018-06-27 工单处理方法、***和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810682171.5A CN109344227A (zh) 2018-06-27 2018-06-27 工单处理方法、***和电子设备

Publications (1)

Publication Number Publication Date
CN109344227A true CN109344227A (zh) 2019-02-15

Family

ID=65296735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810682171.5A Pending CN109344227A (zh) 2018-06-27 2018-06-27 工单处理方法、***和电子设备

Country Status (1)

Country Link
CN (1) CN109344227A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109885768A (zh) * 2019-02-18 2019-06-14 中国联合网络通信集团有限公司 工单处理方法、装置及***
CN110442873A (zh) * 2019-08-07 2019-11-12 云南电网有限责任公司信息中心 一种基于cbow模型的热点工单获取方法及装置
CN110502622A (zh) * 2019-07-03 2019-11-26 平安科技(深圳)有限公司 常见医疗问答数据生成方法、装置以及计算机设备
CN110737698A (zh) * 2019-10-15 2020-01-31 重庆浪尖至简物联网科技有限公司 一种基于问题描述的问题相关信息推荐方法
CN112214508A (zh) * 2020-10-20 2021-01-12 政采云有限公司 数据处理方法及装置
CN117009605A (zh) * 2023-08-08 2023-11-07 四川大学 一种策略化创新设计问题求解方法及***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105610609A (zh) * 2015-12-17 2016-05-25 美的集团股份有限公司 家用电器故障的处理方法、***、家用电器和云服务器
CN106506645A (zh) * 2016-11-10 2017-03-15 中车青岛四方机车车辆股份有限公司 轨道车辆的监控方法和***
CN107168285A (zh) * 2017-05-26 2017-09-15 大连理工大学 一种结合主客观信息和云模型的汽车智能故障诊断与维修辅助方法及***
CN107161821A (zh) * 2017-05-25 2017-09-15 梯联网(贵州)科技股份有限公司 一种电梯终端故障解决办法
WO2017219317A1 (zh) * 2016-06-23 2017-12-28 北京三快在线科技有限公司 一种基于搜索内容的信息推送方法及装置
CN108053351A (zh) * 2018-02-08 2018-05-18 南京邮电大学 智能高考志愿推荐***和推荐方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105610609A (zh) * 2015-12-17 2016-05-25 美的集团股份有限公司 家用电器故障的处理方法、***、家用电器和云服务器
WO2017219317A1 (zh) * 2016-06-23 2017-12-28 北京三快在线科技有限公司 一种基于搜索内容的信息推送方法及装置
CN106506645A (zh) * 2016-11-10 2017-03-15 中车青岛四方机车车辆股份有限公司 轨道车辆的监控方法和***
CN107161821A (zh) * 2017-05-25 2017-09-15 梯联网(贵州)科技股份有限公司 一种电梯终端故障解决办法
CN107168285A (zh) * 2017-05-26 2017-09-15 大连理工大学 一种结合主客观信息和云模型的汽车智能故障诊断与维修辅助方法及***
CN108053351A (zh) * 2018-02-08 2018-05-18 南京邮电大学 智能高考志愿推荐***和推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李晓鹏: "《计算机网络》课程FAQ***设计与开发", 《中国优秀硕士学位论文全文数据库社会科学辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109885768A (zh) * 2019-02-18 2019-06-14 中国联合网络通信集团有限公司 工单处理方法、装置及***
CN110502622A (zh) * 2019-07-03 2019-11-26 平安科技(深圳)有限公司 常见医疗问答数据生成方法、装置以及计算机设备
CN110442873A (zh) * 2019-08-07 2019-11-12 云南电网有限责任公司信息中心 一种基于cbow模型的热点工单获取方法及装置
CN110737698A (zh) * 2019-10-15 2020-01-31 重庆浪尖至简物联网科技有限公司 一种基于问题描述的问题相关信息推荐方法
CN112214508A (zh) * 2020-10-20 2021-01-12 政采云有限公司 数据处理方法及装置
CN117009605A (zh) * 2023-08-08 2023-11-07 四川大学 一种策略化创新设计问题求解方法及***
CN117009605B (zh) * 2023-08-08 2024-04-02 四川大学 一种策略化创新设计问题求解方法及***

Similar Documents

Publication Publication Date Title
CN112612902B (zh) 一种电网主设备的知识图谱构建方法及设备
CN109344227A (zh) 工单处理方法、***和电子设备
CN110298032B (zh) 文本分类语料标注训练***
CN110968699B (zh) 一种基于事理推荐的逻辑图谱构建及预警方法和装置
CN116628172A (zh) 基于知识图谱的政务服务领域多策略融合的对话方法
CN109063221A (zh) 基于混合策略的查询意图识别方法和装置
CN110674274A (zh) 一种针对食品安全法规问答***的知识图谱构建方法
CN110659282B (zh) 数据路由的构建方法、装置、计算机设备和存储介质
CN108416032A (zh) 一种文本分类方法、装置及存储介质
KR101953190B1 (ko) 복잡한 양자 또는 다자 상대방 관계를 탐색하기 위해 이용되는 다차원 재귀적 학습 과정 및 시스템
CN110046264A (zh) 一种面向手机文档的自动分类方法
CN108027814A (zh) 停用词识别方法与装置
CN115547466B (zh) 基于大数据的医疗机构登记评审***及其方法
CN115239214B (zh) 企业的评估处理方法、装置及电子设备
CN112632982A (zh) 一种能用于供应商评价的对话文本情感分析方法
Ma et al. Content Feature Extraction-based Hybrid Recommendation for Mobile Application Services.
CN106775694B (zh) 一种软件配置代码制品的层次分类方法
WO2021128721A1 (zh) 文本分类处理方法和装置
AU2019290658B2 (en) Systems and methods for identifying and linking events in structured proceedings
CN110413757A (zh) 一种词语释义确定方法、装置及***
CN115688729A (zh) 一种输变电工程造价数据集成管理***及其方法
US20210103593A1 (en) Model validation for query intent
CN114610882A (zh) 一种基于电力短文本分类的异常设备编码检测方法和***
CN114048325A (zh) 基于知识图谱的案件处理方法及装置、存储介质
CN114254622A (zh) 一种意图识别方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190215