CN109635292B - 基于机器学习算法的工单质检方法和装置 - Google Patents

基于机器学习算法的工单质检方法和装置 Download PDF

Info

Publication number
CN109635292B
CN109635292B CN201811482026.9A CN201811482026A CN109635292B CN 109635292 B CN109635292 B CN 109635292B CN 201811482026 A CN201811482026 A CN 201811482026A CN 109635292 B CN109635292 B CN 109635292B
Authority
CN
China
Prior art keywords
information
report
work order
additional
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811482026.9A
Other languages
English (en)
Other versions
CN109635292A (zh
Inventor
李道勋
吴志清
李欢欢
颜奕
陈亚萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Eastcom Software Technology Co ltd
Original Assignee
Hangzhou Eastcom Software Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Eastcom Software Technology Co ltd filed Critical Hangzhou Eastcom Software Technology Co ltd
Priority to CN201811482026.9A priority Critical patent/CN109635292B/zh
Publication of CN109635292A publication Critical patent/CN109635292A/zh
Application granted granted Critical
Publication of CN109635292B publication Critical patent/CN109635292B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Factory Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本说明书实施例提供基于机器学习的工单质检方法和装置。在一个例子中,工单质检方法包括:从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;将预测的业务类别与实际的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。本发明实施例有助于提高工单质检准确率。

Description

基于机器学习算法的工单质检方法和装置
技术领域
本发明涉及移动通信的网管技术领域,具体地说涉及EOMS***中的工单内容进行质检的方法和装置。
背景技术
现有EOMS*** (Electric Operation Maintenance System,电子运维***)中包含了一整套工单流转与处理的流程。客服平台生成的投诉工单流转至EOMS***,监控室投诉处理班组对部分字段根据规则和经验进行判断是否符合。在整个环节中,主要在受理、预处理、报结这3个环节需要人工进行检查。人工检查费时费力,且由于工单量大、人力成本高,通常只能做到抽检,无法对全量工单进行检查。
为了解决人工检查费时费力的问题,现有通常的做法是通过设定固定的质检规则的方式来对工单文本进行判断。这种方式通常需要经验丰富的质检人员设定检测规则、构建检测字典等方式。但是,由于工单内容通常为非结构化文本,通常缺少固定的格式,导致构建能够覆盖全面的规则的难度较大,且构建规则时的判断费时费力,准确率也不高。
发明内容
根据本发明第一方面,提供一种基于机器学习算法的工单质检方法,包括:从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致;
从待质检工单中抽取出附加报结信息、解决情况这两个信息;利用分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;分别对分词后的附加报结信息进行向量化;基于向量,利用训练模型进行预测,获取预测的解决情况;其中,训练模型是利用解决情况正确的历史工单训练得到;将预测的解决情况与从工单抽取的解决情况进行对比,如果一致则认定附加报结信息和解决情况一致;
从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量;对工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息,将弱覆盖信息与场景信息转化为第二向量并与第一向量结果合并为第三向量;基于上述合并后的第三向量,利用训练模型进行预测,获取预测的报结意见;其中,训练模型是利用报结意见正确的历史工单训练得到;将预测的报结意见与从工单抽取的报结意见进行对比,如果一致则返回投诉内容、附加报结信息和报结意见一致;
所述工单的投诉内容、附加报结信息与业务类别一致,附加报结信息和解决情况一致,且投诉内容、附加报结信息和报结意见一致,认定该工单为质检通过工单。
根据本发明第二方面,提供一种工单质检装置,包括:第一抽取单元,从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;第一分词单元,利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;第一向量化单元,分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;第一预测单元,基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;第一对比单元,将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致;
第二抽取单元,从待质检工单中抽取出附加报结信息、解决情况这两个信息;第二分词单元,利用分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;第二向量化单元,分别对分词后的附加报结信息进行向量化;第二预测单元,基于向量,利用训练模型进行预测,获取预测的解决情况;其中,训练模型是利用解决情况正确的历史工单训练得到;第二对比单元,将预测的解决情况与从工单抽取的解决情况进行对比,如果一致则认定附加报结信息和解决情况一致;
第三抽取单元,从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据;第三分词单元,利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;第三向量化单元,分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量;弱覆盖信息与场景信息向量化单元和合并单元,对工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息,将弱覆盖信息与场景信息转化为第二向量并与第一向量合并;第三预测单元,基于上述合并后的第三向量,利用训练模型进行预测,获取预测的报结意见;其中,训练模型是利用报结意见正确的历史工单训练得到;第三对比单元,将预测的报结意见与从工单抽取的报结意见进行对比,如果一致则返回投诉内容、附加报结信息和报结意见一致;
判定模块,工单的投诉内容、附加报结信息与业务类别一致,附加报结信息和解决情况一致,且投诉内容、附加报结信息和报结意见一致,认定该工单为质检通过工单。
采用本发明实施例的技术优点:能够通过增加特征、SVM的模型调优等方式来获得效果最优的模型,从而提高结果判断准确率。不需要人工提炼规则,只需要利用历史数据就能对模型进行迭代更新。在未来新增工单内容、新增投诉类别等信息之后也能快速迭代。由于大部分合格工单已经被筛选过滤,所以能够大量减少人工审核工单的数量。
附图说明
图1是根据本发明实施例的基于业务类别分类模型的工单质检方法示意图;
图2是根据本发明实施例的基于解决情况分类模型的工单质检方法示意图;
图3是根据本发明实施例的基于报结意见分类模型的工单质检方法示意图;
图4示意了根据本说明书实施例的可用于实现上述各种技术的设备的详细结构图。
具体实施方式
本发明实施例基于机器学习的文本分类算法自动对工单内容进行分类。利用历史工单数据对模型进行训练和迭代优化。然后通过训练后的模型获得准确的工单类别,并与实际填写的内容进行比对。将比对失败的工单标记为质检不合格并输出。
当前情况下,每月大致有例如15万以上的工单,每个待质检工单中均包含:投诉内容、附加报结信息、投诉业务类别、解决情况、报结意见。在质检时,主要判断投诉业务类别、解决情况、报结意见是否填写正确,是否和投诉内容、附加报结信息相匹配。如果利用人工质检,则费时费力,如果利用规则质检,则准确率不高且规则设定是否困难。
本发明实施例基于机器学习中的TFIDF(term frequency–inverse documentfrequency词频-逆文本频率指数)和SVM(Support Vector Machine,支持向量机)算法,基于投诉内容、附加报结信息、投诉业务类别、解决情况、报结意见等字段中的一个或多个分别构建文本分类模型,利用训练后的模型对工单进行质检。
TFIDF是一种统计方法,通过计算文本中的词频数和逆向文件频率的乘积来给词赋值,从而对文本进行向量化。一个词在一段文本中出现的次数越多,在所有文本中出现的次数越少,则越能代表该段文本,其TFIDF的值越大。
SVM算法是机器学***面对样本进行分割。
在工单质检的流程当中,需要以投诉内容、附加报结信息作为特征,再分别将投诉业务类别、解决情况、报结意见作为标签,构建与优化三个分类模型对类别进行预测。
图1是根据本发明实施例的基于业务类别分类模型的工单质检方法示意图。首先,具体介绍业务类别分类模型的训练过程。具体模型训练过程说明如下:
从历史工单中筛选出业务类别正确的工单;
利用人工构造的分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;
利用TFIDF分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;
将向量作为特征、投诉业务类别作为标签,利用SVM构建模型并优化。
如图1所示,基于业务类别分类模型的工单质检方法包括如下步骤:
在步骤S102,从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息。
在步骤S104,利用人工构造的分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作。
在步骤S106,利用TFIDF分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量。
在步骤S108,基于TFIDF向量,利用训练后的SVM模型进行预测,获取预测结果。
在步骤S112,将预测结果与实际的业务类别进行对比,如果一致则返回正确,不一致则返回预测的业务类别。
图2是根据本发明实施例的基于解决情况分类模型的工单质检方法示意图。首先,对解决情况分类模型的具体模型训练过程说明如下:
从历史工单中筛选出解决情况正确的工单;
利用人工构造的分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;
利用TFIDF分别对分词后的附加报结信息进行向量化;
将向量作为特征、解决情况作为标签,利用SVM构建模型并优化。
如图2所示,基于解决情况分类模型的工单质检方法包括如下步骤:
在步骤S202,从待质检工单中抽取出附加报结信息、解决情况这两个信息。
在步骤S204,利用人工构造的分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;
在步骤S206,利用TFIDF分别对分词后的附加报结信息进行向量化;
在步骤S208,基于TFIDF向量,利用训练后的SVM模型进行预测,获取预测结果。
在步骤S212,将预测结果与实际的解决情况进行对比,如果一致则返回正确,不一致则返回预测的解决情况。
图3是根据本发明实施例的基于报结意见分类模型的工单质检方法示意图。首先,对报结意见分类模型的具体模型训练过程说明如下:
从历史工单中筛选出报结意见正确的工单,再取集中小区状态表的数据。
利用人工构造的分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作。
利用TFIDF分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量。
利用莱温斯坦算法对投诉工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息(乡村、城镇等),将弱覆盖信息与场景信息转化为Onehot向量并与TFIDF的向量结果合并。
将上一步生成的向量作为特征、报结意见作为标签,利用SVM构建模型并优化。
如图3所示,基于报结意见分类模型的工单质检方法包括如下步骤:
在步骤S302,从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据。
在步骤S304,利用人工构造的分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作。
在步骤S306,利用TFIDF分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量。
在步骤S308,利用莱温斯坦算法对投诉工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息(乡村、城镇等),将弱覆盖信息与场景信息转化为Onehot向量并与TFIDF的向量结果合并。当然,向量合并也可以采取一步完成。
在步骤S310,基于上一步生成的向量,利用训练后的SVM模型进行预测,获取预测结果。
在步骤S312,将预测结果与实际的报结意见进行对比,如果一致则返回正确,不一致则返回预测的报结意见。
在一个例子中,可以将三个质检均返回正确的工单认为是质检通过工单,其余工单则需人工再次确认。
图4示意了根据本说明书实施例的可用于实现上述各种技术的设备的详细结构图。该结构图示意了可实现图1-3所示方法流程的硬件基础。如图4所示,设备可包括处理器402,该处理器402用于控制设备的总体操作的微处理器或控制器411,以及控制输入设备436和显示器434。数据总线415可用于在存储设备440、处理器402和控制器411等之间进行数据传输。控制器411可用于通过设备控制总线417与不同设备进行交互并对其进行控制。设备还可包括耦接至数据链路412的网络接口414。在无线连接的情况下,网络接口414可包括无线收发器。
设备还包括存储设备440。该存储设备存储有软件;在运行时,软件自ROM422中加载于RAM420中,并且由此控制处理器402执行相应操作。
在一个例子中,操作包括:从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。
在另一个例子中,操作包括:从待质检工单中抽取出附加报结信息、解决情况这两个信息;利用分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;分别对分词后的附加报结信息进行向量化;基于向量,利用训练模型进行预测,获取预测的解决情况;其中,训练模型是利用解决情况正确的历史工单训练得到;将预测的解决情况与从工单抽取的解决情况进行对比,如果一致则认定附加报结信息和解决情况一致。
在再一个例子中,操作包括:从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量;对工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息,将弱覆盖信息与场景信息转化为第二向量并与第一向量合并为第三向量;基于上述合并后的第三向量,利用训练模型进行预测,获取预测的报结意见;其中,训练模型是利用报结意见正确的历史工单训练得到;将预测的报结意见与从工单抽取的报结意见进行对比,如果一致则返回投诉内容、附加报结信息和报结意见一致。
应当理解,这里描述的设备在很多方面可以利用前面描述的方法实施例或与之结合。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书各实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图1-图3所描述的方法。
本说明书各实施例所描述的功能采用硬件、固件或者其组合或者与软件组合时的方案如下。
一种工单质检装置,包括:第一抽取单元,从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;第一分词单元,利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;第一向量化单元,分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;第一预测单元,基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;第一对比单元,将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致;
第二抽取单元,从待质检工单中抽取出附加报结信息、解决情况这两个信息;第二分词单元,利用分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;第二向量化单元,分别对分词后的附加报结信息进行向量化;第二预测单元,基于向量,利用训练模型进行预测,获取预测的解决情况;其中,训练模型是利用解决情况正确的历史工单训练得到;第二对比单元,将预测的解决情况与从工单抽取的解决情况进行对比,如果一致则认定附加报结信息和解决情况一致;
第三抽取单元,从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据;第三分词单元,利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;第三向量化单元,分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量;弱覆盖信息与场景信息向量化单元和合并单元,对工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息,将弱覆盖信息与场景信息转化为Onehot向量,即第二向量并与第一向量合并成为第三向量;第三预测单元,基于上述第三向量,利用训练模型进行预测,获取预测的报结意见;其中,训练模型是利用报结意见正确的历史工单训练得到;第三对比单元,将预测的报结意见与从工单抽取的报结意见进行对比,如果一致则返回投诉内容、附加报结信息和报结意见一致;
判定模块,工单的投诉内容、附加报结信息与业务类别一致,附加报结信息和解决情况一致,且投诉内容、附加报结信息和报结意见一致,认定质检通过。
应当理解,这里描述的多声道响度均衡设备在很多方面可以利用前面描述的方法实施例或与之结合。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
虽然上文结合TFIDF和SVM算法对本发明的实施例做了说明,但是,很显然,除TFIDF以外的其它统计方法,以及除SVM算法的其它分类方法也是可行的。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (4)

1.一种基于机器学习算法的工单质检方法,包括:
从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;
利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;
分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;
基于向量,利用训练后的SVM模型进行预测,获取预测的业务类别;其中,训练后的SVM模型是利用业务类别正确的历史工单训练得到;
将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致;
从待质检工单中抽取出附加报结信息、解决情况这两个信息;
利用分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;
分别对分词后的附加报结信息进行向量化;
基于向量,利用训练后的SVM模型进行预测,获取预测的解决情况;其中,训练后的SVM模型是利用解决情况正确的历史工单训练得到;
将预测的解决情况与从工单抽取的解决情况进行对比,如果一致则认定附加报结信息和解决情况一致;
从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据;
利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;
分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量;
对工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息,将弱覆盖信息与场景信息转化为第二向量并与第一向量结果合并为第三向量;
基于上述合并后的向量,利用训练后的SVM模型进行预测,获取预测的报结意见;其中,训练后的SVM模型是利用报结意见正确的历史工单训练得到;
将预测的报结意见与从工单抽取的报结意见进行对比,如果一致则返回投诉内容、附加报结信息和报结意见一致;
所述工单的投诉内容、附加报结信息与业务类别一致,附加报结信息和解决情况一致,且投诉内容、附加报结信息和报结意见一致,认定质检通过。
2.一种工单质检装置,包括:
第一抽取单元,从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;
第一分词单元,利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;
第一向量化单元,分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;
第一预测单元,基于向量,利用训练后的SVM模型进行预测,获取预测的业务类别;其中,训练后的SVM模型是利用业务类别正确的历史工单训练得到;
第一对比单元,将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致;
第二抽取单元,从待质检工单中抽取出附加报结信息、解决情况这两个信息;
第二分词单元,利用分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;
第二向量化单元,分别对分词后的附加报结信息进行向量化;
第二预测单元,基于向量,利用训练后的SVM模型进行预测,获取预测的解决情况;其中,训练后的SVM模型是利用解决情况正确的历史工单训练得到;
第二对比单元,将预测的解决情况与从工单抽取的解决情况进行对比,如果一致则认定附加报结信息和解决情况一致;
第三抽取单元,从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据;
第三分词单元,利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;
第三向量化单元,分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量;
弱覆盖信息与场景信息向量化单元和合并单元,对投诉工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息,将弱覆盖信息与场景信息转化为第二向量并与第一向量合并成为第三向量;
第三预测单元,基于上述第三向量,利用训练后的SVM模型进行预测,获取预测的报结意见;其中,训练后的SVM模型是利用报结意见正确的历史工单训练得到;
第三对比单元,将预测的报结意见与从工单抽取的报结意见进行对比,如果一致则返回投诉内容、附加报结信息和报结意见一致;
判定模块,工单的投诉内容、附加报结信息与业务类别一致,附加报结信息和解决情况一致,且投诉内容、附加报结信息和报结意见一致,认定质检通过。
3.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1所述的方法。
4.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1所述的方法。
CN201811482026.9A 2018-12-05 2018-12-05 基于机器学习算法的工单质检方法和装置 Active CN109635292B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811482026.9A CN109635292B (zh) 2018-12-05 2018-12-05 基于机器学习算法的工单质检方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811482026.9A CN109635292B (zh) 2018-12-05 2018-12-05 基于机器学习算法的工单质检方法和装置

Publications (2)

Publication Number Publication Date
CN109635292A CN109635292A (zh) 2019-04-16
CN109635292B true CN109635292B (zh) 2023-07-28

Family

ID=66071226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811482026.9A Active CN109635292B (zh) 2018-12-05 2018-12-05 基于机器学习算法的工单质检方法和装置

Country Status (1)

Country Link
CN (1) CN109635292B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472866A (zh) * 2019-08-13 2019-11-19 中国铁塔股份有限公司 一种工单质检分析方法及装置
CN110704616B (zh) * 2019-09-09 2023-05-12 中盈优创资讯科技有限公司 设备告警工单识别方法及装置
CN112685555B (zh) * 2019-10-17 2023-04-18 ***通信集团浙江有限公司 投诉工单质量检测方法及装置
CN113095515A (zh) * 2019-12-19 2021-07-09 ***通信集团辽宁有限公司 业务故障信息处理方法及装置
CN111191449A (zh) * 2019-12-26 2020-05-22 航天信息股份有限公司 一种税务反馈信息的处理方法及装置
CN111191614B (zh) * 2020-01-02 2023-08-29 中国建设银行股份有限公司 一种单据分类方法和装置
CN112800215A (zh) * 2021-01-29 2021-05-14 北京大米科技有限公司 一种文本处理方法、装置、可读存储介质和电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107861942A (zh) * 2017-10-11 2018-03-30 国网浙江省电力公司电力科学研究院 一种基于深度学习的电力疑似投诉工单识别方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101458676A (zh) * 2007-12-11 2009-06-17 ***通信集团公司 质检确定方法、质检***及神经网络
CN108470022B (zh) * 2018-01-18 2021-11-23 南京邮电大学 一种基于运维管理的智能工单质检方法
CN108876039B (zh) * 2018-06-21 2021-07-27 浙江工业大学 一种基于支持向量机的含分布式电源配电网电能质量预测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107861942A (zh) * 2017-10-11 2018-03-30 国网浙江省电力公司电力科学研究院 一种基于深度学习的电力疑似投诉工单识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
深度学习在电力潜在投诉识别分类中的应用;罗欣;浙江电力;全文 *

Also Published As

Publication number Publication date
CN109635292A (zh) 2019-04-16

Similar Documents

Publication Publication Date Title
CN109635292B (zh) 基于机器学习算法的工单质检方法和装置
CN108170909B (zh) 一种智能建模的模型输出方法、设备及存储介质
CN111931809A (zh) 数据的处理方法、装置、存储介质及电子设备
CN113254254A (zh) ***故障的根因定位方法、装置、存储介质及电子装置
CN113313280B (zh) 云平台的巡检方法、电子设备及非易失性存储介质
CN112508456A (zh) 食品安全风险评估方法、***、计算机设备及存储介质
CN112036295A (zh) 票据图像处理方法、装置、存储介质及电子设备
CN111582645B (zh) 基于因子分解机的app风险评估方法、装置和电子设备
CN113704389A (zh) 一种数据评估方法、装置、计算机设备及存储介质
CN114328277A (zh) 一种软件缺陷预测和质量分析方法、装置、设备及介质
CN111159481B (zh) 图数据的边预测方法、装置及终端设备
CN115422028A (zh) 标签画像体系的可信度评估方法、装置、电子设备及介质
CN110879821A (zh) 评分卡模型衍生标签生成方法、装置、设备及存储介质
CN111062827A (zh) 一种基于人工智能模式的工程监理方法
CN111985226A (zh) 标注数据生成方法及装置
CN115099934A (zh) 一种高潜客户识别方法、电子设备和存储介质
CN114385398A (zh) 一种请求响应状态确定方法、装置、设备和存储介质
CN113296836A (zh) 训练模型的方法、测试方法、装置、电子设备及存储介质
CN113641823A (zh) 文本分类模型训练、文本分类方法、装置、设备及介质
CN110083807B (zh) 合同的修改影响自动预测方法、装置、介质及电子设备
CN112906723A (zh) 一种特征选择的方法和装置
CN112968941B (zh) 一种基于边缘计算的数据采集和人机协同标注方法
CN112598118B (zh) 有监督学习的标注异常处理方法、装置、存储介质及设备
CN112818937B (zh) Excel文件的识别方法、装置、电子设备及可读存储介质
CN117435978A (zh) 异构云数据处理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant