CN113836307B - 一种供电服务工单热点发现方法、***、装置及存储介质 - Google Patents
一种供电服务工单热点发现方法、***、装置及存储介质 Download PDFInfo
- Publication number
- CN113836307B CN113836307B CN202111205671.8A CN202111205671A CN113836307B CN 113836307 B CN113836307 B CN 113836307B CN 202111205671 A CN202111205671 A CN 202111205671A CN 113836307 B CN113836307 B CN 113836307B
- Authority
- CN
- China
- Prior art keywords
- service
- work order
- label
- key
- key phrases
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000003860 storage Methods 0.000 title claims abstract description 12
- 238000013145 classification model Methods 0.000 claims abstract description 27
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 12
- 238000004590 computer program Methods 0.000 claims description 16
- 239000012634 fragment Substances 0.000 claims description 4
- 230000000007 visual effect Effects 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 3
- 238000012821 model calculation Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 21
- 238000004458 analytical method Methods 0.000 abstract description 5
- 238000007619 statistical method Methods 0.000 abstract description 3
- 238000009960 carding Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013433 optimization analysis Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种供电服务工单热点发现方法、***、装置及存储介质,本发明供电服务工单热点发现方法基于关键短语抽取,将服务热点发现问题抽象成业务关键短语抽取和文本分类的问题,将服务热点发现划分为业务标签生成、业务标签模型预测和服务热点统计分析三个流程。业务在关键短语抽取流程,采用的SIFRank算法实现了高质量的关键短语抽取。提炼出直接有业务指导意义的标签短文本,加快了业务人员进行业务梳理的效率,同时把业务标签的更新控制在较短的周期。并且通过构建业务标签分类模型,对服务热点发现的数据处理环节构成闭环,最终支撑电力工单热点的精细化分析和管理。具有处理流程解释性强、业务更新迭代快等优点。
Description
技术领域
本发明属于数据处理技术领域,具体涉及一种供电服务工单热点发现方法、***、装置及存储介质。
背景技术
在电网的客服领域,随着智能客服业务的开展与深化,逐渐积累大量的客服工单数据,这些数据虽然在构建知识库起到了关键作用,但是并没有在在业务优化分析层面发挥价值。
客服工单数据是体现用户服务质量和用户行为的重要分析依据,可以来分析业务运营服务质量及优化方向。因此有必要将客户数据和工单数据融合起来,构建标签体系和运营指标体系,来分析营销业务流程与服务质量优化空间与路径,提升位营销业务服务质量、流程优化、提升产品能力。
当前供电工单服务热点的预测方法,通过单纯文本分类的模型对工单进行标签分类,需要提前对所有的业务标签进行梳理并且固定下来,但是在实际业务场景中,业务标签体系会随着产品和业务的变化而变化,固定的标签体系不能适应变化的业务场景。
发明内容
本发明的目的在于提供一种基于关键短语抽取的供电服务工单热点发现方法、***、装置及存储介质,以解决现有技术中,单纯依靠传统的文本分类,标签生成解释性差的问题。
为实现上述目的,本发明采用如下技术方案:
本发明的第一个方面,一种基于关键短语抽取的供电服务工单热点发现方法,包括如下步骤:
获取历史工单数据,抽取历史工单数据中的关键短语;
通过预设的业务判别二分类模型识别符合业务需求的关键短语,作为符合业务需求的关键标签,利用符合业务需求的关键标签生成标签库;
获取线上工单***的工单,通过预设的业务标签分类模型对工单进行预测,将识别通过的工单打上分类标签并归入标签库,将未识别通过的工单进行关键短语抽取,判断是否符合业务需求,将符合业务需求的关键短语作为符合业务需求的关键标签并归入标签库;
获取标签库内的出现频率超过设定值的标签作为服务热点。
可选的,所述抽取历史工单数据中的关键短语具体方法如下:
对历史工单数据的文本进行分词和词性标注处理,将历史工单数据的文本转化成包含词性信息的词序列;
按照固定的词性组合关系对词序列进行抽取,将抽取的词组合片段作为元素加入到候选关键短语集合;
使用预训练语言模型计算每个词的向量表示;
依据每个词的向量表示,通过句向量模型计算方法,分别获得候选关键短语和单条样本数据的文本的向量表示;
计算候选关键短语和单条样本数据的文本的向量表示的余弦距离作为相似度,把相似度排Top-N的候选关键短语作为最终的关键短语。
可选的,所述业务判别二分类模型的获取方式为:对关键短语进行特征提取,获得关键短语的统计和语义特征;给关键短语分别打上“是/否为业务需求标签”构建训练样本;将提取到的统计和语义特征作为输入训练分类模型。
可选的,所述业务标签分类模型的获取方式为:针对标签库内的关键标签构建文本分类标注训练集,使用TextCNN算法训练业务标签分类模型。
可选的,获取标签库内的出现频率超过设定值的标签作为服务热点,具体包括:按照不同维度对标签库内的标签的进行统计,取出现频率超过设定值的标签作为服务热点并进行可视化呈现。
可选的,所述不同维度包括时间区间、部门和区域。
可选的,获取标签库内的出现频率超过设定值的标签作为服务热点后,将服务热点进行推送给相关部门业务人员。
本发明的第二方面,一种用于基于关键短语抽取的供电服务工单热点发现方法的***,包括:
获取模块,用于获取历史工单数据,抽取历史工单数据中的关键短语;
标签库生成模块,用于通过预设的业务判别二分类模型识别符合业务需求的关键短语,作为符合业务需求的关键标签,利用符合业务需求的关键标签生成标签库;
识别模块,用于获取线上工单***的工单,通过预设的业务标签分类模型对工单进行预测,将识别通过的工单打上分类标签并归入标签库,将未识别通过的工单进行关键短语抽取,判断是否符合业务需求,将符合业务需求的关键短语作为符合业务需求的关键标签并归入标签库;
统计模块,用于获取标签库内的出现频率超过设定值的标签作为服务热点。
本发明的第三方面,一种用于所述基于关键短语抽取的供电服务工单热点发现方法的装置,包括:存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如权利要求1至7任一项所述的基于关键短语抽取电服务工单热点发现方法。
本发明的第四方面,一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现所述的基于关键短语抽取的供电服务工单热点发现方法。
本发明的有益效果如下:
(1)本发明提供的供电服务工单热点发现方法,基于关键短语抽取,将服务热点发现问题抽象成业务关键短语抽取和文本分类的问题,将服务热点发现划分为业务标签生成、业务标签模型预测和服务热点统计分析三个流程。业务在关键短语抽取流程,采用的SIFRank算法实现了高质量的关键短语抽取。提炼出直接有业务指导意义的标签短文本,加快了业务人员进行业务梳理的效率,同时把业务标签的更新控制在较短的周期。并且通过构建业务标签分类模型,对服务热点发现的数据处理环节构成闭环,最终支撑电力工单热点的精细化分析和管理。具有处理流程解释性强、业务更新迭代快等优点。
(2)本发明采用的SIFRank算法即为人工智能领域中较新颖且性能优异的算法,克服了传统的关键短语抽取效果机械泛化能力弱的问题。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例供电服务工单热点发现方法的流程图。
图2为本发明实施例中抽取历史工单数据中的关键短语流程图。
具体实施方式
下面将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
以下详细说明均是示例性的说明,旨在对本发明提供进一步的详细说明。除非另有指明,本发明所采用的所有技术术语与本申请所属领域的一般技术人员的通常理解的含义相同。本发明所使用的术语仅是为了描述具体实施方式,而并非意图限制根据本发明的示例性实施方式。
如图1所示,本发明实施例的第一方面,一种基于关键短语抽取的供电服务工单热点发现方法,包括如下步骤:
步骤1:服务工单业务标签生成,通过关键短语抽取的方法对批量的历史工单数据使用SIFRank算法生成候选的关键短语标签,通过训练一个业务判别二分类模型来识别关键短语是否为符合业务需求的关键标签,然后针对过滤后的关键标签进行人工梳理和整合,进行标签入库。具体如下:
步骤11:从供电服务工单***的数据库里面导出全量的历史工单文本数据,为关键短语抽取做数据准备。
步骤12:利用历史工单文本数据的样本数据,使用SIFRank算法提取出关键短语。
如图2所示,SIFRank算法提取关键短语的具体流程如下:
(1)对样本数据的文本进行分词和词性标注处理,将样本数据的文本转化成包含词性信息的词序列;
(2)按照固定的词性组合关系对词序列进行抽取,得到词组合片段,将抽取的词组合片段作为元素加入到候选关键短语集合;
(3)使用预训练语言模型计算每个词的向量表示;
(4)依据每个词的向量表示,通过句向量模型计算方法,分别获得候选关键短语和单条样本数据的文本的向量表示;
(5)计算候选关键短语和单条样本数据的文本的向量表示的余弦距离作为相似度,把相似度排Top-N的候选关键短语作为最终的关键短语返回。
步骤13:对关键短语进行特征提取,获得关键短语的多个维度的统计和语义特征。关键短语的不同维度的统计和语义特征是作为后续判别的二分类模型的模型输入,包括短语词频、短语长度、是否包含服务实体信息、首字/尾字是否为停用词和子词词性等信息。
作为一种示例,针对关键短语“变压器噪音过大”,会转化成特征表示的键值对“{‘短语词频’:100,‘短语长度’:7,‘是否包含服务实体信息’:1,...}”。
步骤14:训练针对关键短语的业务判别二分类模型,通过给关键短语分别打上“是/否为业务需求标签”构建训练样本,使用XGboost算法使用提取到的统计和语义特征作为输入构建分类模型,预测关键短语是否为业务场景需求的关键标签。
作为一种示例,XGboost算法输入构建分类模型的流程如下:
(1)确定损失函数,泰勒二阶展开,求解最优树权重,继而求出最优树结构和***标准函数;
(2)按照***函数逐步一棵树一棵树去生成,Newton法迭代生成子树。
(3)将每棵树进行累加,作为最终生成的数(损失最小,达到最优)。
XGBoost算法根据抽取到的统计和语义特征构建预测模型,识别关键短语是否为业务需求标签。
步骤15:对全量的关键短语使用业务判别二分类模型进行预测,预测过程会将关键短语进行特征提取,转化为业务判别二分类模型的输入格式,然后使用模型预测的结果作为处理依据,把命中“业务需求标签”的关键短语过滤出来,作为符合业务场景需求的关键标签。
对关键短语进行相似度计算,合并业务编辑距离小于2的标签集合,归一化为单一标签,人工确认后整理到标签库。
步骤2:服务工单业务标签模型预测,针对标签库内的关键标签构建文本分类标注训练集,训练业务标签分类模型,对接线上工单***进行业务标签预测,未能识别的内容归置到业务标签生成流程,否则把工单和识别到的标签进行入库。
步骤2具体包括下列步骤:
步骤21:获取关键短语和包含关键短语的原始工单文本,未包含标签的工单文本通过采样附上“其他”标签,构建工单文本分类标注数据集;
步骤22:使用TextCNN算法利用工单文本分类标注数据集训练业务标签分类模型,训练完成获得业务标签分类模型;
步骤23:对接线上工单***,输入工单文本内容,使用业务标签分类模型进行预测,获得预测标签;
步骤24:判断预测标签是否为“其他”类标签,如果为“其他”类标签则把工单文本归置到用以进行关键短语抽取的样本库内,用于符合业务需求时,生成关键标签并归入标签库;否则进行下一步骤;
步骤25:给工单打上分类标签,把工单和标签信息进行入库;
步骤3:服务热点统计分析,按照不同业务维度对业务标签进行统计分析,进行可视化呈现展示服务热点分布,并且进行相关推送提示服务人员作后续的分析处理。
步骤3具体包括下列步骤:
步骤31:按照时间区间(小时/天/周/月)、部门、区域或者其他维度对工单进行分类标签的统计,获取出现频率超过设定值的标签即为高频标签,作为服务热点进行可视化呈现。
步骤32:对服务热点标签进行推送,发送给相关部门业务人员用以分析。
经过上述三个步骤的操作流程之后,实现对电力工单服务热点的准确预测发现。
本发明的第二方面,一种用于基于关键短语抽取的供电服务工单热点发现方法的***,包括:
获取模块,用于获取历史工单数据,抽取历史工单数据中的关键短语;
标签库生成模块,用于通过预设的业务判别二分类模型识别符合业务需求的关键短语,作为符合业务需求的关键标签,利用符合业务需求的关键标签生成标签库;
识别模块,用于获取线上工单***的工单,通过预设的业务标签分类模型对工单进行预测,将识别通过的工单打上分类标签并归入标签库,将未识别通过的工单进行关键短语抽取,判断是否符合业务需求,将符合业务需求的关键短语作为符合业务需求的关键标签并归入标签库;
统计模块,用于获取标签库内的出现频率超过设定值的标签作为服务热点。
本发明的第三方面,一种用于所述基于关键短语抽取的供电服务工单热点发现方法的装置,包括:存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如权利要求1至7任一项所述的基于关键短语抽取电服务工单热点发现方法。
本发明的第四方面,一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现所述的基于关键短语抽取的供电服务工单热点发现方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、装置、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
由技术常识可知,本发明可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此,上述公开的实施方案,就各方面而言,都只是举例说明,并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。
Claims (8)
1.一种供电服务工单热点发现方法,其特征在于,包括如下步骤:
获取历史工单数据,抽取历史工单数据中的关键短语;
通过预设的业务判别二分类模型识别符合业务需求的关键短语,作为符合业务需求的关键标签,利用符合业务需求的关键标签生成标签库;
获取线上工单***的工单,通过预设的业务标签分类模型对工单进行预测,将识别通过的工单打上分类标签并归入标签库,将未识别通过的工单进行关键短语抽取,判断是否符合业务需求,将符合业务需求的关键短语作为符合业务需求的关键标签并归入标签库;
获取标签库内的出现频率超过设定值的标签作为服务热点;
所述业务判别二分类模型的获取方式为:对关键短语进行特征提取,获得关键短语的统计和语义特征;给关键短语分别打上“是/否为业务需求标签”构建训练样本;将提取到的统计和语义特征作为输入训练分类模型;
所述业务标签分类模型的获取方式为:针对标签库内的关键标签构建文本分类标注训练集,使用TextCNN算法训练业务标签分类模型。
2.根据权利要求1所述的供电服务工单热点发现方法,其特征在于,所述抽取历史工单数据中的关键短语具体方法如下:
对历史工单数据的文本进行分词和词性标注处理,将历史工单数据的文本转化成包含词性信息的词序列;
按照固定的词性组合关系对词序列进行抽取,将抽取的词组合片段作为元素加入到候选关键短语集合;
使用预训练语言模型计算每个词的向量表示;
依据每个词的向量表示,通过句向量模型计算方法,分别获得候选关键短语和单条样本数据的文本的向量表示;
计算候选关键短语和单条样本数据的文本的向量表示的余弦距离作为相似度,把相似度排Top-N的候选关键短语作为最终的关键短语。
3.根据权利要求1所述的供电服务工单热点发现方法,其特征在于,获取标签库内的出现频率超过设定值的标签作为服务热点,具体包括:按照不同维度对标签库内的标签的进行统计,取出现频率超过设定值的标签作为服务热点并进行可视化呈现。
4.根据权利要求3所述的供电服务工单热点发现方法,其特征在于,所述不同维度包括时间区间、部门和区域。
5.根据权利要求1所述的供电服务工单热点发现方法,其特征在于,获取标签库内的出现频率超过设定值的标签作为服务热点后,将服务热点进行推送给相关部门业务人员。
6.一种用于权利要求1所述供电服务工单热点发现方法的***,其特征在于,包括:
获取模块,用于获取历史工单数据,抽取历史工单数据中的关键短语;
标签库生成模块,用于通过预设的业务判别二分类模型识别符合业务需求的关键短语,作为符合业务需求的关键标签,利用符合业务需求的关键标签生成标签库;
识别模块,用于获取线上工单***的工单,通过预设的业务标签分类模型对工单进行预测,将识别通过的工单打上分类标签并归入标签库,将未识别通过的工单进行关键短语抽取,判断是否符合业务需求,将符合业务需求的关键短语作为符合业务需求的关键标签并归入标签库;
统计模块,用于获取标签库内的出现频率超过设定值的标签作为服务热点。
7.一种计算机装置,其特征在于,包括:存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如权利要求1至5任一项所述的供电服务工单热点发现方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1至5任一项所述的供电服务工单热点发现方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111205671.8A CN113836307B (zh) | 2021-10-15 | 2021-10-15 | 一种供电服务工单热点发现方法、***、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111205671.8A CN113836307B (zh) | 2021-10-15 | 2021-10-15 | 一种供电服务工单热点发现方法、***、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113836307A CN113836307A (zh) | 2021-12-24 |
CN113836307B true CN113836307B (zh) | 2024-02-20 |
Family
ID=78965191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111205671.8A Active CN113836307B (zh) | 2021-10-15 | 2021-10-15 | 一种供电服务工单热点发现方法、***、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113836307B (zh) |
Citations (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101763401A (zh) * | 2009-12-30 | 2010-06-30 | 暨南大学 | 一种网络舆情的热点预测和分析方法 |
CN102262625A (zh) * | 2009-12-24 | 2011-11-30 | 华为技术有限公司 | 网页关键词提取方法及装置 |
CN103136337A (zh) * | 2013-02-01 | 2013-06-05 | 北京邮电大学 | 用于复杂网络的分布式知识数据挖掘装置和挖掘方法 |
CN103336847A (zh) * | 2013-07-22 | 2013-10-02 | 厦门市美亚柏科信息股份有限公司 | 一种新闻热点标签的生成方法及*** |
CN103544255A (zh) * | 2013-10-15 | 2014-01-29 | 常州大学 | 基于文本语义相关的网络舆情信息分析方法 |
CN103678670A (zh) * | 2013-12-25 | 2014-03-26 | 福州大学 | 一种微博热词与热点话题挖掘***及方法 |
CN106383817A (zh) * | 2016-09-29 | 2017-02-08 | 北京理工大学 | 利用分布式语义信息的论文标题生成方法 |
CN106570140A (zh) * | 2016-05-26 | 2017-04-19 | 中科鼎富(北京)科技发展有限公司 | 确定信息热点的方法及装置 |
CN106649818A (zh) * | 2016-12-29 | 2017-05-10 | 北京奇虎科技有限公司 | 应用搜索意图的识别方法、装置、应用搜索方法和服务器 |
CN108345670A (zh) * | 2018-02-09 | 2018-07-31 | 国网江苏省电力有限公司电力科学研究院 | 一种用于95598电力工单的服务热点发现方法 |
CN108664585A (zh) * | 2018-05-07 | 2018-10-16 | 多盟睿达科技(中国)有限公司 | 一种基于大数据的广告选词方法 |
CN109255118A (zh) * | 2017-07-11 | 2019-01-22 | 普天信息技术有限公司 | 一种关键词提取方法及装置 |
CN109710766A (zh) * | 2018-12-29 | 2019-05-03 | 云南电网有限责任公司电力科学研究院 | 一种工单数据的投诉倾向分析预警方法及装置 |
CN109783818A (zh) * | 2019-01-17 | 2019-05-21 | 上海三零卫士信息安全有限公司 | 一种企业行业多标签分类方法 |
CN110119765A (zh) * | 2019-04-18 | 2019-08-13 | 浙江工业大学 | 一种基于Seq2seq框架的关键词提取方法 |
CN110929036A (zh) * | 2019-11-29 | 2020-03-27 | 南方电网数字电网研究院有限公司 | 电力营销稽查管理方法、装置、计算机设备和存储介质 |
CN110929043A (zh) * | 2019-11-28 | 2020-03-27 | 北京智齿博创科技有限公司 | 业务问题提取方法及装置 |
CN111159349A (zh) * | 2019-12-30 | 2020-05-15 | 佰聆数据股份有限公司 | 基于自然语言处理技术的电力诉求工单自动分类方法、***、存储介质及计算机设备 |
CN111159557A (zh) * | 2019-12-31 | 2020-05-15 | 北京奇艺世纪科技有限公司 | 一种热点信息获取方法、装置、服务器及介质 |
CN111291042A (zh) * | 2019-12-23 | 2020-06-16 | 创意信息技术股份有限公司 | 一种用于供电服务的电力数据处理***及方法 |
CN111368201A (zh) * | 2020-03-06 | 2020-07-03 | 杭州威佩网络科技有限公司 | 一种热点事件检测方法、装置、电子设备及存储介质 |
CN111931189A (zh) * | 2020-08-14 | 2020-11-13 | 中国工商银行股份有限公司 | Api接口转用风险检测方法、装置和api服务*** |
CN112232564A (zh) * | 2020-10-15 | 2021-01-15 | 国网冀北电力有限公司计量中心 | 标签处理装置及方法 |
CN112258235A (zh) * | 2020-10-28 | 2021-01-22 | 国家电网有限公司客户服务中心 | 一种电力营销稽核新业务发现方法及*** |
CN112487151A (zh) * | 2020-12-14 | 2021-03-12 | 深圳市欢太科技有限公司 | 文案生成方法及装置、存储介质与电子设备 |
-
2021
- 2021-10-15 CN CN202111205671.8A patent/CN113836307B/zh active Active
Patent Citations (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262625A (zh) * | 2009-12-24 | 2011-11-30 | 华为技术有限公司 | 网页关键词提取方法及装置 |
CN101763401A (zh) * | 2009-12-30 | 2010-06-30 | 暨南大学 | 一种网络舆情的热点预测和分析方法 |
CN103136337A (zh) * | 2013-02-01 | 2013-06-05 | 北京邮电大学 | 用于复杂网络的分布式知识数据挖掘装置和挖掘方法 |
CN103336847A (zh) * | 2013-07-22 | 2013-10-02 | 厦门市美亚柏科信息股份有限公司 | 一种新闻热点标签的生成方法及*** |
CN103544255A (zh) * | 2013-10-15 | 2014-01-29 | 常州大学 | 基于文本语义相关的网络舆情信息分析方法 |
CN103678670A (zh) * | 2013-12-25 | 2014-03-26 | 福州大学 | 一种微博热词与热点话题挖掘***及方法 |
CN106570140A (zh) * | 2016-05-26 | 2017-04-19 | 中科鼎富(北京)科技发展有限公司 | 确定信息热点的方法及装置 |
CN106383817A (zh) * | 2016-09-29 | 2017-02-08 | 北京理工大学 | 利用分布式语义信息的论文标题生成方法 |
CN106649818A (zh) * | 2016-12-29 | 2017-05-10 | 北京奇虎科技有限公司 | 应用搜索意图的识别方法、装置、应用搜索方法和服务器 |
CN109255118A (zh) * | 2017-07-11 | 2019-01-22 | 普天信息技术有限公司 | 一种关键词提取方法及装置 |
CN108345670A (zh) * | 2018-02-09 | 2018-07-31 | 国网江苏省电力有限公司电力科学研究院 | 一种用于95598电力工单的服务热点发现方法 |
CN108664585A (zh) * | 2018-05-07 | 2018-10-16 | 多盟睿达科技(中国)有限公司 | 一种基于大数据的广告选词方法 |
CN109710766A (zh) * | 2018-12-29 | 2019-05-03 | 云南电网有限责任公司电力科学研究院 | 一种工单数据的投诉倾向分析预警方法及装置 |
CN109783818A (zh) * | 2019-01-17 | 2019-05-21 | 上海三零卫士信息安全有限公司 | 一种企业行业多标签分类方法 |
CN110119765A (zh) * | 2019-04-18 | 2019-08-13 | 浙江工业大学 | 一种基于Seq2seq框架的关键词提取方法 |
CN110929043A (zh) * | 2019-11-28 | 2020-03-27 | 北京智齿博创科技有限公司 | 业务问题提取方法及装置 |
CN110929036A (zh) * | 2019-11-29 | 2020-03-27 | 南方电网数字电网研究院有限公司 | 电力营销稽查管理方法、装置、计算机设备和存储介质 |
CN111291042A (zh) * | 2019-12-23 | 2020-06-16 | 创意信息技术股份有限公司 | 一种用于供电服务的电力数据处理***及方法 |
CN111159349A (zh) * | 2019-12-30 | 2020-05-15 | 佰聆数据股份有限公司 | 基于自然语言处理技术的电力诉求工单自动分类方法、***、存储介质及计算机设备 |
CN111159557A (zh) * | 2019-12-31 | 2020-05-15 | 北京奇艺世纪科技有限公司 | 一种热点信息获取方法、装置、服务器及介质 |
CN111368201A (zh) * | 2020-03-06 | 2020-07-03 | 杭州威佩网络科技有限公司 | 一种热点事件检测方法、装置、电子设备及存储介质 |
CN111931189A (zh) * | 2020-08-14 | 2020-11-13 | 中国工商银行股份有限公司 | Api接口转用风险检测方法、装置和api服务*** |
CN112232564A (zh) * | 2020-10-15 | 2021-01-15 | 国网冀北电力有限公司计量中心 | 标签处理装置及方法 |
CN112258235A (zh) * | 2020-10-28 | 2021-01-22 | 国家电网有限公司客户服务中心 | 一种电力营销稽核新业务发现方法及*** |
CN112487151A (zh) * | 2020-12-14 | 2021-03-12 | 深圳市欢太科技有限公司 | 文案生成方法及装置、存储介质与电子设备 |
Non-Patent Citations (2)
Title |
---|
基于文本挖掘技术的客服投诉工单自动分类探讨;李颢 等;《移动通信》;第41卷(第23期);66-72 * |
基于自然语言的国网投诉工单智能分类模型构建;张兆芝 等;《微型电脑应用》;第36卷(第07期);54-57 * |
Also Published As
Publication number | Publication date |
---|---|
CN113836307A (zh) | 2021-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109635117B (zh) | 一种基于知识图谱识别用户意图方法及装置 | |
CN112347310B (zh) | 事件处理信息的查询方法、装置、计算机设备和存储介质 | |
CN114168716B (zh) | 基于深度学习的工程造价自动抽取和分析方法及装置 | |
CN111274817A (zh) | 一种基于自然语言处理技术的智能化软件成本度量方法 | |
CN111143571B (zh) | 实体标注模型的训练方法、实体标注方法以及装置 | |
CN108763368A (zh) | 抽取新知识点的方法 | |
CN113505242A (zh) | 一种知识图谱自动嵌入的方法及*** | |
CN110246496A (zh) | 语音识别方法、***、计算机设备及储存介质 | |
CN111782793A (zh) | 智能客服处理方法和***及设备 | |
CN111462752A (zh) | 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法 | |
CN115687621A (zh) | 一种短文本标签标注方法及装置 | |
CN110990711B (zh) | 基于机器学习的微信公众号推荐方法及*** | |
CN111325019A (zh) | 词库的更新方法及装置、电子设备 | |
CN110287495A (zh) | 一种电力营销专业词识别方法及*** | |
CN113220885B (zh) | 一种文本处理方法和*** | |
Jui et al. | A machine learning-based segmentation approach for measuring similarity between sign languages | |
CN112417996B (zh) | 工业图纸的信息处理方法、装置、电子设备和存储介质 | |
CN114356924A (zh) | 用于从结构化文档提取数据的方法和设备 | |
CN114239579A (zh) | 基于正则表达式和crf模型的电力可研文档提取方法及装置 | |
CN113836307B (zh) | 一种供电服务工单热点发现方法、***、装置及存储介质 | |
CN116933782A (zh) | 一种电商文本关键词提取处理方法及*** | |
CN115062615A (zh) | 一种金融领域事件抽取方法和装置 | |
CN114842301A (zh) | 一种图像注释模型的半监督训练方法 | |
CN115080732A (zh) | 投诉工单处理方法、装置、电子设备和存储介质 | |
KR102382226B1 (ko) | 뉴스 기사의 감성 정보를 레이블링하는 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |