CN111539585B - 一种基于随机森林的电力客户诉求敏感度监督及预警方法 - Google Patents
一种基于随机森林的电力客户诉求敏感度监督及预警方法 Download PDFInfo
- Publication number
- CN111539585B CN111539585B CN202010464624.4A CN202010464624A CN111539585B CN 111539585 B CN111539585 B CN 111539585B CN 202010464624 A CN202010464624 A CN 202010464624A CN 111539585 B CN111539585 B CN 111539585B
- Authority
- CN
- China
- Prior art keywords
- customer
- complaints
- power outage
- arrearage
- sensitivity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000035945 sensitivity Effects 0.000 title claims abstract description 67
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000004519 manufacturing process Methods 0.000 claims abstract description 46
- 238000012549 training Methods 0.000 claims abstract description 21
- 238000010801 machine learning Methods 0.000 claims abstract description 19
- 238000012795 verification Methods 0.000 claims abstract description 12
- 230000002159 abnormal effect Effects 0.000 claims abstract description 5
- 238000001914 filtration Methods 0.000 claims abstract description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 16
- 230000005611 electricity Effects 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- 230000008439 repair process Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000012544 monitoring process Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 3
- 238000013138 pruning Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 abstract 1
- 230000000875 corresponding effect Effects 0.000 description 15
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种基于随机森林的电力客户诉求敏感度监督及预警方法,S1、分别构建生产停电诉求和欠费停复电诉求的客户敏感度关联因素集;S2、抽取历史数据并滤除异常数据形成机器学习数据集合;S3、将所述机器学习数据集合划分为训练集和验证集;S4、基于所述训练集和验证集分别得到生产停电诉求和欠费停复电诉求的随机森林预测模型;S5、基于所述生产停电诉求和欠费停复电诉求的随机森林预测模型分别构建生产停电诉求和欠费停复电诉求的敏感度指数模型;S6、基于所述机器学习数据集合确定预警等级的敏感度指数界限;S7、开展客户诉求的预警等级预测。本发明进一步感知电力客户需求,提升电力服务质量。
Description
技术领域
本发明涉及电力大数据与人工智能技术领域,尤其涉及一种基于随机森林的电力客户诉求敏感度监督及预警方法。
背景技术
大数据分析是指对大规模数据进行分析。大数据可以概括为5个V,数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。电力大数据是能源变革中电力工业技术革新的必然过程,而不是简单的技术范畴。电力大数据不仅仅是技术进步,更是涉及整个电力***在大数据时代下发展理念、管理体制和技术路线等方面的重大变革,是下一代智能化电力***在大数据时代下价值形态的跃升。重塑电力核心价值和转变电力发展方式是电力大数据的两条核心主线。
现有技术中,一般采用随机森林算法对停电诉求预测,但停电类型可以分为生产类停电和欠费停电,分别对应生产停电诉求和欠费停复电诉求,由于生产类停电主要非客户原因导致,而欠费停电存在部分客户原因,因此客户对两种不同类型停电的敏感度存在较大差异,因此不分类型对停电进行诉求预测的准确性有待提高。可以根据客户服务工单以及客户档案、费控电费余额等数据中得知客户服务诉求,不同停电类型导致客户服务诉求的关联因素不同,针对生产停电敏感的客户,会在所在台区发生故障停电期间,进行故障报修,所以将台区故障与客户故障报修进行关联融合;而对欠费停复电敏感的客户,在欠费停电期间,交费后会进行“复电登记”申请,所以将客户欠费停电后交费记录与“复电登记”服务申请进行关联融合。且现有技术中的预测结论仅包括可能投诉和不可能投诉两种结论,有待对预测结论做进一步的细化,以便进一步准确感知电力客户需求,提升电力服务质量,减少客户投诉的发生。
发明内容
(一)要解决的技术问题
基于上述问题,本发明提供一种基于随机森林的电力客户诉求敏感度监督及预警方法,分别对生产停电和欠费停复电两种停电类型进行建模、预测,并对预测结果中的可能投诉进一步细化为中风险、中高风险和高风险,有利于进一步感知电力客户需求,提升电力服务质量。
(二)技术方案
基于上述的技术问题,本发明提供一种基于随机森林的电力客户诉求敏感度监督及预警方法,所述方法包括以下步骤:
S1、分别构建生产停电诉求和欠费停复电诉求的客户敏感度关联因素集;
S2、抽取历史数据、滤除异常数据、数据规范化形成机器学习数据集合:所述机器学习数据集合为标记是否发生生产停电投诉或欠费停复电投诉的与关联因素关联的规范化的有效的历史数据集合;
S3、将所述机器学习数据集合划分为训练集和验证集:
S4、基于所述训练集和验证集分别得到生产停电诉求和欠费停复电诉求的随机森林预测模型,分别输出是否生产停电投诉和是否欠费停复电投诉,并计算出各关联因素对对应预测结果影响的重要性占比;
S5、基于所述生产停电诉求和欠费停复电诉求的随机森林预测模型分别构建生产停电诉求和欠费停复电诉求的敏感度指数模型:
S5.1、对所述关联因素进行归一化处理,量化为0-1之间,得到每个关联因素的量化值;
S5.2、对每个关联因素的量化值根据对应的所述每个关联因素的重要性占比进行加权求和,得到0-1之间的关联因素的敏感度指数;
S6、基于所述机器学习数据集合确定预警等级的敏感度指数界限:
基于所述机器学习数据集合,对于发生的生产停电投诉和欠费停复电投诉历史数据分别代入步骤S5计算对应的敏感度指数,并分别采用聚类分析的方法分为三类:中风险、中高风险和高风险,分别得到中风险、中高风险和高风险的生产停电诉求或欠费停复电诉求敏感度指数界限;
S7、开展客户诉求的预警等级预测:
基于客户服务实际情况,根据停电类型代入步骤S4对应的所述随机森林预测模型预测是否生产停电投诉和是否欠费停复电投诉,若为不可能生产停电投诉或不可能欠费停复电投诉,则记为低风险;若为可能生产停电投诉或可能欠费停复电投诉,则按步骤S5计算对应的敏感度指数,并根据步骤S6对应的敏感度指数界限判断预警等级为中风险、中高风险或高风险。
优选地,步骤S1中的所述生产停电诉求的客户敏感度关联因素集的关联因素包括客户所属城市、客户呼叫次数、客户呼叫时间、客户报修次数、台区故障时间;
所述欠费停复电诉求的客户敏感度关联因素集的关联因素包括客户所属城市、客户欠费信息、客户呼叫次数、客户呼叫时间、客户缴费信息、客户“复电登记”申请次数,客户欠费信息包括客户欠费金额、客户欠费起始时间、客户已欠费时间,客户缴费信息包括客户缴费金额、客户缴费起始时间、客户已缴费时间。
进一步的,步骤S2中的所述关联是将客户属性表和客户投诉记录按客户编码进行关联。
进一步的,步骤S2中的所述数据规范化具体为:将客户所属城市分别表示归一化处理,映射到[0,1]之间,将将客户呼叫次数、客户呼叫时间、客户报修次数、台区故障时间、客户“复电登记”申请次数、客户欠费金额、客户欠费起始时间、客户已欠费时间、客户缴费金额、客户缴费起始时间、客户已缴费时间等数值型字段分别通过(原始值-最小值)/(最大值-最小值)规范化为[0,1]之间。
优选地,步骤S3中的所述训练集和验证集按1:1比例划分。
进一步的,步骤S4包括以下步骤:
S4.1、所述训练集数据样本为N,从中有放回地随机抽取容量相同的样本,形成训练子集;
S4.2、抽样得到的所述训练子集有M个特征,所述特征即关联因素,对于是否生产停电投诉的特征包括客户所属城市、客户呼叫次数、客户呼叫时间、客户报修次数、台区故障时间,对于是否欠费停复电投诉的特征包括客户所属城市、客户欠费信息、客户呼叫次数、客户呼叫时间、客户缴费信息、客户“复电登记”申请次数,分别从中随机抽取m个作为***特征子集,m≤M,后续采用CART算法***而不剪枝;
S4.3、重复n次步骤S4.1和S4.2,生成相应数量的n棵子树,分别构成两个随机森林预测模型,代入各子树,对各子树结果以多胜少的方式得到的结果即为所述随机森林预测模型的输出,分别输出是否生产停电投诉或是否欠费停复电投诉;
S4.4、采用所述测试集数据样本分别验证两个随机森林模型的预测结果,评估预测结果,若预测结果满足应用需求,则进入步骤S4.5,否则调整模型参数,返回步骤S4.1;
S4.5、计算两个随机森林模型的各特征对应的Gini指数,即每个再除以所有关联因素的重要性之和得到每个关联因素的重要性占比,其中,k表示数据集中类别的个数,pi表示第i个类别的样本数量占总样本的比例。
本发明也公开了一种基于随机森林的电力客户诉求敏感度监督及预警***,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行一种基于随机森林的电力客户诉求敏感度监督及预警方法。
本发明也公开了一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行一种基于随机森林的电力客户诉求敏感度监督及预警方法。
(三)有益效果
本发明的上述技术方案具有如下优点:
(1)本发明针对不同停电类型,分别构建生产停电诉求和欠费停复电诉求的客户敏感度关联因素集,分别构建随机森林预测模型、敏感度指数模型,并分别进行预警等级预测,对客户需求更具有针对性,预测结果的准确性更高;
(2)本发明根据敏感度指数对随机森林预测模型预测的可能投诉的结论进行了进一步的风险性评估细化,有利于进一步感知客户需求,提高服务质量,具有重要的应用价值;
(3)本发明将通过随机森林预测模型得到的各关联因素的重要性占比作为权重,对关联因素的量化值进行加权求和,得到的敏感度指数相对于敏感度更具有评估价值,有利于提高预测结果的准确性。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1为本发明实施例一种基于随机森林的电力客户诉求敏感度监督及预警方法的流程示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
一种基于随机森林的电力客户诉求敏感度监督及预警方法,如图1所示,包括以下步骤:
S1、分别构建生产停电诉求和欠费停复电诉求的客户敏感度关联因素集:
生产停电诉求的客户敏感度关联因素集的关联因素包括但不仅限于客户所属城市、客户呼叫次数、客户呼叫时间、客户报修次数、台区故障时间;
欠费停复电诉求的客户敏感度关联因素集的关联因素包括但不仅限于客户所属城市、客户欠费信息、客户呼叫次数、客户呼叫时间、客户缴费信息、客户“复电登记”申请次数,客户欠费信息包括客户欠费金额、客户欠费起始时间、客户已欠费时间,客户缴费信息包括客户缴费金额、客户缴费起始时间、客户已缴费时间。
S2、抽取历史数据、滤除异常数据、数据规范化形成机器学习数据集合:
抽取历史一年数据,将客户属性表和客户投诉记录按客户编码进行关联,形成标记是否发生生产停电投诉或欠费停复电投诉的与关联因素关联的历史数据集合,对所述历史数据集合进行清洗,滤除异常数据,并数据规范化形成有效的机器学习数据集合;
数据规范化具体为:将客户所属城市分别表示归一化处理,映射到[0,1]之间,将将客户呼叫次数、客户呼叫时间、客户报修次数、台区故障时间、客户“复电登记”申请次数、客户欠费金额、客户欠费起始时间、客户已欠费时间、客户缴费金额、客户缴费起始时间、客户已缴费时间等数值型字段分别通过(原始值-最小值)/(最大值-最小值)规范化为[0,1]之间。
S3、将所述机器学习数据集合划分为训练集和验证集:
将所述机器学习数据集合按一定比例,划分为训练集和验证集,比如按1:1的比例划分。
S4、基于所述训练集和验证集分别得到生产停电诉求和欠费停复电诉求的随机森林预测模型,分别输出是否生产停电投诉和是否欠费停复电投诉,并计算出各关联因素对对应预测结果影响的重要性占比:
利用训练集对生产停电诉求和欠费停复电诉求分别构建随机森林预测模型,设定模型参数,利用验证集分析预测结果,再调整模型参数,直至预测结果满足分析应用需求,得到满足分析应用需求的随机森林预测模型,分别输出是否生产停电投诉或是否欠费停复电投诉,并计算出各关联因素对对应预测结果影响的重要性占比,具体步骤如下:
S4.1、所述训练集数据样本为N,从中有放回地随机抽取容量相同的样本,形成训练子集;
S4.2、抽样得到的所述训练子集有M个特征,所述特征即关联因素,对于是否生产停电投诉的特征包括但不仅限于客户所属城市、客户呼叫次数、客户呼叫时间、客户报修次数、台区故障时间,对于是否欠费停复电投诉的特征包括但不仅限于客户所属城市、客户欠费信息、客户呼叫次数、客户呼叫时间、客户缴费信息、客户“复电登记”申请次数,分别从中随机抽取m个作为***特征子集,m≤M,后续采用CART算法***而不剪枝;
S4.3、重复n次步骤S4.1和S4.2,生成相应数量的n棵子树,分别构成两个随机森林预测模型,代入各子树,对各子树结果以多胜少的方式得到的结果即为所述随机森林预测模型的输出,分别输出是否生产停电投诉或是否欠费停复电投诉;
S4.4、采用所述测试集数据样本分别验证两个随机森林模型的预测结果,评估预测结果,若预测结果满足应用需求,则进入步骤S4.5,否则调整模型参数,返回步骤S4.1;
S4.5、计算两个随机森林模型的各特征对应的Gini指数,即每个再除以所有关联因素的重要性之和得到每个关联因素的重要性占比,其中,k表示数据集中类别的个数,pi表示第i个类别的样本数量占总样本的比例;
随机森林算法预测模型的构建及重要性占比可以为现有技术中的算法包实现,通常使用算法包实现,如python语言的sklearn.ensemble算法库,该算法库包含了随机森林的分类和回归的实现,分别为RandomForestClassifier算法和RandomForestRegression算法。在预测过程中,使用RandomForestRegression算法。使用算法包的主要参数包括n_estimators和max_features等,其中n_estimators参数用于指定随机森林中的分类器的个数,max_features用于指定算法的最大特征数,输出预测结果。sklearn.ensemble算法库通过调用feature_importances_,提供影响因素即关联因素的重要性排序及占比。
各关联因素对对应预测结果影响的重要性占比,比如生产停电诉求的客户呼叫次数、客户所属城市、客户第一通电话评论时长这三个关联因素的重要性占比即权重分别为50%、30%、20%。
S5、基于所述生产停电诉求和欠费停复电诉求的随机森林预测模型分别构建生产停电诉求和欠费停复电诉求的敏感度指数模型:
S5.1、对所述关联因素进行归一化处理,量化为0-1之间,得到每个关联因素的量化值;
S5.2、对每个关联因素的量化值根据对应的所述每个关联因素的重要性占比进行加权求和,得到0-1之间的关联因素的敏感度指数,敏感度指数越接近1,投诉的可能性越大。
S6、基于所述机器学习数据集合确定预警等级的敏感度指数界限:
基于所述机器学习数据集合,对于发生的生产停电投诉和欠费停复电投诉历史数据分别代入步骤S5计算生产停电诉求和欠费停复电诉求的敏感度指数,并分别采用聚类分析的方法分为三类:中风险、中高风险和高风险,分别得到中风险、中高风险和高风险的生产停电诉求或欠费停复电诉求敏感度指数界限,该聚类分析的方法为一维聚类。
S7、开展客户诉求的预警等级预测:
基于客户服务实际情况,根据停电类型代入步骤S4对应的所述随机森林预测模型预测是否生产停电投诉和是否欠费停复电投诉,若为不可能生产停电投诉或不可能欠费停复电投诉,则记为低风险;若为可能生产停电投诉或可能欠费停复电投诉,则按步骤S5计算生产停电诉求或欠费停复电诉求敏感度指数,并根据步骤S6对应的所述生产停电诉求或欠费停复电诉求敏感度指数界限判断对应的预警等级为中风险、中高风险或高风险。
本发明所述方法根据停电类型对生产停电诉求和欠费停复电诉求分别分析,在步骤S1中分别构建关联因素集,在步骤S4中分别构建随机森林预测模型,在步骤S5中分别构建敏感度指数模型,在步骤S6中分别得到预警等级的敏感度指数界限,在步骤S7中分别进行预警等级预测。
需要说明的是,上述的控制方法可以转换为软件程序指令,既可以使用包括处理器和存储器的控制***来运行实现,也可以通过非暂态计算机可读存储介质中存储的计算机指令来实现。上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
综上可知,通过上述的一种基于随机森林的电力客户诉求敏感度监督及预警方法,具有以下优点:
(1)本发明针对不同停电类型,分别构建生产停电诉求和欠费停复电诉求的客户敏感度关联因素集,分别构建随机森林预测模型、敏感度指数模型,并分别进行预警等级预测,对客户需求更具有针对性,预测结果的准确性更高;
(2)本发明根据敏感度指数对随机森林预测模型预测的可能投诉的结论进行了进一步的风险性评估细化,有利于进一步感知客户需求,提高服务质量,具有重要的应用价值;
(3)本发明将通过随机森林预测模型得到的各关联因素的重要性占比作为权重,对关联因素的量化值进行加权求和,得到的敏感度指数相对于敏感度更具有评估价值,有利于提高预测结果的准确性。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (8)
1.一种基于随机森林的电力客户诉求敏感度监督及预警方法,其特征在于,所述方法包括以下步骤:
S1、分别构建生产停电诉求和欠费停复电诉求的客户敏感度关联因素集;
S2、抽取历史数据、滤除异常数据、数据规范化形成机器学习数据集合:所述机器学习数据集合为标记是否发生生产停电投诉或欠费停复电投诉的与关联因素关联的规范化的有效的历史数据集合;
S3、将所述机器学习数据集合划分为训练集和验证集:
S4、基于所述训练集和验证集分别得到生产停电诉求和欠费停复电诉求的随机森林预测模型,分别输出是否生产停电投诉和是否欠费停复电投诉,并计算出各关联因素对对应预测结果影响的重要性占比;
S5、基于所述生产停电诉求和欠费停复电诉求的随机森林预测模型分别构建生产停电诉求和欠费停复电诉求的敏感度指数模型:
S5.1、对所述关联因素进行归一化处理,量化为0-1之间,得到每个关联因素的量化值;
S5.2、对每个关联因素的量化值根据对应的所述每个关联因素的重要性占比进行加权求和,得到0-1之间的关联因素的敏感度指数;
S6、基于所述机器学习数据集合确定预警等级的敏感度指数界限:
基于所述机器学习数据集合,对于发生的生产停电投诉和欠费停复电投诉历史数据分别代入步骤S5计算对应的敏感度指数,并分别采用聚类分析的方法分为三类:中风险、中高风险和高风险,分别得到中风险、中高风险和高风险的生产停电诉求或欠费停复电诉求敏感度指数界限;
S7、开展客户诉求的预警等级预测:
基于客户服务实际情况,根据停电类型代入步骤S4对应的所述随机森林预测模型预测是否生产停电投诉和是否欠费停复电投诉,若为不可能生产停电投诉或不可能欠费停复电投诉,则记为低风险;若为可能生产停电投诉或可能欠费停复电投诉,则按步骤S5计算对应的敏感度指数,并根据步骤S6对应的敏感度指数界限判断预警等级为中风险、中高风险或高风险。
2.根据权利要求1所述的一种基于随机森林的电力客户诉求敏感度监督及预警方法,其特征在于,步骤S1中的所述生产停电诉求的客户敏感度关联因素集的关联因素包括客户所属城市、客户呼叫次数、客户呼叫时间、客户报修次数、台区故障时间;
所述欠费停复电诉求的客户敏感度关联因素集的关联因素包括客户所属城市、客户欠费信息、客户呼叫次数、客户呼叫时间、客户缴费信息、客户“复电登记”申请次数,客户欠费信息包括客户欠费金额、客户欠费起始时间、客户已欠费时间,客户缴费信息包括客户缴费金额、客户缴费起始时间、客户已缴费时间。
3.根据权利要求1所述的一种基于随机森林的电力客户诉求敏感度监督及预警方法,其特征在于,步骤S2中的所述关联是将客户属性表和客户投诉记录按客户编码进行关联。
4.根据权利要求2所述的一种基于随机森林的电力客户诉求敏感度监督及预警方法,其特征在于,步骤S2中的所述数据规范化具体为:将客户所属城市分别表示归一化处理,映射到[0,1]之间,将将客户呼叫次数、客户呼叫时间、客户报修次数、台区故障时间、客户“复电登记”申请次数、客户欠费金额、客户欠费起始时间、客户已欠费时间、客户缴费金额、客户缴费起始时间、客户已缴费时间等数值型字段分别通过(原始值-最小值)/(最大值-最小值)规范化为[0,1]之间。
5.根据权利要求1所述的一种基于随机森林的电力客户诉求敏感度监督及预警方法,其特征在于,步骤S3中的所述训练集和验证集按1:1比例划分。
6.根据权利要求1所述的一种基于随机森林的电力客户诉求敏感度监督及预警方法,其特征在于,步骤S4包括以下步骤:
S4.1、所述训练集数据样本为N,从中有放回地随机抽取容量相同的样本,形成训练子集;
S4.2、抽样得到的所述训练子集有M个特征,所述特征即关联因素,对于是否生产停电投诉的特征包括客户所属城市、客户呼叫次数、客户呼叫时间、客户报修次数、台区故障时间,对于是否欠费停复电投诉的特征包括客户所属城市、客户欠费信息、客户呼叫次数、客户呼叫时间、客户缴费信息、客户“复电登记”申请次数,分别从中随机抽取m个作为***特征子集,m≤M,后续采用CART算法***而不剪枝;
S4.3、重复n次步骤S4.1和S4.2,生成相应数量的n棵子树,分别构成两个随机森林预测模型,代入各子树,对各子树结果以多胜少的方式得到的结果即为所述随机森林预测模型的输出,分别输出是否生产停电投诉或是否欠费停复电投诉;
S4.4、采用所述测试集数据样本分别验证两个随机森林模型的预测结果,评估预测结果,若预测结果满足应用需求,则进入步骤S4.5,否则调整模型参数,返回步骤S4.1;
7.一种基于随机森林的电力客户诉求敏感度监督及预警***,其特征在于,包括:
至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至6任一项所述的方法。
8.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010464624.4A CN111539585B (zh) | 2020-05-26 | 2020-05-26 | 一种基于随机森林的电力客户诉求敏感度监督及预警方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010464624.4A CN111539585B (zh) | 2020-05-26 | 2020-05-26 | 一种基于随机森林的电力客户诉求敏感度监督及预警方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111539585A CN111539585A (zh) | 2020-08-14 |
CN111539585B true CN111539585B (zh) | 2023-05-23 |
Family
ID=71978239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010464624.4A Active CN111539585B (zh) | 2020-05-26 | 2020-05-26 | 一种基于随机森林的电力客户诉求敏感度监督及预警方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111539585B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112633561A (zh) * | 2020-12-09 | 2021-04-09 | 北京名道恒通信息技术有限公司 | 一种基于工业大数据的生产风险智能预测预警方法 |
CN112766550B (zh) * | 2021-01-08 | 2023-10-13 | 佰聆数据股份有限公司 | 基于随机森林的停电敏感用户预测方法、***、存储介质及计算机设备 |
CN113269247B (zh) * | 2021-05-24 | 2023-09-01 | 平安科技(深圳)有限公司 | 投诉预警模型的训练方法、装置、计算机设备及存储介质 |
CN113449925B (zh) * | 2021-07-12 | 2022-11-29 | 云南电网有限责任公司 | 一种基于随机森林模型的台区停电风险等级预测方法 |
CN113657901B (zh) * | 2021-07-23 | 2024-04-16 | 上海钧正网络科技有限公司 | 欠费用户的催收管理方法、***、终端及介质 |
CN114169770A (zh) * | 2021-12-09 | 2022-03-11 | 福州大学 | 考虑人事时多要素的供电质量投诉预警*** |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106600455A (zh) * | 2016-11-25 | 2017-04-26 | 国网河南省电力公司电力科学研究院 | 一种基于逻辑回归的电费敏感度评估方法 |
CN107507038A (zh) * | 2017-09-01 | 2017-12-22 | 美林数据技术股份有限公司 | 一种基于stacking和bagging算法的电费敏感用户分析方法 |
CN108492033A (zh) * | 2018-03-26 | 2018-09-04 | 国家电网公司客户服务中心 | 电网客户集中投诉智能预警方法 |
KR101979247B1 (ko) * | 2018-08-09 | 2019-05-16 | 주식회사 에프에스 | 지능적 공간 안전 모니터링 장치 및 그 시스템 |
CN109816146A (zh) * | 2018-12-25 | 2019-05-28 | 国网安徽省电力有限公司 | 一种基于随机森林法欠费停复电投诉倾向预测方法 |
CN109934469A (zh) * | 2019-02-25 | 2019-06-25 | 国网河南省电力公司电力科学研究院 | 基于异源交叉回归分析的停电敏感度预警方法及装置 |
CN110717678A (zh) * | 2019-10-13 | 2020-01-21 | 国网福建省电力有限公司 | 一种电费风险评估与预警方法、*** |
CN111062564A (zh) * | 2019-11-08 | 2020-04-24 | 广东电网有限责任公司 | 一种电力客户诉求敏感值计算方法 |
CN111105120A (zh) * | 2018-10-29 | 2020-05-05 | 北京嘀嘀无限科技发展有限公司 | 一种工单处理方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190349273A1 (en) * | 2018-05-14 | 2019-11-14 | Servicenow, Inc. | Systems and method for incident forecasting |
-
2020
- 2020-05-26 CN CN202010464624.4A patent/CN111539585B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106600455A (zh) * | 2016-11-25 | 2017-04-26 | 国网河南省电力公司电力科学研究院 | 一种基于逻辑回归的电费敏感度评估方法 |
CN107507038A (zh) * | 2017-09-01 | 2017-12-22 | 美林数据技术股份有限公司 | 一种基于stacking和bagging算法的电费敏感用户分析方法 |
CN108492033A (zh) * | 2018-03-26 | 2018-09-04 | 国家电网公司客户服务中心 | 电网客户集中投诉智能预警方法 |
KR101979247B1 (ko) * | 2018-08-09 | 2019-05-16 | 주식회사 에프에스 | 지능적 공간 안전 모니터링 장치 및 그 시스템 |
CN111105120A (zh) * | 2018-10-29 | 2020-05-05 | 北京嘀嘀无限科技发展有限公司 | 一种工单处理方法及装置 |
CN109816146A (zh) * | 2018-12-25 | 2019-05-28 | 国网安徽省电力有限公司 | 一种基于随机森林法欠费停复电投诉倾向预测方法 |
CN109934469A (zh) * | 2019-02-25 | 2019-06-25 | 国网河南省电力公司电力科学研究院 | 基于异源交叉回归分析的停电敏感度预警方法及装置 |
CN110717678A (zh) * | 2019-10-13 | 2020-01-21 | 国网福建省电力有限公司 | 一种电费风险评估与预警方法、*** |
CN111062564A (zh) * | 2019-11-08 | 2020-04-24 | 广东电网有限责任公司 | 一种电力客户诉求敏感值计算方法 |
Non-Patent Citations (3)
Title |
---|
严宇平.基于数据挖掘技术的客户停电敏感度研究与应用.《工程科技Ⅱ辑》.2015,全文. * |
彭路.基于深度神经网络的电力客户诉求预判.《工程科技Ⅱ辑》.2020,全文. * |
郑芒英.用电客户停电敏感度分析.《工程科技Ⅱ辑》.2015,全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111539585A (zh) | 2020-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111539585B (zh) | 一种基于随机森林的电力客户诉求敏感度监督及预警方法 | |
CN112053233B (zh) | 基于gra的动态中小企业信用评分方法及*** | |
CN108345670B (zh) | 一种用于95598电力工单的服务热点发现方法 | |
CN113298121B (zh) | 基于多数据源建模的消息发送方法、装置和电子设备 | |
CN113742993B (zh) | 干式变压器寿命损失预测方法、装置、设备及存储介质 | |
CN111062564A (zh) | 一种电力客户诉求敏感值计算方法 | |
CN116882804A (zh) | 一种智能电力监控方法及*** | |
CN113516192A (zh) | 一种用户用电异动识别方法、***、装置及存储介质 | |
CN111932044A (zh) | 一种基于机器学习的钢铁产品价格预测***和方法 | |
CN111091460A (zh) | 一种数据处理方法及装置 | |
CN114584601A (zh) | 用户流失识别及干预方法、***、终端及介质 | |
CN117668205A (zh) | 智慧物流客服处理方法、***、设备及存储介质 | |
CN117853238A (zh) | 基于多数据源融合的电力交易辅助决策*** | |
CN114118793A (zh) | 一种地方交易所风险预警方法、装置及设备 | |
CN116777124B (zh) | 一种基于用户用电行为的窃电监测方法 | |
CN113469536A (zh) | 一种供电服务客户投诉风险等级识别方法 | |
CN113095680A (zh) | 电力大数据模型的评价指标体系与构建方法 | |
CN116611911A (zh) | 基于支持向量机的信用风险预测方法及装置 | |
CN117196630A (zh) | 交易风险预测方法、装置、终端设备以及存储介质 | |
CN114912854B (zh) | 地铁列车运行调整方法、装置、电子设备及存储介质 | |
CN114741592A (zh) | 一种基于多模型融合的产品推荐方法、设备及介质 | |
CN114626433A (zh) | 一种智能电能表故障预测并分类方法、装置及*** | |
CN112927091B (zh) | 用于年金险的投诉预警方法、装置、计算机设备及介质 | |
CN114219245A (zh) | 基于大数据的乡村电力指数评价方法、装置及存储介质 | |
CN113935819A (zh) | 核算异常特征提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |