CN108304990B - 一种停电敏感预判方法和*** - Google Patents

一种停电敏感预判方法和*** Download PDF

Info

Publication number
CN108304990B
CN108304990B CN201711444284.3A CN201711444284A CN108304990B CN 108304990 B CN108304990 B CN 108304990B CN 201711444284 A CN201711444284 A CN 201711444284A CN 108304990 B CN108304990 B CN 108304990B
Authority
CN
China
Prior art keywords
power failure
user
user group
users
training set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711444284.3A
Other languages
English (en)
Other versions
CN108304990A (zh
Inventor
冯歆尧
温柏坚
黄剑文
徐晖
彭泽武
万婵
邓楚然
杨秋勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information Center of Guangdong Power Grid Co Ltd
Original Assignee
Information Center of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information Center of Guangdong Power Grid Co Ltd filed Critical Information Center of Guangdong Power Grid Co Ltd
Priority to CN201711444284.3A priority Critical patent/CN108304990B/zh
Publication of CN108304990A publication Critical patent/CN108304990A/zh
Application granted granted Critical
Publication of CN108304990B publication Critical patent/CN108304990B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Engineering & Computer Science (AREA)
  • Water Supply & Treatment (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种停电敏感预判方法。该方法包括:获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户。通过管理规则和半监督分类模型可以准确判别对停电状况的敏感的用户,从而可以在停电发生时,为采取不同的安抚和引导策略提供参考,减少客户来电风险,树立了电力公司良好的社会形象。

Description

一种停电敏感预判方法和***
技术领域
本发明涉及电力行业客户管理技术领域,尤其涉及一种停电敏感预判方法和***。
背景技术
随着社会经济的快速发展,现阶段企业和居民对供电可靠性的要求越来越高,但停电事件还时有发生,电网企业承担了用户连续稳定用电,以及供电安全管理的义务。一旦停电敏感用户发生停电,该类用户会对停电事件产生供电服务不满意的反应,将会影响电网的企业社会形象。
在停电发生时,准确地判别用户对停电事件的敏感程度,为应急响应及差异化服务提供指导依据,提升电网的服务质量,提高用户对电网服务的满意度,就有必要挖掘对停电敏感的用户,合理的安排停电计划。但是,营销***中并没用统一标识停电敏感用户。于是,为了解决实际业务过程中存在的该问题,就需要对停电敏感进行业务建模与数据挖掘。
发明内容
本发明提供了一种停电敏感预判方法及***,该方法及***可以准确地判别对停电状况的敏感的用户。
为实现上述设计,本发明采用以下技术方案:
一方面,提供了一种停电敏感预判方法,包括:
获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;
将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;
根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;
采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户。
其中,所述根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,包括:
判断所述模型数据集中的每一个用户是否为重要客户、重点关注客户或者特殊行业客户,其中,所述重要客户为带有停电敏感标签的用户,所述重点关注客户为具有高敏感度停电时段的用户,所述特殊行业客户为对电能质量要求高的用户;
若是,则所述用户属于特殊用户群体;
若否,则所述用户属于非特殊用户群体。
其中,所述采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户,包括:
将所述非特殊用户群体分为训练集用户群体和测试集用户群体;
采用类别标记法对所述训练集用户群体中的用户进行类别标记;
对类别标记后的所述训练集用户群体进行特征选择;
确定特征选择后训练集用户群体的模型变量;
根据所述模型变量建立半监督分类模型,对特征选择后训练集用户群体进行半监督分类模型训练,确定停电敏感模型;
通过在特征选择后的训练集用户群体中运行所述停电敏感模型找出特征选择后的训练集用户群体中的停电敏感用户。
其中,所述采用类别标记法对所述训练集用户群体中的用户进行类别标记,包括:
判断所述训练集用户群体中的每一个用户是否为重要客户、部分重点关注客户、部分不能停电客户、近两天内拨打计划停电信息相关热线超过2次的客户、有与计划停电相关投诉工单的客户或历史停电事件发生后存在拨打供电局电话投诉行为的客户;
若是,则对所述用户数据进行标记。
其中,所述对类别标记后的所述训练集用户群体进行特征选择,具体为:
根据历史拨打电话行为特征、停电事件特征和/或用电性质对类别标记后的所述训练集用户群体进行特征选择。
其中,所述对特征选择后训练集用户群体进行半监督分类模型训练,确定停电敏感模型,包括:
Step1:按照所述类别标记法对训练集用户群体中的用户进行标记后,得到了有标记样本集S并记作Seeds集,无标记样本集U;
Step2:输入有标记样本集S集分别到初始分类器H1、H2、H3
Step3:利用S训练H1、H2、H3
Step4:针对
Figure BDA0001527221500000031
若满足H1(xi)=H2(xi)、H2(xi)=H3(xi)或H1(xi)=H3(xi)(其中H1(xi)、H2(xi)、H3(xi)分别表示分类器H1、H2、H3对无标记样本xi的标记结果),那么便将无标记样本xi及其对应的类别标记H2(xi)添加到S,得到新训练集S;
Step5:继续利用新的S训练H1、H2、H3
Step6:返回Step4,直到H1、H2、H3不再变化时,得到最终的有标记样本集记作St,执行Step6;
Step7:利用St训练H1、H2、H3中分类效果最好的一个分类器,得到的效果最好的一个分类器即停电敏感模型。
其中,所述获取用户用电相关信息,包括:
确定用户的群体范围;
确定获取用户用电相关信息的时间窗;
确定预判周期,根据所述预判周期确定用于预判的特征数据集;
确定建立用户历史停电情况表所需的原始数据字段;
根据所述群体范围、时间窗、预判周期、特征数据集和原始数据字段建立用户用电相关信息。
其中,所述将所述用户历史停电情况表输入到分析计算平台进行预处理,包括:
根据所述原始字段构造分析计算平台所需的变量;
对所述用户历史停电情况表中所述变量对应的数据进行筛选,删除所述数据中的异常值和缺失值;
消除筛选后的数据的时间序列属性,获得筛选后的数据的具体数值;
对所述具体数值进行区间规范化。
其中,所述对所述具体数值进行区间规范化的公式为:
Figure BDA0001527221500000041
其中,normalization为特征原始值规范处理结果,initial为特征原始值,min
为该特征的最小值,max为该特征的最大值。
另一方面,提供了一种停电敏感预判***,包括:
建立单元,用于获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;
预处理单元,用于将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;
划分单元,用于根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;
选出单元,用于采用半监督分类模型从所述非特殊用户群体中选出停电敏感用户。
本发明的有益效果为:本发明的一种停电敏感预判方法,包括:获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户。通过管理规则和半监督分类模型可以准确判别对停电状况的敏感的用户,从而可以在停电发生时,为采取不同的安抚和引导策略提供参考,减少客户来电风险,树立了电力公司良好的社会形象。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本发明实施例的内容和这些附图获得其他的附图。
图1是本发明具体实施方式中提供的一种停电敏感预判方法的第一实施例的方法流程图。
图2是本发明具体实施方式中提供的一种停电敏感预判方法的第二实施例的方法流程图。
图3是本发明具体实施方式中提供的一种停电敏感预判***的结构方框图。
具体实施方式
为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本发明实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,其是本发明具体实施方式中提供的一种停电敏感预判方法的第一实施例的方法流程图。如图所示,该方法包括:
步骤S101:获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表。
从电网客服数据库管理***中获取用户用电相关信息,其中,用户用电相关信息包括:用户档案信息、客服工单信息、停电通知记录信息、工单用户关联信息和停电事件信息等,根据这些信息建立用户历史停电情况表。
获取用户用电相关信息,包括如下步骤:
1.确定用电用户的群体范围;例如:用电用户的群体为广东电网用户群体、湖南电网用户群体等。
2.确定获取用户用电相关信息的时间窗,即获取用于预判的用户用电相关信息的时间窗;该时间窗可以根据不同的需求设置不同的长度,例如:可以将时间窗设为12个月,从2017年1月—2017年12月。其中,2017年12月的用户数据为已知类别标识的数据,构造训练数据集目标变量;2017年1月—2017年11月的数据已知行为特征数据,构造训练数据集的特征变量。
3.确定预判周期,根据所述预判周期确定用于预判的特征数据集;可以根据不同的需求设置不同长度的预判周期,例如:可以将预判周期设为未来的1个月,为2018年1月。构造用于预判的特征数据集的时间窗为12个月,即2017年1月—2017年12月,则2017年1月—2017年12月内的特征数据即为用于预判的特征数据集。
4.确定建立用户历史停电情况表所需的原始数据字段;其中,原始数据字段包括用户编号、业务类别代码、停电通知记录标识、停电客户明细标识、客服工作单标识、客户诉求标识、来电内容、接通时间、挂机时间、停电实际开始时间、停电实际结束时间等。
5.根据所述群体范围、时间窗、预判周期、特征数据集和原始数据字段建立用户用电相关信息。
步骤S102:将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集。
将所述用户历史停电情况表输入到分析计算平台进行预处理,包括以下步骤:
1.根据所述原始字段构造分析计算平台所需的变量;如下表1所示。
选取总用电用户样本数量为1118092。
表1分析计算平台所需的变量
Figure BDA0001527221500000071
Figure BDA0001527221500000081
Figure BDA0001527221500000091
2.对所述用户历史停电情况表中所述变量对应的数据进行筛选,删除所述数据中的异常值和缺失值。
检查用户历史停电情况表,对表中上述变量对应的数据进行筛选,删除所述数据中的异常值和缺失值,输出数据质量良好的用户历史停电情况表。
3.消除筛选后的数据的时间序列属性,获得筛选后的数据的具体数值。
4.对所述具体数值进行区间规范化。
对3中获得的具体数据进行区间规范化,具体的的公式为:
Figure BDA0001527221500000092
其中,normalization为特征原始值规范处理结果,initial为特征原始值,min
为该特征的最小值,max为该特征的最大值。
步骤S103:根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户。
管理规则具体为:
1.根据“客户分群标志”识别,判断用户是否为重要客户或重点关注客户;
2.根据“用电类别代码”识别用户的用电类别识别,判断用户是否为特殊行业客户;
3.将重要客户、重点关注客户和特殊行业客户划分为特殊用户群体,其他用户属于非特殊用户群体,并将特殊用户群体定义为停电高敏感用户,在下一个预判周期(如:下一个月或接下来三个月)内标记为“停电高敏感”,直接输入“停电高敏感”标签。
其中,重要客户是在业务上本身就带有停电敏感的标签的用电用户;重点关注客户是具有高敏感度停电时段的用电用户,如:党政机关客户,其工作日的敏感度高于休息日;特殊行业客户是对于电能质量异常高,同时在进行工业生产阶段,具有较高的停电敏感度的用电用户,例如:精密电子加工业客户,渔业养殖、排灌、冷库和茶叶用电客户。
步骤S104:采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户。
采用半监督分类模型从非特殊用户群体中找出的停电敏感用户包括停电高敏感用户和停电低敏感用户。
采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户,包括以下步骤:
1.将所述非特殊用户群体分为训练集用户群体和测试集用户群体;
2.采用类别标记法对所述训练集用户群体中的用户进行类别标记。判断所述训练集用户群体中的每一个用户是否为重要客户、部分重点关注客户、部分不能停电客户、近两天内拨打计划停电信息相关热线超过2次的客户、有与计划停电相关投诉工单的客户或历史停电事件发生后存在拨打供电局电话投诉行为的客户;若是,则对所述用户数据进行标记;否则不进行标记。
3.对类别标记后的所述训练集用户群体进行特征选择。
根据历史拨打电话行为特征、停电事件特征和/或用电性质对类别标记后的所述训练集用户群体进行特征选择。其中,历史拨打电话行为特征是指用户过去对于停电事件产生反应行为,包括拨打次数、拨打时长、拨打时间间隔三大类型;停电事件特征是指停电事件发生对用户用电的影响,包括停电时长、停电次数两大类型;用电性质是用户本身的用电属性,包括重要等级、用电类别与行业分类三大类型。
4.确定特征选择后训练集用户群体的模型变量。
通过检验指标相关性,可知指标之间存在指标冗余现象,根据指标相关性去除模型冗余指标。表2、表3和表4为相关系数矩阵。
表2相关系数矩阵(一)
Figure BDA0001527221500000111
Figure BDA0001527221500000121
Figure BDA0001527221500000131
表3相关系数矩阵(二)
Figure BDA0001527221500000132
Figure BDA0001527221500000141
Figure BDA0001527221500000151
表4相关系数矩阵(三)
Figure BDA0001527221500000152
Figure BDA0001527221500000161
从以上相关系数矩阵来看,指标之间存在高度相关,因此,需要剔除一些高度相关指标,精简模型输入参数,从而获得最终的模型变量,具体如表5所示。
表5最终的模型变量
指标值 指标说明
SJ_AVG_MIN_1M 近一月升级平均拨打时长
SJ_AVG_MIN_3M 近三月月升级平均拨打时长
SJ_AVG_MIN_12M 近一年升级平均拨打时长
SJ_TIMES_1M 近一月升级拨打次数
CALL_AVG_MIN_1M 近一月平均拨打间隔时长
SJ_TIMES_3M 近三月升级拨打次数
CALL_AVG_MIN_3M 近三月平均拨打间隔时长
SJ_TIMES_12M 近一年升级拨打次数
CALL_CF_TMS_1M 近一月重复拨打次数
CALL_AVG_MIN_12M 近一年平均拨打间隔时长
CALL_CF_TMS_3M 近三月重复拨打次数
CALL_CF_TMS_12M 近一年重复拨打次数
CALL_NUM_1M 近一月拨打次数
CALL_NUM_12M 近一年拨打次数
CALL_NUM_3M 近三月拨打次数
CALL_AVG_12M 近一年平均拨打时长
CALL_AVG_3M 近三月平均拨打时长
CALL_AVG_1M 近一月平均拨打时长
5.根据所述模型变量建立半监督分类模型,对特征选择后训练集用户群体进行半监督分类模型训练,确定停电敏感模型。具体为:
Step1:按照所述类别标记法对训练集用户群体中的用户进行标记后,得到了有标记样本集S并记作Seeds集,无标记样本集U;
Step2:输入有标记样本集S集分别到初始分类器H1、H2、H3
Step3:利用S训练H1、H2、H3
Step4:针对
Figure BDA0001527221500000181
若满足H1(xi)=H2(xi)、H2(xi)=H3(xi)或H1(xi)=H3(xi)(其中H1(xi)、H2(xi)、H3(xi)分别表示分类器H1、H2、H3对无标记样本xi的标记结果),那么便将无标记样本xi及其对应的类别标记H2(xi)添加到S,得到新训练集S;
Step5:继续利用新的S训练H1、H2、H3
Step6:返回Step4,直到H1、H2、H3不再变化时,得到最终的有标记样本集记作St,执行Step6;
Step7:利用St训练H1、H2、H3中分类效果最好的一个分类器,得到的效果最好的一个分类器即停电敏感模型。
7.通过在特征选择后的训练集用户群体中运行所述停电敏感模型找出特征选择后的训练集用户群体中的停电敏感用户。
在训练集用户群体中运行停电敏感模型找出其中的停电敏感用户,输出“停电敏感”标签。
最终综合以上步骤,得到关于投诉风险的预测结果如下表6所示。
表6投诉风险的预测结果
投诉倾向类别 停电高敏感 停电低敏感 停电不敏感
用户数量 1080 3106 1113906
在使用本发明的方法预测停电风险投诉之前,只能依靠人工查阅用户资料来判断的方法,每个用户大致要花两分钟左右的时间,使用本发明方法之后,可以批量导入数据分析用户停电敏感度,极大的提高了分析效率。
综上所述,本发明的一种停电敏感预判方法,包括:获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户。通过管理规则和半监督分类模型可以准确判别对停电状况的敏感的用户,从而可以在停电发生时,为采取不同的安抚和引导策略提供参考,减少客户来电风险,树立了电力公司良好的社会形象。
请参考图2,其是本发明具体实施方式中提供的一种停电敏感预判方法的第二实施例的方法流程图。如图所示,该方法包括:
步骤S201:获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表。
步骤S202:将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集。
步骤S203:判断所述模型数据集中的每一个用户是否为重要客户、重点关注客户或者特殊行业客户。
根据管理规则判断所述模型数据集中的每一个用户是否为重要客户、重点关注客户或者特殊行业客户。若是,执行步骤S204;若否,执行步骤S205。
其中,所述重要客户为带有停电敏感标签的用户,所述重点关注客户为具有高敏感度停电时段的用户,所述特殊行业客户为对电能质量要求高的用户。重点关注客户包括:医院、数据中心、党政机关、重要政府领导住宅;特殊行业客户包括:精密电子加工业客户、渔业养殖、排灌、冷库、茶叶用电客户。
步骤S204:所述用户属于特殊用户群体,将所述特殊用户群体确定为停电高敏感用户。
步骤S205:所述用户属于非特殊用户群体。
非特殊用户群体为特殊用户群体以外的用电用户群体。
步骤S206:将所述非特殊用户群体分为训练集用户群体和测试集用户群体。
步骤S207:采用类别标记法对所述训练集用户群体中的用户进行类别标记。
步骤S208:对类别标记后的所述训练集用户群体进行特征选择。
步骤S209:确定特征选择后训练集用户群体的模型变量。
步骤S210:根据所述模型变量建立半监督分类模型,对特征选择后训练集用户群体进行半监督分类模型训练,确定停电敏感模型。
步骤S211:通过在特征选择后的训练集用户群体中运行所述停电敏感模型找出特征选择后的训练集用户群体中的停电敏感用户。
综上所述,本发明实施例可以在发生停电的情况下,准确地判别用户对停电状况的敏感程度,且极大的提高了分析效率,为及时采取不同的安抚和引导策略提供参考,有效提高用户满意度,减少客户来电风险,树立了电力公司良好的社会形象。
以下为本方案一种停电敏感预判***的实施例,一种停电敏感预判***的实施例基于一种停电敏感预判方法的实施例实现,在一种停电敏感预判***的实施例中未尽的描述,请参考一种停电敏感预判方法的实施例。
请参考图3,其是本发明具体实施方式中提供的一种停电敏感预判***的结构方框图。如图所示,该***包括:
建立单元310,用于获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表。
获取用户用电相关信息,包括:
1.确定用户的群体范围;
2.确定获取用户用电相关信息的时间窗;
3.确定预判周期,根据所述预判周期确定用于预判的特征数据集;
4.确定建立用户历史停电情况表所需的原始数据字段;
5.根据所述群体范围、时间窗、预判周期、特征数据集和原始数据字段建立用户用电相关信息。
预处理单元320,用于将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集。
将所述用户历史停电情况表输入到分析计算平台进行预处理,包括:
1.根据所述原始字段构造分析计算平台所需的变量。
2.对所述用户历史停电情况表中所述变量对应的数据进行筛选,删除所述数据中的异常值和缺失值。
3.消除筛选后的数据的时间序列属性,获得筛选后的数据的具体数值。
4.对所述具体数值进行区间规范化。
对所述具体数值进行区间规范化的公式为:
Figure BDA0001527221500000211
其中,normalization为特征原始值规范处理结果,initial为特征原始值,min
为该特征的最小值,max为该特征的最大值。
划分单元330,用于根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户。
根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,包括:
判断所述模型数据集中的每一个用户是否为重要客户、重点关注客户或者特殊行业客户,其中,所述重要客户为带有停电敏感标签的用户,所述重点关注客户为具有高敏感度停电时段的用户,所述特殊行业客户为对电能质量要求高的用户;
若是,则所述用户属于特殊用户群体;
若否,则所述用户属于非特殊用户群体。
选出单元340,用于采用半监督分类模型从所述非特殊用户群体中选出停电敏感用户。
采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户,包括:
1.将所述非特殊用户群体分为训练集用户群体和测试集用户群体。
2.采用类别标记法对所述训练集用户群体中的用户进行类别标记。
判断所述训练集用户群体中的每一个用户是否为重要客户、部分重点关注客户、部分不能停电客户、近两天内拨打计划停电信息相关热线超过2次的客户、有与计划停电相关投诉工单的客户或历史停电事件发生后存在拨打供电局电话投诉行为的客户;若是,则对所述用户数据进行标记。
3.对类别标记后的所述训练集用户群体进行特征选择。
根据历史拨打电话行为特征、停电事件特征和/或用电性质对类别标记后的所述训练集用户群体进行特征选择。
4.确定特征选择后训练集用户群体的模型变量。
5.根据所述模型变量建立半监督分类模型,对特征选择后训练集用户群体进行半监督分类模型训练,确定停电敏感模型。
Step1:按照所述类别标记法对训练集用户群体中的用户进行标记后,得到了有标记样本集S并记作Seeds集,无标记样本集U;
Step2:输入有标记样本集S集分别到初始分类器H1、H2、H3
Step3:利用S训练H1、H2、H3
Step4:针对
Figure BDA0001527221500000231
若满足H1(xi)=H2(xi)、H2(xi)=H3(xi)或H1(xi)=H3(xi)(其中H1(xi)、H2(xi)、H3(xi)分别表示分类器H1、H2、H3对无标记样本xi的标记结果),那么便将无标记样本xi及其对应的类别标记H2(xi)添加到S,得到新训练集S;
Step5:继续利用新的S训练H1、H2、H3
Step6:返回Step4,直到H1、H2、H3不再变化时,得到最终的有标记样本集记作St,执行Step6;
Step7:利用St训练H1、H2、H3中分类效果最好的一个分类器,得到的效果最好的一个分类器即停电敏感模型。
6.通过在特征选择后的训练集用户群体中运行所述停电敏感模型找出特征选择后的训练集用户群体中的停电敏感用户。
综上所述,各单元模块协同工作,建立单元310,用于获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;预处理单元320,用于将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;划分单元330,用于根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;选出单元340,用于采用半监督分类模型从所述非特殊用户群体中选出停电敏感用户。通过管理规则和半监督分类模型可以准确判别对停电状况的敏感的用户,从而可以在停电发生时,为采取不同的安抚和引导策略提供参考,减少客户来电风险,树立了电力公司良好的社会形象。
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。

Claims (8)

1.一种停电敏感预判方法,其特征在于,包括:
获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;
将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;
根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;
采用半监督分类模型从所述非特殊用户群体中找出停电敏感用户,包括:
将所述非特殊用户群体分为训练集用户群体和测试集用户群体;
采用类别标记法对所述训练集用户群体中的用户进行类别标记;
对类别标记后的所述训练集用户群体进行特征选择;
确定特征选择后训练集用户群体的模型变量;
根据所述模型变量建立半监督分类模型,对特征选择后训练集用户群体进行半监督分类模型训练,确定停电敏感模型,包括:
Step1:按照所述类别标记法对训练集用户群体中的用户进行标记后,得到了有标记样本集S并记作Seeds集,无标记样本集U;
Step2:输入有标记样本集S集分别到初始分类器H1、H2、H3
Step3:利用S训练H1、H2、H3
Step4:针对
Figure FDA0003204508920000011
若满足H1(xi)=H2(xi)、H2(xi)=H3(xi)或H1(xi)=H3(xi),那么便将无标记样本xi及其对应的类别标记H2(xi)添加到S,得到新训练集S;其中H1(xi)、H2(xi)、H3(xi)分别表示分类器H1、H2、H3对无标记样本xi的标记结果;
Step5:继续利用新的S训练H1、H2、H3
Step6:返回Step4,直到H1、H2、H3不再变化时,得到最终的有标记样本集记作St,执行Step7;
Step7:利用St训练H1、H2、H3中分类效果最好的一个分类器,得到的效果最好的一个分类器即停电敏感模型;
通过在特征选择后的训练集用户群体中运行所述停电敏感模型找出特征选择后的训练集用户群体中的停电敏感用户。
2.根据权利要求1所述的停电敏感预判方法,其特征在于,所述根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,包括:
判断所述模型数据集中的每一个用户是否为重要客户、重点关注客户或者特殊行业客户,其中,所述重要客户为带有停电敏感标签的用户,所述重点关注客户为具有高敏感度停电时段的用户,所述特殊行业客户为对电能质量要求高的用户;
若是,则所述用户属于特殊用户群体;
若否,则所述用户属于非特殊用户群体。
3.根据权利要求1所述的停电敏感预判方法,其特征在于,所述采用类别标记法对所述训练集用户群体中的用户进行类别标记,包括:
判断所述训练集用户群体中的每一个用户是否为重要客户、部分重点关注客户、部分不能停电客户、近两天内拨打计划停电信息相关热线超过2次的客户、有与计划停电相关投诉工单的客户或历史停电事件发生后存在拨打供电局电话投诉行为的客户;
若是,则对所述用户进行标记。
4.根据权利要求1所述的停电敏感预判方法,其特征在于,所述对类别标记后的所述训练集用户群体进行特征选择,具体为:
根据历史拨打电话行为特征、停电事件特征和/或用电性质对类别标记后的所述训练集用户群体进行特征选择。
5.根据权利要求1所述的停电敏感预判方法,其特征在于,所述获取用户用电相关信息,包括:
确定用电用户的群体范围;
确定获取用户用电相关信息的时间窗;
确定预判周期,根据所述预判周期确定用于预判的特征数据集;
确定建立用户历史停电情况表所需的原始数据字段;
根据所述群体范围、时间窗、预判周期、特征数据集和原始数据字段建立用户用电相关信息。
6.根据权利要求5所述的停电敏感预判方法,其特征在于,所述将所述用户历史停电情况表输入到分析计算平台进行预处理,包括:
根据所述原始数据字段构造分析计算平台所需的变量;
对所述用户历史停电情况表中所述变量对应的数据进行筛选,删除所述数据中的异常值和缺失值;
消除筛选后的数据的时间序列属性,获得筛选后的数据的具体数值;
对所述具体数值进行区间规范化。
7.根据权利要求6所述的停电敏感预判方法,其特征在于,所述对所述具体数值进行区间规范化的公式为:
Figure FDA0003204508920000031
其中,normalization为特征原始值规范处理结果,initial为特征原始值,min为该特征的最小值,max为该特征的最大值。
8.一种停电敏感预判***,其特征在于,包括:
建立单元,用于获取用户用电相关信息,根据所述用户用电相关信息建立用户历史停电情况表;
预处理单元,用于将所述用户历史停电情况表输入到分析计算平台进行预处理,得到用户历史停电情况的模型数据集;
划分单元,用于根据管理规则将所述模型数据集中的用户划分为特殊用户群体和非特殊用户群体,将所述特殊用户群体确定为停电高敏感用户;
选出单元,用于采用半监督分类模型从所述非特殊用户群体中选出停电敏感用户,包括:
将所述非特殊用户群体分为训练集用户群体和测试集用户群体;
采用类别标记法对所述训练集用户群体中的用户进行类别标记;
对类别标记后的所述训练集用户群体进行特征选择;
确定特征选择后训练集用户群体的模型变量;
根据所述模型变量建立半监督分类模型,对特征选择后训练集用户群体进行半监督分类模型训练,确定停电敏感模型,包括:
Step1:按照所述类别标记法对训练集用户群体中的用户进行标记后,得到了有标记样本集S并记作Seeds集,无标记样本集U;
Step2:输入有标记样本集S集分别到初始分类器H1、H2、H3
Step3:利用S训练H1、H2、H3
Step4:针对
Figure FDA0003204508920000041
若满足H1(xi)=H2(xi)、H2(xi)=H3(xi)或H1(xi)=H3(xi),那么便将无标记样本xi及其对应的类别标记H2(xi)添加到S,得到新训练集S;其中H1(xi)、H2(xi)、H3(xi)分别表示分类器H1、H2、H3对无标记样本xi的标记结果;
Step5:继续利用新的S训练H1、H2、H3
Step6:返回Step4,直到H1、H2、H3不再变化时,得到最终的有标记样本集记作St,执行Step7;
Step7:利用St训练H1、H2、H3中分类效果最好的一个分类器,得到的效果最好的一个分类器即停电敏感模型;
通过在特征选择后的训练集用户群体中运行所述停电敏感模型找出特征选择后的训练集用户群体中的停电敏感用户。
CN201711444284.3A 2017-12-27 2017-12-27 一种停电敏感预判方法和*** Active CN108304990B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711444284.3A CN108304990B (zh) 2017-12-27 2017-12-27 一种停电敏感预判方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711444284.3A CN108304990B (zh) 2017-12-27 2017-12-27 一种停电敏感预判方法和***

Publications (2)

Publication Number Publication Date
CN108304990A CN108304990A (zh) 2018-07-20
CN108304990B true CN108304990B (zh) 2021-10-19

Family

ID=62867814

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711444284.3A Active CN108304990B (zh) 2017-12-27 2017-12-27 一种停电敏感预判方法和***

Country Status (1)

Country Link
CN (1) CN108304990B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109934469A (zh) * 2019-02-25 2019-06-25 国网河南省电力公司电力科学研究院 基于异源交叉回归分析的停电敏感度预警方法及装置
CN110598933A (zh) * 2019-09-16 2019-12-20 广东电网有限责任公司 一种停电敏感用户管理方法、***及相关组件
CN112418633A (zh) * 2020-11-17 2021-02-26 国网冀北电力有限公司计量中心 一种基于典型相关分析的停电敏感性相关因素分析方法
CN117913830B (zh) * 2024-03-20 2024-06-04 中国电建集团昆明勘测设计研究院有限公司 一种抽水蓄能电站的资源调度方法和***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108364187A (zh) * 2017-12-20 2018-08-03 国网冀北电力有限公司承德供电公司 一种基于停电敏感特性的停电敏感用户确定方法和***

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108364187A (zh) * 2017-12-20 2018-08-03 国网冀北电力有限公司承德供电公司 一种基于停电敏感特性的停电敏感用户确定方法和***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"基于半监督学习的客户流失预测及其在物流企业中的应用研究";孙二冬;《中国优秀硕士学位论文全文数据库经济与管理科学辑》;20171015(第10期);第12、23-37、51-59页 *
"基于数据挖掘技术的客户停电敏感度研究与应用";严宇平等;《新技术新工艺》;20150925(第9期);第89-90、92-93页 *

Also Published As

Publication number Publication date
CN108304990A (zh) 2018-07-20

Similar Documents

Publication Publication Date Title
CN110188198B (zh) 一种基于知识图谱的反欺诈方法及装置
CN107909274B (zh) 企业投资风险评估方法、装置及存储介质
CN108304990B (zh) 一种停电敏感预判方法和***
US20030233339A1 (en) Data analysis system
CN106570778A (zh) 一种基于大数据的数据集成与线损分析计算的方法
CN103154991A (zh) 信用风险采集
CN109120428B (zh) 一种用于风控分析的方法及***
Abad‐Romero et al. Risk and return around bond rating changes: New evidence from the Spanish stock market
CN113627566A (zh) 一种网络诈骗的预警方法、装置和计算机设备
CN113434575B (zh) 基于数据仓库的数据归因处理方法、装置及存储介质
US20210125272A1 (en) Using Inferred Attributes as an Insight into Banking Customer Behavior
CN112184484A (zh) 一种电力用户差异化服务方法及***
CN116823496A (zh) 基于人工智能的智能保险风险评估和定价***
CN107977855B (zh) 一种管理用户信息的方法及装置
CN112631889B (zh) 针对应用***的画像方法、装置、设备及可读存储介质
CN112950359A (zh) 一种用户识别方法和装置
CN114092230A (zh) 一种数据处理方法、装置、电子设备及计算机可读介质
CN111831817A (zh) 问卷生成分析方法、装置、计算机设备及可读存储介质
CN113706336B (zh) 风险评估方法、装置、计算机设备和存储介质
CN116226293A (zh) 一种电力客户画像生成管理的方法及***
CN112712270B (zh) 信息处理方法、装置、设备及存储介质
CN113537519B (zh) 一种识别异常设备的方法和装置
CN112346938B (zh) 操作审计方法、装置及服务器和计算机可读存储介质
CN113284007B (zh) 基于电力保险套餐的用电信息处理***及其处理方法
CN117934007A (zh) 一种电力用户停电敏感度标签构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant