CN112100246A - 一种基于多维图码标签的客户用电价值挖掘方法 - Google Patents
一种基于多维图码标签的客户用电价值挖掘方法 Download PDFInfo
- Publication number
- CN112100246A CN112100246A CN202011000588.2A CN202011000588A CN112100246A CN 112100246 A CN112100246 A CN 112100246A CN 202011000588 A CN202011000588 A CN 202011000588A CN 112100246 A CN112100246 A CN 112100246A
- Authority
- CN
- China
- Prior art keywords
- customer
- electricity
- value
- label
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000005065 mining Methods 0.000 title claims abstract description 15
- 238000006243 chemical reaction Methods 0.000 claims abstract description 3
- 238000010276 construction Methods 0.000 claims abstract description 3
- 230000004927 fusion Effects 0.000 claims abstract description 3
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 238000009960 carding Methods 0.000 claims description 2
- 238000003064 k means clustering Methods 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 230000006399 behavior Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Fuzzy Systems (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Human Resources & Organizations (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于多维图码标签的客户用电价值挖掘方法属于用电客户管理技术领域,尤其涉及一种基于多维图码标签的客户用电价值挖掘方法。本发明包括以下步骤:基础数据收集:获取用电客户数据,包括客户基础信息、客户价值、电费信息、账户余额、客户信用;多源数据融合:基于国网数据中台,建立营销客户数据库,完成数据转换、存储,为标签构建提供数据支撑。
Description
技术领域
本发明属于用电客户管理技术领域,尤其涉及一种基于多维图码标签的客户用电价值挖掘方法。
背景技术
国网公司传统营销的服务模式以“柜面为主”,客户黏合度低。公司现有服务模式以“坐商”为主,服务接触以“柜面”为主,难以形成与客户实时、有效、高频互动,难以满足客户个性化、便捷化需求,难以形成持续、稳固的客户依赖,客户资源价值不能充分显现。对不同价值的客户的不同用电需求深度挖掘,制定针对性的服务产品,使经营服务策略从过去的以产品为导向逐步向以客户为导向转变,实施差异化的供电服务,进一步提升供电企业的盈利能力和客户满意度,建立和谐稳固的客户关系。
发明内容
针对现有技术的不足,本发明的目的是提供一种基于多维图码标签的客户用电价值挖掘方法,该方法克服了现有方法以柜面为主导致的客户黏合度低的缺点,充分利用电力客户用电行为的图码获取算法,结合大数据分析技术,对大量样本数据进行分析计算,大幅度提高了该方法的实际可操作性,具有很高的工程应用价值;本方法具有较高的适应性,可适用于不同地区、不同规模的客户用电价值挖掘,进而满足不同客户个性化、便捷化需求,形成持续、稳固的客户依赖,使其充分显现客户资源价值。本发明包括以下步骤:
(1)基础数据收集:获取用电客户数据,包括客户基础信息、客户价值、电费信息、账户余额、客户信用;
(2)多源数据融合:基于国网数据中台,建立营销客户数据库,完成数据转换、存储,为标签构建提供数据支撑;
(3)标签规则定义:基于客户用电价值挖掘应用开展客户标签规则梳理与确定,结合企业收入贡献、社会影响力、用户用电基本信息等业务指标,通过构建当前客户用电价值模型生成当前价值模型标签;结合电量增长减少波动、电费增长减少波动、欠费风险、客户信用等指标,构建潜在客户用电价值模型,生成潜在价值模型标签。通过用电客户电量、电费使用等数据构建电量增长、突增突减、逐增逐减、电量波动、电费突增突减等衍生标签。通过用电客户行业类别、电费信息、电量信息等数据构建行业用电高、中、低客户、行业类别、大电费客户、用电类别等衍生标签。
(4)标签算法建模:
1)分析客户用电价值需求及现状;
2)选定用电客户范围,对其现状及影响客户价值的因素进行分析;
3)建立客户价值挖掘指标体系;
4)对指标数据进行处理;
5)采用K-Means聚类分析算法,并根据业务常识选择聚类数k值,并判断模型是否收敛;
6)如模型收敛,输出并生成当前/潜在高/中/低价值客户分类结果集;否则调整模型参数,并并根据目标函数SSE判断模型是否收敛,不断调整k值,最终选取SSE最小的一次作为聚类结果。
(5)标签生产:根据标签规则定义及建模结果,对客户进行标签化标注,最终形成以客户编号为主体的关系模型客户标签库。
(6)标签应用:根据标签生产的衍生标签及模型标签结果集进行展示,并且向相关业务***提供标签应用。
本发明有益效果。
本发明利用多维图码技术,结合大数据挖掘算法,建立客户用电价值挖掘方法,对每个客户进行客户价值的多维度标注,根据标注结果实施差异化的供电服务,满足客户个性化、便捷化需求,形成持续、稳固的客户依赖,充分显现客户资源价值。
附图说明
下面结合附图和具体实施方式对本发明做进一步说明。本发明保护范围不仅局限于以下内容的表述。
图1是本发明标签数据流转图。
图2是本发明标签规则定义图。
具体实施方式
(一)多维图码标签:
标签是“数据”与“业务”间的“桥梁”,标签表达结论和评判,是对数据高度提炼归纳和分析挖掘得到的特征标识。围绕实体-关系-标签这三个元素进行建模,从业务的角度出发对数据进行组织管理,以概念模型的形态透出,实现多维统计分析,生成标签矩阵表,基于国网数据中台架构,支持实时批量更新,保证标签矩阵的时效性。
(二)聚类分析法:
聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法,其讨论的对象是大量的样品,要求能合理地按各自的特性进行分类,在没有先验知识的情况下进行。聚类原则是同一聚类内的数据具有较高的相似性,而不同聚类中的数据不具有相似性。划分方法给定一个包含n个对象或数据行的数据集,从中任意选择k个对象作为初始聚类中心,而剩下的其他对象,则根据它们与这些聚类中心的距离分别进行分配。然后再计算每个所获新聚类的聚类中心,不断重复迭代直到目标函数SSE开始收敛为止。通常采用均方差函数作为测度函数,通过采用K-Means算法,结合企业收入贡献、社会影响力、用户用电基本信息等业务指标,通过构建当前客户用电价值模型生成当前价值标签。结合电量增长减少波动、电费增长减少波动、欠费风险、客户信用等指标,构建潜在客户用电价值模型,生成潜在价值标签。
算法原理:
K-Means的计算方法如下:
1随机选取k个中心点;
2遍历所有数据,将每个数据划分到最近的中心点中;
3计算每个聚类的平均值,并作为新的中心点;
4重复2-3,直到这k个中线点不再变化(收敛了),或执行了足够多的迭代。
算法收敛:
从K-Means的算法可以发现,SSE其实是一个严格的坐标下降过程。设目标函数SSE如下:
SSE(C1,C2,…,Ck)=∑(X-Ci)2
采用欧式距离作为变量之间的聚类函数。每次朝一个变量Ci的方向找到最优解,也就是求偏倒数,然后等于0,可得
其中mi是Ci所在的簇的元素的个数。
也就是当前聚类的均值就是当前方向的最优解(最小值),这与K-Means的每一次迭代过程一样。所以,这样保证SSE每一次迭代时,都会减小,最终使SSE收敛。
由于SSE是一个非凸函数,所以SSE不能保证找到全局最优解,只能确保局部最优解。但是可以重复执行几次K-Means,选取SSE最小的一次作为最终的聚类结果。
0-1标准化:
由于数据之间量纲的不相同,不方便比较。所以,需要将数据统一放到0~1的范围,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。具体计算方法如下:
K值选取:
在实际应用中,由于K-Means一般作为数据预处理,或者用于辅助分类贴标签。所以k一般不会设置很大。可以通过枚举,令k从2到一个固定值如10,在每个k值上重复运行数次K-Means(避免局部最优解),并计算当前k的平均轮廓系数,最后选取轮廓系数最大的值对应的k作为最终的集群数目。
本发明涉及一种基于多维图码标签的客户用电价值挖掘方法,利用电力客户用电行为的图码获取算法,抽取客户基础属性、客户缴费行为、客户用电行为等客户相关数据,结合大数据挖掘算法,开展客户用电价值挖掘,能够为错峰限电、增容扩销、电费服务、抢修服务,提供参考依据,形成与客户实时、有效、高频互动,满足客户个性化、便捷化需求,形成持续、稳固的客户依赖,使其充分显现客户资源价值。
可以理解的是,以上关于本发明的具体描述,仅用于说明本发明而并非受限于本发明实施例所描述的技术方案,本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换,以达到相同的技术效果;只要满足使用需要,都在本发明的保护范围之内。
Claims (1)
1.一种基于多维图码标签的客户用电价值挖掘方法,其特征在于包括以下步骤:
(1)基础数据收集:获取用电客户数据,包括客户基础信息、客户价值、电费信息、账户余额、客户信用;
(2)多源数据融合:基于国网数据中台,建立营销客户数据库,完成数据转换、存储,为标签构建提供数据支撑;
(3)标签规则定义:基于客户用电价值挖掘应用开展客户标签规则梳理与确定,结合企业收入贡献、社会影响力、用户用电基本信息等业务指标,通过构建当前客户用电价值模型生成当前价值模型标签;结合电量增长减少波动、电费增长减少波动、欠费风险、客户信用等指标,构建潜在客户用电价值模型,生成潜在价值模型标签。通过用电客户电量、电费使用等数据构建电量增长、突增突减、逐增逐减、电量波动、电费突增突减等衍生标签。通过用电客户行业类别、电费信息、电量信息等数据构建行业用电高、中、低客户、行业类别、大电费客户、用电类别等衍生标签。
(4)标签算法建模:
1)分析客户用电价值需求及现状;
2)选定用电客户范围,对其现状及影响客户价值的因素进行分析;
3)建立客户价值挖掘指标体系;
4)对指标数据进行处理;
5)采用K-Means聚类分析算法,并根据业务常识选择聚类数k值,并判断模型是否收敛;
6)如模型收敛,输出并生成当前/潜在高/中/低价值客户分类结果集;否则调整模型参数,并并根据目标函数SSE判断模型是否收敛,不断调整k值,最终选取SSE最小的一次作为聚类结果。
(5)标签生产:根据标签规则定义及建模结果,对客户进行标签化标注,最终形成以客户编号为主体的关系模型客户标签库。
标签应用:根据标签生产的衍生标签及模型标签结果集进行展示,并且向相关业务***提供标签应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011000588.2A CN112100246A (zh) | 2020-09-22 | 2020-09-22 | 一种基于多维图码标签的客户用电价值挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011000588.2A CN112100246A (zh) | 2020-09-22 | 2020-09-22 | 一种基于多维图码标签的客户用电价值挖掘方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112100246A true CN112100246A (zh) | 2020-12-18 |
Family
ID=73755754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011000588.2A Pending CN112100246A (zh) | 2020-09-22 | 2020-09-22 | 一种基于多维图码标签的客户用电价值挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112100246A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113450004A (zh) * | 2021-07-02 | 2021-09-28 | 国网北京市电力公司 | 电力信用报告生成方法、装置、电子设备及可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106372775A (zh) * | 2016-08-19 | 2017-02-01 | 国网冀北电力有限公司电力科学研究院 | 一种电网客户综合价值评估方法及*** |
CN107133652A (zh) * | 2017-05-17 | 2017-09-05 | 国网山东省电力公司烟台供电公司 | 基于K‑means聚类算法的用电客户价值评估方法及*** |
CN110427418A (zh) * | 2019-07-04 | 2019-11-08 | 深圳供电局有限公司 | 一种基于客户能源价值指标体系的客户分析分群方法 |
CN111640040A (zh) * | 2020-04-07 | 2020-09-08 | 国网新疆电力有限公司 | 基于客户画像技术的供电客户价值评价方法及大数据平台 |
-
2020
- 2020-09-22 CN CN202011000588.2A patent/CN112100246A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106372775A (zh) * | 2016-08-19 | 2017-02-01 | 国网冀北电力有限公司电力科学研究院 | 一种电网客户综合价值评估方法及*** |
CN107133652A (zh) * | 2017-05-17 | 2017-09-05 | 国网山东省电力公司烟台供电公司 | 基于K‑means聚类算法的用电客户价值评估方法及*** |
CN110427418A (zh) * | 2019-07-04 | 2019-11-08 | 深圳供电局有限公司 | 一种基于客户能源价值指标体系的客户分析分群方法 |
CN111640040A (zh) * | 2020-04-07 | 2020-09-08 | 国网新疆电力有限公司 | 基于客户画像技术的供电客户价值评价方法及大数据平台 |
Non-Patent Citations (5)
Title |
---|
何容 等: "基于大数据分析的电力客户成长型全景视图构建", 自动化应用, no. 10, pages 70 - 71 * |
刘潇潇 等: "基于电力客户行为的客户细分与价值评价研究", 电子世界, no. 24, pages 245 - 248 * |
张禄 等: "基于数据挖掘的电动汽车用户细分及价值评价方法", 电力***保护与控制, no. 22, pages 124 - 130 * |
李森林 等: "一种单层自动编码器的聚类算法研究", 怀化学院学报, no. 11, 28 November 2015 (2015-11-28), pages 39 - 42 * |
黄裕鸿 等: "基于数据挖掘的电信客户终生价值模型的研究", 科技广场, no. 08, pages 1 - 5 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113450004A (zh) * | 2021-07-02 | 2021-09-28 | 国网北京市电力公司 | 电力信用报告生成方法、装置、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Brahmana et al. | Customer segmentation based on RFM model using K-means, K-medoids, and DBSCAN methods | |
CN108388955A (zh) | 基于随机森林和逻辑回归的客户服务策略制定方法、装置 | |
CN108280541A (zh) | 基于随机森林和决策树的客户服务策略制定方法、装置 | |
CN110826886A (zh) | 一种基于聚类算法和主成分分析的电力客户画像构建方法 | |
Li et al. | RETRACTED ARTICLE: Data mining optimization model for financial management information system based on improved genetic algorithm | |
CN109685567A (zh) | 一种基于卷积神经网络和模糊聚类的用电客户画像新方法 | |
CN108399553A (zh) | 一种考虑地理和线路从属关系的用户特征标签设定方法 | |
Sun et al. | Using improved RFM model to classify consumer in big data environment | |
CN111143431A (zh) | 一种智能化量费核查与异常识别*** | |
Dalkani et al. | Modelling electricity consumption forecasting using the markov process and hybrid features selection | |
CN112100246A (zh) | 一种基于多维图码标签的客户用电价值挖掘方法 | |
Chen et al. | A power line loss analysis method based on boost clustering | |
Luk et al. | Design of an intelligent customer identification model in e-commerce logistics industry | |
CN115147242A (zh) | 一种基于数据挖掘的电网数据管理*** | |
Singh et al. | Two-tiered clustering classification experiments for market segmentation of EFTPOS retailers | |
Gong et al. | Study on application of customer segmentation based on data mining technology | |
Ling et al. | Notice of Retraction: CRM Customer Value Based on Data Mining | |
CN116777508B (zh) | 一种基于大数据的医药供应分析管理***及方法 | |
Kunasekaran | Research on E-commerce Customer Loyalty under Big Data | |
Chen | On a machine learning based analysis of online transaction | |
Yu et al. | Construction of User Electricity Behavior Portrait based on QFPAKmeans Clustering | |
Liu et al. | A combinatorial model for natural gas industrial customer value portrait based on value assessment and clustering algorithm | |
Duan et al. | Research on Customer Segmentation Method for Multi-value-Chain Collaboration | |
Yang | Design Mechanism of Precision Marketing Planning Platform Based on User Data Mining | |
Jia et al. | Data Mining and Business Intelligence in SME Customer Relationship Value Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |