CN108388955A - 基于随机森林和逻辑回归的客户服务策略制定方法、装置 - Google Patents

基于随机森林和逻辑回归的客户服务策略制定方法、装置 Download PDF

Info

Publication number
CN108388955A
CN108388955A CN201810027579.9A CN201810027579A CN108388955A CN 108388955 A CN108388955 A CN 108388955A CN 201810027579 A CN201810027579 A CN 201810027579A CN 108388955 A CN108388955 A CN 108388955A
Authority
CN
China
Prior art keywords
demand
customer
sample
services
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810027579.9A
Other languages
English (en)
Inventor
张洪利
李云亭
荣以平
朱伟义
刘霄慧
尹明立
粱波
乔学明
王伟
刘昳娟
王鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Shandong Electric Power Co Ltd
Original Assignee
State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Shandong Electric Power Co Ltd filed Critical State Grid Shandong Electric Power Co Ltd
Priority to CN201810027579.9A priority Critical patent/CN108388955A/zh
Publication of CN108388955A publication Critical patent/CN108388955A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于随机森林和逻辑回归的客户服务策略制定方法和装置,所述方法包括:获取样本客户价值特征,并进行优质性判别;采用样本客户数据,基于随机森林和逻辑回归算法构建优质客户识别模型;将待识别客户的价值特征作为输入,基于所述优质客户识别模型,判断客户是否为优质客户;获取样本客户的服务需求,进行标准化归类分析建立服务需求库;将服务需求库中的服务需求匹配服务内容,将服务内容匹配不同等级的优质客户,建立服务策略库;基于服务需求库和服务策略库,根据优质客户识别结果自动匹配服务策略。本发明基于大数据实现了优质客户的精准定位,并结合用户服务需求分析的分析结果,制定个性化、增值化的服务产品与服务策略。

Description

基于随机森林和逻辑回归的客户服务策略制定方法、装置
技术领域
本发明属于机器学习领域,尤其涉及一种基于随机森林和逻辑回归的客户服务策略 制定方法和装置。
背景技术
随着电力改革深化、售电侧市场的全面放开,国家电网公司各级供电公司均面临着 市场竞争压力,为提升电网企业盈利能力和竞争力,增加优质客户的忠诚度、满意度和客户黏性,企业在做好全社会普遍服务的基础上,为优质客户提供优质服务将是各售电 主体竞争优质客户的主要手段和策略,必须制定有针对性的竞争服务策略,将有限的服 务资源投入到优质客户的身上,与其建立稳定的供用电关系,是电网企业保持长期可持 续发展的必然选择。
随着数据量的爆发式增长和业务要求的不断提高,传统的业务***架构已经越来越 难满足***运行的要求。大数据技术作为重要的战略资源已经在全球范围内达成共识,数据这一基础性战略资源为分析客户需求和提供针对***,提供了数据支撑。
因此,如何基于大数据实现优质客户的精准定位,是目前需要迫切解决的技术问题。
发明内容
为克服上述现有技术的不足,本发明提供了一种售电侧基于随机森林和逻辑回归的 客户服务策略制定方法和装置,所述方法以电网公司客户的用电属性、用电行为、用电特征等海量数据为基础,建立多维度的客户评价指标体系,通过以数据分析方式构建的 客户评价模型,对客户进行综合评分,从而实现对优质客户的精准定位;,并结合用户 用电服务需求分析的分析结果,制定个性化、增值化的服务产品与服务策略,根据市场 反馈及时调整服务策略,增加优质客户的忠诚度、客户粘性和客户满意度,建立与优质 客户间稳定的供用电关系。
为实现上述目的,本发明采用如下技术方案:
一种基于随机森林和逻辑回归的客户服务策略制定方法,包括以下步骤:
步骤1:获取样本客户价值特征,并进行优质性判别;
步骤2:采用样本客户数据,基于随机森林和逻辑回归算法构建优质客户识别模型;
步骤3:将待识别客户的价值特征作为输入,基于所述优质客户识别模型,判断所述客户是否为优质客户;
步骤4:获取样本客户的服务需求,进行标准化归类分析建立服务需求库;将服务需求库中的服务需求匹配服务内容,将服务内容匹配不同等级的优质客户,建立服务策 略库;
步骤5:基于服务需求库和服务策略库,根据优质客户识别结果自动匹配服务策略。
进一步地,所述步骤1包括:
步骤1.1:根据获取的用户各项用电信息构建客户价值评价特征指标体系;
步骤1.2:根据所述指标体***计样本用户的价值特征,并进行样本用户优质性判别。
进一步地,所述步骤1中价值特征包括用户对应的基本属性、经济价值、负荷价值、发展价值、信用价值、行业价值数据。
进一步地,所述步骤2包括:
步骤2.1:对样本用户数据进行预处理;
步骤2.2:基于随机森林法训练优质客户判断模型;
步骤2.3:采用逻辑回归算法构建优质客户等级判断模型;
步骤2.4:结合优质客户判断模型和优质客户等级判断模型获取优质客户识别模型。
进一步地,所述步骤2.1包括:数据清洗、特征因素量化、特征拓展、特征选择和 异常值处理。
进一步地,所述步骤2.2包括:
全特征训练:样本选取全部样本用户数据,模型入参为全部业务指标;
重要特征训练:样本选取全部样本用户数据,模型入参为重要性高的前40%指标;
全特征交叉训练:将样本用户数据平均拆分成10份,每次选择其中9份作为训练样本,剩余1份作为预测样本,循环迭代10次,模型入参为全部业务指标;
重要特征交叉训练:将样本用户数据平均拆分成10份,每次选择其中9份作为训练样本,剩余1份作为预测样本,循环迭代10次,模型入参为重要性高的前40%指标。
进一步地,在模型训练前,所述方法还包括:采用MDA法和MDG法相结合的方式选取重要性指标,通过模型训练,得到指标重要性分析结果。
进一步地,所述方法还包括:建立所述优质客户识别模型升级优化的长效机制,基于专家监督法对优质客户识别模型的判断结果不定期地进行有效性分析,并基于分析结果,重新训练优质客户优化识别模型。
进一步地,所述步骤2.3包括:将优质客户判断模型获取的优质客户通过逻辑回归模型进行综合评分;设置多个综合评分区间,得到优质客户等级判断模型。
进一步地,所述方法还包括:对训练好的模型进行集成,通过数据接口收集用户特征数据,定期开展客户优质等级的判定。
进一步地,所述服务需求库中的服务需求包括业扩办电和电网建设、电费电价和电 力信息、电能质量和供电可靠性、故障停电和计划停电、安全用电和应急保障、电能替代和电力节能、用电培训故障处理及其他等八个需求类别。
进一步地,所述服务需求库建立的具体步骤包括:
获取样本客户的服务需求;
对样本客户的服务需求进行预处理,得到有效服务需求;
根据需求类别对有效服务需求进行归类分析和去重,并将用户描述的自然语言转换 为专业术语的标准需求项,基于专家经验的数据聚类分析,建立服务需求库。
进一步地,所述步骤5包括:
步骤5.1:确定用户等级后,基于服务需求库获取该用户相应行业的需求关注度;
步骤5.2:根据所述需求关注度获取排名靠前的多个需求分类;
步骤5.3:根据所述多个需求分类以及用户等级,基于服务策略库匹配相应的服务策略。
根据本发明的第二目的,本发明还提供了一种基于随机森林和逻辑回归的客户服务 策略制定装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的方法。
根据本发明的第三目的,本发明还提供了一种计算机可读存储介质,其上存储有计 算机程序,该程序被处理器执行时执行所述的一种基于随机森林和逻辑回归的客户服务 策略制定方法。
本发明的有益效果
1、本发明以电网公司客户的用电属性、用电行为、用电特征等海量数据为基础,采用机器学习的技术手段,实现了优质客户的识别,为针对优质客户提供优质服务提供 了保障,有助于提升电网企业竞争力。
2、本发明采用随机森林和逻辑回归相结合的方式进行客户识别模型的训练,所述识别模型能够在识别客户是否优质的基础上,判断客户的优质等级,进一步实现了优质 客户的精准定位。
3、本发明建立所述优质客户识别模型升级优化的长效机制,基于专家监督法对优质客户识别模型的判断结果不定期地进行有效性分析,并基于分析结果,重新训练优质 客户优化识别模型,通过重新训练模型达到模型版本升级及优化的目的。
4、本发明利用大数据技术深度挖掘和分析优质客户综合价值以及用电服务需求,准确的分析客户综合价值体现以及客户用电服务需求,将有限的服务资源集中到优质客户的关键服务需求上,从而提升电网企业在电改新形势下的竞争力,使电网企业保持长 期可持续发展。
5、本发明根据优质客户的识别结果和用电服务需求分析结果,制定个性化、增值化的服务产品与服务策略,并根据市场反馈及时调整服务策略,增加优质客户的忠诚度、客户粘性和客户满意度,建立与优质客户间稳定的供用电关系。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意 性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为本发明基于随机森林和逻辑回归的客户服务策略制定方法流程图;
图2为本发明优质客户识别模型构建流程图;
图3为本发明基于逻辑回归法形成的客户评分趋势示意图;
图4为本发明优质客户行业分布示意图;
图5为本发明服务需求根据需求类别分布示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据 本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和 /或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例一
本实施例公开了一种基于随机森林和逻辑回归的客户服务策略制定方法,如图1所 示,包括以下步骤:
(一)数据准备阶段
1、建立客户价值评价特征指标体系:
通过收集用户档案信息、经济价值类信息、负荷价值类信息、发展价值类信息、信用价值类信息、行业价值类信息,综合分析各种影响客户综合价值的因素,建立客户价 值评价特征指标体系。通过客户集中研讨及客户调研,实现各地市样本用户优质性判别, 为模型训练提供数据基础。
依据优质客户为电网公司带来的各种价值特征为基础,梳理客户的各项用电指标, 依据客户价值角度对指标进行归类,构建客户评价指标体系,对指标标准化处理,并进行多维度汇总,为判断客户优质特性提供数据基础。
2、确定模型训练样本:
通过与地市专家讨论确定的优质客户指标体系,基于营销业务应用***、用电信息 采集***,分别统计出样本用户对应的基本属性、经济价值、负荷价值、发展价值、信 用价值、行业价值数据,以此作为模型训练样本。本实施例中对47.4万样本客户用电 行为特征数据进行了专家评判,标注了是否优质。
用户属性:户号、户名、行业分类、是否高耗能和用电类别。
经济价值:客户用电给供电企业所带来的盈利情况,如售电均价较高、用电量较大、 电费较多的客户。包括:当期售电均价、当期电费、当期电量、累计售电均价、累计电费、累计电量、合同容量和运行容量。
负荷价值:客户在用电过程中表现出来的电力负荷价值,如功率因素较大、平均负荷率高、低谷用电率较好的客户。包括:平均日负荷率、高峰用电率、低谷用电率和力 调系数。
发展价值:客户自身用电发展较好的,未来贡献较大的客户,能给公司带来持续的利润贡献。包括:当期电量增长率、近3个月电量增长率、近6个月电量增长率、近一 年电量增长率、增容次数和减容次数。
信用价值:信用是供用电双方完成交易的基本保障,能够依法用电、按时交纳电费的客户。包括:电费预收结转率、电费回款逾期天数、电费回款逾期次数、电费回款期、 支票退票次数和违约窃电次数。
行业价值:考虑客户的行业发展前景,行业整体用电水平的发展较好。包括:行业电量增长率、行业大类电量增长率和行业小类电量增长率。
在数据准备阶段,还进行了监督源标准制定工作,即作为有效的监督源,它大致应该满足的业务范畴是什么,只有在该业务范畴内产出的监督源,才认为是有效的,可以 开展有监督学习的。
本实施例中对47.4万样本客户用电行为特征数据进行了专家评判,标注了是否优质。
(二)数据处理阶段
当今数据库极易受噪声、丢失数据和不一致数据的侵扰,数量太大,并且多半来自多个异构数据源,导致数据质量较低,低质量的数据将导致数据分析的结果不准确,因 此在模型训练之前,需要进行数据预处理。本方案的数据预处理主要从特征因素量化、 异常值处理、连续变量处理等方面展开。
1、数据清洗
通过数据超限值检验、特征有效性检验、数据空值检验,对数据进行清洗。
超限检查:检查用电量和电费电价均为0的记录并予以删除,用电量和电费电价均为0表示用户都不用电,即都不生产,其相关其他特征也不具特征性。
特征有效性检查:检查用户重要性特征信息过于单一的记录,仅有少数属于重要用 户。
空值检查:检查暂停天数字段全空和电费回款逾期天数缺失严重的记录。暂停天数 字段全空表示暂停天数全用户都缺失;检查电费回款逾期天数,发现字段记录为空,但具体业务为未逾期。
2、特征因素量化
从营销***或其他***采集来的用户档案、节假日和天气等信息都是用文字或代号 表示的,需要对这类变量进行数值化表示。
户名、户号、行业、行业小类、行业大类、高耗能行业、重要性等级等42个字段 特征。分类如下:1)用户属性信息;2)经济价值;3)负荷价值;4)发展价值;5) 信用价值;6)行业价值。
因子化转换:(采用0/1/2/3...数字编码来表达)行业、行业小类、行业大类、高 耗能行业、重要性等级、用电类别、电压等级、所在区域、投资规模、产能规模、负荷 性质;
3、特征拓展:
1)归一化拓展:(将用户数据值设置为[0-1]之内数据作为特征)电费、合同容量、近一年平均售电量、近6个月平均售电量、近3个月平均售电量、运行容量;
2)离散化拓展:(将用户数据值按大小分段作为特征)电费、合同容量、近一年平均售电量、近6个月平均售电量、近3个月平均售电量、运行容量;
3)排序特征拓展:(将用户数据值按大小排序作为特征)电费、合同容量、近一年平均售电量、近6个月平均售电量、近3个月平均售电量、运行容量;
4)量少数据编码拓展:(onehot 0/1编码)增容次数、减容次数、陈欠电费、陈欠 电费占比、违约窃电次数。
4、特征选择:
针对用户属性特征,观测数据的分布均衡情况,初步分析这些维度特征对是否优质 和需求项的影响。
针对5类价值特征,观测数据的分布均衡情况,初步分析这些维度特征对是否优质和需求项的影响。查看是否具有关联特性。
综合降维,探索尝试多种方法,综合各种方法的结果进行降维。
5、异常值处理
采集数据存在未采集或异常数据的情况,档案类数据也存在缺失的情况,需要针对 这部分数据进行缺失值处理,根据不同业务规则选用不同的缺失值处理方法:
默认值替换:对于某些档案中如负荷性质、电压等级的情况,按普遍的业务规则设置默认值进行计算。
个案剔除法:如果缺失值所占比例比较少,且确实的属性比较重要,则采用个案剔除法,剔除掉该条数据。例如用户档案信息中若用户id丢失,则直接剔除掉该条数据。
均值替换法:如果缺失值是数值类型的,则用前后数据的平均值来填充缺失的数据。
如果缺失值是非数值类型的,则用该属性的众数来补齐缺失的数据。
热卡填充法:在数据集中选择一个与缺失数据对象最相似的对象,用该对象的值代 替缺失值。
(三)模型训练阶段
本实施例采用随机森林和逻辑回归法进行模型训练,如图2所示。
1、基于随机森林法训练优质客户判断模型
重要性指标选取
采用以下两种方法进行重要性指标选取:一种是基于OOB误差的方法,称为MDA(Mean Decrease Accuracy);另一种是基于Gini不纯度的方法,称为MDG(Mean DecreaseGini)。两种方法都是标量值越大表示变量越重要。通过模型训练,得到指标重要性分 析结果,对比两种方法得到的重要性指标,具体如下表:
表1
排名 MDA MDG
1 累计电量 累计电量
2 累计电费 累计电费
3 当期电费 当期电费
4 当期电量 当期电量
5 运行容量 运行容量
6 支票退票次数 力调系数
7 累计售电均价 行业大类电量增长率
8 行业大类电量增长率 年平均日负荷率
9 力调系数 电费回款期
10 累计电价增长率 行业小类电量增长率
结合以上重要性指标,确定13个指标为重要性指标,具体如下:
表2
序号 重要性指标 对应数据列
1 累计电量 7
2 累计电费 8
3 当期电费 5
4 当期电量 4
5 运行容量 10
6 力调系数 15
7 支票退票次数 35
8 累计售电均价 9
9 行业大类电量增长率 39
10 累计电价增长率 24
11 年平均日负荷率 11
12 电费回款期 34
13 行业小类电量增长率 38
通过随机森林法对训练数据进行训练及优化,找出用电行为特征值与用户是否优质 之间的对应关系,生成判断客户是否优质的模型。
优选地,采用如下训练过程,实现模型逐步调整,从模型稳定性和准确性两个维度开展模型有效性分析:
全特征训练:样本选取全部47.4万户,模型入参为全部业务指标;
重要特征训练:样本选取全部47.4万户,模型入参为重要性高的前40%指标;
全特征交叉训练:将全部样本平均拆分成10份,每次选择其中9份作为训练样本,剩余1份作为预测样本,循环迭代10次,模型入参为全部业务指标;
重要特征交叉训练:将全部样本平均拆分成10份,每次选择其中9份作为训练样本,剩余1份作为预测样本,循环迭代10次,模型入参为重要性高的前40%指标。
其中,通过分析模型输入变量的显著性系数p进行噪声认定,噪声变量将不纳入模型。
本实施例总计收集47.4万条数据,通过数据清洗,剔除掉3.94万条样本用户。模型训练过程共计应用43.5条样本,其中10.06万户为优质客户,33.39万户为非优质客 户,优质与非优质样本的比例0.3比1。
2、采用逻辑回归算法构建优质客户等级判断模型
应用逻辑回归算法得到用户为优质客户的概率P及综合评分Y,其中概率 P=1/(1+exp(-Y))是关于综合评分Y一个非线性函数。综合评分Y是一个连续变量,通 过设置不同的综合评分区间,为进一步细分客户优质等级提供数值依据。将全部优质客 户通过逻辑回归模型进行综合评分,评分值Y按照从高到低进行排序形成客户评分趋势 图,将优质客户按照四分位法进行划分,确定四个等级优质客户评分区间(如图3),形 成优质客户评级标准。以逻辑回归模型计算存量优质客户的Y值,按其Y值判定该客 户优质等级。
优质客户识别模型将所有高压用户分为5类,分别是:非优质客户、一级优质客户(等级低)、二级优质客户(等级较低)、三级优质客户(等级较高)、四级优质客户(等 级高)。
在当前的47.4万个训练样本中,概率P大于0.5的被分为优质客户,概率小于等于0.5的被分为非优质客户,基于重要特征的模型分类结果准确率达到99.1%。概率 P=1/(1+exp(-Y))是关于综合评分Y一个非线性函数,综合评分Y可以作为进一步细分 客户优质等级的数值依据。评分值Y按照从高到低进行排序形成客户评分趋势图,将优 质客户按照四分位法进行划分,确定四个等级优质客户评分区间(如图3),形成优质客 户评级标准。以逻辑回归模型计算存量优质客户的Y值,按其Y值判定该客户优质等 级。
所述逻辑回归还用于单一客户的优质评价:
具体到单一优质客户,以逻辑回归作为辅助来进行单一用户优质判别结果的解释。 通过对样本数据的分析,得出每个指标的模型系数K。而K值与特征值的乘积Hi的大小代 表指标在反映客户优质程度上的贡献度,从而分析出影响客户优质的主要因素,即用户的优质特质。
(四)模型迭代优化
建模模型版本升级优化的长效机制。通过专家监督开展模型判定结果纠正,不定期 对模型判定结果进行有效性分析,在分析结果基础上,通过重新训练模型达到模型版本升级及优化的目的。
(五)模型效果评估
运用专家打分的数据,对最佳模型的准确率、召回率进行检验,评估模型效果。
(六)模型部署应用
对训练好的模型进行集成,通过数据接口收集用户特征数据,定期开展客户优质等 级的判定。
从优质客户的大数据分析和整体分布情况来看,全省高压客户共计47.4万户,其中优质客户10.06万户,按八大用户行业分类后,优质客户分布如图4所示;工业行业 的优质客户全部的46%,公共事业及管理行业占18%,交通运输及建筑业最低,分别为 2%、3%。从各行业优质客户占比情况来看,信息化传输、计算机软件业和公共事业及 管理业的优质客户占比最高,分别达到74.54%、35.21%;工业、金融、房地产、商务 及居民服务业、交通运输、仓储业次之,分别达到20.17%、20.64%、15.23%;建筑业、 农林牧渔业两个行业的优质客户占比最少,分别为11.58%、6.97%。
(七)服务需求库建立阶段
获取样本客户的服务需求,进行标准化归类分析建立服务需求库:
互联网时代的营销以提升客户体验为核心,客户需求驱动着企业服务和产品的设计 与规划,当前电网企业已面临客户丰富多样和个性化的服务需求,在未来市场化竞争环境下对客户需求的把握将更为重要,因此从精准把握客户需求的角度出发,打造可持续 应用的客户需求管理体系,将客户需求管理作为常态化的工作。
打造标准化需求管理流程。为改变传统需求管理分散、未统一存储、服务供给与需求脱节等显著问题,规划支撑服务策略制定的服务需求库,建立标准需求项、用户行业、 用电容量、优质等级、需求关注度等信息间的关联映射,打造包括需求收集、需求预处 理、需求归类、标准化处理、需求入库的标准化需求管理流程,并已通过实践执行完成 需求数据的原始积累。
首先为保障需求信息的统一规范,根据电力业务分布及业务特点集聚业务专家意见,将服务需求划分为业扩办电和电网建设、电费电价和电力信息、电能质量和供电可 靠性、故障停电和计划停电、安全用电和应急保障、电能替代和电力节能、用电培训故 障处理及其他等八个需求类别;如图5所示。
需求收集方面通过多种手段已收集不同行业、不同规模电力客户的需求1.67万条;
需求预处理方面对描述不清晰、非正常文字描述的需求过滤处理后,整理为9800条有效需求;
基于需求类别标准对有效需求归类分析和去重后形成8156条完整需求;
通过将用户描述的自然语言转换为专业术语的标准需求项,并基于专家经验的数据 聚类分析,完成378条标准需求入库,实现了需求信息的数字化管理;
将制定的标准需求项、原始需求、用户属性及优质等级进行关联,形成服务需求库。
多渠道多手段的需求挖掘。
一是现实需求收集,采用线上线下相结合的方式,通过基层业务人员现场走访、营业厅工作人员在客户等待间隙、大客户经理定期走访的途径实现线下需求的收集;利用 掌上电力等线上渠道功能实现线上需求的收集。
二是潜在需求挖掘,从服务异常和问题入手,利用文本语义挖掘、聚类分析、关联规则分析等方式开展客户服务大数据分析,提取服务需求。
多视角的需求精细化管理。
一是保证需求质量,通过对需求的深度分析,多角度精准把握客户真实的服务诉求, 包括从需求的角度出发,细化定位到不同行业对具体需求的关注度,从行业的角度出发, 细化定位到具体行业对不同需求的关注度,通过掌握行业与需求的依赖关系,为在市场 放开环境下制定针对性的竞争策略提供依据。
二是保证需求时效性,将需求挖掘和分析作为常态化工作开展,通过对现实需求的 周期性收集和对潜在需求的周期性分析,不断更新和完善服务需求库,掌握客户需求的变化趋势,保障基于需求的竞争服务策略的及时、有效。
(八)服务策略库建立阶段
将服务需求库中的服务需求匹配服务内容,将服务内容匹配不同等级的优质客户, 建立服务策略库;优选地,结合地市专家业务经验,所述服务策略库包括针对每个需求分类制定五种等级的竞争策略,高等级竞争策略享有低等级策略,通过识别出的优质客 户等级,自动匹配相应级别的策略,实现策略的精准推送。
传统营销服务中将服务作为被动的实体等待客户发现和调用,企业未能主动的获取 服务的动态请求且难以根据客户需求变化实现服务策略的动态演化,难以适应市场化环 境下多变的市场形势和客户竞争。在实现客户需求数字化管理的基础上,通过以客户需求驱动服务集聚及组合的方法,构建客户-需求-服务三维的服务供求匹配模型,逐步形 成体系化的竞争服务策略库,实现对客户服务诉求的主动响应和快速执行。
首先,建立服务需求与服务内容的匹配,基于服务需求库中的不同需求,综合分析能够满足需求的服务内容和服务形式,形成需求与服务的对应关系。
其次,建立客户等级与服务策略的匹配,在需求与服务匹配的基础上,将客户优质等级作为重要参考维度,并结合市场放开、行业政策、竞争热度等外部竞争因素,对服 务内容和形式细化,根据不同客户优质等级制定差异化的服务策略,例如“政策公开” 的服务需求对不同等级用户以实时上门讲解、定期走访告知、电话告知、信息推送、渠 道公示等策略予以实现。
最后,建立竞争服务策略库更新机制,通过策略执行、策略反馈、策略完善对服务策略实现闭环管理,以服务策略的执行情况和客户评价为参考对策略进行实时调整和完善,确保竞争服务策略能够实时满足市场竞争需要。
(八)服务策略匹配阶段
根据优质客户识别结果搜索服务策略库,得到与当前客户匹配的服务策略。
具体地,匹配相应级别的竞争策略包括:
确定用户等级后,基于服务需求库获取该用户相应行业的需求关注度;
根据所述需求关注度获取排名靠前的多个需求分类;
根据所述多个需求分类以及用户等级,基于服务策略库匹配相应的服务策略。
例如某结构性金属制品制造商,根据模型识别出某户优质等级为三级;通过服务需 求库得知该行业该行业对20类需求比较关注;优先选择前5个需求,基于服务策略库 查找这5个需求三级客户相应的策略进行推荐。根据模型识别出某户优质等级为三级, 三级客户同时享有下级客户的策略,通过需求与竞争策略库获取到对应的竞争策略。
实施例二
本实施例的目的是提供一种计算装置。
一种基于随机森林和逻辑回归的客户服务策略制定装置,包括存储器、处理器及存 储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下 步骤,包括:
步骤1:获取样本客户价值特征,并进行优质性判别;
步骤2:采用样本客户数据,基于随机森林和逻辑回归算法构建优质客户识别模型;
步骤3:基于专家监督法对优质客户识别模型的判断结果进行有效性分析,并基于分析结果训练优质客户优化识别模型;
步骤4:将待识别客户的价值特征作为输入,基于所述优质客户识别模型,判断所述客户是否为优质客户。
实施例三
本实施例的目的是提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行以 下步骤:
步骤1:获取样本客户价值特征,并进行优质性判别;
步骤2:采用样本客户数据,基于随机森林和逻辑回归算法构建优质客户识别模型;
步骤3:基于专家监督法对优质客户识别模型的判断结果进行有效性分析,并基于分析结果训练优质客户优化识别模型;
步骤4:将待识别客户的价值特征作为输入,基于所述优质客户识别模型,判断所述客户是否为优质客户。
以上实施例二和三的装置中涉及的各步骤与方法实施例一相对应,具体实施方式可 参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
本发明的有益效果
1、本发明以电网公司客户的用电属性、用电行为、用电特征等海量数据为基础,采用机器学习的技术手段,实现了优质客户的识别,为针对优质客户提供优质服务提供 了保障,有助于提升电网企业竞争力。
2、本发明采用随机森林和逻辑回归相结合的方式进行客户识别模型的训练,所述识别模型能够在识别客户是否优质的基础上,判断客户的优质等级,进一步实现了优质 客户的精准定位。
3、本发明建立所述优质客户识别模型升级优化的长效机制,基于专家监督法对优质客户识别模型的判断结果不定期地进行有效性分析,并基于分析结果,重新训练优质 客户优化识别模型,通过重新训练模型达到模型版本升级及优化的目的。
4、本发明利用大数据技术深度挖掘和分析优质客户综合价值以及用电服务需求,准确的分析客户综合价值体现以及客户用电服务需求,将有限的服务资源集中到优质客户的关键服务需求上,从而提升电网企业在电改新形势下的竞争力,使电网企业保持长 期可持续发展。
5、本发明根据优质客户的识别结果和用电服务需求分析结果,制定个性化、增值化的服务产品与服务策略,并根据市场反馈及时调整服务策略,增加优质客户的忠诚度、客户粘性和客户满意度,建立与优质客户间稳定的供用电关系。
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置 来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将 它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的 硬件和软件的结合。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围 的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种基于随机森林和逻辑回归的客户服务策略制定方法,其特征在于,包括以下步骤:
步骤1:获取样本客户价值特征,并进行优质性判别;
步骤2:采用样本客户数据,基于随机森林和逻辑回归算法构建优质客户识别模型;
步骤3:将待识别客户的价值特征作为输入,基于所述优质客户识别模型,判断所述客户是否为优质客户;
步骤4:获取样本客户的服务需求,进行标准化归类分析建立服务需求库;将服务需求库中的服务需求匹配服务内容,将服务内容匹配不同等级的优质客户,建立服务策略库;
步骤5:基于服务需求库和服务策略库,根据优质客户识别结果自动匹配服务策略。
2.如权利要求1所述的一种基于随机森林和逻辑回归的客户服务策略制定方法,其特征在于,所述步骤1包括:
步骤1.1:根据获取的用户各项用电信息构建客户价值评价特征指标体系;
步骤1.2:根据所述指标体***计样本用户的价值特征,并进行样本用户优质性判别。
3.如权利要求1或2所述的一种基于随机森林和逻辑回归的客户服务策略制定方法,其特征在于,所述步骤1中价值特征包括用户对应的基本属性、经济价值、负荷价值、发展价值、信用价值、行业价值数据。
4.如权利要求1所述的一种基于随机森林和逻辑回归的客户服务策略制定方法,其特征在于,所述步骤2包括:
步骤2.1:对样本用户数据进行预处理;
步骤2.2:基于随机森林法训练优质客户判断模型;
步骤2.3:采用逻辑回归算法构建优质客户等级判断模型;
步骤2.4:结合优质客户判断模型和优质客户等级判断模型获取优质客户识别模型。
5.如权利要求4所述的一种基于随机森林和逻辑回归的客户服务策略制定方法,其特征在于,所述步骤2.1包括:数据清洗、特征因素量化、特征拓展、特征选择和异常值处理。
6.如权利要求4所述的一种基于随机森林和逻辑回归的客户服务策略制定方法,其特征在于,所述步骤2.2包括:
全特征训练:样本选取全部样本用户数据,模型入参为全部业务指标;
重要特征训练:样本选取全部样本用户数据,模型入参为重要性高的前40%指标;
全特征交叉训练:将样本用户数据平均拆分成10份,每次选择其中9份作为训练样本,剩余1份作为预测样本,循环迭代10次,模型入参为全部业务指标;
重要特征交叉训练:将样本用户数据平均拆分成10份,每次选择其中9份作为训练样本,剩余1份作为预测样本,循环迭代10次,模型入参为重要性高的前40%指标。
7.如权利要求4所述的一种基于随机森林和逻辑回归的客户服务策略制定方法,其特征在于,所述步骤2.3包括:将优质客户判断模型获取的优质客户通过逻辑回归模型进行综合评分;设置多个综合评分区间,得到优质客户等级判断模型。
8.如权利要求1所述的一种基于随机森林和逻辑回归的客户服务策略制定方法,其特征在于,所述服务需求库中的服务需求包括业扩办电和电网建设、电费电价和电力信息、电能质量和供电可靠性、故障停电和计划停电、安全用电和应急保障、电能替代和电力节能、用电培训故障处理及其他等八个需求类别。或
所述服务需求库建立的具体步骤包括:
获取样本客户的服务需求;
对样本客户的服务需求进行预处理,得到有效服务需求;
根据需求类别对有效服务需求进行归类分析和去重,并将用户描述的自然语言转换为专业术语的标准需求项,基于专家经验的数据聚类分析,建立服务需求库。或
所述步骤5包括:
步骤5.1:确定用户等级后,基于服务需求库获取该用户相应行业的需求关注度;
步骤5.2:根据所述需求关注度获取排名靠前的多个需求分类;
步骤5.3:根据所述多个需求分类以及用户等级,基于服务策略库匹配相应的服务策略。
9.一种基于随机森林和逻辑回归的客户服务策略制定装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时执行如权利要求1-8任一项所述的一种基于随机森林和逻辑回归的客户服务策略制定方法。
CN201810027579.9A 2018-01-11 2018-01-11 基于随机森林和逻辑回归的客户服务策略制定方法、装置 Pending CN108388955A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810027579.9A CN108388955A (zh) 2018-01-11 2018-01-11 基于随机森林和逻辑回归的客户服务策略制定方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810027579.9A CN108388955A (zh) 2018-01-11 2018-01-11 基于随机森林和逻辑回归的客户服务策略制定方法、装置

Publications (1)

Publication Number Publication Date
CN108388955A true CN108388955A (zh) 2018-08-10

Family

ID=63076146

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810027579.9A Pending CN108388955A (zh) 2018-01-11 2018-01-11 基于随机森林和逻辑回归的客户服务策略制定方法、装置

Country Status (1)

Country Link
CN (1) CN108388955A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255629A (zh) * 2018-08-22 2019-01-22 阳光财产保险股份有限公司 一种客户分群方法及装置、电子设备、可读存储介质
CN110033307A (zh) * 2019-01-04 2019-07-19 国网浙江省电力有限公司电力科学研究院 一种基于机器学习模型的电力优质客户筛选方法
CN110428265A (zh) * 2019-07-25 2019-11-08 新奥(中国)燃气投资有限公司 一种客户等级划分方法及装置
CN110837587A (zh) * 2019-09-30 2020-02-25 北京健康之家科技有限公司 一种基于机器学习的数据匹配方法和***
CN110992087A (zh) * 2019-11-19 2020-04-10 国网浙江省电力有限公司宁波供电公司 客户用电行为区域差异化方法及装置
CN111340380A (zh) * 2020-03-03 2020-06-26 深圳市海那边科技有限公司 客户资源分配方法、装置以及存储介质
CN112396442A (zh) * 2019-08-15 2021-02-23 国网能源研究院有限公司 新型电力服务产品设计***
CN112767177A (zh) * 2020-12-30 2021-05-07 中国人寿保险股份有限公司上海数据中心 基于随机森林进行客户等级划分的保险客户信息管理***
CN113837868A (zh) * 2021-09-30 2021-12-24 重庆富民银行股份有限公司 一种客群分层***及方法
CN113870641A (zh) * 2021-09-29 2021-12-31 上海乐项信息技术有限公司 一种用于直播带货的模拟培训方法和***
CN114238615A (zh) * 2021-12-14 2022-03-25 淄博天大创新科技服务有限公司 一种企业服务成果数据处理方法及***
CN116401601A (zh) * 2023-04-14 2023-07-07 国网浙江省电力有限公司 基于逻辑回归模型的停电敏感用户优选处置方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255629A (zh) * 2018-08-22 2019-01-22 阳光财产保险股份有限公司 一种客户分群方法及装置、电子设备、可读存储介质
CN110033307A (zh) * 2019-01-04 2019-07-19 国网浙江省电力有限公司电力科学研究院 一种基于机器学习模型的电力优质客户筛选方法
CN110428265A (zh) * 2019-07-25 2019-11-08 新奥(中国)燃气投资有限公司 一种客户等级划分方法及装置
CN112396442A (zh) * 2019-08-15 2021-02-23 国网能源研究院有限公司 新型电力服务产品设计***
CN110837587A (zh) * 2019-09-30 2020-02-25 北京健康之家科技有限公司 一种基于机器学习的数据匹配方法和***
CN110837587B (zh) * 2019-09-30 2023-05-23 北京水滴科技集团有限公司 一种基于机器学习的数据匹配方法和***
CN110992087A (zh) * 2019-11-19 2020-04-10 国网浙江省电力有限公司宁波供电公司 客户用电行为区域差异化方法及装置
CN111340380A (zh) * 2020-03-03 2020-06-26 深圳市海那边科技有限公司 客户资源分配方法、装置以及存储介质
CN112767177A (zh) * 2020-12-30 2021-05-07 中国人寿保险股份有限公司上海数据中心 基于随机森林进行客户等级划分的保险客户信息管理***
CN113870641A (zh) * 2021-09-29 2021-12-31 上海乐项信息技术有限公司 一种用于直播带货的模拟培训方法和***
CN113837868A (zh) * 2021-09-30 2021-12-24 重庆富民银行股份有限公司 一种客群分层***及方法
CN114238615A (zh) * 2021-12-14 2022-03-25 淄博天大创新科技服务有限公司 一种企业服务成果数据处理方法及***
CN116401601A (zh) * 2023-04-14 2023-07-07 国网浙江省电力有限公司 基于逻辑回归模型的停电敏感用户优选处置方法
CN116401601B (zh) * 2023-04-14 2023-09-15 国网浙江省电力有限公司 基于逻辑回归模型的停电敏感用户处置方法

Similar Documents

Publication Publication Date Title
CN108388955A (zh) 基于随机森林和逻辑回归的客户服务策略制定方法、装置
CN108280541A (zh) 基于随机森林和决策树的客户服务策略制定方法、装置
CN108389069A (zh) 基于随机森林和逻辑回归的优质客户识别方法及装置
CN108364191A (zh) 基于随机森林和逻辑回归的优质客户优化识别方法及装置
CN108388974A (zh) 基于随机森林和决策树的优质客户优化识别方法及装置
CN106504029A (zh) 一种基于客户群体行为分析的加油站销量预测方法
CN111026801A (zh) 一种辅助保险类电商运营快速决策工作的方法及***
CN109325799A (zh) 基于云模型的电力客户资源价值评价方法
CN108154311A (zh) 基于随机森林和决策树的优质客户识别方法及装置
CN111192161A (zh) 电力市场交易对象推荐方法、装置
Ye et al. A bibliometric analysis of inventory management research based on knowledge mapping
CN116187808A (zh) 一种基于虚拟电厂用户-套餐标签画像的电力套餐推荐方法
Sun et al. Using improved RFM model to classify consumer in big data environment
CN113450141A (zh) 一种基于电力大客户群体售电量特征的智能预测方法及装置
CN107844874A (zh) 企业营运问题分析***及其方法
CN116523301A (zh) 基于电商大数据进行风险评级预测的***
CN116227958A (zh) 一种基于持仓与净值动态量化评价偏债型基金经理的方法与***
CN114971696A (zh) 一种基于用电量的报价方法及流程信息上传***
CN112926997A (zh) 一种客户关系管理***及方法
Wang et al. Power load forecasting using data mining and knowledge discovery technology
Kunasekaran Research on E-commerce Customer Loyalty under Big Data
CN116777508B (zh) 一种基于大数据的医药供应分析管理***及方法
Qihai et al. Analysis of business intelligence and its derivative-financial intelligence
Wikamulia et al. Predictive business intelligence dashboard for food and beverage business
Chen et al. A web-based ERP data mining system for decision making

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180810

RJ01 Rejection of invention patent application after publication