CN107248086A - 基于用户用电行为分析的广告投放辅助分析方法 - Google Patents
基于用户用电行为分析的广告投放辅助分析方法 Download PDFInfo
- Publication number
- CN107248086A CN107248086A CN201710270555.1A CN201710270555A CN107248086A CN 107248086 A CN107248086 A CN 107248086A CN 201710270555 A CN201710270555 A CN 201710270555A CN 107248086 A CN107248086 A CN 107248086A
- Authority
- CN
- China
- Prior art keywords
- data
- user
- analysis
- mover
- power utilization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 37
- 230000003542 behavioural effect Effects 0.000 title claims abstract description 27
- 230000005611 electricity Effects 0.000 claims abstract description 44
- 238000010835 comparative analysis Methods 0.000 claims abstract description 4
- 238000013480 data collection Methods 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 15
- 241001269238 Data Species 0.000 claims description 9
- 238000009826 distribution Methods 0.000 claims description 9
- HUTDUHSNJYTCAR-UHFFFAOYSA-N ancymidol Chemical compound C1=CC(OC)=CC=C1C(O)(C=1C=NC=NC=1)C1CC1 HUTDUHSNJYTCAR-UHFFFAOYSA-N 0.000 claims description 3
- 238000007621 cluster analysis Methods 0.000 claims description 3
- 210000000805 cytoplasm Anatomy 0.000 claims description 3
- 230000007774 longterm Effects 0.000 claims description 3
- 230000001737 promoting effect Effects 0.000 claims description 3
- 238000013459 approach Methods 0.000 claims description 2
- 230000002159 abnormal effect Effects 0.000 claims 1
- 230000005856 abnormality Effects 0.000 claims 1
- 238000005259 measurement Methods 0.000 abstract description 3
- 230000006399 behavior Effects 0.000 description 8
- 102000000584 Calmodulin Human genes 0.000 description 3
- 108010041952 Calmodulin Proteins 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000005612 types of electricity Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于用户用电行为分析的广告投放辅助分析方法,其特征是:包括数据收集;采集到的数据,对数据的噪音进行一系列操作;归一化处理;K‑means聚类;根据K‑means聚类得到的结果,对每个类别的用户用电量特性进行分析,确定每类用户的用电特点;根据聚类的结果,对比分析每个类别用电客户的不同用电行为特征,就辅助广告投放的业务进行推广。本发明为企业用户提供不同区域居民消费能力测算、消费品关注方向预测,以辅助企业为其产品进行广告定向投放。
Description
技术领域
本发明涉及一种基于用户用电行为分析的广告投放辅助分析方法。
背景技术
目前国家电网公司应用营销信息***、用电信息采集***的逐步发展,积累了各行各业海量用电信息,而随着智能电网技术的发展,智能网关、智能插座设备逐步普及使得用户用电数据采集与存储变得更为便捷,这些数据具有数据量大、数据类型繁多、数据实时性高的大数据基本特征,目前主要应用于国网公司内部营销业务辅助决策,对政府、企业客户的数据定制分析服务应用极为有限。
随着“智慧城市”项目在各个试点城市的深化应用开展,要求跨行业、区域、部门协作,打破信息应用的障碍,实现信息的互联互通,因而对电网大数据应用提出新的需求,即通过客户用电信息结合区域历史数据为政府、企业客户的提供定制场景分析服务,这些定制分析场景通过分析报告、数据可视化、制定服务的方式交付给客户,为国家电网公司创造经济价值。
基于用电信息采集***的客户用电信息,根据初步估算涉及中所有电量数据,一个省(市)公司3年历史数据约为50T,每年新增约20T,符合大数据规模大,数据类型多样,数据处理时效性高的特征。这些用电数据除了满足内部业务提升与改进方面的决策支持外,同样可以面向政府、企业用户提供定制分析服务,如面向政府提供区域居民住宅空置率分析、预测未来经济发展趋势服务指导政府各项政策决策;面向企业客户提供商业投资选址、广告定向投放测算服务辅助企业进行商业投资决策。
发明内容
本发明的目的在于提供一种通过分析不同区域居民用电行为,结合区域商业消费相关多外部数据,利用聚类分析建模,细分居民用电消费特征,挖掘各区域居民消费习惯,从而为企业用户提供不同区域居民消费能力测算、消费品关注方向预测,以辅助企业为其产品进行广告定向投放的基于用户用电行为分析的广告投放辅助分析方法。
本发明的技术解决方案是:
一种基于用户用电行为分析的广告投放辅助分析方法,其特征是:包括下列步骤:
(1)数据收集,结合业务需求,收集用户的用电量数据;
(2)采集到的数据,对数据的噪音进行一系列操作:
异常值处理:异常值判定主要依据方法有两种,一种是拉依达准则法,方法简单易于操作,该方法是最常用的异常值判定与剔除准则,对于数据满足总体x服从正态分布的数据,有:
P(|x‐μ|>3σ)≤0.003
其中,μ和σ分别表示正态总体的数学期望和标准差,x为实际观测值,P为观测值在均值的左右3倍的标准差之外的概率;
此时在数据中出现大于μ+3σ或小于μ-3σ的数据概率很小,因此可以作为异常值剔除该部分数据;
另一种是标准化数值法,Z分数标准化后的数据服从正态分布;该方法可以识别异常值,Z分数低于-3或者高于3的数据为异常值;标准分数(Z分数)公式为:
Z=(x-μ)/σ
其中μ和σ分别表示正态总体的数学期望和标准差;
KNN算法填充缺失值:基于K近邻的缺失值填充方法,是考虑到电力数据的特性,通过选定多少个缺失值附近的临近数据,要计算缺失值,要选择出K个最近邻的数据,并对不同距离的数据设定权值,然后根据相应的加权平均值确定缺失值;平均值法填充缺失值,把异常值处理后指标的平均值作为缺失值的填充;
(3)归一化处理
用户的用电行为特征,主要是为了区分用户在不同时刻的用电趋势变化情况,由于用电客户覆盖面较广泛,不同用户的用电量差异较大,为避免用电数据量级带来的影响,本发明特地在行向做了归一化处理,公式为:
其中i表示第i个用户,t为一天96个时刻中的某一时刻;上述公式是用每个功率值减去当前行功率的最小值,再除以当前行的功率变化范围,即得到归一化后的数值;
(4)K-means聚类
在开始聚类之前,还要做一个数据降维的操作,用采数据一天内收集到的数据为96个点,但是这96个点在相邻的4个点内相差不大,于是取整点的功率数据为代表,得到降维后的各用户的功率数据;
本步骤将在上述处理过程的基础上,对用户进行类别划分,具体步骤如下:
S1.依据轮廓系数法确定最佳的聚类个数N;
S2.从上述数据中随机选取N个用户作为质心;
S3.从剩余的每个用户测量其到每个质心的距离,并把它归到最近质心的类别里;
S4.按照欧氏距离法,重新计算每个类别的质心;
S5.迭代S3-S4,直至新的质心与原质心相等或者小于指定阈值,算法结束;
(5)根据步骤(4)K-means聚类得到的结果,对每个类别的用户用电量特性进行分析,确定每类用户的用电特点;
(6)根据上述聚类的结果,对比分析每个类别用电客户的不同用电行为特征,就辅助广告投放的业务进行推广;
S1.说明聚类分析结果;
S2.分析不同类别对应的用户行为特征,包括用电特性、峰谷的分布情况;
S3.辅助广告投放的业务推广:
综合上述对不同类别用户的行为特征进行分析,将广告投放的主要集中点做归类。
本发明通过分析不同区域居民用电行为,结合区域商业消费相关多外部数据,利用聚类分析建模,细分居民用电消费特征,挖掘各区域居民消费习惯,从而为企业用户提供不同区域居民消费能力测算、消费品关注方向预测,以辅助企业为其产品进行广告定向投放。
本发明的主要创新在于提出了一种基于用户用电行为分析结果的应用分析架构,有效应用用户用电行为分析的结果。本发明能够解决用户用电行为在有效性、适用性、高效性和元素集合为高维的扩展性四个方面的问题。
有效性是指,即挖掘出符合实际业务要求的全部模式,并且没有遗漏,需要保证候选模式能够覆盖全体用电客户,并且在结果集中的模式也必然满足定义。
适用性是指,由于序列模式的数据中本身可能有噪声数据,序列上的某些点的数据可能是错误的,如果严格的按照序列模式顺序进行模式搜索,可能会错失部分潜在的模式,这些模式可能本身是满足定义的,但是由于序列数据中包含有噪声,导致这些模式无法直接以严格匹配的方式从序列数据中挖掘得到。所以,本发明需要引入其他约束,提高算法挖掘出的模式的适用性。
高效性是指,由于为了保证结果的有效性,本发明需要保证算法结果的有效性,算法需要对全搜索空间进行遍历,这会导致对于较大的数据集。所以本发明基于Hadoop进行实现,提高算法的运行效率,即高效性。
元素集合为高维的扩展性是指,结合不同的用户用电行为,集合多维度的实际业务,随着元素集合的实际业务的变化增加,用户的用电行为特征能够辅助业务的改革与提升,这就会使得得到的用户用电行为分析具有很好的扩展性。
附图说明
下面结合附图和实施例度本发明作进一步说明。
图1是本发明方法的总体框图。
图2是聚类结果总体展示图。
图3是各类包含用户数示意图。
图4是第1类用户用电特征图。
图5是第2类用户用电特征图。
图6是第3类用户用电特征图。
图7是第4类用户用电特征图。
图8是第5类用户用电特征图。
图9是第6类用户用电特征图。
图10是第7类用户用电特征图。
图11是第8类用户用电特征图。
图12是第9类用户用电特征图。
图13是第10类用户用电特征图。
具体实施方式
收集台区用户的用电量信息,收集到的数据中日期一般是以列的形式存放,按照上述技术方案的实现思路,首先按照日期由远及近的方式进行排列,并将日期转换为列标。
从用采数据出发,通过去噪、去重、去空等数据清洗整理工作,再进行归一化处理,最终基于用电数据的聚类分析去用户用电行为进行分类,找出不同类别的特征,并有针对性地进行分析和广告投放决策。
1、数据收集,结合业务需求,收集用户的用电量数据,如下表:
表1原始数据表
其中,Pjt i(i=1,2,…,m;j=1,2,…,n;t=1,2,…,96)代表用户i第j天在第t个时刻的实时功率数据。idi(i=1,2,…,m)代表用户i的唯一标识。datej(j=1,2,…,m)代表第j天的日期。
2、步骤1采集到的数据,有的为空,有的可能因为外界干扰或本身
机器故障导致数据采集失常,就需要对数据的噪音进行一系列操作。
异常值处理,异常值判定主要依据方法有两种,一种是拉依达准则法,方法简单易于操作,该方法是最常用的异常值判定与剔除准则,对于数据满足总体x服从正态分布的数据,有:
P(|x‐μ|>3σ)≤0.003
其中,μ和σ分别表示正态总体的数学期望和标准差,x为实际观测值,P为观测值在均值的左右3倍的标准差之外的概率。
此时在数据中出现大于μ+3σ或小于μ-3σ的数据概率很小,因此可以作为异常值剔除该部分数据。一种是标准化数值(Z-score)法,Z分数标准化后的数据服从正态分布。因此该方法可以识别异常值,建议Z分数低于-3或者高于3的数据为异常值。标准分数(Z分数)公式为:
Z=(x-μ)/σ
其中μ和σ分别表示正态总体的数学期望和标准差。此外统计法、分类法和距离法根据不同的问题也会有所应用。
KNN算法填充缺失值,基于K近邻的缺失值填充方法,是考虑到电力数据的特性,通过选定多少个缺失值附近的临近数据,要计算缺失值,要选择出K个最近邻的数据,并对不同距离的数据设定权值,然后根据相应的加权平均值确定缺失值。平均值法填充缺失值,把异常值处理后指标的平均值作为缺失值的填充,该方法比较方便,主要依据数学统计的方法。
处理后的数据如下表2:
表2数据处理中间表
其中,代表用户i在第k个时刻的日平均功率数据。
3、归一化处理
用户的用电行为特征,主要是为了区分用户在不同时刻的用电趋势变化情况,由于用电客户覆盖面较广泛,不同用户的用电量差异较大,为避免用电数据量级带来的影响,本发明特地在行向做了归一化处理,公式为:
(其中i表示第i个用户,t为一天96个时刻中的某一时刻。用每个功率值减去当前行的最小值,再除以当前行的功率变化范围,即得到归一化后的数值)
表3归一化数据表
其中,idi(i=1,2,…,m)代表用户i的唯一标识,Pi k(i=1,2,3…96,k=1,2,3…m)为归一化后的各用户的功率数据
4、K‐means聚类
在开始聚类之前,还要做一个数据降维的操作,用采数据一天内收集到的数据为96个点,但是这96个点在相邻的4个点内相差不大,于是取整点的功率数据为代表,经过归一化之后的数据就形成下表4:
表4降维数据表
其中,idi(i=1,2,…,m)代表用户i的唯一标识,
Pi k(i=1,5,9…93,k=1,2,3…m)为降维后的各用户的功率数据
本步骤将在上述处理过程的基础上,对用户进行类别划分,具体步骤如下:
S1.依据轮廓系数法确定最佳的聚类个数N;
S2.从上述数据中随机选取N个用户作为质心;
S3.从剩余的每个用户测量其到每个质心的距离,并把它归到最近质心的类别里;
S4.按照欧氏距离法,重新计算每个类别的质心;
S5.迭代S3~S4,直至新的质心与原质心相等或者小于指定阈值,算法结束。
1.根据步骤四K‐means聚类得到的结果,对每个类别的用户用电量特性进行分析,确定每类用户的用电特点。
2.结合实际业务,辅助提升业务质量。
根据上述聚类的结果,可以对比分析每个类别用电客户的不同用电行为特征。本发明就辅助广告投放的业务进行推广。
S1.说明聚类分析结果
基于上述的分析过程,可以得到如图2的聚类结果。
(图2中,横坐标P1、P2…P24为一天24小时的时间点,纵坐标为功率数据)
图3中横坐标是聚类出来不同转化因子向量的各个类别,纵坐标是各类包含的用户数。
从图3可以看出,不同类别的用户之间用电行为有较大的差别。下面将分类表述各类用户的用电行为特征。
S2.分析不同类别对应的用户行为特征,包括用电特性、峰谷的分布情况等;
图4中,横坐标P1、P2…P24为一天24小时的时间点,纵坐标为功率数据。
分析该类用户的用电特征发现:该类用户早中晚各有一个小高峰,晚高峰明显高于早高峰,午高峰最低,而平时用电一般,推测该类用户为家中有老人的普通上班族,或者家中有上学的孩子,只有孩子中午在家的一类家庭。
图5中,横坐标P1、P2…P24为一天24小时的时间点,纵坐标为功率数据。
分析该类用户的用电特征发现:该类用户在晚九点以后用电量直线下降,而早九点到晚九点用电量普遍较高,且13点时用电量会略有下降,推测该类用户为属于一类加工厂,属于机器作业。
图6中,横坐标P1、P2…P24为一天24小时的时间点,纵坐标为功率数据。
分析该类用户的用电特征发现:该类用户的用电一直在0.525附近上下浮动,且浮动值不超过0.1,日用电量较为平稳,推测该类用户为昼夜不间断的加工厂用户。
图7中,横坐标P1、P2…P24为一天24小时的时间点,纵坐标为功率数据。
分析该类用户的用电特征发现:该类用户从早八点到晚十八点都属于用电低谷,而晚八点到第二天的早六点一直处于用电高峰期,推测该类用户属于错峰用电的加工厂,属于机器作业。
图8中,横坐标P1、P2…P24为一天24小时的时间点,纵坐标为功率数据。
分析该类用户的用电特征发现:该类用户在8:00-12:00和
14:00-18:00区间内属于用电高峰,午间用电量明显下降,其余时段用电量较低,推测该类用户是写字楼等一般的办公场所。
图9中,横坐标P1、P2…P24为一天24小时的时间点,纵坐标为功率数据。
分析该类用户的用电特征发现:该类用户的用电特征与类别5的用户用电特征类似,属于双峰类用电客户,但下午用电量与上午用电量相差较大,说明该类用户容易受到气温等其它因素的影响,使得用电量明显下降。
图10中,横坐标P1、P2…P24为一天24小时的时间点,纵坐标为功率数据。
分析该类用户的用电特征发现:该类用户的用电量均较低,大部分的用电量都小于0.03,且整体用电较为平稳,说明该类用户一般在家的时间极少,推测该类用户为空载。
图11中,横坐标P1、P2…P24为一天24小时的时间点,纵坐标为功率数据。
分析该类用户的用电特征发现:该类用户的用电特征和类别4有些相似,白天用电量极少而晚上用电量较高,且中午十二点还有一个用电小高峰,推断其为中午做饭用电,推测该类用户为综合第4类用户的基础上,还有一部分用于中午做饭的用户。
图12中,横坐标P1、P2…P24为一天24小时的时间点,纵坐标为功率数据。
分析该类用户的用电特征发现:该类用户只有在十九点以后才逐步进入用电高峰,在早上和中午有一个用电小高峰,推测该类用户为青年上班族用户,早上中午不在家,晚上回家用电较多的类型。
图13中,横坐标P1、P2…P24为一天24小时的时间点,纵坐标为功率数据。
分析该类用户的用电特征发现:该类用户的用电特征与类别1有些类似,用电趋势相似,但该类用户的用电特征为早上用电高于晚上,推测该类用户为家务活动等喜欢在早上进行的一类用户。
S3.辅助广告投放的业务推广。
综合上述对不同类别用户的行为特征进行分析,将广告投放的主要集中点做如下归类:
以上类别划分属于一种框架式的划分,如果要具体划分在不同时间段的广告类型,则需要结合更多的客户信息数据;同时,区分节假日与非节假日的广告划分,也是可以进一步辅助广告投放的方向。
Claims (6)
1.一种基于用户用电行为分析的广告投放辅助分析方法,其特征是:包括下列步骤:
(1)数据收集,结合业务需求,收集用户的用电量数据;
(2)采集到的数据,对数据的噪音进行一系列操作:
异常值处理:异常值判定主要依据方法有两种,一种是拉依达准则法,方法简单易于操作,该方法是最常用的异常值判定与剔除准则,对于数据满足总体x服从正态分布的数据,有:
P(|x‐μ|>3σ)≤0.003
其中,μ和σ分别表示正态总体的数学期望和标准差,x为实际观测值,P为观测值在均值的左右3倍的标准差之外的概率;
此时在数据中出现大于μ+3σ或小于μ-3σ的数据概率很小,因此可以作为异常值剔除该部分数据;
另一种是标准化数值法,Z分数标准化后的数据服从正态分布;该方法可以识别异常值,Z分数低于-3或者高于3的数据为异常值;标准分数(Z分数)公式为:
Z=(x-μ)/σ
其中μ和σ分别表示正态总体的数学期望和标准差;
KNN算法填充缺失值:基于K近邻的缺失值填充方法,是考虑到电力数据的特性,通过选定多少个缺失值附近的临近数据,要计算缺失值,要选择出K个最近邻的数据,并对不同距离的数据设定权值,然后根据相应的加权平均值确定缺失值;平均值法填充缺失值,把异常值处理后指标的平均值作为缺失值的填充;
(3)归一化处理
用户的用电行为特征,主要是为了区分用户在不同时刻的用电趋势变化情况,由于用电客户覆盖面较广泛,不同用户的用电量差异较大,为避免用电数据量级带来的影响,本发明特地在行向做了归一化处理,公式为:
<mrow>
<mover>
<mover>
<msubsup>
<mi>P</mi>
<mi>t</mi>
<mi>i</mi>
</msubsup>
<mo>&OverBar;</mo>
</mover>
<mo>&OverBar;</mo>
</mover>
<mo>=</mo>
<mfrac>
<mrow>
<mover>
<msubsup>
<mi>P</mi>
<mi>t</mi>
<mi>i</mi>
</msubsup>
<mo>&OverBar;</mo>
</mover>
<mo>-</mo>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mi>t</mi>
</munder>
<mover>
<msubsup>
<mi>P</mi>
<mi>t</mi>
<mi>i</mi>
</msubsup>
<mo>&OverBar;</mo>
</mover>
</mrow>
<mrow>
<munder>
<mi>max</mi>
<mi>t</mi>
</munder>
<mover>
<msubsup>
<mi>P</mi>
<mi>t</mi>
<mi>i</mi>
</msubsup>
<mo>&OverBar;</mo>
</mover>
<mo>-</mo>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mi>t</mi>
</munder>
<mover>
<msubsup>
<mi>P</mi>
<mi>t</mi>
<mi>i</mi>
</msubsup>
<mo>&OverBar;</mo>
</mover>
</mrow>
</mfrac>
<mo>&Element;</mo>
<mo>&lsqb;</mo>
<mn>0</mn>
<mo>,</mo>
<mn>1</mn>
<mo>&rsqb;</mo>
</mrow>
其中i表示第i个用户,t为一天96个时刻中的某一时刻;上述公式是用每个功率值减去当前行功率的最小值,再除以当前行的功率变化范围,即得到归一化后的数值;
(4)K-means聚类
在开始聚类之前,还要做一个数据降维的操作,用采数据一天内收集到的数据为96个点,但是这96个点在相邻的4个点内相差不大,于是取整点的功率数据为代表,得到降维后的各用户的功率数据;
本步骤将在上述处理过程的基础上,对用户进行类别划分,具体步骤如下:
S1.依据轮廓系数法确定最佳的聚类个数N;
S2.从上述数据中随机选取N个用户作为质心;
S3.从剩余的每个用户测量其到每个质心的距离,并把它归到最近质心的类别里;
S4.按照欧氏距离法,重新计算每个类别的质心;
S5.迭代S3-S4,直至新的质心与原质心相等或者小于指定阈值,算法结束;
(5)根据步骤(4)K-means聚类得到的结果,对每个类别的用户用电量特性进行分析,确定每类用户的用电特点;
(6)根据上述聚类的结果,对比分析每个类别用电客户的不同用电行为特征,就辅助广告投放的业务进行推广;
S1.说明聚类分析结果;
S2.分析不同类别对应的用户行为特征,包括用电特性、峰谷的分布情况;
S3.辅助广告投放的业务推广:
综合上述对不同类别用户的行为特征进行分析,将广告投放的主要集中点做归类。
2.根据权利要求1所述的基于用户用电行为分析的广告投放辅助分析方法,其特征是:从用采数据出发,通过去噪、去重、去空数据清洗整理工作,再进行归一化处理,最终基于用电数据的聚类分析去用户用电行为进行分类,找出不同类别的特征,并有针对性地进行分析和广告投放决策。
3.根据权利要求1所述的基于用户用电行为分析的广告投放辅助分析方法,其特征是:如果要具体划分在不同时间段的广告类型,则需要结合更多的客户信息数据。
4.根据权利要求1所述的基于用户用电行为分析的广告投放辅助分析方法,其特征是:通过区分节假日与非节假日的广告划分,进一步辅助广告投放的方向。
5.根据权利要求1所述的基于用户用电行为分析的广告投放辅助分析方法,其特征是:所述不同类别用户包括家庭类、正常工业类、不间断工业类、错峰工业类、上班类、空载类、工业+家庭、青年上班类、家庭类。
6.根据权利要求1所述的基于用户用电行为分析的广告投放辅助分析方法,其特征是:收集台区用户的用电量信息,收集到的数据中日期以列的形式存放,按照上述技术方案的实现思路,首先按照日期由远及近的方式进行排列,并将日期转换为列标。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2017100922582 | 2017-02-21 | ||
CN201710092258 | 2017-02-21 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107248086A true CN107248086A (zh) | 2017-10-13 |
Family
ID=60016980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710270555.1A Pending CN107248086A (zh) | 2017-02-21 | 2017-04-24 | 基于用户用电行为分析的广告投放辅助分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107248086A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108038178A (zh) * | 2017-12-07 | 2018-05-15 | 北京邮电大学 | 一种用户用电行为可视化分析方法、装置及电子设备 |
CN108564390A (zh) * | 2017-12-29 | 2018-09-21 | 广东金赋科技股份有限公司 | 大量个体的数据趋势分析方法、电子设备和计算机存储介质 |
CN108776939A (zh) * | 2018-06-07 | 2018-11-09 | 上海电气分布式能源科技有限公司 | 用户用电行为的分析方法及*** |
CN109949181A (zh) * | 2019-03-22 | 2019-06-28 | 华立科技股份有限公司 | 基于knn临近算法的电网类型判断方法和装置 |
CN109961197A (zh) * | 2017-12-22 | 2019-07-02 | 中国电力科学研究院有限公司 | 一种基于电力用户标签的区域综合用电评价方法及*** |
CN110298552A (zh) * | 2019-05-31 | 2019-10-01 | 国网上海市电力公司 | 一种结合历史用电特征的配电网个体功率异常检测方法 |
CN110347957A (zh) * | 2019-06-12 | 2019-10-18 | 合肥大多数信息科技有限公司 | 一种自媒体用电服务推送方法 |
CN110363596A (zh) * | 2019-07-24 | 2019-10-22 | 金禧 | 一种精准广告投放方法及*** |
CN110967251A (zh) * | 2019-12-02 | 2020-04-07 | 湘潭大学 | 用于风电叶片损伤模式识别的方法 |
CN111353795A (zh) * | 2018-12-20 | 2020-06-30 | 北京沃东天骏信息技术有限公司 | 广告效果的衡量方法、装置、介质及设备 |
CN111353814A (zh) * | 2020-02-24 | 2020-06-30 | 上海佳投互联网技术集团有限公司 | 一种识别无效广告用户的方法及*** |
US11107097B2 (en) | 2019-08-29 | 2021-08-31 | Honda Motor Co., Ltd. | System and method for completing trend mapping using similarity scoring |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982489A (zh) * | 2012-11-23 | 2013-03-20 | 广东电网公司电力科学研究院 | 一种基于海量计量数据的电力客户在线分群方法 |
CN103093394A (zh) * | 2013-01-23 | 2013-05-08 | 广东电网公司信息中心 | 一种基于用户用电负荷数据细分的聚类融合方法 |
CN103942606A (zh) * | 2014-03-13 | 2014-07-23 | 国家电网公司 | 基于果蝇智能优化算法的居民用电客户细分方法 |
US20160274609A1 (en) * | 2015-03-18 | 2016-09-22 | Onzo Limited | Classifying utility consumption of consumers |
-
2017
- 2017-04-24 CN CN201710270555.1A patent/CN107248086A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982489A (zh) * | 2012-11-23 | 2013-03-20 | 广东电网公司电力科学研究院 | 一种基于海量计量数据的电力客户在线分群方法 |
CN103093394A (zh) * | 2013-01-23 | 2013-05-08 | 广东电网公司信息中心 | 一种基于用户用电负荷数据细分的聚类融合方法 |
CN103942606A (zh) * | 2014-03-13 | 2014-07-23 | 国家电网公司 | 基于果蝇智能优化算法的居民用电客户细分方法 |
US20160274609A1 (en) * | 2015-03-18 | 2016-09-22 | Onzo Limited | Classifying utility consumption of consumers |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108038178A (zh) * | 2017-12-07 | 2018-05-15 | 北京邮电大学 | 一种用户用电行为可视化分析方法、装置及电子设备 |
CN109961197B (zh) * | 2017-12-22 | 2021-08-27 | 中国电力科学研究院有限公司 | 一种基于电力用户标签的区域综合用电评价方法及*** |
CN109961197A (zh) * | 2017-12-22 | 2019-07-02 | 中国电力科学研究院有限公司 | 一种基于电力用户标签的区域综合用电评价方法及*** |
CN108564390A (zh) * | 2017-12-29 | 2018-09-21 | 广东金赋科技股份有限公司 | 大量个体的数据趋势分析方法、电子设备和计算机存储介质 |
CN108776939A (zh) * | 2018-06-07 | 2018-11-09 | 上海电气分布式能源科技有限公司 | 用户用电行为的分析方法及*** |
CN111353795A (zh) * | 2018-12-20 | 2020-06-30 | 北京沃东天骏信息技术有限公司 | 广告效果的衡量方法、装置、介质及设备 |
CN109949181B (zh) * | 2019-03-22 | 2021-05-25 | 华立科技股份有限公司 | 基于knn临近算法的电网类型判断方法和装置 |
CN109949181A (zh) * | 2019-03-22 | 2019-06-28 | 华立科技股份有限公司 | 基于knn临近算法的电网类型判断方法和装置 |
CN110298552A (zh) * | 2019-05-31 | 2019-10-01 | 国网上海市电力公司 | 一种结合历史用电特征的配电网个体功率异常检测方法 |
CN110298552B (zh) * | 2019-05-31 | 2023-12-01 | 国网上海市电力公司 | 一种结合历史用电特征的配电网个体功率异常检测方法 |
CN110347957A (zh) * | 2019-06-12 | 2019-10-18 | 合肥大多数信息科技有限公司 | 一种自媒体用电服务推送方法 |
CN110363596A (zh) * | 2019-07-24 | 2019-10-22 | 金禧 | 一种精准广告投放方法及*** |
US11107097B2 (en) | 2019-08-29 | 2021-08-31 | Honda Motor Co., Ltd. | System and method for completing trend mapping using similarity scoring |
CN110967251A (zh) * | 2019-12-02 | 2020-04-07 | 湘潭大学 | 用于风电叶片损伤模式识别的方法 |
CN110967251B (zh) * | 2019-12-02 | 2023-07-11 | 湘潭大学 | 用于风电叶片损伤模式识别的方法 |
CN111353814A (zh) * | 2020-02-24 | 2020-06-30 | 上海佳投互联网技术集团有限公司 | 一种识别无效广告用户的方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107248086A (zh) | 基于用户用电行为分析的广告投放辅助分析方法 | |
Rajabi et al. | A comparative study of clustering techniques for electrical load pattern segmentation | |
Benítez et al. | Dynamic clustering segmentation applied to load profiles of energy consumption from Spanish customers | |
Yildiz et al. | Household electricity load forecasting using historical smart meter data with clustering and classification techniques | |
Alahakoon et al. | Advanced analytics for harnessing the power of smart meter big data | |
Choksi et al. | Feature based clustering technique for investigation of domestic load profiles and probabilistic variation assessment: Smart meter dataset | |
CN105117810A (zh) | 一种阶梯电价机制下居民用电中期负载预测方法 | |
CN104992239A (zh) | 一种基于相关系数的行业用电量规律预测方法 | |
Gajowniczek et al. | Electricity peak demand classification with artificial neural networks | |
CN107784518A (zh) | 一种基于多维指标的电力客户细分方法 | |
CN114004296A (zh) | 一种基于电力负荷特征反向提取监测点的方法及*** | |
Park et al. | A novel load image profile-based electricity load clustering methodology | |
Lin et al. | A hybrid economic indices based short-term load forecasting system | |
CN110991477A (zh) | 一种识别电力***异常行业用户和异常用电行为的方法和*** | |
CN111815060A (zh) | 一种用电地区短期负荷预测方法及装置 | |
Kojury-Naftchali et al. | Identifying susceptible consumers for demand response and energy efficiency policies by time-series analysis and supplementary approaches | |
CN116976707B (zh) | 基于用电信息采集的用户用电数据异常分析方法及*** | |
Xu et al. | Spatial-temporal load forecasting using AMI data | |
CN112508260B (zh) | 基于对比学习的配电变压器中长期负荷预测方法及装置 | |
Zufferey et al. | Unsupervised learning methods for power system data analysis | |
Abrishami et al. | Using real-world store data for foot traffic forecasting | |
CN112288496A (zh) | 电力行业负荷分类计算方法及其跟踪分析方法 | |
Wang et al. | Application of clustering technique to electricity customer classification for load forecasting | |
CN106651425A (zh) | 一种考虑业扩报装数据的用户偷电、漏电行为监测方法 | |
CN116258280A (zh) | 一种基于时间序列聚类的短期负荷预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171013 |