CN111062502B - 用户用电行为细分方法及其故障分析方法 - Google Patents

用户用电行为细分方法及其故障分析方法 Download PDF

Info

Publication number
CN111062502B
CN111062502B CN201911301560.XA CN201911301560A CN111062502B CN 111062502 B CN111062502 B CN 111062502B CN 201911301560 A CN201911301560 A CN 201911301560A CN 111062502 B CN111062502 B CN 111062502B
Authority
CN
China
Prior art keywords
user
electricity consumption
users
matrix
subdivision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911301560.XA
Other languages
English (en)
Other versions
CN111062502A (zh
Inventor
罗瑜珣
吴群飞
曾旻睿
陈子彬
黄惟玥
刘林平
李莎莎
周仕君
何星瑶
周栅延
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Hunan Electric Power Co Ltd
Hengyang Power Supply Co of State Grid Hunan Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Hunan Electric Power Co Ltd
Hengyang Power Supply Co of State Grid Hunan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Hunan Electric Power Co Ltd, Hengyang Power Supply Co of State Grid Hunan Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201911301560.XA priority Critical patent/CN111062502B/zh
Publication of CN111062502A publication Critical patent/CN111062502A/zh
Application granted granted Critical
Publication of CN111062502B publication Critical patent/CN111062502B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用户用电行为细分方法,包括获取待分析用户用电数据;采用奇异值分解获取用户和日期的初始化表示特征;获取用户表示特征和日期表示特征;使用聚类算法完成用户用电行为的细分。本发明还提供了一种包括所述用户用电行为细分方法的故障分析方法。本发明根据获得的用户和日期的初始化表示特征,融合地理和用户类型信息,采用矩阵分解算法将居民根据时间序列用电的情况投影到潜在特征空间,并约束地理位置相近的用户在潜在特征空间相近,最后采用凝聚层次和聚类算法在潜在特征空间上对用户聚类细分,得到的用户聚类结果不仅保证用户的地理位置接近,类型一致且具有相似的用电行为;本发明方法可靠性强且准确性高。

Description

用户用电行为细分方法及其故障分析方法
技术领域
本发明属于智能电网领域,具体涉及一种用户用电行为细分方法及其故障分析方法。
背景技术
随着经济技术的发展和人们生活水平的提高,电能已经成为了人们生产和生活中必不可少的二次能源,给人们的生产和生活带来了无尽的便利。而随着智能电网的应用普及和大数据技术快速发展,海量用户用电数据被记录和存储,带动了用户用电行为分析等新方向的实践和理论研究。
特征学习可以被分为两类:监督的和无监督的。在监督特征学习中,被标记过的数据被当做特征用来学习,如神经网络。在无监督特征学习中,未被标记过的数据被当做特征用来学习,例如矩阵分解,各种聚类分析及其变形。
传统的智能电网用户细分模型主要为启发式的聚类算法。根据经验,预先定义两个用户的行为相似性度量方法,然后采用聚类方法基于该相似度度量对用户聚类。相似度计算作用在用户的用电序列向量上,常用的相似度度量方法有欧氏距离、余弦相似度或者皮尔逊系数。这样的理论框架可以聚类用户,但对于电网企业而言,由于供电运输是与地理和用户类型相关的,对地理相近(比如同市、乡镇、社区等)、用户类型一致且用电需求相似的用户群,提供特定的供电服务更为科学。这对传统聚类方法提出了新的挑战。
由于采用常规的矩阵分解方法获得用户和日期的表示特征时,所利用的数据类型单一(仅用户的用电情况),诸如地理位置、用户类型等大量信息得不到有效利用。在获取用户表示特征时会遭遇冷启动问题(用电信息丢失),分析效果也不理想。
发明内容
本发明的目的之一在于提供一种可靠性高且准确性好的用户用电行为细分方法
本发明的目的之二在于提供一种包括所述用户用电行为细分方法的故障分析方法。
本方法中采用的符号说明:
Figure BDA0002321928550000021
本发明提供的这种用户用电行为细分方法,包括如下步骤:
S1.获取待分析用户的近若干天的用电数据(包括用户地理信息和类型信息);
S2.采用奇异值分解获取用户和日期的初始化表示特征;
S3.基于矩阵分解,获取用户表示特征和日期表示特征;
S4.根据获取的用户表示特征和日期表示特征,采用聚类算法对用户进行细分,从而完成用户用电行为的细分。
步骤S1所述的获取待分析用户的近若干天的用电数据,具体为获取待分析用户的近N天的用电数据,并采用近N天的用电数据的平均值填充用电数据缺失日的用电数据;N为自然数。
步骤S3所述的基于矩阵分解,获取用户表示特征和日期表示特征,具体为采用如下步骤获取用户表示特征和日期表示特征:
A.采用如下算式迭代更新用户表示特征Wik和日期表示特征Hjk
Figure BDA0002321928550000031
Figure BDA0002321928550000032
式中Y为用户用电数据,H为日期特征,W为用户特征,LG为矩阵SG的拉普拉斯矩阵,SG为用户地理信息矩阵,LM为矩阵SM的拉普拉斯矩阵,SM为用户类型信息矩阵,YT、HT、WT分别为Y、H、T矩阵对应的转置矩阵。
B.迭代更新的Wik、Hjk与各自上一次更新对应的矩阵相减得到残差矩阵,计算残差矩阵的二范数之和,并进行判断:
若残差矩阵的二范数之和大于设定的阈值,则重复步骤A进行更新;
若残差矩阵的二范数之和小于或等于设定的阈值,则直接获取用户表示特征和日期表示特征。
步骤S4所述的采用聚类算法对用户进行细分,具体为采用如下步骤进行细分:
a.进行凝聚层次聚类;
b.采用K-means聚类算法对用户进行细分。
步骤b所述的采用K-means聚类算法对用户进行细分,具体为采用如下步骤进行细分:
(1)设定聚类的个数C;
(2)任意生成C个簇中心;
(3)计算每个用户到簇中心的距离,并将该用户细分至最近的簇中心所在的簇中;
(4)重新计算簇的中心点;
(5)重复步骤(1)~(4),直至满足事先设定的收敛要求;
(6)剔除用户数少于设定阈值的簇,从而得到最终的用户簇。
本发明还提供了一种包括了基于上述用户用电行为细分方法的故障分析方法,包括如下步骤:
S5.根据步骤S4得到的用户用电行为的细分结果,采用基于专家***智能诊断方法对用户故障进行分析。
本发明提供的这种用户用电行为细分方法及其故障分析方法,通过首先采用奇异值分解获得用户和日期的初始化表示特征,然后融合地理信息和用户类型信息,采用矩阵分解算法,将居民根据其时间序列用电的情况投影到潜在特征空间,并约束地理位置相近的用户在潜在特征空间相近,类型一致的用户在潜在特征空间也相近,最后采用凝聚层次和Kmeans聚类算法,在潜在特征空间上对用户聚类细分,使得用户聚类结果不仅保证用户的地理位置接近,类型一致且具有相似的用电行为;因此,本发明方法的可靠性强且准确性高。
附图说明
图1为本发明方法的方法流程示意图。
图2为本发明方法的实施例一中参数C对平均相似比的影响示意图。
图3为本发明方法的实施例一中参数C对最终簇数的影响示意图。
图4为本发明方法的实施例一中参数C取值为10时不同簇的用电行为对比示意图。
图5为本发明方法的实施例一中每个簇的平均使用电量示意图。
图6为本发明方法的实施例二中参数C对平均相似比的影响示意图。
图7为本发明方法的实施例二中参数C对最终簇数的影响示意图。
图8为本发明方法的实施例二中参数C取值为10时不同簇的用电行为对比示意图。
图9为本发明方法的实施例二中每个簇的平均使用电量示意图。
图10为本发明方法的故障分析方法的方法流程示意图。
具体实施方式
如图1所示为本发明方法的方法流程示意图:本发明提供的这种用户用电行为细分方法,包括如下步骤:
S1.获取待分析用户的近若干天的用电数据(包括用户地理信息和类型信息);具体为获取待分析用户的近N天的用电数据,并采用近N天的用电数据的平均值填充用电数据缺失日的用电数据;N为自然数;
在具体实施时,优选采用近10天的用电数据;
S2.采用奇异值分解获取用户和日期的初始化表示特征;
在具体实施时,假定用户用电情况矩阵的奇异值分解为:
Figure BDA0002321928550000051
其中
Figure BDA0002321928550000052
且∑为对角矩阵,由于奇异值分解(SVD)不能够保证/>
Figure BDA0002321928550000053
和/>
Figure BDA0002321928550000054
的非负性,因此将矩阵/>
Figure BDA0002321928550000055
和/>
Figure BDA0002321928550000056
采用如下公式进行归一化处理:
Figure BDA0002321928550000061
Figure BDA0002321928550000062
式中max为取矩阵的最大元素操作,min为取矩阵的最小元素操作,归一化后的矩阵W和H构造出了用户和日期的初始表示特征。
S3.基于矩阵分解,获取用户表示特征和日期表示特征;具体为采用如下步骤获取用户表示特征和日期表示特征:
A.采用如下算式更新用户表示特征Wik和日期表示特征Hjk
Figure BDA0002321928550000063
Figure BDA0002321928550000064
式中Y为用户用电数据,H为日期特征,W为用户特征,LG为矩阵SG的拉普拉斯矩阵,SG为用户地理信息矩阵,LM为矩阵SM的拉普拉斯矩阵,SM为用户类型信息矩阵,YT、HT、WT分别为Y、H、T矩阵对应的转置矩阵;
迭代更新的Wik、Hjk与各自上一次更新对应的矩阵相减得到残差矩阵,计算残差矩阵的二范数之和,并进行判断:
若残差矩阵的二范数之和大于设定的阈值,则重复步骤A进行更新;
若残差矩阵的二范数之和小于或等于设定的阈值,则直接获取用户表示特征和日期表示特征;
在具体实施时,首先引入描述分解逼近的目标函数,即:
L(W,H)=||Y-WHT||+2tr(WT(DG-SG)W)+2tr(WT(DM-SM)W)
s.t.Wij≥0,Hij≥0
此外,为了避免分解过度拟合,同时为了保证提取的特征为标准化特征,分别对W和H加两个约束项tr(WWT-IW)和tr(HHT-IH),即:
LGE(W,H)=||Y-WHT||+2tr(WT(DG-SG)W)+2tr(WT(DM-SM)W)
+tr(WWT-IW)+tr(HHT-IH)
s.t.Wij≥0,Hij≥0
其中DG和DM均为对角矩阵,且对角线上第(i,j)个元素分别等于矩阵SG和SM的第i行之和,IW和IH分别为大小为N*N和M*M的单位矩阵;
同时,令φ和ψ为拉格朗日乘子来分别约束Wij≥0和Hij≥0,则上述目标函数对应的拉格朗日函数Lf(W,H)为:
Lf(W,H)=||Y-WHT||+2tr(WTLGW)+2tr(WTLMW)+tr(φWT)+tr(ψHT)
+tr(WWT-IW)+tr(HHT-IH)
根据KKT条件,φikWik=0且ψikHik=0,从而可以获得以下等式:
-(YH)ikWik+(WHTH)ikWik+(LGW)ikWik+(LMW)ikWik+(W)ikWik=0
-(YTW)ikHik+(HWTW)ikHik+(H)ikHik=0
然后,根据以下公式分别更新用户表示特征Wik和日期表示特征Hjk
Figure BDA0002321928550000071
Figure BDA0002321928550000072
式中Y为用户用电数据,H为日期特征,W为用户特征,LG为矩阵SG的拉普拉斯矩阵,SG为用户地理信息矩阵,LM为矩阵SM的拉普拉斯矩阵,SM为用户类型信息矩阵,YT、HT、WT分别为Y、H、T矩阵对应的转置矩阵;
不断更新非负矩阵W和H,直至收敛或迭代次数达到设置的上限,最终获得用户和日期的表示特征,如第i个用户的标识特征为Wi(W的第i行向量),第j个日期的表示特征为Hj(H的第j行向量);
S4.根据获取的用户表示特征和日期表示特征,采用聚类算法对用户进行细分,从而完成用户用电行为的细分,具体为采用如下步骤进行细分:
a.进行凝聚层次聚类;
b.采用K-means聚类算法对用户进行细分;具体为采用如下步骤进行细分:
(1)设定聚类的个数C;
(2)任意生成C个簇中心;
(3)计算每个用户到簇中心的距离,并将该用户细分至最近的簇中心所在的簇中;
(4)重新计算簇的中心点;
(5)重复步骤(1)~(4),直至满足事先设定的收敛要求;
(6)剔除用户数少于设定阈值的簇,从而得到最终的用户簇。
本发明提供的用户用电行为细分方法,可以用于构建客户精准画像、智能电表数据应用、供电服务的线上应用、基于大数据分析的差异化客户服务、电力大数据增信应用、电网服务移动作业应用、客户服务全程可视化、基于专家***智能诊断的用户故障分析应用等。并且用户数据量越多,本发明方法得到的结果越精准。
为了验证本发明方法的有效性,以下结合两个实施例对本发明进行说明:
将本发明方法应用于衡阳地区和常德地区的用户十天用电情况数据集上。用户用电情况数据均为真实数据。衡阳地区数据集包含26个街道(或乡镇)的,9种用户类型的443个用户。常德地区数据集包含48个街道(或乡镇)的,12种用户类型的1682个用户。对于用电情况数据中的缺失值,本方法采用平均值替代。
在本实例中,将传统聚类方法凝聚层次聚类和K-means应用在本发明方法框架中,并进行了实验结果对比。引入了平均相似性比例(ASR)来衡量凝聚层次聚类和K-means方法识别的用户簇的簇内紧密和簇间宽松程度,进而表明本发明方法识别用户簇的有效性。同时,在本实例中,还展示了初始簇数C对最终用户簇结果的影响,各用户簇中每个用户的用电量以及各用户簇的用户平均用电量。
实施例一:
1)不同聚类方法实验对比,验证本发明算法的有效性:
图2给出了凝聚层次聚类和K-means中参数C取不同值时,获得的最终用户簇的ASR的值。整体上K-means方法获得ASR值比凝聚层次聚类方法获得ASR值更大。此外,K-Means方法在C=10时获得最大的ASR值1.2441,凝聚层次聚类方法在C=8时获得最大的ASR值1.22868,因此,可以说在本发明方法框架中,K-Means方法的性能优于凝聚层次聚类方法的性能。图3给出了初始簇数C值和最终用户簇之间的关联关系。从图3可以看出,随着C值的增大,K-Means方法获得的最终用户簇也逐渐增多,然而,随着C值的增大,凝聚层次聚类方法获得的最终用户数之间的关联关系没有那么大。综合图2和图3的显示结果,在之后的实验中,设置初始簇数C为10,然后根据权利要求书中K-means的实施步骤,将用户数少于10的簇删除,得到的最终簇数为5个。
2)实验结果各簇中用户用电量分析,验证结果的有效性
本发明方法得到的最终用户簇是具有共同特性的。在本次实例中,图4描述了不同簇中用户不同日期的用电行为,纵坐标为用户用电量,横坐标为日期点。图4(a)共含有229个用户,这些用户1-10日用电量较为平稳,整体用电量集中在10-400瓦;图4(b)共含有12个用户,这些用户用电量较多,集中在6000-10000瓦中,且1、2、9、10日用电量明显高于其他时间段的用电量;图4(c)共含有30个用户,这些用户的用电量集中在3000-5000瓦中,同样呈现1、2、9、10日用电量明显高于其他时间段的用电量的现象;图4(d)共含有101个用户,这些用户的用电量集中300-1000瓦,且9、10日的用电量稍微高于其他时间段的用电量;图4(e)共含有59个用户,这些用户的用电量集中在1200-2200瓦之间,且9、10日的用电量明显高于其他时间段的用电量。此外,如图4(d)所示,某一用户在8日的用电量极高,达到3600瓦左右(可能因为公司文化节、电表设备故障等特殊原因),但该用户仍然被聚类到图4(d)中,这得益于本发明融合了多源数据(如:用户类型和地理位置),从而进一步说明了本发明具有较强的抗干扰能力。图5显示每个簇内每天平均用电情况,从中可以看出不同簇中每天平均电量具有明显差异,且与图4中各簇中用户的用电量趋势吻合。例如:第4个用户簇前几天平均每天用电量呈平稳状态,而在9-10日出现明显上升趋势。
实施例2:
1)不同聚类方法实验对比,验证算法有效性
图6给出了凝聚层次聚类和K-means中参数C取不同值时,获得的常德最终用户簇的ASR值。类似地,K-means方法整体上能获得比凝聚层次聚类方法更大的ASR。此外,当C=10时,K-means方法能够获得最大的ASR=1.239值,当C=12时,凝聚层次聚类能够获得最大的ASR=1.078值,因此,同样地,K-means方法在常德地区数据方面也能获得更好的性能。图7描述了初始簇数C值和最终常德地区最终用户簇之间的关联关系。同样地,K-means方法获得的最终用户数与C值得关联性更高。综合图6和图7的显示结果,在针对常德地区数据的实验中,设置初始簇数C为10,然后根据权利要求书中K-means的实施步骤,将用户数少于10的簇删除,得到的最终簇数为7个。
2)实验结果各簇中用户用电量分析,验证结果的有效性
本发明方法所识别的常德地区最终用户簇是具有共同特性的。在本次实例中,图8描述了七个不同簇中常德地区用户不同日期的用电行为,纵坐标为用户用电量,横坐标为日期。图8(a)共含有1017个用户,这些用户的日用电量集中在0-600瓦,且每日用电量较为平稳;图8(b)共含有80个用户,这些用户的用电量集中在2200-4000瓦之间,4、5日的用电量略高于其他时间的用电量;图8(c)共含有41个用户,这些用户的用电量集中在4000-6000瓦中,且9、10日的用电量明显低于其他时间段;图8(d)共含有357个用户,这些用户的用电量集中在200-1400之间,且先呈现上升趋势后呈现下降趋势;图8(e)共含有132个用户,这些用户的用电量集中在1000-1500瓦之间,且整体较为平稳;图8(f)共含有31个用户,这些用户的用电量集中在6000-9000瓦,4日左右用电量高于其他时间段的用电量;图8(g)共含有12个用户,这些与用户的用电量集中在11000-21000之间,且4、7、8日用电量往往略低于其他时间段用电量。类似地,综合图片中出现的用电量极高或极低点,可以得到如下总结:本发明能够融合多源数据从而加强了用户细分方法的抗噪声干扰能力。图9显示了七个最终用户簇的每天平均用电情况,从中可以看出不同簇每天平均用电量具有明显差异,且与图8中各簇的单个用户用电量趋势吻合。例如:图8(f)在四日左右的用电量达到高峰期。
如图10所示为本发明方法的故障分析方法的方法流程示意图:本发明提供的这种包括上述用户用电行为细分方法的故障分析方法,包括如下步骤:
S1.获取待分析用户的近若干天的用电数据(包括用户地理信息和类型信息);具体为获取待分析用户的近N天的用电数据,并采用近N天的用电数据的平均值填充用电数据缺失日的用电数据;N为自然数;
在具体实施时,优选采用近10天的用电数据;
S2.采用奇异值分解获取用户和日期的初始化表示特征;
在具体实施时,假定用户用电情况矩阵的奇异值分解为:
Figure BDA0002321928550000121
其中
Figure BDA0002321928550000122
且∑为对角矩阵,由于奇异值分解(SVD)不能够保证/>
Figure BDA0002321928550000123
和/>
Figure BDA0002321928550000124
的非负性,因此将矩阵/>
Figure BDA0002321928550000125
和/>
Figure BDA0002321928550000126
采用如下公式进行归一化处理:
Figure BDA0002321928550000127
Figure BDA0002321928550000128
式中max为取矩阵的最大元素操作,min为取矩阵的最小元素操作,归一化后的矩阵W和H构造出了用户和日期的初始表示特征。
S3.基于矩阵分解,获取用户表示特征和日期表示特征;具体为采用如下步骤获取用户表示特征和日期表示特征:
A.采用如下算式更新用户表示特征Wik和日期表示特征Hjk
Figure BDA0002321928550000129
Figure BDA00023219285500001210
式中Y为用户用电数据,H为日期特征,W为用户特征,LG为矩阵SG的拉普拉斯矩阵,SG为用户地理信息矩阵,LM为矩阵SM的拉普拉斯矩阵,SM为用户类型信息矩阵,YT、HT、WT分别为Y、H、T矩阵对应的转置矩阵;
迭代更新的Wik、Hjk与各自上一次更新对应的矩阵相减得到残差矩阵,计算残差矩阵的二范数之和,并进行判断:
若残差矩阵的二范数之和大于设定的阈值,则重复步骤A进行更新;
若残差矩阵的二范数之和小于或等于设定的阈值,则直接获取用户表示特征和日期表示特征;
在具体实施时,首先引入描述分解逼近的目标函数,即:
L(W,H)=||Y-WHT||+2tr(WT(DG-SG)W)+2tr(WT(DM-SM)W)
s.t.Wij≥0,Hij≥0
此外,为了避免分解过度拟合,同时为了保证提取的特征为标准化特征,分别对W和H加两个约束项tr(WWT-IW)和tr(HHT-IH),即:
LGE(W,H)=||Y-WHT||+2tr(WT(DG-SG)W)+2tr(WT(DM-SM)W)
+tr(WWT-IW)+tr(HHT-IH)
s.t.Wij≥0,Hij≥0
其中DG和DM均为对角矩阵,且对角线上第(i,j)个元素分别等于矩阵SG和SM的第i行之和,IW和IH分别为大小为N*N和M*M的单位矩阵。
同时,令φ和ψ为拉格朗日乘子来分别约束Wij≥0和Hij≥0,则上述目标函数对应的拉格朗日函数Lf(W,H)为:
Lf(W,H)=||Y-WHT||+2tr(WTLGW)+2tr(WTLMW)+tr(φWT)+tr(ψHT)
+tr(WWT-IW)+tr(HHT-IH)
根据KKT条件,φikWik=0且ψikHik=0,从而可以获得以下等式:
-(YH)ikWik+(WHTH)ikWik+(LGW)ikWik+(LMW)ikWik+(W)ikWik=0
-(YTW)ikHik+(HWTW)ikHik+(H)ikHik=0
然后,根据以下公式分别更新用户表示特征Wik和日期表示特征Hjk
Figure BDA0002321928550000141
Figure BDA0002321928550000142
式中Y为用户用电数据,H为日期特征,W为用户特征,LG为矩阵SG的拉普拉斯矩阵,SG为用户地理信息矩阵,LM为矩阵SM的拉普拉斯矩阵,SM为用户类型信息矩阵,YT、HT、WT分别为Y、H、T矩阵对应的转置矩阵;
不断更新非负矩阵W和H,直至收敛或迭代次数达到设置的上限,最终获得用户和日期的表示特征,如第i个用户的标识特征为Wi(W的第i行向量),第j个日期的表示特征为Hj(H的第j行向量);
S4.根据获取的用户表示特征和日期表示特征,采用聚类算法对用户进行细分,从而完成用户用电行为的细分,具体为采用如下步骤进行细分:
a.进行凝聚层次聚类;
b.采用K-means聚类算法对用户进行细分;具体为采用如下步骤进行细分:
(1)设定聚类的个数C;
(2)任意生成C个簇中心;
(3)计算每个用户到簇中心的距离,并将该用户细分至最近的簇中心所在的簇中;
(4)重新计算簇的中心点;
(5)重复步骤(1)~(4),直至满足事先设定的额收敛要求;
(6)剔除用于数少于设定阈值的簇,从而得到最终的用户簇;
S5.根据步骤S4得到的用户用电行为的细分结果,采用基于专家***智能诊断方法对用户故障进行分析。

Claims (5)

1.一种用户用电行为细分方法,包括如下步骤:
S1.获取待分析用户的近若干天的用电数据;
S2.采用奇异值分解获取用户和日期的初始化表示特征;
S3.基于矩阵分解,获取用户表示特征和日期表示特征;具体为采用如下步骤获取用户表示特征和日期表示特征:
A.采用如下算式更新用户表示特征Wik和日期表示特征Hjk
Figure QLYQS_1
Figure QLYQS_2
式中Y为用户用电数据,H为日期特征,W为用户特征,LG为矩阵SG的拉普拉斯矩阵,SG为用户地理信息矩阵,LM为矩阵SM的拉普拉斯矩阵,SM为用户类型信息矩阵,YT、HT、WT分别为Y、H、T矩阵对应的转置矩阵;
B.迭代更新的Wik、Hjk与各自上一次更新对应的矩阵相减得到残差矩阵,计算残差矩阵的二范数之和,并进行判断:
若残差矩阵的二范数之和大于设定的阈值,则重复步骤A进行更新;
若残差矩阵的二范数之和小于或等于设定的阈值,则直接获取用户表示特征和日期表示特征;
S4.根据获取的用户表示特征和日期表示特征,采用聚类算法对用户进行细分,从而完成用户用电行为的细分。
2.根据权利要求1所述的用户用电行为细分方法,其特征在于步骤S1所述的获取待分析用户的近若干天的用电数据,具体为获取待分析用户的近N天的用电数据,并采用近N天的用电数据的平均值填充用电数据缺失日的用电数据;N为自然数。
3.根据权利要求2所述的用户用电行为细分方法,其特征在于步骤S4所述的采用聚类算法对用户进行细分,具体为采用如下步骤进行细分:
a.进行凝聚层次聚类;
b.采用K-means聚类算法对用户进行细分。
4.根据权利要求3所述的用户用电行为细分方法,其特征在于步骤b所述的采用K-means聚类算法对用户进行细分,具体为采用如下步骤进行细分:
(1)设定聚类的个数C;
(2)任意生成C个簇中心;
(3)计算每个用户到簇中心的距离,并将该用户细分至最近的簇中心所在的簇中;
(4)重新计算簇的中心点;
(5)重复步骤(1)~(4),直至满足事先设定的收敛要求;
(6)剔除用于数少于设定阈值的簇,从而得到最终的用户簇。
5.一种包括权利要求1~4之一所述的用户用电行为细分方法的故障分析方法,其特征在于还包括如下步骤:
S5.根据步骤S4得到的用户用电行为的细分结果,采用基于专家***智能诊断方法对用户故障进行分析。
CN201911301560.XA 2019-12-17 2019-12-17 用户用电行为细分方法及其故障分析方法 Active CN111062502B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911301560.XA CN111062502B (zh) 2019-12-17 2019-12-17 用户用电行为细分方法及其故障分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911301560.XA CN111062502B (zh) 2019-12-17 2019-12-17 用户用电行为细分方法及其故障分析方法

Publications (2)

Publication Number Publication Date
CN111062502A CN111062502A (zh) 2020-04-24
CN111062502B true CN111062502B (zh) 2023-07-14

Family

ID=70301999

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911301560.XA Active CN111062502B (zh) 2019-12-17 2019-12-17 用户用电行为细分方法及其故障分析方法

Country Status (1)

Country Link
CN (1) CN111062502B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112381351B (zh) * 2020-10-15 2022-10-11 广西电网有限责任公司 一种基于奇异谱分析的用电行为变化检测方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103093394A (zh) * 2013-01-23 2013-05-08 广东电网公司信息中心 一种基于用户用电负荷数据细分的聚类融合方法
CN107358368A (zh) * 2017-07-21 2017-11-17 国网四川省电力公司眉山供电公司 一种面向电力用户细分的鲁棒k‑means聚类方法
CN108776939A (zh) * 2018-06-07 2018-11-09 上海电气分布式能源科技有限公司 用户用电行为的分析方法及***
CN109740790A (zh) * 2018-11-28 2019-05-10 国网天津市电力公司 一种基于时序特征提取的用户用电量预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103093394A (zh) * 2013-01-23 2013-05-08 广东电网公司信息中心 一种基于用户用电负荷数据细分的聚类融合方法
CN107358368A (zh) * 2017-07-21 2017-11-17 国网四川省电力公司眉山供电公司 一种面向电力用户细分的鲁棒k‑means聚类方法
CN108776939A (zh) * 2018-06-07 2018-11-09 上海电气分布式能源科技有限公司 用户用电行为的分析方法及***
CN109740790A (zh) * 2018-11-28 2019-05-10 国网天津市电力公司 一种基于时序特征提取的用户用电量预测方法

Also Published As

Publication number Publication date
CN111062502A (zh) 2020-04-24

Similar Documents

Publication Publication Date Title
WO2021208516A1 (zh) 一种非侵入式负荷分解方法
CN109389180A (zh) 一款基于深度学习的电力设备图像识别方法及巡查机器人
CN109558873B (zh) 一种基于变样本栈式自编码网络的模式识别方法
CN108197425B (zh) 一种基于非负矩阵分解的智能电网数据分解方法
WO2022105117A1 (zh) 一种图像质量评价的方法、装置、计算机设备及存储介质
CN111709397B (zh) 一种基于多头自注意力机制的无人机变尺寸目标检测方法
CN109492748B (zh) 一种基于卷积神经网络的电力***的中长期负荷预测模型建立方法
CN109190890A (zh) 一种基于用户电力消费数据的用户行为分析方法
CN108805213B (zh) 计及小波熵降维的电力负荷曲线双层谱聚类方法
CN109634940A (zh) 一种基于海量低压台区用电数据的典型低压台区用电模型构建方法
CN111724039B (zh) 一种向电力用户推荐客服人员的推荐方法
CN111783879B (zh) 基于正交注意力机制的层次化压缩图匹配方法及***
CN112330078B (zh) 用电量预测方法、装置、计算机设备和存储介质
CN109375116A (zh) 一种基于自编码器的电池***异常电池识别方法
CN112650894A (zh) 一种基于层次分析法和深度信念网络相结合的用户用电行为多维分析诊断方法
Mohammadi et al. An unsupervised learning schema for seeking patterns in rms voltage variations at the sub-10-minute time scale
CN111062502B (zh) 用户用电行为细分方法及其故障分析方法
CN112308341A (zh) 电力数据的处理方法和装置
Miraftabzadeh et al. Knowledge Extraction from PV Power Generation with Deep Learning Autoencoder and Clustering-Based Algorithms
CN105447767A (zh) 一种基于联合矩阵分解模型的电力用户细分方法
CN117493922A (zh) 一种基于数据驱动的配电网户变关系识别方法
CN116596574A (zh) 电网用户画像构建方法及***
CN101504723B (zh) 一种建立投影空间的方法和装置
CN116467631A (zh) 电力指纹识别模型训练方法、电力指纹识别方法及装置
CN116090635A (zh) 一种气象驱动的新能源发电功率预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant