CN105447767A - 一种基于联合矩阵分解模型的电力用户细分方法 - Google Patents
一种基于联合矩阵分解模型的电力用户细分方法 Download PDFInfo
- Publication number
- CN105447767A CN105447767A CN201510801889.8A CN201510801889A CN105447767A CN 105447767 A CN105447767 A CN 105447767A CN 201510801889 A CN201510801889 A CN 201510801889A CN 105447767 A CN105447767 A CN 105447767A
- Authority
- CN
- China
- Prior art keywords
- user
- matrix
- users
- sigma
- stage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 181
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000000354 decomposition reaction Methods 0.000 title claims abstract description 43
- 230000001105 regulatory effect Effects 0.000 claims abstract description 7
- 230000005611 electricity Effects 0.000 claims description 22
- 230000011218 segmentation Effects 0.000 claims description 13
- 239000004615 ingredient Substances 0.000 claims description 12
- 238000009795 derivation Methods 0.000 claims description 8
- 230000003203 everyday effect Effects 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 4
- 230000014759 maintenance of location Effects 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 3
- 230000000452 restraining effect Effects 0.000 claims description 3
- 238000007796 conventional method Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 45
- 238000004458 analytical method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 3
- 238000007418 data mining Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 206010033307 Overweight Diseases 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 235000020825 overweight Nutrition 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于联合矩阵分解模型的电力用户细分方法。其包括输入用户的用电记录数据并构建用户用电记录矩阵;输入用户地理位置信息并用层级表示,构建用户地理位置信息相似度矩阵,调节不同层级地理位置信息中不同组成部分权重;根据用户用电记录矩阵构建联合矩阵分解模型的目标函数,并选择合理的目标函数求解算法进行求解,以得到用户用电需求;根据用户用电需求对用户进行细分。本发明相比于传统方法,用户在需求空间中的表示具有更加丰富的涵义。采用聚类算法,在隐含需求空间中综合考虑用户本身的特性和用户间关系对用户进行聚类,每个簇中的用户的关联关系更加紧密。不同簇之间,用户在用电需求和地理位置等方面均存在较大差异。
Description
技术领域
本发明属于计算机应用技术,数据挖掘,电力数据分析技术领域,特别是涉及一种基于联合矩阵分解模型的电力用户细分方法。
背景技术
随着电网信息化水平的提高,电力***中产生了大量的数据,同时也给电力数据的分析带来了新的挑战。传统的电力数据分析侧重于对生产和供电环节中产生数据的研究,对用户数据的分析往往是针对所有用户的,从而忽略了用户本身的特点及用户之间的关联关系。用户数据中通常包含用户的用电行为、地理位置、时间、日期等信息,而目前的用户数据分析,比较普遍的作法是使用聚类算法根据用电记录对用户进行划分,缺少对其他信息的综合分析,而这些信息中往往包含影响用户用电行为的重要因素。
例如,王雷分析了电力行业客户行为特征,采用k-means算法根据用户的用电行为,对用户行为进行聚类。而吴玲等采用终身价值理论,通过广泛调研和专家咨询,构建了电力用户价值评估体系,并运用层次分析法来评估用户价值。宋才华等运用客户综合价值评估方法建立了客户细分模型,构建了基于客户综合价值的细分指标体系,运用熵权法和专家经验相结合的方式进行用户细分。有些研究人员从用户可靠性要求、用户价值和用户行为三个维度,建立细分指标体系,利用k-means算法对用户进行聚类。还有些研究人员通过构建电力大客户行为和价值评估指标体系,得到电力大客户的需求特征和经济价值评估,并设计大客户信用综合测评体系,实现对电力大客户较全面准确的精细化分类。
矩阵分解模型是近年来较为流行的多变量分析模型,因其在文本和图像等数据上具有良好的可解释性,在数据挖掘领域有着十分广泛的应用。矩阵分解模型将数据矩阵分解为隐藏特征矩阵和系数矩阵的乘积,得到原始输入数据在低维隐藏特征空间中的表示。Lee和Seung等人提出一种非负矩阵分解模型,通过对输入数据矩阵和输出隐藏特征矩阵以及系数矩阵采用非负约束,得到文本和图像的表示,并进行文本聚类和图像恢复。而Cai和He等人在此基础上,采用关系图来约束数据在隐含空间中的表示,提高了非负矩阵分解模型在文本聚类中的性能。而有些研究人员提出一种关系约束的矩阵分解模型,融合数据间关联关系和数据内容,抽取隐含特征,并在文本分类数据中取得良好效果。Takeuchi等人则将多个非负矩阵共同分解,融合用户记录、用户社交关系和歌曲标签,得到用户和歌曲在的统一表示,并进行歌曲推荐。
发明内容
为了解决上述问题,本发明的目的在于提供一种基于联合矩阵分解模型的电力用户细分方法。
为了达到上述目的,本发明提供的基于联合矩阵分解模型的电力用户细分方法包括按顺序执行的下列步骤:
步骤1)输入用户的用电记录数据,根据用电记录数据构建用户的用电记录矩阵;输入用户的地理位置信息,将用户的地理位置信息用层级表示,构建用户的地理位置信息相似度矩阵,并调节不同层级的地理位置信息中不同组成部分的权重;
步骤2)根据步骤1)获得的用户的用电记录矩阵构建联合矩阵分解模型的目标函数,分析影响用户用电行为的时间因素与日期因素,并选择合理的目标函数求解算法进行求解,以得到用户用电需求;
步骤3)根据上述用户用电需求对用户进行细分:
在用户细分过程中,需要计算两个基本指标:1)不同用户的用电需求矩阵的相似度的衡量指标,2)一个用户分组中,所有用户的整体用电需求矩阵的计算。
在步骤1)中,所述的输入用户的用电记录数据,根据用户的用电记录数据构建用电记录矩阵的方法为:
所输入的用户用电记录数据中的所有用户被表示为集合:
U={u1,u2,…,uN}
其中N表示数据中包含的用户个数,ui表示第i个用户。
第i个用户的用电记录数据被构建为用电记录矩阵:
其中D表示数据中用电记录包含的天数,T表示每个用户每天的用电记录包含的均匀采样点的个数,表示T行D列的非负实数矩阵。同时,用和分别表示矩阵Ui的第t行和第d列,即用户ui在每天第t个时间点上的所有用电记录和在第d天的用电记录,并用表示矩阵Ui的第t行第d列上的元素;
最终,输出所有用户的用电记录矩阵:
在步骤1)中,所述的输入用户的地理位置信息,将用户的地理位置信息用层级表示,构建用户的地理位置信息相似度矩阵,并调节不同层级的地理位置信息中不同组成部分的权重的方法为:
第i个用户的地理位置信息被表示为结构体:
其中为居住地点中某个组成部分的字符串表示,按行政单位,即省、城市、区县、乡镇、街道、小区等,从大到小的顺序排列;
第i个用户和第j个用户的地理位置信息相似度计算公式为:
其中eij表示两个用户地理位置信息的相似度值,δ(·,·)为逻辑函数,当两个字符串相同时取值1,否则为0,λk∈(0,1)为平衡参数,用于调节地理位置信息中不同组成部分的权重,通过***在验证数据集上的结果来调节平衡参数的选择;
最终,输出所有用户的地理位置信息相似度矩阵:
在步骤2)中,所述的构建用电记录矩阵联合分解的目标函数的方法为:
(1)最大可能地降低每个用户的用电记录矩阵在分解为时间因素矩阵和日期因素矩阵过程中的损失公式为:
minl1=||Ui-ViSi T||2
其中Vi表示影响第i个用户用电行为的时间因素矩阵,Si表示影响第i个用户用电行为的日期因素矩阵;
(2)保持不同用户的用电记录矩阵分解得到的日期因素矩阵的一致性:
在此,所有N个用户的分解目标函数被融合到一起,并共享日期因素矩阵;
(3)最大可能地降低在地理位置上相邻的用户的时间因素矩阵的差异:
(4)最大可能地保持时间因素矩阵的平滑:
(5)最大可能地保持日期因素矩阵的平滑:
minl5=||S||2
在此,采用矩阵的L2范式的平方||·||2来使矩阵保持平滑。
最终,通过融合步骤(2)、(3)、(4)、(5)中的各项目标函数得到联合矩阵分解模型的目标函数:
其中α、β和γ为平衡参数,用于调节各项目标函数之间的权重,可通过***在验证数据集上的结果来调节平衡参数的选择。
在步骤2)中,所述的选择合理的目标函数求解算法进行求解的方法包括如下步骤:
步骤2.1)初始化矩阵和的S2.1阶段:
K表示隐藏空间中用户需求变量的个数,矩阵V1,V2,…VN和S中的每个元素被随机初始化为0到1之间的实数;
步骤2.2)对矩阵Vi中每个元素进行求导的S2.2阶段:
根据最终目标函数对Vi中每个元素求导,具体公式为:
步骤2.3)对矩阵Vi中每个元素进行更新的S2.3阶段:
每个分别减去步长乘以梯度,具体的更新公式为η是人工设定的步长;
步骤2.4)判断所有Vi矩阵是否更新完毕的S2.4阶段:
若所有的矩阵Vi均更新完毕,则进行步骤2.5)阶段,否则返回步骤2.2)对下一个Vi进行更新;
步骤2.5)对矩阵S中每个元素进行求导的S2.5阶段:
根据最终目标函数对S中每个元素求导,具体公式为
步骤2.6)对矩阵S中每个元素进行更新的S2.6阶段:
每个分别减去步长乘以梯度,具体的更新公式为τ是人工设定的步长;
步骤2.7)判断算法是否收敛的S2.7阶段:
若算法收敛,则进行步骤2.8),否则返回步骤2.2);
步骤2.8)输出结果的S2.8阶段:
输出用户用电需求结果,本流程至此结束。
在步骤3)中,所述的两个基本指标的计算公式如下:
(1)不同用户的用电需求矩阵的相似度的衡量指标如下:
Sim(Vi,Vj)=tr(Vi,Vj T)/(||Vi||||Vj||)
其中tr(·,·)表示矩阵的对角线上元素的和,||·||表示矩阵的L2范式。
(2)一个用户分组c中,所有用户的整体用电需求矩阵的计算公式如下:
其中|c|表示分组c中包含用户的个数。
在步骤3)中,所述的用户细分方法如下:
步骤3.1)将用户随机划分为k个簇c1,c2,…,ck的S3.1阶段:
其中k表示人为设定的用户簇的个数;
步骤3.2)计算每个簇的整体表示的S3.2阶段:
采用上述在步骤3)中的步骤(2)中的公式来计算每个簇的整体表示;
步骤3.3)计算第i个用户与所有簇之间相似度的S3.3阶段:
采用上述在步骤3)中的步骤(1)中的公式,将每个簇的整体表示看作是一个特殊的“用户”,计算用户与簇之间的相似度;
步骤3.4)调整第i个用户的簇标签的S3.4阶段:
根据步骤3.3)中的结果,将第i个用户的簇标签调整为与之最相似的簇;
步骤3.5)判断所有用户是否调整完毕的S3.5阶段:
判断是否所有用户的簇标签均调整完毕,若是,进行步骤3.6),若否,返回步骤3.2);
步骤3.6)判断用户簇标签是否收敛的S3.6阶段:
判断上一轮用户簇标签调整中是否有用户的簇标签发生改变,若是,返回步骤3.2),若否,进行步骤3.7);
步骤3.7)输出结果的S3.7阶段:
输出所有用户簇标签结果,本流程至此结束。
本发明提供的基于联合矩阵分解模型的电力用户细分方法的效果:
本发明对用户的需求分析与表示,包含用户的用电行为、时间、日期和地理位置等信息信息,相比于传统方法,用户在需求空间中的表示具有更加丰富的涵义。
本发明采用聚类算法,在隐含需求空间中综合考虑用户本身的特性和用户间关系对用户进行聚类,每个簇中的用户的关联关系更加紧密。不同簇之间,用户在用电需求和地理位置等方面均存在较大差异。
附图说明
图1为本发明提供的基于联合矩阵分解模型的电力用户细分方法的整体***结构示意图。
图2是本发明提供的基于联合矩阵分解模型的电力用户细分方法流程图。
图3是本发明提供的基于联合矩阵分解模型的电力用户细分方法中联合矩阵分解模型求解方法流程图。
图4是本发明提供的基于联合矩阵分解模型的电力用户细分方法中用户细分方法流程图。
具体实施方式
下面结合附图和具体实施例对本发明提供的基于联合矩阵分解模型的电力用户细分方法进行详细说明。
如图1所示,本发明主要采用数据挖掘理论和方法对电力数据中的用户进行分析,为了保证***的正常运行,在具体实施中,要求所使用的计算机平台配备不低于8G的内存,CPU核心数不低于4个且主频不低于2.6GHz、Windows7及以上版本的64位操作***,并安装Oracle数据库、Java1.7及以上版本、Matlab2011b及以上版本等必备软件环境。
如图2所示,本发明提供的基于联合矩阵分解模型的电力用户细分方法包括按顺序执行的下列步骤:
步骤1)输入用户的用电记录数据,根据用电记录数据构建用户的用电记录矩阵;输入用户的地理位置信息,将用户的地理位置信息用层级表示,构建用户的地理位置信息相似度矩阵,并调节不同层级的地理位置信息中不同组成部分的权重;
用户的用电记录矩阵包含影响用户用电行为的两个重要因素:1)矩阵的行表示每天不同的用户数据采样时间点,2)矩阵的列表示用户记录数据中包含的每一天。
步骤2)根据步骤1)获得的用户的用电记录矩阵构建联合矩阵分解模型的目标函数,分析影响用户用电行为的时间因素与日期因素,并选择合理的目标函数求解算法进行求解,以得到用户用电需求;
所述的目标函数包括五个方面:1)最大可能地降低每个用户的用电记录矩阵在分解为时间因素矩阵和日期因素矩阵过程中的损失,2)保持不同用户的用电记录矩阵分解得到的日期因素矩阵的一致性;3)最大可能地降低在地理位置上相邻的用户的时间因素矩阵的差异;4)最大可能地保持时间因素矩阵和日期因素矩阵的平滑,5)保持目标函数的凸性,使模型具有全局最优解;求解算法应当满足三个基本条件:1)算法能够在可接受的时间内收敛,2)算法对存储空间的需求要控制在合理范围内,3)算法能够并行执行,以提高计算效率。
步骤3)根据上述用户用电需求对用户进行细分:
根据用户用电需求对用户进行细分应当满足两个基本条件:1)同一组中的用户应当具有相似的用电需求矩阵,2)不同组中的用户的用电需求矩阵应当尽可能不同;因此,为了提高用户细分结果的质量,在用户细分过程中,需要计算两个基本指标:1)不同用户的用电需求矩阵的相似度的衡量指标,2)一个用户分组中,所有用户的整体用电需求矩阵的计算;同时,算法应能够自行优化,对划分到错误的分组中的用户进行调整。
在步骤1)中,所述的输入用户的用电记录数据,根据用户的用电记录数据构建用电记录矩阵的方法为:
所输入的用户用电记录数据中的所有用户被表示为集合:
U={u1,u2,…,uN}
其中N表示数据中包含的用户个数,ui表示第i个用户。
第i个用户的用电记录数据被构建为用电记录矩阵:
其中D表示数据中用电记录包含的天数,T表示每个用户每天的用电记录包含的均匀采样点的个数,表示T行D列的非负实数矩阵。同时,用和分别表示矩阵Ui的第t行和第d列,即用户ui在每天第t个时间点上的所有用电记录和在第d天的用电记录,并用表示矩阵Ui的第t行第d列上的元素;
最终,输出所有用户的用电记录矩阵:
在步骤1)中,所述的输入用户的地理位置信息,将用户的地理位置信息用层级表示,构建用户的地理位置信息相似度矩阵,并调节不同层级的地理位置信息中不同组成部分的权重的方法为:
第i个用户的地理位置信息被表示为结构体:
其中为居住地点中某个组成部分的字符串表示,按行政单位,即省、城市、区县、乡镇、街道、小区等,从大到小的顺序排列;
第i个用户和第j个用户的地理位置信息相似度计算公式为:
其中eij表示两个用户地理位置信息的相似度值,δ(·,·)为逻辑函数,当两个字符串相同时取值1,否则为0,λk∈(0,1)为平衡参数,用于调节地理位置信息中不同组成部分的权重,通过***在验证数据集上的结果来调节平衡参数的选择;
最终,输出所有用户的地理位置信息相似度矩阵:
在步骤2)中,所述的构建用电记录矩阵联合分解的目标函数的方法为:
(1)最大可能地降低每个用户的用电记录矩阵在分解为时间因素矩阵和日期因素矩阵过程中的损失公式为:
minl1=||Ui-ViSi T||2
其中Vi表示影响第i个用户用电行为的时间因素矩阵,Si表示影响第i个用户用电行为的日期因素矩阵;
(2)保持不同用户的用电记录矩阵分解得到的日期因素矩阵的一致性:
在此,所有N个用户的分解目标函数被融合到一起,并共享日期因素矩阵;
(3)最大可能地降低在地理位置上相邻的用户的时间因素矩阵的差异:
(4)最大可能地保持时间因素矩阵的平滑:
(5)最大可能地保持日期因素矩阵的平滑:
minl5=||S||2
在此,采用矩阵的L2范式的平方||·||2来使矩阵保持平滑。
最终,通过融合步骤(2)、(3)、(4)、(5)中的各项目标函数得到联合矩阵分解模型的目标函数:
其中α、β和γ为平衡参数,用于调节各项目标函数之间的权重,可通过***在验证数据集上的结果来调节平衡参数的选择。
在步骤2)中,采用矩阵的L2范式的平方||·||2来衡量每一步中的损失和矩阵的平滑,可以保证最终的目标函数l的凸性,使模型具有全局最优解。对目标函数的凸性有如下简单证明方法:
证明1:目标函数l是Vi的凸函数。
首先将目标函数改写为:
其中C1是与Vi无关的常数。令l=f1+αf2+γf3+C1,其中:
以下分别证明f1、f2、f3是Vi的凸函数。
(1) 其中C2是与Vi无关的常数。对Vi的每一行求导,可得以及 用 表示将Vi按行扩展成的高维行向量,则f1对vi的海森矩阵是一个块对角矩阵又因为, 对任意T维非零向量z均成立,则有det(Gt)≥0,det(·)表示矩阵的行列式。因此,f1是Vi的凸函数。
(2)采用上述步骤(1)中的vi,可得所以f2是Vi的凸函数。
(3)令C2是与Vi无关的常数。由证明1中的步骤(2)可知,是Vi的凸函数。又且eij≥0,所以f3是Vi的凸函数。
综上,且有α,γ≥0,目标函数l是Vi的凸函数,证毕。
证明2:目标函数l是S的凸函数。
同样,首先将目标函数改写为:
C1是与S无关的常数。令其中:
C2是与S无关的常数。与定理1的证明类似,用表示将S按行扩展成的高维行向量,可得fi对S的海森矩阵是一个块对角矩阵 其中 则fi是S的凸函数。又||S||2是S的凸函数,且β≥0,目标函数l是S的凸函数,证毕。
在步骤2)中,目标函数l同时是Vi和S的凸函数,为了提高算法的求解速率,并降低算法对存储空间的需求,采用基于梯度下降的迭代更新来求解Vi和S,如图3所示,所述的选择合理的目标函数求解算法进行求解的方法包括如下步骤:
步骤2.1)初始化矩阵和的S2.1阶段:
K表示隐藏空间中用户需求变量的个数,矩阵V1,V2,…VN和S中的每个元素被随机初始化为0到1之间的实数;
步骤2.2)对矩阵Vi中每个元素进行求导的S2.2阶段:
根据最终目标函数对Vi中每个元素求导,具体公式为:
步骤2.3)对矩阵Vi中每个元素进行更新的S2.3阶段:
每个分别减去步长乘以梯度,具体的更新公式为η是人工设定的步长;
步骤2.4)判断所有Vi矩阵是否更新完毕的S2.4阶段:
若所有的矩阵Vi均更新完毕,则进行步骤2.5)阶段,否则返回步骤2.2)对下一个Vi进行更新;
步骤2.5)对矩阵S中每个元素进行求导的S2.5阶段:
根据最终目标函数对S中每个元素求导,具体公式为
步骤2.6)对矩阵S中每个元素进行更新的S2.6阶段:
每个分别减去步长乘以梯度,具体的更新公式为τ是人工设定的步长;
步骤2.7)判断算法是否收敛的S2.7阶段:
若算法收敛,则进行步骤2.8),否则返回步骤2.2);
步骤2.8)输出结果的S2.8阶段:
输出用户用电需求结果,本流程至此结束。
在步骤3)中,所述的两个基本指标的计算公式如下:
(1)不同用户的用电需求矩阵的相似度的衡量指标如下:
Sim(Vi,Vj)=tr(Vi,Vj T)/(||Vi||||Vj||)
其中tr(·,·)表示矩阵的对角线上元素的和,||·||表示矩阵的L2范式。
(2)一个用户分组c中,所有用户的整体用电需求矩阵的计算公式如下:
其中|c|表示分组c中包含用户的个数。
如图4所示,在步骤3)中,所述的用户细分方法如下:
步骤3.1)将用户随机划分为k个簇c1,c2,…,ck的S3.1阶段:
其中k表示人为设定的用户簇的个数;
步骤3.2)计算每个簇的整体表示的S3.2阶段:
采用上述在步骤3)中的步骤(2)中的公式来计算每个簇的整体表示;
步骤3.3)计算第i个用户与所有簇之间相似度的S3.3阶段:
采用上述在步骤3)中的步骤(1)中的公式,将每个簇的整体表示看作是一个特殊的“用户”,计算用户与簇之间的相似度;
步骤3.4)调整第i个用户的簇标签的S3.4阶段:
根据步骤3.3)中的结果,将第i个用户的簇标签调整为与之最相似的簇;
步骤3.5)判断所有用户是否调整完毕的S3.5阶段:
判断是否所有用户的簇标签均调整完毕,若是,进行步骤3.6),若否,返回步骤3.2);
步骤3.6)判断用户簇标签是否收敛的S3.6阶段:
判断上一轮用户簇标签调整中是否有用户的簇标签发生改变,若是,返回步骤3.2),若否,进行步骤3.7);
步骤3.7)输出结果的S3.7阶段:
输出所有用户簇标签结果,本流程至此结束。
本发明采用电力数据中的用户用电记录数据和用户的居住位置信息,为每个用户分别构建用电记录矩阵,并基于结构化对比算法来计算用户地理位置信息的相似度。采用联合矩阵分解模型对用户的用电需求进行建模,分析影响用户用电行为的时间因素与日期因素。然后,根据用户的地理位置相似度,进一步融合地理位置信息,使用户在隐含需求空间中的表示同时包含用电需求信息和地理位置信息。最后,采用聚类算法,根据用户在隐含需求空间中的表示,对用户进行细分,形式化地展现用电行为和居住地点上的关联关系,对电力部门理解用户需求和用户间关系,调整电力生产、维护用电设施等日常管理活动有着重要的参考价值。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。
Claims (7)
1.一种基于联合矩阵分解模型的电力用户细分方法,其特征在于:所述的基于联合矩阵分解模型的电力用户细分方法包括按顺序执行的下列步骤:
步骤1)输入用户的用电记录数据,根据用电记录数据构建用户的用电记录矩阵;输入用户的地理位置信息,将用户的地理位置信息用层级表示,构建用户的地理位置信息相似度矩阵,并调节不同层级的地理位置信息中不同组成部分的权重;
步骤2)根据步骤1)获得的用户的用电记录矩阵构建联合矩阵分解模型的目标函数,分析影响用户用电行为的时间因素与日期因素,并选择合理的目标函数求解算法进行求解,以得到用户用电需求;
步骤3)根据上述用户用电需求对用户进行细分:
在用户细分过程中,需要计算两个基本指标:1)不同用户的用电需求矩阵的相似度的衡量指标,2)一个用户分组中,所有用户的整体用电需求矩阵的计算。
2.根据权利要求1所述的基于联合矩阵分解模型的电力用户细分方法,其特征在于:在步骤1)中,所述的输入用户的用电记录数据,根据用户的用电记录数据构建用电记录矩阵的方法为:
所输入的用户用电记录数据中的所有用户被表示为集合:
U={u1,u2,…,uN}
其中N表示数据中包含的用户个数,ui表示第i个用户;
第i个用户的用电记录数据被构建为用电记录矩阵:
其中D表示数据中用电记录包含的天数,T表示每个用户每天的用电记录包含的均匀采样点的个数,表示T行D列的非负实数矩阵;同时,用和分别表示矩阵Ui的第t行和第d列,即用户ui在每天第t个时间点上的所有用电记录和在第d天的用电记录,并用表示矩阵Ui的第t行第d列上的元素;
最终,输出所有用户的用电记录矩阵:
3.根据权利要求1所述的基于联合矩阵分解模型的电力用户细分方法,其特征在于:在步骤1)中,所述的输入用户的地理位置信息,将用户的地理位置信息用层级表示,构建用户的地理位置信息相似度矩阵,并调节不同层级的地理位置信息中不同组成部分的权重的方法为:
第i个用户的地理位置信息被表示为结构体:
其中为居住地点中某个组成部分的字符串表示,按行政单位,即省、城市、区县、乡镇、街道、小区等,从大到小的顺序排列;
第i个用户和第j个用户的地理位置信息相似度计算公式为:
其中eij表示两个用户地理位置信息的相似度值,δ(·,·)为逻辑函数,当两个字符串相同时取值1,否则为0,λk∈(0,1)为平衡参数,用于调节地理位置信息中不同组成部分的权重,通过***在验证数据集上的结果来调节平衡参数的选择;
最终,输出所有用户的地理位置信息相似度矩阵:
4.根据权利要求1所述的基于联合矩阵分解模型的电力用户细分方法,其特征在于:在步骤2)中,所述的构建用电记录矩阵联合分解的目标函数的方法为:
(1)最大可能地降低每个用户的用电记录矩阵在分解为时间因素矩阵和日期因素矩阵过程中的损失公式为:
其中Vi表示影响第i个用户用电行为的时间因素矩阵,Si表示影响第i个用户用电行为的日期因素矩阵;
(2)保持不同用户的用电记录矩阵分解得到的日期因素矩阵的一致性:
在此,所有N个用户的分解目标函数被融合到一起,并共享日期因素矩阵;
(3)最大可能地降低在地理位置上相邻的用户的时间因素矩阵的差异:
(4)最大可能地保持时间因素矩阵的平滑:
(5)最大可能地保持日期因素矩阵的平滑:
minl5=||S||2
在此,采用矩阵的L2范式的平方||·||2来使矩阵保持平滑。
最终,通过融合步骤(2)、(3)、(4)、(5)中的各项目标函数得到联合矩阵分解模型的目标函数:
其中α、β和γ为平衡参数,用于调节各项目标函数之间的权重,可通过***在验证数据集上的结果来调节平衡参数的选择。
5.根据权利要求1所述的基于联合矩阵分解模型的电力用户细分方法,其特征在于:在步骤2)中,所述的选择合理的目标函数求解算法进行求解的方法包括如下步骤:
步骤2.1)初始化矩阵和的S2.1阶段:
K表示隐藏空间中用户需求变量的个数,矩阵V1,V2,…VN和S中的每个元素被随机初始化为0到1之间的实数;
步骤2.2)对矩阵Vi中每个元素进行求导的S2.2阶段:
根据最终目标函数对Vi中每个元素求导,具体公式为:
步骤2.3)对矩阵Vi中每个元素进行更新的S2.3阶段:
每个分别减去步长乘以梯度,具体的更新公式为η是人工设定的步长;
步骤2.4)判断所有Vi矩阵是否更新完毕的S2.4阶段:
若所有的矩阵Vi均更新完毕,则进行步骤2.5)阶段,否则返回步骤2.2)对下一个Vi进行更新;
步骤2.5)对矩阵S中每个元素进行求导的S2.5阶段:
根据最终目标函数对S中每个元素求导,具体公式为
步骤2.6)对矩阵S中每个元素进行更新的S2.6阶段:
每个分别减去步长乘以梯度,具体的更新公式为τ是人工设定的步长;
步骤2.7)判断算法是否收敛的S2.7阶段:
若算法收敛,则进行步骤2.8),否则返回步骤2.2);
步骤2.8)输出结果的S2.8阶段:
输出用户用电需求结果,本流程至此结束。
6.根据权利要求1所述的基于联合矩阵分解模型的电力用户细分方法,其特征在于:在步骤3)中,所述的两个基本指标的计算公式如下:
(1)不同用户的用电需求矩阵的相似度的衡量指标如下:
Sim(Vi,Vj)=tr(Vi,Vj T)/(||Vi||||Vj||)
其中tr(·,·)表示矩阵的对角线上元素的和,||·||表示矩阵的L2范式;
(2)一个用户分组c中,所有用户的整体用电需求矩阵的计算公式如下:
其中|c|表示分组c中包含用户的个数。
7.根据权利要求1所述的基于联合矩阵分解模型的电力用户细分方法,其特征在于:在步骤3)中,所述的用户细分方法如下:
步骤3.1)将用户随机划分为k个簇c1,c2,…,ck的S3.1阶段:
其中k表示人为设定的用户簇的个数;
步骤3.2)计算每个簇的整体表示的S3.2阶段:
采用上述在步骤3)中的步骤(2)中的公式来计算每个簇的整体表示;
步骤3.3)计算第i个用户与所有簇之间相似度的S3.3阶段:
采用上述在步骤3)中的步骤(1)中的公式,将每个簇的整体表示看作是一个特殊的“用户”,计算用户与簇之间的相似度;
步骤3.4)调整第i个用户的簇标签的S3.4阶段:
根据步骤3.3)中的结果,将第i个用户的簇标签调整为与之最相似的簇;
步骤3.5)判断所有用户是否调整完毕的S3.5阶段:
判断是否所有用户的簇标签均调整完毕,若是,进行步骤3.6),若否,返回步骤3.2);
步骤3.6)判断用户簇标签是否收敛的S3.6阶段:
判断上一轮用户簇标签调整中是否有用户的簇标签发生改变,若是,返回步骤3.2),若否,进行步骤3.7);
步骤3.7)输出结果的S3.7阶段:
输出所有用户簇标签结果,本流程至此结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510801889.8A CN105447767A (zh) | 2015-11-19 | 2015-11-19 | 一种基于联合矩阵分解模型的电力用户细分方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510801889.8A CN105447767A (zh) | 2015-11-19 | 2015-11-19 | 一种基于联合矩阵分解模型的电力用户细分方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105447767A true CN105447767A (zh) | 2016-03-30 |
Family
ID=55557901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510801889.8A Pending CN105447767A (zh) | 2015-11-19 | 2015-11-19 | 一种基于联合矩阵分解模型的电力用户细分方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105447767A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108021538A (zh) * | 2017-11-15 | 2018-05-11 | 国网甘肃省电力公司信息通信公司 | 一种基于联合天气信息矩阵分解的电量数据恢复方法 |
CN108734216A (zh) * | 2018-05-22 | 2018-11-02 | 广东工业大学 | 基于负荷曲线形态的电力用户分类方法、装置及存储介质 |
CN109740790A (zh) * | 2018-11-28 | 2019-05-10 | 国网天津市电力公司 | 一种基于时序特征提取的用户用电量预测方法 |
CN116805785A (zh) * | 2023-08-17 | 2023-09-26 | 国网浙江省电力有限公司金华供电公司 | 基于随机聚类的电力负荷层次时间序列预测方法 |
-
2015
- 2015-11-19 CN CN201510801889.8A patent/CN105447767A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108021538A (zh) * | 2017-11-15 | 2018-05-11 | 国网甘肃省电力公司信息通信公司 | 一种基于联合天气信息矩阵分解的电量数据恢复方法 |
CN108021538B (zh) * | 2017-11-15 | 2021-06-04 | 国网甘肃省电力公司信息通信公司 | 一种基于联合天气信息矩阵分解的电量数据恢复方法 |
CN108734216A (zh) * | 2018-05-22 | 2018-11-02 | 广东工业大学 | 基于负荷曲线形态的电力用户分类方法、装置及存储介质 |
CN109740790A (zh) * | 2018-11-28 | 2019-05-10 | 国网天津市电力公司 | 一种基于时序特征提取的用户用电量预测方法 |
CN116805785A (zh) * | 2023-08-17 | 2023-09-26 | 国网浙江省电力有限公司金华供电公司 | 基于随机聚类的电力负荷层次时间序列预测方法 |
CN116805785B (zh) * | 2023-08-17 | 2023-11-28 | 国网浙江省电力有限公司金华供电公司 | 基于随机聚类的电力负荷层次时间序列预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Domínguez-Muñoz et al. | Selection of typical demand days for CHP optimization | |
CN108446794A (zh) | 一种基于多个卷积神经网络结合架构深度学习预测方法 | |
CN104951425A (zh) | 一种基于深度学习的云服务性能自适应动作类型选择方法 | |
CN106952027A (zh) | 一种10kV配电网线路规划接入容量计算方法 | |
CN105447767A (zh) | 一种基于联合矩阵分解模型的电力用户细分方法 | |
CN104376502A (zh) | 基于灰色关联度的电力客户信用综合评价方法 | |
CN109117872A (zh) | 一种基于自动最优聚类算法的用户用电行为分析方法 | |
CN108960488A (zh) | 一种基于深度学习与多源信息融合的饱和负荷空间分布精准预测方法 | |
CN105335800A (zh) | 一种基于联合学习的电力用户用电量预测方法 | |
CN112614011A (zh) | 电力配网物资需求预测方法和装置、存储介质及电子设备 | |
CN104636834B (zh) | 一种改进的联合概率规划模型***优化方法 | |
CN109409561A (zh) | 多时间尺度时间序列协同预测模型的构建方法 | |
CN109657846A (zh) | 电网交叉补贴规模影响因子筛选方法 | |
CN113591368A (zh) | 一种综合能源***多能负荷预测方法及*** | |
CN111027741A (zh) | 一种面向时空维度的通用化负荷模型分析库构建方法 | |
Zhao et al. | Short-term microgrid load probability density forecasting method based on k-means-deep learning quantile regression | |
CN116701965A (zh) | 一种基于birch聚类算法的企业用户全景碳画像方法 | |
CN115329899A (zh) | 一种聚类等效模型构建方法、***、设备和存储介质 | |
CN101807218B (zh) | 基于异构网络的土地格局演替仿真*** | |
Guan et al. | Customer load forecasting method based on the industry electricity consumption behavior portrait | |
CN116596574A (zh) | 电网用户画像构建方法及*** | |
CN114839586B (zh) | 基于em算法的低压台区计量装置失准计算方法 | |
Wang et al. | A Novel Multi‐Input AlexNet Prediction Model for Oil and Gas Production | |
CN108615091A (zh) | 基于聚类筛选和神经网络的电力气象负荷数据预测方法 | |
CN115130924A (zh) | 一种源网荷储背景下微电网电力设备资产评估方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160330 |
|
RJ01 | Rejection of invention patent application after publication |