CN105447767A

CN105447767A - 一种基于联合矩阵分解模型的电力用户细分方法

Info

Publication number: CN105447767A
Application number: CN201510801889.8A
Authority: CN
Inventors: 王扬; 刘杰; 吴凡; 章斌; 魏睐; 杨得博; 梅振鹏; 郎赫
Original assignee: State Grid Corp of China SGCC; State Grid Tianjin Electric Power Co Ltd
Current assignee: State Grid Corp of China SGCC; State Grid Tianjin Electric Power Co Ltd
Priority date: 2015-11-19
Filing date: 2015-11-19
Publication date: 2016-03-30

Abstract

一种基于联合矩阵分解模型的电力用户细分方法。其包括输入用户的用电记录数据并构建用户用电记录矩阵；输入用户地理位置信息并用层级表示，构建用户地理位置信息相似度矩阵，调节不同层级地理位置信息中不同组成部分权重；根据用户用电记录矩阵构建联合矩阵分解模型的目标函数，并选择合理的目标函数求解算法进行求解，以得到用户用电需求；根据用户用电需求对用户进行细分。本发明相比于传统方法，用户在需求空间中的表示具有更加丰富的涵义。采用聚类算法，在隐含需求空间中综合考虑用户本身的特性和用户间关系对用户进行聚类，每个簇中的用户的关联关系更加紧密。不同簇之间，用户在用电需求和地理位置等方面均存在较大差异。

Description

一种基于联合矩阵分解模型的电力用户细分方法

技术领域

本发明属于计算机应用技术，数据挖掘，电力数据分析技术领域，特别是涉及一种基于联合矩阵分解模型的电力用户细分方法。

背景技术

随着电网信息化水平的提高，电力***中产生了大量的数据，同时也给电力数据的分析带来了新的挑战。传统的电力数据分析侧重于对生产和供电环节中产生数据的研究，对用户数据的分析往往是针对所有用户的，从而忽略了用户本身的特点及用户之间的关联关系。用户数据中通常包含用户的用电行为、地理位置、时间、日期等信息，而目前的用户数据分析，比较普遍的作法是使用聚类算法根据用电记录对用户进行划分，缺少对其他信息的综合分析，而这些信息中往往包含影响用户用电行为的重要因素。

例如，王雷分析了电力行业客户行为特征，采用k-means算法根据用户的用电行为，对用户行为进行聚类。而吴玲等采用终身价值理论，通过广泛调研和专家咨询，构建了电力用户价值评估体系，并运用层次分析法来评估用户价值。宋才华等运用客户综合价值评估方法建立了客户细分模型，构建了基于客户综合价值的细分指标体系，运用熵权法和专家经验相结合的方式进行用户细分。有些研究人员从用户可靠性要求、用户价值和用户行为三个维度，建立细分指标体系，利用k-means算法对用户进行聚类。还有些研究人员通过构建电力大客户行为和价值评估指标体系，得到电力大客户的需求特征和经济价值评估，并设计大客户信用综合测评体系，实现对电力大客户较全面准确的精细化分类。

矩阵分解模型是近年来较为流行的多变量分析模型，因其在文本和图像等数据上具有良好的可解释性，在数据挖掘领域有着十分广泛的应用。矩阵分解模型将数据矩阵分解为隐藏特征矩阵和系数矩阵的乘积，得到原始输入数据在低维隐藏特征空间中的表示。Lee和Seung等人提出一种非负矩阵分解模型，通过对输入数据矩阵和输出隐藏特征矩阵以及系数矩阵采用非负约束，得到文本和图像的表示，并进行文本聚类和图像恢复。而Cai和He等人在此基础上，采用关系图来约束数据在隐含空间中的表示，提高了非负矩阵分解模型在文本聚类中的性能。而有些研究人员提出一种关系约束的矩阵分解模型，融合数据间关联关系和数据内容，抽取隐含特征，并在文本分类数据中取得良好效果。Takeuchi等人则将多个非负矩阵共同分解，融合用户记录、用户社交关系和歌曲标签，得到用户和歌曲在的统一表示，并进行歌曲推荐。

发明内容

为了解决上述问题，本发明的目的在于提供一种基于联合矩阵分解模型的电力用户细分方法。

为了达到上述目的，本发明提供的基于联合矩阵分解模型的电力用户细分方法包括按顺序执行的下列步骤：

步骤1)输入用户的用电记录数据，根据用电记录数据构建用户的用电记录矩阵；输入用户的地理位置信息，将用户的地理位置信息用层级表示，构建用户的地理位置信息相似度矩阵，并调节不同层级的地理位置信息中不同组成部分的权重；

步骤2)根据步骤1)获得的用户的用电记录矩阵构建联合矩阵分解模型的目标函数，分析影响用户用电行为的时间因素与日期因素，并选择合理的目标函数求解算法进行求解，以得到用户用电需求；

步骤3)根据上述用户用电需求对用户进行细分：

在用户细分过程中，需要计算两个基本指标：1)不同用户的用电需求矩阵的相似度的衡量指标，2)一个用户分组中，所有用户的整体用电需求矩阵的计算。

在步骤1)中，所述的输入用户的用电记录数据，根据用户的用电记录数据构建用电记录矩阵的方法为：

所输入的用户用电记录数据中的所有用户被表示为集合：

U＝{u₁,u₂,…,u_N}

其中N表示数据中包含的用户个数,u_i表示第i个用户。

第i个用户的用电记录数据被构建为用电记录矩阵：

其中D表示数据中用电记录包含的天数，T表示每个用户每天的用电记录包含的均匀采样点的个数，表示T行D列的非负实数矩阵。同时，用和分别表示矩阵U_i的第t行和第d列，即用户u_i在每天第t个时间点上的所有用电记录和在第d天的用电记录，并用表示矩阵U_i的第t行第d列上的元素；

最终，输出所有用户的用电记录矩阵：

在步骤1)中，所述的输入用户的地理位置信息，将用户的地理位置信息用层级表示，构建用户的地理位置信息相似度矩阵，并调节不同层级的地理位置信息中不同组成部分的权重的方法为：

第i个用户的地理位置信息被表示为结构体：

g_{i} = {g_{i}^{1}, g_{i}^{2}, ..., g_{i}^{n}}

其中为居住地点中某个组成部分的字符串表示，按行政单位，即省、城市、区县、乡镇、街道、小区等，从大到小的顺序排列；

第i个用户和第j个用户的地理位置信息相似度计算公式为：

e^{i j} = Σ_{k = 1}^{n} λ_{k} Π_{m = 1}^{k} δ (g_{i}^{k}, g_{j}^{k}) / Σ_{k = 1}^{n} λ_{k}

其中e^ij表示两个用户地理位置信息的相似度值，δ(·,·)为逻辑函数，当两个字符串相同时取值1，否则为0，λ_k∈(0,1)为平衡参数，用于调节地理位置信息中不同组成部分的权重，通过***在验证数据集上的结果来调节平衡参数的选择；

最终，输出所有用户的地理位置信息相似度矩阵：

在步骤2)中，所述的构建用电记录矩阵联合分解的目标函数的方法为：

(1)最大可能地降低每个用户的用电记录矩阵在分解为时间因素矩阵和日期因素矩阵过程中的损失公式为：

minl₁＝||U_i-V_iS_i ^T||²

其中V_i表示影响第i个用户用电行为的时间因素矩阵，S_i表示影响第i个用户用电行为的日期因素矩阵；

(2)保持不同用户的用电记录矩阵分解得到的日期因素矩阵的一致性：

\min l_{2} = Σ_{i = 1}^{N} | | U_{i} - V_{i} S^{T} | |^{2}

在此，所有N个用户的分解目标函数被融合到一起，并共享日期因素矩阵；

(3)最大可能地降低在地理位置上相邻的用户的时间因素矩阵的差异：

\min l_{3} = Σ_{i = 1}^{N} Σ_{j = 1}^{N} e^{i j} | | V_{i} - V_{j} | |^{2}

(4)最大可能地保持时间因素矩阵的平滑：

\min l_{4} = Σ_{i = 1}^{N} | | V_{i} | |^{2}

(5)最大可能地保持日期因素矩阵的平滑：

minl₅＝||S||²

在此，采用矩阵的L₂范式的平方||·||²来使矩阵保持平滑。

最终，通过融合步骤(2)、(3)、(4)、(5)中的各项目标函数得到联合矩阵分解模型的目标函数：

\min l = \frac{1}{2} Σ_{i = 1}^{N} | | U_{i} - V_{i} S^{T} | |^{2} + \frac{α}{2} Σ_{i = 1}^{N} | | V_{i} | |^{2} + \frac{β}{2} | | S | |^{2} + \frac{γ}{2} Σ_{i = 1}^{N} Σ_{j = 1}^{N} e^{i j} | | V_{i} - V_{j} | |^{2}

其中α、β和γ为平衡参数，用于调节各项目标函数之间的权重，可通过***在验证数据集上的结果来调节平衡参数的选择。

在步骤2)中，所述的选择合理的目标函数求解算法进行求解的方法包括如下步骤：

步骤2.1)初始化矩阵和的S2.1阶段：

K表示隐藏空间中用户需求变量的个数，矩阵V₁,V₂,…V_N和S中的每个元素被随机初始化为0到1之间的实数；

步骤2.2)对矩阵V_i中每个元素进行求导的S2.2阶段：

根据最终目标函数对V_i中每个元素求导，具体公式为：

\partial l / \partial v_{i}^{t k} = (V_{i}^{t *} S^{T} - U_{i}^{t *}) S^{* k} + (α + {γΣ}_{j = 1, j &NotEqual; i}^{T} e^{i j}) v_{i}^{t k} - {γΣ}_{j = 1, j &NotEqual; i}^{T} e^{i j} v_{j}^{t k};

步骤2.3)对矩阵V_i中每个元素进行更新的S2.3阶段：

每个分别减去步长乘以梯度，具体的更新公式为η是人工设定的步长；

步骤2.4)判断所有V_i矩阵是否更新完毕的S2.4阶段：

若所有的矩阵V_i均更新完毕，则进行步骤2.5)阶段，否则返回步骤2.2)对下一个V_i进行更新；

步骤2.5)对矩阵S中每个元素进行求导的S2.5阶段：

根据最终目标函数对S中每个元素求导，具体公式为

\partial l / \partial s^{d k} = Σ_{i = 1}^{N} {(V_{i}^{* k})}^{T} [V {(S^{d *})}^{T} - U_{i}^{* d}] + {βs}^{d k};

步骤2.6)对矩阵S中每个元素进行更新的S2.6阶段：

每个分别减去步长乘以梯度，具体的更新公式为τ是人工设定的步长；

步骤2.7)判断算法是否收敛的S2.7阶段：

若算法收敛，则进行步骤2.8)，否则返回步骤2.2)；

步骤2.8)输出结果的S2.8阶段：

输出用户用电需求结果，本流程至此结束。

在步骤3)中，所述的两个基本指标的计算公式如下：

(1)不同用户的用电需求矩阵的相似度的衡量指标如下：

Sim(V_i,V_j)＝tr(V_i,V_j ^T)/(||V_i||||V_j||)

其中tr(·,·)表示矩阵的对角线上元素的和，||·||表示矩阵的L₂范式。

(2)一个用户分组c中，所有用户的整体用电需求矩阵的计算公式如下：

C e n t e r (c) = Σ_{u_{i} &Element; c} V_{i} / | c |

其中|c|表示分组c中包含用户的个数。

在步骤3)中，所述的用户细分方法如下：

步骤3.1)将用户随机划分为k个簇c₁,c₂,…,c_k的S3.1阶段：

其中k表示人为设定的用户簇的个数；

步骤3.2)计算每个簇的整体表示的S3.2阶段：

采用上述在步骤3)中的步骤(2)中的公式来计算每个簇的整体表示；

步骤3.3)计算第i个用户与所有簇之间相似度的S3.3阶段：

采用上述在步骤3)中的步骤(1)中的公式，将每个簇的整体表示看作是一个特殊的“用户”，计算用户与簇之间的相似度；

步骤3.4)调整第i个用户的簇标签的S3.4阶段：

根据步骤3.3)中的结果，将第i个用户的簇标签调整为与之最相似的簇；

步骤3.5)判断所有用户是否调整完毕的S3.5阶段：

判断是否所有用户的簇标签均调整完毕，若是，进行步骤3.6)，若否，返回步骤3.2)；

步骤3.6)判断用户簇标签是否收敛的S3.6阶段：

判断上一轮用户簇标签调整中是否有用户的簇标签发生改变，若是，返回步骤3.2)，若否，进行步骤3.7)；

步骤3.7)输出结果的S3.7阶段：

输出所有用户簇标签结果，本流程至此结束。

本发明提供的基于联合矩阵分解模型的电力用户细分方法的效果：

本发明对用户的需求分析与表示，包含用户的用电行为、时间、日期和地理位置等信息信息，相比于传统方法，用户在需求空间中的表示具有更加丰富的涵义。

本发明采用聚类算法，在隐含需求空间中综合考虑用户本身的特性和用户间关系对用户进行聚类，每个簇中的用户的关联关系更加紧密。不同簇之间，用户在用电需求和地理位置等方面均存在较大差异。

附图说明

图1为本发明提供的基于联合矩阵分解模型的电力用户细分方法的整体***结构示意图。

图2是本发明提供的基于联合矩阵分解模型的电力用户细分方法流程图。

图3是本发明提供的基于联合矩阵分解模型的电力用户细分方法中联合矩阵分解模型求解方法流程图。

图4是本发明提供的基于联合矩阵分解模型的电力用户细分方法中用户细分方法流程图。

具体实施方式

下面结合附图和具体实施例对本发明提供的基于联合矩阵分解模型的电力用户细分方法进行详细说明。

如图1所示，本发明主要采用数据挖掘理论和方法对电力数据中的用户进行分析，为了保证***的正常运行，在具体实施中，要求所使用的计算机平台配备不低于8G的内存，CPU核心数不低于4个且主频不低于2.6GHz、Windows7及以上版本的64位操作***，并安装Oracle数据库、Java1.7及以上版本、Matlab2011b及以上版本等必备软件环境。

如图2所示，本发明提供的基于联合矩阵分解模型的电力用户细分方法包括按顺序执行的下列步骤：

用户的用电记录矩阵包含影响用户用电行为的两个重要因素：1)矩阵的行表示每天不同的用户数据采样时间点，2)矩阵的列表示用户记录数据中包含的每一天。

所述的目标函数包括五个方面：1)最大可能地降低每个用户的用电记录矩阵在分解为时间因素矩阵和日期因素矩阵过程中的损失，2)保持不同用户的用电记录矩阵分解得到的日期因素矩阵的一致性；3)最大可能地降低在地理位置上相邻的用户的时间因素矩阵的差异；4)最大可能地保持时间因素矩阵和日期因素矩阵的平滑，5)保持目标函数的凸性，使模型具有全局最优解；求解算法应当满足三个基本条件：1)算法能够在可接受的时间内收敛，2)算法对存储空间的需求要控制在合理范围内，3)算法能够并行执行，以提高计算效率。

步骤3)根据上述用户用电需求对用户进行细分：

根据用户用电需求对用户进行细分应当满足两个基本条件：1)同一组中的用户应当具有相似的用电需求矩阵，2)不同组中的用户的用电需求矩阵应当尽可能不同；因此，为了提高用户细分结果的质量，在用户细分过程中，需要计算两个基本指标：1)不同用户的用电需求矩阵的相似度的衡量指标，2)一个用户分组中，所有用户的整体用电需求矩阵的计算；同时，算法应能够自行优化，对划分到错误的分组中的用户进行调整。

所输入的用户用电记录数据中的所有用户被表示为集合：

U＝{u₁,u₂,…,u_N}

其中N表示数据中包含的用户个数,u_i表示第i个用户。

第i个用户的用电记录数据被构建为用电记录矩阵：

最终，输出所有用户的用电记录矩阵：

第i个用户的地理位置信息被表示为结构体：

g_{i} = {g_{i}^{1}, g_{i}^{2}, ..., g_{i}^{n}}

第i个用户和第j个用户的地理位置信息相似度计算公式为：

e^{i j} = Σ_{k = 1}^{n} λ_{k} Π_{m = 1}^{k} δ (g_{i}^{k}, g_{j}^{k}) / Σ_{k = 1}^{n} λ_{k}

最终，输出所有用户的地理位置信息相似度矩阵：

minl₁＝||U_i-V_iS_i ^T||²

\min l_{2} = Σ_{i = 1}^{N} | | U_{i} - V_{i} S^{T} | |^{2}

\min l_{3} = Σ_{i = 1}^{N} Σ_{j = 1}^{N} e^{i j} | | V_{i} - V_{j} | |^{2}

(4)最大可能地保持时间因素矩阵的平滑：

\min l_{4} = Σ_{i = 1}^{N} | | V_{i} | |^{2}

(5)最大可能地保持日期因素矩阵的平滑：

minl₅＝||S||²

在此，采用矩阵的L₂范式的平方||·||²来使矩阵保持平滑。

\min l = \frac{1}{2} Σ_{i = 1}^{N} | | U_{i} - V_{i} S^{T} | |^{2} + \frac{α}{2} Σ_{i = 1}^{N} | | V_{i} | |^{2} + \frac{β}{2} | | S | |^{2} + \frac{γ}{2} Σ_{i = 1}^{N} Σ_{j = 1}^{N} e^{i j} | | V_{i} - V_{j} | |^{2}

在步骤2)中，采用矩阵的L₂范式的平方||·||²来衡量每一步中的损失和矩阵的平滑，可以保证最终的目标函数l的凸性，使模型具有全局最优解。对目标函数的凸性有如下简单证明方法：

证明1：目标函数l是V_i的凸函数。

首先将目标函数改写为：

l = \frac{1}{2} | | U_{i} - V_{i} S^{T} | |^{2} + \frac{α}{2} | | V_{i} | |^{2} + \frac{γ}{2} Σ_{j = 1, j &NotEqual; i}^{N} e^{i j} | | V_{i} - V_{j} | |^{2} + C_{1}

其中C₁是与V_i无关的常数。令l＝f₁+αf₂+γf₃+C₁，其中：

f_{1} = \frac{1}{2} | | U_{i} - V_{i} S^{T} | |^{2}, f_{2} = \frac{1}{2} | | V_{i} | |^{2}, f_{3} = \frac{1}{2} Σ_{j = 1, j &NotEqual; i}^{N} e^{i j} | | V_{i} - V_{j} | |^{2}

以下分别证明f₁、f₂、f₃是V_i的凸函数。

(1)

f_{1} = \frac{1}{2} Σ_{t = 1}^{T} Σ_{d = 1}^{D} {[u_{i}^{t d} - V_{i}^{t^{*}} {(S^{d *})}^{T}]}^{2} = C_{2} + \frac{1}{2} Σ_{t = 1}^{T} {V_{i}^{t^{*}} [Σ_{d = 1}^{D} {(S^{d *})}^{T} S^{d *}] {(V_{i}^{t *})}^{T} - 2 (Σ_{d = 1}^{D} u_{i}^{t d} S^{d *}) {(V_{i}^{t *})}^{T}},

其中C₂是与V_i无关的常数。对V_i的每一行求导，可得以及

\partial^{2} f_{1} / \partial {(V_{i}^{t *})}^{T} \partial V_{i}^{p *} = 0 (t &NotEqual; p) .

用

v_{i} = {(V_{i}^{1 *}, V_{i}^{2 *}, ..., V_{i}^{T *})}^{T}

表示将V_i按行扩展成的高维行向量，则f₁对v_i的海森矩阵是一个块对角矩阵又因为，

z^{T} [Σ_{d = 1}^{D} {(S^{d *})}^{T} S^{d *}] z = Σ_{d = 1}^{D} z^{T} {(S^{d *})}^{T} S^{d *} z = Σ_{d = 1}^{D} {(S^{d *} z)}^{2} &GreaterEqual; 0

对任意T维非零向量z均成立，则有det(G_t)≥0，det(·)表示矩阵的行列式。因此，f₁是V_i的凸函数。

(2)采用上述步骤(1)中的v_i，可得所以f₂是V_i的凸函数。

(3)令C₂是与V_i无关的常数。由证明1中的步骤(2)可知，是V_i的凸函数。又且e^ij≥0，所以f₃是V_i的凸函数。

综上，且有α,γ≥0，目标函数l是V_i的凸函数，证毕。

证明2：目标函数l是S的凸函数。

同样，首先将目标函数改写为：

l = \frac{1}{2} Σ_{i = 1}^{N} | | U_{i} - V_{i} S^{T} | |^{2} + \frac{β}{2} | | S | |^{2} + C_{1}

C₁是与S无关的常数。令其中：

f_{i} = \frac{1}{2} | | U_{i} - V_{i} S^{T} | |^{2} = \frac{1}{2} Σ_{d = 1}^{D} {S^{d *} [Σ_{t = 1}^{T} {(V_{i}^{t *})}^{T} V_{i}^{t *}] {(S^{d *})}^{T} - 2 (Σ_{t = 1}^{T} u_{i}^{t d} V_{i}^{t *}) {(S^{d *})}^{T}} + C_{2}

C₂是与S无关的常数。与定理1的证明类似，用表示将S按行扩展成的高维行向量，可得f_i对S的海森矩阵是一个块对角矩阵

G_{s} \overset{Δ}{=} \partial^{2} f_{i} / \partial s \partial s^{T} = d i a g [G_{1}, G_{2}, ..., G_{D}],

其中

G_{d} \overset{Δ}{=} Σ_{t = 1}^{T} {(V_{i}^{t *})}^{T} V_{i}^{t *},

则f_i是S的凸函数。又||S||²是S的凸函数，且β≥0，目标函数l是S的凸函数，证毕。

在步骤2)中，目标函数l同时是V_i和S的凸函数，为了提高算法的求解速率，并降低算法对存储空间的需求，采用基于梯度下降的迭代更新来求解V_i和S，如图3所示，所述的选择合理的目标函数求解算法进行求解的方法包括如下步骤：

步骤2.1)初始化矩阵和的S2.1阶段：

步骤2.2)对矩阵V_i中每个元素进行求导的S2.2阶段：

根据最终目标函数对V_i中每个元素求导，具体公式为：

\partial l / \partial v_{i}^{t k} = (V_{i}^{t *} S^{T} - U_{i}^{t *}) S^{* k} + (α + {γΣ}_{j = 1, j &NotEqual; i}^{T} e^{i j}) v_{i}^{t k} - {γΣ}_{j = 1, j &NotEqual; i}^{T} e^{i j} v_{j}^{t k};

步骤2.3)对矩阵V_i中每个元素进行更新的S2.3阶段：

步骤2.4)判断所有V_i矩阵是否更新完毕的S2.4阶段：

步骤2.5)对矩阵S中每个元素进行求导的S2.5阶段：

根据最终目标函数对S中每个元素求导，具体公式为

\partial l / \partial s^{d k} = Σ_{i = 1}^{N} {(V_{i}^{* k})}^{T} [V {(S^{d *})}^{T} - U_{i}^{* d}] + {βs}^{d k};

步骤2.6)对矩阵S中每个元素进行更新的S2.6阶段：

步骤2.7)判断算法是否收敛的S2.7阶段：

若算法收敛，则进行步骤2.8)，否则返回步骤2.2)；

步骤2.8)输出结果的S2.8阶段：

输出用户用电需求结果，本流程至此结束。

在步骤3)中，所述的两个基本指标的计算公式如下：

(1)不同用户的用电需求矩阵的相似度的衡量指标如下：

Sim(V_i,V_j)＝tr(V_i,V_j ^T)/(||V_i||||V_j||)

C e n t e r (c) = Σ_{u_{i} &Element; c} V_{i} / | c |

其中|c|表示分组c中包含用户的个数。

如图4所示，在步骤3)中，所述的用户细分方法如下：

步骤3.1)将用户随机划分为k个簇c₁,c₂,…,c_k的S3.1阶段：

其中k表示人为设定的用户簇的个数；

步骤3.2)计算每个簇的整体表示的S3.2阶段：

步骤3.3)计算第i个用户与所有簇之间相似度的S3.3阶段：

步骤3.4)调整第i个用户的簇标签的S3.4阶段：

步骤3.5)判断所有用户是否调整完毕的S3.5阶段：

步骤3.6)判断用户簇标签是否收敛的S3.6阶段：

步骤3.7)输出结果的S3.7阶段：

输出所有用户簇标签结果，本流程至此结束。

本发明采用电力数据中的用户用电记录数据和用户的居住位置信息，为每个用户分别构建用电记录矩阵，并基于结构化对比算法来计算用户地理位置信息的相似度。采用联合矩阵分解模型对用户的用电需求进行建模，分析影响用户用电行为的时间因素与日期因素。然后，根据用户的地理位置相似度，进一步融合地理位置信息，使用户在隐含需求空间中的表示同时包含用电需求信息和地理位置信息。最后，采用聚类算法，根据用户在隐含需求空间中的表示，对用户进行细分，形式化地展现用电行为和居住地点上的关联关系，对电力部门理解用户需求和用户间关系，调整电力生产、维护用电设施等日常管理活动有着重要的参考价值。

需要强调的是，本发明所述的实施例是说明性的，而不是限定性的，因此本发明并不限于具体实施方式中所述的实施例，凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式，同样属于本发明保护的范围。

Claims

1.一种基于联合矩阵分解模型的电力用户细分方法，其特征在于：所述的基于联合矩阵分解模型的电力用户细分方法包括按顺序执行的下列步骤：

步骤3)根据上述用户用电需求对用户进行细分：

2.根据权利要求1所述的基于联合矩阵分解模型的电力用户细分方法，其特征在于：在步骤1)中，所述的输入用户的用电记录数据，根据用户的用电记录数据构建用电记录矩阵的方法为：

所输入的用户用电记录数据中的所有用户被表示为集合：

U＝{u₁,u₂,…,u_N}

其中N表示数据中包含的用户个数,u_i表示第i个用户；

第i个用户的用电记录数据被构建为用电记录矩阵：

其中D表示数据中用电记录包含的天数，T表示每个用户每天的用电记录包含的均匀采样点的个数，表示T行D列的非负实数矩阵；同时，用和分别表示矩阵U_i的第t行和第d列，即用户u_i在每天第t个时间点上的所有用电记录和在第d天的用电记录，并用表示矩阵U_i的第t行第d列上的元素；

最终，输出所有用户的用电记录矩阵：

3.根据权利要求1所述的基于联合矩阵分解模型的电力用户细分方法，其特征在于：在步骤1)中，所述的输入用户的地理位置信息，将用户的地理位置信息用层级表示，构建用户的地理位置信息相似度矩阵，并调节不同层级的地理位置信息中不同组成部分的权重的方法为：

第i个用户的地理位置信息被表示为结构体：

g_{i} = {g_{i}^{1}, g_{i}^{2}, ..., g_{i}^{n}}

第i个用户和第j个用户的地理位置信息相似度计算公式为：

e^{i j} = Σ_{k = 1}^{n} λ_{k} Π_{m = 1}^{k} δ (g_{i}^{k}, g_{j}^{k}) / Σ_{k = 1}^{n} λ_{k}

最终，输出所有用户的地理位置信息相似度矩阵：

4.根据权利要求1所述的基于联合矩阵分解模型的电力用户细分方法，其特征在于：在步骤2)中，所述的构建用电记录矩阵联合分解的目标函数的方法为：

\min l_{1} = | | U_{i} - V_{i} {S_{i}}^{T} | |^{2}

\min l_{2} = Σ_{i = 1}^{N} | | U_{i} - V_{i} S^{T} | |^{2}

\min l_{3} = Σ_{i = 1}^{N} Σ_{j = 1}^{N} e^{i j} | | V_{i} - V_{j} | |^{2}

(4)最大可能地保持时间因素矩阵的平滑：

\min l_{4} = Σ_{i = 1}^{N} | | V_{i} | |^{2}

(5)最大可能地保持日期因素矩阵的平滑：

minl₅＝||S||²

在此，采用矩阵的L₂范式的平方||·||²来使矩阵保持平滑。

\min l = \frac{1}{2} Σ_{i = 1}^{N} | | U_{i} - V_{i} S^{T} | |^{2} + \frac{α}{2} Σ_{i = 1}^{N} | | V_{i} | |^{2} + \frac{β}{2} | | S | |^{2} + \frac{γ}{2} Σ_{i = 1}^{N} Σ_{j = 1}^{N} e^{i j} | | V_{i} - V_{j} | |^{2}

5.根据权利要求1所述的基于联合矩阵分解模型的电力用户细分方法，其特征在于：在步骤2)中，所述的选择合理的目标函数求解算法进行求解的方法包括如下步骤：

步骤2.1)初始化矩阵和的S2.1阶段：

步骤2.2)对矩阵V_i中每个元素进行求导的S2.2阶段：

根据最终目标函数对V_i中每个元素求导，具体公式为：

\partial l / \partial v_{i}^{t k} = (V_{i}^{t *} S^{T} - U_{i}^{t *}) S^{* k} + (α + γ Σ_{j = 1, j &NotEqual; i}^{T} e^{i j}) v_{i}^{t k} - γ Σ_{j = 1, j &NotEqual; i}^{T} e^{i j} v_{j}^{t k};

步骤2.3)对矩阵V_i中每个元素进行更新的S2.3阶段：

步骤2.4)判断所有V_i矩阵是否更新完毕的S2.4阶段：

步骤2.5)对矩阵S中每个元素进行求导的S2.5阶段：

根据最终目标函数对S中每个元素求导，具体公式为

\partial l / \partial s^{d k} = Σ_{i = 1}^{N} {(V_{i}^{* k})}^{T} [V {(S^{d *})}^{T} - U_{i}^{* d}] + {βs}^{d k};

步骤2.6)对矩阵S中每个元素进行更新的S2.6阶段：

步骤2.7)判断算法是否收敛的S2.7阶段：

若算法收敛，则进行步骤2.8)，否则返回步骤2.2)；

步骤2.8)输出结果的S2.8阶段：

输出用户用电需求结果，本流程至此结束。

6.根据权利要求1所述的基于联合矩阵分解模型的电力用户细分方法，其特征在于：在步骤3)中，所述的两个基本指标的计算公式如下：

(1)不同用户的用电需求矩阵的相似度的衡量指标如下：

Sim(V_i,V_j)＝tr(V_i,V_j ^T)/(||V_i||||V_j||)

其中tr(·,·)表示矩阵的对角线上元素的和，||·||表示矩阵的L₂范式；

C e n t e r (c) = Σ_{u_{i} &Element; c} V_{i} / | c |

其中|c|表示分组c中包含用户的个数。

7.根据权利要求1所述的基于联合矩阵分解模型的电力用户细分方法，其特征在于：在步骤3)中，所述的用户细分方法如下：

步骤3.1)将用户随机划分为k个簇c₁,c₂,…,c_k的S3.1阶段：

其中k表示人为设定的用户簇的个数；

步骤3.2)计算每个簇的整体表示的S3.2阶段：

步骤3.3)计算第i个用户与所有簇之间相似度的S3.3阶段：

步骤3.4)调整第i个用户的簇标签的S3.4阶段：

步骤3.5)判断所有用户是否调整完毕的S3.5阶段：

步骤3.6)判断用户簇标签是否收敛的S3.6阶段：

步骤3.7)输出结果的S3.7阶段：

输出所有用户簇标签结果，本流程至此结束。