CN115310999B

CN115310999B - 基于多层感知机和排序网络的企业用电行为分析方法及***

Info

Publication number: CN115310999B
Application number: CN202210737510.1A
Authority: CN
Inventors: 沈秋英; 曹骏; 张文韬; 朱静怡; 庄文兵; 刘柳; 张恒超; 王之阳; 王波; 曲照言; 王聪
Original assignee: Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Current assignee: Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Priority date: 2022-06-27
Filing date: 2022-06-27
Publication date: 2024-02-02
Anticipated expiration: 2042-06-27
Also published as: CN115310999A

Abstract

本发明公开了基于多层感知机和排序网络的企业用电行为分析方法及***，所述方法包括：构建用电特征指标集合以得到模型指标特征向量，并对各指标进行用电行为评分；构建训练数据集，包括多个企业的模型指标特征向量构成的特征向量集，以及监督信息；对训练数据集中多个企业的模型指标特征向量分别进行多层感知机处理，得到相应的模型指标特征编码集合，训练基于排序网络的企业用电行为分析模型；根据企业用电行为分析模型和从训练数据集中筛选出的基准企业，分析企业的用电行为。本发明可以更好的利用多维度的电力大数据，提高模型对于企业用电行为分析的效率、准确性和可扩展性，并大幅度降低成本。

Description

基于多层感知机和排序网络的企业用电行为分析方法及***

技术领域

本发明属于电力大数据处理技术领域，涉及基于多层感知机和排序网络的企业用电行为分析方法及***。

背景技术

现有技术中，普遍使用传统的专家经验模型来构建企业信用分，而传统的专家经验模型通常是挑选少数重要数据指标，利用专家经验做出判断，得到企业用电行为的评价。但专家经验模型也有不足之处：一是在大量电力数据需要分析处理时，专家经验模型的人力成本过大；二是专家经验模型只能对于当前情况下的场景做出企业电力行为评价，模型难以扩展；三是当电力大数据的维度很大时，专家经验模型存在主观性较强，得到的企业用电行为分析结果往往不够准确的问题。

基于此，在构建评价模型对企业用电行为进行评价时，常常面临以下问题：人工标注大量的电力数据需要做出定量分析标注，其成本很高，而且标注出来的数据主观性强，无法保证准确性，且难以使用逻辑回归、数值回归、线性回归等方法来获取企业用电行为的评价模型。

发明内容

为解决现有技术中存在的不足，本发明的目的在于，提供基于多层感知机和排序网络的企业用电行为分析方法及***，可以更好的利用多维度的电力大数据，提高模型对于企业用电行为分析的效率、准确性和可扩展性，并大幅度降低成本。

为了实现上述目标，本发明采用如下技术方案：

基于多层感知机和排序网络的企业用电行为分析方法，包括以下步骤：

步骤1，构建用电特征指标集合以得到模型指标特征向量，并对各指标进行用电行为评分；

步骤2，构建训练数据集，包括多个企业的模型指标特征向量构成的特征向量集，以及基于各指标用电行为评分得到的表示不同企业之间用电行为初步评价结果的监督信息；

步骤3，对训练数据集中多个企业的模型指标特征向量分别进行多层感知机处理，得到相应的模型指标特征编码集合，采用模型指标特征编码集合和监督信息，训练基于排序网络的企业用电行为分析模型；

步骤4，根据企业用电行为分析模型和从训练数据集中筛选出的基准企业，分析企业的用电行为。

本发明进一步包括以下优选方案：

优选地，步骤1中，构建包括企业的用电负荷水平指标、用电规范指标和用电互动能力指标的用电特征指标集合，将用电特征指标集合中各指标顺序拼接得到模型指标特征向量；并根据专家经验对各指标进行用电行为评分，以用于构建监督信息。

优选地，步骤2具体包括：

步骤2.1，构建训练数据集的特征向量集：将每个企业的模型指标特征向量作为训练数据集的特征向量，并收集多个企业的模型指标特征向量构成特征向量集；

步骤2.2，构建训练数据集的监督信息：对训练数据集中的企业进行配对采样，赋予每一对企业一个表示企业间用电行为初步评价结果的标签，表示不同企业之间用电行为初步评价结果的标签构成监督信息；

其中，标签的取值方式为：

将步骤1中各指标用电行为评分累加得到的企业用电行为初步评价分数，用于初步评价不同企业之间用电行为；

比较每一对企业中第一个企业与第二个企业的初步评价分数，若第一家企业相比于第二家企业高出设定分，则标签记为1，表示第一个企业的用电行为表现更好；若第二家企业相比于第一家企业高出设定分，则标签记为-1，表示第二个企业的用电行为表现更好；其他情况，则标签记为0，表示第一个企业和第二企业的用电行为表现相同。

优选地，步骤3具体包括：

步骤3.1，对训练数据集中多个企业的模型指标特征向量a分别进行多层感知机处理，得到模型指标特征编码集合b：

b＝mlp(a,w)

其中，w为多层感知机mlp的参数a中各指标特征权重集；

步骤3.2，构建排序网络模型，基于排序网络模型、监督信息和排序关系对称性，构建损失函数；

步骤3.3，基于损失函数构建随机梯度下降优化模型，以对模型指标特征编码集合中的权重进行学习；

步骤3.4，根据模型指标特征编码集合和监督信息，采用随机梯度下降优化方法构建并训练企业用电行为分析模型。

优选地，步骤3.2中，构建排序网络模型以如下公式表示，

式中：

P_ij表示排序网络模型认为企业i比企业j用电行为评价更好的概率；

表示假设企业i比企业j的用电行为评价更好；

σ是一个超参常数；

s_i＝s(b_i)表示企业用电行为分析模型给企业i的企业用电行为评估值；

s_j＝s(b_j)表示企业用电行为分析模型给企业j的企业用电行为评估值。

优选地，步骤3.2中，基于排序网络模型、监督信息和排序关系对称性，构建损失函数，具体如下：

构建交叉熵损失函数，以如下公式表示，

将交叉熵损失函数公式化简得到：

式中：

C_ij表示企业i和企业j的损失函数的值；

S_ij属于[-1,0,1]，表示根据监督信息得到的企业i和企业j之间的企业用电行为相对好坏关系；

根据排序关系对称性，即第一个企业与第二个企业相对好关系的对称性，定义一个配对集合I，要求第一个企业比第二个企业用电行为好；

定义集合I的损失函数C，公式如下：

式中，满足s_i>s_j。

优选地，步骤3.3，基于损失函数构建随机梯度下降优化模型，以如下公式表示，

式中：w_k表示模型指标特征编码集合b中特征权重集w的第k个权重；

η表示学习率；

λ_i是一个关于企业i的系数。

优选地，步骤3.4，基于随机梯度下降优化模型构建企业用电行为分析模型，以如下公式表示，

s_i,s_j＝f(a_i,a_j；w) (4)

式中：w为步骤3.3所得到的模型指标特征编码集合b中特征权重集；

f(a_i,a_j；w)表示根据企业i和企业j用电行为的模型指标特征向量a_i,a_j输出评估值的函数；

优选地，步骤4中，引入基准企业，将企业用电行为分析模型对待分析企业输出的评估值归整至0-100的评价分，具体如下：

步骤4.1，采用企业用电行为分析模型得出训练数据集中各企业的评估值，根据评估值将训练数据集中所有企业进行升序排序，第一家企业定义评价分为0分，最后一家企业定义评价分为100分，按平均间隔采样100家企业作为基准企业b₁-b₁₀₀，其模型指标特征集合为A＝{a₁,a₂,……a₁₀₀}，且定义其用电行为评价分S₁-S₁₀₀依次为{1，2，……，100}；

步骤4.2，假设待评价企业的模型指标特征向量为a；

首先依次将待评价企业的模型指标特征向量a与基准企业的特征集合A中的每一个基准企业b_i的向量a_i组成一对输入到步骤3.4的企业用电行为分析模型中，得到对应的用电行为评估值s和s_i，基于此，寻找一对相邻的基准企业b_i和b_i+1，使得s位于s_i和s_i+1之间，得到待评价企业的评价分数所在区间；

根据评估值得到权重，将基准企业b_i和b_i+1的评价分S_i和S_i+1加权得到待评价企业的用电行为评价分S：

S＝S_i+1*(s-s_i)/(s_i+1-s_i)+S_i*(s_i+1-s)/(s_i+1-s_i)。

本发明还提供基于多层感知机和排序网络的企业用电行为分析***，所述***包括：

模型指标特征向量构建及指标评分模块，用于构建用电特征指标集合以得到模型指标特征向量，并对各指标进行用电行为评分；

训练数据集构建模块，用于构建训练数据集，包括多个企业的模型指标特征向量构成的特征向量集，以及基于各指标用电行为评分得到的表示不同企业之间用电行为初步评价结果的监督信息；

企业用电行为分析模型训练模块，用于对训练数据集中多个企业的模型指标特征向量分别进行多层感知机处理，得到相应的模型指标特征编码集合，采用模型指标特征编码集合和监督信息，训练基于排序网络的企业用电行为分析模型；

企业的用电行为分析模块，用于根据企业用电行为分析模型和从训练数据集中筛选出的基准企业，分析企业的用电行为。

本发明的有益效果在于，与现有技术相比：

本发明首先通过基于数据的分类方法来对企业用电特征进行提取，将对企业用电行为的数据要求从定量转化为定性，大大增加了模型的可扩展性；其次利用模型指标特征向量和监督信息，通过多层感知机和排序网络的方法构建并训练企业用电行为分析模型，相比于逻辑回归、数值回归、线性回归等方法，本发明的优点是：

本发明基于多层感知机和排序网络的企业用电行为分析模型，步骤1指标评分只需帮助专家来初步评价不同企业之间用电行为得到监督信息，具体指标评分并不会用于模型训练，比如第一家企业400分，第二家企业250分，指标评分不会用于模型训练，本发明模型训练只使用了400分大于250分的标签信息和模型指标特征向量(模型指标特征向量包含的是增长率u，波动率v，差异度w等，不包含分数)，因此，指标评分可以不用十分精确，因为只要分差较大，初步判断就比较准确了。即不需要给定训练样本的精确定量的用电行为评价得分，只需给出训练数据集中每一对企业用电行为好坏的定性评价，大大降低了数据标注的成本。

本发明的企业用电行为分析模型，可以克服传统的专家经验模型存在主观性较强的缺陷，能够更好利用多维度的电力大数据，确保企业用电特征提取的准确，克服了专家人工评价方法的主观性和不准确性。

附图说明

图1是本发明基于多层感知机和排序网络的企业用电行为分析方法流程图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

如图1所示，本发明提供了基于多层感知机和排序网络的企业用电行为分析方法，在本发明进一步优选但非限制性的实施方式中，所述方法包括以下步骤1-4：

进一步优选地，构建包括企业的用电负荷水平指标、用电规范指标和用电互动能力指标的用电特征指标集合，将用电特征指标集合中各指标顺序拼接得到模型指标特征向量；并根据专家经验对各指标进行用电行为评分，以用于构建监督信息。具体如下：

1)提取企业的用电负荷水平指标，包括企业的用电增长率指标和用电量稳定性指标；

用电增长率指标包括企业近12个月用电量比上12个月同比增长率指标，其用电行为评分计算方法为：

企业近12个月用电量比上12个月同比增长率＝u，

u>0.8，得分：100分；

u＝[0.4,0.8]，得分：50分；

u＝(0,0.4)，得分：30分；

用电稳定性指标包括企业近12个月用电波动在当地同行中水平指标和企业近12个月月电量差异度指标，其用电行为评分计算方法为：

企业近12个月用电波动率＝v，企业近12个月月电量差异度＝w，

v<0.2，得分：100分；

v＝[0.2,0.6]，得分：60分；

v>0.6，得分0分；

w<0.2，得分100分；

w＝[0.2,0.7]，得分60分；

w>0.7，得分0分；

2)提取企业的用电规范指标，包括窃电行为指标和违约用电行为指标；

窃电行为指标包括近24个月窃电次数指标和近24个月窃电违约总费用指标，其用电行为评分计算方法为：

近24个月窃电次数＝q，近24个月窃电违约总费用＝r万元，

q<2，得分：100分；

q＝[2,10]，得分；40分；

q>10，得分：0分；

r<1，得分：100分；

r＝[1,10]，得分：40分；

r>10，得分：0分；

违约用电行为指标包括近24个月违约用电次数指标和近24个月违约用电总费用指标，其用电行为评分计算方法为：

近24个月违约用电次数＝s，近24个月违约用电总费用＝t，

s<2，得分：100分；

s＝[2,10]，得分；40分；

s>10，得分：0分；

t<1，得分：100分；

t＝[1,10]，得分：40分；

t>10，得分：0分。

3)提取企业的用电互动能力指标，包括企业与运营商互动进行设备扩容的能力指标；

企业与运营商互动进行设备扩容的能力指标包括近24个月累计增容次数指标和近24个月累计减容次指标，其用电行为评分计算方法为：

近24个月累计增容次数z1，近24个月累计减容次数z2，

z1>8，得分：100分；

z1＝[4,8]，得分：70分；

z1<4，得分：20分；

z2<4，得分：100分；

z2＝[4,10]，得分：70分；

z2>10，得分：0分。

上述所提取的企业用电负荷水平、用电行为模式、用电互动能力指标按指标顺序拼接，以构成模型指标特征向量；(即模型指标特征向量包含的是同比增长率u，波动率v，差异度w等，不包含指标评分)

上述得到的评分用于后续构建监督信息。

上述内容是神经网络中的固定流程，权重等一系列步骤在下文的多层感知机中实现。

步骤2，构建训练数据集，包括多个企业的模型指标特征向量构成的特征向量集，以及基于各指标用电行为评分得到的表示不同企业之间用电行为初步评价结果的监督信息，具体包括：

其中，标签的取值方式为：

比较每一对企业中第一个企业与第二个企业的初步评价分数，若第一家企业相比于第二家企业高出设定值，如150分，则标签记为1，表示第一个企业的用电行为表现更好；若第二家企业相比于第一家企业高出150分，则标签记为-1，表示第二个企业的用电行为表现更好；其他情况，则标签记为0，表示第一个企业和第二企业的用电行为表现相同。

即若初步评价分数差距不到150分，则标记为0。

具体包括：

b＝mlp(a,w)

其中，w为多层感知机mlp的参数a中各指标特征权重集；

其中每个企业的模型指标特征向量a，对应输出一个模型指标特征编码集合b。b的值为企业用电行为分析模型的输入，最终得到企业用电行为评估值s，由s可得到损失函数值C。

步骤3.1是自动化的过程，输入a，即可自动学习输出b，是本领域常识。

步骤3.1.1，构建多个神经元作为多层感知机mlp的输入层，依次将训练数据集中各企业的模型指标特征向量a输入到每个神经元中；其中，神经元数量由人为设置，具体数量根据模型的效果做出调整，与训练数据集中企业数量和模型指标特征向量a中指标特征数量均不相关。

步骤3.1.2，构建多个隐藏层，对输入的特征向量进行编码，即首先使用一个矩阵和输入的特征向量相乘得到一个新的向量作为编码结果，该矩阵值是多层感知机参数权重的一部分，可通过训练学习得到，新向量的每一位都对应一个神经元，并对每一个神经元使用Tanh函数作为激活函数决定当前神经元否输出结果；

为降低特征编码的计算成本，使用Tanh函数作为激活函数，公式如下所示；

其中,x为神经元所对应的向量位的值，e为自然常数。

步骤3.1.3，构建多个神经元作为多层感知机的输出层，依次输出特征向量的特征编码结果，所得到的特征编码结果为一个高维向量b，其作为用电行为模型指标特征向量的特征变换结果，公式如下：

b＝mlp(a,w)

其中，w为多层感知机mlp的参数权重；

所述编码在本发明中就是指：对向量中的每一个指标进行权重赋值；

1)构建排序网络模型以如下公式表示，

式中：

表示假设企业i比企业j的用电行为评价更好；

σ是一个超参常数；

2)基于排序网络模型、监督信息和排序关系对称性，构建损失函数，具体如下：

构建交叉熵损失函数，以如下公式表示，

将上述公式化简得到：

式中：

C_ij表示企业i和企业j的损失函数的值；

定义集合I的损失函数C，公式如下：

式中，满足s_i>s_j。

基于损失函数构建随机梯度下降优化模型，以如下公式表示，

η表示学习率；

λ_i是一个关于企业i的系数；

损失函数C的值可通过步骤3.2使用特征编码结果b计算得到。

基于随机梯度下降优化模型构建企业用电行为分析模型，以如下公式表示，

s_i,s_j＝f(a_i,a_j；w) (4)

s_i＝s(b_i)表示企业用电行为分析模型给企业i的企业用电行为评估值，其模型输入为向量b_i，为企业i的特征编码结果；

s_j＝s(b_j)表示企业用电行为分析模型给企业j的企业用电行为评估值，其模型输入为向量b_j，为企业j的特征编码结果。

本发明在实际企业用电行为分析时，考虑可解释性，使用百分制标准分，而使用企业用电行为分析模型输出的是整个实数范围，并无法直接拟合到标准分，因此通过步骤4规整神经网络的输出的评估值到0-100。考虑到这个目的，如要得到0-100的用电行为评价分，必须使用基准企业，只对比两家企业的用电行为相对好坏情况无法满足这一要求。

步骤4中，引入基准企业，将企业用电行为分析模型对待分析企业输出的评估值归整至0-100的评价分，具体如下：

步骤4.2，假设待评价企业的模型指标特征向量为a；

首先依次将待评价企业的模型指标特征向量a与基准企业的特征集合A中的每一个基准企业b_i的向量a_i组成一对输入到步骤3.4的企业用电行为分析模型中，得到对应的用电行为评估值s和s_i，即将待评价企业与每一基准企业都代入模型运行一次，共运行100次，得到s和s₁-s₁₀₀，基于此，寻找一对相邻的基准企业b_i和b_i+1，使得s位于s_i和s_i+1之间，得到待评价企业的评价分数所在区间；

S＝S_i+1*(s-s_i)/(s_i+1-s_i)+S_i*(s_i+1-s)/(s_i+1-s_i)。

假设i＝1，基准企业1的用电行为评估值为-20.0，评价分为1，基准企业2的评估值为10.0，评价分为2，待评价企业的评估值为-5.0，则待评价企业的评价分数所在区间为1到2之间；

该待评价企业的用电行为评价分为基准企业1和基准企业2的评价分的加权组合，其权重根据企业用电行为评估值确定，具体为：2*(-5.0-(-20.0))/(10.0-(-20.0))+1*(10.0-(-5.0))/(10.0-(-20.0))＝1.5。

本发明基于多层感知机和排序网络的企业用电行为分析***，运行上述的基于多层感知机和排序网络的企业用电行为分析方法，所述***包括：

本发明的有益效果在于，与现有技术相比：

本发明采用排序方法，将电力数据不定量的维度转化成定性的问题，该方法也使得标注出来的数据准确性显著提高。而针对电力数据多维度不好利用，弱监督学习实现困难的问题，本专利采用多层感知机对电力数据进行处理，从而满足该问题；本发明采用多层感知机和排序网络构建企业用电行为分析模型，实现了自动化的企业用电行为分析，相比于人工专家评价大大降低了成本，具有良好的扩展性，从而可以更好地为金融机构提供金融风控、客户推荐、数据共享等有偿的电力数据产品和服务。

本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述，但是本领域技术人员应该理解，以上实施示例仅为本发明的优选实施方案，详尽的说明只是为了帮助读者更好地理解本发明精神，而并非对本发明保护范围的限制，相反，任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。

Claims

1.基于多层感知机和排序网络的企业用电行为分析方法，其特征在于：

所述方法包括以下步骤：

步骤2，构建训练数据集，包括多个企业的模型指标特征向量构成的特征向量集，以及基于各指标用电行为评分得到的表示不同企业之间用电行为初步评价结果的监督信息；具体包括：

其中，标签的取值方式为：

比较每一对企业中第一个企业与第二个企业的初步评价分数，若第一家企业相比于第二家企业高出设定分，则标签记为1，表示第一个企业的用电行为表现更好；若第二家企业相比于第一家企业高出设定分，则标签记为-1，表示第二个企业的用电行为表现更好；其他情况，则标签记为0，表示第一个企业和第二企业的用电行为表现相同；

步骤3，对训练数据集中多个企业的模型指标特征向量分别进行多层感知机处理，得到相应的模型指标特征编码集合，采用模型指标特征编码集合和监督信息，训练基于排序网络的企业用电行为分析模型；具体包括：

b＝mlp(a,w)

其中，w为多层感知机mlp的参数a中各指标特征权重集；

构建排序网络模型以如下公式表示，

式中：

表示假设企业i比企业j的用电行为评价更好；

σ是一个超参常数；

s_j＝s(b_j)表示企业用电行为分析模型给企业j的企业用电行为评估值；

基于排序网络模型、监督信息和排序关系对称性，构建损失函数，具体如下：

构建交叉熵损失函数，以如下公式表示，

将交叉熵损失函数公式化简得到：

式中：

C_ij表示企业i和企业j的损失函数的值；

定义集合I的损失函数C，公式如下：

式中，满足s_i>s_j；

η表示学习率；

λ_i是一个关于企业i的系数；

步骤3.4，根据模型指标特征编码集合和监督信息，采用随机梯度下降优化方法构建并训练企业用电行为分析模型；

s_i,s_j＝f(a_i,a_j；w) (4)

2.根据权利要求1所述的基于多层感知机和排序网络的企业用电行为分析方法，其特征在于：

步骤1中，构建包括企业的用电负荷水平指标、用电规范指标和用电互动能力指标的用电特征指标集合，将用电特征指标集合中各指标顺序拼接得到模型指标特征向量；并根据专家经验对各指标进行用电行为评分，以用于构建监督信息。

3.根据权利要求1所述的基于多层感知机和排序网络的企业用电行为分析方法，其特征在于：

步骤4.2，假设待评价企业的模型指标特征向量为a；

首先依次将待评价企业的模型指标特征向量a与基准企业的特征集合A中的每一个基准企业b_i的向量a_i组成一对输入到企业用电行为分析模型中，得到对应的用电行为评估值s和s_i，基于此，寻找一对相邻的基准企业b_i和b_i+1，使得s位于s_i和s_i+1之间，根据评估值得到权重，将基准企业b_i和b_i+1的评价分S_i和S_i+1加权得到待评价企业的用电行为评价分S：

S＝S_i+1*(s-s_i)/(s_i+1-s_i)+S_i*(s_i+1-s)/(s_i+1-s_i)。

4.基于多层感知机和排序网络的企业用电行为分析***，运行如权利要求1至3中任一项所述的基于多层感知机和排序网络的企业用电行为分析方法，其特征在于：

所述***包括：