CN115310999B - 基于多层感知机和排序网络的企业用电行为分析方法及*** - Google Patents

基于多层感知机和排序网络的企业用电行为分析方法及*** Download PDF

Info

Publication number
CN115310999B
CN115310999B CN202210737510.1A CN202210737510A CN115310999B CN 115310999 B CN115310999 B CN 115310999B CN 202210737510 A CN202210737510 A CN 202210737510A CN 115310999 B CN115310999 B CN 115310999B
Authority
CN
China
Prior art keywords
enterprise
model
electricity
enterprises
consumption behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210737510.1A
Other languages
English (en)
Other versions
CN115310999A (zh
Inventor
沈秋英
曹骏
张文韬
朱静怡
庄文兵
刘柳
张恒超
王之阳
王波
曲照言
王聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd filed Critical Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Priority to CN202210737510.1A priority Critical patent/CN115310999B/zh
Publication of CN115310999A publication Critical patent/CN115310999A/zh
Application granted granted Critical
Publication of CN115310999B publication Critical patent/CN115310999B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/80Management or planning
    • Y02P90/82Energy audits or management systems therefor

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Water Supply & Treatment (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于多层感知机和排序网络的企业用电行为分析方法及***,所述方法包括:构建用电特征指标集合以得到模型指标特征向量,并对各指标进行用电行为评分;构建训练数据集,包括多个企业的模型指标特征向量构成的特征向量集,以及监督信息;对训练数据集中多个企业的模型指标特征向量分别进行多层感知机处理,得到相应的模型指标特征编码集合,训练基于排序网络的企业用电行为分析模型;根据企业用电行为分析模型和从训练数据集中筛选出的基准企业,分析企业的用电行为。本发明可以更好的利用多维度的电力大数据,提高模型对于企业用电行为分析的效率、准确性和可扩展性,并大幅度降低成本。

Description

基于多层感知机和排序网络的企业用电行为分析方法及***
技术领域
本发明属于电力大数据处理技术领域,涉及基于多层感知机和排序网络的企业用电行为分析方法及***。
背景技术
现有技术中,普遍使用传统的专家经验模型来构建企业信用分,而传统的专家经验模型通常是挑选少数重要数据指标,利用专家经验做出判断,得到企业用电行为的评价。但专家经验模型也有不足之处:一是在大量电力数据需要分析处理时,专家经验模型的人力成本过大;二是专家经验模型只能对于当前情况下的场景做出企业电力行为评价,模型难以扩展;三是当电力大数据的维度很大时,专家经验模型存在主观性较强,得到的企业用电行为分析结果往往不够准确的问题。
基于此,在构建评价模型对企业用电行为进行评价时,常常面临以下问题:人工标注大量的电力数据需要做出定量分析标注,其成本很高,而且标注出来的数据主观性强,无法保证准确性,且难以使用逻辑回归、数值回归、线性回归等方法来获取企业用电行为的评价模型。
发明内容
为解决现有技术中存在的不足,本发明的目的在于,提供基于多层感知机和排序网络的企业用电行为分析方法及***,可以更好的利用多维度的电力大数据,提高模型对于企业用电行为分析的效率、准确性和可扩展性,并大幅度降低成本。
为了实现上述目标,本发明采用如下技术方案:
基于多层感知机和排序网络的企业用电行为分析方法,包括以下步骤:
步骤1,构建用电特征指标集合以得到模型指标特征向量,并对各指标进行用电行为评分;
步骤2,构建训练数据集,包括多个企业的模型指标特征向量构成的特征向量集,以及基于各指标用电行为评分得到的表示不同企业之间用电行为初步评价结果的监督信息;
步骤3,对训练数据集中多个企业的模型指标特征向量分别进行多层感知机处理,得到相应的模型指标特征编码集合,采用模型指标特征编码集合和监督信息,训练基于排序网络的企业用电行为分析模型;
步骤4,根据企业用电行为分析模型和从训练数据集中筛选出的基准企业,分析企业的用电行为。
本发明进一步包括以下优选方案:
优选地,步骤1中,构建包括企业的用电负荷水平指标、用电规范指标和用电互动能力指标的用电特征指标集合,将用电特征指标集合中各指标顺序拼接得到模型指标特征向量;并根据专家经验对各指标进行用电行为评分,以用于构建监督信息。
优选地,步骤2具体包括:
步骤2.1,构建训练数据集的特征向量集:将每个企业的模型指标特征向量作为训练数据集的特征向量,并收集多个企业的模型指标特征向量构成特征向量集;
步骤2.2,构建训练数据集的监督信息:对训练数据集中的企业进行配对采样,赋予每一对企业一个表示企业间用电行为初步评价结果的标签,表示不同企业之间用电行为初步评价结果的标签构成监督信息;
其中,标签的取值方式为:
将步骤1中各指标用电行为评分累加得到的企业用电行为初步评价分数,用于初步评价不同企业之间用电行为;
比较每一对企业中第一个企业与第二个企业的初步评价分数,若第一家企业相比于第二家企业高出设定分,则标签记为1,表示第一个企业的用电行为表现更好;若第二家企业相比于第一家企业高出设定分,则标签记为-1,表示第二个企业的用电行为表现更好;其他情况,则标签记为0,表示第一个企业和第二企业的用电行为表现相同。
优选地,步骤3具体包括:
步骤3.1,对训练数据集中多个企业的模型指标特征向量a分别进行多层感知机处理,得到模型指标特征编码集合b:
b=mlp(a,w)
其中,w为多层感知机mlp的参数a中各指标特征权重集;
步骤3.2,构建排序网络模型,基于排序网络模型、监督信息和排序关系对称性,构建损失函数;
步骤3.3,基于损失函数构建随机梯度下降优化模型,以对模型指标特征编码集合中的权重进行学习;
步骤3.4,根据模型指标特征编码集合和监督信息,采用随机梯度下降优化方法构建并训练企业用电行为分析模型。
优选地,步骤3.2中,构建排序网络模型以如下公式表示,
式中:
Pij表示排序网络模型认为企业i比企业j用电行为评价更好的概率;
表示假设企业i比企业j的用电行为评价更好;
σ是一个超参常数;
si=s(bi)表示企业用电行为分析模型给企业i的企业用电行为评估值;
sj=s(bj)表示企业用电行为分析模型给企业j的企业用电行为评估值。
优选地,步骤3.2中,基于排序网络模型、监督信息和排序关系对称性,构建损失函数,具体如下:
构建交叉熵损失函数,以如下公式表示,
将交叉熵损失函数公式化简得到:
式中:
Cij表示企业i和企业j的损失函数的值;
Sij属于[-1,0,1],表示根据监督信息得到的企业i和企业j之间的企业用电行为相对好坏关系;
根据排序关系对称性,即第一个企业与第二个企业相对好关系的对称性,定义一个配对集合I,要求第一个企业比第二个企业用电行为好;
定义集合I的损失函数C,公式如下:
式中,满足si>sj
优选地,步骤3.3,基于损失函数构建随机梯度下降优化模型,以如下公式表示,
式中:wk表示模型指标特征编码集合b中特征权重集w的第k个权重;
η表示学习率;
λi是一个关于企业i的系数。
优选地,步骤3.4,基于随机梯度下降优化模型构建企业用电行为分析模型,以如下公式表示,
si,sj=f(ai,aj;w) (4)
式中:w为步骤3.3所得到的模型指标特征编码集合b中特征权重集;
f(ai,aj;w)表示根据企业i和企业j用电行为的模型指标特征向量ai,aj输出评估值的函数;
si=s(bi)表示企业用电行为分析模型给企业i的企业用电行为评估值;
sj=s(bj)表示企业用电行为分析模型给企业j的企业用电行为评估值。
优选地,步骤4中,引入基准企业,将企业用电行为分析模型对待分析企业输出的评估值归整至0-100的评价分,具体如下:
步骤4.1,采用企业用电行为分析模型得出训练数据集中各企业的评估值,根据评估值将训练数据集中所有企业进行升序排序,第一家企业定义评价分为0分,最后一家企业定义评价分为100分,按平均间隔采样100家企业作为基准企业b1-b100,其模型指标特征集合为A={a1,a2,……a100},且定义其用电行为评价分S1-S100依次为{1,2,……,100};
步骤4.2,假设待评价企业的模型指标特征向量为a;
首先依次将待评价企业的模型指标特征向量a与基准企业的特征集合A中的每一个基准企业bi的向量ai组成一对输入到步骤3.4的企业用电行为分析模型中,得到对应的用电行为评估值s和si,基于此,寻找一对相邻的基准企业bi和bi+1,使得s位于si和si+1之间,得到待评价企业的评价分数所在区间;
根据评估值得到权重,将基准企业bi和bi+1的评价分Si和Si+1加权得到待评价企业的用电行为评价分S:
S=Si+1*(s-si)/(si+1-si)+Si*(si+1-s)/(si+1-si)。
本发明还提供基于多层感知机和排序网络的企业用电行为分析***,所述***包括:
模型指标特征向量构建及指标评分模块,用于构建用电特征指标集合以得到模型指标特征向量,并对各指标进行用电行为评分;
训练数据集构建模块,用于构建训练数据集,包括多个企业的模型指标特征向量构成的特征向量集,以及基于各指标用电行为评分得到的表示不同企业之间用电行为初步评价结果的监督信息;
企业用电行为分析模型训练模块,用于对训练数据集中多个企业的模型指标特征向量分别进行多层感知机处理,得到相应的模型指标特征编码集合,采用模型指标特征编码集合和监督信息,训练基于排序网络的企业用电行为分析模型;
企业的用电行为分析模块,用于根据企业用电行为分析模型和从训练数据集中筛选出的基准企业,分析企业的用电行为。
本发明的有益效果在于,与现有技术相比:
本发明首先通过基于数据的分类方法来对企业用电特征进行提取,将对企业用电行为的数据要求从定量转化为定性,大大增加了模型的可扩展性;其次利用模型指标特征向量和监督信息,通过多层感知机和排序网络的方法构建并训练企业用电行为分析模型,相比于逻辑回归、数值回归、线性回归等方法,本发明的优点是:
本发明基于多层感知机和排序网络的企业用电行为分析模型,步骤1指标评分只需帮助专家来初步评价不同企业之间用电行为得到监督信息,具体指标评分并不会用于模型训练,比如第一家企业400分,第二家企业250分,指标评分不会用于模型训练,本发明模型训练只使用了400分大于250分的标签信息和模型指标特征向量(模型指标特征向量包含的是增长率u,波动率v,差异度w等,不包含分数),因此,指标评分可以不用十分精确,因为只要分差较大,初步判断就比较准确了。即不需要给定训练样本的精确定量的用电行为评价得分,只需给出训练数据集中每一对企业用电行为好坏的定性评价,大大降低了数据标注的成本。
本发明的企业用电行为分析模型,可以克服传统的专家经验模型存在主观性较强的缺陷,能够更好利用多维度的电力大数据,确保企业用电特征提取的准确,克服了专家人工评价方法的主观性和不准确性。
附图说明
图1是本发明基于多层感知机和排序网络的企业用电行为分析方法流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,本发明提供了基于多层感知机和排序网络的企业用电行为分析方法,在本发明进一步优选但非限制性的实施方式中,所述方法包括以下步骤1-4:
步骤1,构建用电特征指标集合以得到模型指标特征向量,并对各指标进行用电行为评分;
进一步优选地,构建包括企业的用电负荷水平指标、用电规范指标和用电互动能力指标的用电特征指标集合,将用电特征指标集合中各指标顺序拼接得到模型指标特征向量;并根据专家经验对各指标进行用电行为评分,以用于构建监督信息。具体如下:
1)提取企业的用电负荷水平指标,包括企业的用电增长率指标和用电量稳定性指标;
用电增长率指标包括企业近12个月用电量比上12个月同比增长率指标,其用电行为评分计算方法为:
企业近12个月用电量比上12个月同比增长率=u,
u>0.8,得分:100分;
u=[0.4,0.8],得分:50分;
u=(0,0.4),得分:30分;
用电稳定性指标包括企业近12个月用电波动在当地同行中水平指标和企业近12个月月电量差异度指标,其用电行为评分计算方法为:
企业近12个月用电波动率=v,企业近12个月月电量差异度=w,
v<0.2,得分:100分;
v=[0.2,0.6],得分:60分;
v>0.6,得分0分;
w<0.2,得分100分;
w=[0.2,0.7],得分60分;
w>0.7,得分0分;
2)提取企业的用电规范指标,包括窃电行为指标和违约用电行为指标;
窃电行为指标包括近24个月窃电次数指标和近24个月窃电违约总费用指标,其用电行为评分计算方法为:
近24个月窃电次数=q,近24个月窃电违约总费用=r万元,
q<2,得分:100分;
q=[2,10],得分;40分;
q>10,得分:0分;
r<1,得分:100分;
r=[1,10],得分:40分;
r>10,得分:0分;
违约用电行为指标包括近24个月违约用电次数指标和近24个月违约用电总费用指标,其用电行为评分计算方法为:
近24个月违约用电次数=s,近24个月违约用电总费用=t,
s<2,得分:100分;
s=[2,10],得分;40分;
s>10,得分:0分;
t<1,得分:100分;
t=[1,10],得分:40分;
t>10,得分:0分。
3)提取企业的用电互动能力指标,包括企业与运营商互动进行设备扩容的能力指标;
企业与运营商互动进行设备扩容的能力指标包括近24个月累计增容次数指标和近24个月累计减容次指标,其用电行为评分计算方法为:
近24个月累计增容次数z1,近24个月累计减容次数z2,
z1>8,得分:100分;
z1=[4,8],得分:70分;
z1<4,得分:20分;
z2<4,得分:100分;
z2=[4,10],得分:70分;
z2>10,得分:0分。
上述所提取的企业用电负荷水平、用电行为模式、用电互动能力指标按指标顺序拼接,以构成模型指标特征向量;(即模型指标特征向量包含的是同比增长率u,波动率v,差异度w等,不包含指标评分)
上述得到的评分用于后续构建监督信息。
上述内容是神经网络中的固定流程,权重等一系列步骤在下文的多层感知机中实现。
步骤2,构建训练数据集,包括多个企业的模型指标特征向量构成的特征向量集,以及基于各指标用电行为评分得到的表示不同企业之间用电行为初步评价结果的监督信息,具体包括:
步骤2.1,构建训练数据集的特征向量集:将每个企业的模型指标特征向量作为训练数据集的特征向量,并收集多个企业的模型指标特征向量构成特征向量集;
步骤2.2,构建训练数据集的监督信息:对训练数据集中的企业进行配对采样,赋予每一对企业一个表示企业间用电行为初步评价结果的标签,表示不同企业之间用电行为初步评价结果的标签构成监督信息;
其中,标签的取值方式为:
将步骤1中各指标用电行为评分累加得到的企业用电行为初步评价分数,用于初步评价不同企业之间用电行为;
比较每一对企业中第一个企业与第二个企业的初步评价分数,若第一家企业相比于第二家企业高出设定值,如150分,则标签记为1,表示第一个企业的用电行为表现更好;若第二家企业相比于第一家企业高出150分,则标签记为-1,表示第二个企业的用电行为表现更好;其他情况,则标签记为0,表示第一个企业和第二企业的用电行为表现相同。
即若初步评价分数差距不到150分,则标记为0。
步骤3,对训练数据集中多个企业的模型指标特征向量分别进行多层感知机处理,得到相应的模型指标特征编码集合,采用模型指标特征编码集合和监督信息,训练基于排序网络的企业用电行为分析模型;
具体包括:
步骤3.1,对训练数据集中多个企业的模型指标特征向量a分别进行多层感知机处理,得到模型指标特征编码集合b:
b=mlp(a,w)
其中,w为多层感知机mlp的参数a中各指标特征权重集;
其中每个企业的模型指标特征向量a,对应输出一个模型指标特征编码集合b。b的值为企业用电行为分析模型的输入,最终得到企业用电行为评估值s,由s可得到损失函数值C。
步骤3.1是自动化的过程,输入a,即可自动学习输出b,是本领域常识。
步骤3.1.1,构建多个神经元作为多层感知机mlp的输入层,依次将训练数据集中各企业的模型指标特征向量a输入到每个神经元中;其中,神经元数量由人为设置,具体数量根据模型的效果做出调整,与训练数据集中企业数量和模型指标特征向量a中指标特征数量均不相关。
步骤3.1.2,构建多个隐藏层,对输入的特征向量进行编码,即首先使用一个矩阵和输入的特征向量相乘得到一个新的向量作为编码结果,该矩阵值是多层感知机参数权重的一部分,可通过训练学习得到,新向量的每一位都对应一个神经元,并对每一个神经元使用Tanh函数作为激活函数决定当前神经元否输出结果;
为降低特征编码的计算成本,使用Tanh函数作为激活函数,公式如下所示;
其中,x为神经元所对应的向量位的值,e为自然常数。
步骤3.1.3,构建多个神经元作为多层感知机的输出层,依次输出特征向量的特征编码结果,所得到的特征编码结果为一个高维向量b,其作为用电行为模型指标特征向量的特征变换结果,公式如下:
b=mlp(a,w)
其中,w为多层感知机mlp的参数权重;
所述编码在本发明中就是指:对向量中的每一个指标进行权重赋值;
步骤3.2,构建排序网络模型,基于排序网络模型、监督信息和排序关系对称性,构建损失函数;
1)构建排序网络模型以如下公式表示,
式中:
Pij表示排序网络模型认为企业i比企业j用电行为评价更好的概率;
表示假设企业i比企业j的用电行为评价更好;
σ是一个超参常数;
si=s(bi)表示企业用电行为分析模型给企业i的企业用电行为评估值;
sj=s(bj)表示企业用电行为分析模型给企业j的企业用电行为评估值。
2)基于排序网络模型、监督信息和排序关系对称性,构建损失函数,具体如下:
构建交叉熵损失函数,以如下公式表示,
将上述公式化简得到:
式中:
Cij表示企业i和企业j的损失函数的值;
Sij属于[-1,0,1],表示根据监督信息得到的企业i和企业j之间的企业用电行为相对好坏关系;
根据排序关系对称性,即第一个企业与第二个企业相对好关系的对称性,定义一个配对集合I,要求第一个企业比第二个企业用电行为好;
定义集合I的损失函数C,公式如下:
式中,满足si>sj
步骤3.3,基于损失函数构建随机梯度下降优化模型,以对模型指标特征编码集合中的权重进行学习;
基于损失函数构建随机梯度下降优化模型,以如下公式表示,
式中:wk表示模型指标特征编码集合b中特征权重集w的第k个权重;
η表示学习率;
λi是一个关于企业i的系数;
损失函数C的值可通过步骤3.2使用特征编码结果b计算得到。
步骤3.4,根据模型指标特征编码集合和监督信息,采用随机梯度下降优化方法构建并训练企业用电行为分析模型。
基于随机梯度下降优化模型构建企业用电行为分析模型,以如下公式表示,
si,sj=f(ai,aj;w) (4)
式中:w为步骤3.3所得到的模型指标特征编码集合b中特征权重集;
f(ai,aj;w)表示根据企业i和企业j用电行为的模型指标特征向量ai,aj输出评估值的函数;
si=s(bi)表示企业用电行为分析模型给企业i的企业用电行为评估值,其模型输入为向量bi,为企业i的特征编码结果;
sj=s(bj)表示企业用电行为分析模型给企业j的企业用电行为评估值,其模型输入为向量bj,为企业j的特征编码结果。
步骤4,根据企业用电行为分析模型和从训练数据集中筛选出的基准企业,分析企业的用电行为。
本发明在实际企业用电行为分析时,考虑可解释性,使用百分制标准分,而使用企业用电行为分析模型输出的是整个实数范围,并无法直接拟合到标准分,因此通过步骤4规整神经网络的输出的评估值到0-100。考虑到这个目的,如要得到0-100的用电行为评价分,必须使用基准企业,只对比两家企业的用电行为相对好坏情况无法满足这一要求。
步骤4中,引入基准企业,将企业用电行为分析模型对待分析企业输出的评估值归整至0-100的评价分,具体如下:
步骤4.1,采用企业用电行为分析模型得出训练数据集中各企业的评估值,根据评估值将训练数据集中所有企业进行升序排序,第一家企业定义评价分为0分,最后一家企业定义评价分为100分,按平均间隔采样100家企业作为基准企业b1-b100,其模型指标特征集合为A={a1,a2,……a100},且定义其用电行为评价分S1-S100依次为{1,2,……,100};
步骤4.2,假设待评价企业的模型指标特征向量为a;
首先依次将待评价企业的模型指标特征向量a与基准企业的特征集合A中的每一个基准企业bi的向量ai组成一对输入到步骤3.4的企业用电行为分析模型中,得到对应的用电行为评估值s和si,即将待评价企业与每一基准企业都代入模型运行一次,共运行100次,得到s和s1-s100,基于此,寻找一对相邻的基准企业bi和bi+1,使得s位于si和si+1之间,得到待评价企业的评价分数所在区间;
根据评估值得到权重,将基准企业bi和bi+1的评价分Si和Si+1加权得到待评价企业的用电行为评价分S:
S=Si+1*(s-si)/(si+1-si)+Si*(si+1-s)/(si+1-si)。
假设i=1,基准企业1的用电行为评估值为-20.0,评价分为1,基准企业2的评估值为10.0,评价分为2,待评价企业的评估值为-5.0,则待评价企业的评价分数所在区间为1到2之间;
该待评价企业的用电行为评价分为基准企业1和基准企业2的评价分的加权组合,其权重根据企业用电行为评估值确定,具体为:2*(-5.0-(-20.0))/(10.0-(-20.0))+1*(10.0-(-5.0))/(10.0-(-20.0))=1.5。
本发明基于多层感知机和排序网络的企业用电行为分析***,运行上述的基于多层感知机和排序网络的企业用电行为分析方法,所述***包括:
模型指标特征向量构建及指标评分模块,用于构建用电特征指标集合以得到模型指标特征向量,并对各指标进行用电行为评分;
训练数据集构建模块,用于构建训练数据集,包括多个企业的模型指标特征向量构成的特征向量集,以及基于各指标用电行为评分得到的表示不同企业之间用电行为初步评价结果的监督信息;
企业用电行为分析模型训练模块,用于对训练数据集中多个企业的模型指标特征向量分别进行多层感知机处理,得到相应的模型指标特征编码集合,采用模型指标特征编码集合和监督信息,训练基于排序网络的企业用电行为分析模型;
企业的用电行为分析模块,用于根据企业用电行为分析模型和从训练数据集中筛选出的基准企业,分析企业的用电行为。
本发明的有益效果在于,与现有技术相比:
本发明采用排序方法,将电力数据不定量的维度转化成定性的问题,该方法也使得标注出来的数据准确性显著提高。而针对电力数据多维度不好利用,弱监督学习实现困难的问题,本专利采用多层感知机对电力数据进行处理,从而满足该问题;本发明采用多层感知机和排序网络构建企业用电行为分析模型,实现了自动化的企业用电行为分析,相比于人工专家评价大大降低了成本,具有良好的扩展性,从而可以更好地为金融机构提供金融风控、客户推荐、数据共享等有偿的电力数据产品和服务。
本发明首先通过基于数据的分类方法来对企业用电特征进行提取,将对企业用电行为的数据要求从定量转化为定性,大大增加了模型的可扩展性;其次利用模型指标特征向量和监督信息,通过多层感知机和排序网络的方法构建并训练企业用电行为分析模型,相比于逻辑回归、数值回归、线性回归等方法,本发明的优点是:
本发明基于多层感知机和排序网络的企业用电行为分析模型,步骤1指标评分只需帮助专家来初步评价不同企业之间用电行为得到监督信息,具体指标评分并不会用于模型训练,比如第一家企业400分,第二家企业250分,指标评分不会用于模型训练,本发明模型训练只使用了400分大于250分的标签信息和模型指标特征向量(模型指标特征向量包含的是增长率u,波动率v,差异度w等,不包含分数),因此,指标评分可以不用十分精确,因为只要分差较大,初步判断就比较准确了。即不需要给定训练样本的精确定量的用电行为评价得分,只需给出训练数据集中每一对企业用电行为好坏的定性评价,大大降低了数据标注的成本。
本发明的企业用电行为分析模型,可以克服传统的专家经验模型存在主观性较强的缺陷,能够更好利用多维度的电力大数据,确保企业用电特征提取的准确,克服了专家人工评价方法的主观性和不准确性。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。

Claims (4)

1.基于多层感知机和排序网络的企业用电行为分析方法,其特征在于:
所述方法包括以下步骤:
步骤1,构建用电特征指标集合以得到模型指标特征向量,并对各指标进行用电行为评分;
步骤2,构建训练数据集,包括多个企业的模型指标特征向量构成的特征向量集,以及基于各指标用电行为评分得到的表示不同企业之间用电行为初步评价结果的监督信息;具体包括:
步骤2.1,构建训练数据集的特征向量集:将每个企业的模型指标特征向量作为训练数据集的特征向量,并收集多个企业的模型指标特征向量构成特征向量集;
步骤2.2,构建训练数据集的监督信息:对训练数据集中的企业进行配对采样,赋予每一对企业一个表示企业间用电行为初步评价结果的标签,表示不同企业之间用电行为初步评价结果的标签构成监督信息;
其中,标签的取值方式为:
将步骤1中各指标用电行为评分累加得到的企业用电行为初步评价分数,用于初步评价不同企业之间用电行为;
比较每一对企业中第一个企业与第二个企业的初步评价分数,若第一家企业相比于第二家企业高出设定分,则标签记为1,表示第一个企业的用电行为表现更好;若第二家企业相比于第一家企业高出设定分,则标签记为-1,表示第二个企业的用电行为表现更好;其他情况,则标签记为0,表示第一个企业和第二企业的用电行为表现相同;
步骤3,对训练数据集中多个企业的模型指标特征向量分别进行多层感知机处理,得到相应的模型指标特征编码集合,采用模型指标特征编码集合和监督信息,训练基于排序网络的企业用电行为分析模型;具体包括:
步骤3.1,对训练数据集中多个企业的模型指标特征向量a分别进行多层感知机处理,得到模型指标特征编码集合b:
b=mlp(a,w)
其中,w为多层感知机mlp的参数a中各指标特征权重集;
步骤3.2,构建排序网络模型,基于排序网络模型、监督信息和排序关系对称性,构建损失函数;
构建排序网络模型以如下公式表示,
式中:
Pij表示排序网络模型认为企业i比企业j用电行为评价更好的概率;
表示假设企业i比企业j的用电行为评价更好;
σ是一个超参常数;
si=s(bi)表示企业用电行为分析模型给企业i的企业用电行为评估值;
sj=s(bj)表示企业用电行为分析模型给企业j的企业用电行为评估值;
基于排序网络模型、监督信息和排序关系对称性,构建损失函数,具体如下:
构建交叉熵损失函数,以如下公式表示,
将交叉熵损失函数公式化简得到:
式中:
Cij表示企业i和企业j的损失函数的值;
Sij属于[-1,0,1],表示根据监督信息得到的企业i和企业j之间的企业用电行为相对好坏关系;
根据排序关系对称性,即第一个企业与第二个企业相对好关系的对称性,定义一个配对集合I,要求第一个企业比第二个企业用电行为好;
定义集合I的损失函数C,公式如下:
式中,满足si>sj
步骤3.3,基于损失函数构建随机梯度下降优化模型,以对模型指标特征编码集合中的权重进行学习;
基于损失函数构建随机梯度下降优化模型,以如下公式表示,
式中:wk表示模型指标特征编码集合b中特征权重集w的第k个权重;
η表示学习率;
λi是一个关于企业i的系数;
步骤3.4,根据模型指标特征编码集合和监督信息,采用随机梯度下降优化方法构建并训练企业用电行为分析模型;
基于随机梯度下降优化模型构建企业用电行为分析模型,以如下公式表示,
si,sj=f(ai,aj;w) (4)
式中:w为步骤3.3所得到的模型指标特征编码集合b中特征权重集;
f(ai,aj;w)表示根据企业i和企业j用电行为的模型指标特征向量ai,aj输出评估值的函数;
si=s(bi)表示企业用电行为分析模型给企业i的企业用电行为评估值;
sj=s(bj)表示企业用电行为分析模型给企业j的企业用电行为评估值;
步骤4,根据企业用电行为分析模型和从训练数据集中筛选出的基准企业,分析企业的用电行为。
2.根据权利要求1所述的基于多层感知机和排序网络的企业用电行为分析方法,其特征在于:
步骤1中,构建包括企业的用电负荷水平指标、用电规范指标和用电互动能力指标的用电特征指标集合,将用电特征指标集合中各指标顺序拼接得到模型指标特征向量;并根据专家经验对各指标进行用电行为评分,以用于构建监督信息。
3.根据权利要求1所述的基于多层感知机和排序网络的企业用电行为分析方法,其特征在于:
步骤4中,引入基准企业,将企业用电行为分析模型对待分析企业输出的评估值归整至0-100的评价分,具体如下:
步骤4.1,采用企业用电行为分析模型得出训练数据集中各企业的评估值,根据评估值将训练数据集中所有企业进行升序排序,第一家企业定义评价分为0分,最后一家企业定义评价分为100分,按平均间隔采样100家企业作为基准企业b1-b100,其模型指标特征集合为A={a1,a2,……a100},且定义其用电行为评价分S1-S100依次为{1,2,……,100};
步骤4.2,假设待评价企业的模型指标特征向量为a;
首先依次将待评价企业的模型指标特征向量a与基准企业的特征集合A中的每一个基准企业bi的向量ai组成一对输入到企业用电行为分析模型中,得到对应的用电行为评估值s和si,基于此,寻找一对相邻的基准企业bi和bi+1,使得s位于si和si+1之间,根据评估值得到权重,将基准企业bi和bi+1的评价分Si和Si+1加权得到待评价企业的用电行为评价分S:
S=Si+1*(s-si)/(si+1-si)+Si*(si+1-s)/(si+1-si)。
4.基于多层感知机和排序网络的企业用电行为分析***,运行如权利要求1至3中任一项所述的基于多层感知机和排序网络的企业用电行为分析方法,其特征在于:
所述***包括:
模型指标特征向量构建及指标评分模块,用于构建用电特征指标集合以得到模型指标特征向量,并对各指标进行用电行为评分;
训练数据集构建模块,用于构建训练数据集,包括多个企业的模型指标特征向量构成的特征向量集,以及基于各指标用电行为评分得到的表示不同企业之间用电行为初步评价结果的监督信息;
企业用电行为分析模型训练模块,用于对训练数据集中多个企业的模型指标特征向量分别进行多层感知机处理,得到相应的模型指标特征编码集合,采用模型指标特征编码集合和监督信息,训练基于排序网络的企业用电行为分析模型;
企业的用电行为分析模块,用于根据企业用电行为分析模型和从训练数据集中筛选出的基准企业,分析企业的用电行为。
CN202210737510.1A 2022-06-27 2022-06-27 基于多层感知机和排序网络的企业用电行为分析方法及*** Active CN115310999B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210737510.1A CN115310999B (zh) 2022-06-27 2022-06-27 基于多层感知机和排序网络的企业用电行为分析方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210737510.1A CN115310999B (zh) 2022-06-27 2022-06-27 基于多层感知机和排序网络的企业用电行为分析方法及***

Publications (2)

Publication Number Publication Date
CN115310999A CN115310999A (zh) 2022-11-08
CN115310999B true CN115310999B (zh) 2024-02-02

Family

ID=83856032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210737510.1A Active CN115310999B (zh) 2022-06-27 2022-06-27 基于多层感知机和排序网络的企业用电行为分析方法及***

Country Status (1)

Country Link
CN (1) CN115310999B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115907119A (zh) * 2022-11-11 2023-04-04 国网江苏省电力有限公司苏州供电分公司 企业电力消费成长分预测方法和***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020000399A1 (zh) * 2018-06-29 2020-01-02 东莞理工学院 一种基于智能电网的多智能体深度强化学习代理方法
CN112633421A (zh) * 2021-03-09 2021-04-09 国网江西综合能源服务有限公司 一种用户异常用电行为检测方法及装置
CN113988459A (zh) * 2021-11-11 2022-01-28 国网江苏省电力有限公司苏州供电分公司 一种基于电力营销数据的中小企业成长性评估方法及***
CN114004530A (zh) * 2021-11-11 2022-02-01 国网江苏省电力有限公司苏州供电分公司 基于排序支撑向量机的企业电力信用分建模方法及***
CN114219606A (zh) * 2021-11-11 2022-03-22 国网四川省电力公司信息通信公司 一种基于电力数据的用电企业信用评价的方法和***

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11250314B2 (en) * 2017-10-27 2022-02-15 Cognizant Technology Solutions U.S. Corporation Beyond shared hierarchies: deep multitask learning through soft layer ordering
US11232344B2 (en) * 2017-10-31 2022-01-25 General Electric Company Multi-task feature selection neural networks
US20190378017A1 (en) * 2018-06-12 2019-12-12 Sun-Yuan Kung System and method for implementing a neural network
WO2020050872A1 (en) * 2018-09-04 2020-03-12 Didi Research America, Llc System and method for ride order dispatching and vehicle repositioning
US20210248450A1 (en) * 2020-02-07 2021-08-12 Google Llc Sorting attention neural networks

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020000399A1 (zh) * 2018-06-29 2020-01-02 东莞理工学院 一种基于智能电网的多智能体深度强化学习代理方法
CN112633421A (zh) * 2021-03-09 2021-04-09 国网江西综合能源服务有限公司 一种用户异常用电行为检测方法及装置
CN113988459A (zh) * 2021-11-11 2022-01-28 国网江苏省电力有限公司苏州供电分公司 一种基于电力营销数据的中小企业成长性评估方法及***
CN114004530A (zh) * 2021-11-11 2022-02-01 国网江苏省电力有限公司苏州供电分公司 基于排序支撑向量机的企业电力信用分建模方法及***
CN114219606A (zh) * 2021-11-11 2022-03-22 国网四川省电力公司信息通信公司 一种基于电力数据的用电企业信用评价的方法和***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
售电市场环境下基于数据驱动的用户用电行为分析;赵阳;胡诗尧;杨书强;冯成;王毅;;电力需求侧管理(第04期);第45-50页 *
基于多模态知识感知注意力机制的问答方法;张莹莹;钱胜胜;方全;徐常胜;;计算机研究与发展(第05期);第1037-1045页 *

Also Published As

Publication number Publication date
CN115310999A (zh) 2022-11-08

Similar Documents

Publication Publication Date Title
CN111414942B (zh) 一种基于主动学习和卷积神经网络的遥感图像分类方法
CN108921604B (zh) 一种基于代价敏感分类器集成的广告点击率预测方法
CN109492748B (zh) 一种基于卷积神经网络的电力***的中长期负荷预测模型建立方法
CN112613536B (zh) 一种基于smote和深度学习的近红外光谱柴油牌号识别方法
CN111583031A (zh) 一种基于集成学习的申请评分卡模型建立方法
CN111079941B (zh) 信用信息处理方法、***、终端和存储介质
CN110807760A (zh) 一种烟叶分级方法及***
CN112925908A (zh) 一种基于Attention的图注意力网络的文本分类方法及***
CN116109195B (zh) 一种基于图卷积神经网络的绩效评估方法及***
CN115470962A (zh) 一种基于LightGBM的企业失信风险预测模型构建方法
CN115310999B (zh) 基于多层感知机和排序网络的企业用电行为分析方法及***
CN114004530B (zh) 基于排序支撑向量机的企业电力信用分建模方法及***
CN115795351A (zh) 一种基于残差网络和2d特征表示的电梯大数据风险预警方法
CN113837266B (zh) 一种基于特征提取和Stacking集成学习的软件缺陷预测方法
CN114764682A (zh) 一种基于多机器学习算法融合的大米安全风险评估方法
CN113591947A (zh) 基于用电行为的电力数据聚类方法、装置和存储介质
CN112686498A (zh) 一种基于深度卷积网络的企业信用评级方法
CN112163731A (zh) 一种基于加权随机森林的专变用户电费回收风险识别方法
CN111369124A (zh) 一种基于自生成全局特征和注意力的图像美学预测方法
CN113191569A (zh) 一种基于大数据的企业管理方法及***
CN114626594A (zh) 一种基于聚类分析和深度学习的中长期电量预测方法
CN113205274A (zh) 一种施工质量定量化排名方法
CN113807671A (zh) 一种基于多源数据的油井供采匹配程度量化评估方法
CN112508625A (zh) 基于多分枝残差注意力网络的智能稽查建模方法
CN118133051B (zh) 一种要素评估模型的构建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant