CN115660725A - 多维度能源用户画像的刻画方法 - Google Patents

多维度能源用户画像的刻画方法 Download PDF

Info

Publication number
CN115660725A
CN115660725A CN202210864894.3A CN202210864894A CN115660725A CN 115660725 A CN115660725 A CN 115660725A CN 202210864894 A CN202210864894 A CN 202210864894A CN 115660725 A CN115660725 A CN 115660725A
Authority
CN
China
Prior art keywords
information
target user
user
behavior
portrait
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210864894.3A
Other languages
English (en)
Inventor
陈赟
周翔
沈浩
次仁欧珠
潘智俊
赵文恺
王佳裕
傅超然
王晓慧
洪祎祺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
State Grid Shanghai Electric Power Co Ltd
Original Assignee
Shanghai Jiaotong University
State Grid Shanghai Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University, State Grid Shanghai Electric Power Co Ltd filed Critical Shanghai Jiaotong University
Priority to CN202210864894.3A priority Critical patent/CN115660725A/zh
Publication of CN115660725A publication Critical patent/CN115660725A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种多维度能源用户画像的刻画方法,包括:获取能源管理平台里的数据库,数据库中存储有目标用户的基础数据;对数据库中的基础数据进行预处理;对***用户的基础数据信息和目标用户的基础数据信息进行关联计算以得到目标用户的第一画像信息;利用覆盖率和时间段偏好的统计方法来统计用户行为特征,确定目标用户的第二画像信息;最后通过目标能源用户用能行为,进而形成目标用户的第三画像信息,通过多维度的计算并将第一画像信息、第二画像信息和第三画像信息进行整合就能预测目标用户的最终画像信息,本发明利用丰富可靠的数据源不仅降低了能源目标用户画像信息结构不精确的情况,更可以刻画出更加精准完备的用户画像信息。

Description

多维度能源用户画像的刻画方法
技术领域
本发明涉及能源互联网技术领域,具体涉及一种多维度能源用户画像的刻画方法。
背景技术
随着能源互联网建设的不断深入,能源相关行业从上到下均积极创新,以促进能源的高效、合理利用发展。在能源互联网的建设过程中,各类能源之间的协调互补能量增强,未来综合能源利用体系将逐步演化为以用户为中心的综合能源***。其中,用户画像的重要性比重与日俱增,只有将用户的画像刻画的精准,对用户的行为轨迹分析清楚,才能够更好的发挥出数据的价值,才能将用能的价值发挥到最大。
在现有技术中,用户画像的刻画方式主要有如下几类,其一是用户自己填写自己的画像数据,本方式的问题是可能用户填写本身就是错误的或者用户填写的信息不全;其二是使用规则进行客户用户画像,通过用户近一个月的行为数据,通过每天来往的地理位置规则刻画出用户画像;但上述对于能源用户画像的刻画技术不成熟,导致能源用户画像的刻画结果不精准。
发明内容
本发明的主要目的是提供一种多维度能源用户画像的刻画方法,旨在解决现有的对于能源用户画像的全方位的信息刻画技术不成熟,导致能源用户画像的刻画结果不精准的问题。
为了解决以上问题,本发明通过以下技术方案实现:
一种多维度能源用户画像的刻画方法,包括:获取能源管理平台里的数据库,所述数据库中存储有目标用户的基础数据。对所述数据库中的所述基础数据进行预处理。
获取目标用户在第一预设时间段内的基础数据信息。
获取***用户在第二预设时间段内的基础数据信息;其中,所述第一预设时间段小于所述第二预设时间段,且所述第一预设时间段包含于所述第二预设时间段。
对所述***用户的基础数据信息和所述目标用户的基础数据信息进行关联计算以得到所述目标用户的第一画像信息。
利用覆盖率和时间段偏好的统计方法计算所述目标用户的第二画像信息。
基于深度学习的GRU算法模型通过所述目标用户的用能行为信息预测得到所述目标用户的第三画像信息。
结合所述第一画像信息、所述第二画像信息以及所述第三画像信息确定所述目标用户的最终画像信息。
可选地,所述对所述数据库中的所述基础数据进行预处理的步骤包括:
对所述数据库中的所述目标用户的数据信息中的缺失值和异常值进行剔除处理。
可选地,所述***用户为拥有对应的画像信息的用户。所述画像信息包括标签信息和对应的标签内容。所述基础数据信息包括所属行业信息、户号信息、能源消费信息、电力消费信息、供能单位信息、配电位置信息、地理位置信息以及时间信息。所述能源消费信息包括碳排放量和对应的设备名称。
可选地,所述对***用户的基础数据信息和目标用户的基础数据信息进行关联计算以得到所述目标用户的第一画像信息的步骤包括:
将所述目标用户的所属行业信息与所述***用户的所属行业信息进行关联、所述目标用户的户号信息与所述***用户的户号信息进行关联、所述目标用户的能源消费信息与所述***用户的能源消费信息进行关联、将所述目标用户的电力消费信息与所述***用户的电力消费信息进行关联、所述目标用户的供能单位信息与所述***用户的供能单位信息进行关联、所述目标用户的配电位置信息与所述***用户的配电位置信息进行关联、将所述目标用户的地理位置信息与所述***用户的地理位置信息进行关联,将所述目标用户的时间信息与所述***用户的时间信息进行关联,以得到关联比较结果;
基于所述关联比较结果,确定所述目标用户的第一画像信息。
可选地,所述基于所述关联比较结果,确定所述目标用户的第一画像信息的步骤包括:基于所述关联比较结果,将与所述目标用户的地理位置的距离小于预设距离的***用户标记为相关用户。基于所述相关用户的画像信息,获取所述目标用户与所述相关用户一致的标签内容,并标记为相关内容。将所述相关内容及对应的标签信息设置为所述目标用户的所述第一画像信息。
可选地,所述利用覆盖率和时间段偏好的统计方法计算目标用户的第二画像信息的步骤包括:将所述目标用户在某个时刻发生的某类业务行为以及行为状态定义为行为标签T,所述行为标签T为所述第二画像信息。 将每个行为标签T代表的行为特征用频次、平均值、覆盖率、偏离度、平均时间间隔、周期特征及时段偏好特征表示。所述画像信息包括行为标签信息和对应的标签内容。具有所述行为标签T的业务行为包括如下几类:目标用户的月均用能量、年度用能量最高值、年度用能量最低值、用能变化量、用能变化率、用能高峰期以及缴费情况。
可选地,所述利用覆盖率和时间段偏好的统计方法计算目标用户的第二画像信息的步骤还包括:
目标用户u在某个时间段内发生第j个行为标签的业务行为atj的覆盖率用CreateRatio表示,则覆盖率CreateRatio计算公式为:
Figure 519551DEST_PATH_IMAGE001
式中,ET-ST为统计的时间长度,sum(atj,u)ET-ST表示目标用户u在ET-ST的这段时间里,发生业务行为atj的次数总和;j表示选取目标用户u的所有行为标签里面的第j个行为标签,atj表示目标用户u的第j个行为标签的业务行为;sum(ati,u)ET-ST表示为目标用户u在ET-ST的这段时间里,发生业务行为ati的次数总和,i的取值范围为[0,n], i表示选取目标用户u的所有行为标签里面的第i个行为标签, ati表示目标用户u的第i行为标签的业务行为;目标用户u发生第j个行为标签的业务行为atj出现平均时间间隔用average(d)表示,则average(d)的计算公式为:
Figure 371839DEST_PATH_IMAGE002
其中,n表示目标用户u发生atj业务行为的次数;dJ表示目标用户u发生atj业务行为时第J次时间间隔;所述目标用户u发生第j个行为标签的业务行为atj的偏离度
Figure 812047DEST_PATH_IMAGE003
计算公式为:
Figure 960263DEST_PATH_IMAGE004
其中,n表示目标用户u发生atj业务行为的次数;dJ表示目标用户u发生atj业务行为时的第J次时间间隔;将所述目标用户u发生第j个行为标签的业务行为atj的起止时间范围进行划分,形成n个行为间隔D1,D2,...Dn
则所述业务行为atj的周期性period(atj,u)的计算公式为
Figure 537787DEST_PATH_IMAGE005
式中, sum(dI,u)表示目标用户u的行为间隔dI出现的次数,I的取值范围为[1,n];dI表示目标用户u发生atj业务行为时第I次时间间隔;如果业务行为atj没有周期性,则用0表示。如果所述目标用户u的业务行为atj发生在该时间段的次数sum(dI,u)占行为发生总次数的60%,则所述业务行为atj具有时间段偏好,时间段偏好特征TF即为该时间段。
可选地,所述基于深度学习的GRU算法对预测标签信息进行预测,得到目标用户的第三画像信息的步骤包括:将目标用户需预测的标签信息标记为待预测标签。所述待预测标签内容包括:对目标用户的未来某时刻的用能量预测,用能行为预测以及用能变化预测;建立基于深度学习的GRU算法模型;将目标用户的待预测标签及对应的标签内容作为训练数据对基于深度学习的GRU算法模型进行训练;通过完成训练的基于深度学习的GRU算法模型预测得到目标用户的待预标签和对应的标签内容,并作为所述第三画像信息。
可选地,所述将目标用户的待预测信息作为训练数据对基于深度学习的GRU算法模型进行训练的步骤包括:通过上一个节点传输下来的状态ht-1 和当前节点t的输入值xt来获取两个门控状态。得到门控状态之后,使用重置门控来得到重置之后的数据ht-1’,再将所述数据ht-1’与所述输入值xt进行拼接。
将拼接后的数据通过tanh激活函数放缩到[-1~1]的范围内,以得到当前节点状态候选状态h。将当前节点状态候选状态h同时进行遗忘和记忆。
可选地,所述门控状态包括更新门状态和重置门状态;更新门用于控制前一时刻的状态信息保留到当前状态中的程度,更新门的值越大表示前一时刻的状态信息保留越多;重置门用于确定是否要结合当前状态与先前的信息,重置门的值越小说明忽略的信息越多。
所述将当前节点状态ht的状态更新方式为:
Figure 475656DEST_PATH_IMAGE006
其中,z为更新门状态,
Figure 786683DEST_PATH_IMAGE007
, h表示当前时刻的候选状态 ;xt表示当前节点t的输入值;W表示记忆门神经元的参数,是在训练过程中学习得到的。
可选地,所述结合所述第一画像信息、所述第二画像信息以及所述第三画像信息确定所述目标用户的最终画像信息的步骤包括:将所述第一画像信息、所述第二画像信息和所述第三画像信息进行打包形成所述目标用户对应的所述最终画像信息。
本发明至少具有以下优点之一:
本发明提出的多维度能源用户画像的刻画方法通过关联数据信息维度确定目标用户的第一画像信息,利用覆盖率和时间段偏好的统计方法确定目标用户的第二画像信息,最后目标能源用户需预测的标签信息通过深度学习获取,进而形成目标用户的第三画像信息,通过这样多维度的计算并将上述第一画像信息、第二画像信息和第三画像信息进行整合就能预测目标用户的最终画像信息,丰富可靠的数据源不仅降低了能源目标用户画像信息结构不精确的情况,更可以刻画出更加精准完备的用户画像信息。本发明所采用的基础数据信息都属于目标用户的静态用能信息。现在增加了能源供应商等信息,不只是方便目标用户的使用方面,也是将供应商为目标用户的未来用能服务(即第三画像)提供信息依据。
附图说明
图1为本发明提出的一种多维度能源用户画像的刻画方法第一实施例的流程图;
图2为本发明提出的一种多维度能源用户画像的刻画方法第六实施例的GRU算法的输入输出结构图;
图3为本发明提出的一种多维度能源用户画像的刻画方法第七实施例的重置门和更新门的结构示意图;
图4为本发明提出的一种多维度能源用户画像的刻画方法第七实施例的得到当前节点状态ht的过程示意图。
具体实施方式
以下结合附图和具体实施方式对本发明提出的一种多维度能源用户画像的刻画方法作进一步详细说明。根据下面说明,本发明的优点和特征将更清楚。需要说明的是,附图采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施方式的目的。为了使本发明的目的、特征和优点能够更加明显易懂,请参阅附图。须知,本说明书所附图式所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容能涵盖的范围内。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
实施例一
如图1所示,本实施例提供一种多维度能源用户画像的刻画方法,包括:
步骤S100:获取能源管理平台里的数据库,所述数据库中存储有目标用户的基础数据。所述能源管理平台还可以称为“能源大脑”,为运用大数据分析、人工智能、云计算等技术打造的智慧城市能源云平台。
步骤S101、对所述数据库中的所述基础数据进行预处理,在本实施例中,所述步骤S101具体包括:对所述数据库中的所述目标用户的数据信息中的缺失值和异常值进行剔除处理。
可以理解的是,预处理后的数据是可以进行标签定义和操作的。在本实施例中包括基本数据和用能(即静态的和动态的数据),静态数据作为第一画像信息的关联计算的基础,动态数据作为第二画像信息和第三画像信息的基础,进行统计、计算和预测。
步骤S102、获取目标用户在第一预设时间段内的基础数据信息。
获取***用户在第二预设时间段内的基础数据信息;其中,所述第一预设时间段小于所述第二预设时间段,且所述第一预设时间段包含于所述第二预设时间段。对所述***用户的基础数据信息和所述目标用户的基础数据信息进行关联计算以得到所述目标用户的第一画像信息。
在本实施例中,这里的第一预设时间段优选为1个月,但本发明不以此为限。这里的基础数据信息可以是通过智能电表远程获取。
例如,获取目标用户A在消费能源时,能源消费信息为{"排放因子":"3","energy_name":"小名家的energy"}、电力消费信息为{"电量等级":"一级","消费等级":"高"}、地理位置信息为{"wm629s9":"A区1000号";交通地名:A路"},第一预设时间为:2021年6月1日-7月1日。
其中,所述***用户为拥有对应的画像信息的用户,画像信息包括标签信息和对应的标签内容;所述基础数据信息包括所属行业信息、户号信息、能源消费信息、电力消费信息、供能单位信息、配电位置信息、地理位置信息以及时间信息。所述第一预设时间段小于所述第二预设时间段,且第一预设时间段包含于第二预设时间段,所述能源消费信息包括碳排放量和对应的设备名称。
在本实施例中,这里的第二预设时间段为6个月,但本发明不以此为限。
例如,某***用户Y的能源消费信息为{"排放因子":"3","energy_name":"***Y0家的energy"}、电力消费信息为{"电量等级":"一级","消费等级":"低"}、地理位置信息为{"wm629s9":"A区10010号";交通地名;A路"},第二预设时间为:2021年1月1日-7月1日。
例如:画像信息中的标签信息包括:基础数据信息、营业额、行业类别、城市分类、供电电压、负荷性质、用能类别、能源活动、能源消费等级、碳排放量、能源占比、电量等级、季节用电高峰、供电质量感知、违法用电程度、用电类别、能源消费种类、抄表方式、抄表周期、账单发布日、缴费期限日和消费等级。
每个标签信息对应有标签内容,例如,营业额的标签内容为XX元;供电电压的标签内容为220V等。
在本实施例中,这里的第一画像信息即是和目标用户距离较近的***用户的画像信息,因较近距离的用户,在某些画像信息上是一致的,例如基础数据信息中季节用电高峰、电量等级、供电电压、城市分类等。
步骤S103:利用覆盖率和时间段偏好的统计方法计算所述目标用户的第二画像信息。
覆盖率表示某个时间段内该业务行为出现的次数占同类业务行为出现次数总和的比重。行为出现平均时间间隔即行为标签出现时间间隔的平均值。偏离度即行为标签出现的时间间隔的标准差,体现用户产生某种行为的时间均匀程度,偏离度越低,则该行为有可能是一种周期性行为。周期性用来衡量用户某行为是否具有周期性。时段偏好特征表示用户行为产生的时间段偏好。上述特征均从历史态和近态来描述,突出某行为的时间特征。
在本实施例中,所述步骤S103包括:将所述目标用户在某个时刻发生的某类业务行为以及行为状态定义为行为标签T,即将所述行为标签T作为所述第二画像信息; 将每个行为标签T代表的行为特征用频次、平均值、覆盖率、偏离度、平均时间间隔、周期特征及时段偏好特征表示;具有所述行为标签T的业务行为包括如下几类:目标用户的月均用能量、年度用能量最高值、年度用能量最低值、用能变化量、用能变化率、用能高峰期以及缴费情况。
在本实施例中,所述步骤S103还包括:目标用户u在某个时间段内发生第j个行为标签的业务行为atj的覆盖率用CreateRatio表示,则覆盖率CreateRatio计算公式为:
Figure 355067DEST_PATH_IMAGE001
(1)
式中,ET-ST为统计的时间长度,sum(atj,u)ET-ST表示目标用户u在ET-ST的这段时间里,发生业务行为atj的次数总和;j表示选取目标用户u的所有行为标签里面的第j个行为标签,atj表示目标用户u的第j个行为标签的业务行为;sum(ati,u)ET-ST表示为目标用户u在ET-ST的这段时间里,发生业务行为ati的次数总和,i的取值范围为[0,n], i表示选取目标用户u的所有行为标签里面的第i个行为标签, ati表示目标用户u的第i行为标签的业务行为。
目标用户发生第j个行为标签的业务行为atj出现平均时间间隔用average(d)表示,则average(d)的计算公式为:
Figure 617290DEST_PATH_IMAGE008
(2)
其中,n表示目标用户u发生atj业务行为的次数;dJ表示目标用户u发生atj业务行为时第J次时间间隔;
所述目标用户u发生第j个行为标签的业务行为atj的偏离度
Figure 109582DEST_PATH_IMAGE003
计算公式为:
Figure 727646DEST_PATH_IMAGE009
(3)
其中,n表示目标用户u发生atj业务行为的次数;dJ表示目标用户u发生atj业务行为时的第J次时间间隔;
将所述目标用户u发生第j个行为标签的业务行为atj的起止时间范围进行划分,形成n个行为间隔D1,D2,...Dn
则所述业务行为atj的周期性period(atj,u)的计算公式为
Figure 732511DEST_PATH_IMAGE010
(4)
式中,sum(dI,u)表示目标用户u的行为间隔dI出现的次数,I的取值范围为[1,n];dI表示目标用户u发生atj业务行为时第I次时间间隔。如果业务行为atj没有周期性,则用0表示。
如果所述目标用户u的业务行为atj发生在该时间段的次数sum(dI,u)占行为发生总次数的60%,则所述业务行为atj具有时间段偏好,时间段偏好特征TF即为该时间段。步骤S104:基于深度学习的GRU算法模型通过***用户的部分画像信息预测得到目标用户的第三画像信息。
具体的,经过关联计算以及覆盖率和时间段偏好的统计方法得到目标用户的画像信息可能还是不够全面,部分标签信息还是没有,就可以通过深度学习已有画像信息的***用户的部分标签。 首先生成基于深度学习的GRU算法模型,然后将目标用户的待预测标签及对应的标签内容作为训练数据对基于深度学习的GRU算法模型进行训练,这里,待预测标签内容主要为对未来某时刻的用能量预测,用能行为预测以及用能变化预测。
步骤S105:结合第一画像信息、第二画像信息以及第三画像信息确定目标用户的最终画像信息。
通过上述步骤,能够得到目标用户的第一画像信息、第二画像信息和第三画像信息,进而得到目标用户的最终画像信息。
本实施例提出的多维度能源用户画像的刻画方法通过关联数据信息维度确定目标用户的第一画像信息,利用覆盖率和时间段偏好的统计方法计算确定目标用户的第二画像信息,最后目标能源用户需预测的标签信息通过深度学习获取,进而形成目标用户的第三画像信息,通过这样多维度的计算并将上述第一画像信息、第二画像信息和第三画像信息进行整合就能预测目标用户的最终画像信息,丰富可靠的数据源不仅降低了能源目标用户画像信息结构不精确的情况,更可以刻画出更加精准完备的用户画像信息。
实施例二
基于第一实施例,本实施例与实施例一的区别在于,所述步骤S102还包括如下步骤:
步骤S1021:将所述目标用户的所属行业信息与所述***用户的所属行业信息进行关联、所述目标用户的户号信息与所述***用户的户号信息进行关联、所述目标用户的能源消费信息与所述***用户的能源消费信息进行关联、将所述目标用户的电力消费信息与所述***用户的电力消费信息进行关联、所述目标用户的供能单位信息与所述***用户的供能单位信息进行关联、所述目标用户的配电位置信息与所述***用户的配电位置信息进行关联、将所述目标用户的地理位置信息与所述***用户的地理位置信息进行关联,将所述目标用户的时间信息与所述***用户的时间信息进行关联,以得到关联比较结果。
步骤S1022:基于所述关联结果,确定目标用户的第一画像信息。
具体的,这里的关联结果就是比较目标用户的能源消费信息与***用户的所属行业信息,比较目标用户的能源消费信息与***用户的能源消费信息,比较目标用户的能源消费信息与***用户的供能单位信息,比较目标用户的能源消费信息与***用户的配电位置信息,比较目标用户的电力消费信息与***用户的电力消费信息,比较目标用户的地理位置信息与***用户的地理位置信息,比较目标用户的时间信息与***用户的时间信息。
实施例三
基于上述第二实施例,本实施例提出的一种多维度能源用户画像的刻画方法与上述实施例二的区别在于,所述步骤S1022包括如下步骤:
步骤S10221:基于所述关联结果,将与所述目标用户的地理位置的距离小于预设距离的***用户标记为相关用户。
具体的,所述合理的预设距离可以为1公里,但本发明不以此为限,即通过比较目标用户的地理位置信息与***用户的地理位置信息,从而将与目标用户的地理位置的距离小于1公里的***用户标记为相关用户。
若小于预设距离的***用户有多个,则将距离最小的***用户标记为相关用户。或者将能源消费信息和电力消费信息更接近的***用户标记为相关用户。
步骤S10222:基于相关用户的画像信息,获取目标用户与相关用户一致的标签内容,并标记为相关内容。
具体的,因目标用户和相关用户距离比较接近,则会有一些标签内容是一致的,例如:季节用电高峰、电量等级、供电电压、城市分类;这将这些标签内容标记为相关内容。
步骤S10223:将所述相关内容及对应的标签信息设置为目标用户的第一画像信息。
具体的,即将相关用户的季节用电高峰、电量等级、供电电压、城市分类作为目标用户的所述第一画像信息。
实施例四
的第四实施例中,基于第一实施例,本实施例提出的一种多维度能源用户画像的刻画方法中的步骤S104还包括如下步骤:
步骤S1041:将目标用户未拥有的且相关用户拥有的标签信息标记为待预测标签。
具体的,例如:目标用户的画像信息尚未拥有能源消费等级这一标签信息,且相关用户的画像信息用于这一标签信息,则能源消费等级为目标用户对应的待预测标签。
步骤S1042:建立基于深度学习的GRU算法模型。
步骤S1043:将相关用户的待预测标签及对应的标签内容作为训练数据对基于深度学习的GRU算法模型进行训练。
步骤S1044:通过完成训练的基于深度学习的GRU算法模型预测得到目标用户的待预标签和对应的标签内容,并作为所述第三画像信息。
具体的,通过关联数据信息以及最近邻算法维度得到目标用户的第一画像信息和第二画像信息可能还是不能够全面反映目标用户的画像,即目标用户的部分标签信息还是没有,就可以通过深度学习已有画像信息的相关用户的部分标签。 首先,将相关用户的部分标签信息进行模型训练,生成训练模块,部分标签为目标用户不携带的标签。在本专利中,***通过多维度已经预测到目标用户的大部分画像信息,其余的可以通过深度学习进行预测。
首先生成基于深度学习的GRU算法模型,然后将已有画像信息的***用户的部分标签信息对模型进行训练,这里的其中部分标签信息为目标用户尚未拥有的标签信息,例如,通过上述步骤,***已经预测到目标用户的行业分类,电量等级、营业额以及城市分类等标签信息,但是关于能源活动这个标签信息尚不具备,则可以将与目标用户具有关联性的***用户的能源活动这一标签信息及对应的标签内容进行深度学习,以得到目标用户的能源活动这一标签信息,以及对的标签内容。并将能源活动这一标签信息,以及对的标签内容作为目标用户的第三画像信息。
GRU算法(Gate Recurrent Unit)是循环神经网络(Recurrent Neural Network,RNN)的一种。和LSTM(Long-Short Term Memory)一样,也是为了解决长期记忆和反向传播中的梯度等问题而提出来的。
RNN适合分析处理时间序列数据,因为RNN在网络中引入了循环单元结构,并允许隐藏单元之间的内部连接,使探索非连续数据之间的时间关系成为可能。但RNN存在梯度消失的问题,导致随着时间间隔不断增大,RNN会丧失学习过去较久远信息的能力。
LSTM神经网络的提出解决了RNN梯度消失的问题,已被广泛应用于预测时间序列数据领域中,近年来根据不同的需求也演变出许多变体。GRU作为LSTM的一种变体,采用门控循环神经网络结构,相比 LSTM训练参数较少,又同时保持了LSTM 的预测效果。
GRU算法内部单元与LSTM的内部单元很相似,不同之处为GRU将LSTM中的输入门和遗忘门合成一个单一的更新门。因此,GRU中只有两个门结构,分别为更新门和重置门。更新门用于控制前一时刻的状态信息保留到当前状态中的程度,更新门的值越大表示前一时刻的状态信息保留越多。重置门用于确定是否要结合当前状态与先前的信息,重置门的值越小说明忽略的信息越多。
如附图2所示,GRU算法的输入输出结构与普通的RNN是一样的。
有一个当前节点t的输入值xt,和上一个节点传递下来的隐状态(hidden state)ht-1,这个隐状态包含了之前节点的相关信息。
结合输入值xt和隐状态ht-1,GRU算法会得到当前隐藏节点的输出yt和传递给下一个节点的隐状态 ht
通过上一个节点传输下来的状态ht-1 和当前节点t的输入值xt来获取两个门控状态。
具体的,如附图3所示,其中,r控制重置的门控(reset gate),z为控制更新的门控(update gate)。
得到门控状态之后,使用重置门控来得到重置之后的数据ht-1’,再将数据ht-1’与输入值xt进行拼接。由此可以理解的是,状态ht-1经重置门控处理以后状态变为数值ht-1’
将拼接后的数据通过tanh激活函数放缩到[-1~1]的范围内,以得到当前节点状态候选状态h
具体的,得到当前节点状态ht的过程如附图4所示。这里的 ht主要是包含了当前输入值的xt数据。有针对性地对ht添加到当前的隐藏状态,相当于“记忆了当前时刻的状态”。
将当前节点状态候选状态h同时进行遗忘和记忆。
具体的,本步骤使用先前得到的更新门控z(update gate),称之为“更新记忆阶段”。
实施例五
的第五实施例中,基于第四实施例,本实施例提出的一种多维度能源用户画像的刻画方法中的所述门控状态包括更新门状态和重置门状态;更新门用于控制前一时刻的状态信息保留到当前状态中的程度,更新门的值越大表示前一时刻的状态信息保留越多;重置门用于确定是否要结合当前状态与先前的信息,重置门的值越小说明忽略的信息越多。
实施例六
基于五实施例,本实施例提出的一种多维度能源用户画像的刻画方法中的所述将当前节点状态ht的状态更新方式为:
Figure 278767DEST_PATH_IMAGE011
其中,z为更新门状态,
Figure 512434DEST_PATH_IMAGE012
, h表示当前时刻的候选状态 ;xt表示当前节点t的输入值;W表示记忆门神经元的参数,是在训练过程中学习得到的; h主要包含当前输入的xt数据,相当于记忆了当前时刻的状态。
实施例七
基于第一实施例或第六实施例,本实施例提出的一种多维度能源用户画像的刻画方法中的步骤S105包括如下步骤:
将第一画像信息、第二画像信息和第三画像信息打包形成目标用户对应的最终画像信息。
具体的,通过多维度计算得到目标用户的画像信息,可能会存在类似的数据信息,具体的,***提取类似的数据信息,将数据信息进行综合整理,统计出最精确的数据信息。
再通过筛选第一画像信息、第二画像信息以及第三画像信息类似的标签信息进行综合;结合第一画像信息、第二画像信息以及第三画像信息确定目标用户的最终画像信息。
综上所述,本实施例利用“能源大脑”丰富可靠的数据源不仅降低了能源目标用户画像信息结构不精确的情况,更可以刻画出更加精准完备的用户画像信息。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。

Claims (10)

1.一种多维度能源用户画像的刻画方法,其特征在于,包括:
获取能源管理平台里的数据库,所述数据库中存储有目标用户的基础数据;
对所述数据库中的所述基础数据进行预处理;
获取目标用户在第一预设时间段内的基础数据信息;
获取***用户在第二预设时间段内的基础数据信息;其中,所述第一预设时间段小于所述第二预设时间段,且所述第一预设时间段包含于所述第二预设时间段;
对所述***用户的基础数据信息和所述目标用户的基础数据信息进行关联计算以得到所述目标用户的第一画像信息;
利用覆盖率和时间段偏好的统计方法计算所述目标用户的第二画像信息;
基于深度学习的GRU算法模型通过所述目标用户的用能行为信息预测得到所述目标用户的第三画像信息;
结合所述第一画像信息、所述第二画像信息以及所述第三画像信息确定所述目标用户的最终画像信息。
2.如权利要求1所述的多维度能源用户画像的刻画方法,其特征在于,所述对所述数据库中的所述基础数据进行预处理的步骤包括:
对所述数据库中的所述目标用户的数据信息中的缺失值和异常值进行剔除处理。
3.如权利要求1所述的多维度能源用户画像的刻画方法,其特征在于,
所述***用户为拥有对应的画像信息的用户;
所述画像信息包括标签信息和对应的标签内容;
所述基础数据信息包括所属行业信息、户号信息、能源消费信息、电力消费信息、供能单位信息、配电位置信息、地理位置信息以及时间信息;
所述能源消费信息包括碳排放量和对应的设备名称。
4.如权利要求3所述的多维度能源用户画像的刻画方法,其特征在于,
所述对***用户的基础数据信息和目标用户的基础数据信息进行关联计算以得到所述目标用户的第一画像信息的步骤包括:
将所述目标用户的所属行业信息与所述***用户的所属行业信息进行关联、所述目标用户的户号信息与所述***用户的户号信息进行关联、所述目标用户的能源消费信息与所述***用户的能源消费信息进行关联、将所述目标用户的电力消费信息与所述***用户的电力消费信息进行关联、所述目标用户的供能单位信息与所述***用户的供能单位信息进行关联、所述目标用户的配电位置信息与所述***用户的配电位置信息进行关联、将所述目标用户的地理位置信息与所述***用户的地理位置信息进行关联,将所述目标用户的时间信息与所述***用户的时间信息进行关联,以得到关联比较结果;
基于所述关联比较结果,确定所述目标用户的第一画像信息。
5.如权利要求4所述的多维度能源用户画像的刻画方法,其特征在于,
所述基于所述关联比较结果,确定所述目标用户的第一画像信息的步骤包括:
基于所述关联比较结果,将与所述目标用户的地理位置的距离小于预设距离的***用户标记为相关用户;
基于所述相关用户的画像信息,获取所述目标用户与所述相关用户一致的标签内容,并标记为相关内容;
将所述相关内容及对应的标签信息设置为所述目标用户的所述第一画像信息。
6.如权利要求5所述的多维度能源用户画像的刻画方法,其特征在于,
所述利用覆盖率和时间段偏好的统计方法计算目标用户的第二画像信息的步骤包括:
将所述目标用户在某个时刻发生的某类业务行为以及行为状态定义为行为标签T,所述行为标签T为所述第二画像信息;
将每个行为标签T代表的行为特征用频次、平均值、覆盖率、偏离度、平均时间间隔、周期特征及时段偏好特征表示;
具有所述行为标签T的业务行为包括如下几类:目标用户的月均用能量、年度用能量最高值、年度用能量最低值、用能变化量、用能变化率、用能高峰期以及缴费情况。
7.如权利要求6所述的多维度能源用户画像的刻画方法,其特征在于,所述利用覆盖率和时间段偏好的统计方法计算目标用户的第二画像信息的步骤还包括:
目标用户u在某个时间段内发生第j个行为标签的业务行为atj的覆盖率用CreateRatio表示,则覆盖率CreateRatio计算公式为:
Figure FDA0003758215120000031
式中,ET-ST为统计的时间长度,sum(atj,u)ET-ST表示目标用户u在ET-ST的这段时间里,发生业务行为atj的次数总和;j表示选取目标用户u的所有行为标签里面的第j个行为标签,atj表示目标用户u的第j个行为标签的业务行为;
sum(ati,u)ET-ST表示为目标用户u在ET-ST的这段时间里,发生业务行为ati的次数总和,i的取值范围为[0,n],i表示选取目标用户u的所有行为标签里面的第i个行为标签,ati表示目标用户u的第i行为标签的业务行为;
目标用户u发生第j个行为标签的业务行为atj出现平均时间间隔用average(d)表示,则average(d)的计算公式为:
Figure FDA0003758215120000032
其中,n表示目标用户u发生atj业务行为的次数;dJ表示目标用户u发生atj业务行为时第J次时间间隔;
所述目标用户u发生第j个行为标签的业务行为atj的偏离度
Figure FDA0003758215120000033
计算公式为:
Figure FDA0003758215120000034
其中,n表示目标用户u发生atj业务行为的次数;dJ表示目标用户u发生atj业务行为时的第J次时间间隔;
将所述目标用户u发生第j个行为标签的业务行为atj的起止时间范围进行划分,形成n个行为间隔D1,D2,...Dn,则所述业务行为atj的周期性period(atj,u)的计算公式为
Figure FDA0003758215120000041
式中,sum(dI,u)表示目标用户u的行为间隔dI出现的次数,I的取值范围为[1,n];dI表示目标用户u发生atj业务行为时第I次时间间隔;
如果业务行为atj没有周期性,则用0表示;
如果所述目标用户u的业务行为atj发生在该时间段的次数sum(dI,u)占行为发生总次数的60%,则所述业务行为atj具有时间段偏好,时间段偏好特征TF即为该时间段。
8.如权利要求7所述的多维度能源用户画像的刻画方法,其特征在于,
所述基于深度学习的GRU算法对预测标签信息进行预测,得到目标用户的第三画像信息的步骤包括:
将目标用户需预测的标签信息标记为待预测标签;
所述待预测标签内容包括:对目标用户的未来某时刻的用能量预测,用能行为预测以及用能变化预测;
建立基于深度学习的GRU算法模型;
将目标用户的待预测标签及对应的标签内容作为训练数据对基于深度学习的GRU算法模型进行训练;
通过完成训练的基于深度学习的GRU算法模型预测得到目标用户的待预标签和对应的标签内容,并作为所述第三画像信息。
9.如权利要求8所述的多维度能源用户画像的刻画方法,其特征在于,
所述将目标用户的待预测信息作为训练数据对基于深度学习的GRU算法模型进行训练的步骤包括:
通过上一个节点传输下来的状态ht-1和当前节点t的输入值xt来获取两个门控状态;
得到门控状态之后,使用重置门控来得到重置之后的数据ht-1’,再将所述数据ht-1’与所述输入值xt进行拼接;
将拼接后的数据通过tanh激活函数放缩到[-1~1]的范围内,以得到当前节点状态候选状态h’;
将当前节点状态候选状态h'同时进行遗忘和记忆。
10.如权利要求9所述的多维度能源用户画像的刻画方法,其特征在于,
所述门控状态包括更新门状态和重置门状态;更新门用于控制前一时刻的状态信息保留到当前状态中的程度,更新门的值越大表示前一时刻的状态信息保留越多;重置门用于确定是否要结合当前状态与先前的信息,重置门的值越小说明忽略的信息越多;
所述将当前节点状态ht的状态更新方式为:
ht=z⊙ht-1+(1-z)⊙h’
其中,z为更新门状态,
Figure FDA0003758215120000051
h’表示当前时刻的候选状态;xt表示当前节点t的输入值;W表示记忆门神经元的参数,是在训练过程中学习得到的;
所述结合所述第一画像信息、所述第二画像信息以及所述第三画像信息确定所述目标用户的最终画像信息的步骤包括:
将所述第一画像信息、所述第二画像信息和所述第三画像信息进行打包形成所述目标用户对应的所述最终画像信息。
CN202210864894.3A 2022-07-21 2022-07-21 多维度能源用户画像的刻画方法 Pending CN115660725A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210864894.3A CN115660725A (zh) 2022-07-21 2022-07-21 多维度能源用户画像的刻画方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210864894.3A CN115660725A (zh) 2022-07-21 2022-07-21 多维度能源用户画像的刻画方法

Publications (1)

Publication Number Publication Date
CN115660725A true CN115660725A (zh) 2023-01-31

Family

ID=85023770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210864894.3A Pending CN115660725A (zh) 2022-07-21 2022-07-21 多维度能源用户画像的刻画方法

Country Status (1)

Country Link
CN (1) CN115660725A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465565A (zh) * 2020-12-11 2021-03-09 加和(北京)信息科技有限公司 一种基于机器学习的用户画像预测的方法及装置
CN115955452A (zh) * 2023-03-15 2023-04-11 上海帜讯信息技术股份有限公司 基于多轮会话意图识别的5g消息推送方法和装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465565A (zh) * 2020-12-11 2021-03-09 加和(北京)信息科技有限公司 一种基于机器学习的用户画像预测的方法及装置
CN112465565B (zh) * 2020-12-11 2023-09-26 加和(北京)信息科技有限公司 一种基于机器学习的用户画像预测的方法及装置
CN115955452A (zh) * 2023-03-15 2023-04-11 上海帜讯信息技术股份有限公司 基于多轮会话意图识别的5g消息推送方法和装置
CN115955452B (zh) * 2023-03-15 2023-06-06 上海帜讯信息技术股份有限公司 基于多轮会话意图识别的5g消息推送方法和装置

Similar Documents

Publication Publication Date Title
CN113962364B (zh) 一种基于深度学习的多因素用电负荷预测方法
Lin et al. Short-term load forecasting based on LSTM networks considering attention mechanism
US20170308934A1 (en) Management method of power engineering cost
CN115660725A (zh) 多维度能源用户画像的刻画方法
CN107230108A (zh) 业务数据的处理方法及装置
Yilmaz et al. Synthetic demand data generation for individual electricity consumers: Generative Adversarial Networks (GANs)
CN112967088A (zh) 基于知识蒸馏的营销活动预测模型结构和预测方法
CN112381673B (zh) 一种基于数字孪生的园区用电信息分析方法及装置
CN111489259A (zh) 一种基于深度学习的股票市场风险预测智能实现方法
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及***
Yang et al. An ensemble prediction system based on artificial neural networks and deep learning methods for deterministic and probabilistic carbon price forecasting
CN112330052A (zh) 一种配变负荷预测方法
CN115145993A (zh) 基于自学***台
CN115600729A (zh) 一种考虑多属性网格电网负荷预测方法
CN109657846A (zh) 电网交叉补贴规模影响因子筛选方法
CN115983485A (zh) 一种发电厂碳排放的预测方法及***
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及***
CN112508734B (zh) 基于卷积神经网络的电力企业发电量的预测方法及装置
CN111738483A (zh) 基于聚类和深层信念网络的电网降损优化方法及***
Li Prediction of house price index based on machine learning methods
Lin [Retracted] Big Data Technology in the Macrodecision‐Making Model of Regional Industrial Economic Information Applied Research
Alikhani et al. Optimal demand response programs selection using CNN‐LSTM algorithm with big data analysis of load curves
CN114004513A (zh) 一种需求预测方法、***及存储介质
Chen et al. Multi-factor stock selecting model based on residual net and LSTM deep learning algorithm
Zhao et al. A global forecasting method of heterogeneous household short-term load based on pre-trained autoencoder and deep-LSTM model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination