CN111553550A - 一种针对用户行为分析的电力大数据数据质量的评估方法 - Google Patents

一种针对用户行为分析的电力大数据数据质量的评估方法 Download PDF

Info

Publication number
CN111553550A
CN111553550A CN201911255343.1A CN201911255343A CN111553550A CN 111553550 A CN111553550 A CN 111553550A CN 201911255343 A CN201911255343 A CN 201911255343A CN 111553550 A CN111553550 A CN 111553550A
Authority
CN
China
Prior art keywords
data
accuracy
evaluating
user behavior
behavior analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911255343.1A
Other languages
English (en)
Inventor
王兆华
王博
张斌
李通
赵文辉
刘杰
陆彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201911255343.1A priority Critical patent/CN111553550A/zh
Publication of CN111553550A publication Critical patent/CN111553550A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种针对用户行为分析的电力大数据数据质量的评估方法,包括如下步骤:S1:通过数据采集模块采集若干用户的历史网络数据,并通过数据整合模块将历史网络数据进行整合;S2:对特征数据进行分层;S3:对每层数据采用简单随机抽样方法进行抽样,并获得多组分层抽样数据,汇总所述多组分层抽样数据,获得数据样本;S4:根据中央处理模块预设的规则对数据样本进行多个维度下的评估,获得每个评估指标对应的指标评价结果,然后按照权重对多个评价结果进行综合的评估;本发明通过通过权重的分配,提高了数据评估的准确性;然后按照权重对多个评价结果进行综合的评估,这样有利于提高评估结果的准确性。

Description

一种针对用户行为分析的电力大数据数据质量的评估方法
技术领域
本发明属于电力大数据数据质量的评估技术领域,具体涉及一种针对用户行为分析的电力大数据数据质量的评估方法。
背景技术
随着社会的进步与发展,电力的使用越来越广泛,各地不同程度地出现的用电紧张的问题,需对客户的用电行为进行分析,进而通过分析结果来控制供电以及制定出科学、合理、个性的用电引导策略。各种用电数据汇集后形成大数据,一旦大数据的质量不合格,或者不准确,很难得到准确的分析结果,为此,我们提出一种针对用户行为分析的电力大数据数据质量的评估方法,以解决上述背景技术中提到的问题。
发明内容
本发明的目的在于提供一种针对用户行为分析的电力大数据数据质量的评估方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种针对用户行为分析的电力大数据数据质量的评估方法,包括如下步骤:
S1:通过数据采集模块采集若干用户的历史网络数据,并通过数据整合模块将历史网络数据进行整合;
S2:在整合分类后的数据中,根据中央处理模块预设的数据特征调取特征数据,并对特征数据进行分层;
S3:对每层数据采用简单随机抽样方法进行抽样,并获得多组分层抽样数据,汇总所述多组分层抽样数据,获得数据样本;
S4:根据中央处理模块预设的规则对数据样本进行多个维度下的评估,获得每个评估指标对应的指标评价结果,然后按照权重对多个评价结果进行综合的评估;
S5:通过可视化模块对综合的评估结果进行展示。
优选的,所述步骤S1中的数据整合模块用于对历史网络数据进行过滤,该过滤包括对异常数据的剔除、对剔除后的数据的分类、对分类后的数据按照类别进行权重分配。
优选的,所述对异常数据的剔除包括对剔除掉不具有样本意义的数据、剔除掉不准确的数据、剔除掉前后浮动较大的数据。
优选的,所述步骤S2中特征数据包括多个特征参数对应的所述历史网络数据。
优选的,所述步骤S4中多个维度包括数据接入情况、准确性、完备性、一致性以及及时性,所述准确性包括数据句法准确性、数据语义准确性、数据准确性测量覆盖率、元数据准确性、数据范围的准确性以及数据值精度。
优选的,所述可视化模块方便的查看综合的评估结果,适合对算法和接口无深入了解的数据评估业务人员对综合的评估结果的查看。
与现有技术相比,本发明的有益效果是:本发明提供的一种针对用户行为分析的电力大数据数据质量的评估方法,本发明通过对历史网络数据进行整合、根据预设的数据特征调取特征数据,并对特征数据进行分层,由于分类后的数据,按照类别的不同,可能具有不同的权重,通过权重的分配,提高了数据评估的准确性。
对每层数据采用简单随机抽样方法进行抽样,并获得多组分层抽样数据,汇总所述多组分层抽样数据,获得数据样本,根据中央处理模块预设的规则对数据样本进行多个维度下的评估,获得每个评估指标对应的指标评价结果,然后按照权重对多个评价结果进行综合的评估,这样有利于提高评估结果的准确性;
可视化模块方便的查看综合的评估结果,适合对算法和接口无深入了解的数据评估业务人员对综合的评估结果的查看。
附图说明
图1为本发明一种针对用户行为分析的电力大数据数据质量的评估方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本发明提供了如图1的一种针对用户行为分析的电力大数据数据质量的评估方法,包括如下步骤:
S1:通过数据采集模块采集若干用户的历史网络数据,并通过数据整合模块将历史网络数据进行整合;
S2:在整合分类后的数据中,根据中央处理模块预设的数据特征调取特征数据,并对特征数据进行分层;
S3:对每层数据采用简单随机抽样方法进行抽样,并获得多组分层抽样数据,汇总所述多组分层抽样数据,获得数据样本;
S4:根据中央处理模块预设的规则对数据样本进行多个维度下的评估,获得每个评估指标对应的指标评价结果,然后按照权重对多个评价结果进行综合的评估;
S5:通过可视化模块对综合的评估结果进行展示。
具体的,所述步骤S1中的数据整合模块用于对历史网络数据进行过滤,该过滤包括对异常数据的剔除、对剔除后的数据的分类、对分类后的数据按照类别进行权重分配,对数据进行分类,便于后续的调取,且由于分类后的数据,按照类别的不同,可能具有不同的权重,通过权重的分配,提高了数据评估的准确性。
具体的,所述对异常数据的剔除包括对剔除掉不具有样本意义的数据、剔除掉不准确的数据、剔除掉前后浮动较大的数据,这样有利于提高数据的准确性,提高后续评估结果的准确性。
具体的,所述步骤S2中特征数据包括多个特征参数对应的所述历史网络数据。
具体的,所述步骤S4中多个维度包括数据接入情况、准确性、完备性、一致性以及及时性,所述准确性包括数据句法准确性、数据语义准确性、数据准确性测量覆盖率、元数据准确性、数据范围的准确性以及数据值精度。
具体的,所述可视化模块方便的查看综合的评估结果,适合对算法和接口无深入了解的数据评估业务人员对综合的评估结果的查看。
综上所述,与现有技术相比,本发明通过对历史网络数据进行整合、根据预设的数据特征调取特征数据,并对特征数据进行分层,这样提高对数据处理后的准确性;
对每层数据采用简单随机抽样方法进行抽样,并获得多组分层抽样数据,汇总所述多组分层抽样数据,获得数据样本,根据中央处理模块预设的规则对数据样本进行多个维度下的评估,获得每个评估指标对应的指标评价结果,然后按照权重对多个评价结果进行综合的评估,这样有利于提高评估结果的准确性;
可视化模块方便的查看综合的评估结果,适合对算法和接口无深入了解的数据评估业务人员对综合的评估结果的查看。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种针对用户行为分析的电力大数据数据质量的评估方法,其特征在于:包括如下步骤:
S1:通过数据采集模块采集若干用户的历史网络数据,并通过数据整合模块将历史网络数据进行整合;
S2:在整合分类后的数据中,根据中央处理模块预设的数据特征调取特征数据,并对特征数据进行分层;
S3:对每层数据采用简单随机抽样方法进行抽样,并获得多组分层抽样数据,汇总所述多组分层抽样数据,获得数据样本;
S4:根据中央处理模块预设的规则对数据样本进行多个维度下的评估,获得每个评估指标对应的指标评价结果,然后按照权重对多个评价结果进行综合的评估;
S5:通过可视化模块对综合的评估结果进行展示。
2.根据权利要求1所述的一种针对用户行为分析的电力大数据数据质量的评估方法,其特征在于:所述步骤S1中的数据整合模块用于对历史网络数据进行过滤,该过滤包括对异常数据的剔除、对剔除后的数据的分类、对分类后的数据按照类别进行权重分配。
3.根据权利要求2所述的一种针对用户行为分析的电力大数据数据质量的评估方法,其特征在于:所述对异常数据的剔除包括对剔除掉不具有样本意义的数据、剔除掉不准确的数据、剔除掉前后浮动较大的数据。
4.根据权利要求1所述的一种针对用户行为分析的电力大数据数据质量的评估方法,其特征在于:所述步骤S2中特征数据包括多个特征参数对应的所述历史网络数据。
5.根据权利要求1所述的一种针对用户行为分析的电力大数据数据质量的评估方法,其特征在于:所述步骤S4中多个维度包括数据接入情况、准确性、完备性、一致性以及及时性,所述准确性包括数据句法准确性、数据语义准确性、数据准确性测量覆盖率、元数据准确性、数据范围的准确性以及数据值精度。
6.根据权利要求1所述的一种针对用户行为分析的电力大数据数据质量的评估方法,其特征在于:所述可视化模块方便的查看综合的评估结果,适合对算法和接口无深入了解的数据评估业务人员对综合的评估结果的查看。
CN201911255343.1A 2019-12-10 2019-12-10 一种针对用户行为分析的电力大数据数据质量的评估方法 Pending CN111553550A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911255343.1A CN111553550A (zh) 2019-12-10 2019-12-10 一种针对用户行为分析的电力大数据数据质量的评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911255343.1A CN111553550A (zh) 2019-12-10 2019-12-10 一种针对用户行为分析的电力大数据数据质量的评估方法

Publications (1)

Publication Number Publication Date
CN111553550A true CN111553550A (zh) 2020-08-18

Family

ID=72007215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911255343.1A Pending CN111553550A (zh) 2019-12-10 2019-12-10 一种针对用户行为分析的电力大数据数据质量的评估方法

Country Status (1)

Country Link
CN (1) CN111553550A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112529677A (zh) * 2020-12-22 2021-03-19 四川新网银行股份有限公司 一种自动化数据质量评估方法和可读存储介质
CN113779150A (zh) * 2021-09-14 2021-12-10 杭州数梦工场科技有限公司 一种数据质量评估方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112529677A (zh) * 2020-12-22 2021-03-19 四川新网银行股份有限公司 一种自动化数据质量评估方法和可读存储介质
CN113779150A (zh) * 2021-09-14 2021-12-10 杭州数梦工场科技有限公司 一种数据质量评估方法及装置

Similar Documents

Publication Publication Date Title
CN110991786B (zh) 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法
CN104573355B (zh) 一种采用参数寻优支持向量机基于光声光谱法的变压器故障诊断方法
CN110634080A (zh) 异常用电检测方法、装置、设备及计算机可读存储介质
CN104504508B (zh) 基于层次分析与小波回归的台区闭环数据分析方法
CN107527114A (zh) 一种基于大数据的线路台区异常分析方法
CN112598343B (zh) 一种对数据中心的风险巡检方法、装置、设备及存储介质
CN108011367B (zh) 一种基于深度决策树算法的电力负荷特性挖掘方法
CN111553550A (zh) 一种针对用户行为分析的电力大数据数据质量的评估方法
CN111008193A (zh) 一种数据清洗与质量评价方法及***
CN110690701A (zh) 一种异常线损影响因素的分析方法
CN116933010A (zh) 一种基于多源数据融合与深度学习的负载率分析评价方法和***
CN110210719A (zh) 一种电力设备静态数据质量评估方法及***
CN111552686A (zh) 一种电力数据质量评估方法及其装置
CN111242430A (zh) 电力设备供应商评价方法和装置
CN107884646A (zh) 变电站在线监测***危急告警方法
CN111325435A (zh) 输变电设备数据质量评价方法及***
CN113689079A (zh) 基于多元线性回归和聚类分析的台区线损预测方法及***
CN112651622A (zh) 一种电能量质量评估方法和***
CN111275292B (zh) 一种基于模糊层次分析法的接地网状态评估方法
Wenjie et al. A multi-index evaluation method of voltage sag based on the comprehensive weight
CN110070256B (zh) 基于critic方法的零电量用户排查优先度权重计算方法
CN105022012B (zh) 数字式电能质量监测终端的闪变精度检测方法及***
CN111191946A (zh) 故障线路识别方法及装置、电子设备
CN111178676A (zh) 一种配电网项目投资评估方法及***
Chongde et al. Evaluation of the models for Bradford's law

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200818

WD01 Invention patent application deemed withdrawn after publication