CN111553550A - 一种针对用户行为分析的电力大数据数据质量的评估方法 - Google Patents
一种针对用户行为分析的电力大数据数据质量的评估方法 Download PDFInfo
- Publication number
- CN111553550A CN111553550A CN201911255343.1A CN201911255343A CN111553550A CN 111553550 A CN111553550 A CN 111553550A CN 201911255343 A CN201911255343 A CN 201911255343A CN 111553550 A CN111553550 A CN 111553550A
- Authority
- CN
- China
- Prior art keywords
- data
- accuracy
- evaluating
- user behavior
- behavior analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001303 quality assessment method Methods 0.000 title description 2
- 238000011156 evaluation Methods 0.000 claims abstract description 41
- 238000005070 sampling Methods 0.000 claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 23
- 230000010354 integration Effects 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000011157 data evaluation Methods 0.000 claims abstract description 8
- 238000013480 data collection Methods 0.000 claims abstract description 4
- 238000012800 visualization Methods 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 230000008030 elimination Effects 0.000 claims description 6
- 238000003379 elimination reaction Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种针对用户行为分析的电力大数据数据质量的评估方法,包括如下步骤:S1:通过数据采集模块采集若干用户的历史网络数据,并通过数据整合模块将历史网络数据进行整合;S2:对特征数据进行分层;S3:对每层数据采用简单随机抽样方法进行抽样,并获得多组分层抽样数据,汇总所述多组分层抽样数据,获得数据样本;S4:根据中央处理模块预设的规则对数据样本进行多个维度下的评估,获得每个评估指标对应的指标评价结果,然后按照权重对多个评价结果进行综合的评估;本发明通过通过权重的分配,提高了数据评估的准确性;然后按照权重对多个评价结果进行综合的评估,这样有利于提高评估结果的准确性。
Description
技术领域
本发明属于电力大数据数据质量的评估技术领域,具体涉及一种针对用户行为分析的电力大数据数据质量的评估方法。
背景技术
随着社会的进步与发展,电力的使用越来越广泛,各地不同程度地出现的用电紧张的问题,需对客户的用电行为进行分析,进而通过分析结果来控制供电以及制定出科学、合理、个性的用电引导策略。各种用电数据汇集后形成大数据,一旦大数据的质量不合格,或者不准确,很难得到准确的分析结果,为此,我们提出一种针对用户行为分析的电力大数据数据质量的评估方法,以解决上述背景技术中提到的问题。
发明内容
本发明的目的在于提供一种针对用户行为分析的电力大数据数据质量的评估方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种针对用户行为分析的电力大数据数据质量的评估方法,包括如下步骤:
S1:通过数据采集模块采集若干用户的历史网络数据,并通过数据整合模块将历史网络数据进行整合;
S2:在整合分类后的数据中,根据中央处理模块预设的数据特征调取特征数据,并对特征数据进行分层;
S3:对每层数据采用简单随机抽样方法进行抽样,并获得多组分层抽样数据,汇总所述多组分层抽样数据,获得数据样本;
S4:根据中央处理模块预设的规则对数据样本进行多个维度下的评估,获得每个评估指标对应的指标评价结果,然后按照权重对多个评价结果进行综合的评估;
S5:通过可视化模块对综合的评估结果进行展示。
优选的,所述步骤S1中的数据整合模块用于对历史网络数据进行过滤,该过滤包括对异常数据的剔除、对剔除后的数据的分类、对分类后的数据按照类别进行权重分配。
优选的,所述对异常数据的剔除包括对剔除掉不具有样本意义的数据、剔除掉不准确的数据、剔除掉前后浮动较大的数据。
优选的,所述步骤S2中特征数据包括多个特征参数对应的所述历史网络数据。
优选的,所述步骤S4中多个维度包括数据接入情况、准确性、完备性、一致性以及及时性,所述准确性包括数据句法准确性、数据语义准确性、数据准确性测量覆盖率、元数据准确性、数据范围的准确性以及数据值精度。
优选的,所述可视化模块方便的查看综合的评估结果,适合对算法和接口无深入了解的数据评估业务人员对综合的评估结果的查看。
与现有技术相比,本发明的有益效果是:本发明提供的一种针对用户行为分析的电力大数据数据质量的评估方法,本发明通过对历史网络数据进行整合、根据预设的数据特征调取特征数据,并对特征数据进行分层,由于分类后的数据,按照类别的不同,可能具有不同的权重,通过权重的分配,提高了数据评估的准确性。
对每层数据采用简单随机抽样方法进行抽样,并获得多组分层抽样数据,汇总所述多组分层抽样数据,获得数据样本,根据中央处理模块预设的规则对数据样本进行多个维度下的评估,获得每个评估指标对应的指标评价结果,然后按照权重对多个评价结果进行综合的评估,这样有利于提高评估结果的准确性;
可视化模块方便的查看综合的评估结果,适合对算法和接口无深入了解的数据评估业务人员对综合的评估结果的查看。
附图说明
图1为本发明一种针对用户行为分析的电力大数据数据质量的评估方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本发明提供了如图1的一种针对用户行为分析的电力大数据数据质量的评估方法,包括如下步骤:
S1:通过数据采集模块采集若干用户的历史网络数据,并通过数据整合模块将历史网络数据进行整合;
S2:在整合分类后的数据中,根据中央处理模块预设的数据特征调取特征数据,并对特征数据进行分层;
S3:对每层数据采用简单随机抽样方法进行抽样,并获得多组分层抽样数据,汇总所述多组分层抽样数据,获得数据样本;
S4:根据中央处理模块预设的规则对数据样本进行多个维度下的评估,获得每个评估指标对应的指标评价结果,然后按照权重对多个评价结果进行综合的评估;
S5:通过可视化模块对综合的评估结果进行展示。
具体的,所述步骤S1中的数据整合模块用于对历史网络数据进行过滤,该过滤包括对异常数据的剔除、对剔除后的数据的分类、对分类后的数据按照类别进行权重分配,对数据进行分类,便于后续的调取,且由于分类后的数据,按照类别的不同,可能具有不同的权重,通过权重的分配,提高了数据评估的准确性。
具体的,所述对异常数据的剔除包括对剔除掉不具有样本意义的数据、剔除掉不准确的数据、剔除掉前后浮动较大的数据,这样有利于提高数据的准确性,提高后续评估结果的准确性。
具体的,所述步骤S2中特征数据包括多个特征参数对应的所述历史网络数据。
具体的,所述步骤S4中多个维度包括数据接入情况、准确性、完备性、一致性以及及时性,所述准确性包括数据句法准确性、数据语义准确性、数据准确性测量覆盖率、元数据准确性、数据范围的准确性以及数据值精度。
具体的,所述可视化模块方便的查看综合的评估结果,适合对算法和接口无深入了解的数据评估业务人员对综合的评估结果的查看。
综上所述,与现有技术相比,本发明通过对历史网络数据进行整合、根据预设的数据特征调取特征数据,并对特征数据进行分层,这样提高对数据处理后的准确性;
对每层数据采用简单随机抽样方法进行抽样,并获得多组分层抽样数据,汇总所述多组分层抽样数据,获得数据样本,根据中央处理模块预设的规则对数据样本进行多个维度下的评估,获得每个评估指标对应的指标评价结果,然后按照权重对多个评价结果进行综合的评估,这样有利于提高评估结果的准确性;
可视化模块方便的查看综合的评估结果,适合对算法和接口无深入了解的数据评估业务人员对综合的评估结果的查看。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种针对用户行为分析的电力大数据数据质量的评估方法,其特征在于:包括如下步骤:
S1:通过数据采集模块采集若干用户的历史网络数据,并通过数据整合模块将历史网络数据进行整合;
S2:在整合分类后的数据中,根据中央处理模块预设的数据特征调取特征数据,并对特征数据进行分层;
S3:对每层数据采用简单随机抽样方法进行抽样,并获得多组分层抽样数据,汇总所述多组分层抽样数据,获得数据样本;
S4:根据中央处理模块预设的规则对数据样本进行多个维度下的评估,获得每个评估指标对应的指标评价结果,然后按照权重对多个评价结果进行综合的评估;
S5:通过可视化模块对综合的评估结果进行展示。
2.根据权利要求1所述的一种针对用户行为分析的电力大数据数据质量的评估方法,其特征在于:所述步骤S1中的数据整合模块用于对历史网络数据进行过滤,该过滤包括对异常数据的剔除、对剔除后的数据的分类、对分类后的数据按照类别进行权重分配。
3.根据权利要求2所述的一种针对用户行为分析的电力大数据数据质量的评估方法,其特征在于:所述对异常数据的剔除包括对剔除掉不具有样本意义的数据、剔除掉不准确的数据、剔除掉前后浮动较大的数据。
4.根据权利要求1所述的一种针对用户行为分析的电力大数据数据质量的评估方法,其特征在于:所述步骤S2中特征数据包括多个特征参数对应的所述历史网络数据。
5.根据权利要求1所述的一种针对用户行为分析的电力大数据数据质量的评估方法,其特征在于:所述步骤S4中多个维度包括数据接入情况、准确性、完备性、一致性以及及时性,所述准确性包括数据句法准确性、数据语义准确性、数据准确性测量覆盖率、元数据准确性、数据范围的准确性以及数据值精度。
6.根据权利要求1所述的一种针对用户行为分析的电力大数据数据质量的评估方法,其特征在于:所述可视化模块方便的查看综合的评估结果,适合对算法和接口无深入了解的数据评估业务人员对综合的评估结果的查看。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911255343.1A CN111553550A (zh) | 2019-12-10 | 2019-12-10 | 一种针对用户行为分析的电力大数据数据质量的评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911255343.1A CN111553550A (zh) | 2019-12-10 | 2019-12-10 | 一种针对用户行为分析的电力大数据数据质量的评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111553550A true CN111553550A (zh) | 2020-08-18 |
Family
ID=72007215
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911255343.1A Pending CN111553550A (zh) | 2019-12-10 | 2019-12-10 | 一种针对用户行为分析的电力大数据数据质量的评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111553550A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529677A (zh) * | 2020-12-22 | 2021-03-19 | 四川新网银行股份有限公司 | 一种自动化数据质量评估方法和可读存储介质 |
CN113779150A (zh) * | 2021-09-14 | 2021-12-10 | 杭州数梦工场科技有限公司 | 一种数据质量评估方法及装置 |
-
2019
- 2019-12-10 CN CN201911255343.1A patent/CN111553550A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529677A (zh) * | 2020-12-22 | 2021-03-19 | 四川新网银行股份有限公司 | 一种自动化数据质量评估方法和可读存储介质 |
CN113779150A (zh) * | 2021-09-14 | 2021-12-10 | 杭州数梦工场科技有限公司 | 一种数据质量评估方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110991786B (zh) | 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法 | |
CN104573355B (zh) | 一种采用参数寻优支持向量机基于光声光谱法的变压器故障诊断方法 | |
CN110634080A (zh) | 异常用电检测方法、装置、设备及计算机可读存储介质 | |
CN104504508B (zh) | 基于层次分析与小波回归的台区闭环数据分析方法 | |
CN107527114A (zh) | 一种基于大数据的线路台区异常分析方法 | |
CN112598343B (zh) | 一种对数据中心的风险巡检方法、装置、设备及存储介质 | |
CN108011367B (zh) | 一种基于深度决策树算法的电力负荷特性挖掘方法 | |
CN111553550A (zh) | 一种针对用户行为分析的电力大数据数据质量的评估方法 | |
CN111008193A (zh) | 一种数据清洗与质量评价方法及*** | |
CN110690701A (zh) | 一种异常线损影响因素的分析方法 | |
CN116933010A (zh) | 一种基于多源数据融合与深度学习的负载率分析评价方法和*** | |
CN110210719A (zh) | 一种电力设备静态数据质量评估方法及*** | |
CN111552686A (zh) | 一种电力数据质量评估方法及其装置 | |
CN111242430A (zh) | 电力设备供应商评价方法和装置 | |
CN107884646A (zh) | 变电站在线监测***危急告警方法 | |
CN111325435A (zh) | 输变电设备数据质量评价方法及*** | |
CN113689079A (zh) | 基于多元线性回归和聚类分析的台区线损预测方法及*** | |
CN112651622A (zh) | 一种电能量质量评估方法和*** | |
CN111275292B (zh) | 一种基于模糊层次分析法的接地网状态评估方法 | |
Wenjie et al. | A multi-index evaluation method of voltage sag based on the comprehensive weight | |
CN110070256B (zh) | 基于critic方法的零电量用户排查优先度权重计算方法 | |
CN105022012B (zh) | 数字式电能质量监测终端的闪变精度检测方法及*** | |
CN111191946A (zh) | 故障线路识别方法及装置、电子设备 | |
CN111178676A (zh) | 一种配电网项目投资评估方法及*** | |
Chongde et al. | Evaluation of the models for Bradford's law |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200818 |
|
WD01 | Invention patent application deemed withdrawn after publication |