CN111178587B - 一种基于spark框架的短期电力负荷快速预测方法 - Google Patents
一种基于spark框架的短期电力负荷快速预测方法 Download PDFInfo
- Publication number
- CN111178587B CN111178587B CN201911243179.2A CN201911243179A CN111178587B CN 111178587 B CN111178587 B CN 111178587B CN 201911243179 A CN201911243179 A CN 201911243179A CN 111178587 B CN111178587 B CN 111178587B
- Authority
- CN
- China
- Prior art keywords
- data
- load
- spark
- time
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 38
- 238000001514 detection method Methods 0.000 claims abstract description 17
- 230000002159 abnormal effect Effects 0.000 claims abstract description 16
- 230000008569 process Effects 0.000 claims abstract description 12
- 238000005516 engineering process Methods 0.000 claims abstract description 11
- 235000018185 Betula X alpestris Nutrition 0.000 claims abstract description 9
- 235000018212 Betula X uliginosa Nutrition 0.000 claims abstract description 9
- 230000000694 effects Effects 0.000 claims description 6
- 238000005192 partition Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 11
- 238000010025 steaming Methods 0.000 abstract description 5
- 238000000605 extraction Methods 0.000 abstract description 2
- 238000010606 normalization Methods 0.000 abstract description 2
- 238000002474 experimental method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013439 planning Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于spark框架的短期电力负荷快速预测方法,该方法将训练两个模型,一个是使用BIRCH并行化算法对历史负荷数据和天气数据进行聚类,得到一个用于异常检测的模型,另一个是使用基于spark技术的lightGBM算法对历史负荷数据和天气数据进行训练,得到一个负荷预测模型,然后这两个模型发送至Spark Streaming集群,用于对实时数据流的聚类和预测;在对实时数据流的聚类和预测中使用kafka集群接收从各种终端发送过来的电力负荷数据流,并将数据流传送到Spark Steaming集群处理,在Spark Steaming集群上完成实时特征提取及归一化处理,使用异常检测模型进行实时聚类,以发现是否有异常数据,然后利用非异常的负荷数据使用负荷预测模型预测下一个时间段的负荷值。
Description
技术领域
本发明涉及电力负荷预测技术领域,具体涉及一种基于spark框架的短期电力负荷快速预测方法。
背景技术
随着国家电网的发展,智能用电终端和采集终端数量日益扩大,数据获取越来越便捷,使得各种类型的电力自动化数据出现几何级的增长,呈现出“体量大”、“类型多”、“密度低”和“增速快”的典型大数据特征。
电力***负荷预测是电力***各种安全技术措施的重要组成部分,它和继电保护、稳定计算、短路计算一样,对电力***的安全、经济、稳定运行有着非常重要的作用。负荷预测是电网规划及经营工作的基础,准确的负荷预测有助于提高***运行的安全性和稳定性,能够减少发电成本、可以保证规划的精确。
短期负荷预测是指周以内的负荷预测,可用于安排电力调度计划,包括负荷经济分配,电力***安全性检测,设备检修等。在未来的多变且分布式电网场景中,短期负荷预测变得更加重要。对于短期负荷预测,现有的方法大多将研究的重点放在了对于预测模型的改进或者创新上,如使用创新的机器学习模型用于电力负荷预测、使用改进的机器学习模型用于电力负荷预测等,虽然基于数据驱动的智能模型精度越来越高,但是随着数据量和数据维度的增多,导致智能模型在精度提高的同时,模型的复杂度和训练时间指数级增加,甚至难以收敛。而且,传统的数据管理模式在面对海量数据的存储和处理时效率低下,传统用电负荷数据分析的模式仍是以静态离线数据分析为主,例如,将采集到的数据存储起来,然后定时对数据进行分析,这种方式存在与生产运行***结合不紧密,不利于快速预测***的负荷状况以及及时发现异常现象。在很多场景下,预测***期望对实时到达的数据进行同步处理,以满足预测***对实时性和动态扩展性的需求。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种基于spark框架的短期电力负荷快速预测方法,该方法使用spark框架将BIRCH算法并行化,克服了传统单机算法对大规模负荷数据聚类速度缓慢的问题,还使用kafka和spark streaming实现对电力负荷实时数据流的处理,数据处理后使用负荷预测模型进行预测,实现了对负荷的快速预测,且预测相比单机算法具有更高的精度和效率。
本发明的目的通过下述技术方案实现:
一种基于spark框架的短期电力负荷快速预测方法,包括下述步骤:
步骤一,利用spark技术实现BIRCH算法的并行化算法对历史数据进行聚类,具体如下:
(1)使用python爬虫收集某城市某一时间段内的历史电力负荷数据和对应的历史天气数据从而形成原始数据集,其中负荷数据的时间粒度为5分钟,天气数据时间粒度为1小时,并将其存储在HDFS上,该HDFS是一种Hadoop分布式文件***;
(2)从HDFS中将原始数据集读取到spark集群的内存中转换为所需的弹性分布式数据集RDD,对数据进行缺失数据填充、数据归一化和特征提取,选择的主要特征有时间特征、温度、湿度、露点、天气状况、前两天的同期负荷值和前一天同期负荷值,最后生成训练样本集;
(3)将训练样本集数据分发给spark集群中的每个worker,每个worker在各自的分区建立自己的聚类特征树CF-Tree;
(4)将每个分区建立的聚类特征树CF-Tree进行合并,生成一颗大的聚类特征树CF-Tree,该聚类特征树CF-Tree将作为异常数据检测模型;
步骤二,使用基于spark技术的lightGBM算法训练预测模型的过程,具体如下:
(1)将历史负荷数据和天气数据读取到spark内存中生成原始数据集;
(2)特征工程:①数据清洗:补齐负荷数据和天气数据中的缺失值;②特征选择:选择的主要特征有时间特征、温度、湿度、露点、天气状况、前两天的同期负荷值、前一天同期负荷值和前5分钟的负荷值,由于天气信息的时间粒度为1小时,负荷数据的时间粒度为5分钟,所以使用KNN算法去补全负荷数据中缺失的天气信息;③对特征进行归一化处理;
(3)模型训练:①将上一步骤中所获得的数据切分为训练集和测试集;②在spark平台上实现lightGBM算法的并行化,使用训练集对并行化后的算法进行训练,对模型进行参数调优,最后得到负荷预测模型;
步骤三,实时负荷异常检测和负荷预测,具体如下:
(1)将步骤一和步骤二所生成的异常检测模型和负荷预测模型发送到sparkstreaming集群;
(2)使用kafka集群接收各种终端实时采集到的带有实时负荷值和天气信息的数据,spark streaming集群接收kafka的数据并对数据进行处理,将处理后的数据***到聚类特征树CF-Tree中,如果某条数据点在***过程中导致聚类特征树CF-Tree的叶子节点数量增加,则判定该条数据中负荷值为异常值,反之判定为正常值;
(3)从原始数据集和实时数据流中提取所需负荷值和天气信息,其中所需信息包含时间特征、温度、湿度、露点、天气状况、前两天的同期负荷值、前一天同期负荷值和前五分钟的负荷值信息,其中前五分钟的负荷值为上一步骤中正常数据的负荷值;
(4)将提取后的数据输入到负荷预测模型中,预测下一个五分钟的负荷值,使用RMSE、R2和模型训练时间来评估模型效果。
本发明与现有技术相比具有以下的有益效果:
本发明提出的并行BIRCH算法在训练时所有的样本都在磁盘上,聚类特征树CF-Tree仅仅存了CF节点和对应的指针,这样有利于节约内存,此外BIRCH算法本身具有聚类速度快的优点,只需要一遍扫描训练集就可以建立聚类特征树CF-Tree;本发明中使用spark将算法并行化,进一步提高了训练速度,能有效解决电力***中海量数据处理效率低下的问题。
附图说明
图1为本发明的流程示意图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
本发明对电力大数据环境下高精度和实时性的负荷预测展开了研究,提出了一种基于Spark平台的短期电力负荷快速预测方法(spark是继hadoop之后的新一代大数据分布式处理框架,基于内存计算技术,从而具有更高的计算效率;Spark Steaming是spark针对数据流处理的扩展,适合处理高可扩展性、高吞吐率和容错机制的实时数据流)。本发明将训练两个模型,一个是使用BIRCH并行化算法对历史负荷数据和天气数据进行聚类,得到一个用于异常检测的模型,另一个是使用基于spark技术的lightGBM算法对历史负荷数据和天气数据进行训练,得到一个负荷预测模型,然后这两个模型发送至Spark Streaming集群,用于对实时数据流的聚类和预测;在对实时数据流的聚类和预测中使用kafka集群接收从各种终端发送过来的电力负荷数据流,并将数据流传送到Spark Steaming集群处理,在Spark Steaming集群上完成实时特征提取及归一化处理,使用异常检测模型进行实时聚类,以发现是否有异常数据,将异常负荷报告给相关人员,然后利用非异常的负荷数据使用负荷预测模型预测下一个时间段的负荷值。
本发明将BIRCH算法在spark框架上实现并行化,以解决传统技术对大规模负荷数据聚类速度缓慢的问题;使用基于spark技术的lightGBM算法对历史负荷数据和天气数据进行训练,训练得到一个负荷预测模型,以解决现有智能模型中训练时间长的问题;将上述两个模型放到spark streaming集群上对实时传输进来的数据进行快速处理和分析,实现对实时数据流进行异常数据检测和负荷预测。
具体来说,如图1所示,一种基于spark框架的短期电力负荷快速预测方法,包括下述步骤:
步骤一,利用spark技术实现BIRCH算法的并行化算法对历史数据进行聚类,具体如下:
(1)使用python爬虫收集某城市某一时间段内的历史电力负荷数据和对应的历史天气数据从而形成原始数据集,其中负荷数据的时间粒度为5分钟,天气数据时间粒度为1小时,并将其存储在HDFS上,该HDFS是一种Hadoop分布式文件***;
(2)从HDFS中将原始数据集读取到spark集群的内存中转换为所需的弹性分布式数据集RDD,对数据进行缺失数据填充、数据归一化和特征提取,选择的主要特征有时间特征、温度、湿度、露点、天气状况、前两天的同期负荷值和前一天同期负荷值,最后生成训练样本集;
(3)将训练样本集数据分发给spark集群中的每个worker,每个worker在各自的分区建立自己的聚类特征树CF-Tree;
(4)将每个分区建立的聚类特征树CF-Tree进行合并,生成一颗大的聚类特征树CF-Tree,该聚类特征树CF-Tree将作为异常数据检测模型;
步骤二,使用基于spark技术的lightGBM算法训练预测模型的过程,具体如下:
(1)将历史负荷数据和天气数据读取到spark内存中生成原始数据集;
(2)特征工程:①数据清洗:补齐负荷数据和天气数据中的缺失值;②特征选择:选择的主要特征有时间特征、温度、湿度、露点、天气状况、前两天的同期负荷值、前一天同期负荷值和前5分钟的负荷值,由于天气信息的时间粒度为1小时,负荷数据的时间粒度为5分钟,所以使用KNN算法去补全负荷数据中缺失的天气信息;③对特征进行归一化处理;
(3)模型训练:①将上一步骤中所获得的数据切分为训练集和测试集;②在spark平台上实现lightGBM算法的并行化,使用训练集对并行化后的算法进行训练,对模型进行参数调优,最后得到负荷预测模型;
步骤三,实时负荷异常检测和负荷预测,具体如下:
(1)将步骤一和步骤二所生成的异常检测模型和负荷预测模型发送到sparkstreaming集群;
(2)使用kafka集群接收各种终端实时采集到的带有实时负荷值和天气信息的数据,spark streaming集群接收kafka的数据并对数据进行处理,将处理后的数据***到聚类特征树CF-Tree中,如果某条数据点在***过程中导致聚类特征树CF-Tree的叶子节点数量增加,则判定该条数据中负荷值为异常值,反之判定为正常值;
(3)从原始数据集和实时数据流中提取所需负荷值和天气信息,其中所需信息包含时间特征、温度、湿度、露点、天气状况、前两天的同期负荷值、前一天同期负荷值和前五分钟的负荷值信息,其中前五分钟的负荷值为上一步骤中正常数据的负荷值;
(4)将提取后的数据输入到负荷预测模型中,预测下一个五分钟的负荷值,使用RMSE、R2和模型训练时间来评估模型效果。模型评估结果如附图1所示。
如图1所示,对原始数据进行特征工程后,训练得到异常检测和负荷预测两个模型,将两个模型传输到spark streaming集群,然后读取实时的负荷和天气数据进sparkstreaming集群进行特征工程,因为实时读取的数据可能含有异常的负荷值,因此首先在集群中使用异常检测模型去除掉异常数据,然后再使用负荷预测模型进行预测,最后得到预测结果。
本发明提出的并行BIRCH算法在训练时所有的样本都在磁盘上,聚类特征树CF-Tree仅仅存了CF节点和对应的指针,这样有利于节约内存,此外BIRCH算法本身具有聚类速度快的优点,只需要一遍扫描训练集就可以建立聚类特征树CF-Tree;本发明中使用spark将算法并行化,进一步提高了训练速度,能有效解决电力***中海量数据处理效率低下的问题。
其中提出的负荷预测模型的精度和训练时间相比单机算法有更好的效果,实验结果如下表所示,实验采用纽约市近3年来共34万条电力负荷数据进行实验,其中单机模式采用2核2GB内存的虚拟机进行实验,spark集群模式由3台与单机模式配置一致的虚拟机进行实验,采用均方根误差:RMSE(Root Mean Squard Error)、R2(R-Square)和训练时间来衡量模型的优劣,其中RMSE越小表示模型拟合效果越好,R2越大表示模型拟合效果越好。从下表中可以看出,本发明提出的模型有更低的误差和更短的训练时间。
训练模式 | RMSE | R2 | 训练时间/s |
单机 | 253.5 | 0.9611 | 808 |
spark集群 | 247.9 | 0.9629 | 445 |
上述为本发明较佳的实施方式,但本发明的实施方式并不受上述内容的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (1)
1.一种基于spark框架的短期电力负荷快速预测方法,其特征在于,包括下述步骤:
步骤一,利用spark技术实现BIRCH算法的并行化算法对历史数据进行聚类,具体如下:
(1)使用python爬虫收集某城市某一时间段内的历史电力负荷数据和对应的历史天气数据从而形成原始数据集,其中负荷数据的时间粒度为5分钟,天气数据时间粒度为1小时,并将其存储在HDFS上,该HDFS是一种Hadoop分布式文件***;
(2)从HDFS中将原始数据集读取到spark集群的内存中转换为所需的弹性分布式数据集RDD,对数据进行缺失数据填充、数据归一化和特征提取,选择的主要特征有时间特征、温度、湿度、露点、天气状况、前两天的同期负荷值和前一天同期负荷值,最后生成训练样本集;
(3)将训练样本集数据分发给spark集群中的每个worker,每个worker在各自的分区建立自己的聚类特征树CF-Tree;
(4)将每个分区建立的聚类特征树CF-Tree进行合并,生成一颗大的聚类特征树CF-Tree,该聚类特征树CF-Tree将作为异常数据检测模型;
步骤二,使用基于spark技术的lightGBM算法训练预测模型的过程,具体如下:
(1)将历史负荷数据和天气数据读取到spark内存中生成原始数据集;
(2)特征工程:①数据清洗:补齐负荷数据和天气数据中的缺失值;②特征选择:选择的主要特征有时间特征、温度、湿度、露点、天气状况、前两天的同期负荷值、前一天同期负荷值和前5分钟的负荷值,由于天气信息的时间粒度为1小时,负荷数据的时间粒度为5分钟,所以使用KNN算法去补全负荷数据中缺失的天气信息;③对特征进行归一化处理;
(3)模型训练:①将步骤二(1)中所获得的原始数据集切分为训练集和测试集;②在spark平台上实现lightGBM算法的并行化,使用训练集对并行化后的算法进行训练,对模型进行参数调优,最后得到负荷预测模型;
步骤三,实时负荷异常检测和负荷预测,具体如下:
(1)将步骤一和步骤二所生成的异常数据检测模型和负荷预测模型发送到sparkstreaming集群;
(2)使用kafka集群接收各种终端实时采集到的带有实时负荷值和天气信息的数据,spark streaming集群接收kafka的数据并对数据进行处理,将处理后的数据***到聚类特征树CF-Tree中,如果某条数据点在***过程中导致聚类特征树CF-Tree的叶子节点数量增加,则判定该条数据中负荷值为异常值,反之判定为正常值;
(3)从原始数据集和实时数据流中提取所需负荷值和天气信息,其中所需信息包含时间特征、温度、湿度、露点、天气状况、前两天的同期负荷值、前一天同期负荷值和前五分钟的负荷值信息,其中前五分钟的负荷值为步骤三(2)中kafka集群接收到的实时负荷值;
(4)将提取后的数据输入到负荷预测模型中,预测下一个五分钟的负荷值,使用RMSE、R2和模型训练时间来评估模型效果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911243179.2A CN111178587B (zh) | 2019-12-06 | 2019-12-06 | 一种基于spark框架的短期电力负荷快速预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911243179.2A CN111178587B (zh) | 2019-12-06 | 2019-12-06 | 一种基于spark框架的短期电力负荷快速预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111178587A CN111178587A (zh) | 2020-05-19 |
CN111178587B true CN111178587B (zh) | 2022-11-22 |
Family
ID=70653795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911243179.2A Active CN111178587B (zh) | 2019-12-06 | 2019-12-06 | 一种基于spark框架的短期电力负荷快速预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111178587B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111783827A (zh) * | 2020-05-27 | 2020-10-16 | 中能瑞通(北京)科技有限公司 | 一种基于负荷数据的企业用户分类方法和装置 |
CN112381266B (zh) * | 2020-10-22 | 2024-01-09 | 国网湖北省电力有限公司武汉供电公司 | 基于历史供电及天气数据预测未来供电量的***及其方法 |
CN112381297A (zh) * | 2020-11-16 | 2021-02-19 | 国家电网公司华中分部 | 一种基于社会信息计算的地区中长期用电量预测方法 |
CN112488365A (zh) * | 2020-11-17 | 2021-03-12 | 深圳供电局有限公司 | 一种基于负荷预测流水线框架语言的负荷预测***及方法 |
CN112594937B (zh) * | 2020-12-16 | 2022-03-18 | 珠海格力电器股份有限公司 | 热水器的控制方法、装置、电子设备及存储介质 |
CN112714080B (zh) * | 2020-12-23 | 2023-10-17 | 上海观安信息技术股份有限公司 | 一种基于spark图算法的互连关系分类方法及*** |
CN112926627A (zh) * | 2021-01-28 | 2021-06-08 | 电子科技大学 | 一种基于电容型设备缺陷数据的设备缺陷时间预测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704970A (zh) * | 2017-10-24 | 2018-02-16 | 上海电器科学研究所(集团)有限公司 | 一种基于Spark的需求侧负荷预测方法 |
CN109190855A (zh) * | 2018-10-26 | 2019-01-11 | 国网上海市电力公司 | 一种基于Spark平台和并行随机森林回归算法的电力负荷预测方法 |
CN109766950A (zh) * | 2019-01-18 | 2019-05-17 | 东北大学 | 一种基于形态聚类和LightGBM的工业用户短期负荷预测方法 |
CN110084424A (zh) * | 2019-04-25 | 2019-08-02 | 国网浙江省电力有限公司 | 一种基于lstm与lgbm的电力负荷预测方法 |
CN110188919A (zh) * | 2019-04-22 | 2019-08-30 | 武汉大学 | 一种基于长短期记忆网络的负荷预测方法 |
-
2019
- 2019-12-06 CN CN201911243179.2A patent/CN111178587B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704970A (zh) * | 2017-10-24 | 2018-02-16 | 上海电器科学研究所(集团)有限公司 | 一种基于Spark的需求侧负荷预测方法 |
CN109190855A (zh) * | 2018-10-26 | 2019-01-11 | 国网上海市电力公司 | 一种基于Spark平台和并行随机森林回归算法的电力负荷预测方法 |
CN109766950A (zh) * | 2019-01-18 | 2019-05-17 | 东北大学 | 一种基于形态聚类和LightGBM的工业用户短期负荷预测方法 |
CN110188919A (zh) * | 2019-04-22 | 2019-08-30 | 武汉大学 | 一种基于长短期记忆网络的负荷预测方法 |
CN110084424A (zh) * | 2019-04-25 | 2019-08-02 | 国网浙江省电力有限公司 | 一种基于lstm与lgbm的电力负荷预测方法 |
Non-Patent Citations (3)
Title |
---|
基于 Spark 和梯度提升树模型的短期负荷预测;许贤泽等;《华中科技大学学报(自然科学版)》;20190530;第47卷(第5期);第84-89页 * |
基于 Spark 平台和并行随机森林回归算法的;刘琪琛等;《电力建设》;20171030;第38卷(第10期);第84-92页 * |
基于spark模型的电力异常数据检测和短期负荷预测;朱昌敏;《中国优秀硕士学位论文全文数据库》;20190228;第I38-1061页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111178587A (zh) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111178587B (zh) | 一种基于spark框架的短期电力负荷快速预测方法 | |
CN109711609B (zh) | 基于小波变换和极限学习机的光伏电站输出功率预测方法 | |
CN108376982B (zh) | 负载相序的识别方法及装置 | |
AU2022204116B2 (en) | Verification method for electrical grid measurement data | |
CN111967512B (zh) | 一种异常用电检测方法、***和存储介质 | |
CN111259947A (zh) | 一种基于多模态学习的电力***故障预警方法和*** | |
CN107124394A (zh) | 一种电力通信网络安全态势预测方法和*** | |
CN110750524A (zh) | 一种有源配电网故障特征的确定方法及*** | |
CN102880989A (zh) | 一种风电出力时间序列建模方法 | |
CN106980906B (zh) | 一种基于spark的Ftrl电压预测方法 | |
CN113159102B (zh) | 一种多时间尺度的光伏功率预测方法及*** | |
CN114035468B (zh) | 基于XGBoost算法的风机检修流程预测性监控方法与*** | |
CN115795329B (zh) | 一种基于大数据网格下的用电异常行为分析方法和装置 | |
CN105574612A (zh) | 一种基于数据挖掘的光伏发电量预测方法 | |
CN115034485A (zh) | 一种基于数据空间的风电功率区间预测方法及装置 | |
CN110968703B (zh) | 基于lstm端到端抽取算法的异常计量点知识库构建方法及*** | |
CN113792939A (zh) | 基于混合威布尔分布的电能表可靠性预测方法及装置 | |
CN112633632A (zh) | 一种基于信号分解技术的集成短期风电集群功率预测方法 | |
CN114707739A (zh) | 基于大数据的风光出力预测与市场风险管控方法和*** | |
CN114020715A (zh) | 一种日志数据的处理方法、装置、介质及设备 | |
CN114676931B (zh) | 一种基于数据中台技术的电量预测*** | |
CN108427742B (zh) | 一种基于低秩矩阵的配电网可靠性数据修复方法及*** | |
CN107194529B (zh) | 基于挖掘技术的配电网可靠性经济效益分析方法及装置 | |
CN103473461B (zh) | 基于数据特征提取的风功率预测误差估计方法 | |
CN111126645A (zh) | 一种基于数据挖掘技术和改进支持向量机的风电预测算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |