CN114118638A - 风电场功率预测方法、gbdt模型横向训练方法及装置 - Google Patents

风电场功率预测方法、gbdt模型横向训练方法及装置 Download PDF

Info

Publication number
CN114118638A
CN114118638A CN202210107704.3A CN202210107704A CN114118638A CN 114118638 A CN114118638 A CN 114118638A CN 202210107704 A CN202210107704 A CN 202210107704A CN 114118638 A CN114118638 A CN 114118638A
Authority
CN
China
Prior art keywords
data
training
node
characteristic
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210107704.3A
Other languages
English (en)
Other versions
CN114118638B (zh
Inventor
凡航
陈智隆
郝天一
陈琨
王国赛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huakong Tsingjiao Information Technology Beijing Co Ltd
Original Assignee
Huakong Tsingjiao Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huakong Tsingjiao Information Technology Beijing Co Ltd filed Critical Huakong Tsingjiao Information Technology Beijing Co Ltd
Priority to CN202210107704.3A priority Critical patent/CN114118638B/zh
Publication of CN114118638A publication Critical patent/CN114118638A/zh
Application granted granted Critical
Publication of CN114118638B publication Critical patent/CN114118638B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/004Generation forecast, e.g. methods or systems for forecasting future energy generation
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/381Dispersed generators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/10Power transmission or distribution systems management focussing at grid-level, e.g. load flow analysis, node profile computation, meshed network optimisation, active network management or spinning reserve management
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2300/00Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
    • H02J2300/20The dispersed energy generation being of renewable origin
    • H02J2300/28The renewable source being wind energy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2209/00Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
    • H04L2209/46Secure multiparty computation, e.g. millionaire problem
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E10/00Energy generation through renewable energy sources
    • Y02E10/70Wind energy
    • Y02E10/76Power conversion electric or electronic aspects

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Power Engineering (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Wind Motors (AREA)

Abstract

本申请公开了一种风电场功率预测方法、GBDT模型横向训练方法及装置,包括:获取待预测风电场的风电特征数据,风电特征数据包括待预测风电场的指定时刻之前的第一预设数量个历史时刻的风电场功率;将风电特征数据,输入预先训练的GBDT模型中进行功率预测,得到待预测风电场的指定时刻之后的第二预设数量个将来时刻的风电场功率;其中,GBDT模型为多个数据节点和密文计算节点通过密文方式的信息交互和数据计算,基于多个数据节点持有的多个样本的特征数据和目标值进行训练得到的,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值。采用该方案,提高了使用GBDT模型对风电场功率进行预测的准确性。

Description

风电场功率预测方法、GBDT模型横向训练方法及装置
技术领域
本申请涉及机器学习技术领域和多方安全计算技术领域,尤其涉及一种风电场功率预测方法、GBDT模型横向训练方法及装置。
背景技术
风电场集群通常指一个包含多个风电场的地理区域,在风电场的相关技术中,经常需要对风电场功率进行预测,风电场功率预测指的是对风电场未来一段时间内按照一定的时间间隔进行预测,风电场集群功率预测指的是对风电场集群总的功率在未来一段时间内按照一定的时间间隔进行预测,例如,未来4个小时内,按照不低于15分钟的时间间隔进行预测。
准确的风电场功率预测对于调度部门制定日发电计划、调整电力***的运行方式等具有非常重要的意义,而且也为电力现货市场的交易提供了重要信息。
现有的风电场功率预测,可以采用物理方法、基于单风电场预测的累加法和空间升尺度方法等。其中,物理方法的特点在于流程清晰,预测结果的可解释性强,缺点在于预测的精度较差。基于单风电场预测的累加方法,在预测的过程中没有充分考虑风电场之间的相关性。空间升尺度方法,在考虑风电场之间相关性的时候,粒度较粗。
当前有研究提出了采用机器学习的方法用于风电场的功率预测,例如,可以使用GBDT(Gradient Boosting Decision Tree,梯度提升决策树)模型进行风电场的功率预测,GBDT是一套使用决策树技术进行模型训练的监督学习算法。通过拟合多棵决策树的方式,使模型预测结果接近训练时使用的真实值,每棵决策树所拟合的目标值,等于训练集真实值与前面若干棵决策树的预测值的差值。GBDT模型通常被应用于分类、回归等问题。
目前,针对使用GBDT模型进行风电场的功率预测的实际应用中,对GBDT模型进行训练时,往往需要大量的样本的特征数据,而对于GBDT模型的一些使用方,其自身可能无法拥有足够多的样本,无法训练出满足一定预测精度要求的GBDT模型,也就无法实现使用GBDT模型对风电场功率进行更准确的预测。
发明内容
本申请实施例提供一种风电场功率预测方法、GBDT模型横向训练方法及装置,用以解决现有技术中存在的使用GBDT模型对风电场功率进行预测的准确性较低的问题。
本申请实施例提供一种风电场功率预测方法,包括:
获取待预测风电场的风电特征数据,所述风电特征数据包括所述待预测风电场的指定时刻之前的第一预设数量个历史时刻的风电场功率;
将所述风电特征数据,输入预先训练的GBDT模型中进行功率预测,得到所述待预测风电场的所述指定时刻之后的第二预设数量个将来时刻的风电场功率,其中,所述GBDT模型为多个数据节点和密文计算节点通过密文方式的信息交互和数据计算,基于所述多个数据节点持有的多个样本的特征数据和目标值进行训练得到的,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率。
进一步的,所述风电特征数据,还包括所述待预测风电场的指定时刻之后的第三预设数量个将来时刻的预测风速;
所述相同种类特征的特征数据,还包括:该风电场的该时刻之后的第三预设数量个时刻的预测风速。
进一步的,所述待预测风电场为用于进行GBDT模型训练的多个样本中的风电场之一。
本申请实施例还提供一种GBDT模型横向训练方法,应用于训练***中的数据节点,所述训练***包括:多个数据节点和密文计算节点,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率,所述方法,包括:
获取自身持有的多个样本的每种特征的特征数据和目标值;
针对初始GBDT模型的当前决策树的当前层,使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式,计算针对所述当前层的第一训练数据;
向所述密文计算节点密文方式发送所述第一训练数据,使得所述密文计算节点基于接收的所述多个数据节点发送的各自的所述第一训练数据,按照GBDT模型的训练方式,计算针对所述当前层的第二训练数据;
接收所述密文计算节点密文方式发送的所述第二训练数据;
使用所述第二训练数据,按照GBDT模型的训练方式,完成对所述当前层的训练。
进一步的,在所述使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式,计算针对所述当前层的第一训练数据之前,还包括:
通过与所述密文计算节点之间的信息交互和数据计算,确定所述多个数据节点持有的每种特征的分箱边界,作为合并后分箱边界;
分别针对所述当前层的每个节点,按照每种特征的所述合并后分箱边界包括的分箱边界,对该节点包括的所有样本进行分箱,得到分箱结果,作为该种特征的分箱结果,当所述当前层为根节点所属的第一层时,持有的多个样本均位于根节点;
所述使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式,计算针对所述当前层的第一训练数据,包括:
使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式以及所述分箱结果,计算针对所述当前层的第一训练数据。
进一步的,所述使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式以及所述分箱结果,计算针对所述当前层的第一训练数据,包括:
针对所述当前决策树,按照所述初始GBDT模型的损失函数,计算自身持有的多个样本中每个样本的梯度;
分别针对自身持有的每种特征的分箱结果的每个分箱,将该分箱包括的样本的梯度进行聚合,得到针对该种特征的梯度聚合结果,作为针对所述当前层的第一训练数据;
所述向所述密文计算节点密文方式发送所述第一训练数据,包括:
向所述密文计算节点密文方式发送自身持有的每种特征的梯度聚合结果,使得所述密文计算节点将接收的所述多个数据节点发送的每种特征的梯度聚合结果,按照相同分箱进行对应聚合,得到针对所述多个数据节点持有的所有样本的每种特征的整体梯度聚合结果,作为针对所述当前层的第二训练数据;
所述使用所述第二训练数据,按照GBDT模型的训练方式,完成对所述当前层的训练,包括:
针对能够用于进行所述当前层的节点***的各种***标准,使用每种特征的所述整体梯度聚合结果,分别计算按照每种***标准进行节点***的评分增益值,所述各种***标准为基于所有特征的所有分箱边界确定的,评分增益值最高的***标准,作为所述当前层的***标准。
进一步的,还包括:
当所述当前层不为最后一棵决策树的最后一层时,按照所述当前层的***标准,基于自身持有的多个样本的该***标准对应的特征的特征数据,进行节点***,得到所述当前层的节点***结果,当所述当前层为所述当前决策树的最后一层时,所述当前决策树训练完成,当所述当前层为最后一棵决策树的最后一层时,GBDT模型训练完成。
进一步的,所述通过与所述密文计算节点之间的信息交互和数据计算,确定所述多个数据节点持有的每种特征的分箱边界,作为合并后分箱边界,包括:
按照自身持有的每种特征的分箱数,确定该种特征的分箱边界;
向所述密文计算节点发送自身持有的每种特征的分箱边界,使得所述密文计算节点将接收的所述多个数据节点发送的每种特征的分箱边界进行合并,得到每种特征的合并后分箱边界;
接收所述密文计算节点发送的所述合并后分箱边界。
进一步的,所述相同种类特征的特征数据,还包括:该风电场的该时刻之后的第三预设数量个时刻的预测风速。
本申请实施例还提供一种GBDT模型横向训练方法,应用于训练***中的密文计算节点,所述训练***包括:多个数据节点和密文计算节点,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率,所述方法,包括:
接收所述多个数据节点密文方式发送的各自的第一训练数据,所述第一训练数据为所述数据节点针对初始GBDT模型的当前决策树的当前层,使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式计算得到的;
基于接收的所述多个数据节点发送的各自的所述第一训练数据,按照GBDT模型的训练方式,计算针对所述当前层的第二训练数据;
向所述多个数据节点密文方式发送所述第二训练数据,使得各所述数据节点使用所述第二训练数据,按照GBDT模型的训练方式,完成对所述当前层的训练。
进一步的,在所述接收所述多个数据节点密文方式发送的各自的第一训练数据之前,还包括:
通过与所述多个数据节点之间的信息交互和数据计算,确定所述多个数据节点持有的每种特征的分箱边界,作为合并后分箱边界,使得所述多个数据节点分别针对所述当前层的每个节点,按照每种特征的所述合并后分箱边界包括的分箱边界,对该节点包括的所有样本进行分箱,得到分箱结果,作为该种特征的分箱结果,当所述当前层为根节点所属的第一层时,持有的多个样本均位于根节点,所述分箱结果用于计算所述第一训练数据。
进一步的,所述接收所述多个数据节点密文方式发送的各自的第一训练数据,包括:
接收所述多个数据节点密文方式发送的自身持有的每种特征的梯度聚合结果,所述梯度聚合结果为所述数据节点分别针对自身持有的每种特征的分箱结果的每个分箱,将该分箱包括的样本的梯度进行聚合得到的,作为针对所述当前层的第一训练数据,每个样本的梯度为所述数据节点针对所述当前决策树,按照所述初始GBDT模型的损失函数计算得到的;
所述基于接收的所述多个数据节点发送的各自的所述第一训练数据,按照GBDT模型的训练方式,计算针对所述当前层的第二训练数据,包括:
将接收的所述多个数据节点发送的每种特征的梯度聚合结果,按照相同分箱进行对应聚合,得到针对所述多个数据节点持有的所有样本的每种特征的整体梯度聚合结果,作为针对所述当前层的第二训练数据;
所述向所述多个数据节点密文方式发送所述第二训练数据,包括:
向所述多个数据节点密文方式发送所述整体梯度聚合结果,使得各所述数据节点针对能够用于进行所述当前层的节点***的各种***标准,使用每种特征的所述整体梯度聚合结果,分别计算按照每种***标准进行节点***的评分增益值,所述各种***标准为基于所有特征的所有分箱边界确定的,评分增益值最高的***标准,作为所述当前层的***标准。
进一步的,所述通过与所述多个数据节点之间的信息交互和数据计算,确定所述多个数据节点持有的每种特征的分箱边界,作为合并后分箱边界,包括:
接收每个数据节点发送的所持有的每种特征的分箱边界,该分箱边界为该数据节点按照自身持有的每种特征的分箱数确定的;
将接收的所述多个数据节点发送的每种特征的分箱边界进行合并,得到每种特征的合并后分箱边界。
进一步的,所述相同种类特征的特征数据,还包括:该风电场的该时刻之后的第三预设数量个时刻的预测风速。
本申请实施例还提供一种风电场功率预测装置,包括:
特征数据获取模块,用于获取待预测风电场的风电特征数据,所述风电特征数据包括所述待预测风电场的指定时刻之前的第一预设数量个历史时刻的风电场功率;
功率预测模块,用于将所述风电特征数据,输入预先训练的GBDT模型中进行功率预测,得到所述待预测风电场的所述指定时刻之后的第二预设数量个将来时刻的风电场功率,其中,所述GBDT模型为多个数据节点和密文计算节点通过密文方式的信息交互和数据计算,基于所述多个数据节点持有的多个样本的特征数据和目标值进行训练得到的,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率。
本申请实施例还提供一种GBDT模型横向训练装置,应用于训练***中的数据节点,所述训练***包括:多个数据节点和密文计算节点,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率,所述装置,包括:
特征数据获取模块,用于获取自身持有的多个样本的每种特征的特征数据和目标值;
训练数据计算模块,用于针对初始GBDT模型的当前决策树的当前层,使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式,计算针对所述当前层的第一训练数据;
训练数据发送模块,用于向所述密文计算节点密文方式发送所述第一训练数据,使得所述密文计算节点基于接收的所述多个数据节点发送的各自的所述第一训练数据,按照GBDT模型的训练方式,计算针对所述当前层的第二训练数据;
训练数据接收模块,用于接收所述密文计算节点密文方式发送的所述第二训练数据;
训练模块,用于使用所述第二训练数据,按照GBDT模型的训练方式,完成对所述当前层的训练。
本申请实施例还提供一种GBDT模型横向训练装置,应用于训练***中的密文计算节点,所述训练***包括:多个数据节点和密文计算节点,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率,所述装置,包括:
训练数据接收模块,用于接收所述多个数据节点密文方式发送的各自的第一训练数据,所述第一训练数据为所述数据节点针对初始GBDT模型的当前决策树的当前层,使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式计算得到的;
训练数据计算模块,用于基于接收的所述多个数据节点发送的各自的所述第一训练数据,按照GBDT模型的训练方式,计算针对所述当前层的第二训练数据;
训练数据发送模块,用于向所述多个数据节点密文方式发送所述第二训练数据,使得各所述数据节点使用所述第二训练数据,按照GBDT模型的训练方式,完成对所述当前层的训练。
本申请实施例还提供一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现上述任一风电场功率预测方法,或者,实现上述任一应用于数据节点的GBDT模型横向训练方法,或者,实现上述任一应用于密文计算节点的GBDT模型横向训练方法。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一风电场功率预测方法,或者,实现上述任一应用于数据节点的GBDT模型横向训练方法,或者,实现上述任一应用于密文计算节点的GBDT模型横向训练方法。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一风电场功率预测方法,或者,执行上述任一应用于数据节点的GBDT模型横向训练方法,或者,执行上述任一应用于密文计算节点的GBDT模型横向训练方法。
本申请有益效果包括:
本申请实施例提供的上述风电场功率预测方法中,针对待预测风电场,将包括该待预测风电场的指定时刻之前的第一预设数量个历史时刻的风电场功率的风电特征数据,输入预先训练的GBDT模型中进行功率预测,得到该待预测风电场的该指定时刻之后的第二预设数量个将来时刻的风电场功率,其中,GBDT模型为多个数据节点和密文计算节点通过密文方式的信息交互和数据计算,基于多个数据节点持有的多个样本的特征数据和目标值进行训练得到的,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率。由于在所使用的GBDT模型的训练过程中,是基于多个数据节点所持有的样本的特征数据进行训练得到的,相比仅使用一个数据节点所持有的样本的特征数据训练得到的模型,使用了更多样本的特征数据,所以该GBDT模型具有更高的预测精度,因此,使用该GBDT模型进行功率预测能够得到更准确的风电场功率。
本申请实施例提供的上述GBDT模型横向训练方法中,参与训练的多个数据节点,各自持有不同样本的相同种类的特征数据和目标值,并且,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率,在对GBDT模型训练的过程中,数据节点和密文计算节点,针对初始GBDT模型的当前决策树的当前层,分别按照GBDT模型的训练方式,计算第一训练数据和第二训练数据,并且采用密文方式传输第一训练数据和第二训练数据,并使用第二训练数据完成对当前层的训练,从而实现了使用不同的数据节点持有的风电场的功率数据进行GBDT模型的横向训练,并且,确保了参与训练的各数据节点***露自身持有样本的特征数据。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本申请的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中:
图1为本申请实施例提供的风电场功率预测方法的流程图;
图2为本申请实施例提供的GBDT模型的横向训练***的结构示意图;
图3为本申请实施例提供的应用于数据节点的GBDT模型的横向训练方法的流程图;
图4为本申请实施例提供的应用于密文计算节点的GBDT模型的横向训练方法的流程图;
图5为本申请实施例提供的GBDT模型的横向训练方法的流程图;
图6为本申请实施例提供的风电场功率预测装置的结构示意图;
图7-1为本申请实施例提供的应用于数据节点的GBDT模型的横向训练装置的结构示意图;
图7-2为本申请另一实施例提供的应用于数据节点的GBDT模型的横向训练装置的结构示意图;
图8-1为本申请实施例提供的应用于密文计算节点的GBDT模型的横向训练装置的结构示意图;
图8-2为本申请另一实施例提供的应用于密文计算节点的GBDT模型的横向训练装置的结构示意图;
图9为本申请实施例提供的电子设备的结构示意图。
具体实施方式
为了给出提高使用GBDT模型对风电场功率进行预测的准确性的实现方案,本申请实施例提供了一种风电场功率预测方法、GBDT模型横向训练方法及装置,以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本申请实施例提供一种风电场功率预测方法,如图1所示,包括:
步骤11、获取待预测风电场的风电特征数据,风电特征数据包括待预测风电场的指定时刻之前的第一预设数量个历史时刻的风电场功率;
步骤12、将风电特征数据,输入预先训练的GBDT模型中进行功率预测,得到待预测风电场的指定时刻之后的第二预设数量个将来时刻的风电场功率;
其中,GBDT模型为多个数据节点和密文计算节点通过密文方式的信息交互和数据计算,基于多个数据节点持有的多个样本的特征数据和目标值进行训练得到的,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率。
采用本申请实施例提供的上述风电场功率预测方法,由于在所使用的GBDT模型的训练过程中,是基于多个数据节点所持有的样本的特征数据进行训练得到的,相比仅使用一个数据节点所持有的样本的特征数据训练得到的模型,使用了更多样本的特征数据,所以该GBDT模型具有更高的预测精度,因此,使用该GBDT模型进行功率预测能够得到更准确的风电场功率。
进一步的,在本申请的一个实施例中,风电特征数据,还可以包括待预测风电场的指定时刻之后的第三预设数量个将来时刻的预测风速;
相应的,在GBDT模型训练的过程中,相同种类特征的特征数据,还包括:该风电场的该时刻之后的第三预设数量个时刻的预测风速。
本申请实施例中,待预测风电场可以为用于进行GBDT模型训练的多个样本中的风电场之一。
在采用本申请实施例提供的上述方法进行风电场功率预测的实际应用中,指定时刻可以基于预测的需要进行选择,第一预设数量、第二预设数量和第三预设数量,均可以基于实际需要进行灵活设置,例如,风电特征数据中的风电场功率,可以为该指定时刻之前的40个历史时刻的风电场功率,预测风速可以为该指定时刻之后的20个将来时刻的预测风速,预测得到的风电场功率可以为该指定时刻之后的16个将来时刻的风电场功率,其中,在上述各时刻中,每两个相邻时刻之间可以间隔15分钟。
目前,针对使用GBDT模型进行风电场的功率预测的实际应用中,对GBDT模型进行训练时,往往需要大量的样本的特征数据,而对于GBDT模型的一些使用方,其自身可能无法拥有足够多的样本,因此,可以多个参与方共享各自所持有的样本的特征数据进行GBDT模型的训练。
此时,对GBDT模型进行训练时的多个样本的各种特征的特征数据,是由不同的参与方持有的,例如,不同的参与方持有不同风电场的功率数据,而这些参与方之间不希望泄露自身所持有的多个样本的特征数据,从而导致无法实现对GBDT模型的有效训练。
为了解决上述问题,本申请实施例提供一种GBDT模型的横向训练方案,如图2所示,该方案应用于包括多个数据节点和密文计算节点的训练***。
训练***中的每个数据节点,属于一个数据提供方,各数据节点具有用于训练的样本,且不同数据节点具有不同样本,不同的数据节点持有相同种类特征的特征数据,数据节点主要用于本地的特征数据存储以及明文计算。
每个数据节点,还持有每个样本的进行GBDT模型训练所需要的目标值,也可以称作目标数据或标签数据,例如,可以是每个样本的目标值。
本申请实施例中,以风电场和时刻表示样本,即风电场和时刻相结合表示样本,例如,样本1为风电场1时刻1,样本2为风电场2时刻1,样本3为风电场3时刻2,相同种类特征的特征数据,包括:样本中该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率。
密文计算节点,采用密文计算协议,实现GBDT模型训练中的密文计算,所采用的密文计算协议可以是可行的各种协议,例如,本申请实施例中可以采用SS4协议,其是一种基于秘密分享(Secret sharing)的加密协议。
基于所采用的密文计算协议的需要,可以包括多个密文计算节点。
本申请实施例中,多个数据节点和密文计算节点之间,通过信息交互和数据计算,共同完成GBDT模型的横向训练,即横向切分联邦学习(Federated learning)的训练,其中,密文计算节点与数据节点之间的信息交互和数据计算,在一些情况下,针对一些指定的信息和数据,将采用密文方式,从而可以确保各数据节点***露自身持有样本的特征数据。
基于上述训练***,本申请实施例还提供一种GBDT模型横向训练方法,应用于训练***中的数据节点,如图3所示,包括:
步骤31、获取自身持有的多个样本的每种特征的特征数据和目标值;
步骤32、针对初始GBDT模型的当前决策树的当前层,使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式,计算针对当前层的第一训练数据;
步骤33、向密文计算节点密文方式发送第一训练数据,使得密文计算节点基于接收的多个数据节点发送的各自的第一训练数据,按照GBDT模型的训练方式,计算针对当前层的第二训练数据;
步骤34、接收密文计算节点密文方式发送的第二训练数据;
步骤35、使用第二训练数据,按照GBDT模型的训练方式,完成对当前层的训练。
相应的,本申请实施例还提供一种GBDT模型横向训练方法,应用于训练***中的密文计算节点,如图4所示,包括:
步骤41、接收多个数据节点密文方式发送的各自的第一训练数据,第一训练数据为数据节点针对初始GBDT模型的当前决策树的当前层,使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式计算得到的;
步骤42、基于接收的多个数据节点发送的各自的第一训练数据,按照GBDT模型的训练方式,计算针对当前层的第二训练数据;
步骤43、向多个数据节点密文方式发送第二训练数据,使得各数据节点使用第二训练数据,按照GBDT模型的训练方式,完成对当前层的训练。
采用本申请实施例提供的上述GBDT模型横向训练方法,实现了使用不同的数据节点持有的风电场的功率数据进行GBDT模型的横向训练,并且,能够确保参与训练的各数据节点***露自身持有样本的特征数据。
下面结合附图,用具体实施例对本申请提供的方法及装置进行详细描述。
本申请实施例提供一种GBDT模型的横向训练方法,如图5所示,包括如下步骤:
步骤501、数据节点进行数据初始化(data_init)。
本步骤中,数据初始化运行在所有数据节点,将所持有的原始特征数据初始化。初始化后的数据可以是浮点型的原始特征数据,并存储在数据节点本地。
初始化的过程中,也可以按列生成离散化器,离散化器的功能是将浮点型的原始特征数据,转换为整型的离散数据,用于后续GBDT模型的训练。所生成的离散化数据,可以储存在数据节点本地。
本申请实施例中,以风电场和时刻表示样本,即风电场和时刻相结合表示样本,例如,样本1为风电场1时刻1,样本2为风电场2时刻1,样本3为风电场3时刻2,相同种类特征的特征数据,包括:样本中该风电场的该时刻之前的第一预设数量个时刻的风电场功率,以及该风电场的该时刻之后的第三预设数量个时刻的预测风速。
步骤502、数据节点进行GBDT模型的模型初始化(model_init),得到初始GBDT模型,初始GBDT模型包括多棵决策树。
本步骤中,每个数据节点均进行GBDT模型的模型初始化,且得到相同结构的初始GBDT模型。
步骤503、每个数据节点按照初始GBDT模型包括的多棵决策树的排列顺序,将未训练的各决策树中的第一棵决策树作为当前决策树,对当前决策树进行树初始化(tree_init),在对当前决策树进行初始化后,当前决策树的节点结构已经确定,并且,用于训练的多个样本均被分配至当前决策树的根节点。
本步骤中,除了确定当前决策树的节点结构,还可以针对当前决策树,计算每个样本的梯度,按照初始GBDT模型的损失函数,计算自身持有的多个样本中每个样本的梯度,用于后续进行梯度聚合和评分增益值的计算。
本申请实施例中,针对当前决策树,具体可以采用如下公式计算自身持有的多个样本中每个样本的梯度:
Figure DEST_PATH_IMAGE001
Figure 62767DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE003
为多个样本中第
Figure 269626DEST_PATH_IMAGE004
个样本的一阶梯度,
Figure DEST_PATH_IMAGE005
为第
Figure 396851DEST_PATH_IMAGE004
个样本的二阶梯度,
Figure 654657DEST_PATH_IMAGE006
为初始GBDT模型的损失函数,
Figure DEST_PATH_IMAGE007
为第
Figure 22185DEST_PATH_IMAGE004
个样本的目标值,
Figure 188111DEST_PATH_IMAGE008
为训练第
Figure DEST_PATH_IMAGE009
棵决策树时,使用前
Figure 666497DEST_PATH_IMAGE010
棵决策树对第
Figure 28077DEST_PATH_IMAGE004
个样本进行预测的预测值的和值。
本申请实施例中,目标值为样本中该风电场的该时刻之后的第二预设数量个时刻的风电场功率。
步骤504、每个数据节点按照当前决策树包括的各层节点的排列顺序(从根节点指向子节点的顺序),将未训练的各层中的第一层作为当前层,对当前层进行层初始化(tree_depth_init)。
本步骤中,每个数据节点按照自身持有的每种特征的分箱数,确定该种特征的分箱边界,并向密文计算节点发送自身持有的每种特征的分箱边界。
步骤505、密文计算节点执行合并分箱边界(tree_depth_merge),即在接收到每个数据节点发送的所持有的每种特征的分箱边界之后,将接收的多个数据节点发送的每种特征的分箱边界进行合并,得到每种特征的合并后分箱边界,并向每个数据节点发送该合并后分箱边界。
本申请实施例中,由于不同的数据节点针对同一特征所确定的分箱边界可能不同,所以,本步骤中,密文计算节点将所有数据节点所针对同一特征所确定的分箱边界进行合并,得到合并后分箱边界,用于每个数据节点后续基于该合并后分箱边界对持有的样本进行分箱。
步骤506、数据节点执行特征值分箱(tree_depth_split),即每个数据节点分别针对当前层的每个节点,按照每种特征的合并后分箱边界包括的分箱边界,对该节点包括的所有样本进行分箱,得到分箱结果,作为该种特征的分箱结果,当当前层为根节点所属的第一层时,持有的多个样本均位于根节点,当当前层不为第一层时,每个节点所包括的样本可以基于上一层的节点***结果确定。
本步骤中,针对一种特征,对一个节点包括的所有样本进行分箱,可以理解为针对该种特征预先划分了多个连续的特征值区间,每个特征值区间对应一个分箱,按照样本的该特征的特征数据,将该样本分配到该特征数据所属的特征值区间对应的分箱,其中,每个特征值区间的边界,相当于所对应的分箱的边界。
步骤507、每个数据节点执行梯度聚合(tree_depth_gradactive)。
每个数据节点分别针对自身持有的每种特征的分箱结果的每个分箱,将该分箱包括的样本的梯度进行聚合,得到针对该种特征的梯度聚合结果,作为针对当前层的第一训练数据,并向密文计算节点密文方式发送自身持有的每种特征的梯度聚合结果。
步骤508、密文计算节点执行聚合结果求和(tree_depth_grad),即在接收每个数据节点密文方式发送的该数据节点自身持有的每种特征的梯度聚合结果后,将接收的多个数据节点发送的每种特征的梯度聚合结果,按照相同分箱进行对应聚合,得到针对多个数据节点持有的所有样本的每种特征的整体梯度聚合结果,作为针对当前层的第二训练数据,并向每个数据节点密文方式发送该整体梯度聚合结果。
针对每个节点的每种特征的每个分箱的整体梯度聚合结果,可以理解为是针对多个数据节点所持有的所有样本的梯度聚合结果。
步骤509、每个数据节点执行层训练完成(tree_depth_finish),即在接收到密文计算节点密文方式发送的整体梯度聚合结果后,针对能够用于进行当前层的节点***的各种***标准,使用每种特征的整体梯度聚合结果,分别计算按照每种***标准进行节点***的评分增益值,并将评分增益值最高的***标准,作为当前层的***标准。
本步骤中,各种***标准为基于所有特征的所有分箱边界确定的,例如,一个节点按照一种特征的***标准,可以是按照该特征的一个分箱边界,如果一个样本该特征的特征数据小于该分箱边界,将该样本分配到该节点的左子节点,如果该样本该特征的特征数据不小于该分箱边界,将该样本分配到该节点的右子节点。
本步骤中,针对能够用于进行当前层的节点***的各种***标准,具体可以采用如下公式计算每种***标准的评分增益值:
Figure DEST_PATH_IMAGE011
其中,
Figure 504189DEST_PATH_IMAGE012
为该***标准的评分增益值,样本集合
Figure DEST_PATH_IMAGE013
为按照该***标准进行节点***被分配到左子节点的样本的集合,样本集合
Figure 685641DEST_PATH_IMAGE014
为按照该***标准进行节点***被分配到右子节点的样本的集合,
Figure DEST_PATH_IMAGE015
Figure 154668DEST_PATH_IMAGE016
为预设参数。
其中,由于***标准均是按照分箱边界确定的,所以,样本集合
Figure 121487DEST_PATH_IMAGE013
的梯度和值,样本集合
Figure 627555DEST_PATH_IMAGE014
的梯度和值,均可以基于当前层的每个节点的每种特征的每个分箱的整体梯度聚合结果进行计算。
本步骤中,在分别计算按照每种***标准进行节点***的评分增益值,选出当前层的***标准后之后,还可以针对当前层的***标准,计算当前层的每个节点的左子节点和右子节点的权重。
具体可以采用如下公式计算当前层的每个节点的左子节点和右子节点的权重:
Figure DEST_PATH_IMAGE017
Figure 983055DEST_PATH_IMAGE018
其中,
Figure DEST_PATH_IMAGE019
为左子节点的权重,
Figure 68822DEST_PATH_IMAGE020
为右子节点的权重;
Figure 342678DEST_PATH_IMAGE010
棵决策树中每棵决策树对第
Figure 754068DEST_PATH_IMAGE004
个样本进行预测的预测值,为使用该棵决策树对第
Figure 926423DEST_PATH_IMAGE004
个样本进行分类时,第
Figure 65149DEST_PATH_IMAGE004
个样本所位于的节点的权重。
本步骤中,每个数据节点还按照当前层的***标准,基于自身持有的多个样本的该***标准对应的特征的特征数据,进行节点***,得到当前层的节点***结果,该节点***结果能够表示目前位于当前层的每个节点的样本,将被分配到该节点的哪一个子节点,即被分配到该节点的左子节点还是右子节点。
通过本步骤,每个数据节点均完成当前层的训练(tree_depth_finish),并且,由于每个数据节点所获得的合并后分箱边界和整体梯度聚合结果均相同,所以,针对当前层所确定的***标准也是相同的,但由于每个数据节点所持有的样本不同,所以,按照该相同的***标准对自身持有的样本进行节点***,得到的当前层的节点***结果是不同的。
如果当前层不是当前决策树的最后一层,则返回上述步骤504,开启当前决策树的下一层的训练,如果当前层是当前决策树的最后一层,执行下述步骤510。
步骤510、每个数据节点生成当前决策树的树模型,即完成当前决策树的训练(tree_finish)。
本步骤中还可以删除当前决策树中存储的缓存数据。
如果当前决策树不是GBDT模型的最后一棵决策树,则返回上述步骤503,开启GBDT模型的下一棵决策树的训练,如果当前决策树是GBDT模型的最后一棵决策树,执行下述步骤511。
步骤511、每个数据节点生成训练完成的GBDT模型,即完成GBDT模型的训练(model_finish),且所有数据节点所的得到的完成训练的GBDT模型时相同的。
本步骤中,还可以删除GBDT模型中存储的缓存数据。
采用本申请实施例提供的上述GBDT模型的横向训练方法,通过基于密文计算的梯度聚合步骤,保证了各参与方的数据在模型的训练过程中,既不会泄露原始的特征数据,也不会泄露关键的敏感中间数据,能够更好地实现算法安全性与算法运行效率之间的平衡。
基于同一发明构思,根据本申请上述实施例提供的风电场功率预测方法,相应地,本申请实施例还提供一种风电场功率预测装置,如图6所示,包括:
特征数据获取模块61,用于获取待预测风电场的风电特征数据,所述风电特征数据包括所述待预测风电场的指定时刻之前的第一预设数量个历史时刻的风电场功率;
功率预测模块62,用于将所述风电特征数据,输入预先训练的GBDT模型中进行功率预测,得到所述待预测风电场的所述指定时刻之后的第二预设数量个将来时刻的风电场功率,其中,所述GBDT模型为多个数据节点和密文计算节点通过密文方式的信息交互和数据计算,基于所述多个数据节点持有的多个样本的特征数据和目标值进行训练得到的,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率。
进一步的,风电特征数据,还包括待预测风电场的指定时刻之后的第三预设数量个将来时刻的预测风速;
相同种类特征的特征数据,还包括:该风电场的该时刻之后的第三预设数量个时刻的预测风速。
进一步的,待预测风电场为用于进行GBDT模型训练的多个样本中的风电场之一。
本申请实施例还提供一种GBDT模型横向训练装置,应用于训练***中的数据节点,训练***包括:多个数据节点和密文计算节点,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率,如图7-1所示,该装置,包括:
特征数据获取模块71,用于获取自身持有的多个样本的每种特征的特征数据和目标值;
训练数据计算模块72,用于针对初始GBDT模型的当前决策树的当前层,使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式,计算针对当前层的第一训练数据;
训练数据发送模块73,用于向密文计算节点密文方式发送第一训练数据,使得密文计算节点基于接收的多个数据节点发送的各自的第一训练数据,按照GBDT模型的训练方式,计算针对当前层的第二训练数据;
训练数据接收模块74,用于接收密文计算节点密文方式发送的第二训练数据;
训练模块75,用于使用第二训练数据,按照GBDT模型的训练方式,完成对当前层的训练。
进一步的,如图7-2所示,还包括:
分箱边界确定模块76,用于在使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式,计算针对当前层的第一训练数据之前,通过与密文计算节点之间的信息交互和数据计算,确定多个数据节点持有的每种特征的分箱边界,作为合并后分箱边界;
分箱模块77,用于分别针对当前层的每个节点,按照每种特征的合并后分箱边界包括的分箱边界,对该节点包括的所有样本进行分箱,得到分箱结果,作为该种特征的分箱结果,当当前层为根节点所属的第一层时,持有的多个样本均位于根节点;
训练数据计算模块72,具体用于使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式以及分箱结果,计算针对当前层的第一训练数据。
进一步的,训练数据计算模块72,具体用于针对当前决策树,按照初始GBDT模型的损失函数,计算自身持有的多个样本中每个样本的梯度;以及
分别针对自身持有的每种特征的分箱结果的每个分箱,将该分箱包括的样本的梯度进行聚合,得到针对该种特征的梯度聚合结果,作为针对当前层的第一训练数据;
训练数据发送模块73,具体用于向密文计算节点密文方式发送自身持有的每种特征的梯度聚合结果,使得密文计算节点将接收的多个数据节点发送的每种特征的梯度聚合结果,按照相同分箱进行对应聚合,得到针对多个数据节点持有的所有样本的每种特征的整体梯度聚合结果,作为针对当前层的第二训练数据;
训练模块75,具体用于针对能够用于进行当前层的节点***的各种***标准,使用每种特征的整体梯度聚合结果,分别计算按照每种***标准进行节点***的评分增益值,各种***标准为基于所有特征的所有分箱边界确定的,评分增益值最高的***标准,作为当前层的***标准。
训练模块75,还用于当当前层不为最后一棵决策树的最后一层时,按照当前层的***标准,基于自身持有的多个样本的该***标准对应的特征的特征数据,进行节点***,得到当前层的节点***结果,当当前层为当前决策树的最后一层时,当前决策树训练完成,当当前层为最后一棵决策树的最后一层时,GBDT模型训练完成。
分箱边界确定模块76,具体用于按照自身持有的每种特征的分箱数,确定该种特征的分箱边界;并向密文计算节点发送自身持有的每种特征的分箱边界,使得密文计算节点将接收的多个数据节点发送的每种特征的分箱边界进行合并,得到每种特征的合并后分箱边界;以及接收密文计算节点发送的合并后分箱边界。
进一步的,相同种类特征的特征数据,还包括:该风电场的该时刻之后的第三预设数量个时刻的预测风速。
本申请实施例还提供一种GBDT模型横向训练装置,应用于训练***中的密文计算节点,训练***包括:多个数据节点和密文计算节点,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率,如图8-1所示,该装置,包括:
训练数据接收模块81,用于接收多个数据节点密文方式发送的各自的第一训练数据,第一训练数据为数据节点针对初始GBDT模型的当前决策树的当前层,使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式计算得到的;
训练数据计算模块82,用于基于接收的多个数据节点发送的各自的第一训练数据,按照GBDT模型的训练方式,计算针对当前层的第二训练数据;
训练数据发送模块83,用于向多个数据节点密文方式发送第二训练数据,使得各数据节点使用第二训练数据,按照GBDT模型的训练方式,完成对当前层的训练。
进一步的,如图8-2所示,还包括:
分箱边界确定模块84,用于在接收多个数据节点密文方式发送的各自的第一训练数据之前,通过与多个数据节点之间的信息交互和数据计算,确定多个数据节点持有的每种特征的分箱边界,作为合并后分箱边界,使得多个数据节点分别针对当前层的每个节点,按照每种特征的合并后分箱边界包括的分箱边界,对该节点包括的所有样本进行分箱,得到分箱结果,作为该种特征的分箱结果,当当前层为根节点所属的第一层时,持有的多个样本均位于根节点,分箱结果用于计算第一训练数据。
进一步的,训练数据接收模块81,具体用于接收多个数据节点密文方式发送的自身持有的每种特征的梯度聚合结果,梯度聚合结果为数据节点分别针对自身持有的每种特征的分箱结果的每个分箱,将该分箱包括的样本的梯度进行聚合得到的,作为针对当前层的第一训练数据,每个样本的梯度为数据节点针对当前决策树,按照初始GBDT模型的损失函数计算得到的;
训练数据计算模块82,用于将接收的多个数据节点发送的每种特征的梯度聚合结果,按照相同分箱进行对应聚合,得到针对多个数据节点持有的所有样本的每种特征的整体梯度聚合结果,作为针对当前层的第二训练数据;
训练数据发送模块83,具体用于向多个数据节点密文方式发送整体梯度聚合结果,使得各数据节点针对能够用于进行当前层的节点***的各种***标准,使用每种特征的整体梯度聚合结果,分别计算按照每种***标准进行节点***的评分增益值,各种***标准为基于所有特征的所有分箱边界确定的,评分增益值最高的***标准,作为当前层的***标准。
进一步的,分箱边界确定模块84,具体用于接收每个数据节点发送的所持有的每种特征的分箱边界,该分箱边界为该数据节点按照自身持有的每种特征的分箱数确定的;
将接收的多个数据节点发送的每种特征的分箱边界进行合并,得到每种特征的合并后分箱边界。
进一步的,相同种类特征的特征数据,还包括:该风电场的该时刻之后的第三预设数量个时刻的预测风速。
上述各模块的功能可对应于图1至图5所示流程中的相应处理步骤,在此不再赘述。
本申请的实施例所提供的上述各装置可通过计算机程序实现。本领域技术人员应该能够理解,上述的模块划分方式仅是众多模块划分方式中的一种,如果划分为其他模块或不划分模块,只要上述各装置具有上述功能,都应该在本申请的保护范围之内。
本申请实施例还提供一种电子设备,如图9所示,包括处理器91和机器可读存储介质91,机器可读存储介质92存储有能够被处理器91执行的机器可执行指令,处理器91被机器可执行指令促使:实现上述任一风电场功率预测方法,或者,实现上述任一应用于数据节点的GBDT模型横向训练方法,或者,实现上述任一应用于密文计算节点的GBDT模型横向训练方法。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一风电场功率预测方法,或者,实现上述任一应用于数据节点的GBDT模型横向训练方法,或者,实现上述任一应用于密文计算节点的GBDT模型横向训练方法。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一风电场功率预测方法,或者,执行上述任一应用于数据节点的GBDT模型横向训练方法,或者,执行上述任一应用于密文计算节点的GBDT模型横向训练方法。
上述电子设备中的机器可读存储介质可以包括随机存取存储器(Random AccessMemory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质,计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (19)

1.一种风电场功率预测方法,其特征在于,包括:
获取待预测风电场的风电特征数据,所述风电特征数据包括所述待预测风电场的指定时刻之前的第一预设数量个历史时刻的风电场功率;
将所述风电特征数据,输入预先训练的GBDT模型中进行功率预测,得到所述待预测风电场的所述指定时刻之后的第二预设数量个将来时刻的风电场功率,其中,所述GBDT模型为多个数据节点和密文计算节点通过密文方式的信息交互和数据计算,基于所述多个数据节点持有的多个样本的特征数据和目标值进行训练得到的,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率。
2.如权利要求1所述的方法,其特征在于,所述风电特征数据,还包括所述待预测风电场的指定时刻之后的第三预设数量个将来时刻的预测风速;
所述相同种类特征的特征数据,还包括:该风电场的该时刻之后的第三预设数量个时刻的预测风速。
3.如权利要求1或2所述的方法,其特征在于,所述待预测风电场为用于进行GBDT模型训练的多个样本中的风电场之一。
4.一种梯度提升决策树GBDT模型横向训练方法,其特征在于,应用于训练***中的数据节点,所述训练***包括:多个数据节点和密文计算节点,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率,所述方法,包括:
获取自身持有的多个样本的每种特征的特征数据和目标值;
针对初始GBDT模型的当前决策树的当前层,使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式,计算针对所述当前层的第一训练数据;
向所述密文计算节点密文方式发送所述第一训练数据,使得所述密文计算节点基于接收的所述多个数据节点发送的各自的所述第一训练数据,按照GBDT模型的训练方式,计算针对所述当前层的第二训练数据;
接收所述密文计算节点密文方式发送的所述第二训练数据;
使用所述第二训练数据,按照GBDT模型的训练方式,完成对所述当前层的训练。
5.如权利要求4所述的方法,其特征在于,在所述使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式,计算针对所述当前层的第一训练数据之前,还包括:
通过与所述密文计算节点之间的信息交互和数据计算,确定所述多个数据节点持有的每种特征的分箱边界,作为合并后分箱边界;
分别针对所述当前层的每个节点,按照每种特征的所述合并后分箱边界包括的分箱边界,对该节点包括的所有样本进行分箱,得到分箱结果,作为该种特征的分箱结果,当所述当前层为根节点所属的第一层时,持有的多个样本均位于根节点;
所述使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式,计算针对所述当前层的第一训练数据,包括:
使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式以及所述分箱结果,计算针对所述当前层的第一训练数据。
6.如权利要求5所述的方法,其特征在于,所述使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式以及所述分箱结果,计算针对所述当前层的第一训练数据,包括:
针对所述当前决策树,按照所述初始GBDT模型的损失函数,计算自身持有的多个样本中每个样本的梯度;
分别针对自身持有的每种特征的分箱结果的每个分箱,将该分箱包括的样本的梯度进行聚合,得到针对该种特征的梯度聚合结果,作为针对所述当前层的第一训练数据;
所述向所述密文计算节点密文方式发送所述第一训练数据,包括:
向所述密文计算节点密文方式发送自身持有的每种特征的梯度聚合结果,使得所述密文计算节点将接收的所述多个数据节点发送的每种特征的梯度聚合结果,按照相同分箱进行对应聚合,得到针对所述多个数据节点持有的所有样本的每种特征的整体梯度聚合结果,作为针对所述当前层的第二训练数据;
所述使用所述第二训练数据,按照GBDT模型的训练方式,完成对所述当前层的训练,包括:
针对能够用于进行所述当前层的节点***的各种***标准,使用每种特征的所述整体梯度聚合结果,分别计算按照每种***标准进行节点***的评分增益值,所述各种***标准为基于所有特征的所有分箱边界确定的,评分增益值最高的***标准,作为所述当前层的***标准。
7.如权利要求6所述的方法,其特征在于,还包括:
当所述当前层不为最后一棵决策树的最后一层时,按照所述当前层的***标准,基于自身持有的多个样本的该***标准对应的特征的特征数据,进行节点***,得到所述当前层的节点***结果,当所述当前层为所述当前决策树的最后一层时,所述当前决策树训练完成,当所述当前层为最后一棵决策树的最后一层时,GBDT模型训练完成。
8.如权利要求5所述的方法,其特征在于,所述通过与所述密文计算节点之间的信息交互和数据计算,确定所述多个数据节点持有的每种特征的分箱边界,作为合并后分箱边界,包括:
按照自身持有的每种特征的分箱数,确定该种特征的分箱边界;
向所述密文计算节点发送自身持有的每种特征的分箱边界,使得所述密文计算节点将接收的所述多个数据节点发送的每种特征的分箱边界进行合并,得到每种特征的合并后分箱边界;
接收所述密文计算节点发送的所述合并后分箱边界。
9.如权利要求4-8任一所述的方法,其特征在于,所述相同种类特征的特征数据,还包括:该风电场的该时刻之后的第三预设数量个时刻的预测风速。
10.一种梯度提升决策树GBDT模型横向训练方法,其特征在于,应用于训练***中的密文计算节点,所述训练***包括:多个数据节点和密文计算节点,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率,所述方法,包括:
接收所述多个数据节点密文方式发送的各自的第一训练数据,所述第一训练数据为所述数据节点针对初始GBDT模型的当前决策树的当前层,使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式计算得到的;
基于接收的所述多个数据节点发送的各自的所述第一训练数据,按照GBDT模型的训练方式,计算针对所述当前层的第二训练数据;
向所述多个数据节点密文方式发送所述第二训练数据,使得各所述数据节点使用所述第二训练数据,按照GBDT模型的训练方式,完成对所述当前层的训练。
11.如权利要求10所述的方法,其特征在于,在所述接收所述多个数据节点密文方式发送的各自的第一训练数据之前,还包括:
通过与所述多个数据节点之间的信息交互和数据计算,确定所述多个数据节点持有的每种特征的分箱边界,作为合并后分箱边界,使得所述多个数据节点分别针对所述当前层的每个节点,按照每种特征的所述合并后分箱边界包括的分箱边界,对该节点包括的所有样本进行分箱,得到分箱结果,作为该种特征的分箱结果,当所述当前层为根节点所属的第一层时,持有的多个样本均位于根节点,所述分箱结果用于计算所述第一训练数据。
12.如权利要求11所述的方法,其特征在于,所述接收所述多个数据节点密文方式发送的各自的第一训练数据,包括:
接收所述多个数据节点密文方式发送的自身持有的每种特征的梯度聚合结果,所述梯度聚合结果为所述数据节点分别针对自身持有的每种特征的分箱结果的每个分箱,将该分箱包括的样本的梯度进行聚合得到的,作为针对所述当前层的第一训练数据,每个样本的梯度为所述数据节点针对所述当前决策树,按照所述初始GBDT模型的损失函数计算得到的;
所述基于接收的所述多个数据节点发送的各自的所述第一训练数据,按照GBDT模型的训练方式,计算针对所述当前层的第二训练数据,包括:
将接收的所述多个数据节点发送的每种特征的梯度聚合结果,按照相同分箱进行对应聚合,得到针对所述多个数据节点持有的所有样本的每种特征的整体梯度聚合结果,作为针对所述当前层的第二训练数据;
所述向所述多个数据节点密文方式发送所述第二训练数据,包括:
向所述多个数据节点密文方式发送所述整体梯度聚合结果,使得各所述数据节点针对能够用于进行所述当前层的节点***的各种***标准,使用每种特征的所述整体梯度聚合结果,分别计算按照每种***标准进行节点***的评分增益值,所述各种***标准为基于所有特征的所有分箱边界确定的,评分增益值最高的***标准,作为所述当前层的***标准。
13.如权利要求11所述的方法,其特征在于,所述通过与所述多个数据节点之间的信息交互和数据计算,确定所述多个数据节点持有的每种特征的分箱边界,作为合并后分箱边界,包括:
接收每个数据节点发送的所持有的每种特征的分箱边界,该分箱边界为该数据节点按照自身持有的每种特征的分箱数确定的;
将接收的所述多个数据节点发送的每种特征的分箱边界进行合并,得到每种特征的合并后分箱边界。
14.如权利要求10-13任一所述的方法,其特征在于,所述相同种类特征的特征数据,还包括:该风电场的该时刻之后的第三预设数量个时刻的预测风速。
15.一种风电场功率预测装置,其特征在于,包括:
特征数据获取模块,用于获取待预测风电场的风电特征数据,所述风电特征数据包括所述待预测风电场的指定时刻之前的第一预设数量个历史时刻的风电场功率;
功率预测模块,用于将所述风电特征数据,输入预先训练的GBDT模型中进行功率预测,得到所述待预测风电场的所述指定时刻之后的第二预设数量个将来时刻的风电场功率,其中,所述GBDT模型为多个数据节点和密文计算节点通过密文方式的信息交互和数据计算,基于所述多个数据节点持有的多个样本的特征数据和目标值进行训练得到的,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率。
16.一种梯度提升决策树GBDT模型横向训练装置,其特征在于,应用于训练***中的数据节点,所述训练***包括:多个数据节点和密文计算节点,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率,所述装置,包括:
特征数据获取模块,用于获取自身持有的多个样本的每种特征的特征数据和目标值;
训练数据计算模块,用于针对初始GBDT模型的当前决策树的当前层,使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式,计算针对所述当前层的第一训练数据;
训练数据发送模块,用于向所述密文计算节点密文方式发送所述第一训练数据,使得所述密文计算节点基于接收的所述多个数据节点发送的各自的所述第一训练数据,按照GBDT模型的训练方式,计算针对所述当前层的第二训练数据;
训练数据接收模块,用于接收所述密文计算节点密文方式发送的所述第二训练数据;
训练模块,用于使用所述第二训练数据,按照GBDT模型的训练方式,完成对所述当前层的训练。
17.一种梯度提升决策树GBDT模型横向训练装置,其特征在于,应用于训练***中的密文计算节点,所述训练***包括:多个数据节点和密文计算节点,不同的数据节点具有不同样本的相同种类特征的特征数据和目标值,其中,以风电场和时刻表示样本,相同种类特征的特征数据,包括:该风电场的该时刻之前的第一预设数量个时刻的风电场功率,目标值为该风电场的该时刻之后的第二预设数量个时刻的风电场功率,所述装置,包括:
训练数据接收模块,用于接收所述多个数据节点密文方式发送的各自的第一训练数据,所述第一训练数据为所述数据节点针对初始GBDT模型的当前决策树的当前层,使用自身持有的多个样本的每种特征的特征数据和目标值,按照GBDT模型的训练方式计算得到的;
训练数据计算模块,用于基于接收的所述多个数据节点发送的各自的所述第一训练数据,按照GBDT模型的训练方式,计算针对所述当前层的第二训练数据;
训练数据发送模块,用于向所述多个数据节点密文方式发送所述第二训练数据,使得各所述数据节点使用所述第二训练数据,按照GBDT模型的训练方式,完成对所述当前层的训练。
18.一种电子设备,其特征在于,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现权利要求1-3任一所述的方法,或者,实现权利要求4-9任一所述的方法,或者,实现权利要求10-14任一所述的方法。
19.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-3任一所述的方法,或者,实现权利要求4-9任一所述的方法,或者,实现权利要求10-14任一所述的方法。
CN202210107704.3A 2022-01-28 2022-01-28 风电场功率预测方法、gbdt模型横向训练方法及装置 Active CN114118638B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210107704.3A CN114118638B (zh) 2022-01-28 2022-01-28 风电场功率预测方法、gbdt模型横向训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210107704.3A CN114118638B (zh) 2022-01-28 2022-01-28 风电场功率预测方法、gbdt模型横向训练方法及装置

Publications (2)

Publication Number Publication Date
CN114118638A true CN114118638A (zh) 2022-03-01
CN114118638B CN114118638B (zh) 2022-04-19

Family

ID=80362084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210107704.3A Active CN114118638B (zh) 2022-01-28 2022-01-28 风电场功率预测方法、gbdt模型横向训练方法及装置

Country Status (1)

Country Link
CN (1) CN114118638B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570030A (zh) * 2019-08-22 2019-12-13 国网山东省电力公司经济技术研究院 基于深度学习的风电集群功率区间预测的方法及***
US20200175426A1 (en) * 2019-07-01 2020-06-04 Alibaba Group Holding Limited Data-based prediction results using decision forests
CN111667093A (zh) * 2020-04-22 2020-09-15 华北电力科学研究院有限责任公司 中长期风电发电计算方法及装置
CN113688999A (zh) * 2021-08-23 2021-11-23 神州融安科技(北京)有限公司 一种横向联邦xgboost决策树的训练方法
CN113962495A (zh) * 2021-12-21 2022-01-21 华控清交信息科技(北京)有限公司 一种风电场功率预测方法、装置及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200175426A1 (en) * 2019-07-01 2020-06-04 Alibaba Group Holding Limited Data-based prediction results using decision forests
CN110570030A (zh) * 2019-08-22 2019-12-13 国网山东省电力公司经济技术研究院 基于深度学习的风电集群功率区间预测的方法及***
CN111667093A (zh) * 2020-04-22 2020-09-15 华北电力科学研究院有限责任公司 中长期风电发电计算方法及装置
CN113688999A (zh) * 2021-08-23 2021-11-23 神州融安科技(北京)有限公司 一种横向联邦xgboost决策树的训练方法
CN113962495A (zh) * 2021-12-21 2022-01-21 华控清交信息科技(北京)有限公司 一种风电场功率预测方法、装置及电子设备

Also Published As

Publication number Publication date
CN114118638B (zh) 2022-04-19

Similar Documents

Publication Publication Date Title
US11281969B1 (en) Artificial intelligence system combining state space models and neural networks for time series forecasting
Cirstea et al. EnhanceNet: Plugin neural networks for enhancing correlated time series forecasting
CN111967910A (zh) 一种用户客群分类方法和装置
Stratigakos et al. Prescriptive trees for integrated forecasting and optimization applied in trading of renewable energy
CN113435770A (zh) 基于区块链的交易风险评估方法及装置
CN111723947A (zh) 一种联邦学习模型的训练方法及装置
CN106485348A (zh) 一种交易数据的预测方法及装置
CN112948123B (zh) 一种基于Spark的网格水文模型分布式计算方法
Serpell et al. Probabilistic forecasting using monte carlo dropout neural networks
Beichter et al. Net load forecasting using different aggregation levels
CN114118638B (zh) 风电场功率预测方法、gbdt模型横向训练方法及装置
CN114118312B (zh) 一种gbdt模型的纵向训练方法、装置、电子设备及***
Liao et al. Probabilistic wind power forecasting for newly-built wind farms based on multi-task Gaussian process method
CN114118641B (zh) 风电场功率预测方法、gbdt模型纵向训练方法及装置
CN109816149B (zh) 一种风电场随机出力场景生成方法及装置
Miller et al. Towards the development of numerical procedure for control of connected Markov chains
CN114386533B (zh) 一种gbdt模型的横向训练方法、装置、电子设备及***
CN100402708C (zh) 金属电沉积过程中基于神经元网络进行实时控制的方法
CN113449922B (zh) 银行网点选址方法及装置
Mensah et al. EFedDNN: Ensemble based federated deep neural networks for trajectory mode inference
Salma et al. Small area estimation of per capita expenditures using robust empirical best linear unbiased prediction (REBLUP)
Muñoz et al. Bayesian forecasting of spare parts using simulation
Bilokon et al. Mathematical and computer modeling of the sprinklers pollution processes in irrigation systems
Niu et al. Short term load forecasting model based on support vector machine
Huang A demonstration of reliability of the interior-outer-set model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant