CN110533089A - 基于随机森林的自适应非侵入式负荷识别方法 - Google Patents
基于随机森林的自适应非侵入式负荷识别方法 Download PDFInfo
- Publication number
- CN110533089A CN110533089A CN201910764470.8A CN201910764470A CN110533089A CN 110533089 A CN110533089 A CN 110533089A CN 201910764470 A CN201910764470 A CN 201910764470A CN 110533089 A CN110533089 A CN 110533089A
- Authority
- CN
- China
- Prior art keywords
- unknown
- load
- module
- random forest
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 58
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 23
- 238000012360 testing method Methods 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 13
- 238000003066 decision tree Methods 0.000 claims description 12
- 238000005516 engineering process Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 5
- 238000012797 qualification Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 238000006073 displacement reaction Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 230000010076 replication Effects 0.000 claims description 3
- 238000013459 approach Methods 0.000 claims description 2
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims 1
- 238000003909 pattern recognition Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 1
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004851 dishwashing Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000002307 isotope ratio mass spectrometry Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000452 restraining effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2323—Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Discrete Mathematics (AREA)
- Public Health (AREA)
- General Business, Economics & Management (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
基于随机森林的自适应非侵入式负荷识别方法,包括建立用电负荷特征数据库;从每个切换事件中提取所需的负荷特征;将所得负荷特征进行归一化处理后,获得所需样本点;样本点由未知模式识别模块处理,为样本点分配“已知”标签、或“未知”标签;所有标签为“已知”样本点,利用随机森林算法得出识别结果;所有标签为“未知”样本点,由在线聚类模块处理,若产生新聚类,用户可以选择是否将类标签分配给聚类;带标签的新聚类,通过在线更新模块更新随机森林和未知模式识别模块对已有知识进行更新;“未知点”通过新随机森林得出识别结果。本发明可以将容易错误分类的负荷识别为“未知”,并在获取新知识后完成正确的识别,有利于促进未知负荷模式的有效识别。
Description
技术领域
本发明涉及非侵入式负荷监测技术领域,具体涉及一种基于随机森林的自适应非侵入式负荷识别方法。
背景技术
非侵入式负荷监测技术是支撑用能管理和需求侧管理的有效手段,也是实现电网与居民用户友好互动的基础。而负荷识别是非侵入式负荷检测技术的关键技术之一。尽管非侵入式负荷识别技术不断地被完善,但是随着家电行业的发展,家电的种类、品牌和型号的日益繁多,大大增加了负荷识别的难度,容易出现错识、误识的情况。因此,如何从实际识别样本中获取新知识,形成新的学习方案以便正确识别更多的样本是至关重要的。
发明内容
本发明提供一种基于随机森林的自适应非侵入式负荷识别方法,可以将容易错误分类的负荷识别为“未知”,并在获取新知识后完成正确的识别,有利于促进未知负荷模式的有效识别。
本发明采取的技术方案为:
基于随机森林的自适应非侵入式负荷识别方法,包括以下步骤:
步骤一:建立用电负荷特征数据库;
步骤二:针对传入的负荷总线电压、电流波形,检测是否有用电器开关状态的切换事件,并从每个切换事件中提取所需的负荷特征;
步骤三:将所得负荷特征进行归一化处理后,获得所需样本点;
步骤四:样本点由未知模式识别模块处理,为样本点分配“已知”标签、或“未知”标签,若标签为“已知”,则进行步骤五;若标签为“未知”,则进行步骤六;
步骤五:所有标签为“已知”样本点,利用随机森林算法得出识别结果;
步骤六:所有标签为“未知”样本点,由在线聚类模块处理,若产生新聚类,用户可以选择是否将类标签分配给聚类,若用户为新聚类分配了标签,则进行步骤七;
类标签包括现有类或新类标签。
步骤七:带标签的新聚类,通过在线更新模块更新随机森林和未知模式识别模块对已有知识进行更新;
步骤八:完成更新后,“未知点”通过新随机森林得出识别结果。
所述步骤一中,监测各典型用电负荷的电压、电流波形,并提取6种广泛使用的负荷特征,分别为:有功功率、无功功率、位移功率因数、电流中的总谐波失真、功率因数、峰值系数,建立用电负荷特征数据库;用电负荷特征数据库中包括各用电器的负荷特征、类标签。
将所得数据分为训练集和测试集,每个数据集中均包括各用电器的负荷特征和类标签,用电负荷特征数据库作为训练集用于构建随机森林,测试集用于验证负荷识别结果。
所述步骤二中,负荷特征提取包括:
假设电压、电流波形表示为:
式中,V(t)为电压波形表达式;k为谐波次数;Vk第k次谐波电压;w0为初始角频率;t为时间;δk为第k次谐波电压相位;I(t)为电流波形表达式;Ik为第k次谐波电流;θk为第k次谐波电流相位。
从传入的负荷总线电压和电流波形中,提取负荷特征,分别为有功功率P、无功功率Q、位移功率因数dpf、电流中的总谐波失真THD、功率因数pf、峰值系数cf。
1)有功功率:
式中,P为有功功率;Pk为第k次谐波功率;φk为第k次谐波电压和电流的相位差。
2)无功功率:
3)位移功率因数:
dpf=cos(δ1-θ1)
式中,δ1为基波电压相位;θ1为基波电流相位。
4)电流中的总谐波失真:
式中,I1为基波电流。
5)功率因数:
6)峰值系数;
式中,Ipeak为电流峰值;IRMS为电流均方根值。
所述步骤三中,负荷特征归一化处理包括:
步骤二中提取了多个负荷特征,由于不同类型的输入特征数据间的数量级差异较大,为避免造成计算误差,需进行归一化处理,公式如下所示:
其中,x为输入特征值;为x′归一化后的特征值;xmax、xmin分别为特征数据的最大值和最小值。
所述步骤四中,未知模式识别模块是基于输入测试点与训练集中的点之间的阈值欧几里得距离,用于判断是否出现“未知”点,对训练点进行聚类分析。
(1):高斯混合模型(GMM)是一种假设数据是由高斯分布叠加生成的聚类模型,通过期望最大化(EM)算法估计高斯混合模型的参数,将高斯混合模型拟合到每个类标签的训练点中。高斯混合模型不仅输出聚类中心,而且通过具有均值和协方差矩阵的高斯分布表示聚类,并给出了聚类的形状。由于训练数据的高斯分布的个数是未知的,因此需要选择多个高斯分布不同的混合高斯模型对数据进行拟合,选择具有最小贝叶斯信息准则(BIC)的模型。
(2):对于输入测试点,未知模式识别模块计算高斯混合模型中测试点与高斯均值之间的距离中的最小距离,并将其与“未知”阈值进行比较。当它大于“未知”阈值时,则视为“未知”;否则“已知”。
(3):为了确定适当的“未知”阈值,手动定义几对严重“未知”的波形,计算每对波形之间的距离,并将距离的平均值作为“未知”阈值。
所述步骤五中,随机森林是一种用于分类的集成学习方法,
随机森林结合了装袋(Bootstrap Aggregating)和CART(分类和回归树)的思想;利用bootstrap重抽样方法从原始样本中抽取n个样本,对每个bootstrap样本采用CART算法进行决策树建模,对这些决策树采取投票选取机制确定最终的分类结果。
假设对于一个测试集x,第l棵决策树的输出为ftree,l(x)=i,i=1,2,…,c为其对应的类别,l=1,2,…,N为随机森林中的决策树棵数,则随机森林模型的输出为
其中,I(.)表示满足括号中表达式的样本数量。
所述CART算法采用的是一种二分递归分割技术,将当前样本分成两个子样本集,使得生成的非叶子节点都有两个分支。采用基尼(Gini)指数选择最优特征,同时决定该特征的最优二值切分点。
对于给定的样本集D,其基尼指数为:
其中,Ck是D中属于第k类的样本子集,K是类的个数,|Ck|和D表示子集的个数和样本的个数。
如果样本集D根据特征A是否取某一可能值α被分割成D1和D2,则在特征A的条件下D的基尼指数为:
随机森林利用样本抽取和节点特征选取的随机性,使其具有较高的分类准确度,对异常值和噪声具有很好的容忍度,且不易出现过拟合。
所述步骤六中,在线聚类模块,用于判断是否出现新的聚类;
在线聚类是每次形成一个新的聚类时自动更新的聚类算法。当接收到一个新的“未知”点时,在线聚类模块将检查该点是否满足某一聚类,用以判断该点是否是新的负载类型。
聚类k是否“合格”由下式进行判断:
式中,C(i)=k表示将点xi分配给聚类k,表示聚类k的中心。
判断为合格的聚类将呈现给用户,用户可以选择是否为其分配类标签,被分配了类标签的新聚类将用于在线更新模块。
所述步骤七中,在线更新模块,用于实现随机森林和未知模式识别模块的更新,更新模型所需新知识;
首先,由于特征的重要性度量(即基尼系数),在更新随机森林后发生了变化,因此高斯混合模型中的均值和协方差、以及在线聚类模块中的聚类中心也会相应更新;其次,对于高斯混合模型,由于发现了一个新的聚类,因此在新的聚类中的点拟合高斯分布,并将其加入到高斯混合模型中。
本发明一种基于随机森林的自适应非侵入式负荷识别方法,有益效果如下:
(1):本发明采用随机森林算法,具有良好的泛化能力和鲁棒性,利用样本抽取的随机性和节点特征选取的随机性,使其具有较高的分类精度,对异常值和噪声具有很好的容忍度,且不易出现过拟合;
(2):本发明构建自适应非侵入式负荷识别模型,有利于改善错识、误识的情况,有利于正确识别更多类型的家电;
(3):未知模式识别模块可以在大量输入负荷数据中有效判断并筛选“已知”点和“未知”点;
(4):在线聚类模块可以在存储和判断对“未知”点的同时,将产生的新聚类传递给用户;
(5):在线更新模块可以及时更新模型所需的新知识,有利于对新类和错分类用电器进行正确的负荷识别。
附图说明
下面结合附图和实施例对本发明作进一步说明:
图1为本发明中的非侵入式负荷检测技术框架图。
图2为本发明中的基于随机森林的自适应非侵入式负荷识别模型框图。
图3为本发明中的随机森林算法示意图。
图4为本发明中的随机森林特征***示意图。
图5为本发明中的在线聚类模块示意图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步说明。
非侵入式负荷检测技术框架如图1所示,主要包括事件检测、特征提取和负荷识别三个关键技术。针对由于家用电器种类、品牌和型号的日益繁多,导致的错识、误识的情况,本发明提出一种基于随机森林的自适应非侵入式负荷识别,利用随机森林良好的泛化能力和鲁棒性提高识别精度,并利用自适应框架实现新类家电的正确识别。
如图2所示,基于随机森林的自适应非侵入式负荷识别方法,它主要包括:特征提取模块、未知模式识别模块、在线聚类模块、随机森林算法模块、在线更新模块。
首先,特征提取模块在输入负荷总线电流、电压波形中提取负荷特征,归一化处理后产生所需样本点;然后,由未知模式识别模块处理为样本点分配“已知”或“未知”标签,若标签为“已知”,则随机森林算法模块将应用于采样点并输出分类结果,模型将暂停,等待下一个输入波形;若标签为“未知”,则样本点将传递到在线聚类模块,在线聚类模块将存储所有传入的“未知”点并对其执行在线聚类算法,在线聚类过程中,如果形成一个形状良好的聚类,即其中的点可能来自相同类型的设备,它将呈现给用户,用户可以选择将类标签,包括现有标签或者新类,分配给新聚类或丢弃它,如果为新聚类分配了标签,则在线更新模块将使用带标签的新聚类更新随机森林算法模块和未知模式识别模块。
具体实现步骤如下:
本发明利用来源于西蒙弗雷泽大学的Makonin及他的团队的AMPds数据集,选取冰箱、电视机、热泵、洗碗机、洗衣机、暖通空调、微波炉、干衣机8种常用家用电器作为研究对象。
步骤1,分别从各家用电器的电压、电流波形中提取所需负荷特征,将所得数据的50%建立用电负荷特征数据库作为训练集用于构建随机森林。
步骤2,将所得数据的50%作为测试集,测试集中所含用电负荷类别不与训练集中完全一致。
步骤3,由于不同类型的输入特征数据间的数量级差异较大,为了获得所需样本点,需将所得负荷特征进行归一化处理。
步骤4,未知模式识别模块处理样本点,为样本点分配“已知”或“未知”标签。
通过期望最大化(EM)算法估计高斯混合模型(GMM)的参数,将高斯混合模型拟合到每个类标签的训练点中。高斯混合模型给出聚类的形状,并输出聚类中心。
EM算法估计GMM参数步骤如下:
1)假设X={x1,x2,…,xn},家用电器类别数量为K,对每个类别k设置初始值πk、μk和Σk,并计算下式的对数似然函数:
2)根据当前的πk、μk和Σk计算后验概率γ(znk):
3)根据2)中计算的γ(znk)计算新的πk、μk和Σk:
4)检查参数是否收敛或对数似然函数是否收敛,若不收敛,则返回步骤2)
其中:X为聚类中所有点的集合;N(x|μk,Σk)为高斯混合模型中的第k个分量;K为分量数即聚类数量;N为点的数量;Nk为属于聚类k的点的数量;μk为属于聚类k的所有点的加权平均;πk为每个分量N(x|μk,Σk)的权重;γ(znk)为点n(xn)属于聚类k的后验概率;每个点的权值为
手动定义几对严重“未知”的波形,计算每对波形之间的距离,并将距离的平均值作为“未知”阈值。对于输入测试点,未知模式识别模块计算高斯混合模型中测试点与高斯均值之间的距离中的最小距离,并将其与“未知”阈值进行比较。当它大于“未知”阈值时,则视为“未知”,否则“已知”。
步骤5,“已知”点利用随机森林得出识别结果,1表示负荷开启,0表示负荷关闭。随机森林结合了装袋(Bootstrap Aggregating)和分类回归树(CART)的思想,如图3所示。利用bootstrap重抽样方法从原始样本中抽取n个子样本,对每个bootstrap子样本采用CART算法进行决策树建模,对这些决策树采取多数投票选取机制确定最终的分类结果。
CART算法采用的是一种二分递归分割技术,将当前样本分成两个子样本集,使得生成的非叶子节点都有两个分支。本发明中CART作为决策树,采用基尼(Gini)指数选择最优特征,同时决定该特征的最优二值切分点,其特征***流程如图4所示。
对于给定的样本集D,其基尼指数为:
其中,Ck是D中属于第k类的样本子集,K是类的个数,|Ck|和D表示子集的个数和样本的个数。
如果样本集D根据特征A是否取某一可能值α被分割成D1和D2,则在特征A的条件下D的基尼指数为:
实验中,决策树的数量(ntree)可以通过验证模型效果好坏反复选取,往往取***默认的500棵就能够达到比较理想的效果;选取最佳特征时随机选取的特征数(mtry)通常取值为自变量个数的开方(取整),本实验取mtry=3。
步骤6,当接收到一个新的“未知”点时,判断是否有新的聚类形成,在线聚类模块将检查该点是否“合格”,用以判断该点是否是新的负载类型。
聚类k是否“合格”由下式进行判断:
式中,C(i)=k表示将点xi分配给聚类k,表示聚类k的中心。
聚类的大小(分配给该聚类的点的数量)必须足够大,而散点距离(聚类中的点离聚类中心的距离)也必须足够小,即聚类在囊括了足够多的点并具有良好的形状时才具有资格被判断为新的聚类。在线聚类模块流程图如图5所示。
判断合格的聚类将呈现给用户,用户可以选择是为其分配类标签或者舍弃,被分配了类标签的新聚类将用于在线更新模块。
步骤7,在线更新模块用于实现随机森林模块和未知模式识别模块的更新,更新模型所需新知识。
首先,由于特征的重要性度量(即基尼系数)在更新随机森林后发生了变化,因此高斯混合模型中的均值和协方差以及在线聚类模块中的聚类中心也会相应更新。其次,对于高斯混合模型,由于发现了一个新的聚类,因此在新的聚类中的点拟合高斯分布,并将其加入到高斯混合模型中。
步骤8,完成更新后,“未知”点通过新随机森林得出识别结果。
Claims (9)
1.基于随机森林的自适应非侵入式负荷识别方法,其特征在于包括以下步骤:
步骤一:建立用电负荷特征数据库;
步骤二:针对传入的负荷总线电压、电流波形,检测是否有用电器开关状态的切换事件,并从每个切换事件中提取所需的负荷特征;
步骤三:将所得负荷特征进行归一化处理后,获得所需样本点;
步骤四:样本点由未知模式识别模块处理,为样本点分配“已知”标签、或“未知”标签,若标签为“已知”,则进行步骤五;若标签为“未知”,则进行步骤六;
步骤五:所有标签为“已知”样本点,利用随机森林算法得出识别结果;
步骤六:所有标签为“未知”样本点,由在线聚类模块处理,若产生新聚类,用户可以选择是否将类标签分配给聚类,若用户为新聚类分配了标签,则进行步骤七;
步骤七:带标签的新聚类,通过在线更新模块更新随机森林和未知模式识别模块对已有知识进行更新;
步骤八:完成更新后,“未知点”通过新随机森林得出识别结果。
2.根据权利要求1所述基于随机森林的自适应非侵入式负荷识别方法,其特征在于:
所述步骤一中,监测各典型用电负荷的电压、电流波形,并提取广泛使用的负荷特征,分别为:有功功率、无功功率、位移功率因数、电流中的总谐波失真、功率因数、峰值系数,建立用电负荷特征数据库;用电负荷特征数据库中包括各用电器的负荷特征、类标签;
将所得数据分为训练集和测试集,每个数据集中均包括各用电器的负荷特征、类标签,用电负荷特征数据库作为训练集用于构建随机森林,测试集用于验证负荷识别结果。
3.根据权利要求1所述基于随机森林的自适应非侵入式负荷识别方法,其特征在于:
所述步骤二中,负荷特征提取包括:
假设电压、电流波形表示为:
从传入的负荷总线电压和电流波形中,提取负荷特征,分别为:有功功率P、无功功率Q、位移功率因数dpf、电流中的总谐波失真THD、功率因数pf、峰值系数cf。
4.根据权利要求1所述基于随机森林的自适应非侵入式负荷识别方法,其特征在于:
所述步骤三中,负荷特征归一化处理包括:
步骤二中提取了多个负荷特征,由于不同类型的输入特征数据间的数量级差异较大,为避免造成计算误差,需进行归一化处理,公式如下所示:
其中,x为输入特征值;为x′归一化后的特征值;xmax、xmin分别为特征数据的最大值和最小值。
5.根据权利要求1所述基于随机森林的自适应非侵入式负荷识别方法,其特征在于:
所述步骤四中,未知模式识别模块,是基于输入测试点与训练集中的点之间的阈值欧几里得距离,用于判断是否出现“未知”点,对训练点进行聚类分析;
将高斯混合模型拟合到每个类标签的训练点中,对于输入测试点,未知模式识别模块计算高斯混合模型中测试点与高斯均值之间的距离中的最小距离,并将其与“未知”阈值进行比较,当它大于“未知”阈值时,则视为“未知”;否则“已知”;为了确定适当的“未知”阈值,手动定义几对严重“未知”的波形,计算每对波形之间的距离,并将距离的平均值作为“未知”阈值。
6.根据权利要求1所述基于随机森林的自适应非侵入式负荷识别方法,其特征在于:所述步骤五中,随机森林是一种用于分类的集成学习方法,
随机森林结合了装袋Bootstrap Aggregating和CART分类和回归树的思想;利用bootstrap重抽样方法从原始样本中抽取n个样本,对每个bootstrap样本采用CART算法进行决策树建模,对这些决策树采取投票选取机制确定最终的分类结果;
假设对于一个测试集x,第l棵决策树的输出为ftree,l(x)=i,i=1,2,…,c为其对应的类别,l=1,2,…,N为随机森林中的决策树棵数,则随机森林模型的输出为:
其中,I(.)表示满足括号中表达式的样本数量;
所述CART算法采用的是一种二分递归分割技术,将当前样本分成两个子样本集,使得生成的非叶子节点都有两个分支;采用基尼Gini指数选择最优特征,同时决定该特征的最优二值切分点;
对于给定的样本集D,其基尼指数为:
其中,Ck是D中属于第k类的样本子集,K是类的个数,|Ck|和D表示子集的个数和样本的个数;
如果样本集D根据特征A是否取某一可能值α被分割成D1和D2,则在特征A的条件下D的基尼指数为:
7.根据权利要求1所述基于随机森林的自适应非侵入式负荷识别方法,其特征在于:
所述步骤六中,在线聚类模块,用于判断是否出现新的聚类;
在线聚类是每次形成一个新的聚类时自动更新的聚类算法;当接收到一个新的“未知”点时,在线聚类模块将检查该点是否满足某一聚类,用以判断该点是否是新的负载类型;
聚类k是否“合格”由下式进行判断:
式中,C(i)=k表示将点xi分配给聚类k,表示聚类k的中心;
判断为合格的聚类将呈现给用户,用户可以选择是否为其分配类标签,被分配了类标签的新聚类将用于在线更新模块。
8.根据权利要求1所述基于随机森林的自适应非侵入式负荷识别方法,其特征在于:
所述步骤七中,在线更新模块,用于实现随机森林和未知模式识别模块的更新,更新模型所需新知识;
首先,由于特征的重要性度量,在更新随机森林后发生了变化,因此高斯混合模型中的均值和协方差、以及在线聚类模块中的聚类中心也会相应更新;其次,对于高斯混合模型,由于发现了一个新的聚类,因此在新的聚类中的点拟合高斯分布,并将其加入到高斯混合模型中。
9.基于随机森林的自适应非侵入式负荷识别模型,其特征在于包括:特征提取模块、未知模式识别模块、在线聚类模块、随机森林算法模块、在线更新模块;
首先,特征提取模块在输入负荷总线电流、电压波形中提取负荷特征,归一化处理后产生所需样本点;然后,由未知模式识别模块处理为样本点分配“已知”或“未知”标签,若标签为“已知”,则随机森林算法模块将应用于采样点并输出分类结果,模型将暂停,等待下一个输入波形;若标签为“未知”,则样本点将传递到在线聚类模块,在线聚类模块将存储所有传入的“未知”点并对其执行在线聚类算法,在线聚类过程中,如果形成一个形状良好的聚类,即其中的点可能来自相同类型的设备,它将呈现给用户,用户可以选择将类标签,包括现有标签或者新类,分配给新聚类或丢弃它,如果为新聚类分配了标签,则在线更新模块将使用带标签的新聚类更新随机森林算法模块和未知模式识别模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910764470.8A CN110533089B (zh) | 2019-08-19 | 2019-08-19 | 基于随机森林的自适应非侵入式负荷识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910764470.8A CN110533089B (zh) | 2019-08-19 | 2019-08-19 | 基于随机森林的自适应非侵入式负荷识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110533089A true CN110533089A (zh) | 2019-12-03 |
CN110533089B CN110533089B (zh) | 2023-07-11 |
Family
ID=68663878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910764470.8A Active CN110533089B (zh) | 2019-08-19 | 2019-08-19 | 基于随机森林的自适应非侵入式负荷识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110533089B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111428755A (zh) * | 2020-02-29 | 2020-07-17 | 国网(苏州)城市能源研究院有限责任公司 | 非侵入式负荷监测方法 |
CN111553444A (zh) * | 2020-05-15 | 2020-08-18 | 东南大学 | 一种基于非侵入负荷终端数据的负荷辨识方法 |
CN111898694A (zh) * | 2020-08-07 | 2020-11-06 | 广东电网有限责任公司计量中心 | 一种基于随机树分类的非入侵式负荷识别方法及装置 |
CN111948446A (zh) * | 2020-07-20 | 2020-11-17 | 江阴长仪集团有限公司 | 一种自适应的负荷识别方法以及智能电能表 |
CN112016587A (zh) * | 2020-07-09 | 2020-12-01 | 冯燕钧 | 基于主站特征库技术的用能监测云端协同非侵入辨识方法 |
CN113408203A (zh) * | 2021-06-18 | 2021-09-17 | 湘潭大学 | 一种基于正则化贪心森林算法非侵入式负荷辨识方法 |
CN113705601A (zh) * | 2021-05-21 | 2021-11-26 | 国网辽宁省电力有限公司鞍山供电公司 | 一种基于随机森林的电熔镁炉运行状态识别方法 |
CN113899944A (zh) * | 2021-09-30 | 2022-01-07 | 广东电网有限责任公司 | 一种电力负荷投切点的检测方法及装置 |
CN113946720A (zh) * | 2020-07-17 | 2022-01-18 | ***通信集团广东有限公司 | 一种识别群组中用户的方法、装置及电子设备 |
CN115907567A (zh) * | 2023-02-21 | 2023-04-04 | 浙江大学 | 基于鲁棒性随机分割森林算法的负荷事件检测方法及*** |
CN117878931A (zh) * | 2024-03-12 | 2024-04-12 | 徐州景安重工机械制造有限公司 | 一种用于新能源动力站的应急能源调度***及方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090281981A1 (en) * | 2008-05-06 | 2009-11-12 | Chen Barry Y | Discriminant Forest Classification Method and System |
US20110118130A1 (en) * | 2009-08-23 | 2011-05-19 | Jeanne F. Loring | Compositions and methods for defining cells |
CN105404944A (zh) * | 2015-12-11 | 2016-03-16 | 中国电力科学研究院 | 一种面向电力***重过载预警的大数据分析方法 |
US20160180157A1 (en) * | 2014-12-17 | 2016-06-23 | Fezoo Labs, S.L. | Method for setting a tridimensional shape detection classifier and method for tridimensional shape detection using said shape detection classifier |
CN107122790A (zh) * | 2017-03-15 | 2017-09-01 | 华北电力大学 | 基于混合神经网络和集成学习的非侵入式负荷识别算法 |
CN107273920A (zh) * | 2017-05-27 | 2017-10-20 | 西安交通大学 | 一种基于随机森林的非侵入式家用电器识别方法 |
CN107944495A (zh) * | 2017-12-04 | 2018-04-20 | 贵州电网有限责任公司电力科学研究院 | 一种基于深层森林算法的家庭用电负荷分类识别方法 |
CN108491893A (zh) * | 2018-04-13 | 2018-09-04 | 贵州电网有限责任公司 | 一种基于深层森林算法的家庭用电负荷分类识别方法 |
CN108802536A (zh) * | 2018-06-29 | 2018-11-13 | 山东卓尔电气有限公司 | 一种居民户用电情况集中监测方法及监测装置 |
CN109657884A (zh) * | 2019-02-15 | 2019-04-19 | 广东电网有限责任公司 | 电网供电优化方法、装置、设备和计算机可读存储介质 |
-
2019
- 2019-08-19 CN CN201910764470.8A patent/CN110533089B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090281981A1 (en) * | 2008-05-06 | 2009-11-12 | Chen Barry Y | Discriminant Forest Classification Method and System |
US20110118130A1 (en) * | 2009-08-23 | 2011-05-19 | Jeanne F. Loring | Compositions and methods for defining cells |
US20160180157A1 (en) * | 2014-12-17 | 2016-06-23 | Fezoo Labs, S.L. | Method for setting a tridimensional shape detection classifier and method for tridimensional shape detection using said shape detection classifier |
CN105404944A (zh) * | 2015-12-11 | 2016-03-16 | 中国电力科学研究院 | 一种面向电力***重过载预警的大数据分析方法 |
CN107122790A (zh) * | 2017-03-15 | 2017-09-01 | 华北电力大学 | 基于混合神经网络和集成学习的非侵入式负荷识别算法 |
CN107273920A (zh) * | 2017-05-27 | 2017-10-20 | 西安交通大学 | 一种基于随机森林的非侵入式家用电器识别方法 |
CN107944495A (zh) * | 2017-12-04 | 2018-04-20 | 贵州电网有限责任公司电力科学研究院 | 一种基于深层森林算法的家庭用电负荷分类识别方法 |
CN108491893A (zh) * | 2018-04-13 | 2018-09-04 | 贵州电网有限责任公司 | 一种基于深层森林算法的家庭用电负荷分类识别方法 |
CN108802536A (zh) * | 2018-06-29 | 2018-11-13 | 山东卓尔电气有限公司 | 一种居民户用电情况集中监测方法及监测装置 |
CN109657884A (zh) * | 2019-02-15 | 2019-04-19 | 广东电网有限责任公司 | 电网供电优化方法、装置、设备和计算机可读存储介质 |
Non-Patent Citations (10)
Title |
---|
NABILA FARNAAZ ET AL.: "Random Forest Modeling for Network Intrusion Detection System", 《ELSEVIER》, pages 213 - 217 * |
王守相等: "计及用电模式的居民负荷梯度提升树分类识别方法", 《电力***及其自动化学报》 * |
王守相等: "计及用电模式的居民负荷梯度提升树分类识别方法", 《电力***及其自动化学报》, no. 09, 15 September 2017 (2017-09-15), pages 27 - 33 * |
田路强: "基于DBSCAN的分布式聚类及增量聚类的研究与应用", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
田路强: "基于DBSCAN的分布式聚类及增量聚类的研究与应用", 《中国优秀硕士学位论文全文数据库信息科技辑》, 15 March 2017 (2017-03-15), pages 17 - 38 * |
荀港益: "基于聚类分析与随机森林的短期负荷滚动预测", 《智能城市》 * |
荀港益: "基于聚类分析与随机森林的短期负荷滚动预测", 《智能城市》, no. 09, 14 May 2018 (2018-05-14), pages 9 - 11 * |
谢诗雨等: "基于粒子群优化加权随机森林的非侵入式负荷辨识", 《电器与能效管理技术》 * |
谢诗雨等: "基于粒子群优化加权随机森林的非侵入式负荷辨识", 《电器与能效管理技术》, no. 09, 15 May 2019 (2019-05-15), pages 1 - 6 * |
魏金太;高穹;: "基于信息增益和随机森林分类器的入侵检测***研究", 中北大学学报(自然科学版), no. 01, pages 74 - 79 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111428755A (zh) * | 2020-02-29 | 2020-07-17 | 国网(苏州)城市能源研究院有限责任公司 | 非侵入式负荷监测方法 |
CN111428755B (zh) * | 2020-02-29 | 2023-09-08 | 国网(苏州)城市能源研究院有限责任公司 | 非侵入式负荷监测方法 |
CN111553444A (zh) * | 2020-05-15 | 2020-08-18 | 东南大学 | 一种基于非侵入负荷终端数据的负荷辨识方法 |
CN112016587A (zh) * | 2020-07-09 | 2020-12-01 | 冯燕钧 | 基于主站特征库技术的用能监测云端协同非侵入辨识方法 |
CN113946720A (zh) * | 2020-07-17 | 2022-01-18 | ***通信集团广东有限公司 | 一种识别群组中用户的方法、装置及电子设备 |
CN111948446A (zh) * | 2020-07-20 | 2020-11-17 | 江阴长仪集团有限公司 | 一种自适应的负荷识别方法以及智能电能表 |
CN111898694B (zh) * | 2020-08-07 | 2021-09-17 | 广东电网有限责任公司计量中心 | 一种基于随机树分类的非入侵式负荷识别方法及装置 |
CN111898694A (zh) * | 2020-08-07 | 2020-11-06 | 广东电网有限责任公司计量中心 | 一种基于随机树分类的非入侵式负荷识别方法及装置 |
CN113705601A (zh) * | 2021-05-21 | 2021-11-26 | 国网辽宁省电力有限公司鞍山供电公司 | 一种基于随机森林的电熔镁炉运行状态识别方法 |
CN113408203A (zh) * | 2021-06-18 | 2021-09-17 | 湘潭大学 | 一种基于正则化贪心森林算法非侵入式负荷辨识方法 |
CN113899944A (zh) * | 2021-09-30 | 2022-01-07 | 广东电网有限责任公司 | 一种电力负荷投切点的检测方法及装置 |
CN113899944B (zh) * | 2021-09-30 | 2023-11-10 | 广东电网有限责任公司 | 一种电力负荷投切点的检测方法及装置 |
CN115907567A (zh) * | 2023-02-21 | 2023-04-04 | 浙江大学 | 基于鲁棒性随机分割森林算法的负荷事件检测方法及*** |
CN115907567B (zh) * | 2023-02-21 | 2023-05-09 | 浙江大学 | 基于鲁棒性随机分割森林算法的负荷事件检测方法及*** |
CN117878931A (zh) * | 2024-03-12 | 2024-04-12 | 徐州景安重工机械制造有限公司 | 一种用于新能源动力站的应急能源调度***及方法 |
CN117878931B (zh) * | 2024-03-12 | 2024-07-05 | 徐州景安重工机械制造有限公司 | 一种用于新能源动力站的应急能源调度***及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110533089B (zh) | 2023-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110533089A (zh) | 基于随机森林的自适应非侵入式负荷识别方法 | |
CN110443302B (zh) | 基于特征融合与深度学习的负荷辨识方法及其应用 | |
Heo et al. | Toward load identification based on the Hilbert transform and sequence to sequence long short-term memory | |
CN105429135B (zh) | 一种非侵入式电力负荷分解的辨识决策方法及*** | |
CN109145949A (zh) | 基于集成学习的非侵入式电力负荷监测与分解方法及*** | |
CN110514889A (zh) | 一种非侵入式家庭用电负载识别的方法及*** | |
CN106485089B (zh) | 谐波用户典型工况的区间参数获取方法 | |
CN109975673B (zh) | 一种光伏微电网直流侧故障电弧识别方法 | |
CN110135167B (zh) | 一种随机森林的边缘计算终端安全等级评估方法 | |
CN109165604A (zh) | 基于协同训练的非侵入式负荷识别方法及其测试*** | |
CN106327357B (zh) | 一种基于改进概率神经网络的负载识别方法 | |
CN111242161B (zh) | 一种基于智能学习的非侵入式非居民用户负荷辨识方法 | |
CN108345906A (zh) | 一种基于Boost模型的非侵入式用电器识别方法 | |
CN111553444A (zh) | 一种基于非侵入负荷终端数据的负荷辨识方法 | |
CN111398811A (zh) | 基于终端电流代价敏感学习的pmsm退磁故障诊断方法 | |
CN111563827A (zh) | 基于电器物理特性及居民用电行为的负荷分解方法 | |
CN109272058A (zh) | 一种集成电力负荷曲线聚类方法 | |
Liu et al. | A multi-objective evolutionary algorithm based on membrane systems | |
CN108596227A (zh) | 一种用户用电行为主导影响因素挖掘方法 | |
CN108122173A (zh) | 一种基于深度信念网络的多行业负荷预测方法 | |
CN110414839A (zh) | 基于量子遗传算法和svm模型的负荷识别方法及*** | |
CN110261748A (zh) | Gis设备绝缘性能识别方法及*** | |
CN109472712A (zh) | 一种基于结构特征强化的高效马尔可夫随机场社团发现方法 | |
CN113408622A (zh) | 计及特征量信息表达差异的非侵入式负荷辨识方法及*** | |
CN108491893A (zh) | 一种基于深层森林算法的家庭用电负荷分类识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |