发明内容
本发明的目的是提供一种非侵入式家电负荷深度再识别方法,解决了现有技术中存在的单一算法导致负荷识别准确率低下的问题。
本发明所采用的技术方案是,一种非侵入式家电负荷深度再识别方法,具体按照以下步骤实施:
步骤1、获取用户高频数据,对获取的用户高频数据进行去噪处理;
步骤2、通过改进的广义似然比检验对步骤1中的数据进行事件检测,若检测到事件则执行步骤3,否则返回步骤1;
步骤3、对检测到的事件变点,提取多维负荷特征;
步骤4、针对步骤3提取的多维特征,用半监督的Relief-F与mRmR相结合的算法,筛选相关特征;
步骤5、将步骤4得到的特征作为负荷印记,通过自适应FCM算法建立负荷特征库,使用最大隶属度对用户内部家电负荷工作状态进行识别,若两种FCM算法识别结果一致,则结束,不一致则执行步骤6;
步骤6、对GRNN网络的参数光滑因子采用SA-BAS(模拟退火-天牛须)算法进行训练,利用训练好的GRNN网络进行待测样本的深度再识别,完成非侵入式家电负荷的最终识别。
本发明的特点还在于:
步骤1具体按照以下步骤实施:
步骤1.1、获取包含电气参数的高频家电负荷数据,具体表现为电压、电流和对应功率;
步骤1.2、功率信号的去噪处理,由于孤立的噪声点易被事件检测算法错误识别为事件,故选取中值滤波方法,对原始的功率信号进行处理,保证其消除噪声的同时,不改变边缘信息:假设存在一个数字信号序列xj(-∞<j<+∞),对其进行滤波处理时,首先定义一个长度为奇数L的窗口,L=2N+1,N为正整数,假设在某一时刻i,窗口内的信号样本为xi-N,…,xi,…,xi+N,其中xi是位于窗口中心的信号样本值,对这L个信号从小到大重新排列后,其中值便定义为中值滤波器的输出值。
步骤2具体按照以下步骤实施:
步骤2.1、根据式(1)计算基波有功功率P
1,将其联合有功功率P作为二维功率时间序列
根据式(2)提出二元假设检验;
式中,V
1为基波电压,I
1为基波电流,
为二者的相位差。n
c为变点发生时刻,k为窗口总长度,n为窗口中最后一个样本时刻,μ
0,∑
0为假设检验H
0条件下的高斯分布均值,协方差矩阵,μ
a,∑
a为H
1条件下变点发生之前的多维信号均值、多维协方差矩阵,μ
b,∑
b为H
1条件下变点发生之后的多维信号均值、多维协方差矩阵;
步骤2.2、在此时间序列内定义两个连续的窗口Wa和Wb,两窗口内样本为Xn={xm,m=n-k+1,…,n},两窗口长度均为k/2,根据式(3)、式(4)分别计算两窗口内的μ和Σ,之后根据式(5)计算决策函数gn;
步骤2.3、将gn与阈值h1比较,寻找事件发生的可疑点:当决策函数值大于h1时,拒绝H0,两窗口内部数据分布不一致,在变点时刻nc有发生事件的可能;当决策函数小于h1时,拒绝H1,两窗口数据分布一致,无事件发生。且当检测出的多个事件的采样点连续或间隔在3个之内时,将其视为仅有最大gn对应的事件发生;
步骤2.4、以此事件点为基点,对误检的事件进行F检验筛选。首先假设基点前后窗口数据的方差值相等:
根据公式(6)计算统计量F的数值,给定显著水平α,若F的数值满足式(7),则拒绝假设H
0,认为两个母体方差有显著差异,判断该点有事件发生;
步骤3具体按照以下实施:提取变点的功率特征,具体有:有功功率、基波有功功率、无功功率、基波无功功率、视在功率、失真功率、功率因数角、基波功率因数;提取变点处的谐波特征,具体有电压、电压的一至九次的各次谐波幅值、各次谐波含有率、各次谐波含有率之差、总谐波畸变率;电流波形特征,包括其波峰值、平均值、波峰系数;提取变点处的V-I轨迹特征,具体有:对称性、环绕方向、环绕面积、交点个数、Y轴截距、Y轴跨距、中线曲率、轨迹中间部分峰值、左右部分面积、中间部分形状、瞬时导纳标准差。
步骤4具体按照以下步骤实施:
步骤4.1、将部分多维特征样本贴上标签,记为有标记样本S1,剩余记为无标记样本S2,标签为C,多维特征集合为A=(A1,A2,…,AN);
步骤4.2、从S
1中随机抽取一个样本s,其类别为C
q(C
q∈C);从S
2中选出d个近邻样本,记为
在S
1中从除C
q之外的每一类C
p∈C(p≠q)中,分别求解s的一个最近邻样本x;并在S
2中求解x的d个近邻样本,记为
其中近邻公式如式(8)所示;基于公式(9)更新所有特征权重;
式中,M表示迭代次数,d为近邻样本个数,
为样本s所属的q类中的第t个近邻样本,
表示不同于样本s类别的第p类中的第t个近邻样本,P(C
p)表示第p类目标的概率,A
k为第k个特征,
表示样本s和样本
关于特征A
k的距离;
步骤4.3、将步骤4.2循环执行M次,并得到半监督Relief-F最终输出的特征权重ωk'(k=1,2,…,w'),剔除权重系数小于θ的特征,得到一个候选特征子集,进而对其进行半监督mRmR特征选择;
步骤4.4、根据公式(11)在有标记样本S1中计算各特征与样本标签的相关度,根据公式(12)在无标记样本S2中计算各特征的冗余度;
式中,
表示在有标签样本S
1中计算A
k与标签C的互信息,R(A
k,S
m-1)表示已有特征子集S
m-1,其包含m-1个特征,不在S
m-1子集中的特征A
k与已选特征的冗余度;
步骤4.5、建立特征候选集H,选择最大相关度Dmax对应特征作为候选集首项H1,根据式(13)依次选择第k个特征Ak放入H中,直至选出指定特征个数w;
步骤4.6、根据式(14)计算各特征权重。
步骤5具体按照以下步骤实施:
步骤5.1、设置初始聚类数目b,基于最大最小距离算法确定初始聚类中心,同时,计数器k归零;
a、计算数据集的平均值
记距平均值最远的样本点为V
1j(j=1,2,…,w);b、根据公式(15)计算每个数据点与已选聚类中心的最小距离D
x,选择D
x最大值点作为新的聚类中心;c、重复步骤b直至选出b个初始聚类中心;
Dx=min d(xi,Z'k) k'=1,…,kselected (15)
步骤5.2、构建FCM1算法的损失函数L1如式(17)所示,对uij,λj和vik求偏导并组合,利用推导出的式(18)和式(19)进行uij和vik的迭代更新;
式中,n为样本个数,b为聚类数目,w为特征数目,
为样本权重,u
ij为第j个样本属于第i类的隶属度,v为聚类中心矩阵,T
u∈(0,∞)取代模糊指数m,用于控制熵值,引入了最大熵作为正则化;
步骤5.3、计算J
1的值,若
初始聚类数目b的聚类完成,迭代终止,否则,k=k+1,转至步骤5.2继续迭代,直至满足要求;
步骤5.4、根据公式(20)计算初始聚类数b的聚类有效性指标,即轮廓系数S
b,若其满足S
b-2<S
b-1且S
b-1>S
b,则自适应FCM1分类结束,否则,判断聚类数目b是否达到最大值
若达到最大值,则取所有S
b中最大值所对应的b,u,v,若未达到最大值,则b=b+1,并返回执行步骤5.1;
式中,n为样本个数,a(i)为样本点i与同簇剩余样本对象的平均距离,b(i)为样本点i与剩余每个簇的样本对象平均距离的最小值,Sb在[-1,1]之间,S值越大,聚类效果越好;
步骤5.5、将FCM1的最佳聚类数目b设置为FCM2的聚类数,同样采取最大最小距离算法确定初始聚类中心,同时,计数器k归零;
步骤5.6、构建FCM2算法的损失函数J2如式(21)所示,对vik求偏导,利用推导出的式(22)进行vik的迭代更新,采样投影梯度下降法对uij进行迭代:
式中,λ≥0为正交约束参数,函数第二项为对隶属度矩阵增加近似正交约束,来平衡不平衡数据的影响,其中u
ip表示第i个样本点属于类簇p的隶属度,它是由原始隶属度函数u
ip'经过
变换而来;
步骤5.7、计算J
2的值,若
则FCM2聚类完成,迭代终止,否则,k=k+1,转至步骤5.6继续迭代,直至满足
负荷特征库中的FCM算法的聚类数和聚类中心确定完毕;
步骤5.8、输入待测样本,由负荷特征库确定初始聚类中心,通过FCM聚类得到隶属度函数,取待辨识样本对应的隶属度向量并输出,对隶属度进行排序,取最大隶属度对应类别,记为待辨识样本的所属负荷类别。若FCM1和FCM2的样本辨识结果一致,则算法识别结束,最大隶属度对应类别即为样本最终识别结果,若不一致,则执行步骤6。
步骤6具体按照以下步骤实施:
步骤6.1、将FCM辨识结果一致的样本组合起来,作为训练集来训练改进的GRNN神经网络;
步骤6.2、设置参数:输入层神经元个数为特征维数w;模式层神经元为训练集的样本集样本个数n,对于第i个神经元的传递函数如式(23)所示;求和层包含两种类型的神经元,一种是对所有模式层神经元的输出进行算数求和,其传递函数如式(24)所示,另一种是对所有模式层神经元的输出进行加权求和,其传递函数如式(25)所示;输出层神经元个数等于训练样本中输出向量的维数,即聚类的电器类别数b,它的网络输出为两种神经元相除,如式(26)所示;
式中,X为输入样本,Xi为训练集第i个样本数据,σ为光滑因子,Yij为第i个输出样本Yi中的第j个元素;
步骤6.3、GRNN的网络参数只有光滑因子,因此我们使用SA-BAS算法来寻找最优光滑因子σ;首先输入训练数据,并初始化参数:天牛初始位置X0=1,温度T=200,步长因子α=0.95,最大迭代次数N=200,退火循环次数L=100,质心到触须的距离d=1.5,计数器h归为1;
步骤6.4、设置天牛的步长S=T,同时计数器t归为1;
步骤6.5、根据公式(27)更新天牛左、右须位置,根据公式(28)更新天牛位置Xt+1,根据Metropolis准则计算其概率,判断是否接受Xt+1作为新解,如式(29)所示,更新步长St=αSt-1,根据式(30)更新质心到触须的距离,判断计数器t是否大于等于退火循环次数L,若是,则执行步骤6.6,否则,t=t+1,循环执行步骤6.5;
式中,
为随机单位向量,取右须指向左须的方向为天牛在空间中的朝向,sign()为符号函数,值大于零,取1,小于零,取-1,等于零,取0,T为当前温度,ΔT=f(X
t+1)-f(X
t),
为适应度函数的表达式,ω
j为特征权重,x
ij为训练样本网络输出值,
为训练样本预期输出值;
步骤6.6、根据公式(31)更新自适应因子β,T=βT,判断计数器h是否大于等于迭代次数N,若达到,则输出最优天牛位置作为最优光滑因子,训练结束,否则,h=h+1,执行步骤6.4。
式中,fh为当前适应度值,fmin为历史最优适应度值;
利用训练好的光滑因子结合步骤6.2条件,搭建GRNN网络,从而进行待测样本的深度再识别,完成非侵入式家电负荷最终识别。
本发明的有益效果是:本发明一种非侵入式家电负荷深度再识别方法,解决了现有技术中存在的单一算法导致负荷识别准确率低下的问题。通过GLR与F检验相结合的事件检测算法,定位事件发生时刻,使用半监督的Relief-F与mRmR相结合的算法,筛选出与电气标签相关性大的特征,通过自适应FCM1与FCM2组合进行一次判别,使用改进的GRNN进行二次判别,减少了误判和特征冗余,具有识别准确率高,识别速率快的优点。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明一种非侵入式家电负荷深度再识别方法,如图1所示,具体按照以下步骤实施:
步骤1、获取用户高频数据,对获取的用户高频数据进行去噪处理;
步骤1具体按照以下步骤实施:
步骤1.1、获取包含电气参数的高频家电负荷数据,具体表现为电压、电流和对应功率;
步骤1.2、功率信号的去噪处理,由于孤立的噪声点易被事件检测算法错误识别为事件,故选取中值滤波方法,对原始的功率信号进行处理,保证其消除噪声的同时,不改变边缘信息:假设存在一个数字信号序列xj(-∞<j<+∞),对其进行滤波处理时,首先定义一个长度为奇数L的窗口,L=2N+1,N为正整数,假设在某一时刻i,窗口内的信号样本为xi-N,…,xi,…,xi+N,其中xi是位于窗口中心的信号样本值,对这L个信号从小到大重新排列后,其中值便定义为中值滤波器的输出值。
步骤2、通过改进的广义似然比检验对步骤1中的数据进行事件检测,若检测到事件则执行步骤3,否则返回步骤1;
如图2所示,步骤2具体按照以下步骤实施:
步骤2.1、根据式(1)计算基波有功功率P
1,将其联合有功功率P作为二维功率时间序列
根据式(2)提出二元假设检验;
式中,V
1为基波电压,I
1为基波电流,
为二者的相位差。n
c为变点发生时刻,k为窗口总长度,n为窗口中最后一个样本时刻,μ
0,∑
0为假设检验H
0条件下的高斯分布均值,协方差矩阵,μ
a,∑
a为H
1条件下变点发生之前的多维信号均值、多维协方差矩阵,μ
b,∑
b为H
1条件下变点发生之后的多维信号均值、多维协方差矩阵;
步骤2.2、在此时间序列内定义两个连续的窗口Wa和Wb,两窗口内样本为Xn={xm,m=n-k+1,…,n},两窗口长度均为k/2,根据式(3)、式(4)分别计算两窗口内的μ和Σ,之后根据式(5)计算决策函数gn;
步骤2.3、将gn与阈值h1比较,寻找事件发生的可疑点:当决策函数值大于h1时,拒绝H0,两窗口内部数据分布不一致,在变点时刻nc有发生事件的可能;当决策函数小于h1时,拒绝H1,两窗口数据分布一致,无事件发生。且当检测出的多个事件的采样点连续或间隔在3个之内时,将其视为仅有最大gn对应的事件发生;
步骤2.4、以此事件点为基点,对误检的事件进行F检验筛选。首先假设基点前后窗口数据的方差值相等:
根据公式(6)计算统计量F的数值,给定显著水平α,若F的数值满足式(7),则拒绝假设H
0,认为两个母体方差有显著差异,判断该点有事件发生;
步骤3、对检测到的事件变点,提取多维负荷特征;
步骤3具体按照以下实施:提取变点的功率特征,具体有:有功功率、基波有功功率、无功功率、基波无功功率、视在功率、失真功率、功率因数角、基波功率因数;提取变点处的谐波特征,具体有电压、电压的一至九次的各次谐波幅值、各次谐波含有率、各次谐波含有率之差、总谐波畸变率;电流波形特征,包括其波峰值、平均值、波峰系数;提取变点处的V-I轨迹特征,具体有:对称性、环绕方向、环绕面积、交点个数、Y轴截距、Y轴跨距、中线曲率、轨迹中间部分峰值、左右部分面积、中间部分形状、瞬时导纳标准差。步骤4、针对步骤3提取的多维特征,用半监督的Relief-F与mRmR相结合的算法,筛选相关特征;
如图3所示,步骤4具体按照以下步骤实施:
步骤4.1、将部分多维特征样本贴上标签,记为有标记样本S1,剩余记为无标记样本S2,标签为C,多维特征集合为A=(A1,A2,…,AN);
步骤4.2、从S
1中随机抽取一个样本s,其类别为C
q(C
q∈C);从S
2中选出d个近邻样本,记为
在S
1中从除C
q之外的每一类C
p∈C(p≠q)中,分别求解s的一个最近邻样本x;并在S
2中求解x的d个近邻样本,记为
其中近邻公式如式(8)所示;基于公式(9)更新所有特征权重;
式中,M表示迭代次数,d为近邻样本个数,
为样本s所属的q类中的第t个近邻样本,
表示不同于样本s类别的第p类中的第t个近邻样本,P(C
p)表示第p类目标的概率,A
k为第k个特征,
表示样本s和样本
关于特征A
k的距离;
步骤4.3、将步骤4.2循环执行M次,并得到半监督Relief-F最终输出的特征权重ωk'(k=1,2,…,w'),剔除权重系数小于θ的特征,得到一个候选特征子集,进而对其进行半监督mRmR特征选择;
步骤4.4、根据公式(11)在有标记样本S1中计算各特征与样本标签的相关度,根据公式(12)在无标记样本S2中计算各特征的冗余度;
式中,
表示在有标签样本S
1中计算A
k与标签C的互信息,R(A
k,S
m-1)表示已有特征子集S
m-1,其包含m-1个特征,不在S
m-1子集中的特征A
k与已选特征的冗余度;
步骤4.5、建立特征候选集H,选择最大相关度Dmax对应特征作为候选集首项H1,根据式(13)依次选择第k个特征Ak放入H中,直至选出指定特征个数w;
步骤4.6、根据式(14)计算各特征权重。
步骤5、将步骤4得到的特征作为负荷印记,通过自适应FCM算法建立负荷特征库,使用最大隶属度对用户内部家电负荷工作状态进行识别,若两种FCM算法识别结果一致,则结束,不一致则执行步骤6;
如图4、图5所示,步骤5具体按照以下步骤实施:
步骤5.1、设置初始聚类数目b,基于最大最小距离算法确定初始聚类中心,同时,计数器k归零;
a、计算数据集的平均值
记距平均值最远的样本点为V
1j(j=1,2,…,w);b、根据公式(15)计算每个数据点与已选聚类中心的最小距离D
x,选择D
x最大值点作为新的聚类中心;c、重复步骤b直至选出b个初始聚类中心;
Dx=min d(xi,Z'k) k'=1,…,kselected (15)
步骤5.2、构建FCM1算法的损失函数L1如式(17)所示,对uij,λj和vik求偏导并组合,利用推导出的式(18)和式(19)进行uij和vik的迭代更新;
式中,n为样本个数,b为聚类数目,w为特征数目,
为样本权重,u
ij为第j个样本属于第i类的隶属度,v为聚类中心矩阵,T
u∈(0,∞)取代模糊指数m,用于控制熵值,引入了最大熵作为正则化;
步骤5.3、计算J
1的值,若
初始聚类数目b的聚类完成,迭代终止,否则,k=k+1,转至步骤5.2继续迭代,直至满足要求;
步骤5.4、根据公式(20)计算初始聚类数b的聚类有效性指标,即轮廓系数S
b,若其满足S
b-2<S
b-1且S
b-1>S
b,则自适应FCM1分类结束,否则,判断聚类数目b是否达到最大值
若达到最大值,则取所有S
b中最大值所对应的b,u,v,若未达到最大值,则b=b+1,并返回执行步骤5.1;
式中,n为样本个数,a(i)为样本点i与同簇剩余样本对象的平均距离,b(i)为样本点i与剩余每个簇的样本对象平均距离的最小值,Sb在[-1,1]之间,S值越大,聚类效果越好;
步骤5.5、将FCM1的最佳聚类数目b设置为FCM2的聚类数,同样采取最大最小距离算法确定初始聚类中心,同时,计数器k归零;
步骤5.6、构建FCM2算法的损失函数J2如式(21)所示,对vik求偏导,利用推导出的式(22)进行vik的迭代更新,采样投影梯度下降法对uij进行迭代:
式中,λ≥0为正交约束参数,函数第二项为对隶属度矩阵增加近似正交约束,来平衡不平衡数据的影响,其中u
ip表示第i个样本点属于类簇p的隶属度,它是由原始隶属度函数u
ip'经过
变换而来;
步骤5.7、计算J
2的值,若
则FCM2聚类完成,迭代终止,否则,k=k+1,转至步骤5.6继续迭代,直至满足
负荷特征库中的FCM算法的聚类数和聚类中心确定完毕;
步骤5.8、输入待测样本,由负荷特征库确定初始聚类中心,通过FCM聚类得到隶属度函数,取待辨识样本对应的隶属度向量并输出,对隶属度进行排序,取最大隶属度对应类别,记为待辨识样本的所属负荷类别。若FCM1和FCM2的样本辨识结果一致,则算法识别结束,最大隶属度对应类别即为样本最终识别结果,若不一致,则执行步骤6。
步骤6、对GRNN网络的参数光滑因子采用SA-BAS算法进行训练,利用训练好的GRNN网络进行待测样本的二次识别,完成非侵入式家电负荷二次识别。
如图6所示,步骤6具体按照以下步骤实施:
步骤6.1、将FCM辨识结果一致的样本组合起来,作为训练集来训练改进的GRNN神经网络;
步骤6.2、设置参数:输入层神经元个数为特征维数w;模式层神经元为训练集的样本集样本个数n,对于第i个神经元的传递函数如式(23)所示;求和层包含两种类型的神经元,一种是对所有模式层神经元的输出进行算数求和,其传递函数如式(24)所示,另一种是对所有模式层神经元的输出进行加权求和,其传递函数如式(25)所示;输出层神经元个数等于训练样本中输出向量的维数,即聚类的电器类别数b,它的网络输出为两种神经元相除,如式(26)所示;
式中,X为输入样本,Xi为训练集第i个样本数据,σ为光滑因子,Yij为第i个输出样本Yi中的第j个元素;
步骤6.3、GRNN的网络参数只有光滑因子,因此我们使用SA-BAS算法来寻找最优光滑因子σ;首先输入训练数据,并初始化参数:天牛初始位置X0=1,温度T=200,步长因子α=0.95,最大迭代次数N=200,退火循环次数L=100,质心到触须的距离d=1.5,计数器h归为1;
步骤6.4、设置天牛的步长S=T,同时计数器t归为1;
步骤6.5、根据公式(27)更新天牛左、右须位置,根据公式(28)更新天牛位置Xt+1,根据Metropolis准则计算其概率,判断是否接受Xt+1作为新解,如式(29)所示,更新步长St=αSt-1,根据式(30)更新质心到触须的距离,判断计数器t是否大于等于退火循环次数L,若是,则执行步骤6.6,否则,t=t+1,循环执行步骤6.5;
式中,
为随机单位向量,取右须指向左须的方向为天牛在空间中的朝向,sign()为符号函数,值大于零,取1,小于零,取-1,等于零,取0,T为当前温度,ΔT=f(X
t+1)-f(X
t),
为适应度函数的表达式,ω
j为特征权重,x
ij为训练样本网络输出值,
为训练样本预期输出值;
步骤6.6、根据公式(31)更新自适应因子β,T=βT,判断计数器h是否大于等于迭代次数N,若达到,则输出最优天牛位置作为最优光滑因子,训练结束,否则,h=h+1,执行步骤6.4。
式中,fh为当前适应度值,fmin为历史最优适应度值;
用训练好的光滑因子结合步骤6.2条件,搭建GRNN网络,从而进行待测样本的深度再识别,完成非侵入式家电负荷二次识别。
本发明一种非侵入式家电负荷深度再识别方法,通过GLR与F检验相结合的事件检测算法,定位事件发生时刻,使用半监督的Relief-F与mRmR相结合的算法,筛选出与电气标签相关性大的特征,通过自适应FCM1与FCM2组合进行一次判别,使用改进的GRNN进行最终判别,减少了误判和特征冗余,结果与其他文献方法相比,识别准确率较高,识别速率快。