CN110850358A - 基于逐步回归算法的电能表综合检定方法及*** - Google Patents

基于逐步回归算法的电能表综合检定方法及*** Download PDF

Info

Publication number
CN110850358A
CN110850358A CN201911262896.XA CN201911262896A CN110850358A CN 110850358 A CN110850358 A CN 110850358A CN 201911262896 A CN201911262896 A CN 201911262896A CN 110850358 A CN110850358 A CN 110850358A
Authority
CN
China
Prior art keywords
regression
data
module
sample data
electric energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911262896.XA
Other languages
English (en)
Inventor
王清
代燕杰
吴悠
董贤光
刘松
陈祉如
徐新光
王婷婷
刘潇
何毓函
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201911262896.XA priority Critical patent/CN110850358A/zh
Publication of CN110850358A publication Critical patent/CN110850358A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R35/00Testing or calibrating of apparatus covered by the other groups of this subclass
    • G01R35/04Testing or calibrating of apparatus covered by the other groups of this subclass of instruments for measuring time integral of power or current

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于逐步回归算法的电能表综合检定方法及***,方法包括以下步骤:对原始数据分布散点图进行可视化处理并删除异常值,生成样本数据;根据样本数据绘制正态概率图并进行正态分布检验处理;根据检验处理后样本数据拟合出样本误差平均值回归线和中位数回归线,并筛选样本数据;利用逐步回归算法对筛选的样本数据进行多元回归分析,确定回归方程;对回归方程的可信度进行检验,确定数据回归模型;对回归方程进行自变量权重归一化处理,基于相关度计算自变量对误差的影响权重;将自变量对误差的影响权重代入数据回归模型后对电能表进行综合检定。本发明对电能表进行综合检定,保证了电能计量装置的可靠性、稳定性。

Description

基于逐步回归算法的电能表综合检定方法及***
技术领域
本发明涉及一种基于逐步回归算法的电能表综合检定方法及***,属于电能计量技术领域。
背景技术
智能电能表自动化检定流水线车间包含大量智能电能表本体和检定设备,温度、湿度等多种误差源交叉混合,要想在庞大的检定车间严格控制参比温度等条件,使用普通空调很难实现。通常多采用精密空调,但这种做法投入大、能耗大。而国际上最新的电能表标准IR46已将环境温度控制范围从2度扩大至5度。为此,我国现有电能检定规程中参比条件有待进一步审视和优化,这需要大量检定实验数据支撑。
现有的运用于智能电能表误差分析的方法主要采用无偏估计方法,而无偏估计方法主要适用于不存在多重共线性问题的原始数据。然而在智能电能表综合检定误差模型中,温度、湿度等其他环境变量可能是相互依存、相互制约的,各自变量之间可能会存在一定的相关性,这种多重共线性的存在会对无偏估计结果产生较大的负面影响,一般主要表现为回归系数的稳定性差、精度低,模型的可解释性不强等。
因此,如何进行快速准确评估参比条件变化对检定误差影响程度以及精确的智能电能表综合检定是解决的关键问题。
发明内容
针现有技术的不足,本发明提出了一种基于逐步回归算法的电能表综合检定方法及***,其能够实现对电能表综合检定。
本发明解决其技术问题采取的技术方案是:
一方面,本发明实施例提供的一种基于逐步回归算法的电能表综合检定方法,包括以下步骤:
步骤1:对原始数据进行分布散点图可视化处理并删除异常值,生成样本数据;
步骤2:根据样本数据绘制正态概率图并进行正态分布检验处理;
步骤3:根据检验处理后样本数据生成样本误差的平均值、中位数散点图,拟合出样本误差平均值回归线和中位数回归线,并筛选样本数据;
步骤4:利用逐步回归算法对筛选的样本数据进行多元回归分析,确定回归方程;
步骤5:对回归方程的可信度进行检验,确定数据回归模型;
步骤6:对回归方程进行自变量权重归一化处理,基于相关度计算自变量对误差的影响权重;
步骤7:将自变量对误差的影响权重代入数据回归模型后对电能表进行综合检定。
作为本实施例一种可能的实现方式,所述步骤1包括:
获取原始样本数据并绘制分布散点图进行可视化处理;
检测可视化处理后的原始样本数据中的异常值;
删除原始样本数据的异常值,剩余原始样本数据作为样本数据。
作为本实施例一种可能的实现方式,所述步骤2包括:
绘制样本数据的正态概率图;
如果正态概率图中的大多数样本观测值集中在参考线附近,说明样本观测数据近似服从正态分布;如果大多数样本观测值偏离参考线则说明样本观测数据不服从正态分布;
通过运行结果中的h值和p值检验图像判断结果,如果p>0.05且h=0,表示符合正态分布。
作为本实施例一种可能的实现方式,所述步骤3包括:
(1)计算每组数据的算术平均值:
Figure BDA0002310903690000031
(2)计算每组数据的中位数
将每组数据从小到大排序为X1,…,XN
当N为奇数时,
m0.5=X(N+1)/2
当N为偶数时,
Figure BDA0002310903690000032
(3)拟合出样本误差平均值回归线和中位数回归线,并选取算术平均值和中位数两者中拟合效果较好的作为后续计算的样本数据。
作为本实施例一种可能的实现方式,所述步骤4包括:
1)计算变量均值
Figure BDA0002310903690000033
和差平方和L11,L22,L,Lpp,Lyy.记各自的标准化变量为
Figure BDA0002310903690000034
2)计算x1,x2,L,xp,y的相关系数矩阵R(0)
3)设已经选上K个变量:
Figure BDA0002310903690000035
且i1,i2,L,ik互不相同,R(0)经过变换后为
Figure BDA0002310903690000036
对j=1,2,L,k逐一计算标准化变量
Figure BDA0002310903690000037
的偏回归平方和
Figure BDA0002310903690000038
Figure BDA0002310903690000039
作F检验,对给定的显著性水平α,拒绝域为F<F1-α(1,n-k-1)。
4)循环步骤3),直至最终选上t个变量
Figure BDA00023109036900000311
且i1,i2,L,it互不相同,R(0)经过变换后为则对应的回归方程为:
5)通过代数运算求解回归方程得
Figure BDA00023109036900000314
作为本实施例一种可能的实现方式,在步骤5中,可信度的检验指标包括:
a)评价相关系数R:相关系数R绝对值在0.8~1范围内时,自变量与因变量具有较强的线性相关性;
b)F检验:当统计量F值超过F分布表临界值时,证明模型准确,否则因变量与自变量之间线性相关关系不显著;
c)p值检验:与统计量F对应的概率P≤α值时,因变量与自变量之间有显著的线性相关关系。
作为本实施例一种可能的实现方式,在步骤6中,
(1)将回归方程各系数{b1,…,bN}相加得到b;
(2)再分别用
Figure BDA0002310903690000041
得到一组数{a1,a2…aN};
{a1,a2…aN}中自变量所占的比例总和为1。
另一方面,本发明实施例提供的一种基于逐步回归算法的电能表综合检定***,包括:
样本数据生成模块,用于对原始数据分布散点图进行可视化处理并删除异常值,生成样本数据;
正态分布检验模块,用于根据样本数据绘制正态概率图并进行正态分布检验处理;
样本数据筛选模块,用于根据检验处理后样本数据生成样本误差的平均值、中位数散点图,拟合出样本误差平均值回归线和中位数回归线,并筛选样本数据;
回归分析模块,用于利用逐步回归算法对筛选的样本数据进行多元回归分析,确定回归方程;
可信度检验模块,用于对回归方程的可信度进行检验,确定数据回归模型;
归一化处理模块,用于对回归方程进行自变量权重归一化处理,基于相关度计算自变量对误差的影响权重;
电能表检定模块,用于将自变量对误差的影响权重代入数据回归模型后对电能表进行综合检定。
作为本实施例一种可能的实现方式,所述样本数据生成模块包括:
可视化处理模块,用于获取原始样本数据并绘制分布散点图进行可视化处理;
异常值检测模块,用于检测可视化处理后的原始样本数据中的异常值;
异常值删除模块,用于删除原始样本数据的异常值,剩余原始样本数据作为样本数据。
作为本实施例一种可能的实现方式,所述正态分布检验模块包括:
概率图绘制模块,用于绘制样本数据的正态概率图;
正态分布检验模块,用于如果正态概率图中的大多数样本观测值集中在参考线附近,说明样本观测数据近似服从正态分布;如果大多数样本观测值偏离参考线则说明样本观测数据不服从正态分布;
判断结果检验模块,用于通过运行结果中的h值和p值检验图像判断结果,如果p>0.05且h=0,表示符合正态分布。
作为本实施例一种可能的实现方式,所述样本数据筛选模块包括:
算术平均值计算模块,用于计算每组数据的算术平均值:
中位数计算模块,用于计算每组数据的中位数
将每组数据从小到大排序为X1,…,XN
当N为奇数时,
m0.5=X(N+1)/2
当N为偶数时,
后续计算数据选取模块,用于拟合出样本误差平均值回归线和中位数回归线,并选取算术平均值和中位数两者中拟合效果较好的作为后续计算的样本数据。
作为本实施例一种可能的实现方式,所述回归分析模块包括:
标准化变量模块,用于计算变量均值
Figure BDA0002310903690000061
和差平方和L11,L22,L,Lpp,Lyy.记各自的标准化变量为
Figure BDA0002310903690000062
相关系数矩阵模块,用于计算x1,x2,L,xp,y的相关系数矩阵R(0)
偏回归平方和计算模块,用于对已经选上K个变量:
Figure BDA0002310903690000063
且i1,i2,L,ik互不相同,R(0)经过变换后为
Figure BDA0002310903690000064
对j=1,2,L,k逐一计算标准化变量
Figure BDA0002310903690000065
的偏回归平方和
Figure BDA0002310903690000066
Figure BDA0002310903690000067
作F检验,
Figure BDA0002310903690000068
对给定的显著性水平α,拒绝域为F<F1-α(1,n-k-1)。
回归方程确定模块,用于循环步骤3),直至最终选上t个变量
Figure BDA0002310903690000069
且i1,i2,L,it互不相同,R(0)经过变换后为
Figure BDA00023109036900000610
则对应的回归方程为:
回归方程求解模块,用于通过代数运算求解回归方程得
Figure BDA00023109036900000612
作为本实施例一种可能的实现方式,所述可信度检验模块包括:
相关系数R评价模块,用于评价相关系数R:相关系数R绝对值在0.8~1范围内时,自变量与因变量具有较强的线性相关性;
F检验模块,用于检验统计量F:当统计量F值超过F分布表临界值时,证明模型准确,否则因变量与自变量之间线性相关关系不显著;
p值检验模块,用于检验p值:与统计量F对应的概率P≤α值时,因变量与自变量之间有显著的线性相关关系。
作为本实施例一种可能的实现方式,所述归一化处理模块包括:
系数相加模块,用于将回归方程各系数{b1,…,bN}相加得到b;
比例计算模块,用于分别用
Figure BDA00023109036900000613
得到一组数{a1,a2…aN};
{a1,a2…aN}中自变量所占的比例总和为1。
本发明实施例的技术方案可以具有的有益效果如下:
本发明实施例的技术方案将逐步回归算法运用于温度、湿度等检定条件同时变化情况下的电能表等计量装置的综合检定误差分析,准确的建立了智能电能表综合检定数据与温度等参变量的关系,当检定条件存在多重共线性时,拟合效果更好的智能电能表综合检定误差与检定条件的关系模型;通过对电能表等电能计量装置进行综合检定,有效检定电能计量装置的计量误差是否超出标准规定范围,保证了电能计量装置的可靠性、稳定性。
与现有技术相比,本发明的优点在于:
1.避免了由于多重共线性的存在对回归方程结果产生的负面影响;
2.求回归方程的同时可以筛选出检定条件中的关键指标,除去对模型影响较小的非关键性指标;
3.初步求得回归方程后,对方程进行可信度检验以最终确定回归模型,确定模型后通过权重归一化计算各自变量对误差的影响权重,计算结果可信度较高。
附图说明:
图1是根据一示例性实施例示出的一种基于逐步回归算法的电能表综合检定方法流程图;
图2是根据一示例性实施例示出的一种基于逐步回归算法的电能表综合检定***结构图。
具体实施方式
下面结合附图与实施例对本发明做进一步说明:
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
图1是根据一示例性实施例示出的一种基于逐步回归算法的电能表综合检定方法流程图。如图1所示,本发明实施例提供的一种基于逐步回归算法的电能表综合检定方法,包括以下步骤:
步骤1:对原始数据进行分布散点图可视化处理并删除异常值,生成样本数据。
获取原始样本数据并绘制分布散点图进行可视化处理;
检测可视化处理后的原始样本数据中的异常值;
删除原始样本数据的异常值,剩余原始样本数据作为样本数据。由于电能表数据采集量较大,且数据较为集中,而由输入错误导致的异常值较少,因此选择删除异常值。
步骤2:根据样本数据绘制正态概率图并进行正态分布检验处理。
绘制样本数据的正态概率图;
如果正态概率图中的大多数样本观测值集中在参考线附近,说明样本观测数据近似服从正态分布;如果大多数样本观测值偏离参考线则说明样本观测数据不服从正态分布;
通过运行结果中的h值和p值检验图像判断结果,如果p>0.05且h=0,表示符合正态分布。
通过绘制正态概率图来进行正态分布的检验,正态概率图描绘的是一条直线(参考线),每一个样本观测值对应上的一个‘+’号,如果图中的大多数‘+’号集中在参考线附加,说明样本观测数据近似服从正态分布;偏离参考线的‘+’号越多,说明样本观测数据越不服从正态分布;
通过运行结果中的h值和p值检验图像判断结果,h=0表示假设为符合正态分布,p>0.05表示接受h=0,即接受符合正态分布这个假设。
步骤3:根据检验处理后样本数据拟合出样本误差平均值回归线和中位数回归线,并筛选样本数据。
(1)计算每组数据的算术平均值:
(2)计算每组数据的中位数
将每组数据从小到大排序为X1,…,XN
当N为奇数时,中位数为:
m0.5=X(N+1)/2
当N为偶数时,中位数为:
(3)拟合出样本误差平均值回归线和中位数回归线,并选取算术平均值和中位数两者中拟合效果较好的,即散点距离拟合回归线较近的,作为后续计算的样本数据。
步骤4:利用逐步回归算法对筛选的样本数据进行多元回归分析,确定回归方程。
逐步回归分析时在考虑的全部自变量中按其对y的贡献程度大小,由大到小地逐个引入回归方程,而对那些对y作用不显著的变量不被引入回归方程。另外,已被引入回归方程的变量在引入新变量进行F检验后失去重要性时,需要从回归方程中剔除出去。
1)计算变量均值
Figure BDA0002310903690000093
和差平方和L11,L22,L,Lpp,Lyy.记各自的标准化变量为
Figure BDA0002310903690000094
2)计算x1,x2,L,xp,y的相关系数矩阵R(0)
3)设已经选上K个变量:且i1,i2,L,ik互不相同,R(0)经过变换后为
Figure BDA0002310903690000096
对j=1,2,L,k逐一计算标准化变量
Figure BDA0002310903690000097
的偏回归平方和
Figure BDA0002310903690000098
Figure BDA0002310903690000101
作F检验,
Figure BDA0002310903690000102
对给定的显著性水平α,拒绝域为F<F1-α(1,n-k-1)。
4)循环步骤3),直至最终选上了t个变量
Figure BDA0002310903690000103
且i1,i2,L,it互不相同,R(0)经过变换后为
Figure BDA0002310903690000104
则对应的回归方程为:
5)通过代数运算求解回归方程可得
Figure BDA0002310903690000106
通过对数据信息进行分解和筛选,筛选出对检定误差解释作用显著的自变量,同时较好地解决了在多重共线性不可避免的情况下最小二乘估计失效等问题,从而初步得到多元回归方程。
步骤5:对回归方程的可信度进行检验,确定数据回归模型。
可信度的检验指标为:
可信度的检验指标包括:
a)评价相关系数R:相关系数R绝对值在0.8~1范围内时,自变量与因变量具有较强的线性相关性;
b)F检验:当统计量F值超过F分布表临界值时,证明模型准确,否则因变量与自变量之间线性相关关系不显著;
c)p值检验:与统计量F对应的概率P≤α值时,因变量与自变量之间有显著的线性相关关系。
所述相关系数R主要依据相关现象之间的不同特征,表示变量之间线性相关程度;所述F值检验用来分析含多个参变量统计模型,以判断该模型中的所有或部分参变量是否适合用来估计母体;所述p值检验是由检验统计量的样本观察值得出的原假设可能被拒绝的最小显著性水平。
步骤6:对回归方程进行自变量权重归一化处理,基于相关度计算自变量对误差的影响权重。
(1)将回归方程各系数{b1,…,bN}相加得到b;
(2)再分别用
Figure BDA0002310903690000111
得到一组数{a1,a2…aN};
{a1,a2…aN}的总和为1,即为每个自变量所占的比例。
初步求得回归方程后,对方程进行可信度检验以最终确定回归模型,确定模型后通过权重归一化计算各自变量对误差的影响权重,计算结果可信度较高。
步骤7:将自变量对误差的影响权重代入数据回归模型后对电能表进行综合检定。
本实施例将逐步回归算法运用于检定条件同时变化情况下的电能表等计量装置的综合检定误差分析,准确的建立了智能电能表综合检定数据与温度等参变量的关系,当检定条件存在多重共线性时,拟合效果更好的智能电能表综合检定误差与检定条件的关系模型;通过对电能表等电能计量装置进行综合检定,有效检定电能计量装置的计量误差是否超出标准规定范围,保证了电能计量装置的可靠性、稳定性。
图2是根据一示例性实施例示出的一种基于逐步回归算法的电能表综合检定***结构图。如图2所示,本发明实施例提供的一种基于逐步回归算法的电能表综合检定***,包括:
样本数据生成模块,用于对原始数据分布散点图进行可视化处理并删除异常值,生成样本数据;
正态分布检验模块,用于根据样本数据绘制正态概率图并进行正态分布检验处理;
样本数据筛选模块,用于根据检验处理后样本数据生成样本误差的平均值、中位数散点图,拟合出样本误差平均值回归线和中位数回归线,并筛选样本数据;
回归分析模块,用于利用逐步回归算法对筛选的样本数据进行多元回归分析,确定回归方程;
可信度检验模块,用于对回归方程的可信度进行检验,确定数据回归模型;
归一化处理模块,用于对回归方程进行自变量权重归一化处理,基于相关度计算自变量对误差的影响权重;
电能表检定模块,用于将自变量对误差的影响权重代入数据回归模型后对电能表进行综合检定。
作为本实施例一种可能的实现方式,所述样本数据生成模块包括:
可视化处理模块,用于获取原始样本数据并绘制分布散点图进行可视化处理;
异常值检测模块,用于检测可视化处理后的原始样本数据中的异常值;
异常值删除模块,用于删除原始样本数据的异常值,剩余原始样本数据作为样本数据。
作为本实施例一种可能的实现方式,所述正态分布检验模块包括:
概率图绘制模块,用于绘制样本数据的正态概率图;
正态分布检验模块,用于如果正态概率图中的大多数样本观测值集中在参考线附近,说明样本观测数据近似服从正态分布;如果大多数样本观测值偏离参考线则说明样本观测数据不服从正态分布;
判断结果检验模块,用于通过运行结果中的h值和p值检验图像判断结果,如果p>0.05且h=0,表示符合正态分布。
作为本实施例一种可能的实现方式,所述样本数据筛选模块包括:
算术平均值计算模块,用于计算每组数据的算术平均值:
Figure BDA0002310903690000121
中位数计算模块,用于计算每组数据的中位数
将每组数据从小到大排序为X1,…,XN
当N为奇数时,
m0.5=X(N+1)/2
当N为偶数时,
Figure BDA0002310903690000131
后续计算数据选取模块,用于拟合出样本误差平均值回归线和中位数回归线,并选取算术平均值和中位数两者中拟合效果较好的作为后续计算的样本数据。
作为本实施例一种可能的实现方式,所述回归分析模块包括:
标准化变量模块,用于计算变量均值
Figure BDA0002310903690000132
和差平方和L11,L22,L,Lpp,Lyy.记各自的标准化变量为
Figure BDA0002310903690000133
相关系数矩阵模块,用于计算x1,x2,L,xp,y的相关系数矩阵R(0)
偏回归平方和计算模块,用于对已经选上K个变量:且i1,i2,L,ik互不相同,R(0)经过变换后为
Figure BDA0002310903690000135
对j=1,2,L,k逐一计算标准化变量
Figure BDA0002310903690000136
的偏回归平方和
Figure BDA0002310903690000137
Figure BDA0002310903690000138
作F检验,
Figure BDA0002310903690000139
对给定的显著性水平α,拒绝域为F<F1-α(1,n-k-1)。
回归方程确定模块,用于循环步骤3),直至最终选上t个变量
Figure BDA00023109036900001310
且i1,i2,L,it互不相同,R(0)经过变换后为则对应的回归方程为:
Figure BDA00023109036900001312
回归方程求解模块,用于通过代数运算求解回归方程得
Figure BDA00023109036900001313
作为本实施例一种可能的实现方式,所述可信度检验模块包括:
相关系数R评价模块,用于评价相关系数R:相关系数R绝对值在0.8~1范围内时,自变量与因变量具有较强的线性相关性;
F检验模块,用于检验统计量F:当统计量F值超过F分布表临界值时,证明模型准确,否则因变量与自变量之间线性相关关系不显著;
p值检验模块,用于检验p值:与统计量F对应的概率P≤α值时,因变量与自变量之间有显著的线性相关关系。
作为本实施例一种可能的实现方式,所述归一化处理模块包括:
系数相加模块,用于将回归方程各系数{b1,…,bN}相加得到b;
比例计算模块,用于分别用
Figure BDA0002310903690000141
得到一组数{a1,a2…aN};
{a1,a2…aN}中自变量所占的比例总和为1。
在无法确定哪些自变量对检定误差有影响的情况下,本发明首先对所有的自变量进行检验,判断其是否对检定误差有影响且影响是否足够大,之后再进行方程参数的确定。再通过相关系数R的评价、F值检验与p值检验对求得的回归方程的可信度进行检验,确定数据回归模型。最后基于相关度计算各自变量对检定误差影响的权重。该方法能够通过理论分析排除对检定结果可忽略的变量,在保证智能电能表综合检定数据与检定条件建模精度的基础上有效降低模型的复杂度。本发明通过对电能表等电能计量装置进行综合检定,有效检定电能计量装置的计量误差是否超出标准规定范围,保证了电能计量装置的可靠性、稳定性。
与现有技术相比,本发明的优点在于:
1.避免了由于多重共线性的存在对回归方程结果产生的负面影响;
2.求回归方程的同时可以筛选出检定条件中的关键指标,除去对模型影响较小的非关键性指标;
3.初步求得回归方程后,对方程进行可信度检验以最终确定回归模型,确定模型后通过权重归一化计算各自变量对误差的影响权重,计算结果可信度较高。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (14)

1.一种基于逐步回归算法的电能表综合检定方法,其特征是,包括以下步骤:
步骤1:对原始数据进行分布散点图可视化处理并删除异常值,生成样本数据;
步骤2:根据样本数据绘制正态概率图并进行正态分布检验处理;
步骤3:根据检验处理后样本数据生成样本误差的平均值、中位数散点图,拟合出样本误差平均值回归线和中位数回归线,并筛选样本数据;
步骤4:利用逐步回归算法对筛选的样本数据进行多元回归分析,确定回归方程;
步骤5:对回归方程的可信度进行检验,确定数据回归模型;
步骤6:对回归方程进行自变量权重归一化处理,基于相关度计算自变量对误差的影响权重;
步骤7:将自变量对误差的影响权重代入数据回归模型后对电能表进行综合检定。
2.根据权利要求1所述的基于逐步回归算法的电能表综合检定方法,其特征是,所述步骤1包括:
获取原始样本数据并绘制分布散点图进行可视化处理;
检测可视化处理后的原始样本数据中的异常值;
删除原始样本数据的异常值,剩余原始样本数据作为样本数据。
3.根据权利要求2所述的基于逐步回归算法的电能表综合检定方法,其特征是,所述步骤2包括:
绘制样本数据的正态概率图;
如果正态概率图中的大多数样本观测值集中在参考线附近,说明样本观测数据近似服从正态分布;如果大多数样本观测值偏离参考线则说明样本观测数据不服从正态分布;
通过运行结果中的h值和p值检验图像判断结果,如果p>0.05且h=0,表示符合正态分布。
4.根据权利要求3所述的基于逐步回归算法的电能表综合检定方法,其特征是,所述步骤3包括:
(1)计算每组数据的算术平均值:
Figure FDA0002310903680000021
(2)计算每组数据的中位数
将每组数据从小到大排序为X1,…,XN
当N为奇数时,
m0.5=X(N+1)/2
当N为偶数时,
Figure FDA0002310903680000022
(3)拟合出样本误差平均值回归线和中位数回归线,并选取算术平均值和中位数两者中拟合效果较好的作为后续计算的样本数据。
5.根据权利要求4所述的基于逐步回归算法的电能表综合检定方法,其特征是,所述步骤4包括:
1)计算变量均值
Figure FDA0002310903680000023
和差平方和L11,L22,L,Lpp,Lyy.记各自的标准化变量为
Figure FDA0002310903680000024
2)计算x1,x2,L,xp,y的相关系数矩阵R(0)
3)设已经选上K个变量:
Figure FDA0002310903680000025
且i1,i2,L,ik互不相同,R(0)经过变换后为
Figure FDA0002310903680000026
对j=1,2,L,k逐一计算标准化变量
Figure FDA0002310903680000027
的偏回归平方和
Figure FDA0002310903680000028
Figure FDA0002310903680000029
作F检验,
Figure FDA00023109036800000210
对给定的显著性水平α,拒绝域为F<F1-α(1,n-k-1)。
4)循环步骤3),直至最终选上t个变量
Figure FDA0002310903680000031
且i1,i2,L,it互不相同,R(0)经过变换后为
Figure FDA0002310903680000032
则对应的回归方程为:
Figure FDA0002310903680000033
5)通过代数运算求解回归方程得
Figure FDA0002310903680000034
6.根据权利要求5所述的基于逐步回归算法的电能表综合检定方法,其特征是,在步骤5中,
可信度的检验指标包括:
a)评价相关系数R:相关系数R绝对值在0.8~1范围内时,自变量与因变量具有较强的线性相关性;
b)F检验:当统计量F值超过F分布表临界值时,证明模型准确,否则因变量与自变量之间线性相关关系不显著;
c)p值检验:与统计量F对应的概率P≤α值时,因变量与自变量之间有显著的线性相关关系。
7.根据权利要求6所述的基于逐步回归算法的电能表综合检定方法,其特征是,在步骤6中,
(1)将回归方程各系数{b1,…,bN}相加得到b;
(2)再分别用
Figure FDA0002310903680000035
得到一组数{a1,a2…aN};{a1,a2…aN}中自变量所占的比例总和为1。
8.一种基于逐步回归算法的电能表综合检定***,其特征是,包括:
样本数据生成模块,用于对原始数据分布散点图进行可视化处理并删除异常值,生成样本数据;
正态分布检验模块,用于根据样本数据绘制正态概率图并进行正态分布检验处理;
样本数据筛选模块,用于根据检验处理后样本数据生成样本误差的平均值、中位数散点图,拟合出样本误差平均值回归线和中位数回归线,并筛选样本数据;
回归分析模块,用于利用逐步回归算法对筛选的样本数据进行多元回归分析,确定回归方程;
可信度检验模块,用于对回归方程的可信度进行检验,确定数据回归模型;
归一化处理模块,用于对回归方程进行自变量权重归一化处理,基于相关度计算自变量对误差的影响权重;
电能表检定模块,用于将自变量对误差的影响权重代入数据回归模型后对电能表进行综合检定。
9.根据权利要求8所述的基于逐步回归算法的电能表综合检定***,其特征是,所述样本数据生成模块包括:
可视化处理模块,用于获取原始样本数据并绘制分布散点图进行可视化处理;
异常值检测模块,用于检测可视化处理后的原始样本数据中的异常值;
异常值删除模块,用于删除原始样本数据的异常值,剩余原始样本数据作为样本数据。
10.根据权利要求8所述的基于逐步回归算法的电能表综合检定***,其特征是,所述正态分布检验模块包括:
概率图绘制模块,用于绘制样本数据的正态概率图;
正态分布检验模块,用于如果正态概率图中的大多数样本观测值集中在参考线附近,说明样本观测数据近似服从正态分布;如果大多数样本观测值偏离参考线则说明样本观测数据不服从正态分布;
判断结果检验模块,用于通过运行结果中的h值和p值检验图像判断结果,如果p>0.05且h=0,表示符合正态分布。
11.根据权利要求8所述的基于逐步回归算法的电能表综合检定***,其特征是,所述样本数据筛选模块包括:
算术平均值计算模块,用于计算每组数据的算术平均值:
Figure FDA0002310903680000051
中位数计算模块,用于计算每组数据的中位数
将每组数据从小到大排序为X1,…,XN
当N为奇数时,
m0.5=X(N+1)/2
当N为偶数时,
后续计算数据选取模块,用于拟合出样本误差平均值回归线和中位数回归线,并选取算术平均值和中位数两者中拟合效果较好的作为后续计算的样本数据。
12.根据权利要求8所述的基于逐步回归算法的电能表综合检定***,其特征是,所述回归分析模块包括:
标准化变量模块,用于计算变量均值
Figure FDA0002310903680000053
和差平方和L11,L22,L,Lpp,Lyy.记各自的标准化变量为
Figure FDA0002310903680000054
相关系数矩阵模块,用于计算x1,x2,L,xp,y的相关系数矩阵R(0)
偏回归平方和计算模块,用于对已经选上K个变量:且i1,i2,L,ik互不相同,R(0)经过变换后为
Figure FDA0002310903680000056
对j=1,2,L,k逐一计算标准化变量
Figure FDA0002310903680000057
Figure FDA0002310903680000058
回归平方和
Figure FDA0002310903680000059
作F检验,对给定的显著性水平α,拒绝域为F<F1-α(1,n-k-1)。
回归方程确定模块,用于循环步骤3),直至最终选上t个变量
Figure FDA00023109036800000512
且i1,i2,L,it互不相同,R(0)经过变换后为
Figure FDA00023109036800000513
则对应的回归方程为:
Figure FDA0002310903680000061
回归方程求解模块,用于通过代数运算求解回归方程得
Figure FDA0002310903680000062
13.根据权利要求8所述的基于逐步回归算法的电能表综合检定***,其特征是,所述可信度检验模块包括:
相关系数R评价模块,用于评价相关系数R:相关系数R绝对值在0.8~1范围内时,自变量与因变量具有较强的线性相关性;
F检验模块,用于检验统计量F:当统计量F值超过F分布表临界值时,证明模型准确,否则因变量与自变量之间线性相关关系不显著;
p值检验模块,用于检验p值:与统计量F对应的概率P≤α值时,因变量与自变量之间有显著的线性相关关系。
14.根据权利要求8所述的基于逐步回归算法的电能表综合检定***,其特征是,所述归一化处理模块包括:
系数相加模块,用于将回归方程各系数{b1,…,bN}相加得到b;
比例计算模块,用于分别用
Figure FDA0002310903680000063
得到一组数{a1,a2…aN};{a1,a2…aN}中自变量所占的比例总和为1。
CN201911262896.XA 2019-12-10 2019-12-10 基于逐步回归算法的电能表综合检定方法及*** Pending CN110850358A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911262896.XA CN110850358A (zh) 2019-12-10 2019-12-10 基于逐步回归算法的电能表综合检定方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911262896.XA CN110850358A (zh) 2019-12-10 2019-12-10 基于逐步回归算法的电能表综合检定方法及***

Publications (1)

Publication Number Publication Date
CN110850358A true CN110850358A (zh) 2020-02-28

Family

ID=69608739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911262896.XA Pending CN110850358A (zh) 2019-12-10 2019-12-10 基于逐步回归算法的电能表综合检定方法及***

Country Status (1)

Country Link
CN (1) CN110850358A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112927012A (zh) * 2021-02-23 2021-06-08 第四范式(北京)技术有限公司 营销数据的处理方法及装置、营销模型的训练方法及装置
CN114355274A (zh) * 2022-03-14 2022-04-15 浙江万胜智能科技股份有限公司 一种用电信息数据的定期校准方法及***
CN115372294A (zh) * 2022-09-15 2022-11-22 中国市政工程东北设计研究总院有限公司 一种石墨管稳定性判别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559388A (zh) * 2013-10-18 2014-02-05 中冶集团武汉勘察研究院有限公司 一种基于多元逐步回归建立细粒尾矿工程性质指标估算经验公式的方法
CN104361532A (zh) * 2014-11-20 2015-02-18 国家电网公司 微地形大风区对输电线路安全运行影响的研究方法
CN110184088A (zh) * 2019-06-04 2019-08-30 哈尔滨理工大学 一种超声联合电场的原油脱水装置及脱水方法
CN112084678A (zh) * 2020-09-22 2020-12-15 国网冀北电力有限公司承德供电公司 一种基于多元回归的配线线损率处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559388A (zh) * 2013-10-18 2014-02-05 中冶集团武汉勘察研究院有限公司 一种基于多元逐步回归建立细粒尾矿工程性质指标估算经验公式的方法
CN104361532A (zh) * 2014-11-20 2015-02-18 国家电网公司 微地形大风区对输电线路安全运行影响的研究方法
CN110184088A (zh) * 2019-06-04 2019-08-30 哈尔滨理工大学 一种超声联合电场的原油脱水装置及脱水方法
CN112084678A (zh) * 2020-09-22 2020-12-15 国网冀北电力有限公司承德供电公司 一种基于多元回归的配线线损率处理方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A.科苏扬尼斯: "《经济计量学理论 经济计量方法概论》", 30 November 1972, 辽宁财经学院基础部 *
冯力: "《统计学》", 31 July 2018, 东北财经大学出版社 *
徐红: "《构建与实施 高校科研评价体系研究》", 30 April 2019, 华中师范大学出版社 *
陈林林: "《普通高等教育"十三五"规划教材 食品试验设计与数据处理》", 28 February 2017, 中国轻工业出版社 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112927012A (zh) * 2021-02-23 2021-06-08 第四范式(北京)技术有限公司 营销数据的处理方法及装置、营销模型的训练方法及装置
CN114355274A (zh) * 2022-03-14 2022-04-15 浙江万胜智能科技股份有限公司 一种用电信息数据的定期校准方法及***
CN114355274B (zh) * 2022-03-14 2022-07-12 浙江万胜智能科技股份有限公司 一种用电信息数据的定期校准方法及***
CN115372294A (zh) * 2022-09-15 2022-11-22 中国市政工程东北设计研究总院有限公司 一种石墨管稳定性判别方法

Similar Documents

Publication Publication Date Title
CN110850358A (zh) 基于逐步回归算法的电能表综合检定方法及***
CN107015875A (zh) 一种电子整机贮存寿命评估方法及装置
CN111400505A (zh) 一种用电信息采集***匹配故障消缺方案的方法及***
CN111831556A (zh) 软件多故障解耦及并行定位方法及装置
CN112214880B (zh) 一种基于虚实融合的多阶段维修性评估方法
CN111752833B (zh) 一种软件质量体系准出方法、装置、服务器及存储介质
Parker Computer simulation through an error-statistical lens
CN115587670A (zh) 一种基于指标图谱的产品质量诊断方法及装置
CN111914424B (zh) 一种基于短期测风资料的设计风速取值方法及***
CN113761755A (zh) 考虑认知不确定性的温湿度双应力下的加速寿命分析方法
CN111506878B (zh) 基于暂降***指标随机样本估计的节点数量选择装置及方法
CN109102486B (zh) 基于机器学习的表面缺陷检测方法及装置
CN108446213A (zh) 一种静态代码质量分析方法和装置
EP2738701A2 (en) Method and apparatus for statistical electronic circuit simulation
CN105989095B (zh) 顾及数据不确定性的关联规则显著性检验方法及装置
CN104572470B (zh) 一种基于蜕变关系的整数溢出故障检测方法
CN111176253A (zh) 一种基于蒙特卡洛的飞行控制律自动评估方法
CN115983329A (zh) 空气质量及气象条件的预测方法、装置、设备及存储介质
CN115756390A (zh) 量子随机数的随机性检验方法及***
US8027764B2 (en) Method and system for automatic test data generation for lookup tables
CN114936475A (zh) 一种基于拟合优度可信度融合的复杂***成功率评估方法
CN107491576B (zh) 基于性能退化数据的导弹部件可靠性分析方法
CN112307616A (zh) 一种机电产品半试验寿命与可靠性仿真方法
CN109145502B (zh) 一种威布尔型单元寿命分布参数估计方法
CN107862126B (zh) 一种部件级信息多样性条件下的***可靠性评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200228

RJ01 Rejection of invention patent application after publication