CN114330553B

CN114330553B - 基于监督学习的数字采集***校准方法

Info

Publication number: CN114330553B
Application number: CN202111639271.8A
Authority: CN
Inventors: 朱桂兵; 傅鹏; 王猛; 曾浩; 田雨; 郭连平; 蒋俊
Original assignee: Chengdu Jinghui Technology Co ltd; University of Electronic Science and Technology of China
Current assignee: Chengdu Jinghui Technology Co ltd; University of Electronic Science and Technology of China
Priority date: 2021-12-29
Filing date: 2021-12-29
Publication date: 2023-04-07
Anticipated expiration: 2041-12-29
Also published as: CN114330553A

Abstract

本发明公开了一种基于集成监督学习算法的数字采集***校准方法，构建包括上位机、高精度标准源和高精度数字采集***的校准***，并构建校准模型，上位机控制待校准数字采集***和高精度数字采集***对高精度标准源的源信号进行采集，同时采集待校准数字采集***的工作运行参数数据，上位机对待校准数据、参考数据和工作运行参数数据进行处理，得到训练样本数据集对校准模型进行训练和测试，校准准确率达到目标后，采用训练好的校准模型对待校准数字采集***的待校准数据进行校准。本发明通过对数据处理方法进行改进，综合考虑信号数据和待校准数字采集***的工作运行参数数据，提高数字采集***的校准速度和校准精度。

Description

基于监督学习的数字采集***校准方法

技术领域

本发明属于高精度数据采集模块技术领域，更为具体地讲，涉及一种基于监督学习的数字采集***校准方法。

背景技术

在现代工业中，数据采集***中一种应用非常广泛的电子***，其准确度十分重要。数字采集***的校准工作往往借助高精度的多功能校准仪，通过比对校准仪输出的相对真值与数字采集***的实测量值，完成任一量值的精度回归分析。传统数字采集***校准工作中，将采集得到的原始数据经过简单的异常值处理之后转存到硬件存储介质中以期持久化，重复导入模型以完成校准流程。这样的数据处理方式同样存在诸多问题：

a.异常数据的预处理规则无法实时更新和学习，导致环境因素改变之后出现误处理的情况；

b.未考虑或未处理型别特征(如测量类型，测量量程，速度/频率档位等)，无法对其进行有效编码和合理利用；

c.无法处理采集时既已丢失或异常处理后空缺的特征数据，导致由数据不全造成的局部精度丢失；

e.未考虑对采集的数据进行概率分布的映射，以更好地适应非线性的回归模型；

e.未对采样点序列的分布做任何预处理或反馈处理，导致采样点不具备代表性，进而丢失模型的可解释性；

f.未分析训练数据集中各特征的因果/相关性，遑论对特征进行筛选和提取，也就无搭建出合理的回归模型；

g.无任何对训练数据加以更新或学习的策略，导致低效率的硬件持久化和频发的数据失效。

此外，数字采集***的硬件设计通常存在一些较难控制的因素，主要包括：

a.由于器件的热噪声和工作温度曲线不一致，导致设备在不同温度下的工作特性迥异；

b.同一交流信号，其幅值与频率存在显著的相关性；且在交流小信号的情况下，由于采样精度的丢失，导致随机噪声极大，回归曲线显现出较明显的非线性。

传统的数字采集***校准工作通常未考虑以上因素，导致最终的校准出现较大误差。

发明内容

本发明的目的在于克服现有技术的不足，提供一种基于监督学习的数字采集***校准方法，采用改进的数据处理方法，提高校准速度和校准精度。

为了实现上述发明目的，本发明基于监督学习的数字采集***校准方法包括以下步骤：

S1：构建校准***，包括上位机、高精度标准源和高精度数字采集***，其中：

高精度标准源用于在上位机的控制下向待校准数字采集***和高精度数字采集***输出源信号；

高精度数字采集***用于作为校准参考，待校准数字采集***和高精度数字采集***在上位机的控制下同时对源信号进行采集，将采集得到的样本数据发送至上位机；

上位机用于对高精度标准源、待校准数字采集***和高精度数字采集***进行控制，对待校准数字采集***的工作运行参数进行采样，然后接收校准数字采集***和高精度数字采集***的样本数据并进行待校准数字采集***的校准；

S2：构建校准模型，其输入为待校准数字采集***的待校准数据对应的特征数据，其输出为待校准数据对应的校准数据；

S3：上位机控制高精度标准源向待校准数字采集***和高精度数字采集***输出源信号，将待校准数字采集***和高精度数字采集***调整至同一档位并同时对源信号进行采集，待校准数字采集***和高精度数字采集***将采集得到的待校准数据和参考数据反馈回上位机；

同时上位机采用同样的采样率对工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集，得到工作运行参数数据，初始工作运行参数集合φ中所包含的工作运行参数根据实际需要设置；

S4：上位机对校准数字采集***和高精度数字采集***的信号数据进行处理，得到训练样本数据集，具体包括以下步骤：

S4.1：上位机对待校准数据、参考数据和工作运行参数数据进行异常数据检测，将检测得到的异常数据进行标记；

S4.2：对于待校准数据、参考数据和工作运行参数数据，如果某个采样点的数据缺失或被标记为异常数据，则对该采样点的数据进行插补；

S4.3：对于经过异常数据检测和插补的待校准数据、参考数据和工作运行参数数据，采用长度为L的滑动窗口对数据进行分段；记所得到的样本数据段的数量为N，第n个待校准数据为c_n，n＝1,2,…,N，所对应的相同时间段的参考数据为r_n，每个工作运行参数数据为w_n,m，m＝1,2,…,|φ|，|φ|表示所选用的工作运行参数的数量；

上位机根据对待校准数字采集***和高精度数字采集***的控制信号，确定每段数据所对应的档位参数，包括测量类型、测量量程、速度档位、频率档位，对各个档位参数进行特征编码，获取数值化的档位参数，拼接得到档位数据g_n，记其维数为G；

将对应时间段的待校准数据c_n、M个工作运行参数数据w_n,m和档位数据g_n进行拼接，得到维数为(M+1)L+G维特征数据d_n；

S4.4：对特征数据d_n中的每一位特征数据进行无量纲处理，得到特征数据d′_n；

S4.5：根据N个特征数据d′_n进行特征筛选，然后对特征数据进行降维，记得到的特征数据为D_n，其维数为K；

S4.6：将待校准数据c_n对应的特征数据D_n作为输入，将对应时间段的参考数据r_n作为待校准数据c_n的期望校准结果，构成训练样本；然后将N个训练样本划分为两个集合，分别作为训练集和测试集；

S5：将校准模型的输入维数设置为K，输出维数设置为L，采用训练集对校准模型进行训练；

S6：采用测试集对校准模型进行测试，计算得到校准准确率；

S7：判断校准准确率是否达到预设目标，如果未达到，进入步骤S8，否则进入步骤S9；

S8：根据步骤S4.5的特征筛选结果，确定降维后的特征数据中涉及的工作运行参数，对工作运行参数集合φ进行更新；返回步骤S3；

S9：上位机控制待校准数字采集***调整至所需档位对所需采集信号进行采集，待校准数字采集***将采集得到的待校准数据反馈回上位机；同时上位机采用同样的采样率对当前工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集；

上位机将当前采样点及前L-1个采样点的待校准数据记为

每个工作运行参数数据记为

同时获取当前的档位参数，采用步骤SS4.3中的相同方法对档位参数进行特征编码，得到档位数据

将待校准数据

M个工作运行参数数据

和档位数据

进行拼接，得到维数为(M+1)L+G维的特征数据

采用步骤S4.4中的相同方法对特征数据

中的每一位特征数据进行无量纲处理，得到特征数据

根据当前的特征筛选结果，对特征数据

进行降维得到特征数据D′；

将特征数据D′输入训练好的校准模型，得到待校准数据

的校准结果

本发明基于集成监督学习算法的数字采集***校准方法，构建包括上位机、高精度标准源和高精度数字采集***的校准***，并构建校准模型，上位机控制待校准数字采集***和高精度数字采集***对高精度标准源的源信号进行采集，同时采集待校准数字采集***的工作运行参数数据，上位机对待校准数据、参考数据和工作运行参数数据进行处理，得到训练样本数据集对校准模型进行训练和测试，校准准确率达到目标后，采用训练好的校准模型对待校准数字采集***的待校准数据进行校准。

本发明通过对数据处理方法进行改进，综合考虑信号数据和待校准数字采集***的工作运行参数数据，提高数字采集***的校准速度和校准精度。

附图说明

图1是本发明基于监督学习的数字采集***校准方法的具体实施方式流程图；

图2是本发明中校准***的结构图；

图3是本实施例中变间隔采样时采样间隔的确定方法流程图；

图4是一轮数据优化的示例图；

图5是本发明中数据处理的流程图。。

具体实施方式

下面结合附图对本发明的具体实施方式进行描述，以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是，在以下的描述中，当已知功能和设计的详细描述也许会淡化本发明的主要内容时，这些描述在这里将被忽略。

实施例

图1是本发明基于监督学习的数字采集***校准方法的具体实施方式流程图。如图1所示，本发明基于监督学习的数字采集***校准方法的具体步骤包括：

S101：构建校准***：

为了实现数字采集***的校准，本发明采用上位机、高精度标准源和高精度数字采集***搭建校准***。图2是本发明中校准***的结构图。如图2所示，本发明中校准***包括上位机、高精度标准源和高精度数字采集***，其中：

高精度标准源用于在上位机的控制下向待校准数字采集***和高精度数字采集***输出源信号。

高精度数字采集***用于作为校准参考，其精度需要高于待校准数字采集***。待校准数字采集***和高精度数字采集***在上位机的控制下同时对源信号进行采集，将采集得到的样本数据发送至上位机。

上位机用于对高精度标准源、待校准数字采集***和高精度数字采集***进行控制，对待校准数字采集***的工作运行参数进行采样，然后接收校准数字采集***和高精度数字采集***的信号数据并进行待校准数字采集***的校准。

S102：构建校准模型：

构建校准模型，其输入为待校准数字采集***的待校准数据对应的特征数据，其输出为待校准数据对应的校准数据。

在现有的数字采集***校准工作中，其校准策略一般是在最小二乘线性回归的基础上，进行较简单分割插值和高阶拓展，这样的校准方式存在诸多问题：

a.盲目地对线性回归进行高阶拓展，极易导致过拟合现象的出现——当训练点数与模型阶次相当甚至不足时，训练数据显得局部而片面，加之高维度模型会过分记忆训练数据携带的噪声，反而忽略真实的输入/输出关系。反映到结果上，表现为模型可以相当准确地回归训练值，而在测试值上表现则不尽如人意。

b.最小二乘线性回归以均方误差最小化作为回归标准，导致其对输入值的细微变化过分敏感，而模型本身对于异常输入(粗大值)完全无法处理，这使得模型的稳定性受到巨大挑战。

c.分割插值的方式适用于目标回归值存在显著的分段现象的情况，但这类方法无法准确地对分割点进行选择和处理，导致模型复杂，精度下降。

d.最小二乘线性回归的方式无法对其他特征因子(温度，信号频率等)做出及时而准确的反馈，即便采用多维的多元线性回归的方式，也无法完美地训练出一个兼具可解释性和高精度的回归模型；

e.传统模型的一个最大弊端是简单的对回归模型进行点分析，而不考虑训练数据及其目标值本身携带的噪声分布以及回归系数自身的分布情况，无法利用一些训练数据的一些先验条件，依据贝叶斯方法做出可解释的非线性回归预测。

f.除此之外，最小二乘线性回归还具有无法处理特征依赖、模型难以解释，回归模型单一、无法适应新环境，回归计算复杂度高、无法实现增量处理等诸多缺陷。

针对以上问题，本实施例中，根据本发明所针对的数字采集***待校准数据的特点，选择多个回归模型集成得到校准模型。

在回归模型中，惩罚线性回归模型通常用于控制高阶模型过拟合现象的，如岭回归Ridge模型、Lasso模型和Elastic-Net模型等。他们可以提供用于调整线性模型的特征权重分布的超参数。由于本发明所关联之各数值特征只能保证在一定精度范围内的相对稳定，各采样点的实测量值本身携带***噪声，惩罚线性回归理应能够在一定程度上缓解精度噪声对模型鲁棒性的干扰，并能适度地抑制回归结果的过拟合现象。

而高鲁棒性线性回归可以控制异常值干扰，如RANSAC模型、Huber模型和Theil-Sen模型。异常值对线性模型的负面影响是极其恶劣的，而高鲁棒性线性回归模型通过分割采样点迭代拟合的方式，逐步识别坏值并构建全局回归模型。

非线性模型可以相对准确描述真实问题并提高模型可解释性的，这类模型大致都是在其他已知模型的基础上引入核技巧加以重构的，如支持向量回归，内核岭回归和高斯过程回归。由于核方法的引入，这类模型能够很好地对已知量(训练集)和未知量(特征权重系数)给出合理的先验分布假设，通过交叉验证和参数优化得到未知量的最佳回归值。

因此，本实施例从回归模型中优选得到Ridge模型、Lasso模型、Elastic-Net模型、ARD模型、RANSAC模型、Huber模型，从非线性模型中优选得到GPR(高斯过程回归)模型、KRR(内核岭回归)模型以及SVR(支持向量回归)模型，将上述模型集成得到校准模型。就集成算法而言，本实施例中采用堆叠算法，该算法是一种较为常见的集成算法，其具体过程在此不再赘述。

S103：采集样本数据：

上位机控制高精度标准源向待校准数字采集***和高精度数字采集***输出源信号，将待校准数字采集***和高精度数字采集***调整至同一档位并同时对源信号进行采集，待校准数字采集***和高精度数字采集***将采集得到的样本数据反馈回上位机。

同时上位机采用同样的采样率对工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集，初始工作运行参数集合φ中所包含的工作运行参数根据实际需要设置。一般来说，工作运行参数包括设备温度、已开机时长、交流信号频率等。

数据的质量对于后续处理和校准至关重要，好的采样点分布设计能够保证数据处理的合理性并节省数据处理时间。因此在进行数据采集时可以采用变间隔采样，以使数据更加合理，那么各个采样间隔的设置尤为重要。图3是本实施例中变间隔采样时采样间隔的确定方法流程图。如图3所示，本实施例中变间隔采样时采样间隔采用如下方法确定：

S301：获取样本数据：

为了使采样数据更加准确，采用高精度数字采集***对源信号以预设的采样间隔进行采集得到原始数据，记采样点数为H。将原始数据作为数据序列X，其中第h个采样数据为x_h，对应采样时刻为t_h，h＝1,2,…,H。

S302：计算原始比重：

计算数据序列X中每个采样点数据x_h的原始比重p_h：

其中，

表示根据源信号得到的第f个采样数据x_f的理论值。

S303：判断H个原始比重p_h是否满足预设的线性分布，如果不满足，进入步骤S304，否则进入步骤S308。

S304：计算权重：

计算每个采样点数据x_h的权重w_h：

S305：计算绝对权重：

计算每个采样点数据x_h的绝对权重W_h：

S306：计算量化步进：

计算每个采样点数据x_h与其下一个数据x_h+1之间的量化步进λ_h，具体方法如下：

1)令h＝1，累计误差Δ＝0。

2)判断是否h＝1或h＝H，如果是，令量化步进λ_h＝1，进入步骤6)，否则进入步骤3)。

3)判断是否绝对权重W_h＜1，如果是，进入步骤4)，否则将绝对权重W_h取整作为量化步进λ_h，进入步骤6)。

本实施例中取整采用银行家舍入法，又称为四舍六入五取偶(又称四舍六入五留双)法，较普通四舍五入法误差更小。

4)令Δ＝Δ+W_h。

5)判断是否累计误差Δ＜1，如果是，令量化步进λ_h＝0，否则令量化步进λ_h＝1，更新累计误差Δ＝Δ-1。然后进入步骤6)。

6)判断是否h＜H，如果是，进入步骤7)，否则进入步骤8)。

7)令h＝h+1，返回至步骤2)。

8)判断是否

如果是，量化步进计算结束，否则进入步骤9)。

9)从H个量化步进λ_h中筛选出最大值λ_h*，令

即通过最大值λ_h*来弥补量化步进和采样点之间的差值，从而令优化数据的采样点数与原始数据的采样点数相同。量化步进计算结束。

S307：生成优化数据：

依次对于每个量化步进λ_h进行判断，如果λ_h＝0，则丢弃采样点数据x_h，如果λ_h＝1，则将采样点数据x_h添加至优化数据，并保存其采样时刻t_h，如果λ_h＞1，则将采样点数据x_h添加至优化数据，同时在该数据与前一个优化数据之间采用均值***法***λ_h-1个优化数据，同时根据该数据和前一个优化数据的采样时刻确定每个***优化数据的采样时刻。

将优化数据作为数据序列X，返回步骤S302。

S308：确定采样间隔：

根据数据序列X中每个采样数据的采样时刻，确定所需采集数据中各个数据的采样间隔。

图4是一轮数据优化的示例图。如图4所示，该原始数据中包含42个采样点，通过依次计算原始比重、权重、绝对权重、量化步进，最后得到优化数据。可见，优化数据的首尾两个数据作为锚点保持不变，中间的采样点数据进行了重新分配，可以直观看出，优化数据的线性特性较原始数据更好，经过若干轮的迭代优化，从最终的优化数据中即可确定满足要求的采样间隔。

S104：样本数据处理：

上位机对待校准数据、参考数据和工作运行参数数据进行处理，得到训练样本数据集。图5是本发明中数据处理的流程图。如图5所示，本发明中数据处理的具体步骤包括：

S501：异常数据处理：

无论对线性还是非线性模型而言，异常特征数据所造成的负面影响是毁灭性的，因此本发明上位机需要先对待校准数据和参考数据进行异常数据检测，将检测得到的异常数据进行标记。本实施例中异常数据检测的具体方法如下：

对于待校准数据和参考数据中每个采样点的数据值，计算其与理论真值之间的相似度，以及其与左右相邻两个采样点数据值之间的相似度，当任意一个相似度大于对应的预设阈值，说明该采样点数据值为异常数据，对其进行标记。

在实际应用中，由于上位机所得到的待校准数据和参考数据是由相应的数字采集***反馈的，可能存在数据传输错误的情况，因此当出现异常数据时，上位机可以要求相应的数字采集***进行重传，以排除数据传输问题。

S502：数据插补：

对于待校准数据、参考数据和工作运行参数数据，如果某个采样点的数据缺失或被标记为异常数据，则对该采样点的数据进行插补。具体的插值方法可以对不同的特征类型和回归模型进行选择，通常有零值插补，均值插补，近邻插补和迭代插补等。在实际应用中，可以采用实验的方式确定最佳插补策略。

S503：获取特征数据：

对于经过异常数据检测和插补的待校准数据、参考数据和工作运行参数数据，采用长度为L的滑动窗口对数据进行分段。记所得到的样本数据段的数量为N，第n个待校准数据为c_n，n＝1,2,…,N，所对应的相同时间段的参考数据为r_n，每个工作运行参数数据为w_n,m，m＝1,2,…,|φ|，|φ|表示所选用的工作运行参数的数量。

上位机根据对待校准数字采集***和高精度数字采集***的控制信号，确定每段数据所对应的档位参数，包括测量类型、测量量程、速度档位、频率档位。由于机器学习中任何回归模型所依赖的特征数据都应该是数值型的，而档位参数中所包含的都是型别数据，因此需要对各个档位参数进行特征编码，获取数值化的档位参数，拼接得到档位数据g_n，记其维数为G。常用的特征编码有独热编码和标签编码，可以根据实际需要选择。

将对应时间段的待校准数据c_n、M个工作运行参数数据w_n,m和档位数据g_n进行拼接，得到维数为(M+1)L+G维特征数据d_n。

S504：无量纲处理：

由于特征数据d_n是将待校准数据和档位数据进行组合得到，为了排除量纲的影响，需要对特征数据d_n中的每一位特征数据进行无量纲处理，得到特征数据d′_n。

S505：特征筛选：

根据N个特征数据d′_n进行特征筛选，然后对特征数据进行降维，记得到的特征数据为D_n，其维数为K。

特征筛选的具体方法可以根据具体需要选择。本实施例中对N个特征数据d′_n首先通过如主成分分析或独立成分分析提取出主要特征，然后再通过相关性分析或方差阈值化分析去除影响较弱的特征，从而实现特征筛选。一般来说，特征数据D_n的维数是随着校准模型训练的轮数逐渐降低的，

S506：生成训练样本：

将待校准数据c_n对应的特征数据D_n作为输入，将对应时间段的参考数据r_n作为待校准数据c_n的期望校准结果，构成训练样本。然后将N个训练样本划分为两个集合，分别作为训练集和测试集。

S105：校准模型训练：

将校准模型的输入维数设置为K，输出维数设置为L，采用训练集对校准模型进行训练。

S106：校准模型测试：

采用测试集对校准模型进行测试，计算得到校准准确率。本实施例中校准准确率为输入特征数据所得到的校准结果与对应参考数据的欧式距离。

S107：判断校准准确率是否达到预设目标，如果未达到，进入步骤S108，否则进入步骤S109；

S108：工作运行参数集合更新：

根据步骤S505的特征筛选结果，确定降维后的特征数据中涉及的工作运行参数，对工作运行参数集合φ进行更新。返回步骤S103。

S109：数据校准：

上位机控制待校准数字采集***调整至所需档位对所需采集信号进行采集，待校准数字采集***将采集得到的待校准数据反馈回上位机；同时上位机采用同样的采样率对当前工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集。

上位机将当前采样点及前L-1个采样点的待校准数据记为

每个工作运行参数数据记为

同时获取当前的档位参数，采用步骤S503中的相同方法对档位参数进行特征编码，得到档位数据

将待校准数据

M个工作运行参数数据

和档位数据

进行拼接，得到维数为(M+1)L+G维的特征数据

采用步骤S504中的相同方法对特征数据

中的每一位特征数据进行无量纲处理，得到特征数据

根据当前的特征筛选结果，对特征数据

进行降维得到特征数据D′；

将特征数据D′输入训练好的校准模型，得到待校准数据

的校准结果

尽管上面对本发明说明性的具体实施方式进行了描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

Claims

1.一种基于监督学习的数字采集***校准方法，其特征在于，包括以下步骤：

S4：上位机对待校准数据、参考数据和工作运行参数数据进行处理，得到训练样本数据集，具体包括以下步骤：

上位机将当前采样点及前L-1个采样点的待校准数据记为

每个工作运行参数数据记为

将待校准数据

M个工作运行参数数据

和档位数据

进行拼接，得到维数为(M+1)L+G维的特征数据

采用步骤S4.4中的相同方法对特征数据

中的每一位特征数据进行无量纲处理，得到特征数据

根据当前的特征筛选结果，对特征数据

进行降维得到特征数据D′；

将特征数据D′输入训练好的校准模型，得到待校准数据

的校准结果

2.根据权利要求1所述的数字采集***校准方法，其特征在于，所述校准模型由Ridge模型、Lasso模型、Elastic-Net模型、ARD模型、RANSAC模型、Huber模型、GPR模型、KRR模型以及SVR模型集成得到。

3.根据权利要求1所述的数字采集***校准方法，其特征在于，所述步骤S3中数据采集时采用变间隔采样，采样间隔采用如下方法确定：

S3.1：采用高精度数据采集***对源信号以预设的采样间隔进行采集得到原始数据，记采样点数为H；将原始数据作为数据序列X，其中第h个采样数据为x_h，对应采样时刻为t_h，h＝1,2,…,H；

S3.2：计算数据序列X中每个采样点数据x_h的原始比重p_h：

其中，

表示根据源信号得到的第f个采样数据x_f的理论值；

S3.3：判断H个原始比重p_h是否满足预设的线性分布，如果不满足，进入步骤S3.4，否则进入步骤S3.8；

S3.4：计算每个采样点数据x_h的权重w_h：

S3.5：计算每个采样点数据x_h的绝对权重W_h：

S3.6：计算每个采样点数据x_h与其下一个数据x_h+1之间的量化步进λ_h，具体方法如下：

1)令h＝1，累计误差Δ＝0；

2)判断是否h＝1或h＝H，如果是，令量化步进λ_h＝1，进入步骤6)，否则进入步骤3)；

3)判断是否绝对权重W_h＜1，如果是，进入步骤4)，否则将绝对权重W_h取整作为量化步进λ_h，进入步骤6)；

4)令Δ＝Δ+W_h；

5)判断是否累计误差Δ＜1，如果是，令量化步进λ_h＝0，否则令量化步进λ_h＝1，更新累计误差Δ＝Δ-1；然后进入步骤6)；

6)判断是否h＜H，如果是，进入步骤7)，否则进入步骤8)；

7)令h＝h+1，返回至步骤2)；

8)判断是否

如果是，量化步进计算结束，否则进入步骤9)；

9)从H个量化步进λ_h中筛选出最大值

令

量化步进计算结束；

S3.7：依次对于每个量化步进λ_h进行判断，如果λ_h＝0，则丢弃采样点数据x_h，如果λ_h＝1，则将采样点数据x_h添加至优化数据，并保存其采样时刻t_h，如果λ_h＞1，则将采样点数据x_h添加至优化数据，同时在该数据与前一个优化数据之间采用均值***法***λ_h-1个优化数据，同时根据该数据和前一个优化数据的采样时刻确定每个***优化数据的采样时刻;

将优化数据作为数据序列X，返回步骤S3.2；

S3.8：根据数据序列X中每个采样数据的采样时刻，确定所需采集数据中各个数据的采样间隔。

4.根据权利要求3所述的数字采集***校准方法，其特征在于，所述步骤3.6中绝对权重W_h取整采用银行家舍入法进行取整。

5.根据权利要求1所述的数字采集***校准方法，其特征在于，所述步骤S4.1中异常数据的检测方法为：对于待校准数据、参考数据和工作运行参数数据中每个采样点的数据值，计算其与理论真值之间的相似度，以及其与左右相邻两个采样点数据值之间的相似度，当任意一个相似度大于对应的预设阈值，说明该采样点数据值为异常数据，对其进行标记。