CN114330553B - 基于监督学习的数字采集***校准方法 - Google Patents
基于监督学习的数字采集***校准方法 Download PDFInfo
- Publication number
- CN114330553B CN114330553B CN202111639271.8A CN202111639271A CN114330553B CN 114330553 B CN114330553 B CN 114330553B CN 202111639271 A CN202111639271 A CN 202111639271A CN 114330553 B CN114330553 B CN 114330553B
- Authority
- CN
- China
- Prior art keywords
- data
- calibrated
- acquisition system
- digital acquisition
- calibration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 23
- 238000012360 testing method Methods 0.000 claims abstract description 13
- 238000005070 sampling Methods 0.000 claims description 75
- 230000002159 abnormal effect Effects 0.000 claims description 22
- 238000013139 quantization Methods 0.000 claims description 16
- 238000012216 screening Methods 0.000 claims description 15
- 238000005457 optimization Methods 0.000 claims description 10
- 238000005259 measurement Methods 0.000 claims description 8
- 230000005484 gravity Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 4
- 230000001186 cumulative effect Effects 0.000 claims description 2
- 108700041286 delta Proteins 0.000 claims description 2
- 238000003780 insertion Methods 0.000 claims 1
- 230000037431 insertion Effects 0.000 claims 1
- 238000003672 processing method Methods 0.000 abstract description 3
- 238000012417 linear regression Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000002688 persistence Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012880 independent component analysis Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Testing Or Calibration Of Command Recording Devices (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明公开了一种基于集成监督学习算法的数字采集***校准方法,构建包括上位机、高精度标准源和高精度数字采集***的校准***,并构建校准模型,上位机控制待校准数字采集***和高精度数字采集***对高精度标准源的源信号进行采集,同时采集待校准数字采集***的工作运行参数数据,上位机对待校准数据、参考数据和工作运行参数数据进行处理,得到训练样本数据集对校准模型进行训练和测试,校准准确率达到目标后,采用训练好的校准模型对待校准数字采集***的待校准数据进行校准。本发明通过对数据处理方法进行改进,综合考虑信号数据和待校准数字采集***的工作运行参数数据,提高数字采集***的校准速度和校准精度。
Description
技术领域
本发明属于高精度数据采集模块技术领域,更为具体地讲,涉及一种基于监督学习的数字采集***校准方法。
背景技术
在现代工业中,数据采集***中一种应用非常广泛的电子***,其准确度十分重要。数字采集***的校准工作往往借助高精度的多功能校准仪,通过比对校准仪输出的相对真值与数字采集***的实测量值,完成任一量值的精度回归分析。传统数字采集***校准工作中,将采集得到的原始数据经过简单的异常值处理之后转存到硬件存储介质中以期持久化,重复导入模型以完成校准流程。这样的数据处理方式同样存在诸多问题:
a.异常数据的预处理规则无法实时更新和学习,导致环境因素改变之后出现误处理的情况;
b.未考虑或未处理型别特征(如测量类型,测量量程,速度/频率档位等),无法对其进行有效编码和合理利用;
c.无法处理采集时既已丢失或异常处理后空缺的特征数据,导致由数据不全造成的局部精度丢失;
e.未考虑对采集的数据进行概率分布的映射,以更好地适应非线性的回归模型;
e.未对采样点序列的分布做任何预处理或反馈处理,导致采样点不具备代表性,进而丢失模型的可解释性;
f.未分析训练数据集中各特征的因果/相关性,遑论对特征进行筛选和提取,也就无搭建出合理的回归模型;
g.无任何对训练数据加以更新或学习的策略,导致低效率的硬件持久化和频发的数据失效。
此外,数字采集***的硬件设计通常存在一些较难控制的因素,主要包括:
a.由于器件的热噪声和工作温度曲线不一致,导致设备在不同温度下的工作特性迥异;
b.同一交流信号,其幅值与频率存在显著的相关性;且在交流小信号的情况下,由于采样精度的丢失,导致随机噪声极大,回归曲线显现出较明显的非线性。
传统的数字采集***校准工作通常未考虑以上因素,导致最终的校准出现较大误差。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于监督学习的数字采集***校准方法,采用改进的数据处理方法,提高校准速度和校准精度。
为了实现上述发明目的,本发明基于监督学习的数字采集***校准方法包括以下步骤:
S1:构建校准***,包括上位机、高精度标准源和高精度数字采集***,其中:
高精度标准源用于在上位机的控制下向待校准数字采集***和高精度数字采集***输出源信号;
高精度数字采集***用于作为校准参考,待校准数字采集***和高精度数字采集***在上位机的控制下同时对源信号进行采集,将采集得到的样本数据发送至上位机;
上位机用于对高精度标准源、待校准数字采集***和高精度数字采集***进行控制,对待校准数字采集***的工作运行参数进行采样,然后接收校准数字采集***和高精度数字采集***的样本数据并进行待校准数字采集***的校准;
S2:构建校准模型,其输入为待校准数字采集***的待校准数据对应的特征数据,其输出为待校准数据对应的校准数据;
S3:上位机控制高精度标准源向待校准数字采集***和高精度数字采集***输出源信号,将待校准数字采集***和高精度数字采集***调整至同一档位并同时对源信号进行采集,待校准数字采集***和高精度数字采集***将采集得到的待校准数据和参考数据反馈回上位机;
同时上位机采用同样的采样率对工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集,得到工作运行参数数据,初始工作运行参数集合φ中所包含的工作运行参数根据实际需要设置;
S4:上位机对校准数字采集***和高精度数字采集***的信号数据进行处理,得到训练样本数据集,具体包括以下步骤:
S4.1:上位机对待校准数据、参考数据和工作运行参数数据进行异常数据检测,将检测得到的异常数据进行标记;
S4.2:对于待校准数据、参考数据和工作运行参数数据,如果某个采样点的数据缺失或被标记为异常数据,则对该采样点的数据进行插补;
S4.3:对于经过异常数据检测和插补的待校准数据、参考数据和工作运行参数数据,采用长度为L的滑动窗口对数据进行分段;记所得到的样本数据段的数量为N,第n个待校准数据为cn,n=1,2,…,N,所对应的相同时间段的参考数据为rn,每个工作运行参数数据为wn,m,m=1,2,…,|φ|,|φ|表示所选用的工作运行参数的数量;
上位机根据对待校准数字采集***和高精度数字采集***的控制信号,确定每段数据所对应的档位参数,包括测量类型、测量量程、速度档位、频率档位,对各个档位参数进行特征编码,获取数值化的档位参数,拼接得到档位数据gn,记其维数为G;
将对应时间段的待校准数据cn、M个工作运行参数数据wn,m和档位数据gn进行拼接,得到维数为(M+1)L+G维特征数据dn;
S4.4:对特征数据dn中的每一位特征数据进行无量纲处理,得到特征数据d′n;
S4.5:根据N个特征数据d′n进行特征筛选,然后对特征数据进行降维,记得到的特征数据为Dn,其维数为K;
S4.6:将待校准数据cn对应的特征数据Dn作为输入,将对应时间段的参考数据rn作为待校准数据cn的期望校准结果,构成训练样本;然后将N个训练样本划分为两个集合,分别作为训练集和测试集;
S5:将校准模型的输入维数设置为K,输出维数设置为L,采用训练集对校准模型进行训练;
S6:采用测试集对校准模型进行测试,计算得到校准准确率;
S7:判断校准准确率是否达到预设目标,如果未达到,进入步骤S8,否则进入步骤S9;
S8:根据步骤S4.5的特征筛选结果,确定降维后的特征数据中涉及的工作运行参数,对工作运行参数集合φ进行更新;返回步骤S3;
S9:上位机控制待校准数字采集***调整至所需档位对所需采集信号进行采集,待校准数字采集***将采集得到的待校准数据反馈回上位机;同时上位机采用同样的采样率对当前工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集;
上位机将当前采样点及前L-1个采样点的待校准数据记为每个工作运行参数数据记为同时获取当前的档位参数,采用步骤SS4.3中的相同方法对档位参数进行特征编码,得到档位数据将待校准数据M个工作运行参数数据和档位数据进行拼接,得到维数为(M+1)L+G维的特征数据采用步骤S4.4中的相同方法对特征数据中的每一位特征数据进行无量纲处理,得到特征数据根据当前的特征筛选结果,对特征数据进行降维得到特征数据D′;
本发明基于集成监督学习算法的数字采集***校准方法,构建包括上位机、高精度标准源和高精度数字采集***的校准***,并构建校准模型,上位机控制待校准数字采集***和高精度数字采集***对高精度标准源的源信号进行采集,同时采集待校准数字采集***的工作运行参数数据,上位机对待校准数据、参考数据和工作运行参数数据进行处理,得到训练样本数据集对校准模型进行训练和测试,校准准确率达到目标后,采用训练好的校准模型对待校准数字采集***的待校准数据进行校准。
本发明通过对数据处理方法进行改进,综合考虑信号数据和待校准数字采集***的工作运行参数数据,提高数字采集***的校准速度和校准精度。
附图说明
图1是本发明基于监督学习的数字采集***校准方法的具体实施方式流程图;
图2是本发明中校准***的结构图;
图3是本实施例中变间隔采样时采样间隔的确定方法流程图;
图4是一轮数据优化的示例图;
图5是本发明中数据处理的流程图。。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明基于监督学习的数字采集***校准方法的具体实施方式流程图。如图1所示,本发明基于监督学习的数字采集***校准方法的具体步骤包括:
S101:构建校准***:
为了实现数字采集***的校准,本发明采用上位机、高精度标准源和高精度数字采集***搭建校准***。图2是本发明中校准***的结构图。如图2所示,本发明中校准***包括上位机、高精度标准源和高精度数字采集***,其中:
高精度标准源用于在上位机的控制下向待校准数字采集***和高精度数字采集***输出源信号。
高精度数字采集***用于作为校准参考,其精度需要高于待校准数字采集***。待校准数字采集***和高精度数字采集***在上位机的控制下同时对源信号进行采集,将采集得到的样本数据发送至上位机。
上位机用于对高精度标准源、待校准数字采集***和高精度数字采集***进行控制,对待校准数字采集***的工作运行参数进行采样,然后接收校准数字采集***和高精度数字采集***的信号数据并进行待校准数字采集***的校准。
S102:构建校准模型:
构建校准模型,其输入为待校准数字采集***的待校准数据对应的特征数据,其输出为待校准数据对应的校准数据。
在现有的数字采集***校准工作中,其校准策略一般是在最小二乘线性回归的基础上,进行较简单分割插值和高阶拓展,这样的校准方式存在诸多问题:
a.盲目地对线性回归进行高阶拓展,极易导致过拟合现象的出现——当训练点数与模型阶次相当甚至不足时,训练数据显得局部而片面,加之高维度模型会过分记忆训练数据携带的噪声,反而忽略真实的输入/输出关系。反映到结果上,表现为模型可以相当准确地回归训练值,而在测试值上表现则不尽如人意。
b.最小二乘线性回归以均方误差最小化作为回归标准,导致其对输入值的细微变化过分敏感,而模型本身对于异常输入(粗大值)完全无法处理,这使得模型的稳定性受到巨大挑战。
c.分割插值的方式适用于目标回归值存在显著的分段现象的情况,但这类方法无法准确地对分割点进行选择和处理,导致模型复杂,精度下降。
d.最小二乘线性回归的方式无法对其他特征因子(温度,信号频率等)做出及时而准确的反馈,即便采用多维的多元线性回归的方式,也无法完美地训练出一个兼具可解释性和高精度的回归模型;
e.传统模型的一个最大弊端是简单的对回归模型进行点分析,而不考虑训练数据及其目标值本身携带的噪声分布以及回归系数自身的分布情况,无法利用一些训练数据的一些先验条件,依据贝叶斯方法做出可解释的非线性回归预测。
f.除此之外,最小二乘线性回归还具有无法处理特征依赖、模型难以解释,回归模型单一、无法适应新环境,回归计算复杂度高、无法实现增量处理等诸多缺陷。
针对以上问题,本实施例中,根据本发明所针对的数字采集***待校准数据的特点,选择多个回归模型集成得到校准模型。
在回归模型中,惩罚线性回归模型通常用于控制高阶模型过拟合现象的,如岭回归Ridge模型、Lasso模型和Elastic-Net模型等。他们可以提供用于调整线性模型的特征权重分布的超参数。由于本发明所关联之各数值特征只能保证在一定精度范围内的相对稳定,各采样点的实测量值本身携带***噪声,惩罚线性回归理应能够在一定程度上缓解精度噪声对模型鲁棒性的干扰,并能适度地抑制回归结果的过拟合现象。
而高鲁棒性线性回归可以控制异常值干扰,如RANSAC模型、Huber模型和Theil-Sen模型。异常值对线性模型的负面影响是极其恶劣的,而高鲁棒性线性回归模型通过分割采样点迭代拟合的方式,逐步识别坏值并构建全局回归模型。
非线性模型可以相对准确描述真实问题并提高模型可解释性的,这类模型大致都是在其他已知模型的基础上引入核技巧加以重构的,如支持向量回归,内核岭回归和高斯过程回归。由于核方法的引入,这类模型能够很好地对已知量(训练集)和未知量(特征权重系数)给出合理的先验分布假设,通过交叉验证和参数优化得到未知量的最佳回归值。
因此,本实施例从回归模型中优选得到Ridge模型、Lasso模型、Elastic-Net模型、ARD模型、RANSAC模型、Huber模型,从非线性模型中优选得到GPR(高斯过程回归)模型、KRR(内核岭回归)模型以及SVR(支持向量回归)模型,将上述模型集成得到校准模型。就集成算法而言,本实施例中采用堆叠算法,该算法是一种较为常见的集成算法,其具体过程在此不再赘述。
S103:采集样本数据:
上位机控制高精度标准源向待校准数字采集***和高精度数字采集***输出源信号,将待校准数字采集***和高精度数字采集***调整至同一档位并同时对源信号进行采集,待校准数字采集***和高精度数字采集***将采集得到的样本数据反馈回上位机。
同时上位机采用同样的采样率对工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集,初始工作运行参数集合φ中所包含的工作运行参数根据实际需要设置。一般来说,工作运行参数包括设备温度、已开机时长、交流信号频率等。
数据的质量对于后续处理和校准至关重要,好的采样点分布设计能够保证数据处理的合理性并节省数据处理时间。因此在进行数据采集时可以采用变间隔采样,以使数据更加合理,那么各个采样间隔的设置尤为重要。图3是本实施例中变间隔采样时采样间隔的确定方法流程图。如图3所示,本实施例中变间隔采样时采样间隔采用如下方法确定:
S301:获取样本数据:
为了使采样数据更加准确,采用高精度数字采集***对源信号以预设的采样间隔进行采集得到原始数据,记采样点数为H。将原始数据作为数据序列X,其中第h个采样数据为xh,对应采样时刻为th,h=1,2,…,H。
S302:计算原始比重:
计算数据序列X中每个采样点数据xh的原始比重ph:
S303:判断H个原始比重ph是否满足预设的线性分布,如果不满足,进入步骤S304,否则进入步骤S308。
S304:计算权重:
计算每个采样点数据xh的权重wh:
S305:计算绝对权重:
计算每个采样点数据xh的绝对权重Wh:
S306:计算量化步进:
计算每个采样点数据xh与其下一个数据xh+1之间的量化步进λh,具体方法如下:
1)令h=1,累计误差Δ=0。
2)判断是否h=1或h=H,如果是,令量化步进λh=1,进入步骤6),否则进入步骤3)。
3)判断是否绝对权重Wh<1,如果是,进入步骤4),否则将绝对权重Wh取整作为量化步进λh,进入步骤6)。
本实施例中取整采用银行家舍入法,又称为四舍六入五取偶(又称四舍六入五留双)法,较普通四舍五入法误差更小。
4)令Δ=Δ+Wh。
5)判断是否累计误差Δ<1,如果是,令量化步进λh=0,否则令量化步进λh=1,更新累计误差Δ=Δ-1。然后进入步骤6)。
6)判断是否h<H,如果是,进入步骤7),否则进入步骤8)。
7)令h=h+1,返回至步骤2)。
S307:生成优化数据:
依次对于每个量化步进λh进行判断,如果λh=0,则丢弃采样点数据xh,如果λh=1,则将采样点数据xh添加至优化数据,并保存其采样时刻th,如果λh>1,则将采样点数据xh添加至优化数据,同时在该数据与前一个优化数据之间采用均值***法***λh-1个优化数据,同时根据该数据和前一个优化数据的采样时刻确定每个***优化数据的采样时刻。
将优化数据作为数据序列X,返回步骤S302。
S308:确定采样间隔:
根据数据序列X中每个采样数据的采样时刻,确定所需采集数据中各个数据的采样间隔。
图4是一轮数据优化的示例图。如图4所示,该原始数据中包含42个采样点,通过依次计算原始比重、权重、绝对权重、量化步进,最后得到优化数据。可见,优化数据的首尾两个数据作为锚点保持不变,中间的采样点数据进行了重新分配,可以直观看出,优化数据的线性特性较原始数据更好,经过若干轮的迭代优化,从最终的优化数据中即可确定满足要求的采样间隔。
S104:样本数据处理:
上位机对待校准数据、参考数据和工作运行参数数据进行处理,得到训练样本数据集。图5是本发明中数据处理的流程图。如图5所示,本发明中数据处理的具体步骤包括:
S501:异常数据处理:
无论对线性还是非线性模型而言,异常特征数据所造成的负面影响是毁灭性的,因此本发明上位机需要先对待校准数据和参考数据进行异常数据检测,将检测得到的异常数据进行标记。本实施例中异常数据检测的具体方法如下:
对于待校准数据和参考数据中每个采样点的数据值,计算其与理论真值之间的相似度,以及其与左右相邻两个采样点数据值之间的相似度,当任意一个相似度大于对应的预设阈值,说明该采样点数据值为异常数据,对其进行标记。
在实际应用中,由于上位机所得到的待校准数据和参考数据是由相应的数字采集***反馈的,可能存在数据传输错误的情况,因此当出现异常数据时,上位机可以要求相应的数字采集***进行重传,以排除数据传输问题。
S502:数据插补:
对于待校准数据、参考数据和工作运行参数数据,如果某个采样点的数据缺失或被标记为异常数据,则对该采样点的数据进行插补。具体的插值方法可以对不同的特征类型和回归模型进行选择,通常有零值插补,均值插补,近邻插补和迭代插补等。在实际应用中,可以采用实验的方式确定最佳插补策略。
S503:获取特征数据:
对于经过异常数据检测和插补的待校准数据、参考数据和工作运行参数数据,采用长度为L的滑动窗口对数据进行分段。记所得到的样本数据段的数量为N,第n个待校准数据为cn,n=1,2,…,N,所对应的相同时间段的参考数据为rn,每个工作运行参数数据为wn,m,m=1,2,…,|φ|,|φ|表示所选用的工作运行参数的数量。
上位机根据对待校准数字采集***和高精度数字采集***的控制信号,确定每段数据所对应的档位参数,包括测量类型、测量量程、速度档位、频率档位。由于机器学习中任何回归模型所依赖的特征数据都应该是数值型的,而档位参数中所包含的都是型别数据,因此需要对各个档位参数进行特征编码,获取数值化的档位参数,拼接得到档位数据gn,记其维数为G。常用的特征编码有独热编码和标签编码,可以根据实际需要选择。
将对应时间段的待校准数据cn、M个工作运行参数数据wn,m和档位数据gn进行拼接,得到维数为(M+1)L+G维特征数据dn。
S504:无量纲处理:
由于特征数据dn是将待校准数据和档位数据进行组合得到,为了排除量纲的影响,需要对特征数据dn中的每一位特征数据进行无量纲处理,得到特征数据d′n。
S505:特征筛选:
根据N个特征数据d′n进行特征筛选,然后对特征数据进行降维,记得到的特征数据为Dn,其维数为K。
特征筛选的具体方法可以根据具体需要选择。本实施例中对N个特征数据d′n首先通过如主成分分析或独立成分分析提取出主要特征,然后再通过相关性分析或方差阈值化分析去除影响较弱的特征,从而实现特征筛选。一般来说,特征数据Dn的维数是随着校准模型训练的轮数逐渐降低的,
S506:生成训练样本:
将待校准数据cn对应的特征数据Dn作为输入,将对应时间段的参考数据rn作为待校准数据cn的期望校准结果,构成训练样本。然后将N个训练样本划分为两个集合,分别作为训练集和测试集。
S105:校准模型训练:
将校准模型的输入维数设置为K,输出维数设置为L,采用训练集对校准模型进行训练。
S106:校准模型测试:
采用测试集对校准模型进行测试,计算得到校准准确率。本实施例中校准准确率为输入特征数据所得到的校准结果与对应参考数据的欧式距离。
S107:判断校准准确率是否达到预设目标,如果未达到,进入步骤S108,否则进入步骤S109;
S108:工作运行参数集合更新:
根据步骤S505的特征筛选结果,确定降维后的特征数据中涉及的工作运行参数,对工作运行参数集合φ进行更新。返回步骤S103。
S109:数据校准:
上位机控制待校准数字采集***调整至所需档位对所需采集信号进行采集,待校准数字采集***将采集得到的待校准数据反馈回上位机;同时上位机采用同样的采样率对当前工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集。
上位机将当前采样点及前L-1个采样点的待校准数据记为每个工作运行参数数据记为同时获取当前的档位参数,采用步骤S503中的相同方法对档位参数进行特征编码,得到档位数据将待校准数据M个工作运行参数数据和档位数据进行拼接,得到维数为(M+1)L+G维的特征数据采用步骤S504中的相同方法对特征数据中的每一位特征数据进行无量纲处理,得到特征数据根据当前的特征筛选结果,对特征数据进行降维得到特征数据D′;
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (5)
1.一种基于监督学习的数字采集***校准方法,其特征在于,包括以下步骤:
S1:构建校准***,包括上位机、高精度标准源和高精度数字采集***,其中:
高精度标准源用于在上位机的控制下向待校准数字采集***和高精度数字采集***输出源信号;
高精度数字采集***用于作为校准参考,待校准数字采集***和高精度数字采集***在上位机的控制下同时对源信号进行采集,将采集得到的样本数据发送至上位机;
上位机用于对高精度标准源、待校准数字采集***和高精度数字采集***进行控制,对待校准数字采集***的工作运行参数进行采样,然后接收校准数字采集***和高精度数字采集***的样本数据并进行待校准数字采集***的校准;
S2:构建校准模型,其输入为待校准数字采集***的待校准数据对应的特征数据,其输出为待校准数据对应的校准数据;
S3:上位机控制高精度标准源向待校准数字采集***和高精度数字采集***输出源信号,将待校准数字采集***和高精度数字采集***调整至同一档位并同时对源信号进行采集,待校准数字采集***和高精度数字采集***将采集得到的待校准数据和参考数据反馈回上位机;
同时上位机采用同样的采样率对工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集,得到工作运行参数数据,初始工作运行参数集合φ中所包含的工作运行参数根据实际需要设置;
S4:上位机对待校准数据、参考数据和工作运行参数数据进行处理,得到训练样本数据集,具体包括以下步骤:
S4.1:上位机对待校准数据、参考数据和工作运行参数数据进行异常数据检测,将检测得到的异常数据进行标记;
S4.2:对于待校准数据、参考数据和工作运行参数数据,如果某个采样点的数据缺失或被标记为异常数据,则对该采样点的数据进行插补;
S4.3:对于经过异常数据检测和插补的待校准数据、参考数据和工作运行参数数据,采用长度为L的滑动窗口对数据进行分段;记所得到的样本数据段的数量为N,第n个待校准数据为cn,n=1,2,…,N,所对应的相同时间段的参考数据为rn,每个工作运行参数数据为wn,m,m=1,2,…,|φ|,|φ|表示所选用的工作运行参数的数量;
上位机根据对待校准数字采集***和高精度数字采集***的控制信号,确定每段数据所对应的档位参数,包括测量类型、测量量程、速度档位、频率档位,对各个档位参数进行特征编码,获取数值化的档位参数,拼接得到档位数据gn,记其维数为G;
将对应时间段的待校准数据cn、M个工作运行参数数据wn,m和档位数据gn进行拼接,得到维数为(M+1)L+G维特征数据dn;
S4.4:对特征数据dn中的每一位特征数据进行无量纲处理,得到特征数据d′n;
S4.5:根据N个特征数据d′n进行特征筛选,然后对特征数据进行降维,记得到的特征数据为Dn,其维数为K;
S4.6:将待校准数据cn对应的特征数据Dn作为输入,将对应时间段的参考数据rn作为待校准数据cn的期望校准结果,构成训练样本;然后将N个训练样本划分为两个集合,分别作为训练集和测试集;
S5:将校准模型的输入维数设置为K,输出维数设置为L,采用训练集对校准模型进行训练;
S6:采用测试集对校准模型进行测试,计算得到校准准确率;
S7:判断校准准确率是否达到预设目标,如果未达到,进入步骤S8,否则进入步骤S9;
S8:根据步骤S4.5的特征筛选结果,确定降维后的特征数据中涉及的工作运行参数,对工作运行参数集合φ进行更新;返回步骤S3;
S9:上位机控制待校准数字采集***调整至所需档位对所需采集信号进行采集,待校准数字采集***将采集得到的待校准数据反馈回上位机;同时上位机采用同样的采样率对当前工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集;
上位机将当前采样点及前L-1个采样点的待校准数据记为每个工作运行参数数据记为同时获取当前的档位参数,采用步骤SS4.3中的相同方法对档位参数进行特征编码,得到档位数据将待校准数据M个工作运行参数数据和档位数据进行拼接,得到维数为(M+1)L+G维的特征数据采用步骤S4.4中的相同方法对特征数据中的每一位特征数据进行无量纲处理,得到特征数据根据当前的特征筛选结果,对特征数据进行降维得到特征数据D′;
2.根据权利要求1所述的数字采集***校准方法,其特征在于,所述校准模型由Ridge模型、Lasso模型、Elastic-Net模型、ARD模型、RANSAC模型、Huber模型、GPR模型、KRR模型以及SVR模型集成得到。
3.根据权利要求1所述的数字采集***校准方法,其特征在于,所述步骤S3中数据采集时采用变间隔采样,采样间隔采用如下方法确定:
S3.1:采用高精度数据采集***对源信号以预设的采样间隔进行采集得到原始数据,记采样点数为H;将原始数据作为数据序列X,其中第h个采样数据为xh,对应采样时刻为th,h=1,2,…,H;
S3.2:计算数据序列X中每个采样点数据xh的原始比重ph:
S3.3:判断H个原始比重ph是否满足预设的线性分布,如果不满足,进入步骤S3.4,否则进入步骤S3.8;
S3.4:计算每个采样点数据xh的权重wh:
S3.5:计算每个采样点数据xh的绝对权重Wh:
S3.6:计算每个采样点数据xh与其下一个数据xh+1之间的量化步进λh,具体方法如下:
1)令h=1,累计误差Δ=0;
2)判断是否h=1或h=H,如果是,令量化步进λh=1,进入步骤6),否则进入步骤3);
3)判断是否绝对权重Wh<1,如果是,进入步骤4),否则将绝对权重Wh取整作为量化步进λh,进入步骤6);
4)令Δ=Δ+Wh;
5)判断是否累计误差Δ<1,如果是,令量化步进λh=0,否则令量化步进λh=1,更新累计误差Δ=Δ-1;然后进入步骤6);
6)判断是否h<H,如果是,进入步骤7),否则进入步骤8);
7)令h=h+1,返回至步骤2);
S3.7:依次对于每个量化步进λh进行判断,如果λh=0,则丢弃采样点数据xh,如果λh=1,则将采样点数据xh添加至优化数据,并保存其采样时刻th,如果λh>1,则将采样点数据xh添加至优化数据,同时在该数据与前一个优化数据之间采用均值***法***λh-1个优化数据,同时根据该数据和前一个优化数据的采样时刻确定每个***优化数据的采样时刻;
将优化数据作为数据序列X,返回步骤S3.2;
S3.8:根据数据序列X中每个采样数据的采样时刻,确定所需采集数据中各个数据的采样间隔。
4.根据权利要求3所述的数字采集***校准方法,其特征在于,所述步骤3.6中绝对权重Wh取整采用银行家舍入法进行取整。
5.根据权利要求1所述的数字采集***校准方法,其特征在于,所述步骤S4.1中异常数据的检测方法为:对于待校准数据、参考数据和工作运行参数数据中每个采样点的数据值,计算其与理论真值之间的相似度,以及其与左右相邻两个采样点数据值之间的相似度,当任意一个相似度大于对应的预设阈值,说明该采样点数据值为异常数据,对其进行标记。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111639271.8A CN114330553B (zh) | 2021-12-29 | 2021-12-29 | 基于监督学习的数字采集***校准方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111639271.8A CN114330553B (zh) | 2021-12-29 | 2021-12-29 | 基于监督学习的数字采集***校准方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114330553A CN114330553A (zh) | 2022-04-12 |
CN114330553B true CN114330553B (zh) | 2023-04-07 |
Family
ID=81017388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111639271.8A Active CN114330553B (zh) | 2021-12-29 | 2021-12-29 | 基于监督学习的数字采集***校准方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114330553B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103177551A (zh) * | 2011-12-21 | 2013-06-26 | 北京普源精电科技有限公司 | 具有自校准功能的数据采集卡及其数据采集装置 |
CN103744045A (zh) * | 2013-12-17 | 2014-04-23 | 中国电子科技集团公司第二十研究所 | 数字式万用表自动校准*** |
CN106777809A (zh) * | 2017-01-13 | 2017-05-31 | 清华大学 | 一种基于实际运行数据的机车牵引计算模型校准方法 |
CN107247249A (zh) * | 2017-07-12 | 2017-10-13 | 周浩 | 一种交直流电表校验仪校准装置及校准方法 |
CN109946636A (zh) * | 2019-04-03 | 2019-06-28 | 中国计量大学 | 一种基于深度学习的数字万用表示值自动校准方法 |
CN109961186A (zh) * | 2019-03-22 | 2019-07-02 | 大唐环境产业集团股份有限公司 | 基于决策树和bp神经网络的脱硫***运行参数预测方法 |
CN111537944A (zh) * | 2020-05-20 | 2020-08-14 | 南京能瑞自动化设备股份有限公司 | 一种校准参数确定方法、微控制器、计量芯片及上位机 |
CN112528566A (zh) * | 2020-12-18 | 2021-03-19 | 江西理工大学南昌校区 | 基于AdaBoost训练模型的空气质量数据实时校准方法及*** |
CN113312849A (zh) * | 2021-06-15 | 2021-08-27 | 上海耀斑信息科技有限公司 | 供水管网水力模型自动更新及校准算法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7146283B2 (en) * | 2004-08-16 | 2006-12-05 | National Instruments Corporation | Calibrating analog-to-digital systems using a precision reference and a pulse-width modulation circuit to reduce local and large signal nonlinearities |
-
2021
- 2021-12-29 CN CN202111639271.8A patent/CN114330553B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103177551A (zh) * | 2011-12-21 | 2013-06-26 | 北京普源精电科技有限公司 | 具有自校准功能的数据采集卡及其数据采集装置 |
CN103744045A (zh) * | 2013-12-17 | 2014-04-23 | 中国电子科技集团公司第二十研究所 | 数字式万用表自动校准*** |
CN106777809A (zh) * | 2017-01-13 | 2017-05-31 | 清华大学 | 一种基于实际运行数据的机车牵引计算模型校准方法 |
CN107247249A (zh) * | 2017-07-12 | 2017-10-13 | 周浩 | 一种交直流电表校验仪校准装置及校准方法 |
CN109961186A (zh) * | 2019-03-22 | 2019-07-02 | 大唐环境产业集团股份有限公司 | 基于决策树和bp神经网络的脱硫***运行参数预测方法 |
CN109946636A (zh) * | 2019-04-03 | 2019-06-28 | 中国计量大学 | 一种基于深度学习的数字万用表示值自动校准方法 |
CN111537944A (zh) * | 2020-05-20 | 2020-08-14 | 南京能瑞自动化设备股份有限公司 | 一种校准参数确定方法、微控制器、计量芯片及上位机 |
CN112528566A (zh) * | 2020-12-18 | 2021-03-19 | 江西理工大学南昌校区 | 基于AdaBoost训练模型的空气质量数据实时校准方法及*** |
CN113312849A (zh) * | 2021-06-15 | 2021-08-27 | 上海耀斑信息科技有限公司 | 供水管网水力模型自动更新及校准算法 |
Non-Patent Citations (4)
Title |
---|
Deep Learning for Model Parameter Calibration in Power Systems;Safwan Wshah等;《2020 IEEE International Conference on Power Systems Technology (POWERCON)》;1-6 * |
Single-parameter-learning-based finite-time tracking control of underactuated MSVs under input saturation;GuibingZhu等;《Control Engineering Practice》;1-11 * |
基于FPGA的多通道数据采集***的设计;***;《中国优秀硕士学位论文全文数据库信息科技辑》;I135-198 * |
高平坦度示波器通道设计及校准技术研究;余中豪;《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》;C042-872 * |
Also Published As
Publication number | Publication date |
---|---|
CN114330553A (zh) | 2022-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111079836B (zh) | 基于伪标签方法和弱监督学习的过程数据故障分类方法 | |
CN112284440A (zh) | 一种传感器数据偏差自适应修正方法 | |
CN115062272A (zh) | 一种水质监测数据异常识别及预警方法 | |
CN114015825A (zh) | 基于注意力机制的高炉热负荷异常状态监测方法 | |
CN117312769A (zh) | 一种基于BiLSTM的物联网时序数据异常检测方法 | |
CN114330553B (zh) | 基于监督学习的数字采集***校准方法 | |
CN113326744B (zh) | 一种航天器在轨状态异常检测方法及*** | |
CN114216877A (zh) | 茶叶近红外光谱分析中谱峰自动检测与重构方法及*** | |
CN112215495B (zh) | 一种基于长短时记忆神经网络的污染源贡献度计算方法 | |
CN106599391B (zh) | 基于三角形角度值动态加权的关联向量机软测量建模方法 | |
CN113312587B (zh) | 基于arima预测和回归预测的传感器采集数据缺失值处理方法 | |
CN107067034B (zh) | 一种快速识别红外光谱数据分类的方法及*** | |
CN115436342A (zh) | 降低多批次样本间libs检测不确定性的方法及装置 | |
CN115240065A (zh) | 一种基于强化学习的无监督误匹配检测方法 | |
Yu et al. | Design for an SPRT control scheme based on linguistic data | |
CN111781824B (zh) | 一种基于vine copula分位数回归的自适应软测量方法及*** | |
CN112541162A (zh) | 一种面向多遥测参数联合分析的时间轴自规整方法 | |
CN117688388B (zh) | 一种基于数据增强与预测联合学习的软测量方法与*** | |
CN111104985A (zh) | 一种异步航迹关联的加权滑窗方法 | |
CN111949933B (zh) | 小样本条件下水文频率分析中Frank Copula函数的参数估计方法 | |
CN114386196B (zh) | 一种板带力学性能预测准确性评估方法 | |
CN112508320B (zh) | 一种批生产的自动过程阶段划分工作流 | |
CN117743757A (zh) | 基于压缩感知的大坝安全监测数据缺失值插补方法及*** | |
CN111914466B (zh) | 一种基于相关变量分散式建模的化工过程监测方法 | |
CN115128997B (zh) | 一种基于指令域与朴素贝叶斯的有效样本提取方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |