CN114330553B - 基于监督学习的数字采集***校准方法 - Google Patents

基于监督学习的数字采集***校准方法 Download PDF

Info

Publication number
CN114330553B
CN114330553B CN202111639271.8A CN202111639271A CN114330553B CN 114330553 B CN114330553 B CN 114330553B CN 202111639271 A CN202111639271 A CN 202111639271A CN 114330553 B CN114330553 B CN 114330553B
Authority
CN
China
Prior art keywords
data
calibrated
acquisition system
digital acquisition
calibration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111639271.8A
Other languages
English (en)
Other versions
CN114330553A (zh
Inventor
朱桂兵
傅鹏
王猛
曾浩
田雨
郭连平
蒋俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Jinghui Technology Co ltd
University of Electronic Science and Technology of China
Original Assignee
Chengdu Jinghui Technology Co ltd
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Jinghui Technology Co ltd, University of Electronic Science and Technology of China filed Critical Chengdu Jinghui Technology Co ltd
Priority to CN202111639271.8A priority Critical patent/CN114330553B/zh
Publication of CN114330553A publication Critical patent/CN114330553A/zh
Application granted granted Critical
Publication of CN114330553B publication Critical patent/CN114330553B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Testing Or Calibration Of Command Recording Devices (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明公开了一种基于集成监督学习算法的数字采集***校准方法,构建包括上位机、高精度标准源和高精度数字采集***的校准***,并构建校准模型,上位机控制待校准数字采集***和高精度数字采集***对高精度标准源的源信号进行采集,同时采集待校准数字采集***的工作运行参数数据,上位机对待校准数据、参考数据和工作运行参数数据进行处理,得到训练样本数据集对校准模型进行训练和测试,校准准确率达到目标后,采用训练好的校准模型对待校准数字采集***的待校准数据进行校准。本发明通过对数据处理方法进行改进,综合考虑信号数据和待校准数字采集***的工作运行参数数据,提高数字采集***的校准速度和校准精度。

Description

基于监督学习的数字采集***校准方法
技术领域
本发明属于高精度数据采集模块技术领域,更为具体地讲,涉及一种基于监督学习的数字采集***校准方法。
背景技术
在现代工业中,数据采集***中一种应用非常广泛的电子***,其准确度十分重要。数字采集***的校准工作往往借助高精度的多功能校准仪,通过比对校准仪输出的相对真值与数字采集***的实测量值,完成任一量值的精度回归分析。传统数字采集***校准工作中,将采集得到的原始数据经过简单的异常值处理之后转存到硬件存储介质中以期持久化,重复导入模型以完成校准流程。这样的数据处理方式同样存在诸多问题:
a.异常数据的预处理规则无法实时更新和学习,导致环境因素改变之后出现误处理的情况;
b.未考虑或未处理型别特征(如测量类型,测量量程,速度/频率档位等),无法对其进行有效编码和合理利用;
c.无法处理采集时既已丢失或异常处理后空缺的特征数据,导致由数据不全造成的局部精度丢失;
e.未考虑对采集的数据进行概率分布的映射,以更好地适应非线性的回归模型;
e.未对采样点序列的分布做任何预处理或反馈处理,导致采样点不具备代表性,进而丢失模型的可解释性;
f.未分析训练数据集中各特征的因果/相关性,遑论对特征进行筛选和提取,也就无搭建出合理的回归模型;
g.无任何对训练数据加以更新或学习的策略,导致低效率的硬件持久化和频发的数据失效。
此外,数字采集***的硬件设计通常存在一些较难控制的因素,主要包括:
a.由于器件的热噪声和工作温度曲线不一致,导致设备在不同温度下的工作特性迥异;
b.同一交流信号,其幅值与频率存在显著的相关性;且在交流小信号的情况下,由于采样精度的丢失,导致随机噪声极大,回归曲线显现出较明显的非线性。
传统的数字采集***校准工作通常未考虑以上因素,导致最终的校准出现较大误差。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于监督学习的数字采集***校准方法,采用改进的数据处理方法,提高校准速度和校准精度。
为了实现上述发明目的,本发明基于监督学习的数字采集***校准方法包括以下步骤:
S1:构建校准***,包括上位机、高精度标准源和高精度数字采集***,其中:
高精度标准源用于在上位机的控制下向待校准数字采集***和高精度数字采集***输出源信号;
高精度数字采集***用于作为校准参考,待校准数字采集***和高精度数字采集***在上位机的控制下同时对源信号进行采集,将采集得到的样本数据发送至上位机;
上位机用于对高精度标准源、待校准数字采集***和高精度数字采集***进行控制,对待校准数字采集***的工作运行参数进行采样,然后接收校准数字采集***和高精度数字采集***的样本数据并进行待校准数字采集***的校准;
S2:构建校准模型,其输入为待校准数字采集***的待校准数据对应的特征数据,其输出为待校准数据对应的校准数据;
S3:上位机控制高精度标准源向待校准数字采集***和高精度数字采集***输出源信号,将待校准数字采集***和高精度数字采集***调整至同一档位并同时对源信号进行采集,待校准数字采集***和高精度数字采集***将采集得到的待校准数据和参考数据反馈回上位机;
同时上位机采用同样的采样率对工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集,得到工作运行参数数据,初始工作运行参数集合φ中所包含的工作运行参数根据实际需要设置;
S4:上位机对校准数字采集***和高精度数字采集***的信号数据进行处理,得到训练样本数据集,具体包括以下步骤:
S4.1:上位机对待校准数据、参考数据和工作运行参数数据进行异常数据检测,将检测得到的异常数据进行标记;
S4.2:对于待校准数据、参考数据和工作运行参数数据,如果某个采样点的数据缺失或被标记为异常数据,则对该采样点的数据进行插补;
S4.3:对于经过异常数据检测和插补的待校准数据、参考数据和工作运行参数数据,采用长度为L的滑动窗口对数据进行分段;记所得到的样本数据段的数量为N,第n个待校准数据为cn,n=1,2,…,N,所对应的相同时间段的参考数据为rn,每个工作运行参数数据为wn,m,m=1,2,…,|φ|,|φ|表示所选用的工作运行参数的数量;
上位机根据对待校准数字采集***和高精度数字采集***的控制信号,确定每段数据所对应的档位参数,包括测量类型、测量量程、速度档位、频率档位,对各个档位参数进行特征编码,获取数值化的档位参数,拼接得到档位数据gn,记其维数为G;
将对应时间段的待校准数据cn、M个工作运行参数数据wn,m和档位数据gn进行拼接,得到维数为(M+1)L+G维特征数据dn
S4.4:对特征数据dn中的每一位特征数据进行无量纲处理,得到特征数据d′n
S4.5:根据N个特征数据d′n进行特征筛选,然后对特征数据进行降维,记得到的特征数据为Dn,其维数为K;
S4.6:将待校准数据cn对应的特征数据Dn作为输入,将对应时间段的参考数据rn作为待校准数据cn的期望校准结果,构成训练样本;然后将N个训练样本划分为两个集合,分别作为训练集和测试集;
S5:将校准模型的输入维数设置为K,输出维数设置为L,采用训练集对校准模型进行训练;
S6:采用测试集对校准模型进行测试,计算得到校准准确率;
S7:判断校准准确率是否达到预设目标,如果未达到,进入步骤S8,否则进入步骤S9;
S8:根据步骤S4.5的特征筛选结果,确定降维后的特征数据中涉及的工作运行参数,对工作运行参数集合φ进行更新;返回步骤S3;
S9:上位机控制待校准数字采集***调整至所需档位对所需采集信号进行采集,待校准数字采集***将采集得到的待校准数据反馈回上位机;同时上位机采用同样的采样率对当前工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集;
上位机将当前采样点及前L-1个采样点的待校准数据记为
Figure BDA0003442535840000041
每个工作运行参数数据记为
Figure BDA0003442535840000042
同时获取当前的档位参数,采用步骤SS4.3中的相同方法对档位参数进行特征编码,得到档位数据
Figure BDA0003442535840000043
将待校准数据
Figure BDA0003442535840000044
M个工作运行参数数据
Figure BDA0003442535840000045
和档位数据
Figure BDA0003442535840000046
进行拼接,得到维数为(M+1)L+G维的特征数据
Figure BDA0003442535840000047
采用步骤S4.4中的相同方法对特征数据
Figure BDA0003442535840000048
中的每一位特征数据进行无量纲处理,得到特征数据
Figure BDA0003442535840000049
根据当前的特征筛选结果,对特征数据
Figure BDA00034425358400000410
进行降维得到特征数据D′;
将特征数据D′输入训练好的校准模型,得到待校准数据
Figure BDA00034425358400000411
的校准结果
Figure BDA00034425358400000412
本发明基于集成监督学习算法的数字采集***校准方法,构建包括上位机、高精度标准源和高精度数字采集***的校准***,并构建校准模型,上位机控制待校准数字采集***和高精度数字采集***对高精度标准源的源信号进行采集,同时采集待校准数字采集***的工作运行参数数据,上位机对待校准数据、参考数据和工作运行参数数据进行处理,得到训练样本数据集对校准模型进行训练和测试,校准准确率达到目标后,采用训练好的校准模型对待校准数字采集***的待校准数据进行校准。
本发明通过对数据处理方法进行改进,综合考虑信号数据和待校准数字采集***的工作运行参数数据,提高数字采集***的校准速度和校准精度。
附图说明
图1是本发明基于监督学习的数字采集***校准方法的具体实施方式流程图;
图2是本发明中校准***的结构图;
图3是本实施例中变间隔采样时采样间隔的确定方法流程图;
图4是一轮数据优化的示例图;
图5是本发明中数据处理的流程图。。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明基于监督学习的数字采集***校准方法的具体实施方式流程图。如图1所示,本发明基于监督学习的数字采集***校准方法的具体步骤包括:
S101:构建校准***:
为了实现数字采集***的校准,本发明采用上位机、高精度标准源和高精度数字采集***搭建校准***。图2是本发明中校准***的结构图。如图2所示,本发明中校准***包括上位机、高精度标准源和高精度数字采集***,其中:
高精度标准源用于在上位机的控制下向待校准数字采集***和高精度数字采集***输出源信号。
高精度数字采集***用于作为校准参考,其精度需要高于待校准数字采集***。待校准数字采集***和高精度数字采集***在上位机的控制下同时对源信号进行采集,将采集得到的样本数据发送至上位机。
上位机用于对高精度标准源、待校准数字采集***和高精度数字采集***进行控制,对待校准数字采集***的工作运行参数进行采样,然后接收校准数字采集***和高精度数字采集***的信号数据并进行待校准数字采集***的校准。
S102:构建校准模型:
构建校准模型,其输入为待校准数字采集***的待校准数据对应的特征数据,其输出为待校准数据对应的校准数据。
在现有的数字采集***校准工作中,其校准策略一般是在最小二乘线性回归的基础上,进行较简单分割插值和高阶拓展,这样的校准方式存在诸多问题:
a.盲目地对线性回归进行高阶拓展,极易导致过拟合现象的出现——当训练点数与模型阶次相当甚至不足时,训练数据显得局部而片面,加之高维度模型会过分记忆训练数据携带的噪声,反而忽略真实的输入/输出关系。反映到结果上,表现为模型可以相当准确地回归训练值,而在测试值上表现则不尽如人意。
b.最小二乘线性回归以均方误差最小化作为回归标准,导致其对输入值的细微变化过分敏感,而模型本身对于异常输入(粗大值)完全无法处理,这使得模型的稳定性受到巨大挑战。
c.分割插值的方式适用于目标回归值存在显著的分段现象的情况,但这类方法无法准确地对分割点进行选择和处理,导致模型复杂,精度下降。
d.最小二乘线性回归的方式无法对其他特征因子(温度,信号频率等)做出及时而准确的反馈,即便采用多维的多元线性回归的方式,也无法完美地训练出一个兼具可解释性和高精度的回归模型;
e.传统模型的一个最大弊端是简单的对回归模型进行点分析,而不考虑训练数据及其目标值本身携带的噪声分布以及回归系数自身的分布情况,无法利用一些训练数据的一些先验条件,依据贝叶斯方法做出可解释的非线性回归预测。
f.除此之外,最小二乘线性回归还具有无法处理特征依赖、模型难以解释,回归模型单一、无法适应新环境,回归计算复杂度高、无法实现增量处理等诸多缺陷。
针对以上问题,本实施例中,根据本发明所针对的数字采集***待校准数据的特点,选择多个回归模型集成得到校准模型。
在回归模型中,惩罚线性回归模型通常用于控制高阶模型过拟合现象的,如岭回归Ridge模型、Lasso模型和Elastic-Net模型等。他们可以提供用于调整线性模型的特征权重分布的超参数。由于本发明所关联之各数值特征只能保证在一定精度范围内的相对稳定,各采样点的实测量值本身携带***噪声,惩罚线性回归理应能够在一定程度上缓解精度噪声对模型鲁棒性的干扰,并能适度地抑制回归结果的过拟合现象。
而高鲁棒性线性回归可以控制异常值干扰,如RANSAC模型、Huber模型和Theil-Sen模型。异常值对线性模型的负面影响是极其恶劣的,而高鲁棒性线性回归模型通过分割采样点迭代拟合的方式,逐步识别坏值并构建全局回归模型。
非线性模型可以相对准确描述真实问题并提高模型可解释性的,这类模型大致都是在其他已知模型的基础上引入核技巧加以重构的,如支持向量回归,内核岭回归和高斯过程回归。由于核方法的引入,这类模型能够很好地对已知量(训练集)和未知量(特征权重系数)给出合理的先验分布假设,通过交叉验证和参数优化得到未知量的最佳回归值。
因此,本实施例从回归模型中优选得到Ridge模型、Lasso模型、Elastic-Net模型、ARD模型、RANSAC模型、Huber模型,从非线性模型中优选得到GPR(高斯过程回归)模型、KRR(内核岭回归)模型以及SVR(支持向量回归)模型,将上述模型集成得到校准模型。就集成算法而言,本实施例中采用堆叠算法,该算法是一种较为常见的集成算法,其具体过程在此不再赘述。
S103:采集样本数据:
上位机控制高精度标准源向待校准数字采集***和高精度数字采集***输出源信号,将待校准数字采集***和高精度数字采集***调整至同一档位并同时对源信号进行采集,待校准数字采集***和高精度数字采集***将采集得到的样本数据反馈回上位机。
同时上位机采用同样的采样率对工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集,初始工作运行参数集合φ中所包含的工作运行参数根据实际需要设置。一般来说,工作运行参数包括设备温度、已开机时长、交流信号频率等。
数据的质量对于后续处理和校准至关重要,好的采样点分布设计能够保证数据处理的合理性并节省数据处理时间。因此在进行数据采集时可以采用变间隔采样,以使数据更加合理,那么各个采样间隔的设置尤为重要。图3是本实施例中变间隔采样时采样间隔的确定方法流程图。如图3所示,本实施例中变间隔采样时采样间隔采用如下方法确定:
S301:获取样本数据:
为了使采样数据更加准确,采用高精度数字采集***对源信号以预设的采样间隔进行采集得到原始数据,记采样点数为H。将原始数据作为数据序列X,其中第h个采样数据为xh,对应采样时刻为th,h=1,2,…,H。
S302:计算原始比重:
计算数据序列X中每个采样点数据xh的原始比重ph
Figure BDA0003442535840000081
其中,
Figure BDA0003442535840000082
表示根据源信号得到的第f个采样数据xf的理论值。
S303:判断H个原始比重ph是否满足预设的线性分布,如果不满足,进入步骤S304,否则进入步骤S308。
S304:计算权重:
计算每个采样点数据xh的权重wh
Figure BDA0003442535840000083
S305:计算绝对权重:
计算每个采样点数据xh的绝对权重Wh
Figure BDA0003442535840000084
S306:计算量化步进:
计算每个采样点数据xh与其下一个数据xh+1之间的量化步进λh,具体方法如下:
1)令h=1,累计误差Δ=0。
2)判断是否h=1或h=H,如果是,令量化步进λh=1,进入步骤6),否则进入步骤3)。
3)判断是否绝对权重Wh<1,如果是,进入步骤4),否则将绝对权重Wh取整作为量化步进λh,进入步骤6)。
本实施例中取整采用银行家舍入法,又称为四舍六入五取偶(又称四舍六入五留双)法,较普通四舍五入法误差更小。
4)令Δ=Δ+Wh
5)判断是否累计误差Δ<1,如果是,令量化步进λh=0,否则令量化步进λh=1,更新累计误差Δ=Δ-1。然后进入步骤6)。
6)判断是否h<H,如果是,进入步骤7),否则进入步骤8)。
7)令h=h+1,返回至步骤2)。
8)判断是否
Figure BDA0003442535840000091
如果是,量化步进计算结束,否则进入步骤9)。
9)从H个量化步进λh中筛选出最大值λh*,令
Figure BDA0003442535840000092
即通过最大值λh*来弥补量化步进和采样点之间的差值,从而令优化数据的采样点数与原始数据的采样点数相同。量化步进计算结束。
S307:生成优化数据:
依次对于每个量化步进λh进行判断,如果λh=0,则丢弃采样点数据xh,如果λh=1,则将采样点数据xh添加至优化数据,并保存其采样时刻th,如果λh>1,则将采样点数据xh添加至优化数据,同时在该数据与前一个优化数据之间采用均值***法***λh-1个优化数据,同时根据该数据和前一个优化数据的采样时刻确定每个***优化数据的采样时刻。
将优化数据作为数据序列X,返回步骤S302。
S308:确定采样间隔:
根据数据序列X中每个采样数据的采样时刻,确定所需采集数据中各个数据的采样间隔。
图4是一轮数据优化的示例图。如图4所示,该原始数据中包含42个采样点,通过依次计算原始比重、权重、绝对权重、量化步进,最后得到优化数据。可见,优化数据的首尾两个数据作为锚点保持不变,中间的采样点数据进行了重新分配,可以直观看出,优化数据的线性特性较原始数据更好,经过若干轮的迭代优化,从最终的优化数据中即可确定满足要求的采样间隔。
S104:样本数据处理:
上位机对待校准数据、参考数据和工作运行参数数据进行处理,得到训练样本数据集。图5是本发明中数据处理的流程图。如图5所示,本发明中数据处理的具体步骤包括:
S501:异常数据处理:
无论对线性还是非线性模型而言,异常特征数据所造成的负面影响是毁灭性的,因此本发明上位机需要先对待校准数据和参考数据进行异常数据检测,将检测得到的异常数据进行标记。本实施例中异常数据检测的具体方法如下:
对于待校准数据和参考数据中每个采样点的数据值,计算其与理论真值之间的相似度,以及其与左右相邻两个采样点数据值之间的相似度,当任意一个相似度大于对应的预设阈值,说明该采样点数据值为异常数据,对其进行标记。
在实际应用中,由于上位机所得到的待校准数据和参考数据是由相应的数字采集***反馈的,可能存在数据传输错误的情况,因此当出现异常数据时,上位机可以要求相应的数字采集***进行重传,以排除数据传输问题。
S502:数据插补:
对于待校准数据、参考数据和工作运行参数数据,如果某个采样点的数据缺失或被标记为异常数据,则对该采样点的数据进行插补。具体的插值方法可以对不同的特征类型和回归模型进行选择,通常有零值插补,均值插补,近邻插补和迭代插补等。在实际应用中,可以采用实验的方式确定最佳插补策略。
S503:获取特征数据:
对于经过异常数据检测和插补的待校准数据、参考数据和工作运行参数数据,采用长度为L的滑动窗口对数据进行分段。记所得到的样本数据段的数量为N,第n个待校准数据为cn,n=1,2,…,N,所对应的相同时间段的参考数据为rn,每个工作运行参数数据为wn,m,m=1,2,…,|φ|,|φ|表示所选用的工作运行参数的数量。
上位机根据对待校准数字采集***和高精度数字采集***的控制信号,确定每段数据所对应的档位参数,包括测量类型、测量量程、速度档位、频率档位。由于机器学习中任何回归模型所依赖的特征数据都应该是数值型的,而档位参数中所包含的都是型别数据,因此需要对各个档位参数进行特征编码,获取数值化的档位参数,拼接得到档位数据gn,记其维数为G。常用的特征编码有独热编码和标签编码,可以根据实际需要选择。
将对应时间段的待校准数据cn、M个工作运行参数数据wn,m和档位数据gn进行拼接,得到维数为(M+1)L+G维特征数据dn
S504:无量纲处理:
由于特征数据dn是将待校准数据和档位数据进行组合得到,为了排除量纲的影响,需要对特征数据dn中的每一位特征数据进行无量纲处理,得到特征数据d′n
S505:特征筛选:
根据N个特征数据d′n进行特征筛选,然后对特征数据进行降维,记得到的特征数据为Dn,其维数为K。
特征筛选的具体方法可以根据具体需要选择。本实施例中对N个特征数据d′n首先通过如主成分分析或独立成分分析提取出主要特征,然后再通过相关性分析或方差阈值化分析去除影响较弱的特征,从而实现特征筛选。一般来说,特征数据Dn的维数是随着校准模型训练的轮数逐渐降低的,
S506:生成训练样本:
将待校准数据cn对应的特征数据Dn作为输入,将对应时间段的参考数据rn作为待校准数据cn的期望校准结果,构成训练样本。然后将N个训练样本划分为两个集合,分别作为训练集和测试集。
S105:校准模型训练:
将校准模型的输入维数设置为K,输出维数设置为L,采用训练集对校准模型进行训练。
S106:校准模型测试:
采用测试集对校准模型进行测试,计算得到校准准确率。本实施例中校准准确率为输入特征数据所得到的校准结果与对应参考数据的欧式距离。
S107:判断校准准确率是否达到预设目标,如果未达到,进入步骤S108,否则进入步骤S109;
S108:工作运行参数集合更新:
根据步骤S505的特征筛选结果,确定降维后的特征数据中涉及的工作运行参数,对工作运行参数集合φ进行更新。返回步骤S103。
S109:数据校准:
上位机控制待校准数字采集***调整至所需档位对所需采集信号进行采集,待校准数字采集***将采集得到的待校准数据反馈回上位机;同时上位机采用同样的采样率对当前工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集。
上位机将当前采样点及前L-1个采样点的待校准数据记为
Figure BDA0003442535840000121
每个工作运行参数数据记为
Figure BDA0003442535840000122
同时获取当前的档位参数,采用步骤S503中的相同方法对档位参数进行特征编码,得到档位数据
Figure BDA0003442535840000123
将待校准数据
Figure BDA0003442535840000124
M个工作运行参数数据
Figure BDA0003442535840000125
和档位数据
Figure BDA0003442535840000126
进行拼接,得到维数为(M+1)L+G维的特征数据
Figure BDA0003442535840000127
采用步骤S504中的相同方法对特征数据
Figure BDA0003442535840000128
中的每一位特征数据进行无量纲处理,得到特征数据
Figure BDA0003442535840000129
根据当前的特征筛选结果,对特征数据
Figure BDA00034425358400001210
进行降维得到特征数据D′;
将特征数据D′输入训练好的校准模型,得到待校准数据
Figure BDA00034425358400001211
的校准结果
Figure BDA00034425358400001212
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (5)

1.一种基于监督学习的数字采集***校准方法,其特征在于,包括以下步骤:
S1:构建校准***,包括上位机、高精度标准源和高精度数字采集***,其中:
高精度标准源用于在上位机的控制下向待校准数字采集***和高精度数字采集***输出源信号;
高精度数字采集***用于作为校准参考,待校准数字采集***和高精度数字采集***在上位机的控制下同时对源信号进行采集,将采集得到的样本数据发送至上位机;
上位机用于对高精度标准源、待校准数字采集***和高精度数字采集***进行控制,对待校准数字采集***的工作运行参数进行采样,然后接收校准数字采集***和高精度数字采集***的样本数据并进行待校准数字采集***的校准;
S2:构建校准模型,其输入为待校准数字采集***的待校准数据对应的特征数据,其输出为待校准数据对应的校准数据;
S3:上位机控制高精度标准源向待校准数字采集***和高精度数字采集***输出源信号,将待校准数字采集***和高精度数字采集***调整至同一档位并同时对源信号进行采集,待校准数字采集***和高精度数字采集***将采集得到的待校准数据和参考数据反馈回上位机;
同时上位机采用同样的采样率对工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集,得到工作运行参数数据,初始工作运行参数集合φ中所包含的工作运行参数根据实际需要设置;
S4:上位机对待校准数据、参考数据和工作运行参数数据进行处理,得到训练样本数据集,具体包括以下步骤:
S4.1:上位机对待校准数据、参考数据和工作运行参数数据进行异常数据检测,将检测得到的异常数据进行标记;
S4.2:对于待校准数据、参考数据和工作运行参数数据,如果某个采样点的数据缺失或被标记为异常数据,则对该采样点的数据进行插补;
S4.3:对于经过异常数据检测和插补的待校准数据、参考数据和工作运行参数数据,采用长度为L的滑动窗口对数据进行分段;记所得到的样本数据段的数量为N,第n个待校准数据为cn,n=1,2,…,N,所对应的相同时间段的参考数据为rn,每个工作运行参数数据为wn,m,m=1,2,…,|φ|,|φ|表示所选用的工作运行参数的数量;
上位机根据对待校准数字采集***和高精度数字采集***的控制信号,确定每段数据所对应的档位参数,包括测量类型、测量量程、速度档位、频率档位,对各个档位参数进行特征编码,获取数值化的档位参数,拼接得到档位数据gn,记其维数为G;
将对应时间段的待校准数据cn、M个工作运行参数数据wn,m和档位数据gn进行拼接,得到维数为(M+1)L+G维特征数据dn
S4.4:对特征数据dn中的每一位特征数据进行无量纲处理,得到特征数据d′n
S4.5:根据N个特征数据d′n进行特征筛选,然后对特征数据进行降维,记得到的特征数据为Dn,其维数为K;
S4.6:将待校准数据cn对应的特征数据Dn作为输入,将对应时间段的参考数据rn作为待校准数据cn的期望校准结果,构成训练样本;然后将N个训练样本划分为两个集合,分别作为训练集和测试集;
S5:将校准模型的输入维数设置为K,输出维数设置为L,采用训练集对校准模型进行训练;
S6:采用测试集对校准模型进行测试,计算得到校准准确率;
S7:判断校准准确率是否达到预设目标,如果未达到,进入步骤S8,否则进入步骤S9;
S8:根据步骤S4.5的特征筛选结果,确定降维后的特征数据中涉及的工作运行参数,对工作运行参数集合φ进行更新;返回步骤S3;
S9:上位机控制待校准数字采集***调整至所需档位对所需采集信号进行采集,待校准数字采集***将采集得到的待校准数据反馈回上位机;同时上位机采用同样的采样率对当前工作运行参数集合φ中的待校准数字采集***的工作运行参数进行采集;
上位机将当前采样点及前L-1个采样点的待校准数据记为
Figure FDA0003442535830000031
每个工作运行参数数据记为
Figure FDA0003442535830000032
同时获取当前的档位参数,采用步骤SS4.3中的相同方法对档位参数进行特征编码,得到档位数据
Figure FDA0003442535830000033
将待校准数据
Figure FDA0003442535830000034
M个工作运行参数数据
Figure FDA0003442535830000035
和档位数据
Figure FDA0003442535830000036
进行拼接,得到维数为(M+1)L+G维的特征数据
Figure FDA0003442535830000037
采用步骤S4.4中的相同方法对特征数据
Figure FDA0003442535830000038
中的每一位特征数据进行无量纲处理,得到特征数据
Figure FDA0003442535830000039
根据当前的特征筛选结果,对特征数据
Figure FDA00034425358300000310
进行降维得到特征数据D′;
将特征数据D′输入训练好的校准模型,得到待校准数据
Figure FDA00034425358300000311
的校准结果
Figure FDA00034425358300000312
2.根据权利要求1所述的数字采集***校准方法,其特征在于,所述校准模型由Ridge模型、Lasso模型、Elastic-Net模型、ARD模型、RANSAC模型、Huber模型、GPR模型、KRR模型以及SVR模型集成得到。
3.根据权利要求1所述的数字采集***校准方法,其特征在于,所述步骤S3中数据采集时采用变间隔采样,采样间隔采用如下方法确定:
S3.1:采用高精度数据采集***对源信号以预设的采样间隔进行采集得到原始数据,记采样点数为H;将原始数据作为数据序列X,其中第h个采样数据为xh,对应采样时刻为th,h=1,2,…,H;
S3.2:计算数据序列X中每个采样点数据xh的原始比重ph
Figure FDA00034425358300000313
其中,
Figure FDA00034425358300000314
表示根据源信号得到的第f个采样数据xf的理论值;
S3.3:判断H个原始比重ph是否满足预设的线性分布,如果不满足,进入步骤S3.4,否则进入步骤S3.8;
S3.4:计算每个采样点数据xh的权重wh
Figure FDA00034425358300000315
S3.5:计算每个采样点数据xh的绝对权重Wh
Figure FDA0003442535830000041
S3.6:计算每个采样点数据xh与其下一个数据xh+1之间的量化步进λh,具体方法如下:
1)令h=1,累计误差Δ=0;
2)判断是否h=1或h=H,如果是,令量化步进λh=1,进入步骤6),否则进入步骤3);
3)判断是否绝对权重Wh<1,如果是,进入步骤4),否则将绝对权重Wh取整作为量化步进λh,进入步骤6);
4)令Δ=Δ+Wh
5)判断是否累计误差Δ<1,如果是,令量化步进λh=0,否则令量化步进λh=1,更新累计误差Δ=Δ-1;然后进入步骤6);
6)判断是否h<H,如果是,进入步骤7),否则进入步骤8);
7)令h=h+1,返回至步骤2);
8)判断是否
Figure FDA0003442535830000042
如果是,量化步进计算结束,否则进入步骤9);
9)从H个量化步进λh中筛选出最大值
Figure FDA0003442535830000043
Figure FDA0003442535830000044
量化步进计算结束;
S3.7:依次对于每个量化步进λh进行判断,如果λh=0,则丢弃采样点数据xh,如果λh=1,则将采样点数据xh添加至优化数据,并保存其采样时刻th,如果λh>1,则将采样点数据xh添加至优化数据,同时在该数据与前一个优化数据之间采用均值***法***λh-1个优化数据,同时根据该数据和前一个优化数据的采样时刻确定每个***优化数据的采样时刻;
将优化数据作为数据序列X,返回步骤S3.2;
S3.8:根据数据序列X中每个采样数据的采样时刻,确定所需采集数据中各个数据的采样间隔。
4.根据权利要求3所述的数字采集***校准方法,其特征在于,所述步骤3.6中绝对权重Wh取整采用银行家舍入法进行取整。
5.根据权利要求1所述的数字采集***校准方法,其特征在于,所述步骤S4.1中异常数据的检测方法为:对于待校准数据、参考数据和工作运行参数数据中每个采样点的数据值,计算其与理论真值之间的相似度,以及其与左右相邻两个采样点数据值之间的相似度,当任意一个相似度大于对应的预设阈值,说明该采样点数据值为异常数据,对其进行标记。
CN202111639271.8A 2021-12-29 2021-12-29 基于监督学习的数字采集***校准方法 Active CN114330553B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111639271.8A CN114330553B (zh) 2021-12-29 2021-12-29 基于监督学习的数字采集***校准方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111639271.8A CN114330553B (zh) 2021-12-29 2021-12-29 基于监督学习的数字采集***校准方法

Publications (2)

Publication Number Publication Date
CN114330553A CN114330553A (zh) 2022-04-12
CN114330553B true CN114330553B (zh) 2023-04-07

Family

ID=81017388

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111639271.8A Active CN114330553B (zh) 2021-12-29 2021-12-29 基于监督学习的数字采集***校准方法

Country Status (1)

Country Link
CN (1) CN114330553B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177551A (zh) * 2011-12-21 2013-06-26 北京普源精电科技有限公司 具有自校准功能的数据采集卡及其数据采集装置
CN103744045A (zh) * 2013-12-17 2014-04-23 中国电子科技集团公司第二十研究所 数字式万用表自动校准***
CN106777809A (zh) * 2017-01-13 2017-05-31 清华大学 一种基于实际运行数据的机车牵引计算模型校准方法
CN107247249A (zh) * 2017-07-12 2017-10-13 周浩 一种交直流电表校验仪校准装置及校准方法
CN109946636A (zh) * 2019-04-03 2019-06-28 中国计量大学 一种基于深度学习的数字万用表示值自动校准方法
CN109961186A (zh) * 2019-03-22 2019-07-02 大唐环境产业集团股份有限公司 基于决策树和bp神经网络的脱硫***运行参数预测方法
CN111537944A (zh) * 2020-05-20 2020-08-14 南京能瑞自动化设备股份有限公司 一种校准参数确定方法、微控制器、计量芯片及上位机
CN112528566A (zh) * 2020-12-18 2021-03-19 江西理工大学南昌校区 基于AdaBoost训练模型的空气质量数据实时校准方法及***
CN113312849A (zh) * 2021-06-15 2021-08-27 上海耀斑信息科技有限公司 供水管网水力模型自动更新及校准算法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7146283B2 (en) * 2004-08-16 2006-12-05 National Instruments Corporation Calibrating analog-to-digital systems using a precision reference and a pulse-width modulation circuit to reduce local and large signal nonlinearities

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177551A (zh) * 2011-12-21 2013-06-26 北京普源精电科技有限公司 具有自校准功能的数据采集卡及其数据采集装置
CN103744045A (zh) * 2013-12-17 2014-04-23 中国电子科技集团公司第二十研究所 数字式万用表自动校准***
CN106777809A (zh) * 2017-01-13 2017-05-31 清华大学 一种基于实际运行数据的机车牵引计算模型校准方法
CN107247249A (zh) * 2017-07-12 2017-10-13 周浩 一种交直流电表校验仪校准装置及校准方法
CN109961186A (zh) * 2019-03-22 2019-07-02 大唐环境产业集团股份有限公司 基于决策树和bp神经网络的脱硫***运行参数预测方法
CN109946636A (zh) * 2019-04-03 2019-06-28 中国计量大学 一种基于深度学习的数字万用表示值自动校准方法
CN111537944A (zh) * 2020-05-20 2020-08-14 南京能瑞自动化设备股份有限公司 一种校准参数确定方法、微控制器、计量芯片及上位机
CN112528566A (zh) * 2020-12-18 2021-03-19 江西理工大学南昌校区 基于AdaBoost训练模型的空气质量数据实时校准方法及***
CN113312849A (zh) * 2021-06-15 2021-08-27 上海耀斑信息科技有限公司 供水管网水力模型自动更新及校准算法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Deep Learning for Model Parameter Calibration in Power Systems;Safwan Wshah等;《2020 IEEE International Conference on Power Systems Technology (POWERCON)》;1-6 *
Single-parameter-learning-based finite-time tracking control of underactuated MSVs under input saturation;GuibingZhu等;《Control Engineering Practice》;1-11 *
基于FPGA的多通道数据采集***的设计;***;《中国优秀硕士学位论文全文数据库信息科技辑》;I135-198 *
高平坦度示波器通道设计及校准技术研究;余中豪;《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》;C042-872 *

Also Published As

Publication number Publication date
CN114330553A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN111079836B (zh) 基于伪标签方法和弱监督学习的过程数据故障分类方法
CN112284440A (zh) 一种传感器数据偏差自适应修正方法
CN115062272A (zh) 一种水质监测数据异常识别及预警方法
CN114015825A (zh) 基于注意力机制的高炉热负荷异常状态监测方法
CN117312769A (zh) 一种基于BiLSTM的物联网时序数据异常检测方法
CN114330553B (zh) 基于监督学习的数字采集***校准方法
CN113326744B (zh) 一种航天器在轨状态异常检测方法及***
CN114216877A (zh) 茶叶近红外光谱分析中谱峰自动检测与重构方法及***
CN112215495B (zh) 一种基于长短时记忆神经网络的污染源贡献度计算方法
CN106599391B (zh) 基于三角形角度值动态加权的关联向量机软测量建模方法
CN113312587B (zh) 基于arima预测和回归预测的传感器采集数据缺失值处理方法
CN107067034B (zh) 一种快速识别红外光谱数据分类的方法及***
CN115436342A (zh) 降低多批次样本间libs检测不确定性的方法及装置
CN115240065A (zh) 一种基于强化学习的无监督误匹配检测方法
Yu et al. Design for an SPRT control scheme based on linguistic data
CN111781824B (zh) 一种基于vine copula分位数回归的自适应软测量方法及***
CN112541162A (zh) 一种面向多遥测参数联合分析的时间轴自规整方法
CN117688388B (zh) 一种基于数据增强与预测联合学习的软测量方法与***
CN111104985A (zh) 一种异步航迹关联的加权滑窗方法
CN111949933B (zh) 小样本条件下水文频率分析中Frank Copula函数的参数估计方法
CN114386196B (zh) 一种板带力学性能预测准确性评估方法
CN112508320B (zh) 一种批生产的自动过程阶段划分工作流
CN117743757A (zh) 基于压缩感知的大坝安全监测数据缺失值插补方法及***
CN111914466B (zh) 一种基于相关变量分散式建模的化工过程监测方法
CN115128997B (zh) 一种基于指令域与朴素贝叶斯的有效样本提取方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant