CN116324854A - 用于对传感器数据点的不同时间序列进行分段的监视设备和方法 - Google Patents

用于对传感器数据点的不同时间序列进行分段的监视设备和方法 Download PDF

Info

Publication number
CN116324854A
CN116324854A CN202180065975.0A CN202180065975A CN116324854A CN 116324854 A CN116324854 A CN 116324854A CN 202180065975 A CN202180065975 A CN 202180065975A CN 116324854 A CN116324854 A CN 116324854A
Authority
CN
China
Prior art keywords
sensor data
data points
actual
regression model
data point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180065975.0A
Other languages
English (en)
Inventor
J·布朗纳
C·M·布鲁恩
M·勒巴彻
M·施努布施
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of CN116324854A publication Critical patent/CN116324854A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M99/00Subject matter not provided for in other groups of this subclass
    • G01M99/005Testing of complete machines, e.g. washing-machines or mobile phones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Manufacturing & Machinery (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

一种用于对表示技术***(100)的至少一个所测量参数的传感器数据点的不同时间序列进行分段,以检测技术***(100)的不同类型的物理过程的监视设备(200),包括:分析单元(202),其被配置成迭代地针对传感器数据点的时间序列的每个传感器数据点以及迭代地针对所有不同传感器的每个时间序列:‑获得(S 1)实际传感器数据点,‑确定所述实际传感器数据点是否是离群值(S3)并相应地对其进行标记,*确定(S4)所述实际数据点是否表示不连续性,‑由拟合到至少预定义第一数量的随后获得的传感器数据点的在时间上是直线的斜率方程的回归模型来确定斜率(S5),并且确定所述实际传感器数据点是否属于所学习的回归模型,‑如果所述实际传感器数据点不属于所学习的回归模型,则通过基于所述实际数据点和预定义第二数量的先前传感器数据点来学习新的回归模型从而确定新的斜率,以及*创建(S6)包括一个所学习的回归模型的所有传感器数据点的段;以及显示单元,其被配置成‑显示指示所确定的段或者是离群值的传感器数据点的时间序列的每个传感器数据点。

Description

用于对传感器数据点的不同时间序列进行分段的监视设备和 方法
本公开涉及一种用于对表示技术***的至少一个所测量参数的传感器数据点的不同时间序列进行分段以检测技术***的不同类型的物理过程的监视设备和方法。
在各种技术领域中,存在对于监视机器或一般地技术***的操作的需要。例如,在石油和天然气生产、钢铁生产或造纸厂的领域中,出于提供预防性维护、异常检测以及由此可用性的目的,可以监视大量设备,如内燃机引擎、电子设备和泵。
传感器在所有种类的重型机械和技术***中是无处不在的。一般来说,感兴趣的不是对传感器所输出的具体值的分析,而是从传感器值来推断基础技术过程。如果仅定性地知道基础技术过程的特性(即,已知在给定一个具体类型的情况下哪些传感器将升高和下降),但是不具有定量期望(即,传感器X将在y分钟内升高x个单位),则需要变换传感器数据,使得它匹配领域期望(domain expectation)的定性特征。
分析传感器数据的时间序列的主要目标是保护技术***(例如泵)免受损坏和失效。因此,该目标是检测表征技术***的异常和异常行为的传感器数据中的模式,该模式指示该装备在其失效之前的异常操作。这允许技术***的操作者非常及时地采取应对措施,这对于防止对技术***的进一步损害和导致技术***的维修或停机时间的大量成本是极其重要的。
例如对于作为在井下开采石油的电气潜水泵的技术***。传感器被安装在这些泵上,以便测量例如井底压力、井口压力和套管压力以及油温度和马达电流,这使得能够监视整个泵***的状态。对于各种泵失效场景,传感器值典型地示出了传感器数据中的可疑模式和异常,这允许估计根本原因和泵的潜在损坏。
传统上,比如泵这样的技术***的监视和控制是经由对传感器时间序列的视觉检查来执行的,以便标识时间序列内的指示异常行为的段。这样的方法是易于出错的,不允许处理大量数据,并且典型地不能够发现复杂的非线性模式。
存在大量不同的方法,从简单的基于规则的***、统计方法变动到机器学***滑化等,这阻碍了对结果的人类解释以及所监视的技术***的物理过程的所应用改变。
基于规则的评估***典型地依赖于固定的阈值。这些方法首先不允许找到段,并且其次不允许将不同类型的段解纠缠(disentangle)。诸如自回归模型、移动平均及其组合之类的统计方法能够标识传感器数据中的逐渐改变,但是会受到突然改变的严重偏向,该突然改变诸如传感器数据的时间序列中的跳跃和频率改变。作为深度神经网络的机器学习方法典型地需要经标注的数据来发现异常。即使是不需要标注的现有技术非监督方法也不能够在不同的段类型之间进行区分。
与异常行为的检测相关的主要问题涉及引发了泵或其他技术***失效的非常不同的类型的物理过程。
因此,本申请的目的是从表示技术***的参数的传感器数据的时间序列中标识技术***中的不同类型的物理过程。
该目的通过独立权利要求的特征来解决。从属权利要求包含本发明的进一步开发。
第一方面涉及一种用于对表示技术***的至少一个所测量参数的传感器数据点的不同时间序列进行分段以检测技术***的不同类型的物理过程的监视设备,包括:
分析单元,其被配置成迭代地针对传感器数据点的时间序列的每个传感器数据点以及迭代地针对所有不同传感器的每个时间序列:
-获得实际传感器数据点,
-确定所述实际数据点是否是离群值并相应地对其进行标记,
-确定所述实际数据点是否表示不连续性,
-由拟合到至少预定义第一数量的随后获得的传感器数据点的在时间上是直线的斜率方程的回归模型来确定斜率,并且确定所述实际传感器数据点是否属于所学习的回归模型,
-如果所述实际传感器数据点不属于所学习的回归模型,则通过基于所述实际数据点和预定义第二数量的先前传感器数据点来学习新的回归模型从而确定新的斜率,以及
-创建包括一个所学习的回归模型的所有传感器数据点的段,以及
显示单元,其被配置成
-显示指示所确定的段或者是离群值的传感器数据点的时间序列的每个传感器数据点。
一个重要类别的物理过程是随着时间逐渐地发展、最终导致失效的物理过程。这样的物理过程可以通过传感器数据点的时间序列关于时间的梯度来监视。梯度和斜率在这里用作同义词。此外,其中突发事件改变该***的第二类别的过程会导致失效,诸如导致了突发改变的断裂轴,从而在传感器数据的时间线中产生不连续性,尤其是跳跃不连续性。由于时间序列的每个传感器数据点是迭代地处理的,因此作为渲染或平滑化的预处理不会阻碍对突发改变的检测。每个单一数据点被评估和考虑以用于指示物理过程中的改变。属于一个所学习的回归模型的随后数据点的段指示逐渐发展的物理过程。第一和第二预定义数量可以具有不同的值,但是优选地具有相同的值。
根据实施例,所述设备通过附加地评估传感器的传感器数据值来确定操作模式改变,所述传感器数据值指示技术***针对所述实际传感器数据点的时间点的操作模式。
如果存在以可靠的方式指示技术***的操作模式中的改变的物理参数,则这个参数由传感器来测量,并且相应的传感器数据时间线附加地由分析单元来监视和评估。这允许早期检测技术***的操作模式改变,该改变可能被有意地选择和设置、或者在技术***的操作模式期间定期地发生。
根据进一步的优选实施例,所述设备被配置成使得:如果所述实际传感器数据点与相邻传感器数据点的值之间的相对改变超过第一阈值,则所述实际传感器数据点被确定为离群值。
决定所述实际数据点与相邻数据点的值之间的相对改变并且尤其是设置针对那个值的第一阈值允许根据传感器所测量的参数的类型来灵活适配阈值。例如,温度传感器的传感器数据点之间的偏差在技术***的-个物理状态内部可能比压力传感器的传感器数据点变化更多得多,所述压力传感器的传感器数据点可能示出非常稳定的值,而在相同的物理状态中没有显著变化。
在优选实施例中,所述设备被配置成:如果在所述实际传感器数据点之前的预定义第三数量的随后数据点被标记为离群值,则确定不连续性,尤其是跳跃不连续性。
这个特征允许区分:所述实际传感器数据点仅仅是离群值、还是它是以根据指示离群值的第一阈值的值而偏离的传感器数据点的序列的一部分,例如在跳跃不连续性随后的传感器数据点。由于传感器数据时间序列中的跳跃是在技术***中具有突发事件改变的第二类别的物理过程的指示,因此检测这样的跳跃提供了关于物理过程改变的非常相关的信息。
在进一步的优选实施例中,所述监视设备被配置成使得所述斜率是通过所述回归模型最小化随后获得的传感器数据点与所述斜率方程之间的第一距离度量来确定的。
这提供了随后传感器数据点的路线(course)的良好近似。此外,这样的最小化操作具有低复杂度,并且因此可以被快速执行以及由中等或甚至低性能的设备或处理器来执行。作为示例,欧几里德距离可以用作第一距离度量。
在进一步的优选实施例中,如果从所述斜率方程所得到的值(即,预测值)与包括所述实际数据点的传感器数据点的测试集之间的累积偏差的统计显著性低于预定义第二阈值,则所述实际数据点属于所学习的回归模型。
从所述斜率方程所得到的值或由所述斜率方程预测的值是通过将时间上相同的值设置到所述斜率方程中作为它将与之比较的数据点的时间来获得的。统计显著性针对将数据点分类为分别与所述斜率方程和所述回归模型“成一直线”提供了可靠的参数。通过预定义第二阈值,这个实际传感器数据点的偏差和值可以被适配到由传感器测量的技术***的实际所监视参数。除了所述实际数据点之外,传感器数据点的测试集还包括预定义第四数量的继续进行(proceeding)的随后数据点。
作为替代的优选实施例,如果从所述斜率方程所得到的值(即,预测值)与包括所述实际数据点的传感器数据点的测试集之间的累积偏差在预定义置信带之内,则所述实际数据点属于所学习的回归模型。
如果传感器数据点的测试集的累积偏差(也被称为方差)在预定义置信带之外,则学习针对直线的新斜率方程的回归模型,并且创建新的段。
在优选实施例中,如果所述累积偏差在预定义置信带之外,则所述实际传感器数据点不属于所学习的回归模型。
确定所述实际数据点是否属于所学习的回归模型的各种可能性使得能够找到初始斜率,并且同时将它们从专用传感器所指示的跳跃不连续性或模式改变中解纠缠。
在优选实施例中,所确定的段通过在随后段的归一化斜率系数上设置预定义第三阈值被分类成类别,其包括具有预定义值范围中的斜率的随后学习的回归模型的所有传感器数据点。
创建包括具有预定义值范围中的斜率系数(例如,增加、减少或稳定的斜率)的随后学习的回归模型的所有传感器数据点的类别(也被称为被归类的段)也可以以低处理能力要求的方式来揭示时间线中的非线性函数。考虑复杂的非线性模式,这是因为线性回归线以逐段的方式被应用于序列,并且能够近似任何非线性函数。
在优选实施例中,所述设备包括用户输入单元,所述用户输入单元被配置成从领域专家接收任何预定义数量的数据点的值和预定义阈值中的至少一个。
这使得能够以灵活的方式使所述监视设备的配置适配到实际的所监视的技术***,并且使所述监视设备适配到技术***的寿命期间的改变的行为、或技术***的有意改变的操作模式。预定义数量是例如第一、第二、第三和第四数量的传感器数据点以及第一或第二阈值。它还允许领域专家的反馈,该领域专家可以解释所述监视设备的显示输出,并且允许改变各种预定义数量和阈值以拟合到技术***的实际状态和操作模式。
在优选实施例中,不同传感器的每个时间序列被分离地处理。
这具有所述设备缩放(scale)到高维的优点。
在优选实施例中,个体学习模型针对所述不同传感器被创建,并且将模型合并成一个单一模型。
这允许不同传感器时间线的联合评估和分析。
在所述监视设备的优选实施例中,所述段和/或类别被指派给技术***的物理过程。
根据可以被指派给技术***的物理过程的不同传感器时间线的先前分段,规则可以被导出,并且被应用于符合所导出的规则的不同传感器时间线的另外段的组。
因此,已经可以通过所述监视设备来实现和显示在技术***的物理过程方面的预判断(prejudgment)。
本发明的进一步方面涉及一种用于对表示技术***的至少一个所测量参数的传感器数据点的不同时间序列进行分段以检测技术***的不同类型的物理过程的方法,其针对传感器数据点的时间序列的每个传感器数据点以及迭代地针对所有不同传感器的时间序列,包括下面的步骤:
-获得实际传感器数据点
-确定所述实际数据点是否是离群值并将其标记为离群值,
-确定所述实际数据点是否表示不连续性,
-由拟合到至少预定义第一数量的随后获得的传感器数据点的在时间上是直线的斜率方程的回归模型来确定斜率,并且确定所述实际传感器数据点是否属于所学习的回归模型,
-如果所述实际传感器数据点不属于所学习的回归模型,则通过基于所述实际数据点和预定义第二数量的继续进行的传感器数据点来学习新的回归模型从而确定新的斜率,以及
-创建包括具有预定义值范围中的斜率的随后学习的回归模型的所有传感器数据点的段,以及
-显示指示所确定的段或者是离群值的传感器数据点的时间序列的每个传感器数据点。
该方法使得能够标识未标注的数据中的不同类型的段,例如标识逐渐行为的斜率,检测指示由技术***的真实物理过程引发的突然改变的跳跃不连续性。该方法使得能够进一步检测离群值,该离群值指示由于测量误差、噪声等所致的突然改变。利用方法,不同类型的段也可以被解纠缠,来自高维传感器数据的复杂非线性模式的异常行为可以被找到,并且它提供了对不同段和传感器数据的类别执行可解释的总体比较的能力。由于该方法具有低处理复杂度,因此可以处理大量的传感器。输出是人类可读的,并且领域知识可以通过配置必须被考虑的各种阈值或各种数量的传感器数据点来整合。
本发明的进一步方面涉及一种直接可加载到内部存储器或数字计算机中的计算机程序产品,包括软件代码部分,当所述产品在所述数字计算机上运行时,所述软件代码部分用于执行权利要求14的步骤。
在下文中,将更详细地并且参考附图来描述本公开的实施例。
图1图示了包括本发明的监视设备的实施例的监视环境的示例。
图2示意性地图示了在分析单元中对传感器数据点执行的处理步骤以及在监视设备的显示单元中示出的输出的示例性实施例。
图3A-3H图示了在分析单元中执行的斜率确定和分段的详细步骤。
要注意的是,在实施例的以下详细描述中,附图仅仅是示意性的。所图示的元件不一定是按比例示出的。更确切地说,附图旨在说明功能以及组件的协作,该组件例如分析单元、显示单元和输入单元。功能块可以由专用硬件、固件以及由可编程硬件安装的所有软件、和/或专用硬件和固件与软件的组合来实现。要认识到的是,本文中公开的任何电路、处理器或其他电气设备可以包括任何数量的微控制器、图形处理器单元(GPU)、集成电路、存储器设备和软件,其彼此协作以执行本文中公开的操作。
图1示出了包括用于对传感器数据点102的不同时间序列101进行分段的监视设备200的监视环境。传感器数据点102的时间序列101是通过不同传感器随时间测量所监视的技术***100的不同参数而获得的。监视设备200包括传感器数据供应单元201、分析单元202、显示单元203和用户输入单元204。传感器数据供应单元201从技术***100接收传感器数据点102的时间线101。
被监视的技术***100可以是任何种类的机器或机器***,但是也可以是应用于工厂和能量分配***或运输***中的设备。作为示例,这里,潜水泵被描述为技术***。在技术***100中,安装了若干传感器,以便测量物理参数,例如井底压力、井口压力和套管压力以及油温度和马达电流,这使得能够监视整个泵***的状态。对于各种泵失效场景,传感器值典型地示出数据中的可疑模式和异常,这允许估计根本原因和泵的潜在损坏。而且,不同的阶段或物理过程由传感器值以及其随时间的发展来反映。
传感器数据点102的这些时间线101在传感器数据预览单元201中被接收。实际传感器数据点可以在它们被生成时在供应单元201中被接收(即“在线”),并且被转发到分析单元202。作为替代,传感器数据点的历史时间线也可以被存储在传感器数据供应单元201中,并且被转发给分析单元202以用于“离线”评估。
分析单元202获得实际传感器数据点102。在没有对所获得的数据点或传感器数据点的时间线进行任何进一步预处理的情况下,时间序列的每个传感器数据点被迭代地处理,如图2中所图示以及下面所描述的那样。根据所指派的段来标记经处理和分析的数据点。可选地,通过根据预定义的规则和阈值组合不同的段来对段进行分类。用作分析单元202中的设置的各种预定义数量和阈值可以由领域专家经由用户输入单元204被输入,并且被转发给分析单元202。领域专家可以输入或改变这些值,以使分析单元适配到所监视的技术***100的类型,或者使它适配到不同的使用情况和操作模式。
显示单元203提供了用于显示指示段的传感器数据点的所分析的时间序列的装置,该数据点被确定成和/或指示那个数据点作为离群值和/或指示段的类别。操作工作人员可以从所显示的信息中导出技术***100的不同类型的物理过程,并且根据物理过程的类型来适配技术***100的设置或者采取应对措施等。
图2图示了由分析单元202执行的功能和步骤。它处理第一传感器的传感器数据点的时间序列103和不同的第二传感器的传感器数据点的第二时间序列104,如示图300中所示。时间序列103的传感器数据点在分析单元202中被迭代地获得和处理。在完成处理时间序列103的传感器数据点之后,相同的程序适用于时间序列104的每个数据点。
流程图310图示了应用于实际传感器数据点z(t)并且在监视设备的分析单元中执行的方法以及其处理步骤的实施例。单个处理步骤的序列对于这个特定实施例是示例性的。本发明不限于这个序列,而是也覆盖了对那个序列的偏差。
作为第一可选步骤S1,从传感器数据供应单元201获得实际传感器数据点z(t)。可选地,评估传感器的传感器数据值,该传感器数据值指示技术***100在与实际传感器数据z(t)相同的时间点t处的操作模式,参见S2。作为示例,技术***100的频率指示物理模式,并且频率改变指示物理模式中的改变。评估在与实际传感器数据点z(t)相同的时间处检测到的这样的频率传感器数据点的时间线,以检测潜在的频率改变。如果实际数据点与继续进行的数据点之间的频率的绝对差异超过给定阈值,则检测到频率改变。如果检测到频率改变,则实际传感器数据点z(t)被如此标记,并且下一个迭代开始获得时间序列103的随后数据点。
如果在由实际传感器数据点z(t)表示的时间处未检测到操作模式改变,则在步骤S3中确定实际数据点是否是离群值。如果实际传感器数据点z(t)与相邻的先前传感器数据点的值之间的相对改变超过预定义第一阈值,则实际传感器数据点z(t)被确定为离群值。如果这为真,则实际数据点被标记为离群值。作为示例,实际数据点被标记为离群值,如果实际与先前传感器数据值之间的增加或减少的百分比大于0.5%的话,实际数据点z(t)被标记为离群值。在这种情况下,获得下一数据点z(t+1),参见步骤S1,并且处理如之前所描述的那样开始。
如果实际数据点不是离群值,则分析单元202继续进行到步骤S4,步骤S4确定实际数据点z(t)是否表示不连续性,尤其是跳跃不连续性。在步骤S4处,如果在实际传感器数据点z(t)后继续进行的预定义第三数量的随后数据点被标记为离群值,则确定不连续性。如果检测到不连续性,则相应地标记实际数据点,并且在S1步骤中获得下一数据点。
如果未检测到不连续性,则由拟合到至少预定义第一数量的随后获得的传感器数据点的在时间上是直线的斜率方程的回归模型来确定斜率。斜率的计算基于参数回归模型,该参数回归模型计算随时间的平均增加。由于这个模型选择,估计的稳定性依赖于用于拟合的数据点的量,该量是随后获得的传感器数据点的预定义第一数量。这个参数可以由领域专家来选择,并且经由用户输入单元204输入到监视设备200。如果用于构建回归模型的足够的数据点是可用的,则确定实际传感器数据点是否属于所学习的回归模型。如果不存在可用的足够的数据点,则该算法继续进行下一迭代并且获得下一数据点,参见步骤S1。
为了确定实际传感器数据点z(t)是否属于学***,该统计测试根据下一数据点的预测与实际值之间的累积偏差的统计显著性来作出决定。这意味着,如果从斜率方程所得到的值与包括实际数据点的传感器数据点的测试集之间的累积偏差的统计显著性低于预定义第二阈值,则实际数据点属于所学习的回归模型。
作为第二个选项,如果从斜率方程所得到的值与包括实际数据点的传感器数据点的测试集之间的累积偏差在预定义置信带之内,则实际数据点属于所学习的回归模型。如果累积偏差在预定义置信带之外,则实际传感器数据点不属于所学习的回归模型。
图320示出了传感器数据点的所得到的时间序列103′和104′,其针对该时间序列的每个传感器数据点指示它是否是离群值,表示跳跃偏差还是属于表示由一个回归模型所表示的随后传感器数据点的段并且因此属于这个专用段。
在附加的可选步骤S7中,所确定的段通过在随后段的归一化斜率系数上设置预定义第三阈值被分类成类别,其包括具有预定义值范围中的斜率的随后学习的回归模型的所有传感器数据点。例如,斜率被分类成3个不同类别的斜率系数:增加、减少和稳定。再次地,用户具有定义这个分类应当在什么基础上发生的可能性。这里,段是根据随后段的归一化斜率系数上的预定义阈值被分类的,其包括具有预定义值范围中的斜率的所学习的回归模型的所有传感器数据点,参见步骤S7。这允许将相似的斜率合并成更大的段,也被称为“类别”。在图330中,示出了这些类别331、332和333,其中类别331示出了增加的斜率,类别332示出了稳定的路线,并且类别333包括减少的斜率的随后段。
所描述的步骤是针对第一传感器的所有传感器数据点(例如针对图300中的传感器的时间序列103的所有传感器数据点)来执行的。在那之后,以相同的方式来处理第二传感器的数据点的时间序列,即时间序列104。当在传感器中的至少一个的在线监视期间获得新的数据点时,基于针对这些传感器的相应时间序列所生成的回归模型的斜率,所有新的传感器数据点作为实际传感器数据点被一个接一个地处理。
图3A-3H更详细地解释和图示了回归模型对斜率的确定。图3A示出了传感器数据点的时间序列,其中由参考符号X标记的数据点已经被处理并且用于计算斜率,即应用于所学习的回归模型中。由参考符号Z标记的数据点是传感器数据点的测试集Z,其用于确定实际传感器数据点z(t)是否属于所学习的回归模型。测试集Z包括实际传感器数据点z(t),例如作为由回归模型考虑的在时间上是最后的传感器数据点。构建了测试集Z的传感器数据点的最小量由预定义第四数量的随后获得的传感器数据点来给出。
给定数据点的最小集合X=(xt,xt+1,...,xt+T)∈RT,其中t表示时间,并且时间点T的最小量(即,第一预定义数量)优选地大于3。
针对斜率的回归模型经由以下等式来定义:
xt=γ01t+∈t,其中∈t~N(0,σ2) (1)
其中N(0,σ2)表示具有期望零和方差σ2的正态分布。这个模型用于描述其中传感器数据点随时间不断地演变的状态。数据点X用于学***均斜率。传感器数据点Z表示新进入的数据点,该新进入的数据点被测试它们是否仍然属于该线。
平均斜率经由E[xt]=γ01t来定义,其中γ1是斜率,并且E[xt]表示时间t处的传感器数据点的期望值。该模型本身具有3个参数Γ=(σ2,γ0,γ1)。这些参数可以从传感器数据点来学习。学习到的参数由
Figure BDA0004145984050000111
来表示,即参数上的“帽子”指示从传感器数据学习到的值。那些学习到的参数应当尽可能接近传感器数据点的实时序列的值。这是通过最小化距离度量来实现的,该距离度量例如是传感器数据点X与斜率方程之间的欧几里德距离:
Figure BDA0004145984050000112
在等式(2)中,所观测的数据点X与回归模型之间的平方距离被求和,并且最优参数值通过改变(γ0,γ1)来最小化该平方距离而被确定。
由于根据等式(1)的回归模型本身是基于正态分布的,因此需要确定方差。方差是回归模型与数据点X之间的平均二次偏差,并且可以用作该数据点偏离该模型的强烈程度的度量。方差可以通过下式来计算:
Figure BDA0004145984050000113
基于来自等式(2)和(3)的所估计的参数
Figure BDA0004145984050000114
有可能测试新进入的实际数据点z(t)是否仍然拟合到回归模型。在它们不拟合到回归模型的情况下,该算法被迭代。在它们拟合到回归模型的情况下,我们将该数据点包括在数据集X中,并且如上面所描述的那样学习新参数。
新进入的数据点Z=(zT+1,zt+2,...,zt+τ)∈Rτ被认为是测试集,其中τ是新数据点的数量。测试集中的数据点的数量可以是大于0的任何数量。现在必须决定数据点Z的新测试集是否属于所学习的回归模型。这里,可以应用两种方法,要么是基于概率的方法,要么是基于置信带的方法。
对于基于概率的方法,统计测试基于找到甚至更差地拟合当前状态的点的概率。假定新的数据点Z将属于当前斜率,则它针对每个i∈{1,...,τ},持有
Figure BDA0004145984050000121
并且因此,新的测试变量T遵循某种正态分布:
Figure BDA0004145984050000122
基于这个结果,计算该概率,以找到甚至更不拟合到当前状态的点作为变量T。经由以下公式对照当前模型来测试经归一化和平均的数据点Z:
Figure BDA0004145984050000123
即,P(T)给出了找到甚至比所观测的点更不拟合到当前回归模型的点的概率,并且相应地,它可以被解释为针对Z=(zT+1,zt+2,...,zt+τ)∈Rτ属于当前斜率的证据。即,如果P(T)是高的,则相当确定新的点属于当前斜率。
这现在可以使用预定义的显著性水平α来测试,该显著性水平α即α=0.1,如果对于找到甚至更差地拟合到当前状态的点,预期10%的概率的话。
如果现在
P(T)>a
则接受Z=(ZT+1,zt+2,...,Zt+τ)∈Rτ属于当前斜率的假设,并且因此不存在针对改变点CP的证据,参见图3A,其中数据点z(t)被确定成属于传感器数据点X的回归模型。
如果
P(T)≤α,
则难以找到甚至更差地拟合到回归模型的数据点,并且可以得出结论:数据点Z不再属于当前斜率,其引发了改变点CP,参见图3B和图3C。
在基于置信带的方法中,参数
Figure BDA0004145984050000131
定义了回归模型与新的数据点Z之间的偏差的哪个范围可以被认为是正常的。再次使用累积偏差的测试统计:
Figure BDA0004145984050000132
检查新的数据点Z是否可以被认为是正常的。
在给定正态分布的情况下,其认为我们可以定义η,并且如果累积偏差T在由下式给出的范围中,则决定新的传感器数据点Z属于当前斜率:
Figure BDA0004145984050000133
因此,不能够找到改变点CP。然而,如果T在置信范围的区间之外,参见
Figure BDA0004145984050000134
则决定测试集Z不属于该模型,并且因此找到了改变点CP。
对于如图3D和3E中所示的继续进行的实际数据点Z,相同的程序被迭代。
图3F示出了其中检测到实际传感器数据点的值中的突然改变的情形。这里,实际数据点z(t)被确定为离群值。如果预定义第三数量的随后数据点z(t)被标记为离群值,则第一个离群值表示跳跃不连续性。被标记为离群值的第一个传感器数据点表示由跳跃不连续性CP引发的改变点,并且新的回归模型针对随后数据点而被学习,参见图3G。
当传感器数据点的完整时间序列已经被指派到相同斜率的段中时,这些段被分类在类似斜率的更大的段(被称为类别)中。在图3H中,类别C1、C3属于类别稳定的斜率,类别C2属于增加的斜率,并且类别C4属于减少的斜率。
因为每个传感器被分开地处理,因此它缩放至高维数据。这对于处理个体时间序列也是如此,这是由于基于回归的斜率计算具有低处理复杂度。所提出的算法的任何步骤都不需要对传感器数据点的时间序列进行降维或任何变换,并且因此所有结果是由领域专家可解释的,并且可以如图2的图330中所示的那样被可视化。此外,跳跃不连续性和斜率改变两者都可以与特定物理过程相关,并且因此可以是容易地可解释的。由于设置参数的不同可能性,使得专家能够并入他的领域知识。然而,也有可能利用默认的参数设置来运行该算法。
要理解的是,对示例的上述描述旨在是说明性,并且所说明的概念易于进行各种修改。

Claims (15)

1.一种用于对表示技术***(100)的至少一个所测量参数的传感器数据点的不同时间序列进行分段以检测技术***(100)的不同类型的物理过程的监视设备(200),包括
分析单元(202),其被配置成迭代地针对传感器数据点的时间序列的每个传感器数据点以及迭代地针对所有不同传感器的每个时间序列:
-获得(S1)实际传感器数据点,
-确定所述实际传感器数据点是否是离群值(S3)并相应地对其进行标记,
-确定(S4)所述实际数据点是否表示不连续性,
-由拟合到至少预定义第一数量的随后获得的传感器数据点的在时间上是直线的斜率方程的回归模型来确定斜率(S5),并且确定所述实际传感器数据点是否属于所学习的回归模型,
-如果所述实际传感器数据点不属于所学习的回归模型,则通过基于所述实际数据点和预定义第二数量的先前传感器数据点来学习新的回归模型从而确定新的斜率,以及
-创建(S6)包括一个所学习的回归模型的所有传感器数据点的段,以及
显示单元,其被配置成:
-显示指示所确定的段或者是离群值的传感器数据点的时间序列的每个传感器数据点。
2.根据权利要求1所述的监视设备,其中所述分析单元(202)被配置成通过附加地评估传感器的传感器数据值来确定操作模式的改变,所述传感器数据值指示技术***(100)针对所述实际传感器数据点的时间点的操作模式。
3.根据前述权利要求中任一项所述的监视设备,其中如果所述实际传感器数据点与相邻传感器数据点的值之间的相对改变超过预定义第一阈值,则所述实际传感器数据点被确定为离群值。
4.根据前述权利要求中任一项所述的监视设备,其中如果在所述实际传感器数据点之前的预定义第三数量的随后数据点被标记为离群值,则不连续性被确定。
5.根据前述权利要求中任一项所述的监视设备,其中所述斜率是通过所述回归模型最小化随后获得的传感器数据点与所述斜率方程之间的第一距离度量来确定的。
6.根据前述权利要求中任一项所述的监视设备,其中如果从所述斜率方程所得到的值与包括所述实际数据点的传感器数据点的测试集(Z)之间的累积偏差的统计显著性低于预定义第二阈值,则所述实际数据点属于所学习的回归模型。
7.根据权利要求1-5中任一项所述的监视设备,其中如果从所述斜率方程所得到的值与包括所述实际数据点的传感器数据点的测试集(Z)之间的累积偏差在预定义置信带之内,则所述实际数据点属于所学习的回归模型。
8.根据权利要求6所述的监视设备,其中如果所述累积偏差位于预定义置信带之外,则所述实际传感器数据点不属于所学习的回归模型。
9.根据前述权利要求中任一项所述的监视设备,其中所确定的段通过在随后段的归一化斜率系数上设置预定义第三阈值被分类(S7)成类别,其包括具有预定义值范围中的斜率的随后学习的回归模型的所有传感器数据点。
10.根据前述权利要求中任一项所述的监视设备,包括用户输入单元(204),所述用户输入单元(204)被配置成从领域专家接收第一、第二、第三或第四数量的数据点的值和/或第一、第二或第三阈值中的至少一个。
11.根据前述权利要求中任一项所述的监视设备,其中不同传感器的每个时间序列被分离地处理。
12.根据前述权利要求中任一项所述的监视设备,其中个体学习模型针对所述不同传感器被创建,并且被合并成一个单一模型。
13.根据前述权利要求中任一项所述的监视设备,其中所述段和/或类别被指派给技术***的物理过程。
14.一种用于对表示技术***(100)的至少一个所测量参数的传感器数据点的不同时间序列进行分段以检测技术***(100)的不同类型的物理过程的方法,包括迭代地针对传感器数据点的时间序列的每个传感器数据点以及迭代地针对所有不同传感器的时间序列:
-获得(S1)实际传感器数据点,
-确定(S3)所述实际数据点是否是离群值并相应地对其进行标记,
-确定所述实际数据点是否表示不连续性(S4),
-由拟合到至少预定义第一数量的随后获得的传感器数据点的在时间上是直线的斜率方程的回归模型来确定斜率(S5),并且确定所述实际传感器数据点是否属于所学习的回归模型,
-如果所述实际传感器数据点不属于学习的回归模型,则通过基于所述实际数据点和预定义第二数量的先前传感器数据点来学习新的回归模型从而确定新的斜率,以及
-创建包括一个所学习的回归模型的所有传感器数据点的段(S6),以及
-显示指示所确定的段或者是离群值的传感器数据点的时间序列的每个传感器数据点。
15.一种直接可加载到数字计算机的内部存储器中的计算机程序产品,包括软件代码部分,当所述产品在所述数字计算机上运行时,所述软件代码部分用于执行权利要求14的步骤。
CN202180065975.0A 2020-09-28 2021-09-28 用于对传感器数据点的不同时间序列进行分段的监视设备和方法 Pending CN116324854A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20198778.1 2020-09-28
EP20198778.1A EP3975077A1 (en) 2020-09-28 2020-09-28 Monitoring device and method for segmenting different times series of sensor data points
PCT/EP2021/076687 WO2022064067A1 (en) 2020-09-28 2021-09-28 Monitoring device and method for segmenting different times series of sensor data points

Publications (1)

Publication Number Publication Date
CN116324854A true CN116324854A (zh) 2023-06-23

Family

ID=72665170

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180065975.0A Pending CN116324854A (zh) 2020-09-28 2021-09-28 用于对传感器数据点的不同时间序列进行分段的监视设备和方法

Country Status (4)

Country Link
US (1) US20230375441A1 (zh)
EP (2) EP3975077A1 (zh)
CN (1) CN116324854A (zh)
WO (1) WO2022064067A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117470380A (zh) * 2023-12-26 2024-01-30 西安艺琳农业发展有限公司 一种智慧养猪多传感器监测及预警***

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11709819B2 (en) * 2020-09-30 2023-07-25 International Business Machines Corporation Validating test results using a blockchain network
CN115017121B (zh) * 2022-08-05 2022-10-25 山东天意机械股份有限公司 一种混凝土生产设备数据存储***
CN117992738B (zh) * 2024-04-03 2024-06-11 山东兰蝶节能环保科技有限公司 一种节电柜电能自动化节电监测方法及***

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8341106B1 (en) * 2011-12-07 2012-12-25 TaKaDu Ltd. System and method for identifying related events in a resource network monitoring system
WO2017034512A1 (en) * 2015-08-21 2017-03-02 Hewlett Packard Enterprise Development Lp Interactive analytics on time series

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117470380A (zh) * 2023-12-26 2024-01-30 西安艺琳农业发展有限公司 一种智慧养猪多传感器监测及预警***
CN117470380B (zh) * 2023-12-26 2024-03-22 西安艺琳农业发展有限公司 一种智慧养猪多传感器监测及预警***

Also Published As

Publication number Publication date
US20230375441A1 (en) 2023-11-23
WO2022064067A1 (en) 2022-03-31
EP4193313A1 (en) 2023-06-14
EP3975077A1 (en) 2022-03-30

Similar Documents

Publication Publication Date Title
CN116324854A (zh) 用于对传感器数据点的不同时间序列进行分段的监视设备和方法
Amruthnath et al. Fault class prediction in unsupervised learning using model-based clustering approach
Ahmad et al. Autoencoder-based condition monitoring and anomaly detection method for rotating machines
US20140365179A1 (en) Method and Apparatus for Detecting and Identifying Faults in a Process
US7254514B2 (en) Method and system for predicting remaining life for motors featuring on-line insulation condition monitor
EP2905665B1 (en) Information processing apparatus, diagnosis method, and program
Maurya et al. A framework for on-line trend extraction and fault diagnosis
US20070088550A1 (en) Method for predictive maintenance of a machine
EP3416011B1 (en) Monitoring device, and method for controlling monitoring device
EP3859472B1 (en) Monitoring system and monitoring method
US7949497B2 (en) Machine condition monitoring using discontinuity detection
KR102618023B1 (ko) 고장유형에 따른 패턴 분석을 통한 고장 예지 진단시스템 및 방법
CN118176467A (zh) 用于监视技术安装中的资产的状况的***、装置和方法
EP3416012B1 (en) Monitoring device, and method for controlling monitoring device
KR20220132824A (ko) 배전설비 상태 이상 개소 감시 시스템 및 방법
CN117607780A (zh) 一种电能计量装置异常分析***及其分析方法
US11320813B2 (en) Industrial asset temporal anomaly detection with fault variable ranking
US20230297095A1 (en) Monitoring device and method for detecting anomalies
US20220253051A1 (en) Method and assistance system for detecting an abnormal behaviour of a device
de León Hijes et al. Assessment of functional condition of equipment in industrial plants based on multiple measurements
Schadler et al. Fault detection using online selected data and updated regression models
EP3706048A1 (en) Anomaly prediction in an industrial system
Sobczak-Oramus et al. Data-Driven Remaining Useful Life Estimation Approach for Neutron Generators in Multifunction Logging-While-Drilling Service
Sánchez Ramos et al. Physics-informed learning under epistemic uncertainty with an application to system health modeling
CN116648680A (zh) 用于自动识别技术***的故障类型的辅助装置和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination