JP6129508B2 - Anomaly detection pre-processing apparatus and method, program, and anomaly detection apparatus having the same - Google Patents
Anomaly detection pre-processing apparatus and method, program, and anomaly detection apparatus having the same Download PDFInfo
- Publication number
- JP6129508B2 JP6129508B2 JP2012222318A JP2012222318A JP6129508B2 JP 6129508 B2 JP6129508 B2 JP 6129508B2 JP 2012222318 A JP2012222318 A JP 2012222318A JP 2012222318 A JP2012222318 A JP 2012222318A JP 6129508 B2 JP6129508 B2 JP 6129508B2
- Authority
- JP
- Japan
- Prior art keywords
- distribution
- abnormality detection
- data
- normal
- correction term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 129
- 238000007781 pre-processing Methods 0.000 title claims description 28
- 238000000034 method Methods 0.000 title claims description 22
- 230000005856 abnormality Effects 0.000 claims description 135
- 238000012937 correction Methods 0.000 claims description 99
- 238000005259 measurement Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 description 13
- 238000012887 quadratic function Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000000611 regression analysis Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Landscapes
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
- Testing And Monitoring For Control Systems (AREA)
Description
本発明は、異常検出前処理装置および方法ならびにプログラム、それを備えた異常検出装置に関するものである。 The present invention relates to an abnormality detection preprocessing apparatus and method, a program, and an abnormality detection apparatus including the same.
従来、数値の異常を検出するのにマハラノビス距離という統計的手法が一般に用いられている。マハラノビス距離は、正常データが正規分布に従うことを前提とした手法であり、現実のデータにおいては、正規分布に従わないことが多々あるため、正常データを正規分布に従わせる技術が検討されている(例えば、下記特許文献1)。 Conventionally, a statistical method called Mahalanobis distance is generally used to detect numerical anomalies. Mahalanobis distance is a method based on the assumption that normal data follows a normal distribution. In actual data, there are many cases where the normal data does not follow a normal distribution. (For example, the following patent document 1).
しかしながら、正常データが仮に正規分布から離れていると判定されても、異常検知の目的に沿ってそのデータを正規分布に近づける方法がなく、マハラノビス距離によって、精度よく異常検出をすることができないという問題があった。
例えば、信号値を足し合わせて平均を取るなどの処理を行えば、データは中心極限定理から正規分布に近づくので、異常検知の目的に沿わせることに拘らなければ、正規分布に近づける方法はある。しかしながらその場合には、判定すべき異常信号までもが正規分布に近づくこととなり、異常信号が有している特徴が変わってしまい、異常検知の目的には沿わず、上記問題を解決できなかった。
However, even if it is determined that the normal data is away from the normal distribution, there is no method for bringing the data closer to the normal distribution in accordance with the purpose of the abnormality detection, and the abnormality cannot be accurately detected by the Mahalanobis distance. There was a problem.
For example, if processing such as adding signal values and averaging is performed, the data approaches the normal distribution from the central limit theorem, so there is a method to approximate the normal distribution unless it is related to the purpose of abnormality detection . However, in that case, even the abnormal signal to be determined approaches the normal distribution, the characteristics of the abnormal signal change, and does not meet the purpose of abnormality detection, and the above problem cannot be solved. .
本発明は、このような事情に鑑みてなされたものであって、簡便で、かつ、精度よく、収集データの異常検出ができる異常検出前処理装置および方法ならびにプログラム、それを備えた異常検出装置を提供することを目的とする。 The present invention has been made in view of such circumstances, and is a simple and accurate abnormality detection preprocessing apparatus and method and program capable of detecting an abnormality of collected data, and an abnormality detection apparatus having the same The purpose is to provide.
上記課題を解決するために、本発明は以下の手段を採用する。
本発明は、正常時に測定された所定期間内の2変数以上に関する分布データが、正規分布に従った分布になるか否かを判定する判定手段と、正規分布に従う分布でないと判定された場合に、前記分布データをフィッティングさせる複数の仮の非線形モデルと、それぞれ仮の前記非線形モデルの回帰直線との差を、前記分布データを補正する補正項として算出する補正項算出手段と、前記補正項で補正した前記分布データが、最も正規分布に従う分布をもたらす仮の前記非線形モデルを、異常検出で使用する場合の異常検出モデルとして選定し、該異常検出モデルに基づいて算出された前記補正項を異常検出に用いる異常検出補正項として選定する選定手段とを具備する異常検出前処理装置を提供する。
In order to solve the above problems, the present invention employs the following means.
The present invention, the distribution data related to two or more variables in a predetermined period of time that is measured during normal, it is determined determining means for determining whether or not made a distribution in accordance with the normal distribution, not a distribution follows a normal distribution A correction term calculating means for calculating a difference between a plurality of provisional nonlinear models for fitting the distribution data and a regression line of each provisional nonlinear model as a correction term for correcting the distribution data; The correction data calculated based on the abnormality detection model is selected as the abnormality detection model in the case where the distribution data corrected by the correction term causes the distribution that most closely follows the normal distribution to be used for abnormality detection. There is provided an abnormality detection pre-processing device comprising selection means for selecting a term as an abnormality detection correction term used for abnormality detection.
このような構成によれば、正常時に測定された所定期間内の2変数以上に関する分布データが、正規分布に従った分布になるか否かを判定され、正規分布に従う分布でないと判定された分布データが仮の非線形モデルにフィッティングされ、仮の非線形モデルと仮の非線形モデルの回帰分析の結果とに基づいて、分布データを補正する補正項が算出される。算出された補正項により補正された分布データが、最も正規分布に従う分布をもたらす仮の非線形モデルが、異常検出で使用する場合の異常検出モデルとして選定され、該異常検出モデルに基づいて算出された補正項を異常検出に用いる補正項として選定される。
このように、正常データの正規分布性を定量的に評価し、正規分布でないと判定された場合に、それを正規分布に従うように補正することにより、正常時から外れたデータ(つまり、異常データ)を精度よく検出することができる。また、正常時に測定されたデータのみを用いるので、正常データと異常データとを利用する方法と比較して、簡便である。
According to such a configuration, it is determined whether or not the distribution data related to two or more variables within a predetermined period measured in a normal state is a distribution according to a normal distribution, and is determined not to be a distribution according to a normal distribution. The data is fitted to the temporary nonlinear model, and a correction term for correcting the distribution data is calculated based on the temporary nonlinear model and the result of the regression analysis of the temporary nonlinear model. The provisional nonlinear model whose distribution data corrected by the calculated correction term yields a distribution that most closely follows the normal distribution is selected as an abnormality detection model when used in abnormality detection, and is calculated based on the abnormality detection model. The correction term is selected as a correction term used for abnormality detection.
In this way, the normal distribution of normal data is quantitatively evaluated, and if it is determined that the normal distribution is not normal, it is corrected so that it follows the normal distribution. ) Can be detected with high accuracy. Moreover, since only data measured at normal time is used, it is simpler than a method using normal data and abnormal data.
上記異常検出前処理装置の前記補正項算出手段は、仮の前記非線形モデルと、仮の前記非線形モデルの回帰直線との差を前記補正項として算出することが好ましい。 It is preferable that the correction term calculation means of the abnormality detection preprocessing apparatus calculates a difference between the provisional nonlinear model and a regression line of the provisional nonlinear model as the correction term.
仮の非線形モデルとその回帰直線との差によって簡便に補正項を算出できる。
また、従来のように、例えば信号値を加算して平均値を求める等の操作をして正規分布に従わせる場合とは異なり、本発明は、非線形モデルを線形モデルに回帰させることによって、正規分布に従うか否かを判定するので、元となる分布データの特徴が失われることがない。
The correction term can be easily calculated based on the difference between the provisional nonlinear model and the regression line.
Further, unlike the conventional case, for example, in which an operation such as adding signal values to obtain an average value is performed and the normal distribution is followed, the present invention performs normalization by regressing a nonlinear model to a linear model. Since it is determined whether to follow the distribution, the characteristics of the original distribution data are not lost.
上記異常検出前処理装置の補正項算出手段は、正規分布に従う分布でないと判定された前記分布データのうち、所定数選定された前記分布データを複数の仮の前記非線形モデルにフィッティングさせることとしてもよい。
これにより、仮の非線形モデルにフィッティングさせる時間を低減できる。
The correction term calculation means of the abnormality detection preprocessing device may be configured to fit a predetermined number of the distribution data selected from the distribution data determined not to follow a normal distribution to a plurality of temporary nonlinear models. Good.
Thereby, the time for fitting to the temporary nonlinear model can be reduced.
本発明は、上記の異常検出前処理装置と、前記異常検出前処理装置の前記選定手段によって選定された前記異常検出補正項に基づいて、正常異常の判定対象となる測定データである判定データを補正した補正判定データを算出し、前記補正判定データをマハラノビス距離に基づいて、異常か否かを判定する異常検出手段とを具備する異常検出装置を提供する。 The present invention provides determination data, which is measurement data to be determined as normal / abnormal, based on the abnormality detection preprocessing device and the abnormality detection correction term selected by the selection unit of the abnormality detection preprocessing device. Provided is an abnormality detection device comprising: an abnormality detection unit that calculates corrected correction determination data and determines whether the correction determination data is abnormal based on the Mahalanobis distance.
正常時の分布データに基づいて決定された異常検出補正項によって補正された補正判定データに基づいて、測定データが異常か否かを判定する。これにより、異常を精度よく検出することができる。 It is determined whether or not the measurement data is abnormal based on the correction determination data corrected by the abnormality detection correction term determined based on the normal distribution data. Thereby, abnormality can be detected with high accuracy.
本発明は、正常時に測定された所定期間内の2変数以上に関する分布データが、正規分布に従った分布になるか否かを判定する第1過程と、正規分布に従う分布でないと判定された場合に、前記分布データをフィッティングさせる複数の仮の非線形モデルと、それぞれの仮の前記非線形モデルの回帰直線との差を、前記分布データを補正する補正項として算出する第2過程と、前記補正項で補正した前記分布データが、最も正規分布に従う分布をもたらす仮の前記非線形モデルを、異常検出で使用する場合の異常検出モデルとして選定し、該異常検出モデルに基づいて算出された前記補正項を異常検出に用いる異常検出補正項として選定する第3過程とを有する異常検出前処理方法を提供する。 In the present invention, a first process for determining whether or not distribution data relating to two or more variables within a predetermined period measured in a normal state is a distribution according to a normal distribution, and a case where it is determined that the distribution is not a distribution according to a normal distribution A second step of calculating a difference between a plurality of provisional nonlinear models for fitting the distribution data and a regression line of each provisional nonlinear model as a correction term for correcting the distribution data; and the correction term The provisional nonlinear model that provides the distribution that most closely follows the normal distribution is selected as an abnormality detection model when used in abnormality detection, and the correction term calculated based on the abnormality detection model is There is provided an abnormality detection pre-processing method having a third process selected as an abnormality detection correction term used for abnormality detection.
本発明は、正常時に測定された所定期間内の2変数以上に関する分布データが、正規分布に従った分布になるか否かを判定する第1処理と、正規分布に従う分布でないと判定された場合に、前記分布データをフィッティングさせる複数の仮の非線形モデルと、それぞれの仮の前記非線形モデルの回帰直線との差を、前記分布データを補正する補正項として算出する第2処理と、前記補正項で補正した前記分布データが、最も正規分布に従う分布をもたらす仮の前記非線形モデルを、異常検出で使用する場合の異常検出モデルとして選定し、該異常検出モデルに基づいて算出された前記補正項を異常検出に用いる異常検出補正項として選定する第3処理とをコンピュータに実行させるための異常検出前処理プログラムを提供する。 In the present invention, a first process for determining whether or not distribution data relating to two or more variables within a predetermined period measured in a normal state is a distribution according to a normal distribution, and a case where it is determined that the distribution is not a distribution according to a normal distribution A second process for calculating a difference between a plurality of provisional nonlinear models for fitting the distribution data and a regression line of each provisional nonlinear model as a correction term for correcting the distribution data; The provisional nonlinear model that provides the distribution that most closely follows the normal distribution is selected as an abnormality detection model when used in abnormality detection, and the correction term calculated based on the abnormality detection model is Provided is an abnormality detection preprocessing program for causing a computer to execute a third process selected as an abnormality detection correction term used for abnormality detection.
本発明は、簡便で、かつ、精度よく、収集データの異常検出ができるという効果を奏する。 The present invention is advantageous in that it can easily and accurately detect an abnormality in collected data.
以下に、本発明に係る異常検出前処理装置および方法ならびにプログラム、それを備えた異常検出装置の実施形態について図面を参照して説明する。
また、本実施形態では、異常検出前処理装置10を、ガスタービンを監視する監視センターに設け、ガスタービンの異常の検出に用いる場合を想定して説明するが、本発明はこれに限定されない。
DESCRIPTION OF EMBODIMENTS Embodiments of an abnormality detection preprocessing apparatus and method and program according to the present invention and an abnormality detection apparatus including the same will be described below with reference to the drawings.
In the present embodiment, the abnormality
図1は、発電所に設けられるガスタービン設備31を監視センター30から監視する監視システム100の概略構成が示されている。監視センター30には、異常検出前処理装置10を備える異常検出装置20が備えられている。ガスタービン設備31と異常検出装置20とは、情報の授受可能にネットワーク32を介して接続されている。例えば、異常検出装置20は、ガスタービン設備31から所定のタイミングで送信されるガスタービンの運転データ(測定データ)、アラーム情報、および問い合わせ情報等を受信する。異常検出装置20は、取得した各種情報を記憶部(詳細は後述する)に記憶させる。本実施形態においては、ガスタービン設備31からネットワークを介した遠隔地の監視センター30に異常検出装置20を設けることとして説明しているが、異常検出装置20の位置はこれに限定されない。
FIG. 1 shows a schematic configuration of a
図2は、本実施形態に係る異常検出装置20の概略構成を示したブロック図である。
図2に示すように、本実施形態に係る異常検出装置20は、コンピュータシステム(計算機システム)であり、CPU(中央演算処理装置)11、RAM(Random Access Memory)等の主記憶装置12、補助記憶装置13、キーボードやマウスなどの入力装置14、及びディスプレイやプリンタなどの出力装置15、外部の機器と通信を行うことにより情報の授受を行う通信装置16などを備えている。
補助記憶装置13は、コンピュータ読取可能な記録媒体であり、例えば、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等である。この補助記憶装置13には、各種プログラム(例えば、異常検出前処理プログラム)が格納されており、CPU11が補助記憶装置13から主記憶装置12にプログラムを読み出し、実行することにより種々の処理を実現させる。
FIG. 2 is a block diagram showing a schematic configuration of the
As shown in FIG. 2, the
The
図3は、異常検出装置20が備える機能を展開して示した機能ブロック図である。図3に示されるように、異常検出装置20は、異常検出前処理装置10を備えている。異常検出前処理装置10は、判定部(判定手段)1と、補正項算出部(補正項算出手段)2と、選定部(選定手段)3と、記憶部4とを備えている。
FIG. 3 is a functional block diagram showing the functions provided in the
次に、上述した異常検出前処理装置10が備える各部において実行される処理内容について図3を参照して説明する。
記憶部4は、ガスタービン設備31の複数箇所に設けられる計測器から得られた所定期間内の測定データ(運転データ)が記憶されている。測定データには、例えば、ガスタービンの起動時など、正常データが特にバラつく非定常的な状態で測定された所定期間内の運転データと、ガスタービン設備の正常異常の判定対象となる運転データとが含まれる。また、本実施形態においては、ガスタービン設備の複数箇所とは、例えば、燃焼器、圧縮機等であり、測定データは、それら複数箇所から得られる温度や圧力値等の情報である。
Next, processing contents executed in each unit included in the above-described abnormality detection preprocessing
The
判定部1は、正常時に測定された所定期間内の2変数以上に関する分布データが、正規分布に従った分布になるか否かを判定する。例えば、判定部1は、記憶部4に記憶されているガスタービンの複数箇所から取得された測定データのうち、所定期間内の2箇所から取得された測定データの2変数を抽出した分布を分布データとし、正規確率プロット(例えば、qqプロット)に基づいて正規分布に従った分布か否かを判定する。正規確率プロットでは、測定データが正規分布している場合に、測定データを示す点がほぼ直線上に並
ぶ。なお、本実施形態においては、複数箇所から取得された測定データのうち2箇所(2変数)の測定データにより2次元の分布データを生成することとして説明するが、本発明はこれに限定されず、n箇所(n変数)の測定データによりn次元の分布データが生成される場合にも適用される。
The
補正項算出部2は、正規分布に従う分布でないと判定された場合に、分布データをフィッティングさせる複数の仮の非線形モデルと、それぞれの仮の非線形モデルの回帰分析の結果とに基づいて、分布データを補正する補正項を算出する。なお、補正項算出部2は、正規分布に従う分布でないと判定された分布データの全てを仮の非線形モデルにフィッティングさせてもよいが、好ましくは、全ての分布データのうち、所定数選定された分布データを複数の仮の非線形モデルにフィッティングさせる。これにより、フィッティングさせる対象の分布データが少なくなり、フィッティングにかかる時間が低減できる。
具体的には、補正項算出部2は、仮の非線形モデルと、仮の非線形モデルの回帰直線との差を補正項として算出する。
When it is determined that the distribution does not follow the normal distribution, the correction
Specifically, the correction
以下に、仮の非線形モデルを2次関数y=fN(x)とする場合を例に挙げて説明する。
図4は、2次関数y=fN(x)と、この2次関数の回帰直線y=fL(x)=ax+bとを示している。補正項算出部2は2次関数と回帰直線との偏差を下記(1)式により算出する。
Δyi=fN(xi)−(axi+b) (1)
分布データ(xi,yi)を補正する場合には、上記(1)式により決定されたΔyiを補正項とし、以下(2)式のように補正してyi(new)に変換する。
yi(new)=yi−Δyi (2)
Hereinafter, a case where the provisional nonlinear model is a quadratic function y = f N (x) will be described as an example.
FIG. 4 shows a quadratic function y = f N (x) and a regression line y = f L (x) = ax + b of this quadratic function. The correction
Δyi = f N (xi) − (axi + b) (1)
In the case of correcting the distribution data (xi, yi), Δyi determined by the above equation (1) is used as a correction term, and is corrected as shown in the following equation (2) and converted into yi (new).
yi (new) = yi−Δyi (2)
このように、非線形モデルと線形モデルの差分を補正項として分布データを補正することにより、非線形に分布していた分布データを線形の主軸上に確実に分布させることができ、正規分布により従う分布とすることができる。
選定部3は、補正項で補正した分布データが、最も正規分布に従う分布をもたらす仮の非線形モデルを、異常検出で使用する場合の異常検出モデルとして選定し、異常検出モデルに基づいて算出された補正項を異常検出に用いる異常検出補正項として選定する。換言すると、選定部3は、仮の非線形モデル毎に算出された補正項によって補正した分布データの正規分布性をそれぞれ比較し、最も正規分布性を持つ仮の非線形モデルとその仮の非線形モデルから算出された補正項とを、異常検出に用いる非線形モデルおよび補正項として選定する。
In this way, by correcting the distribution data using the difference between the non-linear model and the linear model as a correction term, the distribution data distributed non-linearly can be reliably distributed on the linear main axis. It can be.
The
異常検出装置20は、異常検出部(異常検出手段)21を備えている。
異常検出部21は、記憶部4から判定データを読み出し、異常検出前処理装置10の選定部3によって選定された異常検出補正項に基づいて判定データを補正した補正判定データを算出し、補正判定データをマハラノビス距離に基づいて異常か否かを判定する。また、異常検出部21は、マハラノビス距離に閾値を設け、閾値以下であれば正常とし、閾値より大きい場合には異常として判定する。
The
The
マハラノビス距離を用いた判定とは、ある集団の特徴量(多変数)を一つのパラメータ(マハラノビス距離)で表し、ある測定データの良・不良を、健全な集団(正常時の測定データ)の基本データからの距離で評価する方法である。ある測定データが不良であれば、健全な集団からの距離は大きくなり、測定データが良であれば健全な集団からの距離は小さくなる。 Judgment using Mahalanobis distance refers to the characteristic quantity (multivariate) of a certain group with one parameter (Mahalanobis distance), and the good / bad of certain measurement data is the basis of a healthy group (normal measurement data) This is an evaluation method based on the distance from the data. If some measurement data is bad, the distance from the healthy group is large, and if the measurement data is good, the distance from the healthy group is small.
例えば、k次元のマハラノビス距離MD2は、以下(3)式により求められる。ここで、kは項目数、i,jは1〜k、αijは相関行列の逆行列のi,j成分、mi、mj、σi、σjはそれぞれ単位空間における平均値および標準偏差とする。
以下に本実施形態に係る異常検出前処理装置10および異常検出装置20の作用について、図1から図7を用いて説明する。
ガスタービン設備31からガスタービンの運転に関する運転データが所定のタイミングで遠隔地の監視センター30に出力され、監視センター30の異常検出装置20によって運転データが取得される。異常検出装置20は、取得した運転データを記憶部4に記憶させる(図5のステップSA1)。
The operation of the abnormality
Operation data relating to the operation of the gas turbine is output from the
監視員によって、2変数(例えば、ガスタービン出力(MW)とブレードパス温度(℃))に関する異常検出の開始指示が入力されると、正常時に測定された所定期間内の「ガスタービン出力(MW)」と「ブレードパス温度(℃)」の2変数が選定される、記憶部4から選定された2変数が抽出され、2変数(2次元)に関する分布データが、正規分布に従った分布になるか否かが判定される(図5のステップSA2)。正規分布に従った分布になると判定された場合には、正常時のデータの補正はしないので、異常検出前処理装置10の処理を終了し、異常検出装置20によりマハラノビス距離に基づいた正常異常の判定を行う。
When an abnormality detection start instruction regarding two variables (for example, a gas turbine output (MW) and a blade path temperature (° C.)) is input by a monitor, the “gas turbine output (MW) within a predetermined period measured during normal operation”. ) ”And“ blade path temperature (° C.) ”are selected, the two variables selected from the
分布データが正規分布に従った分布でないと判定された場合には、正規分布に従う分布でないと判定された分布データのうち所定数の分布データが選定され(図5のステップSA3)、選定された分布データを複数の仮の非線形モデルにフィッティングさせ(図5のステップSA4)、それぞれの仮の非線形モデルの回帰直線との差に基づいて、分布データを補正する補正項がそれぞれ算出される(図5のステップSA5)。算出された補正項によって分布データが補正される(図5のステップSA6)。これにより、正規分布に従った分布でないと判定された分布データも、正規分布に従う方向の分布に変換される。 When it is determined that the distribution data is not a distribution according to the normal distribution, a predetermined number of distribution data is selected from the distribution data determined not to be a distribution according to the normal distribution (step SA3 in FIG. 5). The distribution data is fitted to a plurality of temporary nonlinear models (step SA4 in FIG. 5), and correction terms for correcting the distribution data are calculated based on the difference from the regression line of each temporary nonlinear model (FIG. 5). 5 step SA5). The distribution data is corrected by the calculated correction term (step SA6 in FIG. 5). Thereby, the distribution data determined not to be a distribution according to the normal distribution is also converted into a distribution in a direction according to the normal distribution.
補正後の複数の分布データが正規分布に従う分布であるか判定され、最も正規分布に従う分布をもたらす非線形モデルが異常検出モデルとして選定され、この異常検出モデルから算出された補正項が異常検出補正項として選定され(図5のステップSA7)、異常検出部21に出力され、異常検出前処理装置10の処理を終了する。
異常検出装置20の異常検出部21は、記憶部4から判定データを読み出し、選定部3から取得した異常検出補正項に基づいて判定データを補正した補正判定データが算出される。補正判定データがマハラノビス距離の所定閾値と比較され、閾値以下であれば正常とし、閾値より大きい場合には異常として判定される。
It is determined whether a plurality of distribution data after correction is a distribution according to a normal distribution, a nonlinear model that brings the distribution that most closely follows a normal distribution is selected as an abnormality detection model, and a correction term calculated from this abnormality detection model is an abnormality detection correction term. Is selected (step SA7 in FIG. 5), and is output to the
The
図6には、異常検出前処理装置10によって分布データの補正前と補正後との比較データが一例として示されている。ここでは、非線形モデルとして、二次元モデルが用いられている場合を例としている。
図6(a)に、記憶部4から読み出された正常時の分布データ(図示略)の、正規確率プロットによる正規分布性が示されている。正規分布に従う分布であるか否かの判定により、正規分布に従った分布でないと判定された場合に、記憶部4から読み出された正常時の分布データのうち所定数のデータを、2次元モデルでフィッティングしたのが図6(b)である。
In FIG. 6, comparison data before and after correction of distribution data by the abnormality
FIG. 6A shows the normal distribution of normal distribution data (not shown) read from the
これを回帰分析して求められた補正項により記憶部4から読み出した分布データを補正すると(2次元モデルで補正)、図6(c)が得られた。さらに、図6(c)を正規確率プロットすることにより、図6(d)が得られた。図6(a)と図6(d)の上部に記載の数値は、正規分布性を示す値であり、小さいほど正規分布に従うことを意味している。これにより、分布データ補正前の図6(a)より、2次元モデルで分布データが補正された補正後の図6(d)の方が、正規分布らしさが向上していることがわかる。
When the distribution data read from the
同様に、図7(a)から(d)には、非線形モデルとして三角関数モデルが用いられた場合の補正前から補正後の比較データである。
図7(a)は、分布データ補正前の正規確率プロットであり、図7(d)は三角関数モデルで分布データ補正後の正規確率プロットを示している。これにおいても、図7(a)より図7(d)の方が、正規分布らしさが向上していることがわかる。
Similarly, FIGS. 7A to 7D show comparison data before and after correction when a trigonometric function model is used as the nonlinear model.
FIG. 7A is a normal probability plot before distribution data correction, and FIG. 7D shows a normal probability plot after distribution data correction using a trigonometric function model. Also in this case, it can be seen that the normal distribution is more improved in FIG. 7D than in FIG.
以上説明してきたように、本実施形態に係る異常検出前処理装置10および方法ならびにプログラム、それを備えた異常検出装置20によれば、正常時に測定された所定期間内の2変数に関する分布データが、正規分布に従った分布になるか否かを判定され、正規分布に従う分布でないと判定された分布データのうち所定数選定された分布データが仮の非線形モデルにフィッティングされ、仮の非線形モデルと回帰直線との差によって、分布データを補正する補正項が算出される。この補正項により補正された分布データが、最も正規分布に従う分布をもたらす仮の非線形モデルを、異常検出で使用する場合の異常検出モデルとして選定され、異常検出モデルに基づいて算出された補正項を異常検出に用いる補正項として選定される。
As described above, according to the abnormality
このように、正常データの正規分布性を定量的に評価し、正常時に測定された分布データに基づいて、異常検出モデルおよび異常検出に用いる補正項を選定するので、正常時に得られる測定データから逸脱したデータ(つまり、異常データ)を精度よく検出することができる。また、正常時に測定されたデータのみを用いるので正常データと異常データとの両方を用いる場合と比較して簡便である。
また、正常データが正規分布から離れていると判定されても、異常データの特徴を変えることなく、正常データを正規分布に従わせるように補正できる。
In this way, normal distribution of normal data is quantitatively evaluated, and based on the distribution data measured at normal time, an abnormality detection model and a correction term used for abnormality detection are selected. Deviated data (that is, abnormal data) can be detected with high accuracy. In addition, since only data measured at normal time is used, it is simpler than the case of using both normal data and abnormal data.
Even if it is determined that the normal data is away from the normal distribution, the normal data can be corrected to follow the normal distribution without changing the characteristics of the abnormal data.
従来のように信号値を加算して平均値を求める等の操作をして正規分布に従わせる手法とは異なり、本発明は、非線形モデルを線形モデルに回帰させることによって、正規分布に従うか否かが判定できるので、元となる分布データの特徴が失われることがない。
また、異常検出前処理装置10により補正項がひとたび選定されると、異常検出装置20は、その補正項を用いて判定データを変換し、所定の2変数に対する判定データの正常異常を判定することができるので、時間経過に伴うそこからの多少の変化や、判定データの判別そのものには大きな計算負荷がかからず、簡便に処理できる。
Unlike the conventional method of adding a signal value and calculating an average value to follow a normal distribution, the present invention regresses a nonlinear model to a linear model to determine whether or not to follow a normal distribution. Therefore, the characteristics of the original distribution data are not lost.
Further, once the correction term is selected by the abnormality
また、上記実施形態においては、異常検出装置20は、異常検出部21と異常検出前処理装置10とを1つの装置に含めることとして説明していたが、これに限定されず、異常検出部21と異常検出前処理装置10とが異なる装置(コンピュータシステム)に設けられ、情報の授受可能に接続されることとしてもよい。
また、上記実施形態においては、監視員により選定された2変数に関して正規分布に従うか否かの判定と補正項算出を開始していたが、これに限定されず、記憶部4に記憶されている複数箇所(例えば、200箇所)から収集した測定データを全通りの組み合わせの2次元ペアずつ正規分布性の判定と補正項の算出を行う処理を予め行い、その結果を記憶部4に記憶させ、結果だけを適宜読み出すこととしてもよい。
Moreover, in the said embodiment, although the
In the above-described embodiment, the determination whether or not to follow the normal distribution and the calculation of the correction term for the two variables selected by the monitoring staff has been started. However, the present invention is not limited to this, and is stored in the
なお、上記実施形態においては、複数の非線形モデルは、物理的に異なるモデル(例えば、2次関数と三角関数など)を多数用意しておき、その中のパラメータが最適か否かも含めて最も正規分布に従う非線形モデルを選定することとして説明していたが、これに限定されない。例えば、非線形モデルを1つの遺伝子として、モデル同士の交配(合成)や変位(式の一部を変換)などを組み込む、所謂遺伝的アルゴリズム(GE:Genetic Algorithm)による非線形モデルの最適化手法であってもよいこととする。 In the above embodiment, a plurality of nonlinear models (for example, a quadratic function and a trigonometric function) are prepared as a plurality of non-linear models, and the most regular including the parameters in them are optimal. Although described as selecting a nonlinear model according to the distribution, the present invention is not limited to this. For example, this is a method for optimizing a nonlinear model by a so-called genetic algorithm (GE) that incorporates mating (synthesis) and displacement (transformation of a part of an expression) between models using a nonlinear model as one gene. It may be possible.
上記実施形態においては、分布データが、y=f(x)である変数を2変数とした2次元パターンである場合を例に挙げて説明していたが、f(x)=0のn個の変数としたn次元パターンである場合の、補正項の算出方法について、図8を用いて説明する(xはn次元ベクトル)。
a,bはn次元ベクトルとし、tは直線の1次元パラメータとし、回帰直線をx=at+bとする。f(x)=0の中心cN、at+bの中心b(t=0)をデータ群の中心近傍に取ることとする。f(x)=0をcNから単位長さのベクトル{df/ds_i}で、折れ線近似する。ここで、sは曲線の1次元パラメータであり、プラス側およびマイナス側に動くものとする。
In the above-described embodiment, the case where the distribution data is a two-dimensional pattern in which the variable of y = f (x) is two variables has been described as an example, but n pieces of f (x) = 0 are described. A correction term calculation method in the case of an n-dimensional pattern as a variable of x will be described with reference to FIG. 8 (x is an n-dimensional vector).
a and b are n-dimensional vectors, t is a linear one-dimensional parameter, and a regression line is x = at + b. The center cN of f (x) = 0 and the center b (t = 0) of at + b are set near the center of the data group. F (x) = 0 is approximated by a polygonal line from cN to a unit length vector {df / ds_i }. Here, s is a one-dimensional parameter of the curve and moves to the plus side and the minus side.
各折れ線成分について、直線の成分{at_i+b}に移動する変換R_iを算出する。求められたR_iを補正項とし、各正常データについて最も近い折れ線#iを求め、データxをR_ixで変換する。
このように、本発明は、分布データが何次元のパターンであっても、簡便に補正項を求めて正規分布に従う分布とし、マハラノビス距離の判定に馴染みのよい分布が得られる。
For each broken line component, a transformation R_i that moves to a straight line component { at_i + b} is calculated. The obtained R_i is used as a correction term, the nearest broken line #i is obtained for each normal data, and the data x is converted by R_ix .
As described above, according to the present invention, even if the distribution data is a pattern of any dimension, a correction term is easily obtained and the distribution conforms to the normal distribution, and a distribution familiar to the determination of the Mahalanobis distance is obtained.
1 判定部
2 補正項算出部
3 選定部
4 記憶部
10 異常検出前処理装置
20 異常検出装置
21 異常検出部
100 監視システム
DESCRIPTION OF
Claims (5)
正規分布に従う分布でないと判定された場合に、前記分布データをフィッティングさせる複数の仮の非線形モデルと、それぞれ仮の前記非線形モデルの回帰直線との差を、前記分布データを補正する補正項として算出する補正項算出手段と、
前記補正項で補正した前記分布データが、最も正規分布に従う分布をもたらす仮の前記非線形モデルを、異常検出で使用する場合の異常検出モデルとして選定し、該異常検出モデルに基づいて算出された前記補正項を異常検出に用いる異常検出補正項として選定する選定手段と
を具備する異常検出前処理装置。 The distribution data related to two or more variables in a predetermined period of time that is measured during normal, determining means for determining whether or not made a distribution in accordance with the normal distribution,
When it is determined that the distribution does not conform to the normal distribution , a difference between a plurality of provisional nonlinear models for fitting the distribution data and a regression line of each provisional nonlinear model is calculated as a correction term for correcting the distribution data. Correction term calculation means for
The distribution data corrected by the correction term is selected as an abnormality detection model when using the provisional nonlinear model that yields the distribution that follows the most normal distribution as an abnormality detection model, and is calculated based on the abnormality detection model. An abnormality detection pre-processing apparatus comprising: selection means for selecting a correction term as an abnormality detection correction term used for abnormality detection.
前記異常検出前処理装置の前記選定手段によって選定された前記異常検出補正項に基づいて、正常異常の判定対象となる測定データである判定データを補正した補正判定データを算出し、前記補正判定データをマハラノビス距離に基づいて、異常か否かを判定する異常検出手段と
を具備する異常検出装置。 The abnormality detection pre-processing device according to claim 1 or 2 ,
Based on the abnormality detection correction term selected by the selection means of the abnormality detection preprocessing apparatus, correction correction data obtained by correcting determination data that is measurement data to be determined as normal abnormality is calculated, and the correction determination data An abnormality detection device comprising abnormality detection means for determining whether or not there is an abnormality based on the Mahalanobis distance.
正規分布に従う分布でないと判定された場合に、前記分布データをフィッティングさせる複数の仮の非線形モデルと、それぞれの仮の前記非線形モデルの回帰直線との差を、前記分布データを補正する補正項として算出する第2過程と、
前記補正項で補正した前記分布データが、最も正規分布に従う分布をもたらす仮の前記非線形モデルを、異常検出で使用する場合の異常検出モデルとして選定し、該異常検出モデルに基づいて算出された前記補正項を異常検出に用いる異常検出補正項として選定する第3過程と
を有する異常検出前処理方法。 A first step of determining whether or not distribution data relating to two or more variables within a predetermined period measured in a normal period is a distribution according to a normal distribution;
When it is determined that the distribution does not follow the normal distribution , a difference between a plurality of provisional nonlinear models for fitting the distribution data and a regression line of each provisional nonlinear model is used as a correction term for correcting the distribution data. A second process to calculate,
The distribution data corrected by the correction term is selected as an abnormality detection model when using the provisional nonlinear model that yields the distribution that follows the most normal distribution as an abnormality detection model, and is calculated based on the abnormality detection model. And a third step of selecting a correction term as an abnormality detection correction term used for abnormality detection.
正規分布に従う分布でないと判定された場合に、前記分布データをフィッティングさせる複数の仮の非線形モデルと、それぞれの仮の前記非線形モデルの回帰直線との差を、前記分布データを補正する補正項として算出する第2処理と、
前記補正項で補正した前記分布データが、最も正規分布に従う分布をもたらす仮の前記非線形モデルを、異常検出で使用する場合の異常検出モデルとして選定し、該異常検出モデルに基づいて算出された前記補正項を異常検出に用いる異常検出補正項として選定する第3処理と
をコンピュータに実行させるための異常検出前処理プログラム。 A first process for determining whether or not distribution data relating to two or more variables within a predetermined period measured in a normal period is a distribution according to a normal distribution;
When it is determined that the distribution does not follow the normal distribution , a difference between a plurality of provisional nonlinear models for fitting the distribution data and a regression line of each provisional nonlinear model is used as a correction term for correcting the distribution data. A second process to calculate;
The distribution data corrected by the correction term is selected as an abnormality detection model when using the provisional nonlinear model that yields the distribution that follows the most normal distribution as an abnormality detection model, and is calculated based on the abnormality detection model. The abnormality detection pre-processing program for making a computer perform the 3rd process which selects a correction term as an abnormality detection correction term used for abnormality detection.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012222318A JP6129508B2 (en) | 2012-10-04 | 2012-10-04 | Anomaly detection pre-processing apparatus and method, program, and anomaly detection apparatus having the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012222318A JP6129508B2 (en) | 2012-10-04 | 2012-10-04 | Anomaly detection pre-processing apparatus and method, program, and anomaly detection apparatus having the same |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014074659A JP2014074659A (en) | 2014-04-24 |
JP6129508B2 true JP6129508B2 (en) | 2017-05-17 |
Family
ID=50748895
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012222318A Active JP6129508B2 (en) | 2012-10-04 | 2012-10-04 | Anomaly detection pre-processing apparatus and method, program, and anomaly detection apparatus having the same |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6129508B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11789436B2 (en) | 2020-01-06 | 2023-10-17 | Mitsubishi Heavy Industries, Ltd. | Diagnosing device, diagnosing method, and program |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6062581B1 (en) * | 2016-01-14 | 2017-01-18 | 三菱日立パワーシステムズ株式会社 | Plant analysis apparatus, plant analysis method, and program |
JP5973096B1 (en) * | 2016-01-14 | 2016-08-23 | 三菱日立パワーシステムズ株式会社 | Plant analysis apparatus, plant analysis method, and program |
WO2024084826A1 (en) * | 2022-10-17 | 2024-04-25 | 三菱重工業株式会社 | Data processing method, data diagnosis method, and data processing program |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3137393B2 (en) * | 1991-11-25 | 2001-02-19 | 三菱重工業株式会社 | Welding condition monitoring device |
JP2006018681A (en) * | 2004-07-02 | 2006-01-19 | Matsushita Electric Ind Co Ltd | Process control method |
JP4856993B2 (en) * | 2006-03-14 | 2012-01-18 | 株式会社日立ハイテクノロジーズ | Self-diagnosis type automatic analyzer |
-
2012
- 2012-10-04 JP JP2012222318A patent/JP6129508B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11789436B2 (en) | 2020-01-06 | 2023-10-17 | Mitsubishi Heavy Industries, Ltd. | Diagnosing device, diagnosing method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP2014074659A (en) | 2014-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101903283B1 (en) | Automatic diagnosis system and automatic diagnosis method | |
Xu et al. | Advanced data collection and analysis in data-driven manufacturing process | |
WO2018138880A9 (en) | Model parameter value estimation device and estimation method, program, recording medium with program recorded thereto, and model parameter value estimation system | |
US9122273B2 (en) | Failure cause diagnosis system and method | |
US7953577B2 (en) | Method and apparatus for improved fault detection in power generation equipment | |
JP6658250B2 (en) | Error diagnosis method, error diagnosis device, and error diagnosis program | |
JP5901140B2 (en) | Methods, computer programs, and systems for interpolating sensor data for high system availability. | |
JP7040851B2 (en) | Anomaly detection device, anomaly detection method and anomaly detection program | |
JP6129508B2 (en) | Anomaly detection pre-processing apparatus and method, program, and anomaly detection apparatus having the same | |
JP6989398B2 (en) | Failure diagnostic device, failure diagnosis method, and failure diagnosis program | |
JPWO2016195092A1 (en) | Anomaly detector | |
KR20190025473A (en) | Apparatus and Method for Predicting Plant Data | |
JP2020027342A (en) | Information processing apparatus, monitoring device and information processing method | |
JP7127305B2 (en) | Information processing device, information processing method, program | |
JP2017010232A (en) | Plant diagnostic device and plant diagnostic method | |
US20200410042A1 (en) | Abnormality detection device, abnormality detection method, and non-transitory computer-readable medium | |
US11989013B2 (en) | Abnormality detection apparatus, abnormality detection system, and learning apparatus, and methods for the same and non-temporary computer-readable medium storing the same | |
CN113987871B (en) | Online identification method for damage of aero-engine blade | |
JP6597453B2 (en) | Abnormality diagnosis method, abnormality diagnosis device, and abnormality diagnosis program | |
JP2016139274A (en) | Malfunction diagnosis method and malfunction diagnosis system | |
WO2019003703A1 (en) | Diagnostic device and diagnostic method | |
JP4611061B2 (en) | Detector calibration support apparatus and method | |
US20180276322A1 (en) | Failure diagnosis apparatus, monitoring apparatus, failure diagnosis method and recording medium | |
Tian et al. | Statistical process control for multistage processes with non-repeating cyclic profiles | |
JP5948998B2 (en) | Abnormality diagnosis device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150821 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160809 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161011 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170314 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170412 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6129508 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |