JP2005267474A - マハラノビス距離を利用した異常原因診断方法及びプログラム - Google Patents
マハラノビス距離を利用した異常原因診断方法及びプログラム Download PDFInfo
- Publication number
- JP2005267474A JP2005267474A JP2004081781A JP2004081781A JP2005267474A JP 2005267474 A JP2005267474 A JP 2005267474A JP 2004081781 A JP2004081781 A JP 2004081781A JP 2004081781 A JP2004081781 A JP 2004081781A JP 2005267474 A JP2005267474 A JP 2005267474A
- Authority
- JP
- Japan
- Prior art keywords
- value
- feature
- reference data
- distance
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005856 abnormality Effects 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000004364 calculation method Methods 0.000 claims abstract description 29
- 238000003909 pattern recognition Methods 0.000 claims abstract description 10
- 239000011159 matrix material Substances 0.000 claims description 30
- 238000003745 diagnosis Methods 0.000 claims description 19
- 230000008859 change Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 17
- 238000007689 inspection Methods 0.000 description 9
- 230000002159 abnormal effect Effects 0.000 description 8
- 230000007704 transition Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000005259 measurement Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000002405 diagnostic procedure Methods 0.000 description 3
- 238000000018 DNA microarray Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Images
Landscapes
- Testing And Monitoring For Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】 マハラノビス距離を利用したパターン認識における異常原因診断を、少ない計算処理によって実現する方法を提供する。
【解決手段】 定常状態にある対象からマハラノビス空間を求めるステップと、診断しようとする対象から特徴量を抽出してマハラノビス距離(MD)を求めるステップと、距離要素値を計算するステップと、i番目の要素について距離要素値と他の要素に対する相関係数との積の絶対値を計算するステップと、絶対値を計算するステップの計算結果の中から、要素ごとの最大値を抽出するステップとを含むことを特徴とする。
【選択図】 図1
【解決手段】 定常状態にある対象からマハラノビス空間を求めるステップと、診断しようとする対象から特徴量を抽出してマハラノビス距離(MD)を求めるステップと、距離要素値を計算するステップと、i番目の要素について距離要素値と他の要素に対する相関係数との積の絶対値を計算するステップと、絶対値を計算するステップの計算結果の中から、要素ごとの最大値を抽出するステップとを含むことを特徴とする。
【選択図】 図1
Description
本発明は、マハラノビス距離を利用した異常原因診断方法及びプログラムに関する。本発明の異常原因診断方法及びプログラムは、機械、設備等の検査、経済分野での状態推移予測、マーケティング分野での状態推移予測や顧客嗜好の分析、バイオテクノロジー分野でのDNAチップの解析結果分析など、広範な分野において使用することができる。
機械、設備等の検査や経済分野での状態推移予測などを行う方法として、マハラノビス距離を適用するマハラノビス・タグチ法(Mahalanobis−Taguchi System,以下「MTS法」という)が知られている。MTS法の考え方は、以下の通りである。
(1)まず、現象の定常的な状態を表す基準データ(例えば、機械、設備等の検査では、温度や圧力などの計測データ)を、適当な数量収集する。ここで、「定常的な状態」とは、機械、設備等の検査の場合には、正常な稼働状態を意味し、状態推移予測の場合には、状態が正常に推移している状態を意味する。これらの定常的な状態の定義は、例えば設備検査の専門家等が行う。
(2)次いで、基準データに基づいて、特徴量を定める。本明細書において「特徴量」とは、診断しようとする対象のパターン認識に係わる特徴を表す量を意味し、具体的には、計測データ自体(例えば、機械の検査であれば、温度や圧力等、経済状態推移予測であれば、株価や公定歩合等)、計測データの変化の度合いを表す量、計測データを平準化したデータ(例えば、移動平均値)などがあげられる。なお、パターン認識とは、対象の性質や状態を説明したり、或いは説明すると考えられる1以上の変数即ち特徴量から、予め定義された1以上のカテゴリへの対象の帰属度を計算することである。
(3)次いで、基準データの特徴量間の全ての相関に基づいて相関行列を計算し、更に該相関行列の逆行列を計算する。この逆行列が、詳細には後述する数式上のマハラノビス空間となる。
(4)次いで、診断しようとする対象について特徴量を抽出し、該特徴量と(3)で求めた逆行列を用いて、診断しようとする対象のマハラノビス距離(Mahalanobis Distance,以下「MD」という)を求める。
(5)そして、MDが1付近又はそれ以下の小さな値である場合には、診断対象のデータは基準データの仲間即ち定常状態であると判定し、MDが大きな値である場合には、対象データは定常状態ではない(即ち、異常である)と判定する。
(6)さらに、診断対象データが異常であると判定された場合には、その原因がどの特徴量にあるのかを、2水準系の直交表を用いて探索する(即ち、異常診断を行う)。MTS法が、他の一般的なMDを用いた診断、予測への応用方法と異なる大きな点の1つが、直交表による異常原因診断を提供していることである。
(1)まず、現象の定常的な状態を表す基準データ(例えば、機械、設備等の検査では、温度や圧力などの計測データ)を、適当な数量収集する。ここで、「定常的な状態」とは、機械、設備等の検査の場合には、正常な稼働状態を意味し、状態推移予測の場合には、状態が正常に推移している状態を意味する。これらの定常的な状態の定義は、例えば設備検査の専門家等が行う。
(2)次いで、基準データに基づいて、特徴量を定める。本明細書において「特徴量」とは、診断しようとする対象のパターン認識に係わる特徴を表す量を意味し、具体的には、計測データ自体(例えば、機械の検査であれば、温度や圧力等、経済状態推移予測であれば、株価や公定歩合等)、計測データの変化の度合いを表す量、計測データを平準化したデータ(例えば、移動平均値)などがあげられる。なお、パターン認識とは、対象の性質や状態を説明したり、或いは説明すると考えられる1以上の変数即ち特徴量から、予め定義された1以上のカテゴリへの対象の帰属度を計算することである。
(3)次いで、基準データの特徴量間の全ての相関に基づいて相関行列を計算し、更に該相関行列の逆行列を計算する。この逆行列が、詳細には後述する数式上のマハラノビス空間となる。
(4)次いで、診断しようとする対象について特徴量を抽出し、該特徴量と(3)で求めた逆行列を用いて、診断しようとする対象のマハラノビス距離(Mahalanobis Distance,以下「MD」という)を求める。
(5)そして、MDが1付近又はそれ以下の小さな値である場合には、診断対象のデータは基準データの仲間即ち定常状態であると判定し、MDが大きな値である場合には、対象データは定常状態ではない(即ち、異常である)と判定する。
(6)さらに、診断対象データが異常であると判定された場合には、その原因がどの特徴量にあるのかを、2水準系の直交表を用いて探索する(即ち、異常診断を行う)。MTS法が、他の一般的なMDを用いた診断、予測への応用方法と異なる大きな点の1つが、直交表による異常原因診断を提供していることである。
図表と数式を用いて、MTS法の手順をより詳細に説明する。基準データの特徴量は、基準データのサンプル数をn、特徴量の数をkとすると、表1に示されるように整理される。なお、表1において、mは各特徴量の平均値、σは各特徴量の標準偏差である。
次いで、次式を用いて、各特徴量の規準化を行う。
Yij=(yij−mj )/σj
ここで、i=1,2,・・・,n
j=1,2,・・・,k
この規準化により、表1は、表2のように書き換えられる。
規準化すると、各特徴量の平均値は0、各特徴量の標準偏差は1になる。
表2のように規準化された基準データを用いて、各々の特徴間の相関、即ちi列とj列のデータの相関係数を、下記の式(1)により計算する。
このようにして全ての相関係数を計算すると、下記の式(2)のような相関行列が作成される。
このようにして計算された相関行列について、逆行列R-1を計算して、下記の式(3)を得る。
Yij=(yij−mj )/σj
ここで、i=1,2,・・・,n
j=1,2,・・・,k
この規準化により、表1は、表2のように書き換えられる。
表2のように規準化された基準データを用いて、各々の特徴間の相関、即ちi列とj列のデータの相関係数を、下記の式(1)により計算する。
次いで、診断しようとする対象から抽出した特徴量を
y=[y1 y2 ・・・・・ yk ]
のようにベクトルで表す。
そして、各成分を基準データの平均値m及び標準偏差σを用いて
Yi =(yi −mi )/σi
により規準化する。
したがって、診断しようとする対象のデータは
Y=[Y1 Y2 ・・・・・ Yk ]
のように表される。
診断しようとする対象のMDは、YT をYの転置行列として、下記の式(4A)で求められる。
y=[y1 y2 ・・・・・ yk ]
のようにベクトルで表す。
そして、各成分を基準データの平均値m及び標準偏差σを用いて
Yi =(yi −mi )/σi
により規準化する。
したがって、診断しようとする対象のデータは
Y=[Y1 Y2 ・・・・・ Yk ]
のように表される。
診断しようとする対象のMDは、YT をYの転置行列として、下記の式(4A)で求められる。
以上のようにして得られたMDは、0から∞までの値を取り得るが、その値が1付近の小さな値であれば、基準データの仲間、即ち定常的な状態である確率が高く、その値が大きい程、定常的な状態である確率が小さくなる。MDのそのような性質に基づいて、MDから正常又は異常の判定を行う。
次に、診断しようとする対象のデータが「異常」と判定された場合に、原因がいずれの特徴量にあるのかの診断方法について説明する。
診断しようとする対象のデータのMDが大きな値を示し、異常と判定された場合、その原因は、対象の或る特徴量が定常的な値とは異なる値となっているためであり、1個以上の特徴量における個々の値、又は特徴量の組合せが、定常的な状態と異なる場合が考えられる。
個々の値が原因である場合には、その原因の探索は比較的容易である。何故ならば、個々の値について基準データの平均値と標準偏差に基づいて、どの特徴量が異常であるかを容易に求めることができるからである。
一方、複数の特徴量が相関関係をもって原因となる場合には、その探索は容易ではない。複数の特徴量の関係が原因となる場合の例を、図6に示す。図6では、例えば多数存在する特徴量の中から或る2つの特徴量の組を採り上げている。この場合、基準データが◆印で示される分布をもっており、強い正の相関がある。MTS法では、基準データからの距離をMDとして求めるが、MDが相関を考慮した距離であるため、例えば対象がPの位置にあるとすると、この対象のMDは大きくなり、従って“異常”と判定されることになる。しかし、図6のXi 軸とXj 軸における位置を個々に眺めただけでは、Pが◆印群と離れているか否かを判定することはできない。
診断しようとする対象のデータのMDが大きな値を示し、異常と判定された場合、その原因は、対象の或る特徴量が定常的な値とは異なる値となっているためであり、1個以上の特徴量における個々の値、又は特徴量の組合せが、定常的な状態と異なる場合が考えられる。
個々の値が原因である場合には、その原因の探索は比較的容易である。何故ならば、個々の値について基準データの平均値と標準偏差に基づいて、どの特徴量が異常であるかを容易に求めることができるからである。
一方、複数の特徴量が相関関係をもって原因となる場合には、その探索は容易ではない。複数の特徴量の関係が原因となる場合の例を、図6に示す。図6では、例えば多数存在する特徴量の中から或る2つの特徴量の組を採り上げている。この場合、基準データが◆印で示される分布をもっており、強い正の相関がある。MTS法では、基準データからの距離をMDとして求めるが、MDが相関を考慮した距離であるため、例えば対象がPの位置にあるとすると、この対象のMDは大きくなり、従って“異常”と判定されることになる。しかし、図6のXi 軸とXj 軸における位置を個々に眺めただけでは、Pが◆印群と離れているか否かを判定することはできない。
診断に関する問題では、相関に基づかなければ、異常の判定が困難であったり異常原因が不明であることが多く、その場合に異常の原因がどの特徴量にあるのかを探索するためには、全ての特徴量の組合せを考慮しなければならない。しかし、一般に、全ての特徴量の組合せは膨大な数になり、高速コンピュータを使用したとしても、実用的な計算時間とはならない場合が多い。そこで、MTS法では、この異常原因の探索に“2水準系の直交表”を利用している。“2水準系の直交表”は、図7に示すような、一定の規則で“1”と“2”が配置された表である。この直交表を利用して、例えば“1”は「その特徴量を使用する」、“2”は「その特徴量を使用しない」としてマハラノビス空間を計算し、異常データの特徴量毎の異常への貢献度を計算する。この直交表を利用することにより、例えば特徴量数が100個の場合には128通りの組合せの解析、特徴量数が1000個の場合には1024通りの組合せの解析により結果を求めることができる。このようにして計算された結果の一例を、図8に示す。図8には、10個の特徴量からなるマハラノビス空間における、或る対象の各特徴量毎の異常への貢献度が棒グラフで示されており、プラス方向に大きい程、貢献度が大きい(即ち、異常原因としての可能性が大きい)ことを示している。
MTS法では、以上のように直交表を用いた以上原因診断を行うが、直交表を用いない簡便な方策として、診断しようとする対象の各特徴量が基準データからどの程度異なっているかを、基準データの平均値と標準偏差から求める方法もある。これは、例えば、対象の特徴量が「基準データ±3σ」以上であれば、その特徴量が異常原因であるとする方法である。
MTS法では、以上のように直交表を用いた以上原因診断を行うが、直交表を用いない簡便な方策として、診断しようとする対象の各特徴量が基準データからどの程度異なっているかを、基準データの平均値と標準偏差から求める方法もある。これは、例えば、対象の特徴量が「基準データ±3σ」以上であれば、その特徴量が異常原因であるとする方法である。
上述のような従来のマハラノビス距離を利用した異常原因診断方法では、直交表を利用する場合には、直交表に基づいてマハラノビス空間をその都度計算しなければならず、計算時間が膨大になるため、最高速のコンピュータを使用したとしても、かなりの負担となり、特にリアルタイムで異常原因の診断を行う場合には、実用化の大きな障害となっていた。そこで、本発明者は、マハラノビス距離を利用したパターン認識における異常原因診断を、少ない計算処理によって実現する新規な方法及びプログラムを提案した(特許文献1参照)。
上述のマハラノビス距離を利用したパターン認識における異常原因診断方法およびプログラムは、幸いにも好評を博したが、本発明者は、別のアプローチから、更に新規な異常原因診断方法およびプログラムを開発し、ここに提案するものである。
本願請求項1に記載のマハラノビス距離を利用した異常原因診断方法は、定常状態にある対象から複数の基準データを採取し、前記基準データから、前記対象のパターン認識に係わる特徴を表す量である特徴量を求め、前記特徴量を規準化し、前記規準化した特徴量の相関を表す相関係数を下記の式(1)
を用いて求めて、下記の式(2)
に示す相関行列を作成し、次いで前記相関行列について、下記の式(3)
に示す逆行列で表されるマハラノビス空間を求める第1ステップと、診断しようとする前記対象から特徴量を抽出し、前記抽出した特徴量を規準化して、下記の式(4A)
に示すマハラノビス距離(MD)を求める第2ステップと、上記の式(4E)における各要素mdi (i=1,・・・,k)によって定義される距離要素値を計算する第3ステップと、i番目の要素について前記距離要素値と他の要素に対する相関係数との積の絶対値を計算する第4ステップと、前記第4ステップの計算結果の中から、要素ごとの最大値を抽出する第5ステップとを含むことを特徴とするものである。
本願請求項2に記載のマハラノビス距離を利用した異常原因診断方法は、前記請求項1の方法において、前記特徴量が、前記対象から採取した前記基準データ自体、前記基準データの変化の度合いを表した量、又は、前記基準データを平準化したデータのいずれかであることを特徴とするものである。
本願請求項3に記載のマハラノビス距離を利用して所望の対象の異常原因を診断するプログラムは、定常状態にある対象から複数の基準データを採取し、前記基準データから、前記対象のパターン認識に係わる特徴を表す量である特徴量を求め、前記特徴量を規準化し、前記規準化した特徴量の相関を表す相関係数を下記の式(1)
を用いて求めて、下記の式(2)
に示す相関行列を作成し、次いで前記相関行列について、下記の式(3)
に示す逆行列で表されるマハラノビス空間を求めて記憶装置に格納するステップと、診断しようとする前記対象から特徴量を抽出し、前記抽出した特徴量を規準化して、下記の式(4A)
に示すマハラノビス距離(MD)を求めて記憶装置に格納するステップと、上記の式(4E)における各要素mdi (i=1,・・・,k)によって定義される距離要素値を計算して記憶装置に格納するステップと、i番目の要素について前記距離要素値と他の要素に対する相関係数との積の絶対値を計算して記憶装置に格納するステップと、前記絶対値を計算して記憶装置に格納する前記ステップの計算結果の中から、要素ごとの最大値を抽出するステップとをコンピュータに実行させることを特徴とするものである。
本願請求項4に記載のマハラノビス距離を利用して所望の対象の異常原因を診断するプログラムは、前記請求項3のプログラムにおいて、前記特徴量が、前記対象から採取した前記基準データ自体、前記基準データの変化の度合いを表した量、又は、前記基準データを平準化したデータのいずれかであることを特徴とするものである。
本発明によれば、直交表を使用する従来の方法と比較して、上述の特許文献1において提案した方法と同様に、少ない計算処理によって、マハラノビス距離を利用した異常原因診断を的確に行うことが可能になる。
次に図面を参照して、本発明の好ましい実施の形態について詳細に説明する。本実施の形態では、機械の検査を例として説明する。図1は、本発明の好ましい実施の形態に係る異常原因診断方法のフロー図である。最初に、診断しようとする機械の定常状態における適当な数量の所定のデータ(例えば、温度、圧力など)を計測して基準データとし、これらの基準データの特徴量を求める。そして、特徴量を規準化し、規準化した特徴量間の全ての組合せの相関に基づいて相関行列を求め、次いで該相関行列の逆行列(即ち、マハラノビス空間)を求める(ステップ1)。
次いで、診断しようとする機械のマハラノビス距離(MD)を求める(ステップ2)。次いで、距離要素値を計算する(ステップ3)。ここで、距離要素値とは、式(4E)における各要素mdi (i=1,・・・,k)を意味する。
そして、各距離要素値mdi (i=1,・・・,k)について、当該要素と他の要素との相関係数rij(j=1,・・・,k)を乗じ、その絶対値を求める(ステップ4)。
すなわち、1番目の距離要素値mdi については、
|md1 ×r11|,|md1 ×r12|,|md1 ×r13|,・・・,|md1 ×r1k|
を計算し、以下順次
|md2 ×r21|,|md2 ×r22|,|md2 ×r23|,・・・,|md2 ×r2k|
|md3 ×r31|,|md3 ×r32|,|md3 ×r33|,・・・,|md3 ×r3k|
・・・・・
|mdk ×rk1|,|mdk ×rk2|,|mdk ×rk3|,・・・,|mdk ×rkk|
と計算を実行する。ここで、相関係数rij=1であるので、当該個所の計算結果は、距離要素値の絶対値となる。
すなわち、1番目の距離要素値mdi については、
|md1 ×r11|,|md1 ×r12|,|md1 ×r13|,・・・,|md1 ×r1k|
を計算し、以下順次
|md2 ×r21|,|md2 ×r22|,|md2 ×r23|,・・・,|md2 ×r2k|
|md3 ×r31|,|md3 ×r32|,|md3 ×r33|,・・・,|md3 ×r3k|
・・・・・
|mdk ×rk1|,|mdk ×rk2|,|mdk ×rk3|,・・・,|mdk ×rkk|
と計算を実行する。ここで、相関係数rij=1であるので、当該個所の計算結果は、距離要素値の絶対値となる。
全ての計算が完了したら、各要素ごとに計算結果の最大値をその特徴量の異常原因を示す値とする。本明細書では、この異常原因を示す値を「最終効果」と呼ぶ。このようにして、最終効果の表示などの所要の情報を出力する。
上述の計算は、要素の順番に従って実行してもよいし、距離要素値の大きな順に実行し、任意の個所までで止めてもよい。これは、例えば要素の数が数千もあるような場合には、計算時間を短縮するため、途中で計算を止めることもあり得るからである。その場合には、その時点で求められた各要素値の最大値をもって「最終効果」とする。
以上の手順について具体例を用いて説明する。図2(a)には、基準データと各特徴量の平均値、標準偏差が示されており、基準データは、特徴量数k=10、サンプル数n=30である。図2(b)には、各特徴量に関する相関行列が示されている。相関行列は10×10の正方行列であり、左上から右下への対角要素は1である。相関行列から分かるように、特徴量1と特徴量2、3、4、及び、特徴量5と特徴量6、7とは、互いに高い相関をもっている。
このデータのMDは、式(4A)〜式(4F)を用いて計算すると、28.7となり、基準データに対して異常であると判断される。
さらに、要素2(−4.6885)から要素10までの各要素と、他の要素との相関係数から、同様の計算を繰り返す。すると、図3(a)に示されるような結果が得られる。そして、各要素の異常原因としての「最終効果」を集計する。この集計は、距離要素値として最大値になったときの値をその要素の効果として集計するものである。集計の状況は、図3(a)の最終行となるが、それを改めて表7に示す。
なお、上述の例では、要素の順に計算を実行したが、計算の順序は、他の順序でもよい。例えば、距離要素値の大きな順に実行する等である。この場合の計算過程は、図3(b)に示すようになる。「最終効果」は、各要素の計算結果の最大値をとる。
距離要素値の大きな順に計算を実行する場合には、全ての要素について実行すると、その結果は要素の順に計算した場合と同一となるが、途中で計算を中止すると、その結果は要素の順に計算した場合とはやや異なったものとなる。その例を図3(c)に示すが、この例は、要素値の大きな2個目までの計算で中止したものである。その結果は、要素5および要素8の個所で、全てを計算した場合と値が相違している。しかし、最も大きなものを含め、主要な異常原因は、要素値の大きな2個目の計算で既に求められている。このように、主要な異常原因を求めるという目的が、全計算を実行しなくとも実用上差し支えない範囲で達成されることが多く、計算時間を短縮することが重要な場合には有効な方法である。
図4(a)には、最終結果のグラフが示されている。図4(a)を見ると、1番目、2番目、3番目、4番目の効果が大きくなっていることが分かる。この結果は、図2(b)の相関行列から明らかなように、2番目、3番目、4番目の要素は最も要素値の大きな1番目の要素と大きな相関関係にあるためであり、妥当な結果であると考えられる。これらに次いで、5番目、6番目、10番目の要素の効果が大きい。
一方、図4(b)には、従来の方法、即ち直交表を用いた場合の結果が示されている。図4(b)では、例えば4番目の特徴量の効果が負の値になっている。しかし、どのような特徴量であっても、例えば機械の検査のために計測した値が検査結果に負の値をもつということは不自然なことである。効果がないのであれば(即ち、「在っても無くても検査に効果がない」のであれば)、ゼロ付近の値をとるべきである。このように、直交表を用いた場合には、不自然な結果となることがある。
次に、本発明の異常原因診断方法の妥当性について説明する。図5は、特徴量1と特徴量4について基準データの分布を菱形の点群で示し、表3の対象データにおける座標を☆印で示したものである。特徴量の中で最も大きな効果をもつのは特徴量1(最終効果=16.868)であるが、図5における特徴量1と特徴量4との関係を見る限り、☆印の対象データは、基準データから離れており、大きなMDとなることが理解される。また、特徴量1の平均値よりの距離は、特徴量4の平均値よりの距離よりも大きいことが分かる。しかし、対象データの位置が☆印から○印に移動すると、MDは当初の28.698から25.149に低下することから、特徴量4もMDの値に一定の効果を有していると言える。
図5において、特徴量4は特徴量1との相関係数が0.816であり、かなり大きな相関をもっているのが分かる。大きな相関をもつということは、特徴量4が特徴量1の動きに伴った挙動をし、特徴量1が特徴量4の動きに伴った挙動をするということを意味する。したがって、検査対象となるデータの或る特徴量の効果は、他の特徴量の効果との相関も併せて考慮することが妥当であることが分かる。上述のように、各特徴量の距離要素値と相関係数との積を求め、その最大値を計算することにより、妥当な値を求めることが可能になる。なお、相関係数は、負の値もとり得るが、相関係数はその絶対値に意味があるので、距離要素値と相関係数との積の絶対値を効果とした。
次に、コンピュータに上述のステップ(即ち、ステップ1〜ステップ5)を実行させるためのプログラムについて説明する。本プログラムが実行されるコンピュータは、バスによって相互に接続されたCPU(中央処理装置)、メモリ、ハードディスク等の記憶装置、キーボード等の入力装置、表示装置、及び出力装置(いずれも図示せず)を有する一般的な形式のものでよいし、或いはマイクロチップ形式の処理装置等でもよい。
まず、診断しようとする機械の定常状態における適当な数量の所定のデータを計測して基準データとし、入力装置によって入力されたこれらの基準データをメモリに格納する。次いで、CPUにおいて、メモリに格納された基準データから特徴量を求め、さらに特徴量を規準化し、規準化した特徴量間の全ての組合せの相関に基づいて式(2)により相関行列を求め、式(3)により相関行列の逆行列(即ち、マハラノビス空間)を求め、メモリに格納する(ステップ1)。
次いで、診断しようとする機械のデータを入力装置によって入力し、これらのデータをメモリに格納する。次いで、CPUにおいて、これらのデータから特徴を求め、さらに特徴量を規準化し、式(4)によりMDを求め、メモリに格納する(ステップ2)。次いで、CPUにおいて、式(4E)における各要素mdi (i=1,・・・,k)によって定義される距離要素値を計算し、メモリに格納する(ステップ3)。次いで、i番目の要素について前記距離要素値と他の要素に対する相関係数との積の絶対値を計算し、メモリに格納する(ステップ4)。そして、ステップ4の計算結果の中から、要素ごとの最大値を抽出し、メモリに格納する(ステップ5)。
なお、上述の例では、諸データがメモリに格納されるものとして説明したが、データ量が多い場合には、ハードディスク等の大容量記憶装置に格納される。
本発明は、以上の発明の実施の形態に限定されることなく、特許請求の範囲に記載された発明の範囲内で、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることはいうまでもない。
例えば、前記実施の形態では、機械の検査に関連して本発明を説明したが、経済分野での状態推移予測、マーケティング分野での状態推移予測や顧客嗜好の分析、バイオテクノロジー分野でのDNAチップの解析結果分析などの用途においても、同様にして使用することができる。
Claims (4)
- マハラノビス距離を利用した異常原因診断方法であって、
定常状態にある対象から複数の基準データを採取し、前記基準データから、前記対象のパターン認識に係わる特徴を表す量である特徴量を求め、前記特徴量を規準化し、前記規準化した特徴量の相関を表す相関係数を下記の式(1)
診断しようとする前記対象から特徴量を抽出し、前記抽出した特徴量を規準化して、下記の式(4A)
上記の式(4E)における各要素mdi (i=1,・・・,k)によって定義される距離要素値を計算する第3ステップと、
i番目の要素について前記距離要素値と他の要素に対する相関係数との積の絶対値を計算する第4ステップと、
前記第4ステップの計算結果の中から、要素ごとの最大値を抽出する第5ステップと、を含むことを特徴とする方法。 - 前記特徴量が、前記対象から採取した前記基準データ自体、前記基準データの変化の度合いを表した量、又は、前記基準データを平準化したデータのいずれかであることを特徴とする請求項1に記載の方法。
- マハラノビス距離を利用して所望の対象の異常原因を診断するプログラムであって、
定常状態にある対象から複数の基準データを採取し、前記基準データから、前記対象のパターン認識に係わる特徴を表す量である特徴量を求め、前記特徴量を規準化し、前記規準化した特徴量の相関を表す相関係数を下記の式(1)
診断しようとする前記対象から特徴量を抽出し、前記抽出した特徴量を規準化して、下記の式(4A)
上記の式(4E)における各要素mdi (i=1,・・・,k)によって定義される距離要素値を計算して記憶装置に格納するステップと、
i番目の要素について前記距離要素値と他の要素に対する相関係数との積の絶対値を計算して記憶装置に格納するステップと、
前記絶対値を計算して記憶装置に格納する前記ステップの計算結果の中から、要素ごとの最大値を抽出するステップと、
をコンピュータに実行させるためのプログラム。 - 前記特徴量が、前記対象から採取した前記基準データ自体、前記基準データの変化の度合いを表した量、又は、前記基準データを平準化したデータのいずれかであることを特徴とする請求項3に記載のコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004081781A JP2005267474A (ja) | 2004-03-22 | 2004-03-22 | マハラノビス距離を利用した異常原因診断方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004081781A JP2005267474A (ja) | 2004-03-22 | 2004-03-22 | マハラノビス距離を利用した異常原因診断方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005267474A true JP2005267474A (ja) | 2005-09-29 |
Family
ID=35091937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004081781A Pending JP2005267474A (ja) | 2004-03-22 | 2004-03-22 | マハラノビス距離を利用した異常原因診断方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005267474A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013101718A (ja) * | 2013-03-05 | 2013-05-23 | Mitsubishi Heavy Ind Ltd | プラント運転状態監視方法 |
JP2013200245A (ja) * | 2012-03-26 | 2013-10-03 | Ihi Corp | 前処理方法 |
-
2004
- 2004-03-22 JP JP2004081781A patent/JP2005267474A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013200245A (ja) * | 2012-03-26 | 2013-10-03 | Ihi Corp | 前処理方法 |
JP2013101718A (ja) * | 2013-03-05 | 2013-05-23 | Mitsubishi Heavy Ind Ltd | プラント運転状態監視方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6978541B2 (ja) | 動的外れ値偏り低減のコンピュータ実装方法、コンピュータシステム及びコンピュータ装置 | |
Beavers et al. | Practical considerations for using exploratory factor analysis in educational research | |
Garamszegi | Uncertainties due to within-species variation in comparative studies: measurement errors and statistical weights | |
Walker et al. | Comparing curves using additive models | |
JP7063389B2 (ja) | 処理装置、処理方法、およびプログラム | |
WO2019235614A1 (ja) | 関係性分析装置、関係性分析方法および記録媒体 | |
Arif et al. | Joint monitoring of mean and variance using likelihood ratio test statistic with measurement error | |
JPWO2019235603A1 (ja) | 関係性分析装置、関係性分析方法およびプログラム | |
Hussain et al. | IQR CUSUM charts: An efficient approach for monitoring variations in aquatic toxicity | |
Moheb-Alizadeh | Capability analysis of the variable measurement system with fuzzy data | |
JP2005267474A (ja) | マハラノビス距離を利用した異常原因診断方法及びプログラム | |
Haj Mohamad et al. | Detection of cracks in a rotating shaft using density characterization of orbit plots | |
Cetin-Berber et al. | A comparison of one-step and three-step approaches for including covariates in the shared parameter growth mixture model | |
JPWO2020026327A1 (ja) | 情報処理装置、制御方法、及びプログラム | |
JP2004227279A (ja) | マハラノビス距離を利用した異常原因診断方法及びプログラム | |
Cheng | Analysis of simulation experiments by bootstrap resampling | |
Riaz et al. | Adaptive EWMA control chart for monitoring the coefficient of variation under ranked set sampling schemes | |
WO2011163390A1 (en) | Systems and methods for impact analysis in a computer network | |
Marowka | Inferential statistical analysis of performance portability | |
Song et al. | Two robust multivariate exponentially weighted moving average charts to facilitate distinctive product quality features assessment | |
CN111507639B (zh) | 理财风险分析方法及装置 | |
Gafter et al. | A Systematic Methodological Routine for Analyzing Numerical Analysis Results: Tools for Parametric Design Routines of Floating Structures | |
Cardoso et al. | Demonstration of an application for remote outlier detection and accommodation | |
Eren et al. | Modeling of Stress Concentration Factor Using Artificial Neural Networks for a Flat Tension Bar with Opposite V-Shaped Notches | |
Ke | Insufficient Statistical Power of the Chi-Square Model Fit Test for the Exclusion Assumption of the Instrumental Variable Method |