JP6875179B2

JP6875179B2 - システム分析装置、及びシステム分析方法

Info

Publication number: JP6875179B2
Application number: JP2017076602A
Authority: JP
Inventors: 受田　賢知; 賢知受田; 康之玉井; 野口　純司; 純司野口
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2017-04-07
Filing date: 2017-04-07
Publication date: 2021-05-19
Anticipated expiration: 2037-04-07
Also published as: JP2018180759A

Description

本発明は、システム分析装置、及びシステム分析方法に関する。

従来、種々の機器、工場、発電所、プラント等を構成要素として含む所定のシステム（以下、システム等という）に設けられている様々な装置の故障の検知は、熟練者による目視や装置からの出力ノイズなどにより行っていたが、近年のセンシング技術の導入により、機器等における故障をデータとして捉え、これらの故障を自動的に発見することが可能となってきた。また、さらに近年では、機械学習とよばれる分析技術の導入により、システム等が正常に稼動していた期間において各種センサから出力されていたデータのパターンを登録しておき、これに基づきシステム等の異常、又はその予兆を迅速に把握できるようになりつつある。

ただこの場合、分析技術を用いた機器等の故障や予兆の発見には、高度な専門知識（例えば、機器による分析の知識や、その分析の結果を機器等に当てはめて読み解く（解析する）ための知識）が必要となる。しかし、そのような知識を有する技術者は稀少であるため、個々の知識を持つ技術者が意見交換をしつつ手作業でこのような故障や予兆の発見を行う必要があり、場合によっては相当の長期間を要し、多大なコストが発生することもあった。

この点、特許文献１には、機器やプラントの余寿命診断を行う場合において、対象の機器やプラント毎の人の判断をルール化し、これを外部からシステムに与えることで自動的に分析を行うシステムが開示されている。

特開２００６−３０２２９３号公報

特許文献１によれば、診断を行うためのアプリケーションを開発する工数を減らすことは可能であるが、上記ルールを構築するには、システムに関する専門知識（例えば、技術者等の機器の分析の知識や当該分野の技術に関する知識）が必要である。特許文献１の技術には、これらのルールの導出を行う仕組みは存在しないため、システムを的確に分析できるという保証はない。

本発明はこのような背景に鑑みてなされたものであり、その一つの目的は、システムの状態を的確に分析することを可能とするシステム分析装置、及びシステム分析方法を提供することにある。

前記の課題を解決するための本発明の一つは、プロセッサ及びメモリを備えるシステム分析装置であって、複数の装置を含んで構成される所定のシステムにおいて、前記装置の状態を時系列的に示すデータである状態データを前記複数の装置のそれぞれについて取得し、取得した前記状態データに基づき、前記複数の装置のそれぞれを、前記装置の状態の変化の特徴に応じて少なくとも１つ以上のグループに分類する装置分類部と、前記取得した状態データに基づき、前記グループにおける各前記装置が行う処理の時間的先後関係を推定する先後関係推定部と、前記分類したグループ、及び前記推定した時間的先後関係に基づき、前記グループにおける各装置の状態の時間的変化を予測するモデルである分析モデルを生成する分析モデル生成部と、前記生成した分析モデルの内容を示す情報を出力する分析モデル出力部と、を備える。

本発明によれば、システムの状態を的確に分析することができる。

図１は、本実施形態に係る分析システム１の構成の一例を示す図である。図２は、システム分析装置１２０が備えるハードウェア構成の一例を示す図である。図３は、履歴データ１５０の構成の一例を説明する図である。図４は、分析システム１が行う処理の概要を説明する図である。図５は、分析処理の一例を説明する図である。図６は、分析処理の一例を説明する図である。図７は、分析処理の一例を説明する図である。図８は、時間軸方向クレンジングの処理の一例を説明する図である。図９は、不要センサ除外及びセンサ選択に係る処理の一例を説明する図である。図１０は、時刻オフセットの処理の内容の一例を説明する図である。図１１は、最適化処理の内容の一例を説明する図である。図１２は、分析システム１の他の構成の一例を示す図である。

＜システム構成＞
図１は、本実施形態に係る分析システム１の構成の一例を示す図である。分析システム１は、例えば、工場、発電所、油田等の資源の採掘場、又は公共インフラシステム（インフラ＝インフラストラクチャー（infrastructure）。例えば、水道の配管、ガスの配管、道路、自動車、鉄道、航空機。）等の、複数の装置５が設けられている所定のシステム（以下、分析対象システム１０という）を管理する事業体に導入される情報システムである。

分析システム１は、分析対象システム１０に関する分野の専門知識（例えば、分析の専門知識）を持たない利用者１１０であっても、分析対象システム１０の分析を可能とするシステムである。例えば、分析システム１は、その利用又は経年劣化により装置５が破損又は故障する可能性を分析することができる。

すなわち、利用者１１０は、分析システム１に設けられた情報処理装置（コンピュータ）であるシステム分析装置１２０に対して、後述する稼動データ及び状態データを含む処理データ１０２と、利用者１１０が要求する分析に関連する情報である分析対象データ１０４とを含む分析要求１００を入力する。すると、システム分析装置１２０は、分析モデル１０８と、分析モデル１０８の妥当性を示すデータ（例えば、システム特性を示す情報、分析モデル１０８の生成に利用したアルゴリズムやそのアルゴリズムに適用されたパラメータ、適用されたアルゴリズムの順番と組合せ等）である根拠データ１０５とを含むデータである分析結果１０６を出力し、利用者１１０に提示する。

なお、分析対象データ１０４には、例えば、各装置５の過去の故障日時又は故障箇所、利用者１１０が分析の対象とする装置５（以下、分析対象装置という。）等が含まれる。

また、装置５は、例えば、工場や発電所で利用される装置、油田その他の資源の採掘現場で利用される機器、配管、道路、自動車、鉄道、航空機等であり、複数の装置５のそれぞれが単独で、又は連携して対応する処理又は動作を行っている。

また、装置５のそれぞれには、それぞれの装置５の状態又は動作を随時（例えば、所定の時間間隔又は所定のタイミングで）監視している所定のセンサ６（例えば、監視カメラ、温度計、電圧計、電流計、振動計、速度計等）が設けられている。

＜システム分析装置１２０の構成＞
次に、システム分析装置１２０の構成について説明する。
図１に示すように、システム分析装置１２０は、分析対象システム１０における各装置５について、その装置５が稼働中か否かを示すデータ（以下、稼動データという。）、及び、各センサ６が装置５から取得した、当該装置５の状態を示すデータ（状態データ。以下、センシングデータともいう。）を用いることで、分析対象システム１０の特性（以下、システム特性という。例えば、分析対象システム１０の規模、各装置５の配置、装置５が行う処理の順序などの特徴。）を推定し、推定したシステム特性を用いることで、分析対象システム１０における装置５の状態を予測、分析するためのモデルである分析モデル１０８を作成する。

稼動データは、各装置５について、その装置５が稼動中又は停止中であった期間を示すデータである。本実施形態では、稼動データは時系列のデータであり、装置５が停止中であった期間の稼動データには０が設定され、装置５が稼動中であった期間の稼動データには０以外の値が設定されるものとする。稼動データは、例えば、装置５が記憶している、電源投入又は電源切断の履歴のデータである。

センシングデータは、センサ６が取得する時系列のデータであり、例えば、装置５の電源の状態、生産量、装置の状態、温度、電圧等の時間変化を示す時系列データ、又は、速度、材料の投入量の時間変化を示す時系列データである。

分析モデル１０８は、機械学習によって生成される数値モデルであり、例えば、各装置５とその故障時期との関係を表す数式等を記憶している。これにより、利用者１１０は、分析要求１００をシステム分析装置１２０に入力することで、自身の専門性の如何によらず、各装置５の現在の状態が故障にどれだけ近いかを知ることができる。このような分析モデル１０８を利用するプロセスは、機械学習の分野では診断と呼ばれる。

なお、図２は、システム分析装置１２０が備えるハードウェア構成の一例を示す図である。同図に示すように、システム分析装置１２０は、ＣＰＵ（Central Processing Unit）等からなるプロセッサ１１と、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、又はＮＶＲＡＭ（Non-Volatile RAM）等の主記憶装置１２と、ハードディスク（Hard Disk Drive）やＳＳＤ（Solid State Drive）等の補助記憶装置１３と、タッチパネルや操作ボタン等の入力装置１４と、液晶ディスプレイ、プリンタ等の出力装置１５と、他の情報処理装置と通信するための通信装置１６とを備える。

次に、図１に示すように、システム分析装置１２０は、稼動装置抽出部１２５、装置分類部１３０（故障関与センサ出力部）、先後関係推定部１３５（時刻相関抽出部）、分析モデル生成部１４２、情報入力部１４３、分析モデル出力部１４５、状態予測出力部１４７の各機能を備える。

まず、装置分類部１３０は、複数の装置を含んで構成される所定のシステム（分析対象システム１０）において、前記装置の状態を時系列的に示すデータである状態データを前記複数の装置のそれぞれについて取得し、取得した前記状態データに基づき、前記複数の装置のそれぞれを、前記装置の状態の変化の特徴に応じて少なくとも１つ以上のグループに分類する。

ここで、稼動装置抽出部１２５は、前記装置が稼動中又は停止中であることを示すデータである稼動データを取得し、取得した前記稼動データと前記取得した状態データとに基づき、分析対象の前記状態データを取得する。そして前記装置分類部１３０は、前記取得した分析対象の状態データに基づき、前記複数の装置のそれぞれを、前記少なくとも１つ以上のグループ（以下、センサグループという。）に分類する。

先後関係推定部１３５は、前記取得した状態データに基づき、前記グループにおける各前記装置が行う処理の時間的先後関係を推定する。

分析モデル生成部１４２は、前記分類したグループ、及び前記推定した時間的先後関係に基づき、前記グループにおける各装置の状態の時間的変化を予測するモデルである分析モデル（分析モデル１０８）を生成する。

前記分析モデル生成部１４２は、先後関係推定部１３５が前記推定した時間的先後関係に基づき、前記所定のシステムを特徴付けるパラメータである特性値を算出するパラメータ最適化部１４０を備える。前記分析モデル生成部１４２は、前記算出した特性値に基づき、修正した前記分析モデルを生成する。

例えば、前記パラメータ最適化部１４０は、前記特性値として、前記装置間の処理の時間的先後関係を示すパラメータを算出し、算出した前記パラメータに基づき、前記先後関係を満たす、前記修正した分析モデルを生成する。

また、例えば、前記パラメータ最適化部１４０は、前記特性値として、前記所定のシステムにおける全ての前記処理が終了するまでに要する時間を示すパラメータを算出し、算出した前記パラメータが所定の閾値を超える場合に、前記時間のうち一部の期間における前記状態データを特定し、特定した前記状態データに基づき、前記修正した分析モデルを算出する。

また、例えば、前記パラメータ最適化部１４０は、前記特性値として、前記装置が所定の状態に達していた頻度を示すパラメータを算出し、算出したパラメータに基づき前記分析モデルの分析期間を特定し、特定した分析期間における前記分析モデルを前記修正した分析モデルとして生成する。

また、例えば、前記パラメータ最適化部１４０は、前記特性値として、所定のイベントの前後の所定期間における前記状態データの特徴の違いを示すパラメータを算出し、算出した前記パラメータが所定の条件を満たす場合に、前記所定のイベントの前後の時期における前記分析モデルを、前記修正した分析モデルとしてそれぞれ算出する。

情報入力部１４３は、前記装置の過去の所定の状態を示す情報の入力を受け付ける。

分析モデル出力部１４５は、分析モデル生成部１４２が前記生成した分析モデルの内容を示す情報を出力する。

状態予測出力部１４７は、前記入力された装置の状態の情報、及び前記生成した分析モデルに基づき、前記装置が前記所定の状態に達する時間を推定し、推定した前記時間に関する情報を出力する。

また、システム分析装置１２０は、履歴データ１５０を記憶している。
＜履歴データ＞
図３は、履歴データ１５０の構成の一例を説明する図である。履歴データ１５０は、履歴データ管理テーブル５１０、特性種別管理テーブル５２０、データ管理テーブル５３０、特性値管理テーブル５４０、及び作業管理テーブル５５０の各データベースを含んで構成されているリレーショナルデータベースである。

このうち履歴データ管理テーブル５１０は、分析要求１００及び分析結果１０６の内容を記憶しているテーブルであり、入力されてきた分析要求１００ごと（分析処理ごと）に割り当てられた識別子（以下、履歴ＩＤという。）が格納される履歴ＩＤ５１１、他のテーブルとの対応付けのための情報（以下、参照ＩＤという。）が格納される参照ＩＤ５１２、履歴ＩＤ５１１の分析要求１００の直前に入力されてきた分析要求１００の履歴ＩＤが格納される前回分析ＩＤ５１３（なお、初回の分析の場合は「０」が設定される。）、履歴ＩＤ５１１の分析要求１００に対応して算出された故障相関度（分析結果１０６の品質を表す値。詳細は後述する。）が格納される故障相関度５１４、及び、故障相関度５１４が示す故障相関度に対する利用者１１０の評価が格納される採用フラグ５１５（例えば、利用者１１０が当該分析結果１０６に満足した場合には利用者１１０等によって「１」が格納され、満足しない場合には「０」が格納される。）の各項目を有する。

特性種別管理テーブル５２０は、分析モデル１０８を生成する際に用いられる、システム特性を判定するための式（以下、特性判定式という。）を格納するためのテーブルである。特性種別管理テーブル５２０は、各特性判定式に割り当てられた識別子（以下、特性判定式ＩＤという。）が格納される特性判定式ＩＤ５２１、特性判定式ＩＤ５２１の特性判定式の内容（例えば、計算式、プログラム、又はプログラムを呼び出すためのＡＰＩ（Application Programming Interface））が格納される特性判定式５２２、特性判定式５２２に格納される特性判定式の処理方法に関する情報が格納される特性区分５２３、及び、特性判定式５２２に格納される特性判定式を用いて行う処理を特定する情報が格納される判定後処理５２４（例えば、計算式、プログラム、又はプラグラムを呼び出すためのＡＰＩの情報が格納される。具体的には、例えば、稼動装置抽出部１２５、装置分類部１３０、又は先後関係推定部１３５を特定する情報が格納される。）の各項目を有する。

なお、特性判定式５２２には、後述する、装置間順序特性値を算出する特性判定式、装置間距離特性値を算出する特性判定式、システム規模特性値を算出する特性判定式、故障頻度特性値を算出する特性判定式、及び、特性変化特性値を算出する特性判定式等が格納される。

また、特性区分５２３には、例えば、パラメータ最適化部１４０が繰り返して行う所定の処理に使用されるパラメータが格納される。例えば、特性判定式により算出された値が前回算出された値と異なった場合に、その両者の値が同一の値とみなしてよい場合を特定するための情報が格納される。例えば、特性区分５２３に所定の値が格納されている場合には、前記の両者の値が一致しているものとみなされる。

データ管理テーブル５３０は、システム分析装置１２０が処理するデータ（例えば、各計算処理で用いられるデータ、装置５に関する設定値、システム分析装置１２０から出力されるデータ等）を管理するテーブルである。データ管理テーブル５３０は、データごとに割り当てられた識別子（以下、データＩＤという）が格納されるデータＩＤ５３１、参照ＩＤが格納される参照ＩＤ５３２、データＩＤ５３１のデータを処理する装置を特定する情報が格納される装置種別５３３、データＩＤ５３１のデータを処理する機能部（具体的には、例えば、稼動装置抽出部１２５、装置分類部１３０、先後関係推定部１３５、分析モデル生成部１４２、パラメータ最適化部１４０）を特定する情報が格納される機能種別５３４、データＩＤ５３１のデータの種別を特定する情報が格納されるデータ種別５３５、データＩＤ５３１のデータの内容、格納場所、又は取得先（例えばＡＰＩ）を特定する情報が格納されるデータ５３６の各項目を有する。

特性値管理テーブル５４０は、特定判定式により算出される、システム特性を示すパラメータ（以下、特性値という。）を格納するためのテーブルである。特性値管理テーブル５４０は、特性値ごとに割り当てられた識別子（以下、特性値ＩＤという。）が格納される特性値ＩＤ５４１、参照ＩＤが格納される参照ＩＤ５４２、特性判定式ＩＤが格納される特性判定式ＩＤ５４３、及び、特性判定式ＩＤ５４３で特定される特性判定式における特性値が格納される特性値５４４の各項目を有する。

＜特性値について＞
ここで、特性値の具体例を説明する。特性値は、特性判定式等に基づき算出されるパラメータであり、特性値には、例えば、装置間順序特性値、装置間距離特性値、システム規模特性値、故障頻度特性値、及び特性変化特性値がある。

まず、装置間順序特性値は、センサ６間の状態データの時間変化に時間差がある場合、又はセンサグループ間の状態データの時間変化に時間的な先後関係がある場合に、これらの時間的な先後関係（即ち装置５間の順序）を表す特性値である。

装置間距離特性値は、前記の先後関係が存在する場合において、センサ６間、又はセンサグループ間の状態データの時間変化の時間差から算出される、装置５間の距離を表す特性値である。この特性値により、センサ６（装置５）が複数のブロックに分類されると共に、分析対象システム１０が複数の装置５から構成されていることが推測される。

システム規模特性値は、分析対象システム１０や装置５の規模（例えば、空間的広さ）を示す特性値であり、例えば、分析対象システム１０の装置５への材料やエネルギーの入力時から、分析対象システム１０から製品やエネルギーが出力されるまでの時間である。なお、システム規模特性値は、例えば、装置５間の距離を用いて算出される。

故障頻度特性値は、装置５の故障頻度を示す特性値であり、所定の日時以前に１件以上の故障が発生していた頻度又は回数を示す値である。故障頻度特性値の算出方法の詳細は後述する。

特性変化特性値は、所定のイベント（例えば、装置５の停止期間や所定の時期、季節等）の前後の期間での分析対象システム１０の挙動の違いを示す特性値である。特性変化特性値は、例えば、前記所定のイベントの前の所定の期間における、センサ６又はセンサグループの状態データ（以下、停止前データという。）と、前記所定のイベントの後の所定の期間における、センサ６又はセンサグループの状態データ（以下、停止後データという。）との相関関係を示す値である。特性変化特性値は、停止前データと停止後データの間の相関係数が所定の閾値以上であった場合（例えば、停止前に０．５以下であったものが停止後に０．８以上に増加したり、停止前に０．８以上であったものが停止後に０．５以下になった場合等）に、所定の値が設定される。

次に、作業管理テーブル５５０は、システム分析装置１２０で繰り返し行われる最適化処理に係るパラメータを格納するためのテーブルである。作業管理テーブル５５０は、各最適化処理ごとに割り当てられた識別子（以下、サブ履歴ＩＤという。）が格納されるサブ履歴ＩＤ５５１、履歴ＩＤが格納される履歴ＩＤ５５２、参照ＩＤが格納される参照ＩＤ５５３、前回行われた最適化処理のサブ履歴ＩＤが格納される前回分析ＩＤ５５４、サブ履歴ＩＤ５５１の最適化処理によって算出された故障相関度が格納される故障相関度５５５、及び、各回の最適化処理のうちサブ履歴ＩＤ５５１の最適化処理の結果が最も適切であると判断された場合に所定の値が格納される採用フラグ５５６（なお、採用フラグ５５６には、最適化処理の結果の適切さの順位が格納されてもよい。）の各項目を有する。

なお、以上の履歴データ１５０は、稼動装置抽出部１２５、装置分類部１３０（故障関与センサ出力部）、先後関係推定部１３５（時刻相関抽出部）、及び分析モデル生成部１４２が行った処理やその処理に使用されたデータをさらに記憶してもよい。

以上のシステム分析装置１２０の機能は、システム分析装置１２０のハードウエアによって、もしくは、システム分析装置１２０のプロセッサ１１が、主記憶装置１２又は補助記憶装置１３に記憶されているプログラムを読み出して実行することにより実現される。

＜処理＞
次に、システム分析装置１２０が行う処理について説明する。まず、分析システム１の処理の概要について説明する。

＜処理の概要＞
図４は、分析システム１が行う処理の概要を説明する図である。まず、システム分析装置１２０は、分析要求１００の入力を受け付け、入力を受け付けた分析要求１００の内容を解析する（ｓ１０）。そして、システム分析装置１２０は、解析した内容に基づき、分析要求１００のデータの品質を高めるための処理（以下、データクレンジングという。）を行う（ｓ２０）。

具体的には、システム分析装置１２０はまず、状態データ等に基づき、装置５が稼動していた期間を特定し、その期間における装置５の状態データを抽出する処理（以下、時間軸方向クレンジングという。）を行う（ｓ２１）。なお、この処理は、主に稼動装置抽出部１２５によって行われる。

次に、システム分析装置１２０は、時間軸方向クレンジングを行った装置５のうち、故障した装置５又は故障に関連していた装置５を特定する処理（以下、不要センサ除外という。）を行う（ｓ２２）。なお、この処理は、主に装置分類部１３０によって行われる。

また、システム分析装置１２０は、不要センサ除外を行った装置５（装置５に対応するセンサ６）を、少なくとも１つ以上のグループ（センサグループ）に分類する処理（以下、センサ選択という。）を行う（ｓ２３）。なお、この処理は、主に装置分類部１３０によって行われる。

システム分析装置１２０は、センサ選択により分類したセンサグループについて、各センサグループによって行われる処理相互の時間的な先後関係を特定する処理（以下、時刻オフセットという。）を行う（ｓ２４）。なお、この処理は、主に先後関係推定部１３５によって行われる。

以上のようにしてデータクレンジングが終了すると、システム分析装置１２０は、データクレンジングがなされた各グループの状態データの分析を行って分析モデル１０８を生成し、その分析モデル１０８を最適化する処理（以下、最適化処理という。）を行う（ｓ３０）。なお、システム分析装置１２０は、最適化処理の結果に基づき、繰り返しデータクレンジングを行う場合がある。なお、この最適化処理は、主に分析モデル生成部１４２（パラメータ最適化部１４０）によって行われる。

システム分析装置１２０は、最適化処理が終了すると、根拠データ１０５及び分析モデル１０８を含む分析結果１０６を出力して利用者１１０に提示する（ｓ４０）。

次に、システム分析装置１２０が行う処理を説明する。
＜分析処理＞

図５、図６、図７は、システム分析装置１２０が分析要求１００に基づき分析モデル１０８を生成すると共に、分析結果１０６を出力する処理（以下、分析処理という。）の一例を説明する図である。この処理は、例えば、システム分析装置１２０に対して、利用者１１０により所定の入力が行われたことを契機に開始される。

まず、システム分析装置１２０の情報入力部１４３は、利用者１１０から分析要求１００の入力を受け付ける（ｓ２１０）。

（時間軸方向クレンジング）
次に、システム分析装置１２０の稼動装置抽出部１２５は、分析要求１００における稼動データを参照することにより、装置５が稼動又は停止していた期間を全て特定する（ｓ２１５）。具体的には、例えば、稼動装置抽出部１２５は、その値が０、又は０から所定値以上離れた値を稼動データとして有する期間を特定する。

次に、稼動装置抽出部１２５は、分析要求１００に含まれている装置５の故障日時の情報に基づき、その故障日時における各装置５の状態データを取得する（ｓ２２０）。

なお、稼動装置抽出部１２５は、稼動データを取得するセンサ６を利用者１１０に選択させてもよい（ｓ２３０）。また、稼動装置抽出部１２５は、取得する状態データを利用者１１０に選択させてもよい。

次に、稼動装置抽出部１２５は、ｓ２１５及びｓ２２０の処理の結果を履歴データ１５０に記憶する（ｓ２２７）。具体的には、例えば、稼動装置抽出部１２５は、データ管理テーブル５３０に新たなレコードを生成し、生成したレコードに、各装置５の停止期間、稼動期間、及び故障日時を特定する情報（例えば、稼動期間又は停止期間の境界時刻と、故障日時との関係）を格納する。

また、稼動装置抽出部１２５は、ｓ２１５及びｓ２２０の処理で用いられた各種のデータやパラメータを履歴データ１５０に格納する（ｓ２２７）。具体的には、例えば、稼動装置抽出部１２５は、データ管理テーブル５３０に新たなレコードを生成し、生成したレコードのデータ５３６に状態データを格納する。

そして、稼動装置抽出部１２５は、ｓ２２０で抽出した各センサ６（装置５）の状態データ（例えば、過去の停止期間以外の各センサ６（装置５）の状態データ）を、装置分類部１３０に送信する（ｓ２２９）。

ここで、図８は、以上の時間軸方向クレンジングの処理の一例を説明する図である。例えば、稼動装置抽出部１２５は、稼動データに基づき特定される、装置５が正常に停止していた期間８０１を特定する。そして、稼動装置抽出部１２５は、その期間８０１以外の期間を、当該装置５が稼動していた期間（稼動期間）とみなす。稼動装置抽出部１２５は、その稼動期間における各装置５の状態データ８０２を全て抽出する。

このように、稼動装置抽出部１２５は、稼動中の装置５の状態データ（センシングデータ）を抽出する。センシングデータは通常、データ収集開始時刻から全期間にわたって収集されるが、分析対象システム１０は、実際の運用において常に稼動しているとは限らない。例えば、装置５は、計画的な停止、故障による停止、又は省エネルギー実践のための停止等を受ける場合がある。このような場合、全期間のセンシングデータが後述する分析モデル１０８の生成に利用されると、装置５は正常に停止しているにもかかわらず故障により停止していると判定される等することにより、分析モデル１０８の精度が低下することがある。したがって、分析モデル１０８の精度を低下させるような、正常に停止している装置５のセンシングデータは事前に除外しておくことが望ましい。従来、このような除外処理は利用者１１０が専門知識を備えていることを前提に当該利用者１１０が手作業で行っていた。しかし、稼動装置抽出部１２５によれば、このような除外処理を、利用者１１０が専門知識を有しているか否かにかかわらず自動で行うことができる。

（不要センサ除外及びセンタ選択）
次に、図５に示すように、装置分類部１３０は、稼動装置抽出部１２５から受信した各センサ６の状態データの時間的変化の特徴（パターン）を解析する（ｓ２３５）。具体的には、例えば、装置分類部１３０は、回帰分析法や、主成分分析法などに基づき状態データの時間的変化の特徴の解析を行う。

そして、装置分類部１３０は、ｓ２３５で解析した各特徴の違いに基づき（例えば、状態データ間の類似度や相関係数に基づき）、各装置５を複数のグループ（センサグループ）に分類する（ｓ２４０）。具体的には、例えば、装置分類部１３０は、回帰分析法により、互いに相関係数の高い（例えば相関係数が所定の閾値を超える）状態データの時間的変化を有する装置５のグループを同一のセンサグループに分類する。また、例えば、装置分類部１３０は、K-means法などに基づき、状態データの時間的変化の特徴が類似する装置５を同一のセンサグループに分類する。

なお、装置分類部１３０は、その値が所定期間中０である状態データが存在する場合には、その状態データに対応するセンサ６を解析の対象（センサグループの対象）から除外する。

装置分類部１３０は、各センサグループの装置５が正常に稼動していた過去の期間（以下、正常稼動期間という。）を設定する（ｓ２４５）。具体的には、例えば、装置分類部１３０は、分析要求１００に含まれている情報が示す故障発生日時の半年前から、その１年以上前の所定の日時までの期間を、正常稼動期間として設定する。

そして、装置分類部１３０は、ｓ２４５で設定した正常稼動期間における各センサグループの状態データと、特性値管理テーブル５４０に記録されているシステム特性とに基づき、分析モデル１０８を生成する（ｓ２５０）。

すなわち、装置分類部１３０は、分析対象システム１０の特徴に応じた、各センサ６の状態データが示す装置５の状態と、装置５がその状態にある時期との関係について、正常稼動期間を学習期間とした機械学習を行い、これに基づく分析モデル１０８を生成する。

なお、装置分類部１３０は、システム特性を、例えば、特性種別管理テーブル５２０又は特性値管理テーブル５４０から取得し、又は、後述する最適化処理により算出された特性値から取得する。また、装置分類部１３０は、例えば、回帰分析法、K-means法、又はK近傍法に基づき分析モデル１０８を生成してもよい。

装置分類部１３０は、ｓ２５０で生成した分析モデル１０８と、故障日時の情報等と各センサグループにおける状態データとに基づき、時間軸方向クレンジングで抽出した全期間を対象に、センサグループの異常度を算出する処理（以下、異常診断という。）を行う（ｓ２５５）。なお、装置分類部１３０は、ｓ２５０における分析モデル１０８の生成に採用したアルゴリズムと同様のアルゴリズムによって異常診断を行う。

異常度とは、状態データ間の解離の程度を示す値である。例えば、ある時点における異常度は、対象とするセンサグループにおけるある時点での状態データの値と、全センサグループにおける正常稼動期間での状態データの値との間の差異として規定することができる。例えば、異常診断のアルゴリズムに回帰分析法を用いた場合、装置分類部１３０は、前記異常度を、回帰曲線からの距離として算出する。

次に、図６のｓ３２０に示すように装置分類部１３０は、異常診断の結果に基づき、所定の日時の故障に対する各センサグループの関与の高さを示す指標（以下、故障相関度という。）を算出する。なお、ここで算出される故障相関度は、例えば、故障日時の異常度を、学習期間の異常度の平均値で除した値である。

そして装置分類部１３０は、この故障相関度が最も高い（例えば、故障相関度が所定の閾値を超える）センサグループを特定する。故障相関度の値が高いセンサグループは、分析対象装置の故障との関係が大きいと推定される。

なお、この処理で算出される故障相関度の値は、例えば、不要センサ除外及びセンサ選択において用いられるパラメータの内容によって異なる。例えば、前記の回帰分析法が用いられる場合、故障相関度は、ｓ２３５のパターン解析の対象とした状態データの期間によって異なる。そこで、例えば、ｓ３２０において高い値の故障相関度（例えば１０以上の故障相関度）が得られなかった場合は、装置分類部１３０は、ｓ２３５のパターン解析に用いた状態データの期間を変更して再度、同処理を繰り返してもよい。なお、このような解析処理の繰り返しに関しては、例えばシステム分析装置１２０等のリソースに余裕がある場合は、それぞれの解析処理が並列に実行されてもよい。また、装置分類部１３０は、解析処理に充分に時間をかけてもよい場合は、より高度な条件が満たされるまで（例えば、より高い値の故障相関度が得られるまで）、各解析処理を行ってもよい。さらに、装置分類部１３０は、複数回行った解析処理のうちもっとも高い故障相関度が得られた解析処理において分類されたセンサグループを、最終的なセンサグループとしてもよい。

また、ｓ２４５〜ｓ３２０における処理（以下、本段落では本処理という。）においては、センサグループの識別子、学習期間、センサグループの分類におけるクラスタ数、又は機械学習で採用したアルゴリズムなどの各パラメータが用いられる。これらのパラメータは、本処理において互いに依存しない関係にあるため、装置分類部１３０は、システム分析装置１２０等のリソースに余裕がある場合、これらのパラメータの値を変えた様々な組み合わせによる本処理を並列的に実行して分析モデル１０８を生成し、生成したこれらの分析モデル１０８のうち最も故障相関度が高かったパラメータの組み合わせに基づく分析モデル１０８を最終的に選択してもよい。また、装置分類部１３０は、上記組み合わせに基づき算出された故障相関度のランキングを作成して利用者１１０に提示し、利用者１１０に上記組み合わせを選択させることで、最終的な分析モデル１０８を特定してもよい。

装置分類部１３０は、ｓ２３５〜ｓ３２０で使用したデータ、パラメータ、及び分析モデル１０８の内容等を、履歴データ１５０に格納する（ｓ３２２）。例えば、装置分類部１３０は、履歴データ管理テーブル５１０に新たな履歴ＩＤのレコードを生成し、生成したレコードの故障相関度５１４に、ｓ３２０で算出した故障相関度を格納する。また、装置分類部１３０は、履歴データ管理テーブル５１０に新たなデータＩＤのレコードを生成し、生成したレコードのデータ５３６に、ｓ２３５〜ｓ３２０で使用したデータを格納する。

装置分類部１３０は、ｓ２４０でグループ化したセンサ６（装置５）の情報及び状態データを先後関係推定部１３５に送信する（ｓ３２３）。

なお、図９は、不要センサ除外及びセンサ選択に係る処理の一例を説明する図である。同図に示すように、センサ選択により、その時間的変化の特徴が類似する状態データ９０１及び状態データ９０３が「グループ１」のセンサグループに分類され（状態データ９０１及び状態データ９０３の相関度が高い）、状態データ９０２及び状態データ９０４が「グループ２」のセンサグループに分類される（状態データ９０２及び状態データ９０４の相関度が高い）。また、不要センサ除外により、その値が０である状態データ９０５はセンサグループから除外される（いずれの状態データとの相関度も低い）。

このように、装置分類部１３０は、状態データの時間的変化の特徴に応じてセンサ６（装置５）をグループ化する。センサ６は、故障の要因を特定するために様々な位置の装置５に設けられるので、分析対象システム１０が小規模である場合にはセンサ６同士が同様のデータ傾向を示す可能性が高いが、装置５が大規模な工場に設けられている場合等は、センサ６が同種のセンサであっても、その状態データの変化は、センサ６が設けられる箇所によって異なる傾向を示す可能性がある。したがって、装置５の状態を正しく把握するためには、センサ６の位置ではなくセンサ６の状態データの傾向に基づきセンサ６をグループ化することで、センサ６が取り付けられている装置５の空間的な特徴や機能的な特徴を把握することができ、装置５の故障の予兆を効果的に発見することができる。従来、このような装置５（センサ６）のグループ化は、当該分野の専門知識を有する者が手作業で行っていた。しかし、装置分類部１３０は、そのような者に依存することなく、装置５（センサ６）のグループ化を自動的に適切に行うことができる。

（時刻オフセット）
次に、図６のｓ３２５に示すように、先後関係推定部１３５は、ｓ３２３により受信した状態データ及び各センサグループの情報に基づき、各センサグループについて、最も故障に対する寄与が高いセンサ６（分析要求１００で特定される故障日時における故障に対する寄与が高いセンサ６）を特定する。なお、あるセンサ６の寄与度は、例えば、そのセンサ６が属するセンサグループの状態データの平均値の時間変化に対する、そのセンサ６の状態データの時間変化の類似度に基づき算出される。

そして、先後関係推定部１３５は、前記で特定した各センサ６のそれぞれの状態データについて、それぞれの状態データを正又は負の時間軸方向に所定時間シフトさせた状態データ（以下、シフト後状態データという。）をそれぞれ生成し、これらのシフト後状態データの間の相関度（例えば、相関係数等）を算出する。

先後関係推定部１３５は、このように、正又は負の時間軸方向に様々な時間分シフトさせた計算を複数回行い、このうちで相関係数が最も高かった計算（例えば、０．８以上の相関係数が得られた場合の計算）におけるシフトにより生成された各状態データ（すなわち、時刻オフセットを行った状態データ。なお、シフトの対象とならなかった他の状態データも同様にシフトを行ってもよい。）、及びその他ｓ３２５の処理で使用したデータやパラメータを履歴データ１５０に格納する（ｓ３２７）。また、先後関係推定部１３５は、ｓ３２５で生成した状態データ（時間をシフトさせた状態データ）をパラメータ最適化部１４０に送信する（ｓ３２８）。

以上のような時刻オフセットを行う意義は次の通りである。すなわち、分析対象システム１０の規模等によっては、ある装置５で発生した障害の影響が別の装置５で発現するまでに一定の時間を要する場合がある。この場合、ある時間における装置５間の状態データの相関はそれほど高くない場合でも、この発現にかかるまでの時間を考慮することで当該相関が高くなる場合がある。時刻オフセットは、このような場合に対応する処理である。

なお、前記の相関関係の算出はそれぞれ独立して行うことができるため、システム分析装置１２０等のリソースに余裕がある場合、先後関係推定部１３５は、これらの算出を並列的に実行してもよい。また、先後関係推定部１３５は、これらの計算結果を出力して利用者１１０に提示してもよい。

ここで、図１０は、時刻オフセットの処理の内容の一例を説明する図である。同図に示すように、センサグループ１００１（グループ１）及びセンサグループ１００２（グループ２）が、時刻ｘに処理を行う装置である装置ａに取り付けられたセンサ６に関連するセンサグループであり、センサグループ１００３（グループ３）及びセンサグループ１００４（グループ４）が、時刻ｘ＋ｔに処理を行う装置である装置ｎに取り付けられたセンサ６に関連するグループであるとする。この場合、センサグループ１００１及びセンサグループ１００２の状態データの時間変化を時刻ｔずらすと、それぞれセンサグループ１００３及びセンサグループ１００４の状態データの時間変化に類似する。したがって、先後関係推定部１３５は、グループ１及びグループ３は同一のセンサグループであり、グループ２及びグループ４は同一のセンサグループであると設定することができる。

このように、先後関係推定部１３５は、各センサグループ（センサ６）の状態データを時間軸方向にシフトする。すなわち、分析対象システム１０が小規模でありセンサ６間の距離が近い場合等は、実際に発生した各装置５の故障発生時期は各センサ６で観測される状態データの変動時期と同時、又は同一のサンプリング区間内であるが、分析対象システム１０が大規模である場合（例えば工場等に分散配置された装置の場合）は、ある装置５で起きた故障と、別の装置５で観測した故障とは、それぞれのセンサ６において同時に又は同一のサンプリング区間内で観測されず、その結果、装置５の故障の時期を正しく特定できない可能性がある。そこで、装置５が故障か否かを判断する場合においては、この故障の伝搬にかかる時間の考慮（時間差の考慮）が必要になる場合がある。先後関係推定部１３５は、このような時間差を状態データをシフトさせることで自動的に考慮し、調整することができる。

（最適化処理）
次に、図６のｓ３３０に示すように、パラメータ最適化部１４０は、履歴データ管理テーブル５１０を参照することにより、今回算出した故障相関度と、前回までの処理で算出した故障相関度（履歴データ管理テーブル５１０から取得される故障相関度）とを比較する。そしてパラメータ最適化部１４０は、今回算出した故障相関度の方が前回までの処理で算出した故障相関度より低い場合に、以下の最適化処理を行う。

すなわち、パラメータ最適化部１４０は、特性種別管理テーブル５２０を参照することにより、特性判定式における特性値を算出し、算出した特性値に基づき最適化処理を行う。

例えば、装置間順序特性値の場合、パラメータ最適化部１４０は、各センサグループ（又はセンサ６）の状態データの時間変化の特徴を解析し、解析した時間変化の特徴が現れる順に各センサグループ（又はセンサ６）を整列することにより装置間順序特性値を算出する。そしてパラメータ最適化部１４０は、この特性値に基づき、再度データクレンジング（具体的には、例えば、装置分類部１３０以降の処理）を実行させる。

また、装置間距離特性値の場合、パラメータ最適化部１４０は、算出した装置間順序特性値に基づき、センサ６間、又はセンサグループ間の状態データの時間変化の時間差を、装置間距離特性値として算出する。そしてパラメータ最適化部１４０は、この特性値に基づき、再度データクレンジング（具体的には、例えば、装置分類部１３０以降の処理）を実行させる。

また、故障頻度特性値の場合、パラメータ最適化部１４０は、装置分類部１３０が算出したセンサグループのうち、分析要求１００が示す故障日時以前に、所定の閾値以上の故障相関度を有するセンサグループがあった時期（時間帯）を全て特定し、特定した時期（時間帯）の数を故障頻度特性値として算出する。そしてパラメータ最適化部１４０は、この故障頻度特性値が１以上であった場合に、特定した各時期（時間帯）の前後の所定期間を、分析モデル１０８の生成の対象とする期間（学習期間）から除外することを前提とするデータクレンジング（具体的には、例えば、稼動装置抽出部１２５以降の処理）を再度実行させる。

また、特性変化特性値の場合、例えば、パラメータ最適化部１４０は、装置５について発生した停止期間のそれぞれについて特性変化特性値を算出し、算出した特性変化特性値に基づき、その特定変化特性値に係る装置５の停止期間の前後で、異なる分析モデル１０８を生成することを前提とするデータクレンジング（具体的には、例えば、稼動装置抽出部１２５以降の処理）を再度実行させる。これにより、例えば、装置５の停止前後や季節変動により装置５の動作の傾向が変わった場合であっても、システム分析装置１２０は適切な分析モデル１０８を生成することができる。

また、システム規模特性値の場合、例えば、パラメータ最適化部１４０は、算出したシステム規模特性値が所定の閾値を超える場合には、学習期間のうち、状態データの変動が少ない又は無い期間（例えば、状態データの変動幅が所定値未満の期間）を特定し、特定した期間の前の所定期間におけるセンサ６の状態データに基づき分析モデル１０８を生成することを前提とするデータクレンジングを再度実行させる。すなわち、分析対象システム１０の規模が大きい場合、処理の前段にある装置５の障害が解決すれば後段の処理を行う装置５の障害に影響しなくなる可能性が高いため、前段の処理を行う装置５に関してのみ機械学習を行って分析モデル１０８を生成するデータクレンジング（具体的には、例えば、装置分類部１３０以降の処理）を再度実行させる。

なお、図１１は、最適化処理の内容の一例を説明する図である。同図に示すように、最適化処理は、前記に説明した装置間順序特性値、装置間距離特性値、システム規模特性値、故障頻度特性値、又は特性変化特性値により特定されるシステム特性に基づき、データクレンジング及び分析モデル１０８の生成を行う。

パラメータ最適化部１４０は、以上のような最適化処理を、前記で説明したように、故障相関度の向上が見込めなくなるまで繰り返す（ｓ４１０）。

このように、パラメータ最適化部１４０は、稼動装置抽出部１２５、装置分類部１３０、及び先後関係推定部１３５の各機能部の処理結果に基づきシステム特性を推定し、この各機能部の少なくともいずれかにパラメータ上の制約を与えることで、分析モデル１０８を最適化する。このような処理の繰り返し（最適化処理）は、従来、システム分析の技術者が、専門技術者と議論しながら行ってきたため、負荷の高い作業であったが、パラメータ最適化部１４０は、このような最適化処理を自動的にかつ的確に行うことができる。

すなわち、システム分析装置１２０は、従来は専門分野の技術者等が知識や経験に基づき与えていた機器やシステムの特性を自動的に発見し、さらにその結果に基づき最適化処理を行うことで、分析システムにおける装置５の状態やシステム特性を的確に把握することができる。また、この最適化処理において算出された特性値は、履歴テーブル１４０により、履歴ＩＤや分析結果と対応づけて管理されるため、システム分析装置１２０は、過去の分析結果と現在の分析結果との比較を行うことで、さらなる最適化を行い各パラメータを調整することができる。これにより、分析モデル１０８の最適化にかかる時間を減じることができる。

次に、パラメータ最適化部１４０は、作業管理テーブル５５０に登録されている各種のデータやパラメータのうち、分析結果１０６（根拠データ１０５及び分析モデル１０８）を構成するデータ及びパラメータを、履歴データ管理テーブル５１０に登録する（ｓ４１５）。

具体的には、例えば、パラメータ最適化部１４０は、ある参照ＩＤの値が参照ＩＤ５５３に格納されている作業管理テーブル５５０のレコードの各項目を、履歴データ管理テーブル５１０の新たなレコードの各項目に格納し、また、履歴データ管理テーブル５１０のレコードの参照ＩＤ５１２に前記の参照ＩＤの値を格納する。

そして、パラメータ最適化部１４０は、分析結果１０６を出力し、利用者１１０に提示するよう、分析モデル出力部１４５及び状態予測出力部１４７に指示する（ｓ４２０）。具体的には、例えば、パラメータ最適化部１４０は、生成した分析モデル１０８の内容を出力するよう分析モデル出力部１４５に指示し、分析モデル出力部１４５はその内容を出力する。例えば、分析モデル出力部１４５は、分析モデル１０８により推定される、分析対象装置が故障する時期を示す情報を出力する。

また、パラメータ最適化部１４０は、ｓ４１５で履歴データ１５０に保管した内容を根拠データ１０５として出力するよう状態予測出力部１４７に指示し、状態予測出力部１４７はその内容を出力する。

利用者１１０は、出力された分析結果１０６を確認し、適切な分析モデル１０８が作成されていることを確認する（ｓ４２５）。

パラメータ最適化部１４０は、適切な分析モデル１０８が作成されているか否かの入力を利用者１１０から受け付ける。適切な分析モデル１０８が作成された旨の入力がなされた場合（「ＯＫ」）、パラメータ最適化部１４０は、履歴データ管理テーブル５１０の採用フラグ５１５に所定の値を格納する。

一方、適切な分析モデル１０８が作成されていない旨の入力がなされた場合（「Ｒｅｔｒｙ」）、パラメータ最適化部１４０は、履歴データ管理テーブル５１０に新たなレコードを生成し、生成したレコードの各項目に、参照ＩＤ内の情報作業管理テーブル５５０にコピーした後に、ｓ３３０からの処理を再度実行する（ｓ４３０）。

以上に説明したように、本実施形態のシステム分析装置１２０によれば、状態データを複数の装置５について取得し、複数の装置５のそれぞれを、装置５の状態の変化の特徴に応じてグループ（センサグループ）に分類し、各グループにおける各装置５が行う処理の時間的先後関係を推定し、グループにおける各装置５の状態の時間的変化を予測する分析モデル１０８を生成し、その内容を示す情報を出力するので、利用者１１０等は、この分析モデル１０８に基づき、状態変化のパターンが類似する装置５のグループごとに、装置５の状態の時間的変化を推定することができる。このように、本実施形態のシステム分析装置１２０によれば、作業者等は、システム（分析対象システム１０）について専門的な知識を有していなくても、システムの状態を的確に分析することが可能となる。例えば、従来、機器やシステムの故障箇所や故障の予兆を発見する場合は、機器やシステムの特性を熟知した技術者と、分析技術に熟知した技術者が不可欠であり、この専門領域の異なる両者が密に連携し、試行錯誤を経て分析モデルを作成する必要があった。そのため、その分析モデルの作成は当該分野の技術者の知識や経験に依存し、かつ開発に長い期間が必要だったが、本実施形態のシステム分析装置１２０によれば、そのような負担を軽減することができる。そして、このように、機器やプラントの故障やその予兆を迅速に把握することで、これらの運用者は、人員や交換部品に関わるコストの低減を行い、故障に伴うシステムへの影響やエンドユーザからの賠償といったリスクを低減させることが可能となる。

また、本実施形態のシステム分析装置１２０は、装置５の過去の所定の状態を示す情報の入力を受け付け、生成した分析モデル１０８に基づき、装置５が所定の状態に達する時間を推定し、推定した時間に関する情報を出力するので、利用者１１０等は、例えば装置５の過去の故障日時の情報を入力すれば、その装置５が将来故障する時期を予測することができる。これにより、利用者１１０等は、システム（分析対象システム１０）について専門的な知識を有していなくても、システムの状態を的確に予測することが可能となる。

また、本実施形態のシステム分析装置１２０は、稼動データを取得し、取得した稼動データと状態データとに基づき分析対象の状態データを取得し、取得した状態データに基づき、複数の装置５のそれぞれをグループに分類するので、稼働中の又は適切に停止している装置５のみに基づく分析モデル１０８を生成することができる。これにより、例えば、装置５に関して適切な分析を行った分析モデル１０８を生成することができる。

また、本実施形態のシステム分析装置１２０は、状態データに基づき、所定のシステム（分析対象システム１０）を特徴付けるパラメータである特性値を算出し、算出した特性値に基づき、修正した分析モデル１０８を生成するので、分析対象システム１０の特徴に応じた最適な分析モデル１０８を生成することができる。これにより、利用者１１０等は、システムについて専門的な知識を有していなくても、システムの状態を的確に分析することが可能となる。

例えば、本実施形態のシステム分析装置１２０は、特性値として、装置５間の処理の時間的先後関係を示すパラメータ（装置間順序特性値）を算出し、算出したパラメータに基づき、前記先後関係を満たす、修正した分析モデル１０８を生成するので、分析対象システム１０における装置５の処理順序を正しく反映した分析モデル１０８を生成することができる。

また、例えば、本実施形態のシステム分析装置１２０は、特性値として、所定のシステム（分析対象システム１０）における全ての処理が終了するまでに要する時間を示すパラメータ（システム規模特性値）を算出し、算出したパラメータが所定の閾値を超える場合に、前記時間のうち一部の期間における状態データに基づき修正した分析モデル１０８を算出するので、分析対象システム１０の規模が大きい場合であっても必要な期間の状態データのみに基づき迅速に分析モデル１０８を生成することができる。

また、例えば、本実施形態のシステム分析装置１２０は、特性値として、装置５が所定の状態に達していた頻度を示すパラメータ（故障頻度特性値）を算出し、算出したパラメータに基づき分析モデル１０８の分析期間を特定し、特定した分析期間における分析モデル１０８を修正した分析モデル１０８として生成するので、分析モデル１０８を機械学習させる場合に適切な期間（例えば装置５が故障していた期間を除外した区間）のみに基づき分析モデル１０８を生成することで、より適切な分析モデル１０８を生成することができる。

また、例えば、本実施形態のシステム分析装置１２０は、特性値として、所定のイベントの前後の所定期間における状態データの特徴の違いを示すパラメータ（特性変化特性値）を算出し、算出したパラメータが所定の条件を満たす場合に、所定のイベントの前後の時期における分析モデル１０８を、修正した分析モデル１０８としてそれぞれ算出するので、例えば、所定のイベントとして装置５の停止期間や所定の季節等の期間を指定することで、その期間の特徴の違いに応じた適切な種類の分析モデル１０８を生成することができる。

なお、特性値は、各専門分野の技術者の知見を一般化した情報である。従来の分析方法では、専門技術者の知見を一般化又はルール化するには、当該分野ごとの専門技術者が、専門的な用語や定義をそのつど解釈してこれらを数式その他プログラムで処理可能な形式に変換する必要があったが、このような抽象化や抽出の作業は非常に困難であった。しかし、本実施形態のシステム分析装置１２０は、このような抽象化や抽出の工程を加味した汎用性の高い特性値を利用しているため、様々な専門分野においてこれらを適用することができる。

＜分析システム１の他のシステム構成＞
ところで、以上に説明した分析システム１では、利用者１１０が、センサ６に関する情報を含む分析要求１００をシステム分析装置１２０に入力することを前提としていたが、システム分析装置１２０は、分析要求１００を、分析対象システム１０から自動的に取得するようにしてもよい。

図１２は、分析システム１の他の構成の一例を示す図である。同図に示すように、この分析システム１は、センサ６が所定のタイミング又は所定の時間間隔等で装置５の状態データを稼動データと共に取得し、取得したこれらのデータを処理データ１０２としてシステム分析装置１２０に送信する。また、システム分析装置１２０と異なる情報処理装置８が、所定のタイミング又は所定の時間間隔等で分析対象データ１０４をシステム分析装置１２０に送信する。このような分析システム１の構成によれば、利用者１１０等は、システムの状態を迅速かつ的確に分析することが可能となる。

以上、本発明は、上記した実施形態に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施形態の構成の一部を他の実施形態の構成に置き換えることが可能であり、また、ある実施形態の構成に他の実施形態の構成を加えることも可能である。また、各実施形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。

例えば、本実施形態では、分散履歴データ１５０の実装の例として、ソフトウェア的に実現されるリレーショナルデータベース（ＤＢ）を挙げたが、リレーショナルＤＢは、データ間の関係を記述するために用い、実際のデータはファイルサーバやキーバリューストア、又は時系列データベース等に格納し又は管理するようにしてもよい。

また、本実施形態で説明した特性値は、本実施形態で説明した内容に限らず、状態データから計算式やプログラムに基づき算出される特性値であれば、どのような特性値でもよい。

また、本実施形態の分析システム１は、各専門分野の技術者が従来行ってきたパラメータの調整作業を機械化し、様々なパラメータの設定パターンを並列実行して分析モデル１０８を生成することが好ましいので、複数の物理サーバや仮想サーバから構成される分散実行環境を備えていることが望ましい。例えば、本実施形態で説明したシステム分析装置１２０の各機能は、物理サーバ、仮想サーバ、又はコンテナを利用した一台または複数台の情報処理装置により実現されてもよい。ここで物理サーバは、ＣＰＵ、メモリ、バス、記憶装置、ＯＳ（Operating System）、ネットワークインタフェース等から構成される計算機システムであり、仮想サーバは上記のＣＰＵ、メモリ、バス、記憶装置、ＯＳ、ネットワークインタフェース等を、ソフトウェアによる論理的分割や、ハードウェアを用いた回路的分割を行うことで、一台のサーバを複数台のサーバに見せかけて動作させるものである。コンテナはＯＳ上のプロセス空間を分離し、ＯＳ上のアプリケーションが個別のＯＳ上で動作しているように見せかけて動作させる技術である。

１分析システム、５装置、６センサ、１０８分析モデル、１２０システム分析装置、１３０装置分類部、１３５先後関係推定部、１４２分析モデル生成部、１４５分析モデル出力部

Claims

プロセッサ及びメモリを備えるシステム分析装置であって、
複数の装置を含んで構成される所定のシステムにおいて、前記装置の状態を時系列的に示すデータである状態データを前記複数の装置のそれぞれについて取得し、取得した前記状態データに基づき、前記複数の装置のそれぞれを、前記装置の状態の変化の特徴に応じて少なくとも１つ以上のグループに分類する装置分類部と、
前記取得した状態データに基づき、前記グループにおける各前記装置が行う処理の時間的先後関係を推定する先後関係推定部と、
前記分類したグループ、及び前記推定した時間的先後関係に基づき、前記グループにおける各装置の状態の時間的変化を予測するモデルである分析モデルを生成する分析モデル生成部と、
前記生成した分析モデルの内容を示す情報を出力する分析モデル出力部とを備え、
前記分析モデル生成部は、前記推定した時間的先後関係に基づき、前記所定のシステムにおける全ての前記処理が終了するまでに要する時間を示す特性値を算出し、算出した特性値が所定の閾値を超える場合に、前記分析モデルに係る期間のうち前記状態データの変動幅が所定値未満である期間の前の期間における各前記装置の状態データに基づく、修正した前記分析モデルを、所定の日時の前記装置の故障に対する各前記グループの関与の高さを示す指標が最適化されるような前記特性値を特定することで生成するパラメータ最適化部を備える、
システム分析装置。
前記装置の過去の所定の状態を示す情報の入力を受け付ける情報入力部と、
前記入力された装置の状態の情報、及び前記生成した分析モデルに基づき、前記装置が前記所定の状態に達する時間を推定し、推定した前記時間に関する情報を出力する状態予測出力部と、
を備える、請求項１に記載のシステム分析装置。
前記装置が稼動中又は停止中であることを示すデータである稼動データを取得し、取得した前記稼動データと前記取得した状態データとに基づき、分析対象の前記状態データを取得する稼動装置取得部を備え、
前記装置分類部は、前記取得した分析対象の状態データに基づき、前記複数の装置のそれぞれを、前記少なくとも１つ以上のグループに分類する、請求項１に記載のシステム分析装置。
前記分析モデル生成部は、前記推定した時間的先後関係に基づき、各前記グループにおける各前記装置の状態データの時間変化の特徴を解析し、解析した時間変化の特徴が現れる順に各前記グループを整列することにより算出される、前記装置間の処理の時間的先後関係を示す特性値に基づき、修正した前記分析モデルを、所定の日時の前記装置の故障に対する各前記グループの関与の高さを示す指標が最適化されるような前記特性値を特定することで生成するパラメータ最適化部を備える、
請求項１に記載のシステム分析装置。
前記分析モデル生成部は、各前記グループのうち所定日時の前記装置の故障に対する相関度が所定の閾値以上のグループがあった時期の数を表す特性値が所定値以上であった場合に、前記分析モデルに係る期間のうち、各前記時期の前後の所定期間を除いた期間を対象として修正した前記分析モデルを、所定の日時の前記装置の故障に対する各前記グループの関与の高さを示す指標が最適化されるような前記特性値を特定することで生成するパラメータ最適化部を備える、
請求項１に記載のシステム分析装置。
前記分析モデル生成部は、各イベントの前後の所定期間における前記状態データの特徴の違いを示す特性値に基づき特定される前記各イベントの前後で異ならせた、修正した前記分析モデルを、所定の日時の前記装置の故障に対する各前記グループの関与の高さを示す指標が最適化されるような前記特性値を特定することで生成するパラメータ最適化部を備える、
請求項１に記載のシステム分析装置。
前記装置の過去の所定の状態を示す情報の入力を受け付ける情報入力部と、
前記入力された装置の状態の情報、及び前記生成した分析モデルに基づき、前記装置が前記所定の状態に達する時間を推定し、推定した前記時間に関する情報を出力する状態予測出力部と、
前記装置が稼動中又は停止中であることを示すデータである稼動データを取得し、取得した前記稼動データと前記取得した状態データとに基づき、分析対象の前記状態データを取得する稼動装置取得部とをさらに備え、
前記装置分類部は、前記取得した分析対象の状態データに基づき、前記複数の装置のそれぞれを、前記少なくとも１つ以上のグループに分類し、
前記分析モデル生成部は、
前記推定した時間的先後関係に基づき、各前記グループにおける各前記装置の状態データの時間変化の特徴を解析し、解析した時間変化の特徴が現れる順に各前記グループを整列することにより算出される、前記装置間の処理の時間的先後関係を示す特性値に基づき、修正した前記分析モデルを、所定の日時の前記装置の故障に対する各前記グループの関与の高さを示す指標が最適化されるような前記特性値を特定することで生成し、
各前記グループのうち所定日時の前記装置の故障に対する相関度が所定の閾値以上のグループがあった時期の数を表す特性値が所定値以上であった場合に、前記分析モデルに係る期間のうち、各前記時期の前後の所定期間を除いた期間を対象として修正した前記分析モデルを、所定の日時の前記装置の故障に対する各前記グループの関与の高さを示す指標が最適化されるような前記特性値を特定することで生成し、
各イベントの前後の所定期間における前記状態データの特徴の違いを示す特性値に基づき特定される前記各イベントの前後で異ならせた、修正した前記分析モデルを、所定の日時の前記装置の故障に対する各前記グループの関与の高さを示す指標が最適化されるような前記特性値を特定することで生成する、
パラメータ最適化部を備える、
請求項１に記載のシステム分析装置。
システム分析方法であって、
プロセッサ及びメモリを備える情報処理装置が、
複数の装置を含んで構成される所定のシステムにおいて、前記装置の状態を時系列的に示すデータである状態データを前記複数の装置のそれぞれについて取得し、取得した前記状態データに基づき、前記複数の装置のそれぞれを、前記装置の状態の変化の特徴に応じて少なくとも１つ以上のグループに分類する装置分類処理と、
前記取得した状態データに基づき、前記グループにおける各前記装置が行う処理の時間的先後関係を推定する先後関係推定処理と、
前記分類したグループ、及び前記推定した時間的先後関係に基づき、前記グループにおける各装置の状態の時間的変化を予測するモデルである分析モデルを生成する分析モデル生成処理と、
前記生成した分析モデルの内容を示す情報を出力する分析モデル出力処理と、
を実行し、
前記分析モデル生成処理において、前記推定した時間的先後関係に基づき、前記所定のシステムにおける全ての前記処理が終了するまでに要する時間を示す特性値を算出し、算出した特性値が所定の閾値を超える場合に、前記分析モデルに係る期間のうち前記状態データの変動幅が所定値未満である期間の前の期間における各前記装置の状態データに基づく、修正した前記分析モデルを、所定の日時の前記装置の故障に対する各前記グループの関与の高さを示す指標が最適化されるような前記特性値を特定することで生成するパラメータ最適化処理を実行する、
システム分析方法。