WO2019012654A1

WO2019012654A1 - 分析システム、分析方法及び記憶媒体

Info

Publication number: WO2019012654A1
Application number: PCT/JP2017/025560
Authority: WO
Inventors: 昌尚棗田
Original assignee: 日本電気株式会社
Priority date: 2017-07-13
Filing date: 2017-07-13
Publication date: 2019-01-17
Also published as: JPWO2019012654A1; US20210373542A1; US11755004B2; JP6922983B2

Abstract

入力された時系列データに対してイベント種別の分類を行う分類器を含む分析部と、前記時系列データのうちのイベント種別の対応付けが未確定である第１の時系列データであって、前記分類器によって対象イベントが発生している状態に対応する第１のイベント種別であると分類された第１の時系列データと、前記第１のイベント種別に対応付けられている第２の時系列データと、前記対象イベントが発生していない状態に対応する第２のイベント種別に対応付けられている第３の時系列データと、を表示させるための第１の表示情報を生成する表示情報生成部と、前記第１の時系列データに対するイベント種別の対応付けに関する第１の入力を受け付ける入力部と、を備えることを特徴とする分析システムが提供される。

Description

分析システム、分析方法及び記憶媒体

　本発明は、分析システム、分析方法及び記憶媒体に関する。

　プラントの管理等に用いられる異常検出手法に関する種々の検討が行われている。特許文献１のイベント解析装置は、発生日時と機器識別子とイベント種別識別子とを含むイベントログに基づいてベイジアンネットワークを生成するベイジアンネットワーク生成部を有する。イベント解析装置は、ベイジアンネットワークを利用して機器イベントの解析を行うことができ、イベントの因果関係を把握することができる。

　特許文献２のプラント監視装置は、点検作業実施時に点検作業の属性を識別した点検実施信号をプラントから入力する点検実施信号入力部を有する。点検実施信号の入力の有無により、プロセス信号の異常が検出された際にその異常が点検に起因するものであるか否かを判定でき、異常解析の作業負担を軽減することができる。

特開２０１４－２１１８３７号公報特開２０１４－２３５６０３号公報

　特許文献１及び特許文献２に記載の技術において、データとイベントの関連付けに要する作業量が多く、管理負担が大きいことが課題となり得る。

　本発明は、上述の課題に鑑みて行われたものであって、管理負担を低減することが可能な分析システム、分析方法及び記憶媒体を提供することを目的とする。

　本発明の１つの観点によれば、入力された時系列データに対してイベント種別の分類を行う分類器を含む分析部と、前記時系列データのうちのイベント種別の対応付けが未確定である第１の時系列データであって、前記分類器によって対象イベントが発生している状態に対応する第１のイベント種別であると分類された第１の時系列データと、前記第１のイベント種別に対応付けられている第２の時系列データと、前記対象イベントが発生していない状態に対応する第２のイベント種別に対応付けられている第３の時系列データと、を表示させるための第１の表示情報を生成する表示情報生成部と、前記第１の時系列データに対するイベント種別の対応付けに関する第１の入力を受け付ける入力部と、を備えることを特徴とする分析システムが提供される。

　本発明によれば、管理負担を低減することが可能な分析システム、分析方法及び記憶媒体を提供することができる。

本発明の第１実施形態に係るプラント及び分析システムの全体構成を示す概略ブロック図である。本発明の第１実施形態に係る分析システムのハードウェア構成例を示すブロック図である。本発明の第１実施形態に係る記憶部及びイベント種別入力部の機能構成を示すブロック図である。本発明の第１実施形態に係る時系列データの例を示すグラフである。本発明の第１実施形態に係るイベント種別入力の概略を示すフローチャートである。本発明の第１実施形態に係るイベント種別入力のための画面例である。本発明の第１実施形態に係るイベント種別入力のための画面例である。本発明の第１実施形態に係るイベント種別入力のための画面例である。本発明の第１実施形態に係るイベント種別入力のための画面例である。本発明の第１実施形態に係るイベント種別入力のための画面例である。本発明の第１実施形態に係るイベント種別入力のための画面例である。本発明の第１実施形態に係るイベント種別入力のための画面例である。本発明の第１実施形態に係るイベント種別入力方法の例を示すフローチャートである。本発明の第１実施形態に係るイベント種別入力方法の例を示すフローチャートである。本発明の第１実施形態に係るイベント種別入力方法の例を示すフローチャートである。本発明の第２実施形態に係る学習部及び記憶部の機能構成を示すブロック図である。本発明の第２実施形態に係る分類器の学習動作を示すフローチャートである。本発明の第２実施形態に係る分析部及び記憶部の機能構成を示すブロック図である。本発明の第２実施形態に係るイベントの判別動作を示すフローチャートである。本発明の第３実施形態に係る分析システムの機能構成を示すブロック図である。

　以下、図面を参照して、本発明の実施形態を説明する。なお、以下で説明する図面において、同一の機能又は対応する機能を有する要素には同一の符号を付し、その繰り返しの説明は省略することもある。

　［第１実施形態］
　本発明の第１実施形態による分析システム２について説明する。まず、本実施形態による分析システム２及び分析の対象であるプラント１を含む概略構成について図１を用いて説明する。図１は、本実施形態に係るプラント１及び分析システム２の全体構成を示す概略ブロック図である。

　図１に示されるようにプラント１には、プラント１の状態を分析する分析システム２が有線又は無線により通信可能に接続されている。プラント１は、例えば、化学プラント、発電所、医薬品工場、組み立て工場等であり得る。分析システム２は、例えば、プラント１の監視装置であり得る。

　プラント１には、プラント１内に設置される装置の状態、配管を流れる流体の状態等を監視するための複数のセンサ１１及び時刻取得部１２が設けられている。センサ１１は、例えば、温度センサ、湿度センサ、圧力センサ、流量センサ等であり得る。図１では３個のセンサ１１が図示されているが、これは例示であり、センサ１１の個数は任意である。

　時刻取得部１２は、複数のセンサ１１の出力データをデータ出力時刻と対応付けられた時系列データとするために用いられる現在時刻を取得する。時刻取得部１２は、例えば、複数のセンサ１１の制御装置に設けられたリアルタイムクロックであり得る。このような構成により、プラント１は分析システム２に複数のセンサ１１の出力に基づく時系列データを供給する。当該時系列データは、例えば、プラント１内に設けられた装置内の温度、湿度等の測定値の時系列データ、プラント１内に設けられた配管内の圧力、流量等の測定値の時系列データ等であり得る。なお、図１のように複数のセンサ１１に対して１つの時刻取得部１２が設けられる構成であってもよいが、複数のセンサ１１にそれぞれ対応する複数の時刻取得部１２が設けられる構成であってもよい。また、時刻取得部１２は分析システム２側に設けられていてもよい。

　分析システム２は、学習部２１、分析部２２、記憶部２３及びイベント種別入力部２４を備えている。記憶部２３は、プラント１から出力された時系列データをプラント１の状態を示すデータとして記憶する。イベント種別入力部２４は、所定の期間に区分された時系列データの各期間に、プラント１で発生したイベントの種別を対応付ける入力インターフェースである。当該イベント種別の対応付けは、分析システム２の管理者により入力される。これにより、記憶部２３は、イベント種別が対応付けられた状態の時系列データを記憶する。なお、「イベント」とは、各時刻におけるプラント１の状態を意味する。例えば、プラント１内で点検作業員による設備、配管等の点検作業が行われている状態、作業員による設備のマニュアル作業が行われている状態等は、「イベント」の一種である。また、後述するように、通常運転状態及び異常運転状態も「イベント」に含まれる。

　学習部２１は、記憶部２３に記憶された時系列データを特徴量に変換し、当該特徴量とこれに対応付けられたイベント種別とを教師データとして用いて、複数の分類器の機械学習を行う。本明細書では、機械学習のことを単に学習と呼ぶこともある。学習済みの複数の分類器は、例えば記憶部２３に記憶される。分析部２２は、記憶部２３に記憶された時系列データを特徴量に変換し、学習部２１での学習により得られた複数の分類器を用いて当該特徴量に対応するイベントの分類を行い、プラント１で発生したイベントの判別を行う。本実施形態の分析システム２は、プラント１で発生したイベントの種別（例えば、正常運転、点検作業、異常運転等）を自動で判別することができ、プラント１の異常検出等を行うことができる。

　図１に示す構成は一例であり、プラント１で得られた時系列データの分析が可能であればその構成は適宜変更可能である。例えば、分析システム２はプラント１の内部に設けられる構成であってもよく、学習部２１が分析システム２の外部に学習システムとして設けられる構成であってもよい。

　本実施形態による分析システムのハードウェア構成例について図２を用いて説明する。図２は、第２実施形態に係る分析システム２のハードウェア構成例を示すブロック図である。なお、分析システム２は、単一の装置により構成されていてもよいし、有線又は無線で通信可能に接続された２つ以上の物理的に分離された装置により構成されていてもよい。

　分析システム２は、図２に示されるように、ＣＰＵ（Central　Processing　Unit）２００２と、ＲＯＭ（Read　Only　Memory）２００４と、ＲＡＭ（Random　Access　Memory）２００６と、ＨＤＤ（Hard　Disk　Drive）２００８とを備えている。また、分析システム２は、通信インターフェース（Ｉ／Ｆ（Interface））２０１０を備えている。また、分析システム２は、ディスプレイコントローラ２０１２と、ディスプレイ２０１４とを備えている。更に、分析システム２は、入力装置２０１６を備えている。ＣＰＵ２００２、ＲＯＭ２００４、ＲＡＭ２００６、ＨＤＤ２００８、通信Ｉ／Ｆ２０１０、ディスプレイコントローラ２０１２及び入力装置２０１６は、共通のバスライン２０１８に接続されている。

　ＣＰＵ２００２は、分析システム２の全体の制御及び演算処理を行う。ＣＰＵ２００２は、ＨＤＤ２００８等に記憶されたプログラムをＲＡＭ２００６にロードして実行することにより、分析システム２における各部の機能を実現する。

　ＲＯＭ２００４には、ブートプログラム等のプログラムが記憶されている。ＲＡＭ２００６は、ＣＰＵ２００２がプログラムを実行する際のワーキングエリアとして使用される。また、ＨＤＤ２００８には、ＣＰＵ２００２が実行するプログラムが記憶されている。

　また、ＨＤＤ２００８は、記憶部２３等の分析システム２における記憶機能を実現する記憶装置である。なお、分析システム２に用いられる記憶装置は、不揮発性であればＨＤＤ２００８に限定されるものではなく、例えばフラッシュメモリ等であってもよい。

　通信Ｉ／Ｆ２０１０は、ネットワークを介したプラント１との間のデータの通信を制御する。ディスプレイコントローラ２０１２には、表示部としての機能を提供するディスプレイ２０１４が接続されている。ディスプレイコントローラ２０１２は、ＣＰＵ２００２とともに表示させる画像に関するデータを出力する出力部として機能し、出力されたデータに基づく画像がディスプレイ２０１４に表示される。

　入力装置２０１６は、ユーザがイベント種別入力部２４への入力を行うためのキーボード、マウス等のハードウェアである。入力装置２０１６は、ディスプレイ２０１４に組み込まれたタッチパネルであってもよい。分析システム２の管理者は、入力装置２０１６を介して、分析システム２へのイベント種別の入力、処理の実行指示の入力等を行うことができる。

　なお、分析システム２のハードウェア構成は、上述した構成に限定されるものではなく、種々の構成とすることができる。

　図３は、本実施形態に係る記憶部２３及びイベント種別入力部２４の機能構成を示すブロック図である。記憶部２３は、時系列データ記憶部２３１、イベント種別記憶部２３２、特徴量記憶部２３３、教師データ記憶部２３４及び分類器記憶部２３５を備える。イベント種別入力部２４は表示情報生成部２４１及び入力部２４２を備える。

　時系列データ記憶部２３１は、複数のセンサ１１から出力された時系列データを記憶する。図４を参照して時系列データの例を説明する。図４は、本実施形態に係る時系列データの例を示すグラフである。図４には、センサ１１による計測値の時間変動が３個分例示されている。図４のグラフの縦軸はセンサ１１の計測値であり、単位は任意である。図４のグラフの横軸は時刻取得部１２で取得された時刻である。図４に示されるように、時系列データは、Ｎ個の所定の期間（Ｔ１、Ｔ２、Ｔ３、…、ＴＮ）に区分されている。各区間のデータをＮ個の別のデータとして扱い、センサ１１の個数をＭ個とすると、時系列データ記憶部２３１に記憶されている時系列データには、Ｚ＝Ｎ×Ｍ個のデータが含まれていると言える（Ｎは２以上、Ｍは１以上の整数）。

　なお、時系列データ記憶部２３１にセンサ１１による計測値が記憶される際には、後述する特徴量の変換に適するように、デジタルデータへの変換が行われる。具体的には、不図示のアナログデジタル変換器により、センサ１１による計測値の時系列データに対して標本化、量子化等の処理が行われ、デジタルデータに変換される。

　イベント種別記憶部２３２は、分析システム２の管理者によりイベント種別入力部２４に入力された、各期間に対応するイベント種別を記憶する。イベント種別の入力は、例えば、分類の対象にしようとしているイベント（対象イベント）と、その発生時刻とを管理者がイベント種別入力部２４に入力することによりなされ得る。入力する対象イベントの種別は複数個であってもよい。同時刻に複数の対象イベント（対象イベントＡ及び対象イベントＢとする）が重複して発生した場合には、対象イベントＡ及び対象イベントＢとは別の対象イベントＣが発生したものとして取り扱うことができる。このイベント種別の入力についての詳細は後述する。

　特徴量記憶部２３３は、時系列データ記憶部２３１に記憶されている時系列データから算出された１つ又は複数の特徴量を記憶する。特徴量の例としては、該当期間内（例えば期間Ｔ１内）におけるセンサ１１による計測値の分散、標準偏差、最大値と最小値の差（レンジ）、勾配、平均等の統計量が挙げられる。１つのデータごとに算出される特徴量の個数をＫ個（Ｋは１以上の整数）とすると、算出される特徴量の個数は、Ｎ個の期間のそれぞれに対しＭ×Ｋ個、すなわち合計Ｎ×Ｍ×Ｋ個である。

　ここで、管理者が何らかのイベントの発生を入力しなかった時間帯、例えば、プラント１が通常運転を行っている時間については、対象イベントとは別の種別のイベントが発生したものとして扱われる。このイベントは、非対象イベントと呼ばれる。すなわち、対象イベントとして、対象イベントＡ及び対象イベントＢが定義されていた場合、イベント種別は、対象イベントＡ、対象イベントＢ及び非対象イベントＸの３種類となる。また、対象イベントは第１のイベント種別と呼ばれることもあり、非対象イベントは第２のイベント種別と呼ばれることもある。

　教師データ記憶部２３４は、学習部２１に含まれる分類器に対して教師あり機械学習を行わせるための教師データを記憶する。教師データは、特徴量記憶部２３３に記憶されている特徴量と、イベント種別記憶部２３２に記憶されているイベント種別とをそれぞれの時刻又は期間に基づいて対応付けることにより生成される。

　分類器記憶部２３５は、教師データ記憶部２３４に記憶されている教師データを用いて教師あり機械学習を行うことにより得られた分類器を記憶する。ここで行われる教師あり機械学習は、教師データのうちの特徴量を分類の推定のために必要なデータとし、イベント種別を特徴量に基づいて推定されるべき正解（教師）とするものである。教師あり機械学習に用いられる手法としては、例えば、サポ－トベクターマシン、ランダムフォレスト、ニューラルネットワーク等が挙げられる。分類器は複数個（Ｐ個とする）であり得る。Ｐ個の分類器の学習を、組み合わせが互いに異なる一部のデータを用いて行うことにより、生成されるＰ個の分類器は、同一種類ではあるが、分類基準が互いに異なる分類器となり得る。

　表示情報生成部２４１は、分析システム２の管理者にイベント種別の入力を行わせるためのデータ及びＧＵＩ（Graphical　User　Interface）をディスプレイ２０１４に表示させるための表示情報を生成する。入力部２４２は、ディスプレイ２０１４に表示されたＧＵＩへのイベント種別の対応付けの入力を受け付ける。入力されたイベント種別の対応付けはイベント種別記憶部２３２に記憶される。

　本実施形態は、時系列データのうちの一部に対しては既にイベント種別が対応付けられており、これを教師データとした学習済みの分類器が生成されている場合に、更に別の時系列データへのイベント種別の対応付けを追加するという状況に関するものである。イベント種別の対応付けを追加して教師データをより充実させて分類器の再学習を行うことで、分類器の性能を向上させることができる。したがって、時系列データのうちの一部へのイベント種別の対応付け、分類器の学習等はあらかじめ行われているものとし、その手法は特に限定されるものではない。

　図５は、本実施形態に係るイベント種別入力の概略を示すフローチャートである。図５を参照して本実施形態のイベント種別入力の概略を説明する。なお、図５のフローチャートは説明の簡略化のために概略を示したものに過ぎず、処理、分岐等の追加、順序の変更等は適宜行われ得る。

　ステップＳ３１において、分析部２２の分類器は、イベント種別との対応付けが未確定である時系列データの特徴量を特徴量記憶部２３３から取得し、イベント種別の分類を行う。なお、この時系列データは第１の時系列データと呼ばれることもある。

　ステップＳ３２において、表示情報生成部２４１は、表示情報の生成を行う。表示情報は、分類器によりある対象イベントであると分類された時系列データと、当該対象イベントに対応付けられている時系列データと、非対象データに対応付けられている時系列データとをディスプレイ２０１４に表示させるための情報である。この表示情報は第１の表示情報と呼ばれることもある。また、当該対象イベントに対応付けられている時系列データは、第２の時系列データと呼ばれることがあり、非対象データに対応付けられている時系列データは第３の時系列データと呼ばれることがある。

　ステップＳ３３において、入力部２４２は、イベント種別の対応付けに関する入力を受け付ける。この入力内容は第１の入力と呼ばれることもある。管理者がイベント種別を修正する入力をした場合には、処理はステップＳ３４に移行する（ステップＳ３３においてＹＥＳ）。管理者が分類器によって分類されたイベント種別を修正せず確定した場合、分類器による分類に問題は無いため、処理は終了する（ステップＳ３３においてＮＯ）。なお、第１の時系列データとこれに対応付けられた修正済みのイベント種別は教師データとして教師データ記憶部２３４に追加される。

　ステップＳ３４において、学習部２１は、イベント種別の修正入力が行われた第１の時系列データを含む教師データを用いて分類器の再学習を行う。その後処理は再びステップＳ３１に移行し、同様の処理が繰り返される。

　図６乃至図１２は、本実施形態に係るイベント種別入力のための画面例であり、図５の処理を行うためのＧＵＩに相当するものである。以下、これらの図を参照して、表示情報生成部２４１により生成される表示情報に基づいてディスプレイ２０１４に表示されるデータ表示及びイベント種別入力用の画面例を説明する。

　以下に述べる画面例は、時系列データのイベント種別の対応付けを追加するための画面である。時系列データのうちの一部に対してはあらかじめイベント種別が対応付けられており、これを教師データとした学習済みの分類器が生成されていることを前提とする。すなわち、イベント種別が対応付けられた時系列データの個数が少ない状況で、学習用の教師データを増加させて分類器の再学習を行うという状況を想定した入力用画面である。時系列データのうちの一部へのイベント種別の対応付け、分類器の学習等は別のＧＵＩにより既に実行されているものとする。

　図６は設定画面の表示例を示している。画面上方にはタブ３０１、３０２、３０３、３０４、３０５、３０６が表示されており、分析システム２の管理者がポインティングデバイス等により各タブを押下することによりメインウィンドウ３２０の表示内容が各タブに表示されたものに遷移する。図６では、「設定」と表記されたタブ３０１が押下されたことにより、メインウィンドウ３２０には設定画面が表示されている。

　また、メインウィンドウ３２０の左方にはサブウィンドウ３１０が表示されている。サブウィンドウ３１０には確認対象となる時系列データに付され識別子が列挙される。サブウィンドウ３１０及びメインウィンドウ３２０の左方にそれぞれ設けられたスクロールバーのノブ３１１、３２１を上下方向にスライドさせることにより、サブウィンドウ３１０及びメインウィンドウ３２０を上下方向にスクロールさせることができる。

　サブウィンドウ３１０及びメインウィンドウ３２０の下方には、プログレスバー３３１とボタン３２２が表示されている。プログレスバー３３１は、処理の進捗状況を表示する。イベント種別の入力が完了した後、「最終評価」と表記されたボタン３２２を押下することにより、メインウィンドウ３２０の表示をイベントの分類の評価画面に遷移させることができる。

　メインウィンドウ３２０には、「分類閾値（％）」、「確認件数（件）」、「センサデータ表示数（個）」及び「特徴量データ表示数（個）」のラベルが付されたテキストボックスが表示されている。「センサデータ表示数（個）」のテキストボックスは、センサデータ表示画面及びセンサデータ（長期）表示画面で表示されるデータの個数の設定を受け付ける。「特徴量データ表示数（個）」のテキストボックスは、特徴量データ表示画面で表示されるデータの個数の設定を受け付ける。

　「分類閾値（％）」のテキストボックスは、分析部２２におけるイベントの判別のためのパラメータである分類閾値の入力を受け付ける。図７は、「分類閾値（％）」のテキストボックスに数値を入力した後の設定画面の表示例を示している。図７の例では、「分類閾値（％）」のテキストボックスに「８０」を入力した場合に、サブウィンドウ３１０に確認対象が表示され、「確認件数（件）」のテキストボックスに確認すべきデータの総数「１０」が表示されたことを示している。

　分類閾値について説明する。分類閾値は、分類器による分類結果からイベント種別を判別する条件を定めるパラメータの１つである。分析部２２に判定基準の異なる複数の分類器が設けられている場合、複数の分類器が異なる分類結果を出力することがある。このとき、最も多くの分類器が出力した結果を採択する多数決論理によりイベント種別を判定してもよいが、複数の分類器の分類結果がばらついている場合には、確実性が担保できないこともある。そのため、分析部２２は、分類閾値（本例では８０％）よりも多くの割合の分類器が同じ分類結果を出力した場合にのみその結果を採択し、各イベント種別に分類した分類器の個数の最大値が所定の閾値以下である場合にその結果を棄却する。このようにすることで、確実性の低い判別結果を棄却することができ、イベントの判別性能を高めることができる。

　サブウィンドウ３１０には、確認対象となるデータの識別子が列挙される。本例では、１日単位分の時系列データを一単位とした特徴量の算出が行われている場合を想定しており、センサ１１においてデータを計測した日付が識別子となっている。そのため、図７では「１０／０１／１５」（２０１０年１月１５日を示す）等のように日付が縦方向に列挙されている。なお、１時間単位、１分単位などより短い期間を一単位としている場合には、日付だけでなく時刻も識別子に含めることが望ましい。なお、サブウィンドウ３１０に表示されたデータの識別子は押下することが可能であり、押下されると、後述のセンサデータ表示画面に遷移して対応するデータが表示される。

　図８はセンサデータ表示画面の表示例を示している。「センサデータ」と表記されたタブ３０２又はサブウィンドウ３１０に表示されたデータの識別子が押下されると、メインウィンドウ３２０に図８に示されるような複数のセンサデータ（時系列データ）が表示される。このメインウィンドウ３２０の表示は図５のステップＳ３２に相当する表示であり、表示情報生成部２４１により生成された第１の表示情報に基づくものである。

　サブウィンドウ３１０に表示されている識別子のうち、既にイベント種別の対応付け（本表示画面ではラベルと表記）が完了しているものは網掛けで表示されており、メインウィンドウ３２０に表示中のものについては白黒反転して表示されている。

　メインウィンドウ３２０には、行列状に時系列データが並んで配置されている。水平方向（第１の方向）には確認対象の時系列データ、対象イベントの時系列データ、正解事象の時系列データ、非対象イベントの時系列データが並べられている。また、垂直方向（第２の方向）には重要度順に複数の時系列データが並べられている。ここで、確認対象の時系列データとは、イベント種別との対応付けが未確定である時系列データであって、ステップＳ３１において分類器によりある対象イベントであると分類された第１の時系列データであり、管理者による確認対象となる時系列データである。本例では、分類器により「Ａ試験」という名称の対象イベントであると分類されたものとする。このように時系列データを配列することで、管理者は一目で確認対象の時系列データが正解事象の時系列データ、非対象イベントの時系列データのどちらに類似しているかを判断することができる。

　対象イベントの時系列データとは、分類器による分類結果と同じ対象イベント（すなわち、Ａ試験）と既に対応付けられている第２の時系列データである。正解事象の時系列データについては後述する。非対象イベントの時系列データとは、非対象イベントと既に対応付けられている第３の時系列データである。重要度とは、複数の時系列データのうちの、対応付けを行って学習に用いた場合における寄与度の度合いである。例えば、機械学習のアルゴリズムにランダムフォレストを採用している場合には、重要度の指標としてジニ係数が用いられ得る。

　メインウィンドウ３２０の下方には、プルダウンメニュー３３３及びボタン３３４、３３５が表示されている。プルダウンメニュー３３３は、管理者にイベント種別を選択又は入力させるためのメニューである。本例では、プルダウンメニュー３３３は、「Ａ試験」、「Ｂ試験」、「対象外」、「新規」のいずれかの項目から選択するように構成されている。デフォルトでは、プルダウンメニュー３３３には、分類器の分類結果と同一の「Ａ試験」が表示される。例えば、管理者が確認対象の時系列データを「Ａ試験」とは別のイベント種別である「Ｂ試験」であると判断した場合には、「Ｂ試験」を選択することで、イベント種別の設定が可能である。また、「対象外」は、管理者が確認対象の時系列データを分類対象外のデータであると判断した場合に選択する項目であり、「新規」は、「Ａ試験」及び「Ｂ試験」とは別のイベント種別として区別すべきと判断した場合に選択する項目である。「新規」が選択された場合には、管理者に項目名を入力させるウィンドウ、テキストボックス等が更に表示されてもよい。

　「ラベル確定」と表記されたボタン３３４が押下されると、プルダウンメニュー３３３で選択されたイベント種別の設定が確定し、教師データが更新される。また、確定したイベント種別と既に対応付けられている時系列データが正解事象の時系列データの欄に表示される。例えば、プルダウンメニュー３３３で「Ｂ試験」が選択された場合には、Ｂ試験と既に対応付けられている時系列データが正解事象として表示される。なお、図８ではラベル確定前の画面例を示しているため、正解事象の欄にはデータが表示されていない。プルダウンメニュー３３３及びボタン３３４によるイベント種別の修正入力の受け付けは、図５のステップＳ３３に相当する。

　「モデル更新」と表記されたボタン３３５が押下されると、更新された教師データを用いた分類器（本表示画面ではモデルと表記）の再学習が行われる。この再学習は、図５のステップＳ３４に相当する。その後、再び再学習後の分類器によりイベント種別との対応付けが未確定である時系列データの分類が行われ、設定画面に遷移する。この分類は図５のステップＳ３１に相当する。

　なお、対象イベントの時系列データ、正解事象の時系列データ及び非対象イベントの時系列データは、教師データに含まれる時系列データから自動的に選択される。より具体的には、対象イベントの時系列データの列（左から２列目）には、分類器により分類された確認対象のイベント種別（図ではＡ試験）と同じイベント種別の１期間分の時系列データが教師データの中から選択されて表示される。正解事象の時系列データの列（左から３列目）には、ボタン３３４の押下により確定したイベント種別と同じイベント種別の１期間分の時系列データが教師データの中から選択されて表示される。なお、イベント種別の確定前には、図８に示されているように正解事象の時系列データは表示されない。非対象イベントの時系列データの列（左から４列目）には、非対象イベントの１期間分の時系列データが教師データの中から選択されて表示される。このとき、多数の教師データの中からどのデータを表示させるかを決めるための選択は、無作為なものであってもよいが、管理者による確認をより容易にするため、同じ行の確認対象の時系列データとの類似度の高いものが選択されることが好適である。この選択時に参照される類似度の例としては、データ波形間のユークリッド距離の逆数、データ波形間のＤＴＷ（Dynamic　Time　Warping）距離の逆数が挙げられる。ここで、取得したデータそのものに対して類似度の計算を行ってもよいが、類似度の計算の前に所定の処理を行ってもよい。類似度の計算前に行われる所定の処理の例としては、期間ごとのデータを平均値０、分散１となるように標準化する処理が挙げられる。

　図９はセンサデータ（長期）表示画面の表示例を示している。「センサデータ（長期）」と表記されたタブ３０３が押下されると、メインウィンドウ３２０に図９に示されるような複数のセンサデータ（時系列データ）が表示される。図８との違いは、時系列データのグラフの横軸がより長期になっている点と、表示期間の入力を行うテキストボックス３３６がメインウィンドウ３２０の下方に表示されている点である。テキストボックス３３６に所望の期間を入力すると各時系列データの横軸が再設定されグラフの更新が行われる。なお、グラフの横軸の中心の時刻は、図８のセンサデータ表示画面におけるグラフの横軸の中心の時刻と同一になるように設定される。その他の点は図８と同様であるため説明を省略する。図９のセンサデータ（長期）表示画面を更に参照することで、長期的な時系列データの特徴を考慮したイベント種別の設定が可能となる。

　図１０は特徴量データ表示画面の表示例を示している。「特徴量データ」と表記されたタブ３０４が押下されると、メインウィンドウ３２０に図１０に示されるような複数の特徴量が表示される。水平方向（第１の方向）には対象イベントの時系列データの特徴量、正解事象の特徴量、非対象イベントの特徴量の値を示す箱ひげ図が並べられている。図中の破線は確認対象の時系列データから算出された特徴の値を示している。また、垂直方向（第２の方向）には重要度順に各データが並べられている。正解事象の欄は、図８及び図９と同様にボタン３３４が押下され、確認対象のイベント種別が確定した後に表示される。その他の項目は図８及び図９と同様であるため説明を省略する。図１０のセンサデータ（長期）表示画面を更に参照することで、特徴量の値を考慮したイベント種別の設定が可能となる。なお、特徴量の値は、図１０に示されるように箱ひげ図により可視化されているが、特徴量の値そのものが数値で表示される表示形態であってもよい。この特徴量の表示は、表示情報生成部２４１により生成された第４の表示情報に基づくものである。

　図１１は評価画面の表示例を示している。「評価」と表記されたタブ３０５が押下されると、メインウィンドウ３２０に図１１に示されるようなグラフ及びテキストボックスが表示される。この表示は、表示情報生成部２４１により生成された第２の表示情報に基づくものである。

　グラフの横軸は分類閾値であり、縦軸は分類の評価結果であるＰｒｅｃｉｓｉｏｎ（適合率）及びＲｅｃａｌｌ（再現率）である。分類閾値を大きくすると分類器の出力の一致度が高い場合にのみその結果が採択されるのでＰｒｅｃｉｓｉｏｎは高くなるが、棄却される確率も高くなるため、Ｒｅｃａｌｌは小さくなる。このようにＰｒｅｃｉｓｉｏｎとＲｅｃａｌｌはトレードオフの関係となる。本評価画面は、両者の傾向を確認しながら分類閾値を適切に決定するために用いられる。

　「分類閾値（％）」のテキストボックスは、分類閾値の入力を受け付ける。この入力は第２の入力と呼ばれることもある。分類閾値が入力されるとその値に対応したＰｒｅｃｉｓｉｏｎとＲｅｃａｌｌがそれぞれのテキストボックスに自動的に表示される。図１１は、分類閾値に「３０」が入力されたことにより、ＰｒｅｃｉｓｉｏｎとＲｅｃａｌｌの値がいずれも「８０」であると表示されたことを示している。なお、分類閾値のデフォルト値はＦ－ｍｅａｓｕｒｅ等の所定の性能指標が最大になるような値とする。Ｆ－ｍｅａｓｕｒｅとは、ＰｒｅｃｉｓｉｏｎとＲｅｃａｌｌの調和平均である。

　メインウィンドウ３２０の下方には、ボタン３３７、３３８が表示されている。ボタン３３７については図１２の説明において後述する。「最終確認」と表示されたボタン３３８が押下されると、分類器のパラメータである分類閾値の値がテキストボックスに入力されている値で確定され、その後、メインウィンドウ３２０の表示が検証画面に遷移する。

　図１２は検証画面の表示例を示している。「検証」と表記されたタブ３０６が押下されると、メインウィンドウ３２０に図１２に示されるような表及びチェックボックスが表示される。図１２の表は対象イベント１と対象イベント２との分類における混同の状況を示している。例えば１行目は、教師データ内のイベント種別が「Ａ１試験」であるデータとイベント種別が「Ａ２試験」であるデータとの混合率が２０％であり、この分類のＰｒｅｃｉｓｉｏｎとＲｅｃａｌｌがそれぞれ９９％と７９％であることを示している。この検証画面の表示は、表示情報生成部２４１により生成された第３の表示情報に基づくものである。

　ここで、ＸイベントとＹイベントの混合率とは、（ＸイベントをＹイベントと誤判別した数＋ＹイベントをＸイベントと誤判別した数）／（ＸイベントをＸイベントと判別した数＋ＹイベントをＹイベントと判別した数）で定義される。混合率が高いイベント種別は、同一のイベント種別として扱っても問題ない場合がある。その場合、混合率が高いイベント種別を１つのイベント種別にマージすることでよりイベントの判別性能が向上し得る。

　「マージ？」の欄のチェックボックスは、マージ（イベント種別の合併）を行う対象イベントを設定する欄である。また、メインウィンドウ３２０の下方には、ボタン３３７、３３９、３４０が表示されている。「マージ？」のチェックボックスにチェックが入った状態で「マージ」と表記されたボタン３３９を押下すると、チェックが入った行の２つの対象イベントがマージされる。その後、メインウィンドウ３２０の表示が評価画面に遷移する。なお、このマージの要否の入力は、第３の入力と呼ばれることもある。

　「リセット」と表記されたボタン３３７を押下するとマージする前の状態に戻すことができる。図１１に示されたボタン３３７も同様の機能を有する。「完了」と表記されたボタン３４０を押下すると分類器の学習が終了する。

　なお、図１２のＰｒｅｃｉｓｉｏｎとＲｅｃａｌｌは、Ｆ－ｍｅａｓｕｒｅ等の分類器の性能指標が最大になる場合の値が表示される。この値が直前の評価画面で設定された値を下回る場合には図１１の１行目のＲｅｃａｌｌの網掛けのように区別できる状態で表示される。

　混合率が大きい場合にマージを行うことが適切とは限らない。例えば、対象イベントの設定が適切でない場合には、マージを行うのではなく対象イベントの設定を修正したほうがよい。そのような場合は、サブウィンドウ３１０の識別子を押下してメインウィンドウ３２０の表示をセンサデータ表示画面に遷移させ、再び対象イベントの設定を行うこともできる。

　図１３乃至図１５は、本実施形態に係るイベント種別入力方法の例を示すフローチャートである。本処理は、図６乃至図１２のＧＵＩを用いたイベント種別入力の操作の典型例を示すものである。なお、図１３乃至図１５のフローチャートは行われ得る手順の一例を示したものに過ぎず、処理内容及び順序はユーザの操作手順、ＧＵＩの設計等に応じて適宜変更され得る。図６乃至図１２の対応する画面例にも言及しつつ図１３乃至図１５の処理を説明する。

　図１３のステップＳ３１は、図５のステップＳ３１と同様であるため説明を省略する。なお、分類器による分類の処理は、図６乃至図１２の画面表示の前にあらかじめ行われ得る。

　ステップＳ４１において、イベント種別入力部２４は、分類器による分類結果の中に対象イベントに分類されたものが含まれているか否かを判断する。対象イベントに分類されたものが含まれている場合（ステップＳ４１においてＹＥＳ）、処理はステップＳ４２からステップＳ４５のループに移行する。対象イベントに分類されたものが含まれていない場合（ステップＳ４１においてＮＯ）、処理は図１４のステップＳ５１に移行する。なお、本ステップにおける判断は、管理者が分類のリストを確認し、その結果を入力部２４２が受け付けることにより行われるものであってもよい。

　ステップＳ４２からステップＳ４５のループは、対象イベントに分類されたデータのそれぞれに対して行われる。ステップＳ４３において、分類器による分類結果を管理者に確認させるため、表示情報生成部２４１は、センサデータ表示画面等の表示情報の生成を行う。当該表示情報は、ディスプレイ２０１４に表示される。当該画面表示は、図６及び図７の設定画面、図８のセンサデータ表示画面、図９のセンサデータ（長期）表示画面、図１０の特徴量データ表示画面であり得る。管理者はこれらの表示をタブ３０１、３０２、３０３、３０４の押下等の操作により、適宜遷移させながら分類結果の確認を行う。ステップＳ４４において、入力部２４２は、管理者による分類結果の修正等の入力操作を受け付ける。この入力操作は、プルダウンメニュー３３３へのイベント種別の入力等であり得る。

　ステップＳ４２からステップＳ４５のループの後、ステップＳ３４において、学習部２１は、管理者によるイベント種別の設定が確認された教師データを用いて分類器の再学習を行う。図５のステップＳ３４と同様であるため説明を省略する。その後、処理は再びステップＳ３１に移行する。

　図１４のステップＳ５１において、表示情報生成部２４１は、分類閾値を管理者に入力させるため、図１１の評価画面の表示情報の生成を行う。当該表示情報は、ディスプレイ２０１４に表示される。入力部２４２は、管理者による分類閾値の入力操作を受け付ける。

　ステップＳ５２において、表示情報生成部２４１は、マージの要否及びマージ対象を管理者に入力させるため、図１２の検証画面の表示情報の生成を行う。当該表示情報は、ディスプレイ２０１４に表示される。入力部２４２は、管理者によるマージの入力操作を受け付ける。

　ステップＳ５３において、管理者がイベント種別の再設定が必要と判断した場合（ステップＳ５３においてＹＥＳ）、センサデータ表示画面などへの遷移の操作が行われることにより処理は図１５のステップＳ６１からステップＳ６２のループに移行する。管理者がイベント種別の再設定がないと判断し、図１２の「完了」と表記されたボタン３４０を押下した場合（ステップＳ５３においてＹＥＳ）、処理は終了する。

　ステップＳ６１からステップＳ６２のループは、イベント種別の再設定を要するデータのそれぞれに対して行われる。ステップＳ６１からステップＳ６２のループに含まれるステップＳ４３とステップＳ４４は上述のものと同様であるため説明を省略する。

　ステップＳ６１からステップＳ６２のループの後、ステップＳ３４及びステップＳ３１の処理が行われる。これらの処理は、図５のステップＳ３１、Ｓ３４と同様であるため説明を省略する。その後、処理は再び図１４のステップＳ５１に移行する。

　本実施形態の効果について説明する。本実施形態では、センサ１１により多数の時系列データが得られているが、イベント種別が対応付けられた時系列データの個数が少ない状況において、少ない負担でイベント種別の対応付けを行うことができるＧＵＩが提供される。本実施形態では、少量の学習データを用いて学習を行った分類器を用いて分類を行い、管理者はその分類結果を参照しながら必要なもののみ分類を修正すればよい。そのため、はじめから多数のデータを確認してイベント種別の対応付けを行って多量の学習データを準備する場合と比べて時系列データの確認及び対応付けの工数を削減することができる。

　また、イベント種別が対応付けられた時系列データの個数が少ない場合には、どのようにイベント種別を設定すれば適切であるかが明確でないことが多い。これに対し、本実施形態では、確認対象の時系列データに対象イベントと非対象イベントの時系列データを並べて表示することができる。これにより、確認対象の特徴が対象イベントと非対象イベントのどちらに似ているかを判断する等の方法により、管理者は対応付けの作業をより視覚的に行うことができ、効率よく対応付けを行うことができる。

　以上の理由により、本実施形態によれば、管理負担を低減することが可能な分析システム、分析方法及び記憶媒体を提供することができる。

　［第２実施形態］
　本発明の実施にあたり適用され得る学習部２１及び分析部２２の構成の一例を第２実施形態として説明する。その他の構成は第１実施形態と同様であるため詳細な説明は省略する。

　図１６乃至図１９を相互に参照しつつ、本実施形態における分類器の学習及びイベントの判別について説明する。図１６は、本実施形態に係る学習部２１及び記憶部２３の機能構成を示すブロック図である。図１７は、本実施形態に係る分類器の学習動作を示すフローチャートである。図１８は、本実施形態に係る分析部２２及び記憶部２３の機能ブロック図である。図１９は、本実施形態に係るイベントの判別動作を示すフローチャートである。

　図１６及び図１７を参照しつつ本実施形態に係る分類器の学習動作を説明する。図１６に示されるように、学習部２１は、特徴量算出部２１１、教師データ生成部２１２、選択部２１３及び分類器学習部２１４を備える。記憶部２３の構成は図３と同様であり説明を省略する。

　図１７のステップＳ１１において、分析システム２は、複数のセンサ１１から出力された時系列データを取得し、時系列データ記憶部２３１に記憶させる。なお、ステップＳ１１の動作は、例えば、センサ１１での計測時にリアルタイムに行う等の手法により事前に行われていてもよい。

　ステップＳ１２において、特徴量算出部２１１は、時系列データ記憶部２３１に記憶されている時系列データを読み出し、１つ又は複数の特徴量を算出する。算出された特徴量は、特徴量記憶部２３３に記憶される。

　ステップＳ１３において、分析システム２のイベント種別入力部２４は、各期間に対応するイベント種別の入力を受け付ける。入力されたイベント種別は、イベント種別記憶部２３２に記憶される。

　ステップＳ１４において、教師データ生成部２１２は、特徴量記憶部２３３に記憶されている特徴量と、イベント種別記憶部２３２に記憶されているイベント種別とをそれぞれの時刻又は期間に基づいて対応付けたデータを生成する。このデータは、分類器の教師あり機械学習のための教師データとして用いられる。生成された教師データは、教師データ記憶部２３４に記憶される。

　その後、ステップＳ１５からステップＳ１８までのループがＰ回繰り返される（Ｐは２以上の整数）。ステップＳ１６において、選択部２１３は、教師データ記憶部２３４に記憶された教師データのうち、Ｎ個の期間におけるＭ個のセンサ１１のデータ、すなわち、Ｚ＝Ｎ×Ｍ個のデータをイベント種別ごとに分け、それぞれのイベント種別ごとに一部又は全部の期間に対応する特徴量群を選択する。例えば、対象イベントＡ、対象イベントＢ及び非対象イベントＸの３種類がある場合には、対象イベントＡ、対象イベントＢ及び非対象イベントＸのそれぞれに対して選択が行われる。ここで、ステップＳ１２においてＺ＝Ｎ×Ｍ個のデータのうちの１つに対して複数個の特徴量が算出されている場合（Ｋが複数の場合）には、Ｋ個の特徴量が組として特徴量群に含まれるように選択される。このように、本ステップで選択される特徴量群は、Ｎ個の期間のうちの一部又は全部の期間（この期間の個数をＮ１個とする）に得られたＭ個のセンサのデータからＫ個ずつ算出されたＮ１×Ｍ×Ｋ個の特徴量を含む。

　ステップＳ１７において、分類器学習部２１４は、ステップＳ１６で選択された特徴量群のデータを用いて分類器の学習を行う。ここで、分類器学習部２１４で行われる学習は、教師あり機械学習である。より具体的には、教師データのうちの特徴量を分類の推定のために必要なデータとし、イベント種別を特徴量に基づいて推定されるべき正解（教師）とする教師あり機械学習が行われる。教師あり機械学習に用いられる手法としては、例えば、サポ－トベクターマシン、ランダムフォレスト、ニューラルネットワーク等が挙げられる。

　ステップＳ１６及びステップＳ１７により１個の分類器の学習が行われる。学習済みの分類器は分類器記憶部２３５に記憶される。以上のステップＳ１６及びステップＳ１７の動作がＰ回繰り返され、Ｐ個の分類器の学習が行われる。ここで、Ｐ回のステップＳ１６のそれぞれにおいて、選択される特徴量群に含まれるデータの組み合わせが互いに異なるように選択が行われる。これにより、生成されるＰ個の分類器は、互いに異なる特徴量群に基づいて学習されたことにより、同一種類ではあるが、分類基準が互いに異なる分類器となる。

　ステップＳ１５からステップＳ１８の間のループがＰ回繰り返され、Ｐ個の分類器の学習が完了すると、図１７のフローチャートによる分類器の学習動作は終了する。

　次に、図１８及び図１９を参照しつつ本実施形態に係るイベントの判別動作を説明する。本動作は、上述の学習動作により得られたＰ個の分類器を用いて、センサ１１の時系列データに基づいてプラント１で発生したイベントを判別する動作である。図１８に示されるように、分析部２２は、特徴量算出部２２１、分類部２２２及び判別部２２３を備える。記憶部２３の構成は図３と同様であるため説明を省略する。

　図１８のステップＳ２１において、分析システム２は、複数のセンサ１１から出力された時系列データを取得し、時系列データ記憶部２３１に記憶させる。ステップＳ２１の動作は、例えば、センサ１１での計測時にリアルタイムに行う等の手法により事前に行われていてもよい。なお、時系列データを取得する複数のセンサ１１の組み合わせは、上述の教師データの生成に用いた複数のセンサ１１の組み合わせと同じものである。

　ステップＳ２２において、特徴量算出部２２１は、時系列データ記憶部２３１に記憶されている時系列データを読み出し、１つ又は複数の特徴量を算出する。ここで、算出する特徴量の種類、個数等は上述の教師データと同じものとする。この処理は図１７のステップＳ１２と同様であるため詳細な説明を省略する。

　ステップＳ２３において、分類部２２２は、分類器記憶部２３５に記憶されているＰ個の分類器のそれぞれを用いて、特徴量記憶部２３３に記憶されている期間ごとの特徴量を入力データとするイベント種別の分類を行う。各分類器は、入力に応じて、学習時に定義されている対象イベント及び非対象イベントのうちのいずれかのイベント分類に分類した結果を出力する。

　ステップＳ２４において、判別部２２３は、Ｐ個の分類器がそれぞれ出力したＰ個のイベント分類の結果を統合して各期間にプラント１で発生したイベントを判別する。Ｐ個の分類器は、分類基準が互いに異なるため、異なる分類結果を出力する場合がある。そこで、１つの判別結果を得るため、判別時にＰ個の分類結果を統合して判別を行う。この判別は、例えば、最も多くの分類器により分類されたイベント種別に対応するイベントが分類対象期間に発生したものと判定する多数決論理により行われるが、最大値が所定の閾値以下の場合にイベントの判別結果を棄却する。

　当該棄却は、より具体的には、以下のようなアルゴリズムとすることができる。各イベント種別に分類した分類器の個数の最大値が所定の閾値よりも大きい場合、判別部２２３は、最も多くの分類器により分類されたイベント種別に対応するイベントが分類対象期間に発生したものと判定する。各イベント種別に分類した分類器の個数の最大値が所定の閾値以下である場合、判別部２２３は、対象イベントが分類対象期間に発生していないものと判定する。このようにすることで、確実性の低い判別結果を棄却することができ、イベントの判別性能を向上させることができる。

　このようにして、本実施形態の分析システム２は、複数のセンサ１１で得られた時系列データに基づいて、所定の期間ごとにプラント１で発生したイベントを判別することができる。分析システム２は、イベントの判別結果をログとして記憶してもよく、イベントの判別結果に応じたメッセージを管理者に通知してもよい。イベントの判別結果に応じたメッセージとは、ディスプレイ２０１４への警告文章の表示、不図示の警報装置による音、光等による報知等であり得る。

　本実施形態の効果について説明する。一般に、通常運転とは抽象的な概念であるため、通常運転か否かの判断基準を定義して、通常運転であるという情報を入力することには大きな負担を要する。これに対し、本実施形態の分析システム２の運用においては、管理者は、対象イベントの発生時刻を入力すればよく、通常運転についてはその時刻を特に入力しなくても非対象イベントとして扱われるので、通常運転についての情報の入力は必須ではない。また、分類の必要がないイベントについても同様に、特に入力しなくても非対象イベントとして扱うことができる。したがって、本実施形態の分析システム２は管理者が入力しなければならない情報を少なくすることができ、管理負担を低減することができる。

　通常運転を定義せず対象イベント以外を一括して非対象イベントとして扱っていることから、学習の状況によってはＰ個の分類器のうちの一部の分類器で正しくイベントが分類されない場合があり得る。しかしながら、本実施形態の学習システムは、基準が互いに異なる複数の分類器により分類を行い、その結果を統合することで一部の分類器の誤分類の影響を低減することができる。そのため、分析システム２全体としては十分な判別性能を確保することができる。

　また、本実施形態の分析システム２は、分類すべきイベント種別が増加した場合など、更新が必要な場合の管理者の作業量が少ない。本実施形態では教師あり機械学習により学習させた分類器を用いているため、分類すべきイベント種別が増加した場合には、管理者は、増加後のイベント種別と発生時間帯を入力することにより教師データを更新して、分類器を再学習させるだけでよい。したがって、システムの改修、データベースの再構築のような多大な管理負担が生じない。更に、分析時にプラント１側に追加の作業を要求する必要がない点においても大きな管理負担を要しない構成となっている。

　以上のように、本実施形態によれば、管理負担を低減することが可能な学習システム、分析システム、学習方法及び記憶媒体を提供することができる。

　なお、ステップＳ１６におけるデータの選択手法は限定されないが、Ｐ回のループでより確実に異なるデータが選択されるように、乱択アルゴリズム等を用いて無作為に行われることが望ましい。

　また、ステップＳ１６における選択において、１つの分類器の学習に用いられる特徴量群のうち、非対象イベントに対応付けられた特徴量の個数を対象イベントに対応付けられた特徴量の個数よりも多くするように選択することが望ましい。非対象イベントは様々な挙動のイベントを含むため、十分な学習を行うためには、多数のデータが必要となるためである。

　また、ステップＳ１６における選択において、１つの分類器の学習に用いられる特徴量について、対象イベントに対応付けられた特徴量についてはすべてを選択し、非対象イベントに対応付けられた特徴量については一部を選択することが望ましい。対象イベントの中には発生頻度が低いものがある。分類が明確な対象イベントについては、分類器の性能の向上のため、すべてを選択する方がよい場合が多い。一方、非対象イベントについては多様な特徴を持つデータが多数得られるため、すべてを選択すると逆に複数の分類器の性能が全体的に低下することがあり、一部を選択する方がよい場合が多い。なお、非対象イベントに対応付けられた特徴量の一部を選択する際には、上述のように乱択アルゴリズム等を用いて無作為に行われることが望ましい。

　また、ステップＳ１２、Ｓ２２で算出される特徴量としては、少なくとも所定の期間内における時系列データの分散を含むことが望ましい。プラント１において重要なイベントが発生した場合には、センサ１１による計測値の時間変動が大きくなる場合が多く、様々な統計量の中で特に分散に特徴的な挙動が現れることが多いためである。

　また、ステップＳ１２、Ｓ２２での特徴量の算出は、対象イベントの発生時刻及び終了時刻の少なくとも一方のみに対応する時系列データに基づいて行われることが望ましい。センサ１１による計測値は、対象イベントの発生時刻及び終了時刻に大きく変動する場合が多く、発生時刻から終了時刻の間の期間においては、センサ１１による計測値の変動はさほど大きくない場合が多い。そのため、特徴的な挙動を示す発生時刻及び終了時刻の少なくとも一方のみに基づいて得られた特徴量を用いて学習を行うことで、より有効な学習を行うことができる。

　また、図４に示された時系列データの区分の仕方は任意であるが、手法を適用する際の容易性の観点からは１日を等分することができるような期間による区分であることが望ましい。例えば、期間Ｔ１を０時００分から０時３０分、期間Ｔ２を０時３０分から１時００分というように３０分刻みで順次設定することで、１日が４８等分される。プラント１における点検等の事前に計画されているイベントは、毎日同じ時刻に定期的に行われることが多く、また、作業のスケジューリングの観点から２時、４時３０分等のようにキリのよい時間に設定されていることが多い。このようなイベントの発生時間に合わせるため、１日を等分するように期間を区分することが望ましい。

　また、ステップＳ１６における選択において、１つの分類器の学習に用いられる特徴量の組のうち、非対象イベントに対応付けられた特徴量については少なくとも１日分の連続した時系列データに基づく特徴量がすべて含まれるような組み合わせで選択することが望ましい。１日分の連続した時系列データとは、典型的にはある日の０時からの１日分の時系列データであるが、連続した２４時間であれば、ある日の１８時から翌日の１８時のように日をまたいだ時系列データであってもよい。１日分のデータをすべてまとめて選択することにより、１日の中で決められた時間に発生する非対象イベント又は１日に１回のように低頻度に発生する非対象イベントの特徴を取りこぼす可能性を低減することができ、分類器の性能を向上させることができる。例えば、プラント１において毎日４時にある設備の点検が予定されている場合に、４時を含む期間を除いた選択がなされると、この設備の点検の特徴を取りこぼすことになる。これに対し、１日分のデータをまとめて選択すれば、毎日４時に行われる点検は除外されないため、この点検の取りこぼしを無くすことができる。

　また、ステップＳ１１における所定の期間の区分と、ステップＳ２１における所定の期間の区分は、同じ基準で行われていることが望ましい。例えば、ステップＳ１１における所定の期間の区分が１日を４８等分するものであれば、ステップＳ２１における区分もこれと同様に１日を４８等分するものであることが望ましい。学習時と分析時の期間の区分の仕方を同一とすることで、分析時の入力データが学習時の入力データに近くなるため、分類器の性能を向上させることができる。

　［第３実施形態］
　上述の第１実施形態及び第２実施形態において説明した分析システム２は、第３実施形態によれば、図２０に示すような分析システム６００として構成することもできる。図２０は、第３実施形態に係る分析システム６００の機能構成を示すブロック図である。

　図２０に示すように、第３実施形態による分析システム６００は、入力された時系列データに対してイベント種別の分類を行う分類器を含む分析部６０２を有している。また、分析システム６００は、時系列データのうちのイベント種別の対応付けが未確定である第１の時系列データであって、分類器によって対象イベントが発生している状態に対応する第１のイベント種別であると分類された第１の時系列データと、第１のイベント種別に対応付けられている第２の時系列データと、対象イベントが発生していない状態に対応する第２のイベント種別に対応付けられている第３の時系列データと、を表示させるための第１の表示情報を生成する表示情報生成部６０４を有している。また、分析システム６００は、第１の時系列データに対するイベント種別の対応付けに関する第１の入力を受け付ける入力部６０６を有している。これにより、管理負担を低減することが可能な分析システム６００が提供される。

　［変形実施形態］
　以上、実施形態を参照して本発明を説明したが、本発明は上述の実施形態に限定されるものではない。本願発明の構成及び詳細には本発明の要旨を逸脱しない範囲で、当業者が理解し得る様々な変形をすることができる。例えば、いずれかの実施形態の一部の構成を、他の実施形態に追加した実施形態、あるいは他の実施形態の一部の構成と置換した実施形態も本発明を適用し得る実施形態であると理解されるべきである。

　例えば、上述の実施形態では、時系列データは、センサ１１からの出力値ではなく、装置の制御信号であってもよい。その場合、当該制御信号は、図４に示されるようなアナログ信号でなくてもよく、例えば、２値のデジタル値であり得る。このように、本発明は、装置の制御に関する監視にも適用され得る。

　また、上述の各実施形態の機能を実現するように該実施形態の構成を動作させるプログラムを記録媒体に記録させ、該記録媒体に記録されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も各実施形態の範疇に含まれる。すなわち、コンピュータ読取可能な記録媒体も各実施形態の範囲に含まれる。また、上述のコンピュータプログラムが記録された記録媒体はもちろん、そのコンピュータプログラム自体も各実施形態に含まれる。

　該記録媒体としては、例えばフロッピー（登録商標）ディスク、ハードディスク、光ディスク、光磁気ディスク、ＣＤ－ＲＯＭ（Compact　Disc-Read　Only　Memory）、磁気テープ、不揮発性メモリカード、ＲＯＭを用いることができる。また該記録媒体に記録されたプログラム単体で処理を実行しているものに限らず、他のソフトウェア、拡張ボードの機能と共同して、ＯＳ（Operating　System）上で動作して処理を実行するものも各実施形態の範疇に含まれる。

　上述の各実施形態の機能により実現されるサービスは、ＳａａＳ（Software　as　a　Service）の形態でユーザに対して提供することもできる。

　上述の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

　（付記１）
　入力された時系列データに対してイベント種別の分類を行う分類器を含む分析部と、
　前記時系列データのうちの前記イベント種別の対応付けが未確定である第１の時系列データであって、前記分類器によって対象イベントが発生している状態に対応する第１のイベント種別であると分類された第１の時系列データと、前記第１のイベント種別に対応付けられている第２の時系列データと、前記対象イベントが発生していない状態に対応する第２のイベント種別に対応付けられている第３の時系列データと、を表示させるための第１の表示情報を生成する表示情報生成部と、
　前記第１の時系列データに対する前記イベント種別の対応付けに関する第１の入力を受け付ける入力部と、
　を備えることを特徴とする分析システム。

　（付記２）
　前記入力部により前記イベント種別の対応付けが入力された前記第１の時系列データを教師データとして用いることにより、前記分類器の学習を行う学習部を更に備える
　ことを特徴とする付記１に記載の分析システム。

　（付記３）
　前記表示情報生成部は、更に、前記分類器による分類の評価結果を表示させるための第２の表示情報を生成する
　ことを特徴とする付記１又は２に記載の分析システム。

　（付記４）
　前記評価結果は、適合率及び再現率を含む
　ことを特徴とする付記３に記載の分析システム。

　（付記５）
　前記分析部は、前記分類器の分類結果に基づいて前記イベント種別の判別を行い、
　前記入力部は、更に、前記イベント種別の判別の条件に関する第２の入力を受け付ける
　ことを特徴とする付記３又は４に記載の分析システム。

　（付記６）
　前記表示情報生成部は、更に、前記分類器による分類における複数の前記イベント種別の混同の状況を表示させるための第３の表示情報を生成する
　ことを特徴とする付記１乃至５のいずれか１項に記載の分析システム。

　（付記７）
　前記入力部は、更に、複数の前記イベント種別の合併の要否に関する第３の入力を受け付ける
　ことを特徴とする付記６に記載の分析システム。

　（付記８）
　前記表示情報生成部は、前記第１の時系列データと、前記第２の時系列データと、前記第３の時系列データとを第１の方向に並べて表示させるように前記第１の表示情報を生成する
　ことを特徴とする付記１乃至７のいずれか１項に記載の分析システム。

　（付記９）
　前記表示情報生成部は、前記第１の時系列データと、前記第２の時系列データと、前記第３の時系列データとをそれぞれ複数個ずつ第２の方向に並べて表示させるように前記第１の表示情報を生成する
　ことを特徴とする付記１乃至８のいずれか１項に記載の分析システム。

　（付記１０）
　前記第２の方向に並んで表示される複数の前記第１の時系列データは、前記分類器の学習における重要度順に配列される
　ことを特徴とする付記９に記載の分析システム。

　（付記１１）
　前記表示情報生成部は、前記第１の時系列データの特徴量と、前記第２の時系列データの特徴量と、前記第３の時系列データの特徴量とに基づく表示を行わせる第４の表示情報を生成する
　ことを特徴とする付記１乃至１０のいずれか１項に記載の分析システム。

　（付記１２）
　入力された時系列データに対してイベント種別の分類を行うステップと、
　前記時系列データのうちのイベント種別の対応付けが未確定である第１の時系列データであって、対象イベントが発生している状態に対応する第１のイベント種別であると分類された第１の時系列データと、前記第１のイベント種別に対応付けられている第２の時系列データと、前記対象イベントが発生していない状態に対応する第２のイベント種別に対応付けられている第３の時系列データと、を表示させるための第１の表示情報を生成するステップと、
　前記第１の時系列データに対するイベント種別の対応付けに関する第１の入力を受け付けるステップと、
　を備えることを特徴とする分析方法。

　（付記１３）
　コンピュータに、
　入力された時系列データに対してイベント種別の分類を行うステップと、
　前記時系列データのうちのイベント種別の対応付けが未確定である第１の時系列データであって、対象イベントが発生している状態に対応する第１のイベント種別であると分類された第１の時系列データと、前記第１のイベント種別に対応付けられている第２の時系列データと、前記対象イベントが発生していない状態に対応する第２のイベント種別に対応付けられている第３の時系列データと、を表示させるための第１の表示情報を生成するステップと、
　前記第１の時系列データに対するイベント種別の対応付けに関する第１の入力を受け付けるステップと、
　を実行させることを特徴とするプログラムが記憶された記憶媒体。

１　　　　　　　　　　　　　　　　　　　　プラント
２、６００　　　　　　　　　　　　　　　　分析システム
１１　　　　　　　　　　　　　　　　　　　センサ
１２　　　　　　　　　　　　　　　　　　　時刻取得部
２１　　　　　　　　　　　　　　　　　　　学習部
２２、６０２　　　　　　　　　　　　　　　分析部
２３　　　　　　　　　　　　　　　　　　　記憶部
２４　　　　　　　　　　　　　　　　　　　イベント種別入力部
２１１、２２１　　　　　　　　　　　　　　特徴量算出部
２１２　　　　　　　　　　　　　　　　　　教師データ生成部
２１３　　　　　　　　　　　　　　　　　　選択部
２１４　　　　　　　　　　　　　　　　　　分類器学習部
２２２　　　　　　　　　　　　　　　　　　分類部
２２３　　　　　　　　　　　　　　　　　　判別部
２３１　　　　　　　　　　　　　　　　　　時系列データ記憶部
２３２　　　　　　　　　　　　　　　　　　イベント種別記憶部
２３３　　　　　　　　　　　　　　　　　　特徴量記憶部
２３４　　　　　　　　　　　　　　　　　　教師データ記憶部
２３５　　　　　　　　　　　　　　　　　　分類器記憶部
２４１、６０４　　　　　　　　　　　　　　表示情報生成部
２４２、６０６　　　　　　　　　　　　　　入力部
３０１～３０６　　　　　　　　　　　　　　タブ
３１０　　　　　　　　　　　　　　　　　　サブウィンドウ
３１１、３２１　　　　　　　　　　　　　　ノブ
３３１　　　　　　　　　　　　　　　　　　プログレスバー
３３２、３３４、３３５、３３７～３４０　　ボタン
３３３　　　　　　　　　　　　　　　　　　プルダウンメニュー
３３６　　　　　　　　　　　　　　　　　　テキストボックス
２００２　　　　　　　　　　　　　　　　　ＣＰＵ
２００４　　　　　　　　　　　　　　　　　ＲＯＭ
２００６　　　　　　　　　　　　　　　　　ＲＡＭ
２００８　　　　　　　　　　　　　　　　　ＨＤＤ
２０１０　　　　　　　　　　　　　　　　　通信Ｉ／Ｆ
２０１２　　　　　　　　　　　　　　　　　ディスプレイコントローラ
２０１４　　　　　　　　　　　　　　　　　ディスプレイ
２０１６　　　　　　　　　　　　　　　　　入力装置
２０１８　　　　　　　　　　　　　　　　　バスライン

Claims

　入力された時系列データに対してイベント種別の分類を行う分類器を含む分析部と、
　前記時系列データのうちの前記イベント種別の対応付けが未確定である第１の時系列データであって、前記分類器によって対象イベントが発生している状態に対応する第１のイベント種別であると分類された第１の時系列データと、前記第１のイベント種別に対応付けられている第２の時系列データと、前記対象イベントが発生していない状態に対応する第２のイベント種別に対応付けられている第３の時系列データと、を表示させるための第１の表示情報を生成する表示情報生成部と、
　前記第１の時系列データに対する前記イベント種別の対応付けに関する第１の入力を受け付ける入力部と、
　を備えることを特徴とする分析システム。
　前記入力部により前記イベント種別の対応付けが入力された前記第１の時系列データを教師データとして用いることにより、前記分類器の学習を行う学習部を更に備える
　ことを特徴とする請求項１に記載の分析システム。
　前記表示情報生成部は、更に、前記分類器による分類の評価結果を表示させるための第２の表示情報を生成する
　ことを特徴とする請求項１又は２に記載の分析システム。
　前記評価結果は、適合率及び再現率を含む
　ことを特徴とする請求項３に記載の分析システム。
　前記分析部は、前記分類器の分類結果に基づいて前記イベント種別の判別を行い、
　前記入力部は、更に、前記イベント種別の判別の条件に関する第２の入力を受け付ける
　ことを特徴とする請求項３又は４に記載の分析システム。
　前記表示情報生成部は、更に、前記分類器による分類における複数の前記イベント種別の混同の状況を表示させるための第３の表示情報を生成する
　ことを特徴とする請求項１乃至５のいずれか１項に記載の分析システム。
　前記入力部は、更に、複数の前記イベント種別の合併の要否に関する第３の入力を受け付ける
　ことを特徴とする請求項６に記載の分析システム。
　前記表示情報生成部は、前記第１の時系列データと、前記第２の時系列データと、前記第３の時系列データとを第１の方向に並べて表示させるように前記第１の表示情報を生成する
　ことを特徴とする請求項１乃至７のいずれか１項に記載の分析システム。
　前記表示情報生成部は、前記第１の時系列データと、前記第２の時系列データと、前記第３の時系列データとをそれぞれ複数個ずつ第２の方向に並べて表示させるように前記第１の表示情報を生成する
　ことを特徴とする請求項１乃至８のいずれか１項に記載の分析システム。
　前記第２の方向に並んで表示される複数の前記第１の時系列データは、前記分類器の学習における重要度順に配列される
　ことを特徴とする請求項９に記載の分析システム。
　前記表示情報生成部は、前記第１の時系列データの特徴量と、前記第２の時系列データの特徴量と、前記第３の時系列データの特徴量とに基づく表示を行わせる第４の表示情報を生成する
　ことを特徴とする請求項１乃至１０のいずれか１項に記載の分析システム。
　入力された時系列データに対してイベント種別の分類を行うステップと、
　前記時系列データのうちのイベント種別の対応付けが未確定である第１の時系列データであって、対象イベントが発生している状態に対応する第１のイベント種別であると分類された第１の時系列データと、前記第１のイベント種別に対応付けられている第２の時系列データと、前記対象イベントが発生していない状態に対応する第２のイベント種別に対応付けられている第３の時系列データと、を表示させるための第１の表示情報を生成するステップと、
　前記第１の時系列データに対するイベント種別の対応付けに関する第１の入力を受け付けるステップと、
　を備えることを特徴とする分析方法。
　コンピュータに、
　入力された時系列データに対してイベント種別の分類を行うステップと、
　前記時系列データのうちのイベント種別の対応付けが未確定である第１の時系列データであって、対象イベントが発生している状態に対応する第１のイベント種別であると分類された第１の時系列データと、前記第１のイベント種別に対応付けられている第２の時系列データと、前記対象イベントが発生していない状態に対応する第２のイベント種別に対応付けられている第３の時系列データと、を表示させるための第１の表示情報を生成するステップと、
　前記第１の時系列データに対するイベント種別の対応付けに関する第１の入力を受け付けるステップと、
　を実行させることを特徴とするプログラムが記憶された記憶媒体。