WO2023148843A1

WO2023148843A1 - 時系列データ処理方法

Info

Publication number: WO2023148843A1
Application number: PCT/JP2022/004047
Authority: WO
Inventors: 昌尚棗田
Original assignee: 日本電気株式会社
Priority date: 2022-02-02
Filing date: 2022-02-02
Publication date: 2023-08-10

Abstract

本発明の時系列データ処理装置１００は、対象が予め設定された状態における、対象の動作を表すログデータと、対象から計測した計測値を表す数値データと、対象の性能を表す性能データと、に基づいて、ログデータと数値データとを入力として、性能データを予測し、ログデータと数値データとの特徴量を表す特徴量ベクトルを生成する学習モデルを生成する生成部１２１を備える。そして、生成部１２１は、予め設定された基準を満たす分布となるよう前記特徴量ベクトルを生成する学習モデルを生成する。

Description

時系列データ処理方法

　本発明は、時系列データ処理方法、時系列データ処理装置、プログラムに関する。

　エネルギー（電気、ガス、上水など）、化学製品（原油、ガソリン、プラスチックなど）、金属製品（鉄、半導体など）、機械製品（自動車、コンピュータなど）、食品、医薬品、などを製造する産業プラントや、情報処理システムといった設備では、各種センサからの計測値である時系列データを分析し、異常状態が発生したことを検出して出力することが行われている。例えば、特許文献１では、監視対象設備に設置されるセンサによって取得されたデータを入力データとし、自己符号化器を用いて入力データを再現した出力データの再現誤差を検出することで、監視対象設備の異常を検出している。

特開２０１９－１７９４００号公報

　しかしながら、特許文献１の技術では、センサにて計測した数値データのみから異常を検出しているため、監視対象で生じている動作を考慮した異常を検知することが困難である、という問題が生じる。一例として、監視対象で実行されるはずのプログラムがバグにより実行されなかったにも関わらず、プログラムからエラーコードが出力されなかった場合には、ＣＰＵ使用率などの数値データのみから異常を検出することができない。その結果、監視対象の状態を検出する精度の向上を図ることができない、という問題が生じる。

　このため、本発明の目的は、上述した課題である、対象の状態を検出する精度の向上を図ることができない、ことを解決することにある。

　本発明の一形態である時系列データ処理方法は、
　対象が予め設定された状態における、対象の動作を表すログデータと、対象から計測した計測値を表す数値データと、対象の性能を表す性能データと、に基づいて、前記ログデータと前記数値データとを入力として、前記性能データを予測し、前記ログデータと前記数値データとの特徴量を表す特徴量ベクトルを生成する学習モデルを生成する際に、予め設定された基準を満たす分布となるよう前記特徴量ベクトルを生成する前記学習モデルを生成する、
という構成をとる。

　また、本発明の一形態である時系列データ処理装置は、
　対象が予め設定された状態における、対象の動作を表すログデータと、対象から計測した計測値を表す数値データと、対象の性能を表す性能データと、に基づいて、前記ログデータと前記数値データとを入力として、前記性能データを予測し、前記ログデータと前記数値データとの特徴量を表す特徴量ベクトルを生成する学習モデルを生成する生成部を備え、
　前記生成部は、予め設定された基準を満たす分布となるよう前記特徴量ベクトルを生成する前記学習モデルを生成する、
という構成をとる。

　また、本発明の一形態であるプログラムは、
　コンピュータに、
　対象が予め設定された状態における、対象の動作を表すログデータと、対象から計測した計測値を表す数値データと、対象の性能を表す性能データと、に基づいて、前記ログデータと前記数値データとを入力として、前記性能データを予測し、前記ログデータと前記数値データとの特徴量を表す特徴量ベクトルを生成する学習モデルを生成する際に、予め設定された基準を満たす分布となるよう前記特徴量ベクトルを生成する前記学習モデルを生成する、
処理を実行させる、
という構成をとる。

　本発明は、以上のように構成されることにより、対象の状態を検出する精度の向上を図ることができる。

本発明の実施形態１における時系列データ処理装置の構成を示すブロック図である。図１に開示した時系列データ処理装置の学習部の構成を示すブロック図である。図１に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。図１に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。図１に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。図１に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。図１に開示した時系列データ処理装置の動作を示すフローチャートである。図１に開示した時系列データ処理装置の動作を示すフローチャートである。本発明の実施形態２における時系列データ処理装置のハードウェア構成を示すブロック図である。本発明の実施形態２における時系列データ処理装置の構成を示すブロック図である。本発明の実施形態２における時系列データ処理装置の動作を示すフローチャートである。

　＜実施形態１＞
　本発明の第１の実施形態を、図１乃至図８を参照して説明する。図１乃至図２は、時系列データ処理装置の構成を説明するための図であり、図３乃至図８は、時系列データ処理装置の処理動作を説明するための図である。

　［構成］
　本発明における時系列データ処理装置１０は、情報処理システムなどの状態を検出する対象Ｃに接続されている。そして、時系列データ処理装置１０は、対象Ｃの動作を表すログデータと、対象Ｃに設置された計測装置にて計測された計測値を表す数値データと、対象Ｃの性能を表す性能データと、を取得して分析し、分析結果に基づいて対象Ｃの状態を検出するものである。

　ここで、対象Ｃは、例えば、サーバ装置などの情報処理システムである。この場合、ログデータは、情報処理システムが実行しているイベントなどの処理内容を表すログ系列データである。また、数値データは、情報処理システムを構成する各情報処理装置のＣＰＵ（Central Processing Unit）使用率、メモリ使用率、ディスクアクセス頻度、入出力パケット数、入出力パケットレート、消費電力値などの数値にて表される数値系列データである。また、性能データは、情報処理システムを構成する各情報処理装置による処理時間や実行スレッド数、滞留キュー数などの性能指標を表すデータである。

　そして、時系列データ処理装置１０で検出する対象Ｃの状態は、本実施形態では対象Ｃの異常状態であることとし、ログと計測値からなる時系列データに基づいて、異常状態であることを検出することとする。ここで、異常状態は、予め定めた所定の期間における対象Ｃの状態から大きく逸脱する状態であり、故障や障害、およびそれらの予兆、その所定の期間で作動しなかった動作モードで作動している状態であってよく、複数の状態に対応していてもよい。なお、時系列データ処理装置１０で検出する対象Ｃの状態は、異常状態であることに限定されず、正常状態であることを検出したり、特定の動作モードで作動している状態など、いかなる状態を検出してもよく、また複数の状態を検出してもよい。

　但し、本発明において状態を検出する対象Ｃは、情報処理システムであることに限定されず、製造工場や処理施設などのプラントなど、いかなるものであってもよい。例えば、対象Ｃがプラントである場合には、ログデータは、プラントを構成する機器や設備の動作による処理内容を表すデータであり、計測値である数値データは、プラント内の温度、圧力、流量、消費電力値、原料の供給量、残量などの数値である。また、性能データは、プラントによる処理時間、歩留まり率などの性能指標を表すデータである。

　時系列データ処理装置１０は、演算装置と記憶装置とを備えた１台又は複数台の情報処理装置にて構成される。そして、時系列データ処理装置１０は、図１に示すように、データ取得部１１、学習部１２、状態検出部１３、を備える。データ取得部１１、学習部１２、状態検出部１３の機能は、演算装置が記憶装置に格納された各機能を実現するためのプログラムを実行することにより、実現することができる。また、時系列データ処理装置１０は、取得データ記憶部１６、学習モデル記憶部１７を備える。取得データ記憶部１６と学習モデル記憶部１７は、記憶装置により構成される。以下、各構成について詳述する。

　データ取得部１１は、所定の時間間隔あるいはイベントが発生する毎に、対象Ｃが実行している処理内容に対応するログ系列データを取得して、時間情報と共に取得データ記憶部１６に記憶する。このとき、ログ系列データとして、例えば、処理内容毎に予め設定された固有のログＩＤを取得して記憶する。一例として、データ取得部１１は、図３上図のログ系列データで示すように、各時間における処理内容に対応するログＩＤを取得して記憶する。

　また、データ取得部１１は、対象Ｃにて計測された計測値である数値系列データを、所定の時間間隔で取得して、時間情報と共に取得データ記憶部１６に記憶する。このとき、数値系列データとして、例えば、対象Ｃである情報処理システムのＣＰＵ使用率などのリソースの使用状況を表す数値を取得して記憶する。一例として、データ取得部１１は、図３上図の数値系列データで示すように、各時間におけるリソースの計測値を取得して記憶する。

　また、データ取得部１１は、対象Ｃにて計測された性能指標を表す性能データを、所定の時間間隔で取得して、時間情報と共に取得データ記憶部１６に記憶する。このとき、性能データとして、例えば、対象Ｃである情報処理システムによる処理時間や実行スレッド数、滞留キュー数を取得して記憶する。

　そして、データ取得部１１は、対象Ｃの稼働状態が正常であると判断されているときに取得したログ系列データ（第一のログ系列データ）と数値系列データ（第一の数値系列データ）と性能データ（第一の性能データ）とを、学習データとして蓄積しておく。また、データ取得部１１は、対象Ｃの異常状態を検出するために取得したログ系列データ（第二のログ系列データ）と数値系列データ（第二の数値系列データ）とを、状態検出用データとして取得する。このとき、データ取得部１１は、状態検出用データとして性能データ（第二の性能データ）も取得してもよい。

　学習部１２（生成部）は、対象Ｃが正常状態であると判断されたときに学習データとして取得され蓄積されているログ系列データ（第一のログ系列データ）と数値系列データ（第一の数値系列データ）と性能データ（第一の性能データ）とを用いて、機械学習を行う。特に、学習部１２は、ログ系列データと数値系列データとを入力して、性能データを予測値として出力する学習モデルを生成して学習モデル記憶部１７に記憶する。このとき、学習部１２は、入力されたログ系列データと数値系列データとから、実際の性能データとの誤差が最小となるような予測値を出力する学習モデルを生成する。この学習モデルはさらに、入力されたログ系列データと数値系列データとの特徴量を表す特徴量ベクトルを生成すると共に、当該特徴量ベクトルの分布が予め設定された基準を満たす分布となるよう学習部１２によって学習されている。以下、学習部１２による学習モデルの生成処理について詳しく説明する。

　図２に示すように、学習部１２は、エンコーダ１２Ａとデコーダ１２Ｂとを備えている。エンコーダ１２Ａは、第一特徴量算出部１２ａと、第二特徴量算出部１２ｂと、第三特徴量算出部１２ｃと、を備えており、学習データとして取得されたログ系列データと数値系列データとから、これらの特徴量を表す特徴量ベクトルＦを生成する。なお、ここでは、図３上図の符号Ｗで示すように、ログ系列データと数値系列データとからなる時系列データを所定の時間幅毎に分割し、分割した部分時系列データ毎のログ系列データと数値系列データとから、特徴量ベクトルＦを生成する。

　第一特徴量算出部１２ａは、学習データとして取得されたログ系列データからログ系列特徴量ベクトルｆ１を生成する。例えば、第一特徴量算出部１２ａは、図３下図に示すように、まず前処理として、各ログＩＤに、それぞれ各ログＩＤに対応するログが生じた時間を表す時間情報を組み合わせる。そして、符号Ｗで示すような時間幅毎に分割した部分時系列データに含まれる全てのログＩＤと時間との組み合わせデータをベクトル化することで、ログ系列ベクトルに変換する。つまり、ログ系列ベクトルは、符号Ｗで示すような時間幅毎に分割した各部分時系列データ内のログの特徴量を表すベクトルである。但し、第一特徴量算出部１２ａは、ログ系列データをログ系列ベクトルに変換する際に、必ずしもログＩＤに時間を組み合わせることに限定されず、ログＩＤやログを特定する情報だけのログ系列ベクトルに変換してもよい。また、ログ系列ベクトルには、数値がログの種別であることを表す情報が付加されてもよい。これは、ベクトルの１番目の要素が数値系列、ベクトルの２番目の要素がログ系列に対応するＯｎｅ－ｈｏｔベクトル表現でもよい。また、ログ系列ベクトルは、後述する数値系列ベクトルを同じ次元となるよう変換されてもよい。また、ログが生じた時間を表す時間情報は、符号Ｗで示した時間幅内での相対時間でもよい。これは、例えば、符号Ｗで示した時間幅の両端のＵＮＩＸ時刻をＴｓ、Ｔｅとし、ログの発生時刻のＵＮＩＸ時刻をＴとしたとき、Ｔ／｜Ｔｅ－Ｔｓ｜で計算される正規化された相対時間でもよい。ここで、｜・｜は絶対値を取り出す演算子である。

　そして、第一特徴量算出部１２ａは、ログ系列ベクトルと後述する数値系列ベクトルとから、後に詳述するように、Ｃｒｏｓｓ　Ａｔｔｅｎｔｉｏｎという手法を用いて、ログ系列ベクトルと数値系列ベクトルとの依存関係を表す情報を含む、ログ系列ベクトルの特徴量を表すログ系列特徴量ベクトルｆ１を生成する。例えば、図４の左側に示すように、ログ系列ベクトルを主、数値系列ベクトルを従とし、各ベクトルの各要素間の依存関係つまり関連度合いを表す重要度（スコア）を算出し、かかる重要度を各要素の重みとして用いて、ログ系列ベクトルの特徴量を表すログ系列特徴量ベクトルｆ１を生成する。

　第二特徴量算出部１２ｂは、学習データとして取得された数値系列データから数値系列特徴量ベクトルｆ２を生成する。例えば、第二特徴量算出部１２ｂは、図３下図に示すように、まず前処理として、各計測値である数値に、それぞれ各数値が計測された時間を表す時間情報を組み合わせる。そして、符号Ｗで示すような時間幅毎に分割した部分時系列データに含まれる全ての数値と時間との組み合わせデータをベクトル化することで、数値系列ベクトルに変換する。つまり、数値系列ベクトルは、符号Ｗで示すような時間幅毎に分割した各部分時系列データ内の計測値である数値の特徴量を表すベクトルである。但し、第二特徴量算出部１２ｂは、数値系列データを数値系列ベクトルに変換する際に、必ずしも計測値である数値に時間を組み合わせることに限定されず、数値情報だけの数値系列ベクトルに変換してもよい。また、数値系列ベクトルには、データが数値の種別であることを表す情報が付加されてもよい。これは、ベクトルの１番目の要素が数値系列、ベクトルの２番目の要素がログ系列に対応するＯｎｅ－ｈｏｔベクトル表現でもよい。また、数値系列ベクトルは、上述したログ系列ベクトルを同じ次元となるよう変換されてもよい。また、各数値が計測された時間を表す時間情報は、ログ系列の場合と同様に符号Ｗで示した時間幅内での相対時間でもよい。

　そして、第二特徴量算出部１２ｂは、ログ系列ベクトルと後述する数値系列ベクトルとから、後に詳述するように、Ｃｒｏｓｓ　Ａｔｔｅｎｔｉｏｎという手法を用いて、ログ系列ベクトルと数値系列ベクトルとの依存関係を表す情報を含む、数値系列ベクトルの特徴量を表す数値系列特徴量ベクトルｆ２を生成する。例えば、図４の右側に示すように、数値系列ベクトルを主、ログ系列ベクトルを従とし、各ベクトルの各要素間の依存関係つまり関連度合いを表す重要度（スコア）を算出し、かかる重要度を重みとして用いて、数値系列ベクトルの特徴量を表す数値系列特徴量ベクトルｆ２を生成する。

　ここで、上述したログ系列特徴量ベクトルｆ１及び数値系列特徴量ベクトルｆ２の生成方法の一例を説明する。ここでは、図４の左側に示すログ系列特徴量ベクトルｆ１を生成する方法を、図５を参照して説明するが、数値系列特徴量ベクトルも同様に生成する。まず、従となる数値ベクトルを（Ｋ，Ｖ）、主となるログ系列ベクトルを（Ｑ）とする。ここでは、「Ｑ，Ｋ，Ｖ」は別々の全結合層によって同じ次元となるように調整されており、また、「Ｋ，Ｖ」は同一なものとして図示しているが、別々の全結合層によって中身が異なる。なお、「Ｒ」は各ベクトルのデータ構造を示しており、「ｎ，ｍ」はデータ数、「ｄ」は次元、を表している。まず、「ｓｏｆｔｍａｘ（ＱＫ^Ｔ）」で示すようにログ系列ベクトルと数値系列ベクトルの依存関係から見た各要素の重要度を算出する。そして、かかる重要度を重みとし、「ｓｏｆｔｍａｘ（ＱＫ^Ｔ）Ｖ」で示すように、ログ系列特徴量ベクトルｆ１－１を算出する。その後、「ｖ＝ｓｏｆｔｍａｘ（ＱＫ^Ｔ）Ｖ」に基づいて決まる重み「ａ」を用いて、「ａ　ｓｏｆｔｍａｘ（ＱＫ^Ｔ）Ｖ」で示すように加重平均をとった１つの特徴量ベクトルであるログ系列特徴量ベクトルｆ１を生成する。ここで、「ａ」は、例えば図５中で示す式にて算出でき、「ｗ，Ｐ，Ｑ」は重みを表している。変形例では、ログ系列特徴量ベクトルｆ１－１の最新の時刻に対応するベクトルをログ系列特徴量ベクトルｆ１としてもよい。

　第三特徴量算出部１２ｃは、上述したように生成したログ系列特徴量ベクトルｆ１と数値系列特徴量ベクトルｆ２とから特徴量ベクトルＦを生成する。例えば、ログ系列特徴量ベクトルｆ１と数値系列特徴量ベクトルｆ２との和や結合により、特徴量ベクトルＦを生成する。このようにＣｒｏｓｓ　Ａｔｔｅｎｔｉｏｎという手法を用いて生成された特徴量ベクトルＦは、ログ系列データと数値系列データとの相互方向の依存関係を表す情報を含むこととなる。

　但し、学習部１２であるエンコーダ１２Ａは、必ずしも上述した方法で特徴量ベクトルＦを生成することに限定されず、いかなる方法でログ系列データと数値系列データとから特徴量ベクトルＦを生成してもよい。また、生成される特徴量ベクトルＦは、ログ系列データと数値系列データとのいかなる関係性を表す情報を含んでいてもよい。

　そして、デコーダ１２Ｂは、上述したように生成された特徴量ベクトルＦから、学習データとして取得された性能データを予測値として出力するよう学習する。このとき、エンコーダ１２Ａ及びデコーダ１２Ｂからなる学習部１２は、出力となる予測値と、学習データとして取得された性能データと、の誤差を最小とすると共に、予め設定された基準を満たすような分布となる特徴量ベクトルＦを、上述した手法で生成するよう学習する。本実施形態では、学習部１２は、図２に示すように、所定の座標空間において原点を中心とした所定範囲Ｒを設定し、かかる範囲Ｒ内に特徴量ベクトルＦの値が収まるよう、当該特徴量ベクトルＦを生成する。ここで、この座標空間の次元は、特徴量ベクトルＦの次元に一致し、原点は、特徴量ベクトルＦの分布の中心である。なお、学習部１２が生成する特徴量ベクトルＦは、所定の分布に従って密集すればよく、例えば、複数の中心点Ｃ_１、Ｃ_２、・・・、Ｃ_Ｎと、それぞれに対応する半径Ｒ_１、半径Ｒ_２、・・・、半径Ｒ_N内に特徴量ベクトルＦの値が収まるように、特徴量ベクトルＦを生成してもよい。また、所定範囲Ｒは、半径ｒの超球でもよい。また、所定範囲Ｒは、学習データの特徴量ベクトルＦの大半が収まる範囲としてもよく、所定範囲Ｒが半径ｒの超球の場合は、所定座標空間の原点から学習データの特徴量ベクトルＦが示す点までの距離の分布の上側ｑパーセント点を用いて決定してもよい。

　ここで、上述したエンコーダ１２Ａおよびデコーダ１２Ｂがニューラルネットワークで構成されている場合を例に、エンコーダ１２Ａとデコーダ１２Ｂの学習方法の一例を説明する。

　学習データとして、Ｎ組の学習サンプルが得られたとする。各サンプルは、長さlm_iの数値系列データxm_i、長さll_iのログ系列データxl_i、長さ１の性能データy_iからなる。ここで、iはサンプルＩＤを示すインデックスであるあ。エンコーダ１２Ａは数値系列データxm_iとログ系列データxl_iをD次元の特徴量ベクトルＦz_i=[z_i1, z_i2,..., z_iD]に変換するニューラルネットワークである。デコーダ１２Ｂは特徴量ベクトルＦz_iから性能データの予測値（数１式）を算出するニューラルネットワークである。

　本実施形態において、エンコーダ１２Ａとデコーダ１２Ｂは、数２式で定義される予測誤差に対する損失、を最小化するように、損失に対する各パラメータの勾配を誤差逆伝搬法によって求め、確率的勾配降下法で各パラメータを更新する。このパラメータ更新を損失の値が収束するまで続ける。

　次に、特徴量ベクトルＦの分布の中心の初期値を算出する。エンコーダ１２Ａを用いて各学習サンプルの特徴量ベクトルＦz_iを算出し、特徴量ベクトルＦの分布の中心c=[c₁,c₂,...,c_D]を、数３式によって、特徴量ベクトルＦz_iの平均値として初期化する。

　この初期値を用いて、エンコーダ１２Ａのパラメータを、数４式で定義される特徴量ベクトルＦの分布の広がりに対する損失、を最小化するように、損失に対する各パラメータの勾配を誤差逆伝搬法によって求め、確率的勾配降下法で各パラメータを更新する。このパラメータ更新を損失の値が収束するまで続ける。

　変形例は、エンコーダ１２Ａとデコーダ１２ＢがL_pを最小化するように学習した後、数５式を最小化するようにパラメータを更新する。ここではλは０以上の値を持つ調整パラメータである。

　なお、上述した学習方法は、１例であって、本発明はこの例に制限されない。

　状態検出部（検出部）１３は、上述した学習モデルを生成した後に対象Ｃから計測された状態検出用データであるログ系列データ（第二のログ系列データ）と数値系列データ（第二の数値系列データ）とを、学習モデル記憶部１７に記憶された学習モデルに入力し、その出力から対象Ｃの状態を検出する。本実施形態においては、学習モデルから特徴量ベクトルＦが新たに生成されて出力されるため、かかる特徴量ベクトルＦと、上述した学習部１２による学習の際に設定された平面空間の範囲Ｒと、に基づいて、異常状態を検出する。例えば、状態検出部１３は、図６に示すように、平面空間の範囲Ｒの中心となる原点と、新たに生成された特徴量ベクトルＦと、の距離Ｄを算出し、かかる距離Ｄから対象Ｃの異常度を算出する。このとき、距離Ｄが平面空間の範囲Ｒの外側に位置するほど異常度が高くなるよう算出され、異常状態と検出されることとなる。なお、学習時に、特徴量ベクトルＦが所定の分布となるよう学習している場合には、かかる分布と新たに生成した特徴量ベクトルＦとの乖離度などから異常度を算出して異常状態を検出してもよい。

　さらに、状態検出部１３は、ログ系列データと数値系列データとを学習モデルに入力することにより出力される性能の予測値と、対象Ｃから状態検出用データとして取得した性能データ（第二の性能データ）と、の誤差を算出し、その誤差から異常度を算出して対象Ｃの状態を検出してもよい。例えば、上述した特徴量ベクトルＦから算出した異常度と、予測誤差から算出した異常度と、の両方の値に基づいて、対象Ｃの状態を検出してもよい。

　なお、上述した状態検出部１３にて学習モデルに入力されるログ系列データと数値系列データとは、学習時に学習部１２に入力されたデータ構造と同一となる。つまり、本実施形態では、図３の符号Ｗに示すような所定の時間幅のログ系列データと数値系列データにそれぞれ時間情報を付加した、ログ系列ベクトルと数値系列ベクトルとが入力されることとなる。

　［動作］
　次に、上述した時系列データ処理装置１０の動作を、主に図７乃至図８のフローチャートを参照して説明する。まず、図７のフローチャートを参照して、対象Ｃの異常状態を検出するための学習モデルを生成するときの動作を説明する。

　時系列データ処理装置１０は、正常状態で稼働している対象Ｃから、対象Ｃが実行している処理内容に対応するログ系列データと、対象Ｃにて計測された計測値である数値系列データと、対象Ｃにて計測された性能指標を表す性能データと、を取得して、学習データとして記憶する（ステップＳ１）。そして、時系列データ処理装置１０は、学習データとして記憶されているログ系列データと数値系列データと性能データとを用いて、機械学習を行う（ステップＳ２）。このとき、時系列データ処理装置１０は、上述したように、入力されたログ系列データと数値系列データとから、実際の性能データとの誤差が最小となる予測値を出力すると共に、予め設定された基準を満たすような分布となるようなログ系列データと数値系列データとの特徴量を表す特徴量ベクトルを生成する学習モデルを生成して記憶する（ステップＳ３）。特に、時系列データ処理装置１０は、ログ系列ベクトルと数値系列ベクトルとの依存関係を表す情報を含むような特徴量ベクトルＦを生成するような学習モデルを生成する。

　次に、図８のフローチャートを参照して、対象Ｃの異常状態を検出するときの動作について説明する。この動作は、上述したように学習モデルを生成した後の動作となる。

　まず、時系列データ処理装置１０は、上述同様に、対象Ｃが実行している処理内容に対応するログ系列データと、対象Ｃにて計測された計測値である数値系列データとを、状態検出用データとして取得する（ステップＳ１１）。そして、時系列データ処理装置１０は、ログ系列データと数値系列データとを、記憶している学習モデルに対して入力する（ステップＳ１２）。時系列データ処理装置１０は、学習モデルにて新たに生成された特徴量ベクトルＦと、設定された平面空間の範囲Ｒと、に基づいて、対象Ｃの異常度を算出し（ステップＳ１３）、かかる異常度の値から対象Ｃの異常状態を検出する（ステップＳ１４）。例えば、時系列データ処理装置１０は、図６に示すように、平面空間の範囲Ｒの中心となる原点に対して、新たに生成された特徴量ベクトルＦが平面空間の範囲Ｒ外に位置する場合に、異常状態であると検出する。

　以上のように、本実施形態では、対象Ｃが実行している処理内容に対応するログと、対象Ｃにて計測された計測値である数値と、を用いて学習モデルを生成しており、かかる学習モデルを用いて対象Ｃの状態検出を行うことで、数値単独やログ単独で状態検出を行う場合よりも、より高い精度で対象Ｃの状態を検出することができる。特に、本実施形態では、ログと計測値との依存関係を含む特徴量ベクトルを生成する学習モデルを生成しており、さらに、かかる特徴量ベクトルが所定の分布となるよう学習モデルを生成しているため、ログと計測値との依存関係が考慮されたより精度の高い状態検出を行うことができる。

　さらに、本実施形態では、学習モデルが対象Ｃの性能の予測値を出力する構成となっており、特に、性能の予測値の誤差が最小になるよう学習されているため、かかる学習モデルにて生成される特徴量ベクトルには、性能予測に影響を及ぼす入力データが反映されることとなる。換言すると、生成される特徴量ベクトルには、性能予測に影響を及ぼさない入力データが反映されないこととなる。その結果、特徴量ベクトルを用いて状態検出を行うことで、誤検出を抑制でき、より精度の高い状態検出を行うことができる。
　

　＜実施形態２＞
　次に、本発明の第２の実施形態を、図９乃至図１１を参照して説明する。図９乃至図１０は、実施形態２における時系列データ処理装置の構成を示すブロック図であり、図１１は、時系列データ処理装置の動作を示すフローチャートである。なお、本実施形態では、上述した実施形態で説明した時系列データ処理装置及び時系列データ処理方法の構成の概略を示している。

　まず、図９を参照して、本実施形態における時系列データ処理装置１００のハードウェア構成を説明する。時系列データ処理装置１００は、一般的な情報処理装置にて構成されており、一例として、以下のようなハードウェア構成を装備している。
　・ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）１０１（演算装置）
　・ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）１０２（記憶装置）
　・ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）１０３（記憶装置）
　・ＲＡＭ１０３にロードされるプログラム群１０４
　・プログラム群１０４を格納する記憶装置１０５
　・情報処理装置外部の記憶媒体１１０の読み書きを行うドライブ装置１０６
　・情報処理装置外部の通信ネットワーク１１１と接続する通信インタフェース１０７
　・データの入出力を行う入出力インタフェース１０８
　・各構成要素を接続するバス１０９

　そして、時系列データ処理装置１００は、プログラム群１０４をＣＰＵ１０１が取得して当該ＣＰＵ１０１が実行することで、図１０に示す生成部１２１を構築して装備することができる。なお、プログラム群１０４は、例えば、予め記憶装置１０５やＲＯＭ１０２に格納されており、必要に応じてＣＰＵ１０１がＲＡＭ１０３にロードして実行する。また、プログラム群１０４は、通信ネットワーク１１１を介してＣＰＵ１０１に供給されてもよいし、予め記憶媒体１１０に格納されており、ドライブ装置１０６が該プログラムを読み出してＣＰＵ１０１に供給してもよい。但し、上述した生成部１２１は、かかる手段を実現させるための専用の電子回路で構築されるものであってもよい。

　なお、図９は、時系列データ処理装置１００である情報処理装置のハードウェア構成の一例を示しており、情報処理装置のハードウェア構成は上述した場合に限定されない。例えば、情報処理装置は、ドライブ装置１０６を有さないなど、上述した構成の一部から構成されてもよい。

　そして、時系列データ処理装置１００は、上述したようにプログラムによって構築された生成部１２１の機能により、図１１のフローチャートに示す時系列データ処理方法を実行する。

　図１１に示すように、時系列データ処理装置１００は、
　対象が予め設定された状態における、対象の動作を表すログデータと、対象から計測した計測値を表す数値データと、対象の性能を表す性能データと、を含む時系列データに基づいて、前記ログデータと前記数値データとを入力として、前記性能データを予測すると共に、前記ログデータと前記数値データとの特徴量を表す特徴量ベクトルを生成する学習モデルを生成する際に、予め設定された基準を満たす分布となるよう前記特徴量ベクトルを生成する前記学習モデルを生成する（ステップＳ１０１）、
という処理を実行する。

　本発明は、以上のように構成されることにより、対象のログデータと数値データとの関係が考慮された学習モデルを生成でき、かかる学習モデルを用いることで対象の状態をより高い精度で検出することができる。

　なお、上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体（non-transitory computer readable medium）を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（tangible storage medium）を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（Read Only Memory）、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM）、フラッシュＲＯＭ、ＲＡＭ（Random Access Memory））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（transitory computer readable medium）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

　以上、上記実施形態等を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。また、上述した生成部１２１の機能のうちの少なくとも一以上の機能は、ネットワーク上のいかなる場所に設置され接続された情報処理装置で実行されてもよく、つまり、いわゆるクラウドコンピューティングで実行されてもよい。

　＜付記＞
　上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明における時系列データ処理方法、時系列データ処理装置、プログラムの構成の概略を説明する。但し、本発明は、以下の構成に限定されない。
（付記１）
　対象が予め設定された状態における、対象の動作を表すログデータと、対象から計測した計測値を表す数値データと、対象の性能を表す性能データと、に基づいて、前記ログデータと前記数値データとを入力として、前記性能データを予測し、前記ログデータと前記数値データとの特徴量を表す特徴量ベクトルを生成する学習モデルを生成する際に、予め設定された基準を満たす分布となるよう前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理方法。
（付記２）
　付記１に記載の時系列データ処理方法であって、
　前記ログデータと前記数値データとに対応する前記性能データと、当該ログデータと当該数値データとを入力としたときの予測値と、の誤差が最小となるよう前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理方法。
（付記３）
　付記１又は２に記載の時系列データ処理方法であって、
　前記時系列データに含まれる前記ログデータと前記数値データとの関係性を表す情報に関する前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理方法。
（付記４）
　付記３に記載の時系列データ処理方法であって、
　前記ログデータと前記数値データとの依存関係を表す情報に関する前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理方法。
（付記５）
　付記４に記載の時系列データ処理方法であって、
　前記ログデータと前記数値データとの相互方向の依存関係を表す情報に関する前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理方法。
（付記６）
　付記１乃至５のいずれかに記載の時系列データ処理方法であって、
　前記特徴量ベクトルが所定の空間範囲内に収まるよう当該特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理方法。
（付記７）
　付記６に記載の時系列データ処理方法であって、
　前記特徴量ベクトルが予め設定された座標を中心とした所定範囲内に収まるよう当該特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理方法。
（付記８）
　付記１乃至７のいずれかに記載の時系列データ処理方法であって、
　対象から新たに計測された前記ログデータと前記数値データとを前記学習モデルに入力して生成された新たな前記特徴量ベクトルに基づいて、対象の状態を検出する、
時系列データ処理方法。
（付記９）
　付記８に記載の時系列データ処理方法であって、
　前記学習モデルを生成する際に生成された前記特徴量ベクトルの分布と、前記新たな特徴量ベクトルと、に基づいて、対象の状態を判別する、
時系列データ処理方法。
（付記１０）
　対象が予め設定された状態における、対象の動作を表すログデータと、対象から計測した計測値を表す数値データと、対象の性能を表す性能データと、に基づいて、前記ログデータと前記数値データとを入力として、前記性能データを予測し、前記ログデータと前記数値データとの特徴量を表す特徴量ベクトルを生成する学習モデルを生成する生成部を備え、
　前記生成部は、予め設定された基準を満たす分布となるよう前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理装置。
（付記１１）
　付記１０に記載の時系列データ処理装置であって、
　前記生成部は、前記ログデータと前記数値データとに対応する前記性能データと、当該ログデータと当該数値データとを入力としたときの予測値と、の誤差が最小となるよう前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理装置。
（付記１２）
　付記１０又は１１に記載の時系列データ処理装置であって、
　前記生成部は、前記ログデータと前記数値データとの関係性を表す情報に関する前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理装置。
（付記１３）
　付記１０乃至１２のいずれかに記載の時系列データ処理装置であって、
　前記生成部は、前記特徴量ベクトルが所定の空間範囲内に収まるよう当該特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理装置。
（付記１４）
　付記１０乃至１３のいずれかに記載の時系列データ処理装置であって、
　対象から新たに計測された前記ログデータと前記数値データとを前記学習モデルに入力して生成された新たな前記特徴量ベクトルに基づいて、対象の状態を検出する検出部を備えた、
時系列データ処理装置。
（付記１５）
　付記１４に記載の時系列データ処理装置であって、
　前記検出部は、前記学習モデルを生成する際に生成された前記特徴量ベクトルの分布と、前記新たな特徴量ベクトルと、に基づいて、対象の状態を判別する、
時系列データ処理装置。
（付記１６）
　コンピュータに、
　対象が予め設定された状態における、対象の動作を表すログデータと、対象から計測した計測値を表す数値データと、対象の性能を表す性能データと、に基づいて、前記ログデータと前記数値データとを入力として、前記性能データを予測し、前記ログデータと前記数値データとの特徴量を表す特徴量ベクトルを生成する学習モデルを生成する際に、予め設定された基準を満たす分布となるよう前記特徴量ベクトルを生成する前記学習モデルを生成する、
処理を実行させるためのプログラムを記憶したコンピュータにて読み取り可能な記憶媒体。

１０　時系列データ処理装置
１１　データ取得部
１２　学習部
１３　状態検出部
１６　取得データ記憶部
１７　学習モデル記憶部
１００　時系列データ処理装置
１０１　ＣＰＵ
１０２　ＲＯＭ
１０３　ＲＡＭ
１０４　プログラム群
１０５　記憶装置
１０６　ドライブ装置
１０７　通信インタフェース
１０８　入出力インタフェース
１０９　バス
１１０　記憶媒体
１１１　通信ネットワーク
１２１　生成部

Claims

　対象が予め設定された状態における、対象の動作を表すログデータと、対象から計測した計測値を表す数値データと、対象の性能を表す性能データと、に基づいて、前記ログデータと前記数値データとを入力として、前記性能データを予測し、前記ログデータと前記数値データとの特徴量を表す特徴量ベクトルを生成する学習モデルを生成する際に、予め設定された基準を満たす分布となるよう前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理方法。
　請求項１に記載の時系列データ処理方法であって、
　前記ログデータと前記数値データとに対応する前記性能データと、当該ログデータと当該数値データとを入力としたときの予測値と、の誤差が最小となるよう前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理方法。
　請求項１又は２に記載の時系列データ処理方法であって、
　前記ログデータと前記数値データとの関係性を表す情報に関する前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理方法。
　請求項３に記載の時系列データ処理方法であって、
　前記ログデータと前記数値データとの依存関係を表す情報に関する前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理方法。
　請求項４に記載の時系列データ処理方法であって、
　前記ログデータと前記数値データとの相互方向の依存関係を表す情報に関する前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理方法。
　請求項１乃至５のいずれかに記載の時系列データ処理方法であって、
　前記特徴量ベクトルが所定の空間範囲内に収まるよう当該特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理方法。
　請求項６に記載の時系列データ処理方法であって、
　前記特徴量ベクトルが予め設定された座標を中心とした所定範囲内に収まるよう当該特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理方法。
　請求項１乃至７のいずれかに記載の時系列データ処理方法であって、
　対象から新たに計測された前記ログデータと前記数値データとを前記学習モデルに入力して生成された新たな前記特徴量ベクトルに基づいて、対象の状態を検出する、
時系列データ処理方法。
　請求項８に記載の時系列データ処理方法であって、
　前記学習モデルを生成する際に生成された前記特徴量ベクトルの分布と、前記新たな特徴量ベクトルと、に基づいて、対象の状態を判別する、
時系列データ処理方法。
　対象が予め設定された状態における、対象の動作を表すログデータと、対象から計測した計測値を表す数値データと、対象の性能を表す性能データと、に基づいて、前記ログデータと前記数値データとを入力として、前記性能データを予測し、前記ログデータと前記数値データとの特徴量を表す特徴量ベクトルを生成する学習モデルを生成する生成部を備え、
　前記生成部は、予め設定された基準を満たす分布となるよう前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理装置。
　請求項１０に記載の時系列データ処理装置であって、
　前記生成部は、前記ログデータと前記数値データとに対応する前記性能データと、当該ログデータと当該数値データとを入力としたときの予測値と、の誤差が最小となるよう前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理装置。
　請求項１０又は１１に記載の時系列データ処理装置であって、
　前記生成部は、前記ログデータと前記数値データとの関係性を表す情報に関する前記特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理装置。
　請求項１０乃至１２のいずれかに記載の時系列データ処理装置であって、
　前記生成部は、前記特徴量ベクトルが所定の空間範囲内に収まるよう当該特徴量ベクトルを生成する前記学習モデルを生成する、
時系列データ処理装置。
　請求項１０乃至１３のいずれかに記載の時系列データ処理装置であって、
　対象から新たに計測された前記ログデータと前記数値データとを前記学習モデルに入力して生成された新たな前記特徴量ベクトルに基づいて、対象の状態を検出する検出部を備えた、
時系列データ処理装置。
　請求項１４に記載の時系列データ処理装置であって、
　前記検出部は、前記学習モデルを生成する際に生成された前記特徴量ベクトルの分布と、前記新たな特徴量ベクトルと、に基づいて、対象の状態を判別する、
時系列データ処理装置。
　コンピュータに、
　対象が予め設定された状態における、対象の動作を表すログデータと、対象から計測した計測値を表す数値データと、対象の性能を表す性能データと、に基づいて、前記ログデータと前記数値データとを入力として、前記性能データを予測し、前記ログデータと前記数値データとの特徴量を表す特徴量ベクトルを生成する学習モデルを生成する際に、予め設定された基準を満たす分布となるよう前記特徴量ベクトルを生成する前記学習モデルを生成する、
処理を実行させるためのプログラムを記憶したコンピュータにて読み取り可能な記憶媒体。