WO2023242927A1

WO2023242927A1 - データ管理装置、データ管理方法、及びプログラム

Info

Publication number: WO2023242927A1
Application number: PCT/JP2022/023690
Authority: WO
Inventors: 絵莉奈竹下; 章弘森田; 友哉小杉; 友輝山田
Original assignee: 日本電信電話株式会社
Priority date: 2022-06-13
Filing date: 2022-06-13
Publication date: 2023-12-21

Abstract

本開示に係るデータ管理装置（１０）は、将来のネットワークパラメータの予測値を出力する学習済みモデルの生成に用いられた学習データを所定期間ごとに分割し、分割データとして出力する分割データ生成部（１１１）と、分割データごとに学習済みモデルを適用した結果を示す学習結果情報を取得する学習結果情報取得部（１１２）と、分割データに対応する期間のネットワークパラメータの実測値を示す実測値情報を取得し、実測値情報と学習結果情報とに基づいて、分割データのそれぞれについて、学習済みモデルの予測精度を判断する精度判断部（１１３）と、予測精度に応じて、分割データを圧縮するか否かを決定する圧縮決定部（１１４）と、圧縮決定部（１１４）により圧縮されなかった分割データである非圧縮分割データと、圧縮決定部（１１４）により圧縮された分割データである圧縮分割データとを記憶する記憶部（１２）と、を備える。

Description

データ管理装置、データ管理方法、及びプログラム

　本開示は、データ管理装置、データ管理方法、及びプログラムに関する。

　従来、複数の転送装置を介して複数のエンド端末間の通信が行われる通信ネットワークＮＷを有する通信システムＮＳであって、当該通信ネットワークの性能を表すパラメータ（本明細書において、ネットワークパラメータと呼ぶ。）のデータを収集するネットワークデータベースＮＤＢと、機械学習の技術を用いて将来のネットワークパラメータを予測する予測機能部ＬＭとを有する通信システムが存在する。図５は、当該通信システムＮＳの概略を示す。通信システムＮＳでは、転送装置Ｔ１からＴ４を介して、エンド端末ＥＴ１とエンド端末ＥＴ２との通信が行われる。図６のグラフは、縦軸が収集されたネットワークパラメータとしてのトラフィック流量を、横軸が時間を表す。通信システムＮＳでは、図６の矢印で示す時点において、過去のトラフィック流量を学習データとして用いて任意の機械学習を行って学習モデルが作成され、該学習モデルを用いて、将来のトラフィック流量を予測機能部ＬＭが予測できる。このように、将来のネットワークパラメータを予測する手法が考案されている。

　例えば非特許文献１では、過去のネットワークパラメータを用いて、将来のネットワークパラメータを予測する技術が開示されている。学習モデルの生成に用いる学習データは、過去のネットワークパラメータの他、関連する設定データも含まれることもある。例えば非特許文献２においては、ネットワークパラメータの他、ユーザ特徴データを用いて機械学習を行い、生成した学習モデルに基づいて将来のネットワークパラメータを予測することが開示されている。

R. Vinayakumar, K. P. Soman and P. Poornachandran, "Applying deep learning approaches for network traffic prediction," 2017 International Conference on Advances in Computing, Communications and Informatics (ICACCI), 2017 A. Azari, P. Papapetrou, S. Denic, and G. Peters, "User traffic prediction for proactive resource management: Learning-powered approaches," in 2019 IEEE Global Communications Conference (GLOBECOM), pp. 1-6, 2019.

　過去のデータに対して高い精度を示せたとしても、将来的に予測精度が低下していくことが知られている。図７は、縦軸がトラフィック流量、横軸が時間を表すグラフである。まず学習期間Ａにおけるトラフィック流量を学習データとして用いて機械学習が行われ、学習モデルＡが生成される。当該学習モデルＡは、学習期間Ａのデータのうちのテストデータで高い予測精度があることが確認されているとする。図７の矢印で示すタイミングで学習モデルＡを用いて、予測期間Ｂに対するトラフィック流量の予測を行っていると、トラフィック流量のトレンドの変化等に伴い、学習モデルＡでは予測の精度が低下してくることが予想される。予測の精度を改善するために，新たな学習データとしての予測期間Ｂのトラフィック流量のデータと、過去の学習データである学習期間Ａのトラフィック流量のデータとを用いて、再学習又はモデルアーキテクチャの再設計を実施する必要がある。

　一方で、過去の学習データを生データとして持ち続けると、ネットワークデータベースＮＤＢの維持管理コストが増大する問題がある。トラフィック流量の予測の精度が維持できる範囲で、保存する過去のデータの量を減じることが必要である。このように、学習済みモデルの見直しのための学習データの保存の効率を改善する技術が望まれていた。

　かかる事情に鑑みてなされた本開示の目的は、学習済みモデルの見直しのための学習データの保存効率を改善する技術を提供することにある。

　上記課題を解決するため、本開示に係るデータ管理装置は、将来のネットワークパラメータの予測値を出力する学習済みモデルの生成に用いられた学習データを所定期間ごとに分割し、分割データとして出力する分割データ生成部と、前記分割データごとに前記学習済みモデルを適用した結果を示す学習結果情報を取得する学習結果情報取得部と、前記分割データに対応する期間のネットワークパラメータの実測値を示す実測値情報を取得し、前記実測値情報と前記学習結果情報とに基づいて、前記分割データのそれぞれについて、前記学習済みモデルの予測精度を判断する精度判断部と、前記予測精度に応じて、前記分割データを圧縮するか否かを決定する圧縮決定部と、前記圧縮決定部により圧縮されなかった分割データである非圧縮分割データと、前記圧縮決定部により圧縮された分割データである圧縮分割データとを記憶する記憶部と、を備える。

　また、上記課題を解決するため、本開示に係るデータ管理方法は、記憶部を備えるデータ管理装置が実行するデータ管理方法であって、将来のネットワークパラメータの予測値を出力する学習済みモデルの生成に用いられた学習データを所定期間ごとに分割し、分割データとして出力する分割データ生成ステップと、前記分割データごとに前記学習済みモデルを適用した結果を示す学習結果情報を取得する学習結果情報取得ステップと、前記分割データに対応する期間のネットワークパラメータの実測値を示す実測値情報を取得し、前記実測値情報と前記学習結果情報とに基づいて、前記分割データのそれぞれについて、前記学習済みモデルの予測精度を判断する精度判断ステップと、前記予測精度に応じて、前記分割データを圧縮するか否かを決定する圧縮決定ステップと、前記圧縮決定ステップにより圧縮されなかった分割データである非圧縮分割データと、前記圧縮決定ステップにより圧縮された分割データである圧縮分割データとを前記記憶部に記憶する記憶ステップと、を含む。

　上記課題を解決するため、本開示に係るプログラムは、コンピュータを、本開示に係るデータ管理装置として機能させる。

　本開示に係るデータ管理装置、データ管理方法、及びプログラムによれば、継続学習のための学習データの保存効率を改善することができる。

本実施形態に係るシステムの概略構成を示す図である。本実施形態に係るデータ管理装置の構成例を示す図である。分割データを説明するための図である。本実施形態に係るデータ管理装置の動作の一例を示すフローチャートである。本実施形態に係るデータ管理装置の動作の一例を示すフローチャートである。従来の通信システムを示す概略図である。従来の、ネットワークパラメータの予測をする技術を説明するための図である。従来の機械学習の例を説明するための図である。

　＜システム１の概略構成＞
　図１は、本実施形態に係るシステム１の構成を示す図である。図１に示すように、システム１は、ネットワークパラメータ収集装置Ｎと、データ管理装置１０とを備える。各装置は、例えばインターネット及び移動体通信網等を含むネットワーク３０と有線又は無線により通信可能に接続される。各装置間で情報を送受信するための通信方法は、特に限定されない。各装置は一体化されていてもよい。つまり、例えば、データ管理装置１０が、ネットワークパラメータ収集装置Ｎの機能を備えていても良い。各装置は、ネットワーク３０を介して、互いに通信する。

　ネットワークパラメータ収集装置Ｎとデータ管理装置１０とは、クラウドコンピューティングシステム又はその他のコンピューティングシステムに属するサーバ等のコンピュータである。

　ネットワーク３０は、インターネット、少なくとも１つＷＡＮ（Wide Area Network）、少なくとも１つのＭＡＮ（Metropolitan Area Network）、又はこれらの任意の組合せを含む。ネットワーク３０は、少なくとも１つの無線ネットワーク、少なくとも１つの光ネットワーク、又はこれらの任意の組合せを含んでもよい。無線ネットワークは、例えば、アドホックネットワーク、セルラーネットワーク、無線ＬＡＮ（local area network）、衛星通信ネットワーク、又は地上マイクロ波ネットワークである。

　ネットワークパラメータ収集装置Ｎは、メモリ、コントローラ、及び通信インターフェースを備えるコンピュータによって構成される。メモリは、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、ＥＥＰＲＯＭ（Electrically Erasable Programmable Read-Only Memory）、ＲＯＭ（Read-Only Memory）及びＲＡＭ（Random Access Memory）等によって構成されてもよい。コントローラは、ＡＳＩＣ(Application Specific Integrated Circuit)、ＦＰＧＡ(Field-Programmable Gate Array)等の専用のハードウェアによって構成されてもよいし、プロセッサによって構成されてもよいし、双方を含んで構成されてもよい。通信インターフェースには、例えば、イーサネット（登録商標）、ＦＤＤＩ（Fiber Distributed Data Interface）、Ｗｉ－Ｆｉ（登録商標）等の規格が用いられてもよい。

　ネットワークパラメータ収集装置Ｎは、ネットワーク３０内の、ネットワークの性能を表すパラメータであるネットワークパラメータを収集する。ネットワークパラメータとは，インターフェースごと又はフローごと等、任意の単位で、任意の時間間隔で収集されるパラメータのことである。ネットワークパラメータは、例えば平均送信トラフィック流量、転送装置におけるリソース利用率、遅延時間を含む。本実施形態において、ネットワークパラメータは平均送信トラフィック流量を指す。ネットワークパラメータ収集装置Ｎは、収集したネットワークパラメータのログを示すログ情報を、データ管理装置１０へ送信する。当該ログ情報は、学習データとして学習モデルの生成に用いられるものである。

　データ管理装置１０は、以下で説明するように、学習済みモデルの生成に用いられた学習データを用いて、当該学習済みモデルの予測精度を判断する。データ管理装置１０は、当該予測精度に応じて、学習データの保存の手法を決定する。データ管理装置１０は、学習済みモデルの予測精度が下がった場合に、保存していた学習データと直近のネットワークパラメータとを用いて再学習又は新たなモデルを生成する。

　＜データ管理装置１０の構成＞
　図２を参照して、データ管理装置１０について説明する。データ管理装置１０は制御部１１、記憶部１２、通信部１３、入力部１４、及び出力部１５を備える。

　記憶部１２は、１つ以上のメモリを含み、例えば半導体メモリ、磁気メモリ、光メモリなどを含んでもよい。記憶部１２に含まれる各メモリは、例えば主記憶装置、補助記憶装置、又はキャッシュメモリとして機能してもよい。記憶部１２は、データ管理装置１０の動作に用いられる任意の情報を記憶する。記憶部１２は、必ずしもデータ管理装置１０が内部に備える必要はなく、データ管理装置１０の外部に備える構成としてもよい。記憶部１２は、以下で説明するように、圧縮決定部１１４により圧縮されなかった分割データである非圧縮分割データと、圧縮決定部１１４により圧縮された分割データである圧縮分割データとを記憶する。

　通信部１３は、ネットワーク３０に接続する１つ以上の通信用インターフェースを含む。当該通信用インターフェースは、例えば移動通信規格、有線ＬＡＮ規格、又は無線ＬＡＮ規格に対応するが、これらに限られず、任意の通信規格に対応してもよい。通信部１３は、データ管理装置１０の動作に用いられる情報を受信し、またデータ管理装置１０の動作によって得られる情報を送信する。

　入力部１４には、少なくとも１つの入力用インターフェースが含まれる。入力用インターフェースは、例えば、物理キー、静電容量キー、ポインティングデバイス、ディスプレイと一体的に設けられたタッチスクリーン、又はマイクである。入力部１４は、データ管理装置１０の動作に用いられる情報を入力する操作を受け付ける。入力部１４は、データ管理装置１０に備えられる代わりに、外部の入力機器としてデータ管理装置１０に接続されてもよい。接続方式としては、例えば、ＵＳＢ（Universal Serial Bus）、ＨＤＭＩ（High-Definition Multimedia Interface）（登録商標）、又はBluetooth（登録商標）等の任意の方式を用いることができる。

　出力部１５には、少なくとも１つの出力用インターフェースが含まれる。出力用インターフェースは、例えば、ディスプレイ又はスピーカである。ディスプレイは、例えば、ＬＣＤ（Liquid Crystal Display）又は有機ＥＬ（Electro Luminescence）ディスプレイである。出力部１５は、データ管理装置１０の動作によって得られる情報を出力する。出力部１５は、データ管理装置１０に備えられる代わりに、外部の出力機器としてデータ管理装置１０に接続されてもよい。接続方式としては、例えば、ＵＳＢ、ＨＤＭＩ（登録商標）、又はBluetooth（登録商標）等の任意の方式を用いることができる。

　制御部１１は、制御演算回路（コントローラ）により実現される。該制御演算回路は、ＡＳＩＣ、ＦＰＧＡ等の専用のハードウェアによって構成されてもよいし、プロセッサによって構成されてもよいし、双方を含んで構成されてもよい。制御部１１は、データ管理装置１０の各部を制御しながら、データ管理装置１０の動作に関わる処理を実行する。制御部１１は、外部装置との情報の送受信を、通信部１３及びネットワーク３０を介して行うことができる。

　制御部１１は、分割データ生成部１１１と、学習結果情報取得部１１２と、精度判断部１１３と、圧縮決定部１１４と、圧縮部１１５と、復元部１１６と、学習部１１７とを備える。

　分割データ生成部１１１は、将来のネットワークパラメータの予測値を出力する学習済みモデルの生成に用いられた学習データを所定期間ごとに分割し、分割データとして出力する。分割データ生成部１１１はまず、学習済みモデルの生成に用いられた学習データを取得する。学習データの取得には任意の手法が採用されてよい。本実施形態では、以下で説明するようにネットワークパラメータ収集装置Ｎから学習部１１７が学習データを取得し、当該学習データに基づいて学習済みモデルを生成する。分割データ生成部１１１は、学習部１１７から当該学習データを取得できる。これに限られず、分割データ生成部１１１はネットワークパラメータ収集装置Ｎから直接、学習データを受信することで取得してもよい。

　図３を参照して分割データ生成部１１１が出力する分割データを説明する。図３は学習部１１７が学習済みモデル生成のために用いる学習データを示し、縦軸はネットワークパラメータとしてのトラフィック流量を示し、横軸は時間を示す。ネットワークパラメータは本実施形態ではトラフィック流量であるがこれに限られず、転送装置におけるリソース利用率、遅延時間等であってもよい。学習データとしてのネットワークパラメータのうち、学習データＤ１の範囲については、学習部１１７によって学習が完了しているとする。分割データ生成部１１１は、学習データＤ１を、時間tごとに分割し、ｎ個の分割データd_{1,1}，d_{1,2},...d_{1,n}の集合を生成する。ｔはユーザによって自由に設定されてよい。分割データ生成部１１１は、生成した複数の分割データを学習結果情報取得部１１２へ出力する。

　学習結果情報取得部１１２は、分割データごとに学習済みモデルを適用した結果を示す学習結果情報を取得する。学習結果情報取得部１１２はまず、以下で説明する、学習済みモデルを生成した学習部１１７から、当該学習済みモデルを取得する。

　学習結果情報取得部１１２は、取得した学習済みモデルを、分割データ生成部１１１から出力された複数の分割データのそれぞれに適用する。本実施形態では、学習結果情報取得部１１２は分割データd_{1,1}, d_{1,2},...d_{1,n}のそれぞれに対し学習済みモデルを適用する。学習結果情報取得部１１２は、学習モデルを適用した結果を学習結果情報として生成する。以下の表１は、学習結果情報の例を示す。本実施形態では、学習結果情報を表形式で示すがこれに限られない。

　上記表１において、予測結果は、学習データが分割された、d_{1,1}からd_{1,n}の各期間の、学習済みモデルによって予測されたトラフィック流量を示す。学習結果情報取得部１１２は、学習結果情報を精度判断部１１３へ出力する。

　精度判断部１１３は、分割データに対応する期間のネットワークパラメータの実測値を示す実測値情報を取得し、取得した情報に基づいて、分割データのそれぞれについて、学習済みモデルの予測精度を判断する。実測値情報の取得には任意の手法が採用されてよい。例えば精度判断部１１３は、ネットワークパラメータ収集装置Ｎから、トラフィック流量を示す値を、実測値を示す実測値情報として受信することで取得してよい。

　以下の表２は、実測値情報の例を示す。本実施形態では、実測値情報を表形式で示すがこれに限られない。

　上記表２において実測値は、上述のように分割データ生成部１１１によって分割されたd_{1,1}からd_{1,n}の各期間における、トラフィック流量の実測値を示す。上記表１と比較すると、分割データd_{1,1}の誤差は５０ＭＢ、分割データd_{1,2}の誤差は２０ＭＢ、分割データd_{1,n}の誤差は５ＭＢである。精度判断部１１３は、各分割データの予測値と実測値との差分に応じて、誤差の程度を「誤差大」「誤差中」「誤差小」と段階的に示す誤差情報を生成する。当該誤差の程度が小さい程、学習済みモデルの予測の精度が高いことが表され、誤差の程度が大きい程、学習済みモデルの予測の精度が低いことが表される。誤差の程度を決定するための基準値は自由に設定されてよい。例えば本実施形態では、精度判断部１１３が、誤差の値が１０ＭＢ未満の場合は「誤差小」、１０ＭＢ以上３０ＭＢ未満の場合は「誤差中」、３０ＭＢ以上の場合は「誤差大」、と誤差の程度を決定し、誤差情報を生成してよい。この場合、誤差情報は、誤差の程度として、分割データd_{1,1}については「誤差大」、分割データd_{1,2}については「誤差中」、分割データd_{1,n}については「誤差小」であることを示す。

　以下で説明する、復元部１１６による圧縮分割データの復元のため、精度判断部１１３は、学習済みモデルの予測精度が閾値以下であるか否かを判定してよい。予測精度が閾値以下となったことの判定には任意の手法が採用されてよく、例えば精度判断部１１３は、現時点での学習モデルを適用した結果と、現時点での実測値との差分に基づいて予測精度が閾値以下であるか否かを判定してもよい。

　精度判断部１１３は、生成した誤差情報を圧縮決定部１１４へ出力する。このようにして精度判断部１１３は実測値情報と学習結果情報とに基づいて、分割データのそれぞれについて、学習済みモデルの予測精度を判断する。

　圧縮決定部１１４は、予測精度に応じて、分割データを圧縮するか否かを決定する。具体的には圧縮決定部１１４は、精度判断部１１３から出力された誤差情報が示す誤差の程度に応じて分割データを圧縮することを決定する。本実施形態では、圧縮決定部１１４は、誤差情報が示す誤差の程度が「誤差大」である分割データd_{1,1}を生データとして残し、誤差の程度が「誤差小」である分割データd_{1,n}と誤差の程度が「誤差中」である分割データd_{1,2}とについては、データを圧縮することを決定する。

　圧縮決定部１１４は、圧縮することを決定した分割データを時系列方向に圧縮し、圧縮分割データとして記憶部１２に格納する。時系列方向の圧縮は時系列データベースで採用されるような任意の時間圧縮アルゴリズムが用いられてよい。圧縮決定部１１４は、圧縮せずに生データとして残すことを決定した分割データについては圧縮せずに、非圧縮分割データとして記憶部１２に格納する。本実施形態では、圧縮決定部１１４は、分割データd_{1,1}を非圧縮分割データとして、分割データd_{1,2}及び分割データd_{1,n}を圧縮分割データとしてそれぞれ記憶部１２に格納する。

　復元部１１６は、学習済みモデルの予測精度が閾値以下となった場合に、圧縮分割データを復元して復元分割データを生成する。圧縮分割データに復元には任意の手法が採用されてよい。例えば復元部１１６は、圧縮分割データを任意の関数にフィッティングし、当該関数に白色雑音を追加して元の時間間隔のデータに復元してもよい。予測精度の閾値は自由に設定されてよい。これに限られず、ユーザが出力部１５を介して表示される誤差情報を確認し、学習済みモデルの予測精度が閾値以下となったことを判断し、復元分割データの生成を復元部１１６に対し指示できてもよい。

　本実施形態では、復元部１１６は、記憶部１２に圧縮分割データとして格納されている分割データd_{1,2}及び分割データd_{1,n}を復元し、復元分割データとして生成する。復元部１１６は、復元分割データd_{1,2}及びd_{1,n}を学習部１１７に出力する。

　学習部１１７は、ネットワークパラメータ収集装置Ｎから取得したネットワークパラメータのログを示すログ情報を学習データとして用いて将来のネットワークパラメータの予測値を出力する学習済みモデルを生成する。学習済みモデルの生成には、ニューラルネットワーク、深層学習等の任意の機械学習手法が用いられてよい。学習部１１７は生成した学習済みモデルを記憶部１２に格納する。これに限られず、学習部１１７は当該学習モデルを適用して将来のネットワークパラメータの予測を行ってもよいし、当該学習モデルを外部の予測用の装置に出力できてもよい。

　学習部１１７は、復元部１１６から復元分割データが出力された場合、すなわち学習済みモデルの予測精度が閾値以下となった場合に、非圧縮分割データ、復元分割データ、及び直近のネットワークパラメータを用いて、再学習する、又はモデルアーキテクチャを再設計（変更）して新たなモデルを生成する。本実施形態では、学習部１１７は、復元分割データd_{1,2}及びd_{1,n}を復元部１１６から取得し、記憶部１２から非圧縮分割データd_{1,1}を読み出すことで取得し、直近のネットワークパラメータをネットワークパラメータ収集装置Ｎから受信することで取得する。学習部１１７による再学習又は新たなモデルの生成には、学習済みモデルの生成と同様に任意の機械学習手法が用いられてよい。

　学習部１１７は、再学習の結果、学習済みモデルを修正した場合は、当該修正した学習済みモデルを適用して将来のネットワークパラメータの予測を行ってもよい。学習部１１７は、当該修正した学習済みモデルを外部の予測用の装置に出力できてもよい。学習部１１７は、学習済みモデルに代わる新たな学習モデルを生成した場合も同様に、当該新たな学習モデルを適用して将来のネットワークパラメータの予測を行ってよい。

　このように学習部１１７は、学習データを用いて学習済みモデルを生成する。学習部１１７は、学習済みモデルの予測精度が閾値以下となった場合には、非圧縮分割データ、復元分割データ、及び直近のネットワークパラメータを用いて、再学習する、又は新たなモデルを生成する。

＜プログラム＞
　上述したデータ管理装置１０として機能させるために、プログラム命令を実行可能なコンピュータを用いることも可能である。ここで、コンピュータは、汎用コンピュータ、専用コンピュータ、ワークステーション、ＰＣ（Personal Computer）、電子ノートパッドなどであってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。

　コンピュータは、プロセッサと、記憶部と、入力部と、出力部と、通信インターフェースとを備える。プロセッサは、ＣＰＵ(Central Processing Unit)、ＭＰＵ（Micro Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＳｏＣ（System on a Chip）等であり、同種又は異種の複数のプロセッサにより構成されてもよい。プロセッサは、記憶部からプログラムを読み出して実行することで、上記各構成の制御及び各種の演算処理を行う。なお、これらの処理内容の少なくとも一部をハードウェアで実現することとしてもよい。入力部は、ユーザの入力操作を受け付けてユーザの操作に基づく情報を取得する入力インターフェースであり、ポインティングデバイス、キーボード、マウスなどである。出力部は、情報を出力する出力インターフェースであり、ディスプレイ、スピーカなどである。通信インターフェースは、外部の装置と通信するためのインターフェースである。

　プログラムは、コンピュータが読み取り可能な記録媒体に記録されていてもよい。このような記録媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録された記録媒体は、非一過性（non-transitory）の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ＵＳＢメモリなどであってもよい。また、このプログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。

＜データ管理装置１０の動作＞
　次に、図４Ａ及び図４Ｂを参照して、本実施形態に係るデータ管理装置１０の動作について説明する。当該データ管理装置１０の動作は、本実施形態に係るデータ管理方法に相当する。

　図４ＡのステップＳ１において、ログ情報を学習データとして用いて、データ管理装置１０の学習部１１７が将来のネットワークパラメータの予測値を出力する学習モデルを学習済みモデルとして生成する。学習部１１７は、ログ情報をネットワークパラメータ収集装置Ｎから取得してよい。学習部１１７は、当該学習済みモデルを用いて将来のネットワークパラメータの予測を行ってもよいし、学習済みモデルを外部装置に出力してもよい。本実施形態において学習部１１７は、学習結果情報取得部１１２に学習済みモデルを出力する。

　ステップＳ２において、分割データ生成部１１１はまず、学習済みモデルの生成に用いられた学習データを取得する。学習データの取得には任意の手法が採用されてよい。分割データ生成部１１１は、学習部１１７から学習データを取得してもよいし、ネットワークパラメータ収集装置Ｎから直接、学習データを受信することで取得してもよい。

　ステップＳ３において、分割データ生成部１１１は、取得した学習データを所定期間ごとに分割し、分割データとして学習結果情報取得部１１２に出力する。

　ステップＳ２とステップＳ３とに示すように、分割データ生成部１１１は、将来のネットワークパラメータの予測値を出力する学習済みモデルの生成に用いられた学習データを所定期間ごとに分割し、分割データとして出力する。

　ステップＳ４において、学習結果情報取得部１１２は、学習部１１７から学習済みモデルを取得する。

　ステップＳ５において、学習結果情報取得部１１２は、取得した学習済みモデルを、分割データ生成部１１１から出力された複数の分割データのそれぞれに適用する。学習結果情報取得部１１２は、学習モデルを適用した結果を学習結果情報として生成する。学習結果情報取得部１１２は、生成した学習結果情報を精度判断部１１３へ出力する。

　ステップＳ４とステップＳ５とに示すように、学習結果情報取得部１１２は、分割データごとに学習済みモデルを適用した結果を示す学習結果情報を取得する。

　ステップＳ６において、精度判断部１１３は、ネットワークパラメータ収集装置Ｎから、ログ情報を実測値を示す実測値情報として受信することで取得する。このようにして精度判断部１１３は分割データに対応する期間のネットワークパラメータの実測値を示す実測値情報を取得する。

　図４ＢのステップＳ７において、精度判断部１１３は、学習結果情報取得部１１２から出力された学習結果情報と、実測値情報とに基づき各分割データの予測値と実測値との差分に応じて、誤差の程度を「誤差大」「誤差中」「誤差小」と段階的に示す誤差情報を生成する。当該誤差の程度が小さい程、学習済みモデルの予測の精度が高いことが表され、誤差の程度が大きい程、学習済みモデルの予測の精度が低いことが表される。精度判断部１１３は、生成した誤差情報を圧縮決定部１１４へ出力する。

　ステップＳ６とステップＳ７とに示すように、精度判断部１１３は実測値情報と学習結果情報とに基づいて、分割データのそれぞれについて、学習済みモデルの予測精度を判断する。

　ステップＳ８において、圧縮決定部１１４は、予測精度に応じて、分割データを圧縮するか否かを決定する。具体的には圧縮決定部１１４は、精度判断部１１３から出力された誤差情報が示す誤差の程度に応じて前記分割データを圧縮することを決定する。本実施形態では、圧縮部１１５は、誤差情報が示す誤差の程度が「誤差大」である分割データを生データとして残し、誤差の程度が「誤差小」又は「誤差中」である分割データとについては、データを圧縮することを決定する。

　ステップＳ９において、圧縮決定部１１４は、圧縮することを決定した分割データを時系列方向に圧縮し、圧縮分割データとして記憶部１２に格納する。時系列方向の圧縮は時系列データベースで採用されるような任意の時間圧縮アルゴリズムが用いられてよい。圧縮決定部１１４は、圧縮せずに生データとして残すことを決定した分割データについては圧縮せずに、非圧縮分割データとして記憶部１２に格納する。

　ステップＳ１０において、精度判断部１１３は、学習済みモデルの予測精度が閾値以下であるか否かを判定する。一般的に、学習済みモデルの生成日から時間が経過すると、学習済みモデルの予測精度が低下する。予測精度が閾値以下となったことの判定には任意の手法が採用されてよく、例えば精度判断部１１３は、現時点での学習モデルを適用した結果と、現時点での実測値との差分に基づいて予測精度が閾値以下であるか否かを判定してもよい。

　ステップＳ１１において、復元部１１６は、学習済みモデルの予測精度が閾値以下となった場合に、圧縮分割データを復元して復元分割データを生成する。圧縮分割データに復元には任意の手法が採用されてよい。予測精度の閾値は自由に設定されてよい。本実施形態では、復元部１１６は、記憶部１２に圧縮分割データとして格納されている分割データを復元し、復元分割データとして生成する。復元部１１６は、復元分割データを学習部１１７に出力する。

　ステップＳ１２において、学習部１１７は、非圧縮分割データ、復元分割データ、及び直近のネットワークパラメータを用いて、再学習する、又はモデルアーキテクチャを再設計（変更）して新たなモデルを生成する。本実施形態では、学習部１１７は、復元分割データを復元部１１６から取得し、記憶部１２から非圧縮分割データを読み出すことで取得し、直近のネットワークパラメータをネットワークパラメータ収集装置Ｎから受信することで取得する。学習部１１７による再学習又は新たなモデルの生成には、学習済みモデルの生成と同様に任意の機械学習手法が用いられてよい。このように学習部１１７は、学習データを用いて学習済みモデルを生成し、学習済みモデルの予測精度が閾値以下となった場合には、非圧縮分割データ、復元分割データ、及び直近のネットワークパラメータ（学習済みモデル生成時以降のネットワークパラメータ）を用いて、再学習する、又は新たなモデルを生成する。その後、システム１の動作は終了する。

　上述したように、本実施形態のデータ管理装置１０は、将来のネットワークパラメータの予測値を出力する学習済みモデルの生成に用いられた学習データを所定期間ごとに分割し、分割データとして出力する分割データ生成部１１１と、分割データごとに学習済みモデルを適用した結果を示す学習結果情報を取得する学習結果情報取得部１１２と、分割データに対応する期間のネットワークパラメータの実測値を示す実測値情報を取得し、実測値情報と学習結果情報とに基づいて、分割データのそれぞれについて、学習済みモデルの予測精度を判断する精度判断部１１３と、予測精度に応じて、分割データを圧縮するか否かを決定する圧縮決定部１１４と、圧縮決定部１１４により圧縮されなかった分割データである非圧縮分割データと、圧縮決定部１１４により圧縮された分割データである圧縮分割データとを記憶する記憶部１２と、を備える。

　本実施形態によれば、学習済みモデルについて、時間軸で分割された学習データごとに予測精度を評価できる。予測精度が低い部分はトレンド、季節変動等のノイズである可能性が高いが、同様の特性のノイズが新しいデータでの予測精度の低下を招いている可能性がある。本実施形態では、予測の精度が高い区間の学習データは圧縮し、予測の精度が低い区間の学習データは後の継続学習のために圧縮せずに生データとして保存できるため、再学習、又はモデルアーキテクチャの再設計（変更）により新しい学習済みモデルを作る際に、再度トレンドを捉えることができる。また本実施形態によれば、全ての学習データを格納する場合と比較して、記憶部１２の容量を節約できる。また、後の継続学習により必要とされる予測の精度が低い区間の学習データについては圧縮せず、データの破損の可能性を低減して確実に保存することが可能となる。よって、学習済みモデルの見直しのための学習データの保存効率を改善することができる。

　上述したように、本実施形態のデータ管理装置１０は、学習済みモデルの予測精度が閾値以下となった場合に、圧縮分割データを復元して復元分割データを生成する復元部１１６をさらに備える。

　本実施形態によれば、分割された学習データのうち圧縮されたデータについて、学習済みモデルの予測精度が下がって再度の学習が必要となったときに自動的に復元することができる。人手により、再度学習モデルを生成するために学習データを選択し直す場合と比較して、効率的に圧縮された学習データを活用することができる。よって、学習済みモデルの見直しのための学習データの保存効率を改善することができる。

　上述したように、本実施形態のデータ管理装置１０は、学習データを用いて学習済みモデルを生成し、学習済みモデルの予測精度が閾値以下となった場合には、非圧縮分割データ、復元分割データ、及び直近のネットワークパラメータを用いて、再学習する、又は新たなモデルを生成する学習部１１７をさらに備える。

　本実施形態によれば、学習済みモデルの予測精度が下がって再度の学習が必要となったときに、学習部１１７が自動的に必要な学習データを用いて再学習、又は新たな学習モデルを生成することができる。人手により、学習データを選択して学習させる場合と比較して、効率的に記憶部１２に格納していた学習データを活用することができる。よって学習済みモデルの見直しのための学習データの保存効率を改善することができる。

　上述したように、本実施形態のデータ管理装置１０において、ネットワークパラメータはトラフィック流量である。

　本実施形態によれば、ネットワークパラメータのうち、ユーザの通信サービスの契約内容に大きく関わるトラフィック流量について、より精度のよい学習モデルの生成が可能となる。

　以上の実施形態に関し、更に以下の付記を開示する。
　［付記項１］
　メモリと、前記メモリに接続された制御部と、を備え、
　前記制御部は、
　　将来のネットワークパラメータの予測値を出力する学習済みモデルの生成に用いられた学習データを所定期間ごとに分割し、分割データとして出力し、
　　前記分割データごとに前記学習済みモデルを適用した結果を示す学習結果情報を取得し、
　　前記分割データに対応する期間のネットワークパラメータの実測値を示す実測値情報を取得し、前記実測値情報と前記学習結果情報とに基づいて、前記分割データのそれぞれについて、前記学習済みモデルの予測精度を判断し、
　　前記予測精度に応じて、前記分割データを圧縮するか否かを決定し、
　前記メモリは、前記制御部により圧縮されなかった分割データである非圧縮分割データと、前記制御部により圧縮された分割データである圧縮分割データとを記憶する、
データ管理装置。
　［付記項２］
　前記制御部は、前記学習済みモデルの予測精度が閾値以下となった場合に、前記圧縮分割データを復元して復元分割データを生成する、付記項１に記載のデータ管理装置。
　［付記項３］
　前記制御部は、前記学習データを用いて前記学習済みモデルを生成し、
前記学習済みモデルの予測精度が閾値以下となった場合には、前記非圧縮分割データ、前記復元分割データ、及び直近のネットワークパラメータを用いて、再学習する、又は新たなモデルを生成する、付記項２に記載のデータ管理装置。
　［付記項４］
　前記ネットワークパラメータはトラフィック流量である、付記項１から３のいずれか一項に記載のデータ管理装置。
　［付記項５］
　メモリを備えるデータ管理装置が実行するデータ管理方法であって、
　将来のネットワークパラメータの予測値を出力する学習済みモデルの生成に用いられた学習データを所定期間ごとに分割し、分割データとして出力する分割データ生成ステップと、
　前記分割データごとに前記学習済みモデルを適用した結果を示す学習結果情報を取得する学習結果情報取得ステップと、
　前記分割データに対応する期間のネットワークパラメータの実測値を示す実測値情報を取得し、前記実測値情報と前記学習結果情報とに基づいて、前記分割データのそれぞれについて、前記学習済みモデルの予測精度を判断する精度判断ステップと、
　前記予測精度に応じて、前記分割データを圧縮するか否かを決定する圧縮決定ステップと、
　前記圧縮決定ステップにより圧縮されなかった分割データである非圧縮分割データと、前記圧縮決定ステップにより圧縮された分割データである圧縮分割データとを前記メモリに記憶する記憶ステップと、
を含む、データ管理方法。
　［付記項６］
　前記学習済みモデルの予測精度が閾値以下となった場合に、前記圧縮分割データを復元して復元分割データを生成する復元ステップをさらに含む、付記項５に記載のデータ管理方法。
　［付記項７］
　前記学習データを用いて前記学習済みモデルを生成し、
　前記学習済みモデルの予測精度が閾値以下となった場合には、前記非圧縮分割データ、前記復元分割データ、及び直近のネットワークパラメータを用いて、再学習する、又は新たなモデルを生成する学習ステップをさらに含む、付記項６に記載のデータ管理方法。
　［付記項８］
　コンピュータによって実行可能なプログラムを記憶した非一時的記憶媒体であって、
　前記コンピュータを、付記項１から４のいずれか一項に記載のデータ管理装置として機能させるプログラムを記憶した非一時的記憶媒体。

　上述の実施形態は代表的な例として説明したが、本開示の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、請求の範囲から逸脱することなく、種々の変形又は変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを１つに組み合わせたり、あるいは１つの構成ブロックを分割したりすることが可能である。

１　システム
１０　データ管理装置
１１　制御部
１２　記憶部
１３　通信部
１４　入力部
１５　出力部
３０　ネットワーク
１１１　分割データ生成部
１１２　学習結果情報取得部
１１３　精度判断部
１１４　圧縮決定部
１１５　圧縮部
１１６　復元部
１１７　学習部

Claims

　将来のネットワークパラメータの予測値を出力する学習済みモデルの生成に用いられた学習データを所定期間ごとに分割し、分割データとして出力する分割データ生成部と、
　前記分割データごとに前記学習済みモデルを適用した結果を示す学習結果情報を取得する学習結果情報取得部と、
　前記分割データに対応する期間のネットワークパラメータの実測値を示す実測値情報を取得し、前記実測値情報と前記学習結果情報とに基づいて、前記分割データのそれぞれについて、前記学習済みモデルの予測精度を判断する精度判断部と、
　前記予測精度に応じて、前記分割データを圧縮するか否かを決定する圧縮決定部と、
　前記圧縮決定部により圧縮されなかった分割データである非圧縮分割データと、前記圧縮決定部により圧縮された分割データである圧縮分割データとを記憶する記憶部と、
を備えるデータ管理装置。
　前記学習済みモデルの予測精度が閾値以下となった場合に、前記圧縮分割データを復元して復元分割データを生成する復元部をさらに備える、請求項１に記載のデータ管理装置。
　前記学習データを用いて前記学習済みモデルを生成し、
前記学習済みモデルの予測精度が閾値以下となった場合には、前記非圧縮分割データ、前記復元分割データ、及び直近のネットワークパラメータを用いて、再学習する、又は新たなモデルを生成する学習部さらに備える、請求項２に記載のデータ管理装置。
　前記ネットワークパラメータはトラフィック流量である、請求項１から３のいずれか一項に記載のデータ管理装置。
　記憶部を備えるデータ管理装置が実行するデータ管理方法であって、
　将来のネットワークパラメータの予測値を出力する学習済みモデルの生成に用いられた学習データを所定期間ごとに分割し、分割データとして出力する分割データ生成ステップと、
　前記分割データごとに前記学習済みモデルを適用した結果を示す学習結果情報を取得する学習結果情報取得ステップと、
　前記分割データに対応する期間のネットワークパラメータの実測値を示す実測値情報を取得し、前記実測値情報と前記学習結果情報とに基づいて、前記分割データのそれぞれについて、前記学習済みモデルの予測精度を判断する精度判断ステップと、
　前記予測精度に応じて、前記分割データを圧縮するか否かを決定する圧縮決定ステップと、
　前記圧縮決定ステップにより圧縮されなかった分割データである非圧縮分割データと、前記圧縮決定ステップにより圧縮された分割データである圧縮分割データとを前記記憶部に記憶する記憶ステップと、
を含む、データ管理方法。
　前記学習済みモデルの予測精度が閾値以下となった場合に、前記圧縮分割データを復元して復元分割データを生成する復元ステップをさらに含む、請求項５に記載のデータ管理方法。
　前記学習データを用いて前記学習済みモデルを生成し、
　前記学習済みモデルの予測精度が閾値以下となった場合には、前記非圧縮分割データ、前記復元分割データ、及び直近のネットワークパラメータを用いて、再学習する、又は新たなモデルを生成する学習ステップをさらに含む、請求項６に記載のデータ管理方法。
　コンピュータを、請求項１から３のいずれか一項に記載のデータ管理装置として機能させるためのプログラム。