JP7176656B1 - 予測モデル再学習装置、予測モデル再学習方法及びプログラム - Google Patents

予測モデル再学習装置、予測モデル再学習方法及びプログラム Download PDF

Info

Publication number
JP7176656B1
JP7176656B1 JP2022082239A JP2022082239A JP7176656B1 JP 7176656 B1 JP7176656 B1 JP 7176656B1 JP 2022082239 A JP2022082239 A JP 2022082239A JP 2022082239 A JP2022082239 A JP 2022082239A JP 7176656 B1 JP7176656 B1 JP 7176656B1
Authority
JP
Japan
Prior art keywords
data
learning
prediction model
relearning
index value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022082239A
Other languages
English (en)
Other versions
JP2023170458A (ja
Inventor
龍哉 金田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Original Assignee
Fuji Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd filed Critical Fuji Electric Co Ltd
Priority to JP2022082239A priority Critical patent/JP7176656B1/ja
Application granted granted Critical
Publication of JP7176656B1 publication Critical patent/JP7176656B1/ja
Publication of JP2023170458A publication Critical patent/JP2023170458A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】コンセプトドリフト発生に伴う再学習後の予測モデルの精度低下を抑止できる技術を提供すること。【解決手段】本開示の一態様による予測モデル再学習装置は、時間経過に伴うデータ特性の変化による予測モデルの性能劣化を検知するように構成されている検知部と、前記検知部によって前記予測モデルの性能劣化が検知された場合、前記予測モデルの再学習に用いる再学習用データを決定するように構成されているデータ決定部と、前記データ決定部によって決定された前記再学習用データを用いて、前記予測モデルを再学習するように構成されている再学習部と、を有する。【選択図】図4

Description

本開示は、予測モデル再学習装置、予測モデル再学習方法及びプログラムに関する。
機械学習技術等を利用したAI(Artificial Intelligence)による予測では、時間経過に伴うデータ特性の変化(コンセプトドリフト)によって予測精度が低下し得ることが知られている。このため、コンセプトドリフトが発生した場合、コンセプトドリフト発生後のデータを用いて予測モデルを再学習するといった対策が行われることが多い。一方で、予測モデルを再学習するためにエンジニアリング(例えば、多数のデータの中からコンセプトドリフト発生後のデータを抽出するといった作業等)を行うと運用コスト増に繋がるという問題点がある。
そこで、コンセプトドリフトの発生を自動で検知した上で、エンジニアリングを行わずに、コンセプトドリフト発生後のデータを用いて予測モデルを再学習できる技術が求められている。なお、コンセプトドリフトに関連する従来技術として、特許文献1~4等が知られている。
特表2020-522055号公報 特開2021-60940号公報 国際公開第2021/079447号 国際公開第2020/255305号
しかしながら、エンジニアリングを行わない場合、コンセプトドリフト発生前のデータが再学習用データに混入する可能性がある。コンセプトドリフト発生前のデータはコンセプトドリフト発生後のデータと分布が異なるため、コンセプトドリフト発生前のデータが再学習用データに混入した場合、再学習後の予測モデルが十分な予測精度を得られない可能性がある。このため、再学習後の予測モデルの精度低下を抑止するためには、コンセプトドリフト発生前のデータが再学習用データにできるだけ混入しないようにすることが好ましい。
なお、特許文献1にはコンセプトドリフトが検知された場合に警告することが開示されているが、コンセプトドリフトの発生に伴う再学習に関しては開示されていない。また、特許文献2にはモデルを再学習することが開示されているが、コンセプトドリフト発生前のデータが再学習用データに混入する可能性に関しては考慮されていない。特許文献3にはコンセプトドリフトの発生を通知することが開示されているが、コンセプトドリフトの発生に伴う再学習に関しては開示されていない。特許文献4には予測モデルを再学習することが開示されているが、コンセプトドリフト発生前のデータが再学習用データに混入する可能性に関しては考慮されていない。
本開示は、上記の点に鑑みてなされたもので、コンセプトドリフト発生に伴う再学習後の予測モデルの精度低下を抑止できる技術を提供することを目的とする。
本開示の一態様による予測モデル再学習装置は、時間経過に伴うデータ特性の変化による予測モデルの性能劣化を検知するように構成されている検知部と、前記検知部によって前記予測モデルの性能劣化が検知された場合、前記予測モデルの再学習に用いる再学習用データを決定するように構成されているデータ決定部と、前記データ決定部によって決定された前記再学習用データを用いて、前記予測モデルを再学習するように構成されている再学習部と、を有する。
コンセプトドリフト発生に伴う再学習後の予測モデルの精度低下を抑止できる技術が提供される。
本実施形態に係る予測モデル再学習装置のハードウェア構成の一例を示す図である。 本実施形態に係る予測モデル再学習装置の機能構成の一例を示す図である。 コンセプトドリフト発生前後におけるデータ値の一例を概念的に示す図である。 本実施形態に係る予測モデル再学習処理の流れの一例を示すフローチャートである。 各説明変数と目的変数との散布図を示す図である。 目的変数の推移を示す図である。 予測誤差の推移を示す図である。
以下、本発明の一実施形態について説明する。以下の実施形態では、コンセプトドリフトの発生に伴い予測モデルを再学習する場合に、再学習後の予測モデルの精度低下を抑止することができる予測モデル再学習装置10について説明する。ここで、本実施形態に係る予測モデル再学習装置10には、再学習用データが与えられるものとする。再学習用データとは予測モデルの再学習用に与えられるデータのことであり、1以上の説明変数と予測モデルの予測対象となる目的変数との組で表される。具体的には、Nを説明変数の総数、x(ただし、n=1,・・・,N)をn番目の説明変数、yを目的変数としたときに、再学習用データは(y,x,・・・,x)と表される。以下では、時刻t(正確には、tは1以上の整数値を取る時刻インデックス)の再学習用データを(y(t),x(t),・・・,x(t))と表し、予測モデル再学習装置10には再学習用データの時系列{(y(t),x(t),・・・,x(t))|t=1,・・・,T}(ただし、Tは与えられた再学習用データの最終時刻)が与えられるものとする。なお、時刻tを特に明示しないときは(y(t),x(t),・・・,x(t))を(y,x,・・・,x)と表す。
また、以下では、予測モデルをf(・;θ)(ただし、θは予測モデルのパラメータ)で表し、説明変数x,・・・,xを入力したときの予測モデルfの出力値(つまり、目的変数の予測値)を^yで表す。すなわち、^y=f(x,・・・,x;θ)と表す。ただし、パラメータθを特に明示しないときはf(・)又は単にfと表す。なお、ハット「^」は予測値(又は推定値)であることを表している。
<予測モデル再学習装置10のハードウェア構成>
本実施形態に係る予測モデル再学習装置10のハードウェア構成例を図1に示す。図1に示すように、本実施形態に係る予測モデル再学習装置10は、入力装置101と、表示装置102と、外部I/F103と、通信I/F104と、RAM(Random Access Memory)105と、ROM(Read Only Memory)106と、補助記憶装置107と、プロセッサ108とを有する。これらの各ハードウェアは、それぞれがバス109を介して通信可能に接続されている。
入力装置101は、例えば、キーボード、マウス、タッチパネル、物理ボタン等である。表示装置102は、例えば、ディスプレイ、表示パネル等である。なお、予測モデル再学習装置10は、例えば、入力装置101及び表示装置102の少なくとも一方を有していなくてもよい。
外部I/F103は、記録媒体103a等の外部装置とのインタフェースである。予測モデル再学習装置10は、外部I/F103を介して、記録媒体103aの読み取りや書き込み等を行うことができる。記録媒体103aとしては、例えば、フレキシブルディスク、CD(Compact Disc)、DVD(Digital Versatile Disk)、SDメモリカード(Secure Digital memory card)、USB(Universal Serial Bus)メモリカード等が挙げられる。
通信I/F104は、予測モデル再学習装置10を通信ネットワークに接続するためのインタフェースである。RAM105は、プログラムやデータを一時保持する揮発性の半導体メモリ(記憶装置)である。ROM106は、電源を切ってもプログラムやデータを保持することができる不揮発性の半導体メモリ(記憶装置)である。補助記憶装置107は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等のストレージ装置(記憶装置)である。プロセッサ108は、例えば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等の演算装置である。
本実施形態に係る予測モデル再学習装置10は、図1に示すハードウェア構成を有することにより、後述する予測モデル再学習処理を実現することができる。なお、図1に示す予測モデル再学習装置10のハードウェア構成は一例であって、予測モデル再学習装置10のハードウェア構成はこれに限られるものではない。例えば、予測モデル再学習装置10は、複数の補助記憶装置107や複数のプロセッサ108を有していてもよいし、図示したハードウェアの一部を有していなくてもよいし、図示したハードウェア以外の様々なハードウェアを有していてもよい。
<予測モデル再学習装置10の機能構成>
本実施形態に係る予測モデル再学習装置10の機能構成例を図2に示す。図2に示すように、本実施形態に係る予測モデル再学習装置10は、データ取得部201と、評価指標値算出部202と、コンセプトドリフト検知部203と、データ決定部204と、再学習部205と、更新判定部206と、モデル更新部207とを有する。これら各機能部は、予測モデル再学習装置10にインストールされた1以上のプログラムが、プロセッサ108に実行させる処理により実現される。なお、当該各機能部のうちの一部の機能部が、通信ネットワークを介して接続される計算機(例えば、クラウド上のサーバ等)が備えるプロセッサにより実現されていてもよい。
また、本実施形態に係る予測モデル再学習装置10は、再学習用データ記憶部208と、予測モデル記憶部209とを有する。これら各記憶部は、例えば、補助記憶装置107により実現される。なお、再学習用データ記憶部208及び予測モデル記憶部209の少なくとも一方の記憶部が、予測モデル再学習装置10と通信ネットワークを介して接続される記憶装置(例えば、クラウド上のストレージ、データベースサーバ等)により実現されていてもよい。
データ取得部201は、再学習用データ記憶部208に記憶されている再学習用データ(例えば、或る時刻tから或る時刻t+LまでのL件の再学習用データ)を取得する。以下、データ取得部201によってL件の再学習用データが取得されるものとする。なお、Lは予め決められた1以上の整数である。
評価指標値算出部202は、データ取得部201によって取得されたL件の再学習用データを用いて、予測モデルfの予測精度(又は予測誤差)を表す所定の評価指標値を算出する。ここで、評価指標値としては予測モデルの予測精度(又は予測誤差)を表す任意の指標値を採用することができる。例えば、決定係数、平均絶対パーセント誤差(MAPE:Mean Absolute Percentage Error)、平均絶対誤差(MAE:Mean Absolute Error)、二乗平均平方根誤差(RMSE:Root Mean Squared Error)、平均二乗誤差(MSE:Mean Squared Error)等を評価指標値として採用することが可能である。一例として、平均二乗誤差を評価指標値として採用する場合、データ取得部201によって取得されたL件の再学習用データを{(y(t),x(t),・・・,x(t))|t=s,・・・,s+L}とすれば、評価指標値は、((y(s)-^y(s))+・・・+(y(s+L)-^y(s+L)))/Lと算出される。
コンセプトドリフト検知部203は、評価指標値算出部202によって算出された評価指標値を用いて、コンセプトドリフトの発生を検知する。具体的には、例えば、評価指標値が予測誤差を表すものである場合、コンセプトドリフト検知部203は、当該評価指標値が所定の閾値thを超えている場合にコンセプトドリフトの発生を検知する。一方で、例えば、評価指標値が予測精度を表すものである場合、コンセプトドリフト検知部203は、当該評価指標値が所定の閾値thを下回っている場合にコンセプトドリフトの発生を検知する。すなわち、コンセプトドリフト検知部203は、予測精度が或る基準よりも低い場合又は予測誤差が或る基準よりも高い場合にコンセプトドリフトの発生を検知する。なお、閾値thは予め設定された値とするが、予測モデルfが適用される対象(例えば、プラント、工場等)の運用状況に応じて適宜その値が変更されてもよい。
データ決定部204は、コンセプトドリフト検知部203によってコンセプトドリフトの発生が検知された場合に、評価指標値算出部202によって算出された評価指標値に応じて予測モデルfの再学習に用いる再学習用データ(再学習用データ集合)を決定する。
ここで、再学習用データを決定する理由について、図3を参照しながら説明する。図3は、時刻T'でコンセプトドリフトが発生している場合を表している。図3に示されるように、コンセプトドリフトの発生前後でデータ値(目的変数の値)の特性(言い換えれば、データ値の分布)が異なる。このため、コンセプトドリフト発生後の予測精度を向上させるためにはコンセプトドリフト発生後の再学習用データ(図3の例では時刻T'以降の再学習用データ)を再学習に用いることが好ましい。そこで、最新の再学習用データ(時刻Tの再学習用データ)から遡ってそれ以前の所定の件数の再学習用データを再学習に用いることが考えられる(例えば、0以上の或る整数である定数Kを用いて時刻T-Kから時刻Tの再学習用データを再学習に用いる等。)。しかしながら、この場合、再学習用データ数が固定的となり、コンセプトドリフト発生前の再学習用データも再学習に用いられる恐れがある。一方で、コンセプトドリフト発生前のすべての再学習用データを再学習に用いない場合、再学習に用いられるデータ数が不足し、逆に十分な予測精度が得られない可能性もある。
以上のことから、本実施形態では、最新の再学習用データから遡って再学習用データを再学習に用いると共に、コンセプトドリフト発生前の再学習用データをできるだけ再学習に用いずに、かつ、適切なデータ数となるように再学習に用いるデータ数を調整する。
例えば、データ決定部204は、評価指標値に応じて0以上T-1以下の整数αを決定した上で、再学習用データ記憶部208に記憶されている再学習用データのうち、時刻T-αから時刻Tの再学習用データを再学習に用いると決定する。このとき、データ決定部204は、評価指標値によって表される予測精度が高い(又は予測誤差が低い)ほどαを大きな値とし、一方で予測精度が低い(又は予測誤差が高い)ほどαを小さな値とする。すなわち、予測精度が高い(又は予測誤差が低い)ほどコンセプトドリフト発生前の再学習用データが再学習に用いられることを許容してデータ数を多くする。一方で、予測精度が低い(又は予測誤差が高い)ほどコンセプトドリフト発生前の再学習用データが再学習に用いられることを許容せずにデータ数を少なくし、できるだけコンセプトドリフト発生前の再学習用データが再学習に用いられないようにする。これは、予測精度が高い(又は予測誤差が低い)ほど、現状の予測モデルfでもコンセプトドリフト発生後にも対応できているためである。これにより、コンセプトドリフト発生前の再学習用データをできるだけ用いずに、適切な数の再学習用データが決定される。
なお、上記のαは、例えば、評価指標値が取り得る値の範囲によって予め決められていてもよい。例えば、評価指標値が0以上c未満のときはα=α、c以上c未満のときはα=α、c以上のときはα=α等というように予め決められていてもよい。また、上記の例ではαは時刻であるものとしたが、これに限られるものではなく、例えば、αをデータ数としてもよい。αがデータ数である場合、データ決定部204は、評価指標値に応じて1以上T以下の整数αを決定した上で、時刻T以前のα件の再学習用データを再学習に用いると決定すればよい。
再学習部205は、データ決定部204によって決定された再学習用データを用いて、予測モデルfを再学習する。なお、再学習部205は、既知の学習手法(学習アルゴリズム)により予測モデルfを再学習すればよい。
更新判定部206は、再学習部205によって再学習された予測モデルfで現状の予測モデルfを更新するか否かを判定する。例えば、更新判定部206は、再学習後の予測モデルfの評価指標値の算出を評価指標値算出部202に依頼し、その評価指標値が、現状の予測モデルfの評価指標値よりも改善している場合に、再学習後の予測モデルfで現状の予測モデルfを更新すると判定する。
モデル更新部207は、再学習後の予測モデルfで現状の予測モデルf(つまり、予測モデル記憶部209に記憶されている予測モデルf)を更新する。これにより、これ以降、再学習後の予測モデルfが現状の予測モデルfとなる。
再学習用データ記憶部208は、再学習用データの時系列{(y(t),x(t),・・・,x(t))|t=1,・・・,T}を記憶する。
予測モデル記憶部209は、予測モデルf(のパラメータθ)を記憶する。なお、予測モデルfとしては説明変数から目的変数を予測する任意の機械学習モデルを採用することができる。例えば、ニューラルネットワーク、回帰木等を予測モデルとして採用することが可能である。
<予測モデル再学習処理>
以下、本実施形態に係る予測モデル再学習処理の流れについて、図4を参照しながら説明する。
データ取得部201は、再学習用データ記憶部208から1件以上の再学習用データを取得する(ステップS101)。
次に、評価指標値算出部202は、上記のステップS101で取得された再学習用データを用いて、予測モデルfの予測精度(又は予測誤差)を表す所定の評価指標値を算出する(ステップS102)。
次に、コンセプトドリフト検知部203は、上記のステップS102で算出された評価指標値を用いて、コンセプトドリフトの発生を検知する(ステップS103)。
上記のステップS103でコンセプトドリフトの発生が検知された場合、データ決定部204は、再学習に用いる再学習用データを決定する(ステップS104)。
次に、再学習部205は、上記のステップS104で決定された再学習用データを用いて、予測モデルfを再学習する(ステップS105)。
次に、更新判定部206は、上記のステップS105で再学習された予測モデルfで現状の予測モデルf(つまり、予測モデル記憶部209に記憶されている予測モデルf)を更新するか否かを判定する(ステップS106)。
上記のステップS106で現状の予測モデルfを更新すると判定された場合、モデル更新部207は、再学習後の予測モデルfで現状の予測モデルfを更新する(ステップS107)。
なお、上記のステップS103でコンセプトドリフトの発生が検知されなかった場合、上記のステップS106で現状の予測モデルfを更新すると判定されなかった場合、予測モデル再学習装置10は、予測モデル再学習処理を終了する。
<評価>
以下、本実施形態に係る予測モデル再学習処理の評価について説明する。
本評価を行うために、以下の式(1)により非線形データを10000点生成した。ただし、コンセプトドリフトを模擬するため、7750点以降では、バイアスを加えた。
y=10x-4x +7x +ε (1)
ここで、yが目的変数、x~xが説明変数、εは0以上1以下の乱数を取るノイズである。なお、xは目的変数yに影響を与えない説明変数である。
このとき、x~xに対して0以上1以下の乱数を与えてデータを生成した。ただし、7750点以降では、上記の式(1)の右辺に対してバイアスbを更に加えてデータを生成した。
以上により生成したデータにおける各説明変数と目的変数の散布図を図5に示す。図5に示されるように、説明変数xは目的変数yと相関関係があることがわかる。一方、説明変数x、xは目的変数yと非線形な関係があることがわかる。
次に、目的変数yの推移を図6に示す。図6に示されるように、7750点以降のデータでコンセプトドリフトが発生している。
上記のデータを用いて、本実施形態に係る予測モデル再学習処理と既存手法とを比較した。既存手法としては、予測精度の悪化が検知された場合にすべての再学習用データを用いて予測モデルを再学習する手法を採用した。
10000点のデータのうち、0~1000点のデータを初期学習データとして予測モデルを学習した上で、101~1100、201~1200、・・・、9001~10000の90個のデータ集合をそれぞれ再学習用データの時系列とした。また、コンセプトドリフト発生を検知するためのデータ数(データ取得部201が再学習用データ記憶部208から取得する再学習用データ数L)は100とした。予測モデルfの学習手法には勾配部ブースティングを用いた。更に、評価指標値としては決定係数を採用し、1001~1100点のデータで算出された決定係数(以下、基準決定係数と呼ぶことにする。)に対して3%以上悪化している場合にコンセプトドリフトの発生を検知するものとした。すなわち、基準決定係数×0.97を閾値thとし、決定係数が閾値th未満である場合にコンセプトドリフトの発生を検知するものとした。
データ決定部204では、αとしてデータ数を採用し、基準決定係数からの悪化の程度によりαを決定した。具体的には、決定係数が基準決定係数から3%以上10%未満悪化した場合はα=1000として1000点の再学習用データを再学習に用いると決定し、10%以上15%未満悪化した場合はα=750として750点の再学習用データを再学習に用いると決定し、15%以上悪化した場合はα=500として500点の再学習用データを再学習に用いると決定した。また、コンセプトドリフトの発生を検知した際に用いた100点のデータにより現状の予測モデルfの決定係数と再学習後の予測モデルfを評価指標値算出部202により算出し、更新判定部206では、再学習後の予測モデルfの決定係数が改善されている場合に再学習後の予測モデルfで現状の予測モデルfを更新する判定した。
以上の設定の下、(a)再学習を行わなかった場合、(b)既存手法、(c)本実施形態に係る予測モデル再学習処理の予測誤差の推移を図7に示す。図7に示されるように、(a)では再学習を行っていないため予測誤差が大きいままである。(b)では再学習を行っているため予測誤差は収束しているが、(c)と比較すると予測誤差の収束は遅い。このように、本実施形態に係る予測モデル再学習処理では、既存手法と比較して、予測誤差の収束が早くなる。このため、従来手法と比較して、コンセプトドリフト発生に伴う再学習後の予測モデルの精度低下が抑止できていることがわかる。
<変形例>
上記の実施形態では、データ決定部204は、評価指標値算出部202によって算出された評価指標値に応じてαを決定した上で、このαから再学習用データを決定したが、例えば、複数のαを決定した上で、この中から最良のαを用いて再学習用データを決定してもよい。
例えば、データ決定部204は、評価指標値算出部202によって算出された評価指標値に応じてα,α,・・・,αを決定した上で、これらのα,α,・・・,αの各々を用いてM個の再学習用データ集合を決定してもよい。この場合、再学習部205は、M個の再学習用データ集合の各々を用いてそれぞれ再学習したM個の予測モデルfのうち、評価指標値が最も良い予測モデルfを選択し、この選択した予測モデルfを再学習後の予測モデルfとすればよい。なお、再学習部205によって再学習されたM個の予測モデルfの評価指標値を算出する際には、コンセプトドリフトの発生を検知した際に用いられた学習用データが使用されてもよいし、別途用意した評価用のデータが使用されてもよい。
<まとめ>
以上のように、本実施形態に係る予測モデル再学習装置10は、コンセプトドリフトの発生が検知された場合に、現状の予測モデルfの予測精度に応じて、コンセプトドリフト発生後のデータを再学習に用いると共に、コンセプトドリフト発生前のデータをできるだけ再学習に用いず、かつ、適切なデータ数となるように再学習用データを決定する。これにより、再学習後の予測モデルの精度低下が抑制され、コンセプトドリフト発生後のデータに素早く適応することが可能となる。
<適用例>
本実施形態に係る予測モデル再学習装置10は、予測モデルfにより説明変数から目的変数を予測する様々な対象に適用可能である。適用分野の一例を挙げれば、プラントや工場等における電力の需要予測、プラントや工場等における温度予測、商品の販売予測等がある。
本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。
10 予測モデル再学習装置
101 入力装置
102 表示装置
103 外部I/F
103a 記録媒体
104 通信I/F
105 RAM
106 ROM
107 補助記憶装置
108 プロセッサ
109 バス
201 データ取得部
202 評価指標値算出部
203 コンセプトドリフト検知部
204 データ決定部
205 再学習部
206 更新判定部
207 モデル更新部
208 再学習用データ記憶部
209 予測モデル記憶部

Claims (7)

  1. 時刻インデックスt=1からt=Tまでの時系列データとして与えられた再学習用データ集合の中から所定の時刻インデックスt=sからt=s+Lまでの再学習用データを取得するように構成されている取得部と、
    前記取得部によって取得された再学習用データを用いて、予測モデルの性能を表す評価指標値を算出するように構成されている指標値算出部と、
    前記指標値算出部によって算出された評価指標値が所定の閾値未満である場合、時間経過に伴うデータ特性の変化による前記予測モデルの性能劣化を検知するように構成されている検知部と、
    前記検知部によって前記予測モデルの性能劣化が検知された場合、前記予測モデルの再学習に用いる再学習用データを決定するように構成されているデータ決定部と、
    前記データ決定部によって決定された前記再学習用データを用いて、前記予測モデルを再学習するように構成されている再学習部と、
    を有し、
    前記データ決定部は、
    前記指標値算出部によって算出された評価指標値に応じて0以上T-1以下の整数αを決定し、前記再学習用データ集合のうち、時刻インデックスt=T-αからt=Tまでの再学習用データを、前記予測モデルの再学習に用いる再学習用データとして決定するように構成されている、予測モデル再学習装置。
  2. 時刻インデックスt=1からt=Tまでの時系列データとして与えられた再学習用データ集合の中から所定の時刻インデックスt=sからt=s+Lまでの再学習用データを取得するように構成されている取得部と、
    前記取得部によって取得された再学習用データを用いて、予測モデルの性能を表す評価指標値を算出するように構成されている指標値算出部と、
    前記指標値算出部によって算出された評価指標値が所定の閾値未満である場合、時間経過に伴うデータ特性の変化による前記予測モデルの性能劣化を検知するように構成されている検知部と、
    前記検知部によって前記予測モデルの性能劣化が検知された場合、前記予測モデルの再学習に用いる再学習用データを決定するように構成されているデータ決定部と、
    前記データ決定部によって決定された前記再学習用データを用いて、前記予測モデルを再学習するように構成されている再学習部と、
    を有し、
    前記データ決定部は、
    前記指標値算出部によって算出された評価指標値に応じて1以上T以下の整数αを決定し、前記再学習用データ集合のうち、時刻インデックスt=T以前のα件の再学習用データを、前記予測モデルの再学習に用いる再学習用データとして決定するように構成されている予測モデル再学習装置。
  3. 前記再学習後の予測モデルにより、前記再学習前の予測モデルを更新するように構成されている更新部を更に有し、
    前記データ決定部は、
    複数の前記整数αを決定し、複数の前記整数αの各々に対応する再学習用データを、前記予測モデルの再学習に用いる再学習用データとして決定するように構成されており、
    前記再学習部は、
    複数の前記整数αの各々に対応する再学習用データをそれぞれ用いて、前記予測モデルをそれぞれ再学習するように構成されており、
    前記更新部は、
    それぞれ再学習された予測モデルのうち、予測性能が最も良い予測モデルにより、前記再学習前の予測モデルを更新するように構成されている請求項又はに記載の予測モデル再学習装置。
  4. 時刻インデックスt=1からt=Tまでの時系列データとして与えられた再学習用データ集合の中から所定の時刻インデックスt=sからt=s+Lまでの再学習用データを取得する取得手順と、
    前記取得手順によって取得された再学習用データを用いて、予測モデルの性能を表す評価指標値を算出する指標値算出手順と、
    前記指標値算出手順によって算出された評価指標値が所定の閾値未満である場合、時間経過に伴うデータ特性の変化による前記予測モデルの性能劣化を検知する検知手順と、
    前記検知手順によって前記予測モデルの性能劣化が検知された場合、前記予測モデルの再学習に用いる再学習用データを決定するデータ決定手順と、
    前記データ決定手順によって決定された前記再学習用データを用いて、前記予測モデルを再学習する再学習手順と、
    をコンピュータが実行し、
    前記データ決定手順は、
    前記指標値算出手順によって算出された評価指標値に応じて0以上T-1以下の整数αを決定し、前記再学習用データ集合のうち、時刻インデックスt=T-αからt=Tまでの再学習用データを、前記予測モデルの再学習に用いる再学習用データとして決定する、予測モデル再学習方法。
  5. 時刻インデックスt=1からt=Tまでの時系列データとして与えられた再学習用データ集合の中から所定の時刻インデックスt=sからt=s+Lまでの再学習用データを取得する取得手順と、
    前記取得手順によって取得された再学習用データを用いて、予測モデルの性能を表す評価指標値を算出する指標値算出手順と、
    前記指標値算出手順によって算出された評価指標値が所定の閾値未満である場合、時間経過に伴うデータ特性の変化による前記予測モデルの性能劣化を検知する検知手順と、
    前記検知手順によって前記予測モデルの性能劣化が検知された場合、前記予測モデルの再学習に用いる再学習用データを決定するデータ決定手順と、
    前記データ決定手順によって決定された前記再学習用データを用いて、前記予測モデルを再学習する再学習手順と、
    をコンピュータが実行し、
    前記データ決定手順は、
    前記指標値算出手順によって算出された評価指標値に応じて1以上T以下の整数αを決定し、前記再学習用データ集合のうち、時刻インデックスt=T以前のα件の再学習用データを、前記予測モデルの再学習に用いる再学習用データとして決定する、予測モデル再学習方法。
  6. 時刻インデックスt=1からt=Tまでの時系列データとして与えられた再学習用データ集合の中から所定の時刻インデックスt=sからt=s+Lまでの再学習用データを取得する取得手順と、
    前記取得手順によって取得された再学習用データを用いて、予測モデルの性能を表す評価指標値を算出する指標値算出手順と、
    前記指標値算出手順によって算出された評価指標値が所定の閾値未満である場合、時間経過に伴うデータ特性の変化による前記予測モデルの性能劣化を検知する検知手順と、
    前記検知手順によって前記予測モデルの性能劣化が検知された場合、前記予測モデルの再学習に用いる再学習用データを決定するデータ決定手順と、
    前記データ決定手順によって決定された前記再学習用データを用いて、前記予測モデルを再学習する再学習手順と、
    をコンピュータに実行させ
    前記データ決定手順は、
    前記指標値算出手順によって算出された評価指標値に応じて0以上T-1以下の整数αを決定し、前記再学習用データ集合のうち、時刻インデックスt=T-αからt=Tまでの再学習用データを、前記予測モデルの再学習に用いる再学習用データとして決定する、プログラム。
  7. 時刻インデックスt=1からt=Tまでの時系列データとして与えられた再学習用データ集合の中から所定の時刻インデックスt=sからt=s+Lまでの再学習用データを取得する取得手順と、
    前記取得手順によって取得された再学習用データを用いて、予測モデルの性能を表す評価指標値を算出する指標値算出手順と、
    前記指標値算出手順によって算出された評価指標値が所定の閾値未満である場合、時間経過に伴うデータ特性の変化による前記予測モデルの性能劣化を検知する検知手順と、
    前記検知手順によって前記予測モデルの性能劣化が検知された場合、前記予測モデルの再学習に用いる再学習用データを決定するデータ決定手順と、
    前記データ決定手順によって決定された前記再学習用データを用いて、前記予測モデルを再学習する再学習手順と、
    をコンピュータに実行させ、
    前記データ決定手順は、
    前記指標値算出手順によって算出された評価指標値に応じて1以上T以下の整数αを決定し、前記再学習用データ集合のうち、時刻インデックスt=T以前のα件の再学習用データを、前記予測モデルの再学習に用いる再学習用データとして決定する、プログラム。
JP2022082239A 2022-05-19 2022-05-19 予測モデル再学習装置、予測モデル再学習方法及びプログラム Active JP7176656B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022082239A JP7176656B1 (ja) 2022-05-19 2022-05-19 予測モデル再学習装置、予測モデル再学習方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022082239A JP7176656B1 (ja) 2022-05-19 2022-05-19 予測モデル再学習装置、予測モデル再学習方法及びプログラム

Publications (2)

Publication Number Publication Date
JP7176656B1 true JP7176656B1 (ja) 2022-11-22
JP2023170458A JP2023170458A (ja) 2023-12-01

Family

ID=84144785

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022082239A Active JP7176656B1 (ja) 2022-05-19 2022-05-19 予測モデル再学習装置、予測モデル再学習方法及びプログラム

Country Status (1)

Country Link
JP (1) JP7176656B1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021256171A1 (ja) * 2020-06-16 2021-12-23 株式会社日立製作所 モデル運用支援システム及び方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021256171A1 (ja) * 2020-06-16 2021-12-23 株式会社日立製作所 モデル運用支援システム及び方法

Also Published As

Publication number Publication date
JP2023170458A (ja) 2023-12-01

Similar Documents

Publication Publication Date Title
Ollivier et al. Training recurrent networks online without backtracking
CA3088689C (en) Finite rank deep kernel learning for robust time series forecasting and regression
US20120130929A1 (en) Controlling quarantining and biasing in cataclysms for optimization simulations
JP4265296B2 (ja) 変化点検出装置,変化点検出方法および変化点検出用プログラム
Liu et al. An experimental study on symbolic extreme learning machine
JP7481902B2 (ja) 管理計算機、管理プログラム、及び管理方法
JP2019159888A (ja) 機械学習システム
JP7176656B1 (ja) 予測モデル再学習装置、予測モデル再学習方法及びプログラム
CN113177355B (zh) 一种电力负荷预测方法
JP7344149B2 (ja) 最適化装置及び最適化方法
CN116090618A (zh) 一种电力通信网的运行态势感知方法和装置
JP2024044583A (ja) プラント応答推定装置、プラント応答推定方法、及びプログラム
Marcek Some statistical and CI models to predict chaotic high-frequency financial data
JP7050028B2 (ja) 計算機システム及び機械学習の制御方法
JP6740193B2 (ja) パラメータ推定装置、パラメータ推定方法及びパラメータ推定プログラム
JP2019095894A (ja) 推定装置、学習装置、学習済みモデル、推定方法、学習方法、及びプログラム
JP5713877B2 (ja) 入出力モデル推定装置、方法、及びプログラム
JP7435883B1 (ja) ノイズ除去付き予測装置、ノイズ除去付き予測方法、及びプログラム
JP7283645B1 (ja) 予測値補正装置、予測値補正方法及びプログラム
EP4239501A1 (en) Calculation device, calculation program, recording medium, and calculation method
JP7428288B1 (ja) プラント応答推定装置、プラント応答推定方法、及びプログラム
JP7462905B2 (ja) 制御装置、方法、プログラム及びシステム
US20240232659A1 (en) Prediction device, training device, prediction method, training method, prediction program, and training program
Akimenko et al. Optimal control models for interregional migration under social risks
Mody et al. Enhancing Real Estate Market Insights through Machine Learning: Predicting Property Prices with Advanced Data Analytics

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220519

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221011

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221024

R150 Certificate of patent or registration of utility model

Ref document number: 7176656

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150