WO2023119664A1

WO2023119664A1 - 機械学習プログラム、装置、及び方法

Info

Publication number: WO2023119664A1
Application number: PCT/JP2021/048388
Authority: WO
Inventors: 佳寛大川
Original assignee: 富士通株式会社
Priority date: 2021-12-24
Filing date: 2021-12-24
Publication date: 2023-06-29
Also published as: JPWO2023119664A1

Abstract

機械学習装置は、運用データである画像のデータセットに含まれる画像の各々について、機械学習モデル２０を用いて各画素をクラス分類した分類結果を取得し、分類結果の確信度を示す分類スコアの平均値が閾値以上の画像の分類結果を「良」、閾値未満の画像の分類結果を「不良」と判定し（Ａ）、分類結果が「良」の画像の内、同一の撮影場所及び撮影方向で撮影された画像の分類結果を用いて、合成疑似ラベルを生成し（Ｂ）、運用データの画像を拡張した拡張画像を生成し（Ｃ）、分類結果が「良」の画像については、各画素に、その画素の分類結果をラベル付けし、分類結果が「不良」の画像、及び拡張画像の各々に合成疑似ラベルをラベル付けすることにより、訓練データを生成し（Ｄ）、生成した訓練データを用いて、機械学習モデル２０を訓練する（Ｅ）。

Description

機械学習プログラム、装置、及び方法

　開示の技術は、機械学習プログラム、機械学習装置、及び機械学習方法に関する。

　近年、企業等で利用されているシステムで実行される、データの判定、分類等の処理への機械学習モデルの導入が進んでいる。機械学習モデルは、システム開発時の訓練時に利用した訓練データに基づいてデータの判定、分類等を行う。そのため、システム運用中に利用する運用データの傾向が、訓練データの傾向から変化すると、機械学習モデルの判定精度、分類精度等が低下する。システム運用中の機械学習モデルの精度を維持するためには、定期的に手動で、すなわち、機械学習モデルの出力結果の正誤を人間が確認することで正解率等の精度を示す値を算出する。そして、その値が低下した場合には、システムは、手動で正誤確認され、正解のラベルが付与された訓練データを用いて機械学習モデルを訓練する。

　また、機械学習モデルによりデータの判定、分類等を行う技術として、画像の画素単位等の小領域毎に被写体の種別をクラス分類することで、画像内を被写体の種別毎に領域分けするセマンティックセグメンテーションという技術が存在する。セマンティックセグメンテーションのタスクにおいても、上記と同様に、機械学習モデルを用いたシステムの運用中に、運用データの変化により、機械学習モデルの精度が低下する場合がある。これに対して、システム運用中の変化後の運用データを想定して予め用意し、システムで利用する機械学習モデルの訓練に、この変化後の運用データも含めた訓練データを用いる技術が提案されている。

Yang Zou, Zhiding Yu, B.V.K. Vijaya Kumar, and Jinsong Wang, "Unsupervised Domain Adaptation for Semantic Segmentation via Class-Balanced Self-Training", Proceedings of the European Conference on Computer Vision (ECCV), 2018, pp. 289-305. Yunsheng Li, Lu Yuan, and Nuno Vasconcelos, "Bidirectional Learning for Domain Adaptation of Semantic Segmentation", Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2019, pp. 6929-6938.

　上述したように、セマンティックセグメンテーションのタスクにおいては、画素単位等の小領域毎にクラス分類を行う。そのため、システム運用中に、運用データに対して正解ラベルを付与する場合には、運用コストが膨大となる。また、システム運用中に運用データがどのような変化をするかが不明な場合には、事前に変化後の運用データを用意して機械学習モデルを訓練することは困難である。

　一つの側面として、開示の技術は、セマンティックセグメンテーションのタスクにおいて、機械学習モデルの精度を維持することを目的とする。

　一つの態様として、開示の技術は、機械学習モデルが第１の画像を閾値未満の値に基づいて分類したとする。この場合、開示の技術は、前記機械学習モデルが前記閾値以上の値に基づいて第２の画像を分類した分類結果に基づいて、前記第１の画像の第１の領域の位置に対応する前記第２の画像の第２の領域の分類結果を、前記第１の領域に対してラベル付けする。これにより、開示の技術は、訓練データを生成し、前記訓練データに基づいて前記機械学習モデルを訓練する。

　一つの側面として、セマンティックセグメンテーションのタスクにおいて、機械学習モデルの精度を維持することができる、という効果を有する。

機械学習モデルの精度低下を説明するための図である。セマンティックセグメンテーションを説明するための図である。セマンティックセグメンテーションのタスクにおける機械学習モデルの精度低下を説明するための図である。機械学習装置の機能ブロック図である。機械学習装置の各処理を説明するための図である。合成疑似ラベルの生成を説明するための図である。分類結果が「不良」の画像へのラベル付けを説明するための図である。運用中の機械学習モデルの精度の推移を表すグラフである。機械学習装置として機能するコンピュータの概略構成を示すブロック図である。機械学習処理の一例を示すフローチャートである。状況変化があった場合の画像例及び分類結果例の概略図を示す。状況変化があった場合の画像例及び分類結果例の概略図を示す。適用例における訓練データの生成を示す図である。適用例における画像例、分類結果、及び精度の一例の概略図である。適用例における画像例、分類結果、及び精度の一例の概略図である。

　以下、図面を参照して、開示の技術に係る実施形態の一例を説明する。
　まず、実施形態の詳細を説明する前に、システム運用中における機械学習モデルの精度低下について説明する。

　例えば、画像に写る被写体を推定する画像分類のシステムで利用される機械学習モデルの訓練では、分類を行う際に有用な画像上の特徴が、訓練データである画像から訓練される。しかし、運用時にシステムに入力される画像の特徴が、機械学習モデルの訓練時に使用された画像の特徴から変化してしまう場合がある。この原因としては、例えば、画像を撮影するカメラの表面が汚れた、位置がずれた、感度が劣化した等が挙げられる。このような運用時に取得される画像の特徴の変化により、機械学習モデルの精度低下が生じる。例えば、運用当初の機械学習モデルは正解率９９％の精度であったのに対し、運用開始から所定期間経過後には、正解率６０％の精度しか出せなくなるような精度低下が生じる。

　このような精度低下が生じる原因について説明する。図１に、ラベル毎の境界平面と、各画像から抽出される特徴量とを特徴量空間に射影した概略図を示す。図１左図に示すように、機械学習モデルの訓練直後では、特徴量空間において、境界平面を境に特徴量がラベル毎に明確に分かれている。そして、取得される画像の特徴に変化が生じた場合、図１右図に示すように、画像から抽出される特徴量が異なるラベルの領域へ移動したり（図１中の破線部）、複数のラベルの領域が連結したりする（図１中の一点鎖線部）。このため、機械学習モデルによる分類結果が誤り易くなり、精度低下が生じる。

　ここで、特徴量空間における特徴量の分布は、同じラベルの特徴量の分布には密度が高い点が１又は複数あり、分布の外側に向かって密度が薄くなる場合が多いという特徴を持つ。そこで、その特徴を利用して、運用データである画像に対して自動ラベル付けを行う以下のような参考手法が考えられる。参考手法は、精度低下前の特徴量空間における、各ラベルの特徴量のクラスタ毎に密度を計算し、クラスタ数を記録する。また、参考手法は、各クラスタの中で密度が一定以上の領域の中心、又は最も密度の高い点をクラスタ中心として記録する。そして、参考手法は、運用後において、運用データである画像の特徴量の密度を、特徴量空間の各点について計算する。参考手法は、特徴量空間において、密度が閾値以上となる領域に含まれる特徴量をクラスタとして抽出する。そして、参考手法は、閾値を変更することで、抽出されるクラスタ数が、精度低下前に記録したクラスタ数となる最小の閾値を探索する。参考手法は、最小の閾値の際にクラスタリングされた各クラスタのクラスタ中心と、精度低下前に記録したクラスタ中心とのマッチングを行う。そして、参考手法は、精度低下前のクラスタに対応するラベルを、マッチングしたクラスタに含まれる特徴量に対応する画像に付与する。これにより、運用データの画像へのラベル付けが行われる。参考手法は、ラベル付けが行われた運用データを用いて、機械学習モデルを訓練することで、運用中の機械学習モデルの精度低下を抑制する。

　また、ここで、セマンティックセグメンテーションのタスクについて考える。セマンティックセグメンテーションとは、図２に示すように、入力画像を機械学習モデルへ入力し、画像の画素単位等の小領域毎に被写体の種別をクラス分類することで、画像内を被写体の種別毎に領域分けした分類結果を出力する技術である。図３に示すように、セマンティックセグメンテーションのタスクにおいても、上記の画像分類問題と同様に、運用時の時間経過、天候等の状況変化により、機械学習モデルの精度低下が生じる。図３は、昼間の屋外で撮影した画像を訓練データとして用いて訓練された機械学習モデルを用いたシステムにおいて、運用時に、夜間に撮影された画像が入力される例を示している。例えば、昼間の画像と夜間の画像との間の明度変化や、昼間の画像にはない、外灯の光の反射等が夜間の画像に存在すること（図３の破線部）等が原因で、機械学習モデルの精度が低下する。

　このようなセマンティックセグメンテーションのタスクにおける運用時の精度低下に対して、上記の参考手法を適用することが考えられる。しかし、セマンティックセグメンテーションにおいては、画像中の各画素等の小領域単位でクラス分類を行うため、運用中に扱うインスタンスの数が膨大となり、参考手法のようなクラスタリングが困難である。例えば、各バッチで３２０画素×２４０画素の画像１００枚を処理する場合、クラスタリングの対象となるインスタンス数は、画像分類問題であれば１００個である。これに対して、セマンティックセグメンテーション問題では、３２０×２４０×１００＝７，６８０，０００個となる。

　そこで、本実施形態では、参考手法のようなクラスタリングを用いることなく、運用時の運用データの変化に追従し、適切なラベル付けを行う。以下、本実施形態に係る機械学習装置について詳述する。なお、以下の実施形態では、画像の各画素のクラス分類を行うセマンティックセグメンテーション問題を例に説明する。

　図４に示すように、機械学習装置１０には、運用データとして、画像のデータセットが入力される。機械学習装置１０は、機能的には、判定部１１と、生成部１２と、訓練部１６とを含む。生成部１２はさらに、ラベル生成部１３と、拡張画像生成部１４と、訓練データ生成部１５とを含む。また、機械学習装置１０の所定の記憶領域には、機械学習モデル２０が記憶される。

　機械学習モデル２０は、運用中のシステムで、セマンティックセグメンテーションのタスクを実行するために用いられている機械学習モデルである。機械学習モデル２０は、例えば、ＤＮＮ（Deep Neural Network）等で構成される。

　判定部１１は、図５のＡに示すように、機械学習装置１０に入力された運用データである画像のデータセットを取得する。判定部１１は、取得した画像の各々について、機械学習モデル２０を用いて各画素をクラス分類した分類結果を取得する。そして、判定部１１は、各画像についての分類結果の良否を判定する。具体的には、判定部１１は、分類結果と共に、分類結果の確信度を示す分類スコアを算出する。分類スコアは、例えば、機械学習モデル２０がＤＮＮの場合、最終層の一つ前の層の出力値、すなわち、ｓｏｆｔｍａｘ関数を適用する前の値に基づくスコアとしてよい。

　より具体的には、Ｎ個のクラス分類を行うセマンティックセグメンテーション問題の場合、画像ｘ＿ｉの画素（ｋ，ｌ）について、機械学習モデル２０から得られる分類スコアベクトルｖ_{（ｘ＿ｉ，ｋ，ｌ）}が下記（１）式で表されるとする。この場合、分類スコアＳ_{（ｘ＿ｉ，ｋ，ｌ）}を下記（２）式としてよい。
ｖ_{（ｘ＿ｉ，ｋ，ｌ）}＝［ｓ_{（ｘ＿ｉ，ｋ，ｌ，１）}，・・・，ｓ_{（ｘ＿ｉ，ｋ，ｌ，Ｎ）}］
　　　　　　　　　　　　　　　　　　　　　　　　　　・・・（１）
Ｓ_{（ｘ＿ｉ，ｋ，ｌ）}
＝ａｒｇ　ｍａｘ_ｓ（ｓ_{（ｘ＿ｉ，ｋ，ｌ，１）}，・・・，ｓ_{（ｘ＿ｉ，ｋ，ｌ，Ｎ）}）
　　　　　　　　　　　　　　　　　　　　　　　　　　・・・（２）
　ただし、ｓ_{（ｘ＿ｉ，ｋ，ｌ，ｎ）}（ｎ＝１，・・・，Ｎ）は、画像ｘ＿ｉの画素（ｋ，ｌ）がクラスｎである確率である。

　判定部１１は、画像の全画素についての分類スコアの平均値を算出する。判定部１１は、平均値が閾値以上であれば、その画像の分類結果を「良」、平均値が閾値未満であれば、その画像の分類結果を「不良」と判定する。これにより、教師データなしで、運用時の機械学習モデル２０の精度低下を判定することができる。なお、分類結果が「不良」の画像は、開示の技術の「第１の画像」の一例であり、分類結果が「良」の画像は、開示の技術の「第２の画像」の一例である。

　生成部１２は、機械学習モデル２０を再学習するための訓練データを生成する。以下、ラベル生成部１３、拡張画像生成部１４、及び訓練データ生成部１５の各々について詳述する。

　ラベル生成部１３は、図５のＢに示すように、分類結果が「良」の画像の内、同一の撮影場所及び撮影方向で撮影された画像の分類結果を用いて、合成疑似ラベルを生成する。具体的には、図６に示すように、ラベル生成部１３は、分類結果が「良」の画像の集合Ｘ^Ｗに含まれる各画像ｘ＿ｉの画素（ｋ，ｌ）の分類スコアベクトルｖ_{（ｘ＿ｉ，ｋ，ｌ）}を用いて、下記（３）式に示すように、画素（ｋ，ｌ）についての合成疑似ラベルｃ_{（ｋ，ｌ）}を生成する。

　すなわち、ラベル生成部１３は、画像ｘ＿ｉ∈Ｘ^Ｗの各画素（ｋ，ｌ）について、分類スコアベクトルの要素毎、すなわちクラス毎の確率の和が最大となるクラスに対応するラベルを、その画素（ｋ，ｌ）の合成疑似ラベルｃ_{（ｋ，ｌ）}として生成する。

　拡張画像生成部１４は、図５のＣに示すように、運用データの画像を拡張した拡張画像を生成する。拡張画像の生成方法は従来既知の方法を採用してよい。例えば、拡張画像生成部１４は、分類結果が「良」の画像と、分類結果が「不良」の画像とのαブレンドにより拡張画像を生成してよい。なお、拡張画像生成部１４は、２以上の画像を合成して拡張画像を生成する場合、同一の撮影場所及び撮影方向で撮影された画像を用いる。

　訓練データ生成部１５は、図５のＤに示すように、分類結果が「良」の画像については、各画素に、その画素の分類結果をラベル付けすることにより、訓練データを生成する。また、訓練データ生成部１５は、分類結果が「不良」の画像、及び拡張画像の各々に合成疑似ラベルをラベル付けすることにより、訓練データを生成する。具体的には、図７に示すように、訓練データ生成部１５は、分類結果が「不良」の画像の画素（ｋ，ｌ）に、その画像と同一の撮影場所及び撮影方向で撮影された、分類結果が「良」の画像から生成された合成疑似ラベルｃ_{（ｋ，ｌ）}を付与する。また、訓練データ生成部１５は、拡張画像についても同様に、拡張画像の画素（ｋ，ｌ）に、その拡張画像の元となった画像と同一の撮影場所及び撮影方向で撮影された、分類結果が「良」の画像から生成された合成疑似ラベルｃ_{（ｋ，ｌ）}を付与する。

　訓練部１６は、図５のＥに示すように、生成部１２により生成された訓練データを用いて、機械学習モデル２０を訓練する。すなわち、訓練部１６は、運用時に取得される運用データに対して、その時点で運用中の機械学習モデル２０による分類結果が正解ラベルとしてラベル付けされた訓練データを用いて、機械学習モデル２０を再学習する。再学習された機械学習モデル２０は出力され、運用中のシステムへ適用される。

　図８に、運用中の経過時間と機械学習モデルの精度との関係を概略的に示す。図８の例では、実線は、運用中に得られる分類結果が適正な場合の精度の推移であり、破線は、運用中に得られる分類結果が適正ではない場合の精度の推移である。このように、運用データに対する分類結果が真の分類結果と大きく異なる場合、その分類結果を正解ラベルとしてラベル付けした訓練データを用いてモデルを再訓練しても精度が維持されない、又は再訓練することで逆に精度が低下する場合がある。本実施形態では、運用データに対する分類結果の良否を判定した上で、分類結果が「不良」の画像については、分類結果が「良」の画像の分類結果に基づくラベルが付与される。そのため、図８の実線で示す例と同様に、運用中の機械学習モデルの精度低下を抑制することができる。

　機械学習装置１０は、例えば図９に示すコンピュータ４０で実現されてよい。コンピュータ４０は、ＣＰＵ（Central Processing Unit）４１と、一時記憶領域としてのメモリ４２と、不揮発性の記憶部４３とを備える。また、コンピュータ４０は、入力部、表示部等の入出力装置４４と、記憶媒体４９に対するデータの読み込み及び書き込みを制御するＲ／Ｗ（Read/Write）部４５とを備える。また、コンピュータ４０は、インターネット等のネットワークに接続される通信Ｉ／Ｆ（Interface）４６を備える。ＣＰＵ４１、メモリ４２、記憶部４３、入出力装置４４、Ｒ／Ｗ部４５、及び通信Ｉ／Ｆ４６は、バス４７を介して互いに接続される。

　記憶部４３は、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、フラッシュメモリ等によって実現されてよい。記憶媒体としての記憶部４３には、コンピュータ４０を、機械学習装置１０として機能させるための機械学習プログラム５０が記憶される。機械学習プログラム５０は、判定プロセス５１と、生成プロセス５２と、訓練プロセス５６とを有する。また、記憶部４３は、機械学習モデル２０を構成する情報が記憶される情報記憶領域６０を有する。

　ＣＰＵ４１は、機械学習プログラム５０を記憶部４３から読み出してメモリ４２に展開し、機械学習プログラム５０が有するプロセスを順次実行する。ＣＰＵ４１は、判定プロセス５１を実行することで、図４に示す判定部１１として動作する。また、ＣＰＵ４１は、生成プロセス５２を実行することで、図４に示す生成部１２として動作する。また、ＣＰＵ４１は、訓練プロセス５６を実行することで、図４に示す訓練部１６として動作する。また、ＣＰＵ４１は、情報記憶領域６０から情報を読み出して、機械学習モデル２０をメモリ４２に展開する。これにより、機械学習プログラム５０を実行したコンピュータ４０が、機械学習装置１０として機能することになる。なお、プログラムを実行するＣＰＵ４１はハードウェアである。

　なお、機械学習プログラム５０により実現される機能は、例えば半導体集積回路、より詳しくはＡＳＩＣ（Application Specific Integrated Circuit）、ＧＰＵ（Graphics Processing Unit）等で実現することも可能である。

　次に、本実施形態に係る機械学習装置１０の作用について説明する。機械学習装置１０に運用中のシステムで利用されている機械学習モデル２０が記憶され、機械学習装置１０に運用データである画像のデータセットが入力される。そして、機械学習モデル２０の再学習が指示されると、機械学習装置１０において、図１０に示す機械学習処理が実行される。なお、機械学習処理は、開示の技術の機械学習方法の一例である。

　ステップＳ１１で、判定部１１が、機械学習装置１０に入力された運用データである画像のデータセットを取得する。そして、判定部１１が、取得した画像の各々について、機械学習モデル２０を用いて各画素をクラス分類した分類結果を取得する。次に、ステップＳ１２で、判定部１１が、各画素の分類結果の確信度を示す分類スコアの、画像の全画素についての平均値を算出し、平均値が閾値以上の画像の分類結果を「良」、平均値が閾値未満の画像の分類結果を「不良」と判定する。

　次に、ステップＳ１３で、ラベル生成部１３が、分類結果が「良」の画像の内、同一の撮影場所及び撮影方向で撮影された画像の分類結果を用いて、合成疑似ラベルを生成する。次に、ステップＳ１４で、拡張画像生成部１４が、運用データの画像を拡張した拡張画像を生成する。次に、ステップＳ１６で、訓練データ生成部１５が、分類結果が「良」の画像について、各画素に、その画素の分類結果をラベル付けすることにより、訓練データを生成する。また、訓練データ生成部１５が、分類結果が「不良」の画像、及び拡張画像の各々に合成疑似ラベルをラベル付けすることにより、訓練データを生成する。

　次に、ステップＳ１７で、訓練部１６が、生成部１２により生成された訓練データを用いて、機械学習モデル２０を訓練する。そして、機械学習処理は終了する。

　以上説明したように、本実施形態に係る機械学習装置は、機械学習モデルにより運用データである画像に対してセマンティックセグメンテーションを行った際の分類結果の分類スコアに基づいて、分類結果の良否を判定する。また、機械学習装置は、分類結果が「不良」と判定された画像の各画素に、その画素に対応する、分類結果が「良」の画像の各画素の分類結果をラベル付けした訓練データを生成し、生成した訓練データに基づいて機械学習モデルを訓練する。これにより、セマンティックセグメンテーションのタスクにおいて、運用コストを抑制しつつ、機械学習モデルの精度を維持することができる。

　ここで、本実施形態に係る機械学習装置により訓練される機械学習モデルを、河川の増水検知を行うシステムに適用した適用例について説明する。この適用例のタスクは、河川を撮影した画像に対してセマンティックセグメンテーションを行い、河川（水面）に分類された領域に基づいて、増水の有無を判別するものである。この適用例において、１５箇所の撮影箇所のうち、８箇所の非増水箇所及び７箇所の増水箇所の各々で、１０～２０分間隔で撮影された４日間分の画像のデータセットを運用データとして使用して検証した結果について説明する。また、検証条件として、初期の機械学習モデルは、ＣＰＮｅｔ（参考文献１）を用いた。

　参考文献１：C. Yu, J. Wang, C. Gao, G. Yu, C. Shen, N. Sang, "Context Prior for Scene Segmentation," IEEE Conference on Computer Vision and Pattern Recognition, pp. 12416-12425, 2020.

　また、拡張画像の生成方法は、グレースケール化、フリッピング、及びランダムイレージングを適用した。また、２時間毎に、その前４時間分の画像（約１５０枚～２５０枚）及び初期の機械学習モデルの訓練時に使用した訓練データの一部（３００枚）を用いて、機械学習モデルをファインチューニングにより訓練して再学習を行った。また、ファインチューニングにおいて、学習率の初期値を０．００００１、エポック数を５００とした。なお、参考として、上記のファインチューニングに要する時間は、ＧＰＵ１枚で１０分弱である。一方、初期の機械学習モデルの訓練時は、学習率の初期値を０．００１、エポック数を２００００とした場合、約５時間を要する。

　１８：００－２２：００に撮影された画像について、分類結果が「良」と判定された画像の分類スコアの平均は０．９４６、分類結果が「不良」と判定された画像の分類スコアの平均は０．８７１であった。図１１及び図１２に、同一の撮影場所及び撮影方向で撮影された画像で撮影時間が異なる場合、すなわち、２つの画像間に状況変化があった場合の画像例及び分類結果例の概略図を示す。図１１の上段は、１８：００付近のまだ明るい時間帯に撮影された画像の例であり、その分類結果の分類スコアは０．９５９であり、「良」と判定された。一方、図１１の下段は、日が暮れて暗くなった時間帯に撮影された画像の例であり、その分類結果の分類スコアは０．８８５であり、「不良」と判定された。図１２も同様の状況変化があった画像例であり、図１２の上段の画像例は、その分類結果の分類スコアは０．９７３であり、「良」と判定された。一方、図１２の下段の画像例は、その分類結果の分類スコアは０．８８５であり、「不良」と判定された。このように、状況変化に伴って分類スコアが減少しており、正解ラベルを用いることなく、機械学習モデルの精度低下を検知することができている。

　適用例において、図１３に示すように、「良」と判定された分類結果から合成疑似ラベルを生成し、分類結果が「不良」と判定された画像及び拡張画像に、生成した合成疑似ラベルをラベル付けして訓練データを生成した。図１４及び図１５に、この場合の画像例、分類結果、及び精度の一例を概略的に示す。図１４は、１８：００付近のまだ明るい時間帯に撮影された画像例であり、図１５は、夜間の画像例である。精度は、クラス「水面」の分類結果の平均正解率を表している。図１４に示すように、明るい時間帯の画像に対しては、再学習前の機械学習モデルでの分類結果、及び適用例による再学習後の機械学習モデルによる分類結果のいずれも高い精度を維持している。また、図１５に示すように、状況変化が生じた夜間の画像例では、再学習前の機械学習モデルでの分類結果は著しく精度が低下する。これに対して、適用例による再学習後の機械学習モデルによる分類結果では、高い精度を維持している。すなわち、適用例は、運用中の状況変化がある場合でも、人手による正解ラベルの付与等の運用コストをかけることなく、機械学習モデルの精度を維持することができている。

　なお、上記実施形態では、セマンティックセグメンテーションとして、画像の画素毎にクラス分類する場合について説明したが、クラス分類は画素単位に限定されない。例えば、２画素×２画素、３画素×３画素等の小領域単位でクラス分類を行うようにしてもよい。

　また、上記実施形態では、合成疑似ラベルを生成する処理、及びラベル付けの処理において、同一の撮影場所及び撮影方向で撮影された画像を対象として処理する場合について説明したが、これに限定されない。撮影場所及び撮影方向が異なる画像同士であっても、同一の地点に対応する画像上の位置の対応が画像同士でとれればよい。

　また、上記実施形態では、画像単位で分類結果の良否を判定する場合について説明したが、これに限定されない。機械学習装置は、クラス分類の単位毎に良否を判定してもよい。この場合、１つの画像内に、分類結果が「良」の領域と「不良」の領域とが存在することになる。また、この場合、機械学習装置は、合成疑似ラベルも画像単位で生成するのではなく、分類結果が「良」の領域毎に生成する。そして、機械学習装置は、各画像において、分類結果が「不良」の領域に対して、その領域の位置に対応する、分類結果が「良」の領域から生成した合成疑似ラベルを付与するようにしてもよい。また、機械学習装置は、各画像において、分類結果が「良」の領域については、その領域の分類結果をラベルとして付与すればよい。

　また、上記実施形態では、機械学習プログラムが記憶部に予め記憶（インストール）されている態様を説明したが、これに限定されない。開示の技術に係るプログラムは、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ＵＳＢメモリ等の記憶媒体に記憶された形態で提供することも可能である。

１０   機械学習装置
１１   判定部
１２   生成部
１３   ラベル生成部
１４   拡張画像生成部
１５   訓練データ生成部
１６   訓練部
２０   機械学習モデル
４０   コンピュータ
４１   ＣＰＵ
４２   メモリ
４３   記憶部
４４   入出力装置
４５   Ｒ／Ｗ部
４６   通信Ｉ／Ｆ
４７   バス
４９   記憶媒体
５０   機械学習プログラム
５１   判定プロセス
５２   生成プロセス
５６   訓練プロセス
６０   情報記憶領域

Claims

　機械学習モデルが第１の画像を閾値未満の値に基づいて分類した場合、前記機械学習モデルが前記閾値以上の値に基づいて第２の画像を分類した分類結果に基づいて、前記第１の画像の第１の領域の位置に対応する前記第２の画像の第２の領域の分類結果を、前記第１の領域に対してラベル付けした訓練データを生成し、
　前記訓練データに基づいて前記機械学習モデルを訓練する、
　処理をコンピュータに実行させることを特徴とする機械学習プログラム。
　前記機械学習モデルが前記第１の画像を閾値未満の値で分類した場合とは、前記第１の画像のうち前記第１の領域を含む複数の領域のそれぞれが分類される際に出力される値の平均が前記閾値未満である場合である、
　請求項１に記載の機械学習プログラム。
　前記機械学習モデルが前記第１の画像を閾値未満の値で分類した場合とは、前記第１の画像のうち前記第１の領域が分類される際に出力される値が前記閾値未満である場合であって、
　前記機械学習モデルが前記閾値以上の値に基づいて前記第２の画像を分類した分類結果とは、前記第２の画像を前記機械学習モデルへ入力して得られる前記第２の画像の前記第２の領域を前記閾値以上の値に基づいて分類した前記第２の領域の分類結果である、
　請求項１に記載の機械学習プログラム。
　前記出力される値は、前記機械学習モデルによる分類結果の確信度を示す値である、
　請求項２又は請求項３に記載の機械学習プログラム。
　前記訓練データを生成する処理は、前記第１の画像の第３の領域が前記閾値以上の値で分類された場合、前記第１の画像の前記第３の領域に対して前記第３の領域の分類結果をラベル付けした前記訓練データを生成する処理を含む、
　請求項１～請求項４のいずれか１項に記載の機械学習プログラム。
　前記訓練データを生成する処理は、前記第１の画像及び前記第２の画像の少なくとも一方を用いて生成された第３の画像の第４の領域の位置に対応する前記第２の画像の第２の領域の分類結果を、前記第４の領域に対してラベル付けした訓練データを生成する処理を含む、
　請求項１～請求項５のいずれか１項に記載の機械学習プログラム。
　前記第２の領域の分類結果は、前記第２の領域が複数のクラスの各々に分類される確率であり、
　前記ラベル付けの処理は、複数の前記第２の画像の前記第２の領域の分類結果に基づいて、前記第２の領域が分類される確率が最も高いクラスに対応するラベルを前記第１の領域に付与することを含む、
　請求項１～請求項６のいずれか１項に記載の機械学習プログラム。
　機械学習モデルが第１の画像を閾値未満の値に基づいて分類した場合、前記機械学習モデルが前記閾値以上の値に基づいて第２の画像を分類した分類結果に基づいて、前記第１の画像の第１の領域の位置に対応する前記第２の画像の第２の領域の分類結果を、前記第１の領域に対してラベル付けした訓練データを生成し、
　前記訓練データに基づいて前記機械学習モデルを訓練する、
　処理を実行する制御部を含むことを特徴とする機械学習装置。
　前記機械学習モデルが前記第１の画像を閾値未満の値で分類した場合とは、前記第１の画像のうち前記第１の領域を含む複数の領域のそれぞれが分類される際に出力される値の平均が前記閾値未満である場合である、
　請求項８に記載の機械学習装置。
　前記機械学習モデルが前記第１の画像を閾値未満の値で分類した場合とは、前記第１の画像のうち前記第１の領域が分類される際に出力される値が前記閾値未満である場合であって、
　前記機械学習モデルが前記閾値以上の値に基づいて前記第２の画像を分類した分類結果とは、前記第２の画像を前記機械学習モデルへ入力して得られる前記第２の画像の前記第２の領域を前記閾値以上の値に基づいて分類した前記第２の領域の分類結果である、
　請求項８に記載の機械学習装置。
　前記出力される値は、前記機械学習モデルによる分類結果の確信度を示す値である、
　請求項９又は請求項１０に記載の機械学習装置。
　前記訓練データを生成する処理は、前記第１の画像の第３の領域が前記閾値以上の値で分類された場合、前記第１の画像の前記第３の領域に対して前記第３の領域の分類結果をラベル付けした前記訓練データを生成する処理を含む、
　請求項８～請求項１１のいずれか１項に記載の機械学習装置。
　前記訓練データを生成する処理は、前記第１の画像及び前記第２の画像の少なくとも一方を用いて生成された第３の画像の第４の領域の位置に対応する前記第２の画像の第２の領域の分類結果を、前記第４の領域に対してラベル付けした訓練データを生成する処理を含む、
　請求項８～請求項１２のいずれか１項に記載の機械学習装置。
　前記第２の領域の分類結果は、前記第２の領域が複数のクラスの各々に分類される確率であり、
　前記ラベル付けの処理は、複数の前記第２の画像の前記第２の領域の分類結果に基づいて、前記第２の領域が分類される確率が最も高いクラスに対応するラベルを前記第１の領域に付与することを含む、
　請求項８～請求項１３のいずれか１項に記載の機械学習装置。
　機械学習モデルが第１の画像を閾値未満の値に基づいて分類した場合、前記機械学習モデルが前記閾値以上の値に基づいて第２の画像を分類した分類結果に基づいて、前記第１の画像の第１の領域の位置に対応する前記第２の画像の第２の領域の分類結果を、前記第１の領域に対してラベル付けした訓練データを生成し、
　前記訓練データに基づいて前記機械学習モデルを訓練する、
　処理をコンピュータに実行させることを特徴とする機械学習方法。
　前記機械学習モデルが前記第１の画像を閾値未満の値で分類した場合とは、前記第１の画像のうち前記第１の領域を含む複数の領域のそれぞれが分類される際に出力される値の平均が前記閾値未満である場合である、
　請求項１５に記載の機械学習方法。
　前記機械学習モデルが前記第１の画像を閾値未満の値で分類した場合とは、前記第１の画像のうち前記第１の領域が分類される際に出力される値が前記閾値未満である場合であって、
　前記機械学習モデルが前記閾値以上の値に基づいて前記第２の画像を分類した分類結果とは、前記第２の画像を前記機械学習モデルへ入力して得られる前記第２の画像の前記第２の領域を前記閾値以上の値に基づいて分類した前記第２の領域の分類結果である、
　請求項１５に記載の機械学習方法。
　前記出力される値は、前記機械学習モデルによる分類結果の確信度を示す値である、
　請求項１６又は請求項１７に記載の機械学習方法。
　前記訓練データを生成する処理は、前記第１の画像の第３の領域が前記閾値以上の値で分類された場合、前記第１の画像の前記第３の領域に対して前記第３の領域の分類結果をラベル付けした前記訓練データを生成する処理を含む、
　請求項１５～請求項１８のいずれか１項に記載の機械学習方法。
　機械学習モデルが第１の画像を閾値未満の値に基づいて分類した場合、前記機械学習モデルが前記閾値以上の値に基づいて第２の画像を分類した分類結果に基づいて、前記第１の画像の第１の領域の位置に対応する前記第２の画像の第２の領域の分類結果を、前記第１の領域に対してラベル付けした訓練データを生成し、
　前記訓練データに基づいて前記機械学習モデルを訓練する、
　処理をコンピュータに実行させることを特徴とする機械学習プログラムを記憶した非一時的記憶媒体。