WO2021240589A1

WO2021240589A1 - 学習装置、推論装置、プログラム、学習方法及び推論方法

Info

Publication number: WO2021240589A1
Application number: PCT/JP2020/020503
Authority: WO
Inventors: 偉雄藤田; 大祐鈴木
Original assignee: 三菱電機株式会社
Priority date: 2020-05-25
Filing date: 2020-05-25
Publication date: 2021-12-02
Also published as: JPWO2021240589A1

Abstract

サンプル画像に対して画像の劣化を模擬する第１の画像処理を行うことで、劣化サンプル画像を生成する劣化処理部（１０１）と、劣化サンプル画像に対して、処理パラメータを用いて予め定められた第２の画像処理を行うことで、処理後画像を生成する画像処理部（１０２）と、サンプル画像及び処理後画像を用いて学習を行うことで、第２の画像処理における好適な処理パラメータを推論するための学習済モデルを生成するモデル生成部（１０４）と、を備える。

Description

学習装置、推論装置、プログラム、学習方法及び推論方法

　本開示は、学習装置、推論装置、プログラム、学習方法及び推論方法に関する。

　入力された画像に対して、画像処理を適用することで、例えば、画像上における認識率を向上させるケースがある。そのような画像処理のアルゴリズムは、処理の強度又は特性を調整するためのパラメータを有することが多く、入力される画像の特性に合わせて適切にパラメータ調整を行わなければ、望ましい画像処理効果を得ることができない。

　例えば、特許文献１には、撮像部で対象物を撮影し、その撮影画像に基づいて対象物を検出し、検出結果に基づいてロボットを制御する技術が記載されている。
　特許文献１では、機械学習を用いて、撮像部によって撮像された対象物の画像に対する画像処理に関する画像処理パラメータが算出される。その画像処理パラメータの算出部は、撮影画像における対象物の検出結果の良否に基づいて、又は、対象物の検出結果によりロボットが行った作業の良否に基づいて、機械学習を行う。

　特許文献１では、機械学習によってロボットがより望ましい作業を行うような画像処理パラメータで撮影画像が処理されるようになる。

特開２０１８－１２６７９９号公報（３頁３７行～４頁１８行）

　特許文献１に記載された技術は、画像処理パラメータ算出部を学習させるためにはロボットを動作させたうえで、対象物の検出結果若しくはロボットの作業に関する評価結果を得て、その結果をフィードバックとして学習装置に入力する必要があり、一般的な画像処理に応用することが困難である。

　また、一般的な学習済み被写体検出処理の中間層では対象物を検出するための抽象化された特徴量が抽出されており、そのような画像処理パラメータから最終的な被写体に対応する特徴量が求められる。そして、最も可能性が高い画像処理パラメータが検出処理の最終的な結果として出力されるようになっている。そのため最終的な検出結果又はロボットの作業評価をフィードバックに用いる方式では、二番手以降の検出候補に対応する特徴量が切り捨てられて、処理パラメータの変化が画像に与える影響を詳細に捉えることが困難であり、学習が十分に進まない可能性がある。
　以上のように、従来の技術では、必要な学習用データを取得するために、他のシステムを動作させたり、別の処理を行わせたりする必要がある。

　そこで、本開示の一又は複数の態様は、他のシステムを動作させたり、別の処理を行わせたりせずに、必要な学習効果が得られるようにすることを目的とする。

　本開示の一態様に係る学習装置は、サンプル画像に対して画像の劣化を模擬する第１の画像処理を行うことで、劣化サンプル画像を生成する劣化処理部と、前記劣化サンプル画像に対して、処理パラメータを用いて予め定められた第２の画像処理を行うことで、処理後画像を生成する画像処理部と、前記サンプル画像及び前記処理後画像を用いて学習を行うことで、前記第２の画像処理における好適な処理パラメータを推論するための学習済モデルを生成するモデル生成部と、を備えることを特徴とする。

　本開示の一態様に係る推論装置は、サンプル画像に対して画像の劣化を模擬する第１の画像処理を行うことで生成された劣化サンプル画像に対して、処理パラメータを用いて予め定められた第２の画像処理を行うことで、処理後画像を生成し、前記サンプル画像及び前記処理後画像を用いて学習を行うことで、前記第２の画像処理における好適な処理パラメータを推論するために生成された学習済モデルを用いて、対象画像から、前記対象画像に好適な処理パラメータである対象処理パラメータを推論する推論部と、前記対象画像に対して、前記対象処理パラメータを用いて前記第２の画像処理を行うことで、処理後対象画像を生成する画像処理部と、を備えることを特徴とする。

　本開示の一態様に係るプログラムは、コンピュータを、サンプル画像に対して画像の劣化を模擬する第１の画像処理を行うことで、劣化サンプル画像を生成する劣化処理部、前記劣化サンプル画像に対して、処理パラメータを用いて予め定められた第２の画像処理を行うことで、処理後画像を生成する画像処理部、及び、前記サンプル画像及び前記処理後画像を用いて学習を行うことで、前記第２の画像処理における好適な処理パラメータを推論するための学習済モデルを生成するモデル生成部、として機能させることを特徴とする。

　本開示の一態様に係るプログラムは、コンピュータを、サンプル画像に対して画像の劣化を模擬する第１の画像処理を行うことで生成された劣化サンプル画像に対して、処理パラメータを用いて予め定められた第２の画像処理を行うことで、処理後画像を生成し、前記サンプル画像及び前記処理後画像を用いて学習を行うことで、前記第２の画像処理における好適な処理パラメータを推論するために生成された学習済モデルを用いて、対象画像から、前記対象画像に好適な処理パラメータである対象処理パラメータを推論する推論部、及び、前記対象画像に対して、前記対象処理パラメータを用いて前記第２の画像処理を行うことで、処理後対象画像を生成する画像処理部、として機能させることを特徴とする。

　本開示の一態様に係る学習方法は、サンプル画像に対して画像の劣化を模擬する第１の画像処理を行うことで、劣化サンプル画像を生成し、前記劣化サンプル画像に対して、処理パラメータを用いて予め定められた第２の画像処理を行うことで、処理後画像を生成し、前記サンプル画像及び前記処理後画像を用いて学習を行うことで、前記第２の画像処理における好適な処理パラメータを推論するための学習済モデルを生成することを特徴とする。

　本開示の一態様に係る推論方法は、サンプル画像に対して画像の劣化を模擬する第１の画像処理を行うことで生成された劣化サンプル画像に対して、処理パラメータを用いて予め定められた第２の画像処理を行うことで、処理後画像を生成し、前記サンプル画像及び前記処理後画像を用いて学習を行うことで、前記第２の画像処理における好適な処理パラメータを推論するために生成された学習済モデルを用いて、対象画像から、前記対象画像に好適な処理パラメータである対象処理パラメータを推論し、前記対象画像に対して、前記対象処理パラメータを用いて前記第２の画像処理を行うことで、処理後対象画像を生成することを特徴とする。

　本開示の一又は複数の態様によれば、他のシステムを動作させたり、別の処理を行わせたりせずに、必要な学習効果を得ることができる。

学習装置の構成を概略的に示すブロック図である。３層のニューラルネットワークを説明するための概略図である。コンピュータの構成を概略的に示すブロック図である。学習装置の学習処理を示すフローチャートである。推論装置の構成を概略的に示すブロック図である。推論装置の推論処理を示すフローチャートである。

実施の形態．
　図１は、実施の形態に係る学習装置１００の構成を概略的に示すブロック図である。
　学習装置１００は、劣化処理部１０１と、画像処理部１０２と、データ取得部１０３と、モデル生成部１０４と、学習済モデル記憶部１０７とを備える。

　劣化処理部１０１は、サンプル画像ＳＩに対して画像の劣化を模擬する画像処理を行うことで、劣化サンプル画像ＤＩを生成する。ここでの画像処理を第１の画像処理ともいう。
　例えば、劣化処理部１０１は、学習装置１００に入力されるサンプル画像ＳＩに対して、天候又は夜間の照度低下等による画質劣化を模擬する処理を行い、劣化サンプル画像ＤＩを生成する。劣化サンプル画像ＤＩは、画像処理部１０２及びモデル生成部１０４に与えられる。なお、サンプル画像ＳＩは、データ取得部１０３にも与えられる。

　ここでの画質劣化は、例えば、サンプル画像ＳＩがカメラの撮影画像である場合、天候又は夜間の照度低下により撮影画像に解像度の低下が生じたり、ノイズが増加したりすることを指す。

　なお、学習装置１００に入力されるサンプル画像ＳＩは、カメラの撮影画像に限定されるものではない。例えば、サンプル画像ＳＩが伝送される画像である場合には、劣化サンプル画像ＤＩは、伝送時の圧縮処理によって劣化を生じた伝送後画像であってもよい。また、サンプル画像ＳＩがスキャナにより取り込まれる画像である場合には、劣化サンプル画像ＤＩは、原稿読み取り時に劣化を生じたスキャナによる読み取り画像であってもよい。

　画像処理部１０２は、劣化サンプル画像ＤＩに対して、処理パラメータＰＰを用いて予め定められた画像処理を行うことで、処理後画像ＰＩを生成する。ここでの画像処理は、第２の画像処理ともいう。処理後画像ＰＩは、データ取得部１０３に与えられる。画像処理の際の処理パラメータＰＰは、モデル生成部１０４から与えられる。

　データ取得部１０３は、サンプル画像ＳＩ及び処理後画像ＰＩから学習用データを生成する。学習用データは、モデル生成部１０４に与えられる。

　モデル生成部１０４は、サンプル画像ＳＩ及び処理後画像ＰＩを用いて学習を行うことで、画像処理部１０２が行う画像処理における好適な処理パラメータを推論するための学習済モデルを生成する。
　例えば、モデル生成部１０４は、サンプル画像ＳＩ及び処理後画像ＰＩを含む学習用データを用いて、劣化サンプル画像ＤＩを入力として、画像処理部１０２の処理パラメータＰＰを出力する。言い換えると、モデル生成部１０４は、劣化サンプル画像ＤＩを参照し、処理後画像ＰＩが入力されるサンプル画像ＳＩに近づくような、画像処理部１０２の処理パラメータＰＰを推論する学習モデルを生成する。

　なお、学習装置１００は、画像処理部１０２の処理パラメータを学習するために使用される。学習装置１００は、例えば、図示しないネットワークを介して画像の入力を受ける入力部と接続され、その入力部を備える装置とは、別個の装置であってもよく、同じ装置であってもよい。
　また、学習装置１００は、そのような画像の入力部を備えていてもよい。さらに、学習装置１００は、クラウドサーバ上に存在していてもよい。

　モデル生成部１０４は、推論部１０５と、評価値算出部１０６とを備える。
　推論部１０５は、教師あり学習、教師なし学習又は強化学習等の公知の学習アルゴリズムを用いて、画像処理部１０２の処理パラメータＰＰを推論する。ここでは、一例として、ニューラルネットワークを適用した場合について説明する。

　推論部１０５は、例えば、学習モデルであるニューラルネットワークモデルに従って、いわゆる教師あり学習により、画像処理部１０２の処理パラメータＰＰを学習する。ここで、教師あり学習は、入力及び結果（ラベル）のデータの組を与えることで、それらの学習用データにある特徴を学習し、入力から結果を推論する手法である。

　ニューラルネットワークは、複数のニューロンからなる入力層、複数のニューロンからなる中間層（隠れ層）、及び、複数のニューロンからなる出力層で構成される。中間層は、１層又は２層以上でもよい。

　例えば、図２に示されているような３層のニューラルネットワークであれば、複数の入力が入力層（Ｘ１～Ｘ３）に入力されると、その値に重みＷ１（Ｗ１１～Ｗ１６）が掛けられる。その重みＷ１が掛けられた値が、中間層（Ｙ１～Ｙ２）に入力され、その結果に、さらに重みＷ２（Ｗ２１～Ｗ２６）が掛けられる。そして、重みＷ２が掛けられた値が出力層（Ｚ１～Ｚ３）から出力される。この出力結果は、重みＷ１の値と、重みＷ２の値とによって変わる。

　図１に戻り、推論部１０５は、ニューラルネットワークを用いて、データ取得部１０３によって取得されるサンプル画像ＳＩ及び処理後画像ＰＩの組合せに基づいて作成される学習用データに従って、いわゆる教師あり学習により、入力される劣化サンプル画像ＤＩに対応する画像処理部１０２の処理パラメータＰＰを学習する。

　すなわち、推論部１０５は、入力層に劣化サンプル画像ＤＩを入力し、出力層から出力された画像処理部１０２の処理パラメータＰＰによる処理後画像ＰＩが、元のサンプル画像ＳＩに近づくように重みＷ１と、重みＷ２とを調整することで学習する。具体的には、後述する評価値算出部１０６にてサンプル画像ＳＩと、処理後画像ＰＩとを入力として算出される二つの画像の類似度を示す評価値を参照し、類似度がより高くなるように学習を実行する。

　言い換えると、評価値算出部１０６は、サンプル画像ＳＩと、処理後画像ＰＩとの類似度を示す評価値を算出し、推論部１０５は、その評価値を参照して、サンプル画像ＳＩと、処理後画像ＰＩとの類似度が高くなるように学習モデルを更新することで、学習済モデルを生成する。

　評価値算出部１０６は、サンプル画像ＳＩと、処理後画像ＰＩとを比較し、それらの類似度を評価値として算出する。
　例えば、評価値算出部１０６は、サンプル画像ＳＩの画素値と、処理後画像ＰＩの画素値との差を積算した値により、評価値を算出することができる。評価値の計算方法としては、二つの画像の各画素の画素値の差分を二乗して平均することで算出される平均二乗誤差（以下、ＭＳＥという）が用いられてもよい。

　また、評価値算出部１０６が画像から特定の被写体を検出する被写体検出処理をさらに行うものである場合には、評価値算出部１０６は、サンプル画像に対して被写体検出処理を実行した際の中間層出力と、処理後画像ＰＩに対して被写体検出処理を実行した際の中間層出力との差を積算した値により、評価値を算出してもよい。
　例えば、画像から認識される被写体の特徴量を指標とするために、学習済み被写体検出処理の中間層出力ＭＳＥが用いられてもよい。学習済み被写体検出処理の中間層では、対象物を検出するための抽象化された特徴量が抽出されており、ここから最終的な被写体に対応する特徴量が求められ、最も可能性が高い対象物が検出処理の最終的な結果として出力されるようになっている。このため、被写体検出処理の最終検出結果ではなく、中間層出力を比較することで、可能性が低い検出結果が切り捨てられる前の抽象化された特徴量を反映した類似度の評価値を得ることができる。

　学習済み被写体検出処理の中間層出力ＭＳＥが用いられる場合は、サンプル画像ＳＩと、処理後画像ＰＩとが、それぞれ学習装置１００が搭載される装置の用途に合わせて予め用意されたニューラルネットワークから成る学習済み被写体検出処理に入力される。評価値算出部１０６は、それぞれの画像が入力された際の被写体検出処理の中間層データを抽出し、データ毎に差分を二乗して平均値を求める。

　なお、学習済み被写体検出処理が４層以上のニューラルネットワークの場合、複数の中間層が存在するため、比較対象とする中間層を選択する必要がある。ニューラルネットワークにおいては、前段の中間層では個々の画素値の変化に近い特性が得られ、後段になるほどより抽象化され、検出対象となる被写体の特徴が抽出されたデータが得られる。そのため、評価値算出部１０６は、出力される画像の用途に応じて比較対象とする中間層の位置を使い分けることが望ましい。

　すなわち、出力画像が専ら機械学習による被写体検出処理の入力として使われ、人間が目視で処理画像を確認することがない場合には、画像としての類似性よりも抽象化された被写体の特徴が類似していればよいので、評価値算出部１０６は、後段の中間層を比較対象として選択する。
　逆に、出力画像を人間が目視で確認する用途が主であれば、画像としての類似性を高めるため、評価値算出部１０６は、前段の中間層を比較対象として選択する。

　また、複数の用途に出力画像を用いる場合、評価値算出部１０６は、複数の中間層出力を参照し、各中間層出力を比較して算出した値を加重平均したものを評価値として用いてもよい。
　言い換えると、評価値算出部１０６は、サンプル画像ＳＩに対して被写体検出処理を実行した際の中間層出力と、処理後画像ＰＩに対して被写体検出処理を実行した際の中間層出力との差を積算した第１の値を算出する。また、評価値算出部１０６は、サンプル画像ＳＩの画素値と、処理後画像ＰＩの画素値との差を積算した第２の値を算出する。そして、評価値算出部１０６は、第１の値と、第２の値とを加重平均した値により、評価値を算出してもよい。

　また、評価値算出部１０６は、画像の画素値のＭＳＥ又は学習済み被写体検出処理の中間層出力ＭＳＥをそれぞれ単独で評価値として用いるのではなく、二つの値を加重平均して評価値として用いてもよい。

　推論部１０５は、以上のような学習を実行することで学習済モデルを生成する。
　学習済モデル記憶部１０７は、生成された学習済モデルを記憶する。

　以上に記載された学習装置１００は、図３に示されているような、コンピュータ１１０により実現することができる。
　図３に示されているように、コンピュータ１１０は、補助記憶装置１１１と、通信装置１１２と、メモリ１１３と、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）等のプロセッサ１１４とを備える。

　補助記憶装置１１１は、コンピュータ１１０での処理に必要なプログラム及びデータを記憶する。
　通信装置１１２は、他の装置と通信を行なう。
　メモリ１１３は、プロセッサ１１４の作業領域を提供する。
　プロセッサ１１４は、補助記憶装置１１１に記憶されているプログラムをメモリ１１３に読み出して、そのプログラムを実行することで、処理を行う。

　例えば、劣化処理部１０１、画像処理部１０２、データ取得部１０３及びモデル生成部１０４は、プロセッサ１１４が補助記憶装置１１１に記憶されているプログラムをメモリ１１３に読み出して、そのプログラムを実行することで実現することができる。
　このようなプログラムは、ネットワークを通じて提供されてもよく、また、記録媒体に記録されて提供されてもよい。即ち、このようなプログラムは、例えば、プログラムプロダクトとして提供されてもよい。

　学習済モデル記憶部１０７は、プロセッサ１１４が補助記憶装置１１１を利用することにより実現することができる。
　なお、以上に記載された実施の形態では、学習装置１００が学習済モデル記憶部１０７を備えているが、本実施の形態は、以上のような例に限定されるものではない。例えば、学習済モデル記憶部１０７は、学習装置１００とは別の装置に備えられていてもよい。このような場合、モデル生成部１０４で生成された学習済モデルは、通信装置１１２を介して、別の装置に送られる。

　次に、図４を用いて、学習装置１００が学習する処理について説明する。
　図４は、学習装置１００の学習処理を示すフローチャートである。

　劣化処理部１０１は、予め用意されたサンプル画像ＳＩを取得し、画質劣化を模擬する処理を行い、劣化サンプル画像ＤＩを生成する（Ｓ１０）。ここで入力として用いられるサンプル画像ＳＩは、学習装置１００が使用される環境下で一般的に取得される画像として想定される画像が予め用意されているものとする。

　また、画質劣化処理の種別、及び、画質劣化処理で用いられる処理パラメータＤＰは、学習装置１００が使用される環境下で想定される画質劣化要因に対応するものを、予め複数種類定められているものとする。そして、劣化処理部１０１は、実際の使用条件で環境が任意に変化するのを模擬するために、入力されるサンプル画像ＳＩ毎に、処理パラメータＤＰをランダムに切り替えて処理を実行する。

　次に、モデル生成部１０４の推論部１０５は、劣化処理部１０１からの劣化サンプル画像ＤＩを受け取り、その出力として画像処理部１０２に処理パラメータＰＰを与える（Ｓ１１）。ここでは、推論部１０５は、ニューラルネットワークを用いて、劣化サンプル画像ＤＩから処理パラメータＰＰを算出するものとする。

　次に、画像処理部１０２は、モデル生成部１０４から与えられた処理パラメータＰＰを用いて、劣化処理部１０１から与えられた劣化サンプル画像ＤＩに画像処理を適用し、処理後画像ＰＩを生成する（Ｓ１２）。

　次に、データ取得部１０３は、サンプル画像ＳＩと、処理後画像ＰＩとを取得する（Ｓ１３）。ここでは、データ取得部１０３は、サンプル画像ＳＩと、処理後画像ＰＩとを同時に取得するものとしたが、実施の形態はこのような例に限定されない。サンプル画像ＳＩと、対応する処理後画像ＰＩとを関連付けることができれば、データ取得部１０３は、サンプル画像ＳＩと、対応する処理後画像ＰＩとをそれぞれ別のタイミングで取得してもよい。

　次に、モデル生成部１０４の評価値算出部１０６は、データ取得部１０３によって取得されるサンプル画像ＳＩと、処理後画像ＰＩとを比較して、それらの類似度を評価値として算出する（Ｓ１４）。

　次に、モデル生成部１０４の推論部１０５は、評価値算出部１０６で算出された評価値に従って、サンプル画像ＳＩと、処理後画像ＰＩとの類似度がより高くなるような処理パラメータＰＰが算出されるように、ニューラルネットワークにおける各層の重みを更新する（Ｓ１５）。

　次に、モデル生成部１０４の推論部１０５は、予め定められた学習処理の終了条件が満たされたか否かを判断する（Ｓ１６）。学習処理の終了条件が満たされた場合（Ｓ１６でＹｅｓ）には、処理はステップＳ１７に進み、学習処理の終了条件が満たされていない場合（Ｓ１６でＮｏ）には、処理はステップＳ１１に戻る。

　ステップＳ１７では、推論部１０５は、生成した学習済モデルを学習済モデル記憶部１０７に送り、学習済モデル記憶部１０７は、その学習済モデルを記憶する。即ち、学習済モデル記憶部１０７は、ニューラルネットワークにおける各層の重みを記憶する。

　図５は、推論装置１２０の構成を概略的に示すブロック図である。
　推論装置１２０は、画像取得部１２１と、学習済モデル記憶部１２２と、推論部１２３と、画像処理部１２４とを備える。

　画像取得部１２１は、図示しないイメージセンサ若しくはカメラモジュール等の画像取得装置又は画像伝送装置を通じて、画像処理の対象となる画像である対象画像ＴＩを取得する。

　学習済モデル記憶部１２２は、学習装置１００で学習された学習済モデルを記憶する。推論装置１２０は、学習装置１００と同じ装置で実現されていてもよい。この場合には、学習済モデル記憶部１２２は、学習済モデル記憶部１０７と同じ記憶部であってもよい。また、推論装置１２０が学習装置１００とは別の装置である場合には、推論装置１２０は、例えば、図示しないネットワークを介して、学習装置１００から学習済モデルを取得して、学習済モデル記憶部１２２に記憶させればよい。なお、学習済モデル記憶部１２２は、図示しないネットワークに接続されているクラウド上に設けられていてもよい。

　推論部１２３は、学習済モデル記憶部１２２に記憶されている学習済モデルを用いて、対象画像ＴＩから、画像処理部１２４で使用される好適な処理パラメータＰＰを推論する。すなわち、この学習済モデルに画像取得部１２１が取得した対象画像ＴＩを入力することで、推論部１２３は、画質劣化の影響を受けた対象画像ＴＩに適した画像処理部１２４の処理パラメータＰＰを推論することができる。ここで推論される処理パラメータＰＰを対象処理パラメータともいう。

　なお、本実施の形態では、推論部１２３は、学習装置１００のモデル生成部１０４で学習された学習済モデルを用いて、画像処理部１２４の処理パラメータＰＰを算出するものとして説明したが、本実施の形態は、以上のような例に限定されない。例えば、学習済モデル記憶部１２２は、他の画像処理装置から取得された学習済モデルを記憶し、推論部１２３は、この学習済モデルに基づいて画像処理部１２４の処理パラメータＰＰを算出してもよい。但し、このような場合でも、学習済モデルは、学習装置１００で行なわれる処理と同様の処理で生成されることが望ましい。

　画像処理部１２４は、対象画像ＴＩに対して、予め定められた画像処理を適用し、処理後対象画像ＯＩを生成する。ここで適用される画像処理は、第２の画像処理ともいう。また、第２の画像処理で用いられる処理パラメータＰＰは、推論部１２３で推論された対象処理パラメータである。

　以上に記載された推論装置１２０も、図３に示されているようなコンピュータ１１０により実現することができる。

　例えば、画像取得部１２１、推論部１２３及び画像処理部１２４は、プロセッサ１１４が補助記憶装置１１１に記憶されているプログラムをメモリ１１３に読み出して、そのプログラムを実行することで実現することができる。
　このようなプログラムは、ネットワークを通じて提供されてもよく、また、記録媒体に記録されて提供されてもよい。即ち、このようなプログラムは、例えば、プログラムプロダクトとして提供されてもよい。
　また、学習済モデル記憶部１２２は、プロセッサ１１４が補助記憶装置１１１を利用することにより実現することができる。

　図６は、推論装置１２０の推論処理を示すフローチャートである。
　まず、画像取得部１２１は、イメージセンサ若しくはカメラモジュール等の画像取得装置又は画像伝送装置を通じて、対象画像ＴＩを取得する（Ｓ２０）。

　次に、推論部１２３は、学習済モデル記憶部１２２に記憶されている学習済モデルに対象画像ＴＩを入力し、画像処理部１２４の処理パラメータＰＰを算出する（Ｓ２１）。
　次に、推論部１２３は、その処理パラメータＰＰを画像処理部１２４に与える（Ｓ２２）。

　次に、画像処理部１２４は、推論部１２３から与えられた処理パラメータＰＰを用いて、画像取得部１２１から与えられた対象画像ＴＩに対して画像処理を行い、処理後対象画像ＯＩを生成する（Ｓ２３）。

　以上のように、本実施の形態によれば、他のシステムを動作させたり、別の処理を行わせたりせずに、実際に生じる劣化に対応した画像に基づいて、必要な学習用データを取得することができるため、実際に生じる劣化に対応した処理パラメータＰＰを取得することができる。

　なお、モデル生成部１０４で用いられる学習アルゴリズムとしては、特徴量そのものの抽出を学習する深層学習（Ｄｅｅｐ　Ｌｅａｒｎｉｎｇ）を用いることもでき、他の公知の方法、例えば、ニューラルネットワーク、遺伝的プログラミング、機能論理プログラミング又はサポートベクターマシン等に従って機械学習が実行されてもよい。

　なお、学習装置１００及び推論装置１２０は、例えば、図示しないネットワークを介して画像の入力部と接続され、その入力部とは別個の装置であってもよい。また、学習装置１００及び推論装置１２０は、画像の入力部とともに、図示しない１つの装置、例えば、画像処理装置に内蔵されていてもよい。さらに、学習装置１００及び推論装置１２０は、図示しないクラウドサーバ上に存在していてもよい。

　また、モデル生成部１０４は、図示しない複数の画像入力部から取得される画像をサンプル画像ＳＩとして用いて、画像処理部１０２の処理パラメータＰＰを学習するようにしてもよい。なお、モデル生成部１０４は、図示しないある画像入力部に関して画像処理部１０２の処理パラメータＰＰを学習した学習済モデルを、これとは別の画像入力部から入力される対象画像ＴＩに適用し、その別の画像入力部に関して画像処理部１０２の処理パラメータＰＰを再学習して更新を実行するようにしてもよい。

　１００　学習装置、　１０１　劣化処理部、　１０２　画像処理部、　１０３　データ取得部、　１０４　モデル生成部、　１０５　推論部、　１０６　評価値算出部、　１０７　学習済モデル記憶部、　１２０　推論装置、　１２１　画像取得部、　１２２　学習済モデル記憶部、　１２３　推論部、　１２４　画像処理部。

Claims

　サンプル画像に対して画像の劣化を模擬する第１の画像処理を行うことで、劣化サンプル画像を生成する劣化処理部と、
　前記劣化サンプル画像に対して、処理パラメータを用いて予め定められた第２の画像処理を行うことで、処理後画像を生成する画像処理部と、
　前記サンプル画像及び前記処理後画像を用いて学習を行うことで、前記第２の画像処理における好適な処理パラメータを推論するための学習済モデルを生成するモデル生成部と、を備えること
　を特徴とする学習装置。
　前記モデル生成部は、
　前記サンプル画像と、前記処理後画像との類似度を示す評価値を算出する評価値算出部と、
　前記評価値を参照して、前記サンプル画像と、前記処理後画像との類似度が高くなるように学習モデルを更新することで、前記学習済モデルを生成する推論部と、を備えること
　を特徴とする請求項１に記載の学習装置。
　前記評価値算出部は、前記サンプル画像の画素値と、前記処理後画像の画素値との差を積算した値により、前記評価値を算出すること
　を特徴とする請求項２に記載の学習装置。
　前記評価値算出部は、画像から特定の被写体を検出する被写体検出処理をさらに行い、
　前記評価値算出部は、前記サンプル画像に対して前記被写体検出処理を実行した際の中間層出力と、前記処理後画像に対して前記被写体検出処理を実行した際の中間層出力との差を積算した値により、前記評価値を算出すること
　を特徴とする請求項２に記載の学習装置。
　前記評価値算出部は、画像から特定の被写体を検出する被写体検出処理をさらに行い、
　前記評価値算出部は、前記サンプル画像に対して前記被写体検出処理を実行した際の中間層出力と、前記処理後画像に対して前記被写体検出処理を実行した際の中間層出力との差を積算した第１の値を算出し、
　前記サンプル画像の画素値と、前記処理後画像の画素値との差を積算した第２の値を算出し、
　前記第１の値と、前記第２の値とを加重平均した値により、前記評価値を算出すること
　を特徴とする請求項２に記載の学習装置。
　サンプル画像に対して画像の劣化を模擬する第１の画像処理を行うことで生成された劣化サンプル画像に対して、処理パラメータを用いて予め定められた第２の画像処理を行うことで、処理後画像を生成し、前記サンプル画像及び前記処理後画像を用いて学習を行うことで、前記第２の画像処理における好適な処理パラメータを推論するために生成された学習済モデルを用いて、対象画像から、前記対象画像に好適な処理パラメータである対象処理パラメータを推論する推論部と、
　前記対象画像に対して、前記対象処理パラメータを用いて前記第２の画像処理を行うことで、処理後対象画像を生成する画像処理部と、を備えること
　を特徴とする推論装置。
　コンピュータを、
　サンプル画像に対して画像の劣化を模擬する第１の画像処理を行うことで、劣化サンプル画像を生成する劣化処理部、
　前記劣化サンプル画像に対して、処理パラメータを用いて予め定められた第２の画像処理を行うことで、処理後画像を生成する画像処理部、及び、
　前記サンプル画像及び前記処理後画像を用いて学習を行うことで、前記第２の画像処理における好適な処理パラメータを推論するための学習済モデルを生成するモデル生成部、として機能させること
　を特徴とするプログラム。
　コンピュータを、
　サンプル画像に対して画像の劣化を模擬する第１の画像処理を行うことで生成された劣化サンプル画像に対して、処理パラメータを用いて予め定められた第２の画像処理を行うことで、処理後画像を生成し、前記サンプル画像及び前記処理後画像を用いて学習を行うことで、前記第２の画像処理における好適な処理パラメータを推論するために生成された学習済モデルを用いて、対象画像から、前記対象画像に好適な処理パラメータである対象処理パラメータを推論する推論部、及び、
　前記対象画像に対して、前記対象処理パラメータを用いて前記第２の画像処理を行うことで、処理後対象画像を生成する画像処理部、として機能させること
　を特徴とするプログラム。
　サンプル画像に対して画像の劣化を模擬する第１の画像処理を行うことで、劣化サンプル画像を生成し、
　前記劣化サンプル画像に対して、処理パラメータを用いて予め定められた第２の画像処理を行うことで、処理後画像を生成し、
　前記サンプル画像及び前記処理後画像を用いて学習を行うことで、前記第２の画像処理における好適な処理パラメータを推論するための学習済モデルを生成すること
　を特徴とする学習方法。
　サンプル画像に対して画像の劣化を模擬する第１の画像処理を行うことで生成された劣化サンプル画像に対して、処理パラメータを用いて予め定められた第２の画像処理を行うことで、処理後画像を生成し、前記サンプル画像及び前記処理後画像を用いて学習を行うことで、前記第２の画像処理における好適な処理パラメータを推論するために生成された学習済モデルを用いて、対象画像から、前記対象画像に好適な処理パラメータである対象処理パラメータを推論し、
　前記対象画像に対して、前記対象処理パラメータを用いて前記第２の画像処理を行うことで、処理後対象画像を生成すること
　を特徴とする推論方法。