JP7452149B2 - ブロックノイズ検出の為の学習装置及びコンピュータプログラム - Google Patents

ブロックノイズ検出の為の学習装置及びコンピュータプログラム Download PDF

Info

Publication number
JP7452149B2
JP7452149B2 JP2020050353A JP2020050353A JP7452149B2 JP 7452149 B2 JP7452149 B2 JP 7452149B2 JP 2020050353 A JP2020050353 A JP 2020050353A JP 2020050353 A JP2020050353 A JP 2020050353A JP 7452149 B2 JP7452149 B2 JP 7452149B2
Authority
JP
Japan
Prior art keywords
image
learning
block noise
pseudo
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020050353A
Other languages
English (en)
Other versions
JP2021149719A (ja
Inventor
直希 土屋
佳寛 真鍋
進 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisin Corp
Original Assignee
Aisin Seiki Co Ltd
Aisin Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisin Seiki Co Ltd, Aisin Corp filed Critical Aisin Seiki Co Ltd
Priority to JP2020050353A priority Critical patent/JP7452149B2/ja
Publication of JP2021149719A publication Critical patent/JP2021149719A/ja
Application granted granted Critical
Publication of JP7452149B2 publication Critical patent/JP7452149B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)

Description

本発明は、画像に対して生じるブロックノイズ検出の為の学習装置及びコンピュータプログラムに関する。
従来より、ナビゲーション装置、スマートフォン、パーソナルコンピュータ等の画像を表示する為の画像表示装置(液晶ディスプレイ、有機ELディスプレイ等)を備えた各種機器では、CPU等の演算手段によって生成された画像データを一旦メモリに書き込み、その後メモリから読み出した画像データをGPU等の画像処理を行う演算手段(CPUが行っても良い)によって画像表示装置に対して描画することにより画像の表示を行う。しかしながら、このような画像表示装置への画像の表示を行う際に、例えばメモリに対する画像データの書き込みと画像データの読み出しのタイミングが合わない等の理由により、メモリに書き込む画像データの生成に異常が生じる場合があり、その場合に画像表示装置に表示される画像にブロックノイズが生じることが知られている。
上記ブロックノイズの発生を防止する為には、画像の描画を行う前に生成された画像データに対してブロックノイズを生じさせる異常があることを検出可能とする必要がある。そして、このような画像データの異常を描画前に検出する為には学習モデルの導入が有効である。例えば画像表示装置への画像表示に関する学習モデルとして特開2018-136537号公報には、表示部に実際に表示された映像に対応するデータを学習データ、表示部への表示を意図している理想的な映像に対応するデータを教師データとしてニューラルネットワークを用いた学習を行うことによって画素の階調を補正し、映像の品質を向上させる技術について開示されている。
特開2012-192878号公報(第15-17頁)
ここで、上記特許文献1の学習モデルでは教師データとして、表示部への表示を意図している理想的な映像に対応するデータを用いている。しかし、実際に学習モデルを構築するに際して、学習モデルが表示部に実際に表示された映像のデータを取得することは比較的容易な一方で、表示部に表示する前の理想的な映像(即ち表示される予定の映像)のデータを取得することは容易でないことが多い。従って、上記特許文献1の学習モデルは適用できるケースが限られ、実用上問題があった。
本発明は前記従来における問題点を解消するためになされたものであり、正常画像に対して疑似的にブロックノイズを生じさせた画像を生成して教師データとして用いることによって、教師データの取得が容易となり、広く適用することが可能なブロックノイズ検出の為の学習装置及びコンピュータプログラムを提供することを目的とする。
前記目的を達成するため本発明に係るブロックノイズ検出の為の学習装置は、ブロックノイズの生じていない学習用正常画像を取得する正常画像取得手段と、ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像である疑似ブロックノイズ画像を生成する疑似ブロックノイズ画像生成手段と、前記学習用正常画像に対して前記疑似ブロックノイズ画像を重畳して合成することによって、前記学習用正常画像に対して擬似的にブロックノイズを生じさせた疑似異常画像を、ブロックノイズを検出する為の学習モデルの学習に用いる教師データとして生成する教師データ生成手段と、を有し、前記疑似ブロックノイズ画像生成手段は、ノイズ領域とするブロック形状のサイズ、位置、ノイズ領域の色及び透過率を夫々設定して前記疑似ブロックノイズ画像を生成する
また、本発明に係るコンピュータプログラムは、ブロックノイズ検出の為の学習に係るプログラムである。具体的には、コンピュータを、ブロックノイズの生じていない学習用正常画像を取得する正常画像取得手段と、ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像である疑似ブロックノイズ画像を生成する疑似ブロックノイズ画像生成手段と、前記学習用正常画像に対して前記疑似ブロックノイズ画像を重畳して合成することによって、前記学習用正常画像に対して擬似的にブロックノイズを生じさせた疑似異常画像を、ブロックノイズを検出する為の学習モデルの学習に用いる教師データとして生成する教師データ生成手段と、して機能させる為のコンピュータプログラムであって、前記疑似ブロックノイズ画像生成手段は、ノイズ領域とするブロック形状のサイズ、位置、ノイズ領域の色及び透過率を夫々設定して前記疑似ブロックノイズ画像を生成する
前記構成を有する本発明に係るブロックノイズ検出の為の学習装置及びコンピュータプログラムによれば、正常画像に対して疑似的にブロックノイズを生じさせた画像を生成して教師データとして用い、ブロックノイズを検出する為の学習を行うので、従来と比べて教師データの取得が容易となる。その結果、画像表示装置に表示する画像の品質を向上させるという点において広く適用可能な学習モデルを構築することが可能となる。また、擬似的にブロックノイズを生じさせた疑似異常画像を生成する場合であっても、実際にブロックノイズが生じている異常画像を再現して教師データとして用いることが可能となる。
本実施形態に係る学習システムを示した概略構成図である。 本実施形態に係る学習装置を示したブロック図である。 本実施形態に係るナビゲーション装置を示したブロック図である。 本実施形態に係る学習処理プログラムのフローチャートである。 学習用画像において重複画像の除外を行う態様を示した図である。 疑似ブロックノイズ画像の一例を示した図である。 疑似異常画像の一例を示した図である。 ブロックノイズ領域の面積値の分布を示した図である。 学習結果の評価に伴う再学習の態様を示した図である。 本実施形態に係る画像表示処理プログラムのフローチャートである。
以下、本発明に係る学習装置を具体化した一実施形態について図面を参照しつつ詳細に説明する。先ず、本実施形態に係る学習装置1を含む学習システム2の概略構成について図1を用いて説明する。図1は本実施形態に係る学習システム2を示した概略構成図である。
図1に示すように、本実施形態に係る学習システム2は、画像に生じるブロックノイズ検出の為の学習モデルの学習を行う学習装置1と、各種の画像を表示する手段を備えるとともに学習システム2によって表示画像のブロックノイズの低減を図る対象となるナビゲーション装置3と、を基本的に有する。尚、本実施形態では特に表示画像のブロックノイズの低減を図る対象として車載器であるナビゲーション装置3を例に挙げて説明しているが、画像を表示する手段を備える装置であればナビゲーション装置以外であっても良い。例えば、スマートフォン、タブレット端末、パーソナルコンピュータ等をナビゲーション装置3の代わりとしても良い。
また、本実施形態では学習を行う主体である学習装置1は画像の表示を行うナビゲーション装置3と別体に設けているが、学習装置1はナビゲーション装置3の一部(即ち学習機能を有するナビゲーション装置3)としても良い。その場合には、学習機能を有するナビゲーション装置3が本発明に係る学習装置に該当する。
ここで、学習装置1は、ナビゲーション装置3に表示される画像に生じるブロックノイズを検出する為の学習モデルの学習を行う装置である。また、学習装置1は、学習モデルの学習や学習結果を評価する為のテストに用いる各種画像が記憶されたDBを備え、DBに格納された画像を用いて後述のように学習モデルの学習や学習結果の評価を行う。特に本実施形態ではナビゲーション装置3において表示される画像を対象としたブロックノイズ検出の為の学習を行うので、DBにはナビゲーション装置3において表示対象となる画像(例えば地図画像、移動案内画像、施設案内画像等)が格納される。また、最終的に学習装置1において学習した学習モデルをナビゲーション装置3へと組み込むことによって、学習結果をナビゲーション装置3へと反映する。
一方、ナビゲーション装置3は、車両4に搭載され、格納する地図データや通信により取得した地図データに基づいて自車位置周辺の地図を表示したり、地図画像上において車両の現在位置を表示したり、設定された案内経路に沿った移動案内を行う車載機である。特に本実施形態では、学習装置1により学習した学習モデルを組み込み、表示する画像のブロックノイズの発生を低減させる処理についても行う。尚、詳細については後述する。
続いて、学習システム2に含まれる学習装置1のより具体的な構成について図2を用いて説明する。図2は本実施形態に係る学習装置1を示したブロック図である。
学習装置1は、図2に示すように制御部11と、制御部11に接続された情報記録手段としての教師画像DB12と、タッチパネルやキーボード等から構成される入力操作部13と、を備える。
制御部11は、学習装置1の全体の制御を行う制御ユニット(MCU、MPU等)であり、演算装置及び制御装置としてのCPU21、並びにCPU21が各種の演算処理を行うにあたってワーキングメモリとして使用されるRAM22、制御用のプログラムのほか、後述の学習処理プログラム(図4参照)等が記録されたROM23、ROM23から読み出したプログラムを記憶するフラッシュメモリ24等の内部記憶装置を備えている。尚、制御部11は、処理アルゴリズムとしての各種手段を有する。例えば、正常画像取得手段は、ブロックノイズの生じていない学習用正常画像を取得する。疑似ブロックノイズ画像生成手段は、ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像である疑似ブロックノイズ画像を生成する。教師データ生成手段は、学習用正常画像に対して疑似ブロックノイズ画像を重畳して合成することによって、学習用正常画像に対して擬似的にブロックノイズを生じさせた疑似異常画像を、ブロックノイズを検出する為の学習モデルの学習に用いる教師データとして生成する。
また、教師画像DB12は、学習モデルの学習や学習結果を評価する為のテストに用いる各種画像を記憶する為の記憶手段であり、例えば不揮発性のメモリやHDD等によって構成される。ここで、教師画像DB12に格納される画像は大きく分けて3種類あり、学習に用いる学習用画像25、学習結果を評価する為の一次テストに用いる一次テスト用画像26、一次テスト後に行われる二次テストに用いる二次テスト用画像27が存在する。教師画像DB12に格納される画像数は例えば学習用画像25が約9万枚、一次テスト用画像26が約2万枚、二次テストに用いる二次テスト用画像27が約79万枚存在する。尚、学習用画像25、一次テスト用画像26、二次テスト用画像27は一部が重複していても良い。
ここで、本実施形態に係る学習装置1は、ナビゲーション装置3において表示される画像を対象としたブロックノイズを検出する為の学習モデルの学習を行うので、学習用画像25、一次テスト用画像26及び二次テスト用画像27はいずれもナビゲーション装置3において表示対象となる画像(例えば地図画像、移動案内画像、施設案内画像等)となる。また、学習用画像25は、過去にナビゲーション装置3において実際に表示された画像でも良いし、学習用に疑似的に生成した画像であっても良い。更に学習用画像25は、基本的にブロックノイズが生じていない正常画像のみを含む。但し、後述のように学習時においては学習用画像25の正常画像からブロックノイズが生じている異常画像が疑似的に生成され、正常画像と疑似的に生成された異常画像を教師画像として学習が行われる。
一方、一次テスト用画像26及び二次テスト用画像27は、疑似的に生成した画像であっても良いが、より現実に近い状況を想定して学習効果を確認するために、過去にナビゲーション装置3において実際に表示された画像を用いるのが望ましい。一次テスト用画像26及び二次テスト用画像27には、ブロックノイズが生じていない正常画像と、ブロックノイズが生じている異常画像を予め含む。例えば正常画像5割、異常画像5割の比率とするがその比率は適宜変更可能とする。
また、入力操作部13は、例えばキーボード、マウス、ディスプレイの前面に設けられたタッチパネル等によって構成され、操作者による各種操作を受け付け可能に構成されている。そして、制御部11は、入力操作部13を介して入力された操作に基づき、対応する各種の動作を実行すべく制御を行う。例えば本実施形態では後述のように疑似的に生成するブロックノイズのパラメータの設定を行う際や学習の目標値を設定する際などに操作される。
本実施形態に係る学習装置1において学習される学習モデルは、上述したようにナビゲーション装置3において表示される画像を対象としたブロックノイズ検出の為の学習モデルであるが、より具体的にはナビゲーション装置3において生成された画像データを画面上に表示する前に該画像データが異常画像(表示した際にブロックノイズが生じる画像)に該当するかを判定する学習モデルである。詳細については後述するがナビゲーション装置3は、ブロックノイズが生じると予測されるエリアの面積値が閾値以上である場合に異常画像であると判定し、特に学習モデルはその閾値について学習によって最適値を算出する。
続いて、学習システム2に含まれるナビゲーション装置3の概略構成について図3を用いて説明する。図3は本実施形態に係るナビゲーション装置3を示したブロック図である。
図3に示すように本実施形態に係るナビゲーション装置3は、ナビゲーション装置3が搭載された車両の現在位置を検出する現在位置検出部31と、各種のデータが記録されたデータ記録部32と、入力された情報に基づいて、各種の演算処理を行うナビゲーションECU33と、ユーザからの操作を受け付ける操作部34と、ユーザに対して車両周辺の地図やナビゲーション装置3に設定された案内経路に関する情報等を表示する液晶ディスプレイ35と、経路案内に関する音声ガイダンスや危険因子に対する警告等を出力するスピーカ36と、記憶媒体であるDVDを読み取るDVDドライブ37と、プローブセンタやVICS(登録商標:Vehicle Information and Communication System)センタ等の情報センタとの間で通信を行う通信モジュール38と、を有している。また、ナビゲーション装置3は、CAN等の車載ネットワークを介して、ナビゲーション装置3の搭載された車両に対して設置されたセンサや車両制御用のECU等と接続されている。
以下に、ナビゲーション装置3が有する各構成要素について順に説明する。
現在位置検出部31は、GPS41、車速センサ42、ステアリングセンサ43、ジャイロセンサ44等からなり、現在の車両の位置、方位、車両の走行速度、現在時刻等を検出することが可能となっている。ここで、特に車速センサ42は、車両の移動距離や車速を検出する為のセンサであり、車両の駆動輪の回転に応じてパルスを発生させ、パルス信号をナビゲーションECU33に出力する。そして、ナビゲーションECU33は発生するパルスを計数することにより駆動輪の回転速度や移動距離を算出する。尚、上記4種類のセンサをナビゲーション装置3が全て備える必要はなく、これらの内の1又は複数種類のセンサのみをナビゲーション装置3が備える構成としても良い。
また、データ記録部32は、外部記憶装置及び記録媒体としてのハードディスク(図示せず)と、ハードディスクに記録された地図情報DB45や学習情報DB46や所定のプログラム等を読み出すとともにハードディスクに所定のデータを書き込む為のドライバである記録ヘッド(図示せず)とを備えている。尚、データ記録部32としてはハードディスクの代わりにメモリーカードやCDやDVD等の光ディスクを有しても良い。また、地図情報DB45は外部のサーバに格納させ、ナビゲーション装置3が通信により取得しても良い。
ここで、地図情報DB45は、例えば、道路(リンク)に関するリンクデータ、ノード点に関するノードデータ、施設に関する施設データ、経路探索処理に用いられる探索データ、地図を表示するための地図表示データ、各交差点に関する交差点データ、地点を検索するための検索データ等を含む。
また、学習情報DB46は、学習装置1によって学習された学習モデルに関する情報が格納される記憶手段である。本実施形態では後述のようにナビゲーション装置3は、生成され液晶ディスプレイ35に表示する前の画像データについて異常画像(表示した際にブロックノイズが生じる画像)に該当するかを判定し、異常画像に該当すると判定された場合に画像データの再生成を行うが、判定の際に用いる閾値が学習値として上記学習モデルに含まれている。尚、学習情報DB46に格納される学習モデルに関する情報は、学習装置1から通信或いは記憶媒体を介して取得し、更に取得した情報に基づいて適宜更新可能とするのが望ましい。
一方、ナビゲーションECU(エレクトロニック・コントロール・ユニット)33は、ナビゲーション装置3の全体の制御を行う電子制御ユニットであり、演算装置及び制御装置としてのCPU51、並びにCPU51が各種の演算処理を行うにあたってワーキングメモリとして使用されるとともに、経路が探索されたときの経路データ等が記憶されるRAM52、制御用のプログラムのほか、後述の画像表示処理プログラム(図10参照)等が記録されたROM53、ROM53から読み出したプログラムを記憶するフラッシュメモリ54等の内部記憶装置を備えている。更に、特に画像の描画に関する演算を行うGPU55、画像の描画に関する情報を格納するVRAM(ビデオメモリ)56についても備えている。但し、GPU55やVRAM56は必須ではなく、CPU51やRAM52がそれらの動作を代わりに行っても良い。
操作部34は、走行開始地点としての出発地及び走行終了地点としての目的地を入力する際等に操作され、各種のキー、ボタン等の複数の操作スイッチ(図示せず)を有する。そして、ナビゲーションECU33は、各スイッチの押下等により出力されるスイッチ信号に基づき、対応する各種の動作を実行すべく制御を行う。尚、操作部34は液晶ディスプレイ35の前面に設けたタッチパネルを有しても良い。また、マイクと音声認識装置を有しても良い。
また、液晶ディスプレイ35には、道路を含む地図画像、交通情報、操作案内、操作メニュー、キーの案内、ナビゲーション装置3で設定されている案内経路、案内経路に沿った案内情報、ニュース、天気予報、時刻、メール、テレビ番組等が表示される。尚、液晶ディスプレイ35の代わりに、HUDやHMDを用いても良い。また、本実施形態では特にナビゲーション装置3に組み込まれた学習モデルを用いて、後述のように液晶ディスプレイ35に表示される画像に対してブロックノイズの低減の為の処理が行われる。
また、スピーカ36は、ナビゲーションECU33からの指示に基づいて案内経路に沿った走行を案内する音声ガイダンスや、交通情報の案内を出力する。
また、DVDドライブ37は、DVDやCD等の記録媒体に記録されたデータを読み取り可能なドライブである。そして、読み取ったデータに基づいて音楽や映像の再生、地図情報DB45や学習情報DB46の更新等が行われる。尚、DVDドライブ37に替えてメモリーカードを読み書きする為のカードスロットを設けても良い。
また、通信モジュール38は、交通情報センタ、例えば、VICSセンタやプローブセンタ等から送信された交通情報を受信する為の通信装置であり、例えば携帯電話機やDCMが該当する。また、学習装置1との間の通信について可能にしても良い。
続いて、上記構成を有する本実施形態に係る学習装置1においてCPU21が実行する学習処理プログラムについて図4に基づき説明する。図4は本実施形態に係る学習処理プログラムのフローチャートである。ここで、学習処理プログラムは、前回の処理を実行した後から一定期間経過後に実行され、教師画像DB12に格納された画像を用いてナビゲーション装置3に表示される画像に生じるブロックノイズ検出の為の学習モデルの学習を行い、より最適な学習モデルを生成するプログラムである。また、以下の図4にフローチャートで示されるプログラムは、制御部11が備えているRAM22、ROM23等に記憶されており、CPU21により実行される。
先ず、学習処理プログラムでは、ステップ(以下、Sと略記する)1において、CPU21は教師画像DB12から学習モデルの学習に用いる学習用画像25を抽出する。尚、学習用画像25は、ナビゲーション装置3において表示対象となる画像(例えば地図画像、移動案内画像、施設案内画像等)であり、過去にナビゲーション装置3において実際に表示された画像でも良いし、学習用に疑似的に生成した画像であっても良い。過去にナビゲーション装置3において実際に表示された画像を収集する手段としては、例えば液晶ディスプレイ35の表示画像を撮像し、撮像画像から正常画像のみを目視で抽出することにより行う。また、学習の過程で後述のように二次テスト用画像27の一部が学習用画像25として追加される場合もある(S13)。前記S1で抽出される学習用画像25は基本的にブロックノイズが生じていない正常画像のみであり、枚数は約9万枚とする。
尚、前記S1で抽出された約9万枚の学習用画像25の中には、全く同一或いはごく一部のみが異なる実質的に同一な複数の画像(以下、重複画像)が多く含まれる。このような複数の重複画像の全てを対象として学習を行ったとしても、複数の重複画像の内から選択した一の重複画像のみを対象として学習を行った場合であっても学習効果に大きな差はない。従って、処理負担を軽減するために図5に示すように重複画像については一のみを残して他の重複画像は以降の処理対象から除外する(S2)。特にS2においてCPU21は、ハッシュ関数を用いて前記S1で抽出された約9万枚の学習用画像25の内から上記重複画像の探索を行う。尚、ハッシュ関数を用いた探索以外の手段によって重複画像を判定しても良い。前記S2の処理を行った結果、以降の処理で処理対象となる学習用画像25の枚数は約4.5万枚まで削減される。
続いて、S3においてCPU21は、ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像(以下、疑似ブロックノイズ画像という)を生成する。ここで、図6は前記S3で生成される疑似ブロックノイズ画像61の一例を示した図である。疑似ブロックノイズ画像61のサイズは学習用画像25と同サイズとする。また、ノイズ領域は一又は複数の正方形のブロック形状が連なった領域となるが、画像内においてノイズ領域となるブロック形状のサイズや位置はランダムに設定される。例えば以下の方法により設定する。
(1)周波数をランダムに取得し、sin波とcos波の合成波を生成する。
(2)画像の縦方向に対してブロックサイズ単位のステップで合成波からサンプリング値をサンプリングする。
(3)画像の横方向に対しても上記(1)及び(2)の処理を行う。
(4)縦方向と横方向に夫々サンプリングされたサンプリング値について、閾値を基準に白(255)と黒(0)のいずれかに区分する。黒に設定された領域がノイズ領域となる。
また、前記S3においてCPU21は、前記S1で教師画像DB12から抽出され、前記S2で重複画像を除外した後の学習用画像25の数に対応する数(例えば約4.5万枚)だけ疑似ブロックノイズ画像61を生成する。生成される複数の疑似ブロックノイズ画像61毎に、ノイズ領域となるブロック形状のサイズや位置は上記(1)~(4)の手段を用いてランダムに設定される。
その後、S4においてCPU21は、前記S3で生成された疑似ブロックノイズ画像について、複数の疑似ブロックノイズ画像61毎にノイズ領域の色をランダムに設定する。例えば、HSV色空間から色をランダムに選択し、選択した色にノイズ領域の色を変換する。また、ノイズ領域の透過率についても同様にランダムに設定する。尚、ノイズ領域の色や透過率については一の画像内において同一としても良いし、一の画像内でもエリア毎に異なる態様に設定しても良い。
続いて、S5においてCPU21は、前記S1で教師画像DB12から抽出され、前記S2で重複画像を除外した後の学習用画像25に対して、図7に示すように前記S3で生成された疑似ブロックノイズ画像61を重畳して合成する。更に、S6においてCPU21は、重畳した画像をグレースケール変換する。その結果、図7に示すように正常画像である学習用画像25に対して擬似的にブロックノイズを生じさせた疑似異常画像62が生成される。尚、疑似異常画像62に生じているブロックノイズの位置、形状、透過率、色(グレースケールの色)については画像毎に上記S3及びS4の処理によりランダムに設定されることとなる。また、処理対象となる学習用画像25の枚数が約4.5万枚であれば、疑似異常画像62も約4.5万枚生成されることとなる。
その後、S7においてCPU21は、前記S6で生成された疑似ブロックノイズ画像(即ち擬似的にブロックノイズを生じさせた異常画像)と教師画像DB12から抽出した学習用画像25(即ち正常画像)を教師画像として、ランダムに学習モデルに入力して学習を行う。尚、学習モデルに入力する正常画像と異常画像の割合は例えば正常画像:異常画像=4:6とする。尚、割合は適宜変更可能であるが、異常画像の検出を漏れなく行う為に、異常画像の割合を多くするのが望ましい。上記学習モデルによる学習は、前記S6で生成された全ての疑似ブロックノイズ画像61の入力が終了するまで行う。また、学習モデルは例えばU-Netモデルを用いる。
前記S7における学習モデルによる学習としては、例えばランダムに入力された画像が“正常画像”又は“異常画像”のいずれに該当するかの予測を行う。そして、学習モデルが予測した結果と、予め用意している画像が正常画像か異常画像であるかの答えと照合させることで学習モデルの学習を行う。尚、学習モデルの学習としては“正常画像”又は“異常画像”の予測に加えて、画像内のどの領域にブロックノイズが生じているかを予測させ、学習モデルが予測した結果と、予め用意しているブロックノイズが生じている領域の答えと照合させることで学習モデルの学習を行うようにしても良い。
その後、S8においてCPU21は、生成された全ての疑似ブロックノイズ画像61を対象として学習モデルの学習を行った後に、学習モデルの学習結果を評価する為に教師画像DB12に格納された一次テスト用画像26を用いて評価値mIoUを算出する。具体的には、学習後の学習モデルに対して一次テスト用画像26を入力し、一次テスト用画像26においてブロックノイズが生じている領域を予測させる。そして、学習モデルが予測した結果と、予め用意しているブロックノイズが生じている領域の答えと照合させ、評価値mIoUを算出する。尚、評価値mIoUは予測結果と正解が完全に一致していれば1.0となり、ずれが大きくなる程0に近い値が算出される。例えばピクセル単位で混同行列を用いることによって評価値mIoUを算出する。
尚、一次テスト用画像26は、過去にナビゲーション装置3において実際に表示された画像を用い、ブロックノイズが生じていない正常画像と、ブロックノイズが生じている異常画像を夫々含むようにする。一次テスト用画像26の枚数は約2万枚とするが、2万枚の一次テスト用画像26に対して夫々算出された評価値mIoUの平均値を、今回の学習モデルの最終的な評価値mIoUとする。但し、平均値ではなく中央値や最頻値としても良い。
その後、CPU21は上記S1~S8の処理を所定回数(例えば100回)繰り返し行う。処理を繰り返す度に前記S3で生成される疑似ブロックノイズ画像61のノイズ領域の位置、形状、色、透過率がランダムに変化する、即ち学習モデルで学習対象とする教師画像が変わるので、学習モデルの学習結果を評価する評価値mIoUも繰り返す度に変わることとなる。
次に、S9においてCPU21は、所定回数繰り返し行った学習において、前記S8で算出された評価値mIoUが最も高い値となった学習モデル(以下、ベスト学習モデルという)を選択する。そして、選択されたベスト学習モデルの学習結果を改めて評価する為に、ベスト学習モデルに対して教師画像DB12に格納された二次テスト用画像27を入力し、入力された二次テスト用画像27においてブロックノイズが生じていると予測された領域(以下、ブロックノイズ領域という)の面積値を算出する。
尚、二次テスト用画像27は、一次テスト用画像26と同様に過去にナビゲーション装置3において実際に表示された画像を用い、ブロックノイズが生じていない正常画像と、ブロックノイズが生じている異常画像を夫々含むようにする。二次テスト用画像27の枚数は約79万枚とし、79万枚の二次テスト用画像27に対して夫々ブロックノイズ領域の面積値を算出する。
続いて、S10においてCPU21は、入力された二次テスト用画像27が正常画像である場合と異常画像である場合とに分けて、前記S9で算出されたブロックノイズ領域の面積値の分布(ヒストグラム)を生成する。例えば図8は前記S10において生成されるブロックノイズ領域の面積値の分布の一例を示した図である。図8に示すように前記S10において生成されるブロックノイズ領域の面積値の分布は、横軸を面積値、縦軸を度数とし、算出された面積値を所定範囲毎に区分してその範囲に含まれる度数を示すヒストグラムとする。
基本的に入力された二次テスト用画像27が正常画像である場合のブロックノイズ領域の面積値の分布は、0付近に度数が集中することとなる。一方、入力された二次テスト用画像27が異常画像である場合のブロックノイズ領域の面積値の分布は、ある程度分散して度数が分布することとなる。
次に、S11においてCPU21は、異常画像を異常画像と判断する再現率(Recall)が100%となること、即ち異常画像に対する見逃しが無いことを第1の条件とし、且つ適合率(Precision、精度ともいう)が最も高くなることを第2の条件として閾値を算出する。本実施形態において学習モデルが学習するのは、ナビゲーション装置3において生成された画像データを画面上に表示する前に該画像データが異常画像(表示した際にブロックノイズが生じる画像)に該当するかを判定する為の学習である。そして、学習モデルはブロックノイズが生じると予測されるブロックノイズ領域の面積値が閾値以上である場合に異常画像であると判定することとし、S11ではその閾値について学習によって最適値を算出する。
ここで、閾値の算出において重要なのはナビゲーション装置3に反映した際に異常画像の見逃しが無いこと、即ち異常画像を正常画像と判定しないことである。また、適合率、即ちナビゲーション装置3が異常画像と判定した画像が実際に異常画像である割合はできる限り高くするのが望ましい。従って、図8に示すように生成されたブロックノイズ領域の面積値の分布において、入力された二次テスト用画像27が異常画像である場合の度数が存在する最も低い面積値を閾値とする。
また、前記S11においてCPU21は、設定された閾値における適合率を算出する。ここで、適合率は上述したようにナビゲーション装置3に反映した際に異常画像と判定した画像が実際に異常画像である割合(正解率)である。前記S10で生成されたブロックノイズ領域の面積値の分布において、閾値以上の面積値において正常画像と異常画像を合わせた度数に対する異常画像の度数の割合が適合率となる。即ち、閾値以上の面積値において正常画像の度数が存在しなければ適合率は理想値である100%となるが、100%の到達は困難である為、後述のように目標値として例えば99%を設定する。
その後、S12においてCPU21は、前記S11で設定された閾値をナビゲーション装置3に反映した際の再現率(Recall)と適合率(Precision)の値が目標値に到達するか否かを判定する。尚、再現率の目標値は100%とし、適合率の目標値は99%とする。但し、目標値は適宜変更可能である。例えば適合率の目標値を98%や97%としても良い。また、本実施形態では上述のように再現率が100%であることを条件に閾値を設定するので、前記S12では再現率については必ず目標値に到達すると判定されることとなるが、例えば適合率が99%であることを条件に閾値を設定し、S12では再現率が目標値に到達するか否かの判定を行っても良い。
そして、前記S11で設定された閾値をナビゲーション装置3に反映した際の再現率(Recall)と適合率(Precision)の値が目標値に到達すると判定された場合(S12:YES)には、S14へと移行する。それに対して、前記S11で設定された閾値をナビゲーション装置3に反映した際の再現率(Recall)と適合率(Precision)の値が目標値に到達しないと判定された場合(S12:NO)には、S13へと移行する。
S13においてCPU21は、適合率を向上させる為に、現在の学習モデルではブロックノイズ領域の予測を正しく行うことができなかった正常画像、即ち前記S10で生成されたブロックノイズ領域の面積値の分布において、ブロックノイズ領域の面積値が閾値以上となっている正常画像について学習対象として追加する。具体的には図9に示すようにブロックノイズ領域の面積値の分布において、閾値以上の面積値となる正常画像を学習用画像25に追加する。即ち、二次テスト用画像27の一部が学習用画像25に新たに追加されることとなる。
その後、S1へと戻りCPU21は新たに画像の追加された学習用画像25に基づいて学習モデルの学習を行う。ブロックノイズ領域の予測を正しくできなかった正常画像を学習対象として追加することにより、その後に新たな学習を行った学習モデルでは適合率(Precision)の向上が期待できる。
一方、S14においてCPU21は、前記S11で設定された閾値を含むベスト学習モデルを学習結果としてナビゲーション装置3へと組み込む。尚、ベスト学習モデルの組み込みは、例えば通信や記憶媒体を介して必要な情報をナビゲーション装置3へと取得させることにより行う。その結果、ナビゲーション装置3は組み込んだベスト学習モデルを用いて後述のように表示する画像のブロックノイズの発生を低減させる処理が可能となる。
続いて、本実施形態に係るナビゲーション装置3においてCPU51やGPU55が実行する画像表示処理プログラムについて図10に基づき説明する。図10は本実施形態に係る画像表示処理プログラムのフローチャートである。ここで、画像表示処理プログラムは、車両のACC電源(accessory power supply)がONされた後に実行され、前述の学習処理プログラム(図4参照)において学習装置1により学習した学習モデルを組み込むことによって、表示する画像のブロックノイズの発生を低減させるプログラムである。また、以下の図10にフローチャートで示されるプログラムは、ナビゲーションECU33が備えているRAM52、ROM53等に記憶されており、CPU51又はGPU55により実行される。
先ず、画像表示処理プログラムでは、S21においてCPU51はナビゲーション装置3において表示対象とする画像の画像データを生成する。尚、ナビゲーション装置3において表示対象とする画像は現在のナビゲーション装置3の状況によって異なるが、基本的には車両の現在位置周辺の地図画像を表示する。また、車両の移動案内の実行中であって案内交差点に接近した場合には、交差点拡大図等についても表示する。また、ユーザによって施設検索が行われた場合には検索された施設のリストや施設情報等についても表示する。
続いて、S22においてCPU51は、学習情報DB46に格納された学習モデルを用いて、前記S21で生成された画像データについて液晶ディスプレイ35に表示する前にブロックノイズの検出を行う。具体的には、CPU51は学習モデルを用いてブロックノイズが生じると予測されるエリアの面積値を特定し、面積値が閾値以上の場合に画像データにブロックノイズが生じると判定する。尚、閾値については前述の学習処理プログラム(図4参照)において最適値が算出されている(S11)。
その後、S23においてCPU51は、前記S22の検出結果に基づいて前記S21で生成された画像データにブロックノイズが生じると判定されたか否かを判定し、ブロックノイズが生じると判定された場合(S23:YES)には、S24へと移行する。
S24においてCPU51は、生成された画像データに異常が有ると推定し、画像データを再度生成する処理を行う。その後、S22へと移行し、再生成した画像データについて改めてブロックノイズの検出を行う。
一方、前記S21で生成された画像データにブロックノイズが生じないと判定された場合(S23:NO)には、S25へと移行する。S25では生成された画像データを一旦RAM52やVRAM56等のメモリに格納する。
その後、GPU55はメモリに格納された画像データを液晶ディスプレイ35に描画する描画処理を行う。その結果、液晶ディスプレイ35に表示される画像にブロックノイズが生じることを防止することが可能となる。尚、画像の描画処理についてはCPU51が行っても良い。
以上詳細に説明した通り、本実施形態に係る学習装置1及び学習装置1で実行されるコンピュータプログラムでは、ブロックノイズの生じていない学習用正常画像を取得するとともに(S1)、ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像である疑似ブロックノイズ画像を生成し(S3)、学習用正常画像に対して疑似ブロックノイズ画像を重畳して合成することによって、学習用正常画像に対して擬似的にブロックノイズを生じさせた疑似異常画像を、ブロックノイズを検出する為の学習モデルの学習に用いる教師データとして生成し(S6)、生成された教師データを用いて学習モデルの学習を行う(S1~S13)ので、従来と比べて教師データの取得が容易となる。その結果、画像表示装置(例えばナビゲーション装置、スマートフォン、タブレット端末、パーソナルコンピュータ)に表示する画像の品質を向上させるという点において広く適用可能な学習モデルを構築することが可能となる。
尚、本発明は前記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内で種々の改良、変形が可能であることは勿論である。
例えば、上記実施形態では、学習モデルの学習結果を評価する手段として再現率(Recall)と適合率(Precision)を用いているが、他の評価手段によって学習結果を評価するようにしても良い。
また、本実施形態ではブロックノイズの画像である疑似ブロックノイズ画像61を生成する際に、ノイズ領域とするブロック形状のサイズ、位置、ノイズ領域の色及び透過率の各パラメータを夫々ランダムに変化させているが、各パラメータの一部(例えばノイズ領域とするブロック形状のサイズと位置)のみをランダムに設定しても良い。また、学習装置1の操作を行う操作者においてパラメータを設定可能にしても良い。
また、本実施形態では学習用画像25に対して擬似的にブロックノイズを生じさせた疑似異常画像をグレースケール変換しているが、グレースケール変換については行わないようにしても良い。
また、上記実施形態では学習処理プログラム(図4)は学習装置1が実施しているが、ナビゲーション装置3が実施するようにしても良い。その場合には、学習機能を有するナビゲーション装置3が本発明に係る学習装置に該当する。
また、上記実施形態では表示画像のブロックノイズの低減を図る対象として車載器であるナビゲーション装置3を例に挙げて説明しているが、画像を表示する手段を備える装置であればナビゲーション装置以外であっても良い。例えば、スマートフォン、タブレット端末、パーソナルコンピュータ等をナビゲーション装置3の代わりとしても良い。
また、本発明に係るブロックノイズ検出の為の学習装置を具体化した実施例について上記に説明したが、ブロックノイズ検出の為の学習装置は以下の構成を有することも可能であり、その場合には以下の効果を奏する。
例えば、第1の構成は以下のとおりである。
ブロックノイズの生じていない学習用正常画像(25)を取得する正常画像取得手段(21)と、ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像である疑似ブロックノイズ画像(61)を生成する疑似ブロックノイズ画像生成手段(21)と、前記学習用正常画像に対して前記疑似ブロックノイズ画像を重畳して合成することによって、前記学習用正常画像に対して擬似的にブロックノイズを生じさせた疑似異常画像(62)を、ブロックノイズを検出する為の学習モデルの学習に用いる教師データとして生成する教師データ生成手段(21)と、を有する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、正常画像に対して疑似的にブロックノイズを生じさせた画像を生成して教師データとして用い、ブロックノイズを検出する為の学習を行うので、従来と比べて教師データの取得が容易となる。その結果、画像表示装置に表示する画像の品質を向上させるという点において広く適用可能な学習モデルを構築することが可能となる。
また、第2の構成は以下のとおりである。
前記疑似ブロックノイズ画像生成手段(21)は、ノイズ領域とするブロック形状のサイズ、位置、ノイズ領域の色及び透過率を夫々設定して前記疑似ブロックノイズ画像(61)を生成する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、擬似的にブロックノイズを生じさせた疑似異常画像を生成する場合であっても、実際にブロックノイズが生じている異常画像を再現して教師データとして用いることが可能となる。
また、第3の構成は以下のとおりである。
前記疑似ブロックノイズ画像生成手段(21)は、ノイズ領域とするブロック形状のサイズ、位置、ノイズ領域の色及び透過率の少なくとも一をパラメータとしてランダムに変化させて複数の前記疑似ブロックノイズ画像(61)を生成し、前記教師データ生成手段(21)は、複数の前記疑似ブロックノイズ画像(61)を前記学習用正常画像(25)に対して重畳して合成した複数の前記疑似異常画像(62)を生成し、複数の前記疑似異常画像を教師データとして用いて前記学習モデルの学習を行う。
上記構成を有するブロックノイズ検出の為の学習装置によれば、擬似的にブロックノイズを生じさせた疑似異常画像を生成する場合に、パラメータをランダムに変えて様々なブロックノイズのパターンに基づく複数の疑似異常画像を生成し、生成した複数の疑似異常画像を教師データとして用いることによって、実際に生じ得る多様なブロックノイズを想定した高い学習効果について期待できる。
また、第4の構成は以下のとおりである。
教師データとして用いる前記疑似異常画像(62)を変えて前記学習モデルの学習を複数回行い、複数回の学習毎に前記学習モデルの学習結果を評価する学習結果評価手段(21)と、最も評価の高い学習結果を示した前記学習モデルを採用する学習モデル採用手段(21)と、を有する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、教師データとする疑似異常画像を変化させて複数回の学習を行わせるとともに、最も評価の高い学習後の学習モデルを採用するので、仮に擬似的にブロックノイズを生じさせた疑似異常画像に実際には存在し得ない不自然な異常画像が含まれていたとしても、それらを教師データとして学習した学習モデルについては排除でき、より実際の異常画像に近い疑似異常画像を教師データとして学習した学習モデルを採用することが可能となる。
また、第5の構成は以下のとおりである。
前記学習結果評価手段(21)は、複数回の学習毎に学習された学習モデルを用いて、ブロックノイズが生じているテスト用異常画像を含む第1のテスト用画像(26)に対してブロックノイズが生じているエリアの予測判断を行わせ、ブロックノイズが生じていると予測されたエリアと実際にブロックノイズが生じているエリアとの一致の度合いを評価する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、ブロックノイズが生じているエリアの予測判断によって学習結果の評価を行うので、ブロックノイズを検出する為の学習評価の高い学習モデルを採用することが可能となる。
また、第6の構成は以下のとおりである。
前記学習モデル採用手段(21)により採用された前記学習モデルを用いて、ブロックノイズの生じていないテスト用正常画像とブロックノイズが生じているテスト用異常画像とを含む第2のテスト用画像(27)群に対してブロックノイズが生じているエリアの予測を行わせるエリア予測手段(21)と、前記エリア予測手段によりブロックノイズが生じていると予測されたエリアの面積分布を、前記テスト用正常画像と前記テスト用異常画像とに分けて生成する面積分布生成手段(21)と、前記面積分布に基づいて前記学習モデル採用手段により採用された前記学習モデルを再評価する学習モデル再評価手段(21)と、を有する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、ブロックノイズの生じていないテスト用正常画像とブロックノイズが生じているテスト用異常画像に対して夫々ブロックノイズが生じているエリアの予測判断を行い、ブロックノイズが生じていると予測されたエリアの面積分布に基づいて学習結果の評価を行うので、ブロックノイズの生じていない正常画像を正常画像と検出し、ブロックノイズの生じている異常画像を異常画像と検出することを評価対象とした学習モデルの評価が可能となる。
また、第7の構成は以下のとおりである。
前記学習モデル再評価手段(21)は、再現率と適合率が予め設定された目標値に到達したか否かによって評価を行い、再現率と適合率が目標値に到達していない場合には、再度、学習モデルの学習を行う再学習手段(21)を有する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、特に再現率と適合率が予め設定された目標値に到達した学習モデルを採用可能となる一方で、再現率と適合率が予め設定された目標値に到達しない学習モデルについては再学習を行うことによって、再現率と適合率を向上させることが可能となる。
また、第8の構成は以下のとおりである。
前記再学習手段(21)は、前記第2のテスト用画像(27)群に含まれるテスト用正常画像の内、前記学習モデルによってブロックノイズのエリアの予測が正しくできなかったテスト用正常画像を前記学習用正常画像(25)に追加し、再度、学習モデルの学習を行う。
上記構成を有するブロックノイズ検出の為の学習装置によれば、再現率と適合率が予め設定された目標値に到達しない学習モデルについては、ブロックノイズのエリアの予測が正しくできなかったテスト用正常画像を学習対象に追加して再学習を行うことによって、再現率と適合率を向上させることが可能となる。
また、第9の構成は以下のとおりである。
画像表示装置(35)に表示する為の画像データを生成する画像データ生成手段(51)と、前記画像データ生成手段により生成された前記画像データに基づく画像の表示を行う前に、前記画像データに対して前記教師データに基づいて学習された学習モデルを用いてブロックノイズの検出を行うブロックノイズ検出手段(51)と、前記ブロックノイズ検出手段によって前記ブロックノイズが生じると検出された画像データに対してブロックノイズを低減させるための処理を行うブロックノイズ低減手段(51)と、を有する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、学習された学習モデルを用いることによって、画像表示装置に表示する前の画像データに対して予めブロックノイズを生じさせる画像データか否かを検出することが可能となる。そして、ブロックノイズが生じると検出された画像データに対してブロックノイズを低減させるための処理を行うことによって、ブロックノイズが生じた画像が画像表示装置に表示されることを防止できる。
また、第10の構成は以下のとおりである。
前記ブロックノイズ検出手段(51)は、前記画像データにおいてブロックノイズが生じるエリアを予測するとともに、ブロックノイズが生じると予測されたエリアの面積値が閾値以上の場合に、前記画像データに前記ブロックノイズが生じると検出する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、学習された学習モデルを用いて画像表示装置に表示する前の画像データに対してブロックノイズが生じるエリアを予測することによって、画像表示装置に表示する前の画像データがブロックノイズを生じさせる画像データか否かを正確に検出することが可能となる。
1 学習装置
2 学習システム
3 ナビゲーション装置
12 教師画像DB
21 CPU
22 RAM
23 ROM
25 学習用画像
26 一次テスト用画像
27 二次テスト用画像
33 ナビゲーションECU
35 液晶ディスプレイ
51 CPU
55 GPU
61 疑似ブロックノイズ画像
62 疑似異常画像

Claims (10)

  1. ブロックノイズの生じていない学習用正常画像を取得する正常画像取得手段と、
    ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像である疑似ブロックノイズ画像を生成する疑似ブロックノイズ画像生成手段と、
    前記学習用正常画像に対して前記疑似ブロックノイズ画像を重畳して合成することによって、前記学習用正常画像に対して擬似的にブロックノイズを生じさせた疑似異常画像を、ブロックノイズを検出する為の学習モデルの学習に用いる教師データとして生成する教師データ生成手段と、を有し、
    前記疑似ブロックノイズ画像生成手段は、ノイズ領域とするブロック形状のサイズ、位置、ノイズ領域の色及び透過率を夫々設定して前記疑似ブロックノイズ画像を生成する学習装置。
  2. 前記疑似ブロックノイズ画像生成手段は、ノイズ領域とするブロック形状のサイズ、位置、ノイズ領域の色及び透過率の少なくとも一をパラメータとしてランダムに変化させて複数の前記疑似ブロックノイズ画像を生成し、
    前記教師データ生成手段は、複数の前記疑似ブロックノイズ画像を前記学習用正常画像に対して重畳して合成した複数の前記疑似異常画像を生成し、
    複数の前記疑似異常画像を教師データとして用いて前記学習モデルの学習を行う請求項に記載の学習装置。
  3. 教師データとして用いる前記疑似異常画像を変えて前記学習モデルの学習を複数回行い、
    複数回の学習毎に前記学習モデルの学習結果を評価する学習結果評価手段と、
    最も評価の高い学習結果を示した前記学習モデルを採用する学習モデル採用手段と、を有する請求項1又は請求項2に記載の学習装置。
  4. 前記学習結果評価手段は、
    複数回の学習毎に学習された学習モデルを用いて、ブロックノイズが生じているテ
    スト用異常画像を含む第1のテスト用画像に対してブロックノイズが生じているエリアの予測判断を行わせ、
    ブロックノイズが生じていると予測されたエリアと実際にブロックノイズが生じているエリアとの一致の度合いを評価する請求項に記載の学習装置。
  5. 前記学習モデル採用手段により採用された前記学習モデルを用いて、ブロックノイズの生じていないテスト用正常画像とブロックノイズが生じているテスト用異常画像とを含む第2のテスト用画像群に対してブロックノイズが生じているエリアの予測を行わせるエリア予測手段と、
    前記エリア予測手段によりブロックノイズが生じていると予測されたエリアの面積分布を、前記テスト用正常画像と前記テスト用異常画像とに分けて生成する面積分布生成手段と、
    前記面積分布に基づいて前記学習モデル採用手段により採用された前記学習モデルを再評価する学習モデル再評価手段と、を有する請求項又は請求項に記載の学習装置。
  6. 前記学習モデル再評価手段は、再現率と適合率が予め設定された目標値に到達したか否かによって評価を行い、
    再現率と適合率が目標値に到達していない場合には、再度、学習モデルの学習を行う再学習手段を有する請求項に記載の学習装置。
  7. 前記再学習手段は、前記第2のテスト用画像群に含まれるテスト用正常画像の内、前記学習モデルによってブロックノイズのエリアの予測が正しくできなかったテスト用正常画像を前記学習用正常画像に追加し、再度、学習モデルの学習を行う請求項に記載の学習装置。
  8. 画像表示装置に表示する為の画像データを生成する画像データ生成手段と、
    前記画像データ生成手段により生成された前記画像データに基づく画像の表示を行う前に、前記画像データに対して前記教師データに基づいて学習された学習モデルを用いてブロックノイズの検出を行うブロックノイズ検出手段と、
    前記ブロックノイズ検出手段によって前記ブロックノイズが生じると検出された画像データに対してブロックノイズを低減させるための処理を行うブロックノイズ低減手段と、を有する請求項1乃至請求項のいずれかに記載の学習装置。
  9. 前記ブロックノイズ検出手段は、前記画像データにおいてブロックノイズが生じるエリアを予測するとともに、ブロックノイズが生じると予測されたエリアの面積値が閾値以上の場合に、前記画像データに前記ブロックノイズが生じると検出する請求項に記載の学習装置。
  10. コンピュータを、
    ブロックノイズの生じていない学習用正常画像を取得する正常画像取得手段と、
    ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像である疑似ブロックノイズ画像を生成する疑似ブロックノイズ画像生成手段と、
    前記学習用正常画像に対して前記疑似ブロックノイズ画像を重畳して合成することによって、前記学習用正常画像に対して擬似的にブロックノイズを生じさせた疑似異常画像を、ブロックノイズを検出する為の学習モデルの学習に用いる教師データとして生成する教師データ生成手段と、
    して機能させる為のコンピュータプログラムであって、
    前記疑似ブロックノイズ画像生成手段は、ノイズ領域とするブロック形状のサイズ、位置、ノイズ領域の色及び透過率を夫々設定して前記疑似ブロックノイズ画像を生成するコンピュータプログラム
JP2020050353A 2020-03-20 2020-03-20 ブロックノイズ検出の為の学習装置及びコンピュータプログラム Active JP7452149B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020050353A JP7452149B2 (ja) 2020-03-20 2020-03-20 ブロックノイズ検出の為の学習装置及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020050353A JP7452149B2 (ja) 2020-03-20 2020-03-20 ブロックノイズ検出の為の学習装置及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2021149719A JP2021149719A (ja) 2021-09-27
JP7452149B2 true JP7452149B2 (ja) 2024-03-19

Family

ID=77849137

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020050353A Active JP7452149B2 (ja) 2020-03-20 2020-03-20 ブロックノイズ検出の為の学習装置及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP7452149B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7339394B1 (ja) 2022-05-20 2023-09-05 株式会社日立ハイテクフィールディング 情報処理装置、情報処理方法、およびプロブラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009518A (ja) 2008-06-30 2010-01-14 Canon Inc パターン検出器の学習装置、学習方法及びプログラム
JP2010152751A (ja) 2008-12-25 2010-07-08 Nec Corp 統計モデル学習装置、統計モデル学習方法、およびプログラム
JP2011217010A (ja) 2010-03-31 2011-10-27 Sony Corp 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体
JP2014135014A (ja) 2013-01-11 2014-07-24 Fuji Xerox Co Ltd 画像識別装置及びプログラム
JP2016057918A (ja) 2014-09-10 2016-04-21 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
WO2018105195A1 (ja) 2016-12-07 2018-06-14 三菱電機株式会社 映像障害検知装置、映像障害検知方法、及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009518A (ja) 2008-06-30 2010-01-14 Canon Inc パターン検出器の学習装置、学習方法及びプログラム
JP2010152751A (ja) 2008-12-25 2010-07-08 Nec Corp 統計モデル学習装置、統計モデル学習方法、およびプログラム
JP2011217010A (ja) 2010-03-31 2011-10-27 Sony Corp 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体
JP2014135014A (ja) 2013-01-11 2014-07-24 Fuji Xerox Co Ltd 画像識別装置及びプログラム
JP2016057918A (ja) 2014-09-10 2016-04-21 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
WO2018105195A1 (ja) 2016-12-07 2018-06-14 三菱電機株式会社 映像障害検知装置、映像障害検知方法、及びプログラム

Also Published As

Publication number Publication date
JP2021149719A (ja) 2021-09-27

Similar Documents

Publication Publication Date Title
Li et al. Lane changing intention recognition based on speech recognition models
CN110458165B (zh) 一种引入注意力机制的自然场景文本检测方法
JP5911165B2 (ja) 画像認識装置
JP2022526513A (ja) ビデオフレームの情報ラベリング方法、装置、機器及びコンピュータプログラム
JP5509712B2 (ja) 運転支援システム、運転支援装置、運転支援方法、及び運転支援プログラム
KR20190128724A (ko) 타겟 인식 방법, 장치, 저장 매체 및 전자 기기
Roy et al. Multi-modality sensing and data fusion for multi-vehicle detection
US12005922B2 (en) Toward simulation of driver behavior in driving automation
US11330384B2 (en) Artificial intelligence device for diagnosing failure and method thereof
US11587314B2 (en) Intelligent correction of vision deficiency
CN111044045A (zh) 基于神经网络的导航方法、装置及终端设备
CN105607288A (zh) 基于声波探测辅助的智能眼镜全方位车辆零部件完整性检测方法
JP7452149B2 (ja) ブロックノイズ検出の為の学習装置及びコンピュータプログラム
WO2021130888A1 (ja) 学習装置、推定装置および学習方法
CN111323033A (zh) 路径引导装置及其控制方法、信息处理服务器、以及路径引导***
CN115205335A (zh) 行人轨迹预测方法、装置和电子设备
Lee et al. Linking the detection response task and the attend algorithm through assessment of human–machine interface workload
CN107992873A (zh) 目标检测方法及装置、存储介质、电子设备
KR102014288B1 (ko) 드론을 이용한 인공지능 기반 개발압력 예측방법
WO2005098760A1 (ja) 描画方法、描画プログラム、および描画装置
JP6681965B2 (ja) 自律走行のための学習対象イメージ抽出装置及び方法
EP3691297A1 (en) Test arrangement and test method
CN115830638A (zh) 基于注意力机制的小尺寸人头检测方法及相关设备
US20240083441A1 (en) Driving evaluation system, learning device, evaluation result output device, method, and program
Castorena et al. A safety-oriented framework for sound event detection in driving scenarios

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20210423

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231017

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240219

R150 Certificate of patent or registration of utility model

Ref document number: 7452149

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150