JP7481173B2 - 情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
JP7481173B2
JP7481173B2 JP2020109666A JP2020109666A JP7481173B2 JP 7481173 B2 JP7481173 B2 JP 7481173B2 JP 2020109666 A JP2020109666 A JP 2020109666A JP 2020109666 A JP2020109666 A JP 2020109666A JP 7481173 B2 JP7481173 B2 JP 7481173B2
Authority
JP
Japan
Prior art keywords
image
trained model
images
information processing
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020109666A
Other languages
English (en)
Other versions
JP2022007021A (ja
Inventor
文一 安藤
侑心 豊暉原
譲 兼森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NS Solutions Corp
Nippon Steel Stainless Steel Corp
Original Assignee
NS Solutions Corp
Nippon Steel Stainless Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NS Solutions Corp, Nippon Steel Stainless Steel Corp filed Critical NS Solutions Corp
Priority to JP2020109666A priority Critical patent/JP7481173B2/ja
Publication of JP2022007021A publication Critical patent/JP2022007021A/ja
Application granted granted Critical
Publication of JP7481173B2 publication Critical patent/JP7481173B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、情報処理装置、情報処理方法、及びプログラムに関する。
近年、人工知能(AI:Artificial Intelligence)を利用した画像認識が行われている。例えば、写真に写っている動物が何であるのか画像認識により判定することができるが、この判定を行わせるためには、認識対象となる物の特徴をあらわす特徴量を使ってコンピュータ等の情報処理装置に予め学習させておく必要がある。そして、この学習に用いる教師データ(ラベル付きの学習データ)の量がAIによる画像認識の認識精度に大きく影響を及ぼす。
しかし、十分な学習を行うためのデータを用意することが困難な場合もあり、不十分な学習状況のもと画像認識を行うと、認識精度が低下して適切な結果が得られないこともある。また、未学習のものや認識対象外のものについては、学習済みの結果から一番近いものを選ぶ動作をするため、未学習や認識対象外の画像を正しく判定させることは非常に困難である。
特許文献1には、顔判別に係る教師データを作成する技術が開示されている。特許文献1には、対象画像中の種々の方向を向いた顔を判別器を用いて検出することが記載されており、検出対象画像上で順次切り出した部分画像に対して左右反転処理や90度単位の回転処理を施すことにより、部分画像の反転/回転画像を生成し、これらの画像に対して所定の種類の判別器を用いて当該画像が所定の顔の向きおよび天地方向にある顔であるか否かを判別する。
特開2006-350704号公報
しかしながら、特許文献1に記載の技術では、部分画像の反転や回転により教師データとなる画像を生成しており、反転処理や回転処理により得られる画像には限りがあるため必ずしも十分な量の教師データが得られるものではない。本発明は、このような事情に鑑みてなされたものであり、より多くの教師データを作成し、画像認識の認識精度を高めることを目的とする。
本発明に係る情報処理装置は、画像認識による型式の判定処理に用いる学習済みモデルを生成する情報処理装置であって、対象となる被写体を含む複数の第1の画像を取得する画像取得手段と、取得された前記第1の画像のそれぞれに対して、前記第1の画像に含まれる前記被写体に係る複数の要素についてのラベルを付与するラベル付与手段と、前記ラベルが付与された前記第1の画像に基づいて前記要素毎の前記学習済みモデルを生成するモデル生成手段と、生成された前記要素毎の前記学習済みモデルに基づいて前記型式の判定処理を行う被写体を含む第2の画像の各要素を判定し、前記各要素の判定結果の組み合わせと、前記型式との対応を示す判定情報を用いて、各要素の判定結果の組み合わせに対応する前記型式を判定する判定手段とを有することを特徴とする。
本発明によれば、より多くの教師データを作成でき、画像認識の認識精度を高めることが可能となる。
本実施形態における情報処理装置のハードウェア構成の例を示す図である。 本実施形態における情報処理装置の機能構成の例を示す図である。 処理対象の一例を説明する図である。 本実施形態における判定情報の例を示す図である。 本実施形態における情報処理装置の動作を説明する図である。 本実施形態における情報処理装置の処理例を示すフローチャートである。 本実施形態における梱包型式判定を説明する図である。 本実施形態における情報処理装置の処理例を示すフローチャートである。
以下、本発明の実施形態を図面に基づいて説明する。
図1は、本発明の一実施形態における情報処理装置100のハードウェア構成の一例を示す図である。情報処理装置100は、例えばパーソナルコンピュータ(PC)、サーバ装置、タブレット端末等の情報処理装置である。情報処理装置100は、CPU101、主記憶装置102、補助記憶装置103、入力I/F104、出力I/F105、及びネットワークI/F106を有する。CPU101、主記憶装置102、補助記憶装置103、入力I/F104、出力I/F105、及びネットワークI/F106は、システムバス107を介して、互いに通信可能に接続されている。
CPU(Central Processing Unit)101は、情報処理装置100を制御する中央演算装置である。主記憶装置102は、CPU101のワークエリアやデータの一時的な記憶場所として機能する記憶装置である。主記憶装置102は、例えばRAM(Random Access Memory)等を用いて実装される。補助記憶装置103は、プログラム、画像データ、各種処理に係る情報等を記憶する記憶装置である。補助記憶装置103は、例えばROM(Read Only Memory)、ハードディスクドライブ(HDD)、ソリッドステートドライブ(SSD)等を用いて実装される。
入力I/F104は、マウス、キーボード、タッチパネルの操作部、撮像装置(カメラ)等の入力装置との接続に利用されるインターフェースである。CPU101は、入力I/F104を介して、入力I/F104に接続された入力装置からの入力を受け付ける。出力I/F105は、モニタ、スピーカ、タッチパネルの表示部等の出力装置との接続に利用されるインターフェースである。ネットワークI/F106は、例えばインターネットやLAN(Local Area Network)等のネットワークを介した、外部のサーバや装置等との通信に利用されるインターフェースである。
CPU101が、補助記憶装置103に記憶されたプログラムに基づいて処理を実行することによって、図2に示す情報処理装置100の各機能、及び後述するフローチャートに示す各処理等が実現される。
図2は、本実施形態における情報処理装置100の機能構成の一例を示す図である。情報処理装置100は、画像取得部201、ラベル付与部202、モデル生成部203、判定部204、及び記憶部205を有する。
画像取得部201は、撮像装置等により撮影された対象となる被写体を含む画像を、外部の撮像装置や記憶装置等から取得する。画像取得部201により取得される画像には、学習に用いる画像や判定処理される画像を含む。
ラベル付与部202は、画像取得部201により取得された、学習に用いる画像に対して、画像に含まれる各要素に係るラベルを付与する。ラベル付与部202は、学習に用いる画像に対して付与するラベルの情報の入力を受け付け、入力されるラベルを画像に付与する。ラベル付与部202は、学習に用いる画像の各画像に対して、複数の要素、すなわち複数の項目からなるラベル情報を付与する。以下では、学習に用いる画像について、画像に対するラベル付与の有無に応じて、ラベルが付与されていない画像を「学習データ」とも称し、ラベル付与部202によりラベルが付与された画像を「教師データ」とも称する。
モデル生成部203は、ラベル付与部202によりラベルが付与された、学習に用いる画像である教師データを用いて学習を行い、学習済みモデルを生成する。モデル生成部203は、教師データとなる画像から特徴量を抽出し、抽出した特徴量に基づいて学習し学習済みモデルを生成する。モデル生成部203は、ラベルとして付与された各要素のそれぞれについて、学習済みモデルを生成する。
判定部204は、画像取得部201により取得された、判定対象の画像について、モデル生成部203により生成された学習済みモデルを用いて、各要素に係る判定処理を行う。また、判定部204は、判定処理により得られた各要素の判定結果の組み合わせに基づいて、判定対象の画像に含まれる被写体の種別を判定する。
記憶部205は、画像取得部201により取得された画像(学習データとしての画像や判定処理される画像等)やラベル付与部202によりラベルが付与された画像(教師データ)等を記憶する。また、記憶部205は、モデル生成部203により生成された学習済みモデルや判定部204での被写体の種別の判定に用いる判定情報等を記憶する。
なお、図2に示した例では、画像取得部201、ラベル付与部202、モデル生成部203、判定部204、及び記憶部205を有する情報処理装置100を一例として示したが、これに限定されるものではない。例えば、学習に係る機能部、すなわち学習に用いる画像(学習データ)を取得する画像取得部201、ラベル付与部202、及びモデル生成部203と、判定に係る機能部、すなわち判定部204とは、異なる情報処理装置が有するような構成であってもよい。また、記憶部205が、情報処理装置と接続される外部の記憶装置であってもよい。
図3に示すような「コイル」を梱包材で梱包した「梱包済みコイル」の梱包型式の判定を例に、本実施形態における情報処理装置100の動作について説明する。図3(A)に、コイルの一例を示す。図3(A)に示すように、コイル301は、鋼板等の金属材を巻き取ったものである。なお、コイルは、金属材に限らず、板状の樹脂シートやゴムシートを巻き取ったものなどであってもよい。図3(B)は梱包済みコイルの一例を示す図であり、図3(B)には、図3(A)に示したようなコイルを、梱包紙で覆い、リング部材及び結束バンドを施した例を示している。図3(B)において、311は梱包済みコイルにおける内リング部材(内周梱包部材)であり、312は梱包済みコイルにおける外リング部材(外周梱包部材)であり、313は梱包済みコイルにおける結束バンド(フープ)である。なお、図3(B)に示した梱包済みコイルは一例であり、このような梱包に限定されるものではない。例えば、コイルを、梱包紙、リング部材、及び結束バンドの内の少なくとも1つを用いて梱包したものであってもよい。以下においては、梱包済みコイルにおける結束数、内リング部材、及び外リング部材に基づいて梱包型式の判定を行うものとするが、これは一例であり、梱包型式を判定するための要素は適宜設定することが可能である。
本実施形態における情報処理装置100を梱包型式の判定に適用する場合、図2に示した各機能部は、下記のように動作する。以下の説明において「コイル画像」とは、梱包済みコイルを被写体として含む画像を示すものとする。画像取得部201は、学習データとしてのコイル画像や判定処理される(判定対象の)コイル画像を取得する。ラベル付与部202は、画像取得部201により取得された学習データとしての画像のそれぞれに対して、結束数、内リング部材、及び外リング部材に関するラベル情報を付与する。例えば、ラベル付与部202は、学習データのある画像に対して“結束数:3、内リング部材:A、外リング部材:α”といったラベル情報を付与する。
ここで、結束数は、梱包済みコイルにおける縦方向及び横方向のすべての結束数であってもよいし、縦方向又は横方向の一方向の結束数であってもよい。また、縦方向と横方向の結束数を区別してラベルとして付与するようにしてもよい。内リング部材及び外リング部材については、例えば部材の色を示す情報や部材の有無を示す情報をラベルとして付与する。本実施形態では、ラベル付与部202は、学習データとしての画像のそれぞれに対して、結束数、内リング部材、及び外リング部材に関するラベル情報を付与するものとしたが、これに限らず、他の要素についてのラベル情報を含んでもよい。
モデル生成部203は、ラベル付与部202によりラベルが付与された教師データに基づいて学習機を用いた学習を行って、結束数、内リング部材、及び外リング部材のそれぞれについての学習済みモデルを生成する。モデル生成部203は、教師データとなるコイル画像から特徴量を抽出し、抽出した特徴量に基づいて学習し、結束数、内リング部材、及び外リング部材の各要素についての学習済みモデルを生成する。判定部204は、生成された結束数、内リング部材、及び外リング部材の各学習済みモデルを用いて、画像取得部201により取得された判定対象の画像における各要素(結束数、内リング部材、及び外リング部材)の判定処理を行う。また、判定部204は、図4に示すような判定情報(判定テーブル)に基づいて、判定対象のコイルの梱包型式を判定する。
図4は、コイルの梱包型式を判定する判定情報(判定テーブル)の例を示す図である。図4に一例を示す判定情報(判定テーブル)は、例えば記憶部205に記憶され、判定部204は、記憶された判定情報(判定テーブル)を参照して処理を行う。図4には、結束数が3又は4を判定可能な学習済みモデルを有し、内リング部材がA、B、又はCを判定可能な学習済みモデルを有し、外リング部材がα又はβを判定可能な学習済みモデルを有する場合の判定情報(判定テーブル)を示している。
例えば、判定部204は、結束数が3、内リング部材がA、及び外リング部材がαとの判定結果が得られた場合には、梱包済みコイルの梱包型式が型式1であると判定する。また、例えば、判定部204は、結束数が4、内リング部材がA、及び外リング部材がαとの判定結果が得られた場合には、梱包済みコイルの梱包型式が未知の型式であると判定する。また、判定部204は、結束数が4、内リング部材がBとの判定結果が得られた場合には、外リング部材の判定結果にかかわらず梱包済みコイルの梱包型式が未知の型式であると判定する。なお、図4においては、結束数及び外リング部材についてそれぞれ2種類、内リング部材について3種類の例を示したが、これは一例であり、各要素についての学習済みモデルが判定可能な種類の数に応じた判定情報(判定テーブル)を用意すればよい。
図5を参照して、本実施形態における情報処理装置100において梱包済みコイルの梱包型式を判定する動作について説明する。学習済みモデルを生成する学習フェーズにおいては、撮像装置501により梱包済みコイルを被写体として含む画像を撮影して、撮影されたコイル画像を画像取得部201が学習データ502として取得する。画像取得部201は、学習データ502として複数のコイル画像を取得する。なお、学習データ502としてのコイル画像は、撮像装置501から直接取得するものに限らず、予め撮影され記憶装置等に記憶されたコイル画像を取得するようにしてもよい。
続いて、学習データ502として取得されたコイル画像のそれぞれに対して、ラベル付与部202が各要素(結束数、内リング部材、及び外リング部材)に係るラベルを付与して、ラベルが付与された画像である教師データ503を生成する。このように、本実施形態では、1つの学習データとしての画像に対して、結束数、内リング部材、及び外リング部材の3つのラベルを付与することにより、1つの学習データから3つの教師データを作成することができる。例えば、1つの学習データに対して、M種類のラベルを付与すれば、1つの学習データからM個の教師データを生成することができ、より多くの教師データを得ることが可能となる。
次に、モデル生成部203が、作成された教師データ503を用いて学習機504で学習し、コイル画像に含まれる各要素についての学習済みモデル505を生成する。この生成された学習済みモデル505は、判定処理を行う判定フェーズにおいて、判定部204での判定処理に用いられる。
判定対象のコイル画像から梱包型式を判定する判定フェーズでは、撮像装置511により梱包済みコイルを被写体として含む画像を撮影して、撮影されたコイル画像を画像取得部201が判定対象の画像データ512として取得する。なお、判定対象の画像は、梱包済みコイル全体が写り込んだ1つの画像に限られるものではなく、判定処理に適した部分が写り込むように複数の撮像装置511によって撮影された画像であってもよい。次に、判定部204が、取得された判定対象の画像データ512を、判定機506を用いて学習済みモデルにより各要素について判定処理を行い、判定結果を出力する。
次に、図6を参照して、梱包済みコイルの梱包型式を判定する情報処理装置100の処理例について説明する。まず、学習済みモデルを生成する学習フェーズにおいては、ステップS601にて、画像取得部201は、学習データとしての複数のコイル画像611を取得する。ステップS601において取得された学習データとしてのコイル画像611は、ラベル付与部202により、各要素についてのラベルが付与されて教師データとして例えば記憶部205に記憶される。
次に、ステップS602にて、モデル生成部203は、ステップS601において生成された教師データを用いて、結束数の分類に係る深層学習(ディープラーニング)を行い、結束数の判定に用いる学習済みモデル612を生成する。ステップS603にて、モデル生成部203は、ステップS601において生成された教師データを用いて、内リング部材の分類に係る深層学習を行い、内リング部材の判定に用いる学習済みモデル613を生成する。
ステップS604にて、モデル生成部203は、ステップS601において生成された教師データを用いて、外リング部材の分類に係る深層学習を行い、外リング部材の判定に用いる学習済みモデル614を生成し、学習フェーズの処理を終了する。ステップS602~S604において生成された学習済みモデル612~614は、例えば記憶部205に記憶される。なお、学習フェーズにおけるステップS602、S603、及びS604の処理を実行する順序は、図6に示した例に限定されるものではなく、任意である。本実施形態では各要素について深層学習を行って学習済みモデルを生成するようにしているが、深層学習に限らず、その他の教師あり機械学習でも学習済みモデルを生成することが可能である。学習済みモデルを生成するための教師あり機械学習としては、例えばニューラルネットワーク、K近傍法、線形回帰などがある。
また、判定対象のコイル画像から梱包型式を判定する判定フェーズでは、ステップS651にて、画像取得部201は、判定対象のコイル画像661を取得する。次に、ステップS652にて、判定部204は、判定対象のコイル画像661と結束数を判定するための学習済みモデル612とを用いて判定処理を行い、判定対象のコイル画像661での梱包済みコイルにおける結束数を判定する。ステップS653にて、判定部204は、判定対象のコイル画像661と内リング部材を判定するための学習済みモデル613とを用いて判定処理を行い、判定対象のコイル画像661での梱包済みコイルにおける内リング部材を判定する。
ステップS654にて、判定部204は、判定対象のコイル画像661と外リング部材を判定するための学習済みモデル614とを用いて判定処理を行い、判定対象のコイル画像661での梱包済みコイルにおける外リング部材を判定する。なお、判定フェーズにおいても、ステップS652、S653、及びS654の処理を実行する順序は、図6に示した例に限定されるものではなく、任意である。
次に、ステップS655にて、判定部204は、前述したステップS652~S654での判定処理により得られた判定結果に基づいて、判定対象のコイル画像に含まれる梱包済みコイルの梱包型式を判定する。判定部204は、前述した判定処理により得られた判定結果の組み合わせと、判定情報(判定テーブル)とを比較して、判定対象のコイル画像での梱包済みコイルの梱包型式を判定する。
次に、ステップS656において、梱包済みコイルの梱包型式についての追加学習が必要であるか否かを判定する。追加学習が必要であると判定した場合には、ステップS657にて、判定対象のコイル画像を学習データとして追加する追加学習準備処理を行い、学習フェーズに戻る。追加学習が不要であると判定した場合には、判定フェーズの処理を終了する。
本実施形態によれば、学習データとしての複数の画像のそれぞれに対して、画像に含まれる各要素についてのラベルを付与して教師データを作成することで、学習データからより多くの教師データを作成することができ、より多くの教師データを用いて学習済みモデルを生成することで画像認識の認識精度を高めることが可能となる。
また、本実施形態では、判定するための要素を学習可能なレベルに分解して各要素についての学習済みモデルを生成し、それらを用いて画像認識を行う。このように判定するための要素を学習可能なレベルにまで分け、各要素の判定結果の組み合わせに基づいて判定することで、未学習や認識対象外の画像を正しく判定することが可能となる。
なお、ラベル付与部202による学習データへのラベルの付与は、各要素に付与するラベルの情報の入力を要素毎に受け付けて付与するようにしてもよいし、図4に示したような情報を保持しておき、梱包型式の入力を受け付けて入力された梱包型式に対応する各要素のラベルを付与するようにしてもよい。また、コイル画像に人等が写り込んでいる場合には、そのコイル画像は無効データにして処理に用いないようにしてもよい。また、梱包型式を判定する際、同一の判定対象に対して複数の画像を用いて複数回の判定を行い、判定結果の梱包型式が一致している場合、もしくは一致度が所定の閾値を越えた場合に、判定結果が正しいものであると判定するようにしてもよい。
ここで、判定部204による判定処理を、結束数、内リング部材、外リング部材の順で行った場合、図4に例示した判定情報に基づく梱包済みコイルの梱包型式の判定過程は、図7に示すようになる。図7においては、梱包型式が特定できる判定結果を実線で示し、梱包型式が特定できない判定結果を破線で示している。
判定部204による判定処理を、結束数、内リング部材、外リング部材の順で行った場合、図7に701で示したように、結束数の判定結果が4であり、内リング部材の判定結果がBであると、外リング部材の判定結果にかかわらず、梱包済みコイルの梱包型式は特定できずに未知の型式とされる。そこで、図7に示した例のように、判定処理の結果が梱包済みコイルの梱包型式が特定できない状態となった場合には、それ以降の判定処理を行わないようにして処理量を低減するようにしてもよい。
この場合、情報処理装置100は、例えば図8に示すように判定フェーズの処理を実行すればよい。図8は、本実施形態における情報処理装置100の他の処理例を示すフローチャートである。なお、学習フェーズの処理は前述した実施形態と同様であるので、図8には判定フェーズでの処理のみを示している。
図8に示すように、ステップS801にて、画像取得部201は、判定対象のコイル画像を取得する。次に、ステップS802にて、判定部204は、判定対象のコイル画像と結束数を判定するための学習済みモデルとを用いて判定処理を行い、判定対象のコイル画像での梱包済みコイルにおける結束数を判定する。次に、ステップS803にて、判定部204は、判定結果として得られた結束数となる型式の候補があるか否かを判定する。判定部204は、判定結果として得られた結束数となる型式の候補があると判定した場合にはステップS804へ進み、型式の候補がないと判定した場合には未知の型式と判定してステップS809へ進む。
ステップS804にて、判定部204は、判定対象のコイル画像と内リング部材を判定するための学習済みモデルとを用いて判定処理を行い、判定対象のコイル画像での梱包済みコイルにおける内リング部材を判定する。次に、ステップS805にて、判定部204は、判定結果として得られた結束数及び内リング部材の組み合わせとなる型式の候補があるか否かを判定する。判定部204は、判定結果として得られた結束数及び内リング部材の組み合わせとなる型式の候補があると判定した場合にはステップS806へ進み、型式の候補がないと判定した場合には未知の型式と判定してステップS809へ進む。
ステップS806にて、判定部204は、判定対象のコイル画像と外リング部材を判定するための学習済みモデルとを用いて判定処理を行い、判定対象のコイル画像での梱包済みコイルにおける外リング部材を判定する。次に、ステップS807にて、判定部204は、判定結果として得られた結束数、内リング部材、及び外リング部材の組み合わせとなる型式の候補があるか否かを判定する。判定部204は、判定結果として得られた結束数、内リング部材、及び外リング部材の組み合わせとなる型式の候補があると判定した場合にはステップS808へ進み、型式の候補がないと判定した場合には未知の型式と判定してステップS809へ進む。
ステップS808にて、判定部204は、前述したステップS802、S804、S806での判定処理により得られた判定結果に基づいて、判定対象のコイル画像に含まれる梱包済みコイルの梱包型式を判定する。判定部204は、前述した判定処理により得られた判定結果の組み合わせと、判定情報(判定テーブル)とを比較して、判定対象のコイル画像での梱包済みコイルの梱包型式を判定する。
ステップS809において、梱包済みコイルの梱包型式についての追加学習が必要であるか否かを判定する。追加学習が必要であると判定した場合には、ステップS810にて、追加学習に係る処理を行い、追加学習が不要であると判定した場合には、判定フェーズの処理を終了する。このように判定結果の組み合わせに該当する型式の候補がない場合には、以降の判定処理を行わないことで、処理量を低減することができる。
なお、判定処理を、結束数、内リング部材、外リング部材の順で行う場合を説明したが、これは一例であり、判定処理の実行順序は、梱包済みコイルの判定情報に基づいて、処理量を低減できる適切な順序となるように設定すればよい。
前述した実施形態に対して、対象の梱包済みコイルを物体検出して画像から検出部位を切り出す方法や、梱包の部材を物体検出した抽出する方法などを適用するようにしてもよい。これらの方法を組み合わせることで、画像認識の認識精度の向上を図ることが可能となる。
また、対象の梱包済みコイルの大きさが判定結果に影響を及ぼさない画像の学習について、大小さまざまな画像を学習させることにより、大きさによる違いがないことや周囲に写っている他の装置等がノイズであることを認識させてもよい。この場合、大小さまざまなサイズの画像を用意する必要があるため、画像処理や物体検出等で画像に占める対象物の大きさが常に同じになるように切り出して学習し、同様の処理を施した画像に対して判定処理を行うようにすれば、大小さまざまな画像を用意して大きさによる違いがないことを認識させる必要がないため、より少ない教師データでも効果を得ることができる。
また、情報処理装置100での画像認識による判定結果とユーザ(人)による判定結果とを組み合わせて型式の判定を行う場合、情報処理装置100において、入力されたユーザによる判定結果とは異なる判定結果となったときには判定結果が相違している旨をユーザに報知するようにしてもよい。
なお、前記実施形態は、何れも本発明を実施するにあたっての具体化のほんの一例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
100 情報処理装置
101 CPU
102 主記憶装置
103 補助記憶装置
104 入力I/F
105 出力I/F
106 ネットワークI/F
107 システムバス
201 画像取得部
202 ラベル付与部
203 モデル生成部
204 判定部
205 記憶部

Claims (13)

  1. 画像認識による型式の判定処理に用いる学習済みモデルを生成する情報処理装置であって、
    対象となる被写体を含む複数の第1の画像を取得する画像取得手段と、
    取得された前記第1の画像のそれぞれに対して、前記第1の画像に含まれる前記被写体に係る複数の要素についてのラベルを付与するラベル付与手段と、
    前記ラベルが付与された前記第1の画像に基づいて前記要素毎の前記学習済みモデルを生成するモデル生成手段と
    生成された前記要素毎の前記学習済みモデルに基づいて前記型式の判定処理を行う被写体を含む第2の画像の各要素を判定し、前記各要素の判定結果の組み合わせと、前記型式との対応を示す判定情報を用いて、各要素の判定結果の組み合わせに対応する前記型式を判定する判定手段とを有することを特徴とする情報処理装置。
  2. 前記判定手段は、同一の被写体を含む複数の前記第2の画像を用いて複数回の前記判定処理を行うことを特徴とする請求項1に記載の情報処理装置。
  3. 複数の要素毎の学習済みモデルを用いて判定対象の画像における各要素の判定を行い得られた各要素の判定結果の組み合わせから型式を特定する、画像認識による型式の判定処理に用いる前記学習済みモデルを生成する情報処理装置であって、
    対象となる被写体を含む複数の第1の画像を取得する画像取得手段と、
    取得された前記第1の画像のそれぞれに対して、前記第1の画像に含まれる前記被写体に係る複数の要素についてのラベルを付与するラベル付与手段と、
    前記ラベルが付与された前記第1の画像に基づいて前記要素毎の前記学習済みモデルを生成するモデル生成手段とを有することを特徴とする情報処理装置。
  4. 前記ラベル付与手段は、前記第1の画像に対して付与する各要素のラベルの情報の入力を受け付けて前記ラベルを付与することを特徴とする請求項1~3の何れか1項に記載の情報処理装置。
  5. 前記ラベル付与手段は、前記第1の画像における前記被写体の型式を示す情報の入力を受け付けて、入力された前記型式を示す情報に対応する前記ラベルを付与することを特徴とする請求項1~3の何れか1項に記載の情報処理装置。
  6. 前記モデル生成手段は、前記ラベルが付与された前記第1の画像を用いて教師あり機械学習を行い前記学習済みモデルを生成することを特徴とする請求項1~の何れか1項に記載の情報処理装置。
  7. 前記モデル生成手段は、前記ラベルが付与された前記第1の画像を用いて深層学習を行い前記学習済みモデルを生成することを特徴とする請求項1~の何れか1項に記載の情報処理装置。
  8. 前記被写体は梱包済みコイルであり、前記型式は前記梱包済みコイルの梱包型式であることを特徴とする請求項1~の何れか1項に記載の情報処理装置。
  9. 前記複数の要素は、前記梱包済みコイルにおける結束数、内リング部材、及び外リング部材のうちの少なくとも1つを含むことを特徴とする請求項に記載の情報処理装置。
  10. 画像認識による型式の判定処理に用いる学習済みモデルを生成する情報処理装置の情報処理方法であって、
    対象となる被写体を含む複数の第1の画像を取得する画像取得工程と、
    取得された前記第1の画像のそれぞれに対して、前記第1の画像に含まれる前記被写体に係る複数の要素についてのラベルを付与するラベル付与工程と、
    前記ラベルが付与された前記第1の画像に基づいて前記要素毎の前記学習済みモデルを生成するモデル生成工程と
    生成された前記要素毎の前記学習済みモデルに基づいて前記型式の判定処理を行う被写体を含む第2の画像の各要素を判定し、前記各要素の判定結果の組み合わせと、前記型式との対応を示す判定情報を用いて、各要素の判定結果の組み合わせに対応する前記型式を判定する判定工程とを有することを特徴とする情報処理方法。
  11. 複数の要素毎の学習済みモデルを用いて判定対象の画像における各要素の判定を行い得られた各要素の判定結果の組み合わせから型式を特定する、画像認識による型式の判定処理に用いる前記学習済みモデルを生成する情報処理装置の情報処理方法であって、
    対象となる被写体を含む複数の第1の画像を取得する画像取得工程と、
    取得された前記第1の画像のそれぞれに対して、前記第1の画像に含まれる前記被写体に係る複数の要素についてのラベルを付与するラベル付与工程と、
    前記ラベルが付与された前記第1の画像に基づいて前記要素毎の前記学習済みモデルを生成するモデル生成工程とを有することを特徴とする情報処理方法。
  12. 画像認識による型式の判定処理に用いる学習済みモデルを生成する情報処理装置のコンピュータに、
    対象となる被写体を含む複数の第1の画像を取得する画像取得ステップと、
    取得された前記第1の画像のそれぞれに対して、前記第1の画像に含まれる前記被写体に係る複数の要素についてのラベルを付与するラベル付与ステップと、
    前記ラベルが付与された前記第1の画像に基づいて前記要素毎の前記学習済みモデルを生成するモデル生成ステップと
    生成された前記要素毎の前記学習済みモデルに基づいて前記型式の判定処理を行う被写体を含む第2の画像の各要素を判定し、前記各要素の判定結果の組み合わせと、前記型式との対応を示す判定情報を用いて、各要素の判定結果の組み合わせに対応する前記型式を判定する判定ステップとを実行させるためのプログラム。
  13. 複数の要素毎の学習済みモデルを用いて判定対象の画像における各要素の判定を行い得られた各要素の判定結果の組み合わせから型式を特定する、画像認識による型式の判定処理に用いる前記学習済みモデルを生成する情報処理装置のコンピュータに、
    対象となる被写体を含む複数の第1の画像を取得する画像取得ステップと、
    取得された前記第1の画像のそれぞれに対して、前記第1の画像に含まれる前記被写体に係る複数の要素についてのラベルを付与するラベル付与ステップと、
    前記ラベルが付与された前記第1の画像に基づいて前記要素毎の前記学習済みモデルを生成するモデル生成ステップとを実行させるためのプログラム。
JP2020109666A 2020-06-25 2020-06-25 情報処理装置、情報処理方法、及びプログラム Active JP7481173B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020109666A JP7481173B2 (ja) 2020-06-25 2020-06-25 情報処理装置、情報処理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020109666A JP7481173B2 (ja) 2020-06-25 2020-06-25 情報処理装置、情報処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2022007021A JP2022007021A (ja) 2022-01-13
JP7481173B2 true JP7481173B2 (ja) 2024-05-10

Family

ID=80111152

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020109666A Active JP7481173B2 (ja) 2020-06-25 2020-06-25 情報処理装置、情報処理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP7481173B2 (ja)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杉本昭彦,深層学習でクルマの写真から型式を特定 オークネットIBSが中古車ディーラー用システム,日経ビッグデータ,日経BP社,2016年11月10日,第33号,第11頁

Also Published As

Publication number Publication date
JP2022007021A (ja) 2022-01-13

Similar Documents

Publication Publication Date Title
US10936911B2 (en) Logo detection
JP6161257B2 (ja) イベント検出装置及びその方法、動作認識装置及びその方法、プログラム
JP2018151748A (ja) 画像処理装置、画像処理方法、テンプレート作成装置、物体認識処理装置及びプログラム
JP7316731B2 (ja) ビジョンシステムで画像内のパターンを検出及び分類するためのシステム及び方法
KR20190072074A (ko) 악성 코드 검출 방법 및 시스템
JP2019101919A (ja) 情報処理装置、情報処理方法、コンピュータプログラムおよび記憶媒体
TW201123026A (en) Methods and systems for gesture recognition, and computer program products thereof
US8538171B2 (en) Method and system for object detection in images utilizing adaptive scanning
WO2023165616A1 (zh) 图像模型隐蔽后门的检测方法及***、存储介质、终端
US11455801B2 (en) Generating signatures within a network that includes a plurality of computing devices of varying processing capabilities
TW202004528A (zh) 商品特定裝置、記錄媒體及學習方法
JP2013206458A (ja) 画像における外観及びコンテキストに基づく物体分類
US12020510B2 (en) Person authentication apparatus, control method, and non-transitory storage medium
Aly et al. Arabic sign language recognition using spatio-temporal local binary patterns and support vector machine
US10997407B2 (en) Detecting document objects
JP7481173B2 (ja) 情報処理装置、情報処理方法、及びプログラム
CA3035387A1 (en) Digitization of industrial inspection sheets by inferring visual relations
JP7251078B2 (ja) 画像処理装置及びプログラム
CN110751065B (zh) 训练数据的采集方法及装置
JP5084798B2 (ja) アプリケーション状態認識方法、装置及びプログラム
JP7473186B2 (ja) 画像処理装置、画像処理方法、及びプログラム
Henderson et al. Reflection invariance: an important consideration of image orientation
US11741732B2 (en) Techniques for detecting text
JP7445364B2 (ja) 画像処理プログラム、画像処理方法、及び画像処理装置
Ashaduzzaman et al. An Automated Testing Framework for Gesture Recognition System using Dynamic Image Pattern Generation with Augmentation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200716

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231107

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20231225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240425

R150 Certificate of patent or registration of utility model

Ref document number: 7481173

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150