JP7489225B2 - 画像処理システム、情報処理装置、プログラムおよび画像処理方法 - Google Patents

画像処理システム、情報処理装置、プログラムおよび画像処理方法 Download PDF

Info

Publication number
JP7489225B2
JP7489225B2 JP2020074922A JP2020074922A JP7489225B2 JP 7489225 B2 JP7489225 B2 JP 7489225B2 JP 2020074922 A JP2020074922 A JP 2020074922A JP 2020074922 A JP2020074922 A JP 2020074922A JP 7489225 B2 JP7489225 B2 JP 7489225B2
Authority
JP
Japan
Prior art keywords
image
window
recognition
size
recognition target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020074922A
Other languages
English (en)
Other versions
JP2021174067A (ja
Inventor
恭介 川原
宏幸 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Metawater Co Ltd
Original Assignee
Metawater Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Metawater Co Ltd filed Critical Metawater Co Ltd
Priority to JP2020074922A priority Critical patent/JP7489225B2/ja
Publication of JP2021174067A publication Critical patent/JP2021174067A/ja
Application granted granted Critical
Publication of JP7489225B2 publication Critical patent/JP7489225B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、画像処理システム、情報処理装置、プログラムおよび画像処理方法に関する。
特許文献1には、撮像装置の撮像画像を、撮像装置からの距離に応じて複数の領域に分割し、分割した領域を単位として、認識対象の画像認識を行う技術が記載されている。
特開2016-181743号公報
特許文献1に記載されている技術では、認識対象の移動に伴って撮像装置の撮像画像における認識対象の大きさが変動しても、認識対象を追跡するために、撮像画像を撮像装置からの距離に応じて複数の領域に分割している。
しかしながら、特許文献1に記載されている技術では、撮像画像に映る認識対象のサイズによっては、認識対象の正確な画像認識を行うことができないという問題があった。
かかる事情に鑑みてなされた本発明の目的は、認識対象の画像認識の精度向上を図ることにある。
本発明の一実施形態に係る画像処理システムは、入力画像における認識対象の画像認識のための調整を行う調整手段と、前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備え、前記調整手段は、前記認識対象のサイズに応じて、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する。
本発明の一実施形態に係る情報処理装置は、入力画像における認識対象の画像認識のための調整を行う調整手段と、前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備え、前記調整手段は、前記認識対象のサイズに応じて、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する。
本発明の一実施形態に係る情報処理装置は、入力画像における認識対象の画像認識のための調整を行う調整手段と、前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備える画像処理システムを構成するために、前記調整手段および前記認識手段の少なくとも1つを備え、前記調整手段は、前記認識対象のサイズに応じて、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する。
本発明の一実施形態に係るプログラムは、情報処理装置を、入力画像における認識対象の画像認識のための調整を行う調整手段と、前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、として機能させ、前記調整手段は、前記認識対象のサイズに応じて、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する。
本発明の一実施形態に係るプログラムは、通信可能に接続された複数の情報処理装置によって構成され、入力画像における認識対象の画像認識のための調整を行う調整手段と、前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備える画像処理システムにおける、記複数の情報処理装置のうちの1つの情報処理装置を、前記調整手段および前記認識手段のうち少なくとも1つとして機能させ、前記調整手段は、前記認識対象のサイズに応じて、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する。
本発明の一実施形態に係る画像処理方法は、入力画像における認識対象の画像認識のための調整を行う調整ステップと、前記調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識ステップと、を含み、前記調整ステップでは、前記認識対象のサイズに応じて、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する。
本発明の一実施形態によれば、認識対象の画像認識の精度向上を図ることができる。
本発明の一実施形態に係る画像処理システムの構成の一例を示す図である。 図1に示す情報処理装置による画像認識について説明するための図である。 図1に示す情報処理装置の動作の一例を示すフローチャートである。 図1に示す調整手段の動作の一例を示すフローチャートである。 図1に示す調整手段による撮像画像の解像度の調整の一例を示す図である。 図1に示す調整手段によるウィンドウのサイズの調整の一例を示す図である。 図1に示す調整手段の動作の他の一例を示すフローチャートである。 図1に示す調整手段の動作を模式的に示す図である。
以下、本発明の実施の形態について図面を参照して例示説明する。各図中、同一符号は、同一または同等の構成要素を示している。
図1は、本発明の一実施形態に係る画像処理システム1の構成の一例を示す図である。
図1に示す画像処理システム1は、撮像装置10と、情報処理装置20とを備える。撮像装置10と情報処理装置20とは、例えば、インターネット、携帯電話網などのネットワークを介して、有線通信および/または無線通信による通信が可能である。
撮像装置10は、所定の範囲を撮像した撮像画像を生成する装置である。撮像装置10は、生成した撮像画像を情報処理装置20に送信する。
情報処理装置20は、撮像装置10の撮像画像を入力画像とし、入力画像における認識対象の画像認識を行う装置である。情報処理装置20は、例えば、ネットワークを介して撮像装置10と通信可能な、サーバ装置、パーソナルコンピュータなどの装置である。情報処理装置20は、例えば、図2に示すように、撮像装置10の撮像画像2に対して、画像認識の単位であるウィンドウ3を横方向および縦方向に走査し、ウィンドウ3内の画像における認識対象4の画像認識を行う。
図1を再び参照して、情報処理装置20のハードウェア構成について説明する。
通信部21は、有線または無線を介して外部装置と通信する1つ以上の通信インタフェースである。本実施形態においては、通信部21は、撮像装置10と通信する通信インタフェースを含む。通信部21は、撮像装置10から送信されてきた撮像画像2を取得し、制御部23に出力する。
記憶部22は、1つ以上のメモリである。メモリは、例えば、半導体メモリ、磁気メモリまたは光メモリなどであるが、これらに限られず任意のメモリとすることができる。記憶部22は、例えば、一次記憶装置または二次記憶装置として機能する。記憶部22は、例えば、情報処理装置20に内蔵されるが、任意のインタフェースを介して情報処理装置20に外部から接続される構成も可能である。
制御部23は、1つ以上のプロセッサである。制御部23は、例えば、マイクロコントローラであるがこれに限られず、例えば、汎用のプロセッサまたは特定の処理に特化した専用プロセッサなど、任意のプロセッサとすることができる。制御部23は、情報処理装置20全体の動作を制御する。
次に、情報処理装置20のソフトウェア構成について、図1を参照して説明する。情報処理装置20の動作の制御に用いられる1つ以上のプログラムが記憶部22に記憶される。当該1つ以上のプログラムは、制御部23により読み込まれると、制御部23を、調整手段231および認識手段232として機能させる。
調整手段231は、画像認識の単位であるウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する手段である。調整手段231は、ウィンドウ3内の画像における認識対象4のサイズに応じて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する。調整手段231の動作の詳細については後述する。
認識手段232は、調整手段231による調整後、撮像画像2に対してウィンドウ3を走査し、ウィンドウ3内の画像における認識対象4の画像認識を行う手段である。認識手段232は、認識対象4の検出の成否あるいは認識の確からしさを示す認識スコアを調整手段231に出力することができる。
次に、本実施形態に係る情報処理装置20の動作について説明する。
図3は、本実施形態に係る情報処理装置20の動作の一例を示す図であり、本実施形態に係る画像処理方法について説明するための図である。
調整手段231は、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する(ステップS11)。ここで、調整手段231は、ウィンドウ3内の画像における認識対象4のサイズに応じて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する。
認識手段232は、調整手段231による調整後、撮像画像2に対してウィンドウ3を走査し、ウィンドウ3内の画像における認識対象4の画像認識を行う(ステップS12)。すなわち、認識手段232は、調整手段231により解像度が調整された撮像画像2に対してウィンドウ3を走査して、ウィンドウ3内の画像における認識対象4の画像認識を行う。あるいは、認識手段232は、撮像画像2に対して調整手段231によりサイズが調整されたウィンドウ3を走査して、ウィンドウ3内の画像における認識対象4の画像認識を行う。あるいは、認識手段232は、調整手段231により解像度が調整された撮像画像2に対して、調整手段231によりサイズが調整されたウィンドウ3を走査して、ウィンドウ3内の画像における認識対象4の画像認識を行う。
このように本実施形態に係る画像処理方法は、ウィンドウ3のサイズおよび入力画像である撮像画像2の解像度の少なくとも一方を調整する調整ステップ(ステップS11)と、調整後、撮像画像2に対してウィンドウ3を走査し、ウィンドウ3内の画像における認識対象4の画像認識を行う認識ステップ(ステップS12)と、を含む。そして、調整ステップでは、ウィンドウ3内の画像における認識対象4のサイズに応じて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する。
次に、調整手段231の動作についてより詳細に説明する。
図4は、1枚(1フレーム)の撮像画像2に対する画像認識を行う際の、調整手段231の動作の一例を示すフローチャートである。
調整手段231は、予め定められた、ウィンドウ3のサイズおよび撮像画像2の解像度を設定する(ステップS21)。
調整手段231は、設定したウィンドウ3のサイズおよび撮像画像2の解像度による画像認識により、認識手段232が認識対象4の検出に成功したか否かを判定する(ステップS22)。認識対象4の検出に成功したか否かは、例えば、認識手段232から出力される認識対象4の検出の成否あるいは認識スコアに基づき判定することができる。
認識対象4の検出に失敗したと判定した場合(ステップS22:No)、調整手段231は、ウィンドウ3のサイズまたは撮像画像2の解像度を変更し(ステップS23)、ステップS22の処理に戻る。調整手段231は、認識手段232による認識対象4の検出が成功するまで、ステップS22およびステップS23の処理を繰り返す。
認識対象4の検出に成功したと判定した場合(ステップS22:Yes)、調整手段231は、ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズであるか否かを判定する(ステップS24)。ここで、ウィンドウ3内の画像における認識対象4の検出サイズが適当であるとは、ウィンドウ3内の画像の面積に対する認識対象4の画像の面積の比である面積比、および、ウィンドウ3内の画像の長さに対する認識対象4の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まることを指す。
ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズであると判定した場合(ステップS24:Yes)、調整手段231は、現在のウィンドウ3のサイズおよび撮像画像2の解像度の設定を維持し、処理を終了する。
ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズでないと判定した場合(ステップS24:No)、調整手段231は、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を変更し(ステップS25)、ステップS24の処理に戻る。調整手段231は、ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズになるまで、ステップS24およびステップS25の処理を繰り返す。すなわち、調整手段231は、ウィンドウ3内の画像の面積に対する認識対象4の画像の面積の比である面積比、および、ウィンドウ3内の画像の長さに対する認識対象4の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まるように、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する。
本願発明者が検討した結果、上述した面積比あるいは長さ比が所定の範囲内にある場合に、画像認識の認識スコアが上がり、認識精度が向上することが分かった。認識対象4の種類などにより変動するが、例えば、長さ比が1/10~1/2の範囲内にあるときに、認識精度が向上することが分かった。調整手段231は、ウィンドウ3内の画像に認識対象4が検出されると、ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズとなるように、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する。
以下では、調整手段231によるウィンドウ3のサイズまたは撮像画像2の解像度の調整について、図5A,5Bを参照して説明する。
調整手段231によるウィンドウ3のサイズまたは撮像画像2の解像度の調整の一例について、図5Aを参照して説明する。図5Aでは、ウィンドウ3のサイズに対して、認識対象4の検出サイズが大きすぎる場合を例として説明する。図5Aでは、元の撮像画像2の縦方向のサイズをI1とし、元の撮像画像2の横方向のサイズをI2とする。また、ウィンドウ3の縦方向のサイズをW1とし、ウィンドウ3の横方向のサイズをW2とする。また、撮像画像2内の認識対象4の縦方向のサイズをH1とする。
調整手段231は、例えば、ウィンドウ3のサイズは固定したままで、撮像画像2の解像度を徐々に変化させる。具体的には、調整手段231は、ウィンドウ3のサイズは固定したままで、撮像画像2の解像度を徐々に下げる。撮像画像2の解像度を下げることで、解像度の調整後の撮像画像2’の縦方向のサイズI1’および横方向のサイズI2’はそれぞれ、元の撮像画像2の縦方向のサイズI1および横方向のサイズI2よりも小さくなる。撮像画像2のサイズが小さくなることで、解像度の調整後の撮像画像2’内の認識対象4の縦方向のサイズH1’も、撮像画像2内の認識対象4の縦方向のサイズH1よりも小さくなる。そのため、例えば、ウィンドウ3の縦方向のサイズW1に対する認識対象4の縦方向のサイズH1’の長さ比(H1’/W1)が所定の範囲に収まるようになる。
ウィンドウ3のサイズを固定したままで、撮像画像2の解像度を徐々に下げることで、ウィンドウ3のサイズに対して、認識対象4の検出サイズが大きすぎる場合にも、認識対象4の検出サイズを調整し、認識対象4の画像認識の精度向上を図ることができる。また、ウィンドウ3のサイズを固定とすることで、画像認識を行うCPU(Central Processing Unit)あるいはGPU(Graphics Processing Unit)は1つのウィンドウ3のサイズによる画像認識に対応可能であればよく、構成の簡素化を図ることができる。
なお、ウィンドウ3のサイズに対して認識対象4の検出サイズが大きすぎる場合、調整手段231は、撮像画像2の解像度を固定して、ウィンドウ3のサイズを大きくする調整を行ってもよい。また、ウィンドウ3のサイズに対して認識対象4の検出サイズが大きすぎる場合、調整手段231は、撮像画像2の解像度を下げるとともに、ウィンドウ3のサイズを大きくする調整を行ってもよい、これらの調整によっても、認識対象4の検出サイズに対してウィンドウ3のサイズが相対的に大きくなり、ウィンドウ3のサイズに対する認識対象4の検出サイズを適当なサイズにすることができる。
次に、調整手段231によるウィンドウ3のサイズまたは撮像画像2の解像度の調整の他の一例について、図5Bを参照して説明する。図5Bでは、ウィンドウ3のサイズに対して、認識対象4の検出サイズが小さすぎる場合を例として説明する。図5Bでは、図5Aと同様に、元の撮像画像2の縦方向のサイズをI1とし、元の撮像画像2の横方向のサイズをI2とする。また、ウィンドウ3の縦方向のサイズをW1とし、ウィンドウ3の横方向のサイズをW2とする。また、撮像画像2内の認識対象4の縦方向のサイズをH1とする。
調整手段231は、例えば、撮像画像2の解像度は固定したままで、ウィンドウ3のサイズを徐々に変化させる。具体的には、調整手段231は、撮像画像2の解像度は固定したままで、ウィンドウ3のサイズを徐々に小さくする。ウィンドウ3のサイズを小さくすることで、サイズの調整後のウィンドウ3’の縦方向のサイズW1’および横方向のサイズW2’はそれぞれ、元のウィンドウ3の縦方向のサイズW1および横方向のサイズW2よりも小さくなる。ウィンドウ3のサイズが小さくなることで、例えば、ウィンドウ3の縦方向のサイズW1’に対する認識対象4の縦方向のサイズH1の長さ比(H1/W1’)が所定の範囲に収まるようになる。
撮像画像2の解像度を固定したままで、ウィンドウ3のサイズを徐々に小さくすることで、ウィンドウ3のサイズに対して、認識対象4の検出サイズが小さすぎる場合にも、認識対象4の検出サイズを調整し、認識対象4の画像認識の精度向上を図ることができる。また、事前学習により、教師データに応じた解像度を算出し、撮像画像2の解像度を算出した解像度に固定とすることで、余分な分割/縮小作業を行わずに、認識対象を最適な制度で均一に認識することができるように、ウィンドウ3のサイズを調整することができる。余分な分割/縮小作業を行う必要がないので、撮像画像2の解像度の調整を行うCPUあるいはGPUの処理負荷の軽減を図ることができる。
図6は、複数の(複数フレームの)撮像画像2に対して連続的に画像認識を行う際の、調整手段231の動作の一例を示すフローチャートである。以下では、処理対象の撮像画像2の1つ前(直前)の撮像画像2において、所定のウィンドウ3のサイズおよび撮像画像2の解像度で、認識対象4が検出されているものとする。
調整手段231は、処理対象の撮像画像2の直前の撮像画像2におけるウィンドウ3のサイズおよび撮像画像2の解像度を用いた画像認識により、認識手段232が認識対象4の検出に引き続き成功したか否かを判定する(ステップS31)。
認識対象4の検出に失敗したと判定した場合(ステップS31:No)、調整手段231は、図6に示す処理を終了する。そして、調整手段231は、例えば、図4を参照して説明した処理を開始する。
認識対象4の検出に成功したと判定した場合(ステップS31:Yes)、調整手段231は、ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズであるか否かを判定する(ステップS32)。
ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズであると判定した場合(ステップS32:Yes)、調整手段231は、ウィンドウ3のサイズおよび撮像画像2の解像度を調整する必要がないので、処理を終了する。すなわち、調整手段231は、認識対象4の検出に成功し、ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズである場合、直前のウィンドウ3のサイズおよび撮像画像2の解像度の設定を維持する。
ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズでないと判定した場合(ステップS32:No)、調整手段231は、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を変更し(ステップS33)、ステップS32の処理に戻る。調整手段231は、ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズになるまで、ステップS32およびステップS33の処理を繰り返す。
図7は、複数の撮像画像2に対して連続的に画像認識を行う際の調整手段231の動作を模式的に示す図である。図7においては、4つの撮像画像2(撮像画像2-1~2-4)に対して連続的に画像認識を行うものとする。具体的には、時刻t0から時刻t10において、撮像画像2-1の画像認識を行い、時刻t10から時刻t20において、撮像画像2-2の画像認識を行い、時刻t20から時刻t30において、撮像画像2-3の画像認識を行い、時刻t30から時刻t40において、撮像画像2-4の画像認識を行うものとする。また、撮像画像2-1~2-4には、2つの認識対象4(認識対象4a,4b)が含まれ、認識対象4a,4bを検出することが予め定められているものとする。また、撮像画像2-1,2-2においては、認識対象4aは認識対象4bよりも小さく映り、撮像画像2-3,2-4においては、認識対象4aは認識対象4bと同程度の大きさで映っているものとする。また、撮像画像2-1~2-2、撮像画像2-3~2-4それぞれにおいて、認識対象4aの大きさはほぼ変化せず、また、撮像画像2-1~2-4において、認識対象4bの大きさはほぼ変化してないものとする。また、調整手段231は、撮像画像2の解像度は固定して、ウィンドウ3のサイズを調整するものとする。
調整手段231は、ウィンドウ3のサイズを所定の最小のサイズから徐々に大きくしていく。調整手段231は、時刻t0から、時刻t10よりも前の時刻t01までの期間において、認識対象4a,4bに対するウィンドウ3のサイズを最小のサイズ(例えば、300×300[pixel])に設定する。図7に示すように、ウィンドウ3のサイズを300×300にした場合、認識対象4a,4bともにウィンドウ3内に収まらず、認識手段232は、認識対象4aおよび認識対象4bを検出することができない。
認識手段232が認識対象4a,4bを検出することができない場合、図4を参照して説明したように、調整手段231は、ウィンドウ3のサイズを変更する。したがって、調整手段231は、時刻t01から、時刻t10よりも前の時刻t02までの期間において、認識対象4a,4bに対するウィンドウ3のサイズを、時刻t0から時刻t01までの期間で設定したウィンドウ3のサイズよりも大きいサイズ(例えば、600×600[pixel])に設定する。図7に示すように、ウィンドウ3のサイズを600×600に設定した場合、認識対象4aは、ウィンドウ3内に収まり、認識手段232は、認識対象4aを検出することができる。また、ウィンドウ3のサイズに対する認識対象4aの検出サイズが所定の範囲に収まっている場合、認識手段232は、認識対象4aについてのウィンドウ3のサイズの調整を終了する。一方、認識対象4bは、ウィンドウ3内に収まらず、認識手段232は、認識対象4bを検出することができない。
認識手段232が認識対象4bを検出することができない場合、調整手段231は、ウィンドウ3のサイズを変更する。したがって、調整手段231は、時刻t02から、時刻t10よりも前の時刻t03までの期間において、認識対象4bに対するウィンドウ3のサイズを、時刻t01から時刻t02までの期間で設定したウィンドウ3のサイズよりも大きいサイズ(例えば、1200×1200[pixel])に設定する。図7に示すように、ウィンドウ3のサイズを1200×1200に設定した場合、認識対象4bは、ウィンドウ3内に収まり、認識手段232は、認識対象4bを検出することができる。また、ウィンドウ3のサイズに対する認識対象4bの検出サイズが所定の範囲に収まっている場合、調整手段231は、認識対象4bについてのウィンドウ3のサイズの調整を終了する。
撮像画像2-2では、認識対象4a,4bのサイズはほぼ変化していない。そのため、認識対象4aに対するウィンドウ3のサイズ(600×600)はそのままで、認識手段232は、認識対象4aを検出することができる。ウィンドウ3のサイズに対する認識対象4aの検出サイズが所定の範囲に収まっている場合、調整手段231は、ウィンドウ3のサイズの設定を維持する。また、認識対象4bに対するウィンドウ3のサイズ(1200×1200)はそのままで、認識手段232は、認識対象4bを検出することができる。ウィンドウ3のサイズに対する認識対象4bの検出サイズが所定の範囲に収まっている場合、調整手段231は、ウィンドウ3のサイズの設定を維持する。したがって、調整手段231は、時刻t10から時刻t20においては、認識対象4a,4bに対するウィンドウ3のサイズの設定を維持する。
撮像画像2-3では、認識対象4bのサイズはほぼ変化していないが、認識対象4aのサイズは大きくなっている。そのため、時刻t20~t21においては、撮像画像2-2における認識対象4aに対するウィンドウ3のサイズ(600×600)では、ウィンドウ3内に認識対象4aが収まらず、認識手段232は、認識対象4aを検出することができない。
そこで、調整手段231は、認識対象4aに対するウィンドウ3のサイズを所定の最小のサイズから徐々に大きくしていく。調整手段231は、時刻t21から、時刻t30よりも前の時刻t22までの期間において、認識対象4aに対するウィンドウ3のサイズを最小のサイズ(例えば、300×300[pixel])に設定する。図7に示すように、ウィンドウ3のサイズを300×300にした場合、認識対象4aはウィンドウ3内に収まらず、認識手段232は、認識対象4aを検出することができない。
認識手段232が認識対象4aを検出することができない場合、調整手段231は、時刻t22から、時刻t30よりも前の時刻t23までの期間において、認識対象4aに対するウィンドウ3のサイズを、時刻t21から時刻t22までの期間で設定したウィンドウ3のサイズよりも大きいサイズ(例えば、1200×1200[pixel])に設定する。図7に示すように、ウィンドウ3のサイズを1200×1200に設定した場合、認識対象4aはウィンドウ3内に収まり、認識手段232は、認識対象4aを検出することができる。また、ウィンドウ3のサイズに対する認識対象4aの検出サイズが所定の範囲に収まっている場合、調整手段231は、認識対象4aについてのウィンドウ3のサイズの調整を終了する。
なお、図7においては、時刻t20から時刻t21までの期間(ウィンドウ3のサイズを600×600である期間)において、認識対象4aはウィンドウ3内に収まっていないため、時刻t22において、ウィンドウ3のサイズを、300×300から1200×300に変更する例を説明したが、本発明はこれに限られるものではない、調整手段231は、認識対象4がウィンドウ3内に収まらない場合、ウィンドウ3のサイズを順次、大きくしてもよい。したがって、調整手段231は、時刻t22において、ウィンドウ3のサイズを、300×300の次に大きな、600×600に変更してもよい。また、ウィンドウ3のサイズはあくまでも一例であり、ウィンドウ3のサイズおよび変更率は適宜、設定可能である。
一方、撮像画像2-3では、認識対象4bのサイズはほぼ変化していない。そのため、認識対象4bに対するウィンドウ3のサイズ(1200×1200)はそのままで、調整手段231は、認識対象4bを検出することができる。ウィンドウ3のサイズに対する認識対象4bの検出サイズが所定の範囲に収まっている場合、調整手段231は、認識対象4bに対するウィンドウ3のサイズの設定を維持する。
撮像画像2-4では、認識対象4a,4bのサイズはほぼ変化していない。そのため、認識対象4aに対するウィンドウ3のサイズ(1200×1200)はそのままで、認識手段232は、認識対象4aを検出することができる。ウィンドウ3のサイズに対する認識対象4aの検出サイズが所定の範囲に収まっている場合、調整手段231は、認識対象4aに対するウィンドウ3のサイズの設定を維持する。また、認識対象4bに対するウィンドウ3のサイズ(1200×1200)はそのままで、認識手段232は、認識対象4bを検出することができる。ウィンドウ3のサイズに対する認識対象4bの検出サイズが所定の範囲に収まっている場合、調整手段231は、認識対象4bに対するウィンドウ3のサイズの設定を維持する。したがって、調整手段231は、時刻t30から時刻t40においては、認識対象4a,4bに対するウィンドウ3のサイズの設定を維持する。
なお、本実施形態においては、調整手段231は、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を徐々に変化させる例を用いて説明したが、これに限られるものではない。調整手段231は、例えば、認識対象が予め指定された教師画像を用いた機械学習により作成されたモデルを用いて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整してもよい。
上述したようなモデルは、例えば、以下のようにして作成することができる。まず、教師画像(動画クリップ)における認識対象の最大サイズおよび最小サイズを測定する。そして、認識対象が所定の範囲(例えば、1/10~1/2、より好ましくは、1/8~1/5)に収まるための、教師画像の分割率、分割数あるいは縮小率を算出し、算出結果に従い、教師画像を分割あるいは縮小する。次に、分割あるいは縮小された画像のうち、認識対象が含まれている画像における認識対象を矩形で指示するなどしてタグ付けする。そして、認識対象がタグ付けされた画像を用いた機械学習を行うことにより、上述したようなモデルを作成することができる。
また、調整手段231は、撮像画像の撮像状況に基づいて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整してもよい。例えば、認識しづらい状況で撮像された撮像画像に対しては、通常時は1/10~1/2に収まるように設定されているウィンドウ3のサイズまたは解像度を、1/8~1/5へと変化させてもよい。撮像状況の特定にあたっては、該当する撮像状況(例えば、夕焼けや雪景色などといった撮影環境や、撮影対象の種類など)を、例えば、ユーザにより予め特定しておいてもよく、機械学習を行った際の認識率(認識精度)から特定してもよい。また、調整手段231は、撮像状況のほかにも、対象物の動きに基づいて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整してもよい。
このように本実施形態においては、画像処理システム1は、調整手段231と、認識手段232とを備える。調整手段231は、入力画像としての撮像画像2における認識対象4の画像認識の単位であるウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する。認識手段232は、調整手段231による調整後、撮像画像2に対してウィンドウ3を走査し、ウィンドウ3内の画像における認識対象4の画像認識を行う。ここで、調整手段231は、ウィンドウ3内の画像における認識対象4のサイズに応じて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する。
ウィンドウ3内の画像における認識対象4のサイズに応じて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整することで、ウィンドウ3内の画像における認識対象4のサイズを、画像認識に適したサイズに変更することができる。そのため、認識対象4のサイズによらず、認識対象4の画像認識の精度向上を図ることができる。
本発明を諸図面および実施形態に基づき説明してきたが、当業者であれば本開示に基づき種々の変形及び修正を行うことが容易であることに注意されたい。したがって、これらの変形および修正は本発明の範囲に含まれることに留意されたい。例えば、各手段、各ステップなどに含まれる機能などは論理的に矛盾しないように再配置可能であり、複数の手段およびステップなどを1つに組み合わせたり、あるいは分割したりすることが可能である。前述したところは本発明の一実施形態にすぎず、特許請求の範囲において、種々の変更を加えてよいことは言うまでもない。
また、上述した実施形態において、情報処理装置20の制御部23によって実現される各種の手段をソフトウェア構成として説明したが、これらのうち少なくとも一部の手段は、ソフトウェア資源および/またはハードウェア資源を含む概念であってもよい。
また、上述した実施形態に係る情報処理装置20として機能させるために、コンピュータまたは携帯電話などの装置を用いることができる。当該装置は、実施形態に係る情報処理装置20の各機能を実現する処理内容を記述したプログラムを、当該装置のメモリに格納し、当該装置のプロセッサによって当該プログラムを読み出して実行させることによって実現可能である。
また、情報処理装置20の各構成または各手段が、通信可能に接続された複数の情報処理装置に分散配置された構成も可能である。当該複数の情報処理装置のうち少なくとも1つの情報処理装置が、上述した画像処理システム1を構成するために、調整手段231および認識手段232の少なくとも1つを備える構成も可能である。
1 画像処理システム
2,2-1~2-4 撮像画像
3 ウィンドウ
4,4a,4b 認識対象
10 撮像装置
20 情報処理装置
21 通信部
22 記憶部
23 制御部
231 調整手段
232 認識手段

Claims (9)

  1. 入力画像における認識対象の画像認識のための調整を行う調整手段と、
    前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備え、
    前記調整手段は、前記ウィンドウ内の画像の面積に対する前記認識対象の画像の面積の比である面積比、および、前記ウィンドウ内の画像の長さに対する前記認識対象の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まるように、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する、画像処理システム。
  2. 請求項1に記載の画像処理システムにおいて、
    前記調整手段は、前記ウィンドウのサイズを固定し、前記面積比および前記長さ比の少なくとも一方が前記所定の範囲に収まるように、前記入力画像の解像度を徐々に変化させる、画像処理システム。
  3. 請求項1に記載の画像処理システムにおいて、
    前記調整手段は、前記入力画像の解像度を固定し、前記面積比および前記長さ比の少なくとも一方が前記所定の範囲に収まるように、前記ウィンドウのサイズを徐々に変化させる、画像処理システム。
  4. 請求項1に記載の画像処理システムにおいて、
    前記調整手段は、認識対象が予め指定された教師画像を用いた機械学習により作成されたモデルを用いて、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する、画像処理システム。
  5. 入力画像における認識対象の画像認識のための調整を行う調整手段と、
    前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備え、
    前記調整手段は、前記ウィンドウ内の画像の面積に対する前記認識対象の画像の面積の比である面積比、および、前記ウィンドウ内の画像の長さに対する前記認識対象の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まるように、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する、情報処理装置。
  6. 入力画像における認識対象の画像認識のための調整を行う調整手段と、前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備える画像処理システムを構成するために、
    前記調整手段および前記認識手段の少なくとも1つを備え、
    前記調整手段は、前記ウィンドウ内の画像の面積に対する前記認識対象の画像の面積の比である面積比、および、前記ウィンドウ内の画像の長さに対する前記認識対象の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まるように、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する情報処理装置。
  7. 情報処理装置を、
    入力画像における認識対象の画像認識のための調整を行う調整手段と、
    前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、として機能させ、
    前記調整手段は、前記ウィンドウ内の画像の面積に対する前記認識対象の画像の面積の比である面積比、および、前記ウィンドウ内の画像の長さに対する前記認識対象の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まるように、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する、プログラム。
  8. 通信可能に接続された複数の情報処理装置によって構成され、入力画像における認識対象の画像認識のための調整を行う調整手段と、前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備え
    る画像処理システムにおける、記複数の情報処理装置のうちの1つの情報処理装置を、
    前記調整手段および前記認識手段のうち少なくとも1つとして機能させ、
    前記調整手段は、前記ウィンドウ内の画像の面積に対する前記認識対象の画像の面積の比である面積比、および、前記ウィンドウ内の画像の長さに対する前記認識対象の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まるように、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する、プログラム。
  9. 入力画像における認識対象の画像認識のための調整を行う調整ステップと、
    前記調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識ステップと、を含み、
    前記調整ステップでは、前記ウィンドウ内の画像の面積に対する前記認識対象の画像の面積の比である面積比、および、前記ウィンドウ内の画像の長さに対する前記認識対象の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まるように、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する、画像処理方法。
JP2020074922A 2020-04-20 2020-04-20 画像処理システム、情報処理装置、プログラムおよび画像処理方法 Active JP7489225B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020074922A JP7489225B2 (ja) 2020-04-20 2020-04-20 画像処理システム、情報処理装置、プログラムおよび画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020074922A JP7489225B2 (ja) 2020-04-20 2020-04-20 画像処理システム、情報処理装置、プログラムおよび画像処理方法

Publications (2)

Publication Number Publication Date
JP2021174067A JP2021174067A (ja) 2021-11-01
JP7489225B2 true JP7489225B2 (ja) 2024-05-23

Family

ID=78281791

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020074922A Active JP7489225B2 (ja) 2020-04-20 2020-04-20 画像処理システム、情報処理装置、プログラムおよび画像処理方法

Country Status (1)

Country Link
JP (1) JP7489225B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009223527A (ja) 2008-03-14 2009-10-01 Seiko Epson Corp 画像処理装置、画像処理方法、画像処理のためのコンピュータプログラム
JP2010218395A (ja) 2009-03-18 2010-09-30 Ricoh Co Ltd 画像処理装置、画像処理方法および画像処理プログラム
JP2013062688A (ja) 2011-09-13 2013-04-04 Canon Inc 画像処理装置、画像処理方法
JP2014142760A (ja) 2013-01-23 2014-08-07 Mega Chips Corp 画像検出装置及び制御プログラム並びに画像検出方法
JP2015182604A (ja) 2014-03-24 2015-10-22 東芝アルパイン・オートモティブテクノロジー株式会社 画像処理装置および画像処理プログラム
JP2017199278A (ja) 2016-04-28 2017-11-02 ソニーセミコンダクタソリューションズ株式会社 検出装置、検出方法、およびプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06347420A (ja) * 1993-06-11 1994-12-22 Kawasaki Steel Corp 画像領域切出し装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009223527A (ja) 2008-03-14 2009-10-01 Seiko Epson Corp 画像処理装置、画像処理方法、画像処理のためのコンピュータプログラム
JP2010218395A (ja) 2009-03-18 2010-09-30 Ricoh Co Ltd 画像処理装置、画像処理方法および画像処理プログラム
JP2013062688A (ja) 2011-09-13 2013-04-04 Canon Inc 画像処理装置、画像処理方法
JP2014142760A (ja) 2013-01-23 2014-08-07 Mega Chips Corp 画像検出装置及び制御プログラム並びに画像検出方法
JP2015182604A (ja) 2014-03-24 2015-10-22 東芝アルパイン・オートモティブテクノロジー株式会社 画像処理装置および画像処理プログラム
JP2017199278A (ja) 2016-04-28 2017-11-02 ソニーセミコンダクタソリューションズ株式会社 検出装置、検出方法、およびプログラム

Also Published As

Publication number Publication date
JP2021174067A (ja) 2021-11-01

Similar Documents

Publication Publication Date Title
US11164323B2 (en) Method for obtaining image tracking points and device and storage medium thereof
CN109934041B (zh) 信息处理方法、信息处理***、介质和计算设备
US10733705B2 (en) Information processing device, learning processing method, learning device, and object recognition device
JP2008511258A (ja) リアルタイム画像安定化
JP6374536B2 (ja) 追尾システム、端末装置、カメラ装置、追尾撮影方法及びプログラム
JP2019129410A (ja) 監視カメラ、監視カメラの制御方法、およびプログラム
JP2016100636A (ja) 撮像装置
JP7489225B2 (ja) 画像処理システム、情報処理装置、プログラムおよび画像処理方法
CN111971951B (zh) 运算装置、运算方法、可移动介质和鉴别***
US10491833B2 (en) Information processing apparatus, information processing method, and non-transitory computer-readable recording medium
JP2009302731A (ja) 画像処理装置、画像処理プログラム、画像処理方法、および電子機器
CN113850805B (zh) 多文档检测方法、装置、电子设备及存储介质
CN112613409A (zh) 手部关键点检测方法、装置、网络设备及存储介质
CN107147901A (zh) 一种传感器校正方法、装置、设备以及存储介质
JP2009237632A (ja) オブジェクト検出方法、オブジェクト検出装置、オブジェクト検出プログラムおよび印刷装置
JP2021114111A (ja) 撮像支援装置、撮像支援方法、及びプログラム
JP2021056899A (ja) 画像処理装置、画像処理方法およびプログラム
CN113723416B (zh) 一种图像处理方法、装置、设备及存储介质
US20240233234A1 (en) Image processing apparatus, image processing method, non-transitory computer-readable storage medium
US11800230B2 (en) Image processing apparatus of reducing whole operation time of arrival inspection, image processing method, and storage medium
KR102655332B1 (ko) 영상 왜곡 보정 장치 및 방법
JP2001268431A (ja) 補正画像生成装置,補正画像生成方法,補正画像生成用プログラム記録媒体および補正画像生成用プログラム
US11711619B2 (en) Controlling exposure based on inverse gamma characteristic
KR102565318B1 (ko) 블러 이미지에 포함된 연속적인 이미지의 취득 방법 및 장치
JPH02123877A (ja) 移動物体の自動追尾装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221102

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231010

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240513

R150 Certificate of patent or registration of utility model

Ref document number: 7489225

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150