JP2022070648A

JP2022070648A - 情報処理装置および情報処理方法

Info

Publication number: JP2022070648A
Application number: JP2020179823A
Authority: JP
Inventors: 超張; Chao Zhang; 優薄波; Masaru Usunami
Original assignee: Omron Corp; Omron Tateisi Electronics Co
Current assignee: Omron Corp
Priority date: 2020-10-27
Filing date: 2020-10-27
Publication date: 2022-05-13
Anticipated expiration: 2040-10-27
Also published as: DE112021005703T5; WO2022091577A1; CN116261742A; US20230419500A1

Abstract

【課題】撮像された画像から検出した領域を好適に分割できる技術を提供する。【解決手段】情報処理装置が、撮像された画像から、所定の特徴を有する特徴領域を検出する検出手段と、前記特徴領域の慣性主軸で前記特徴領域を分割する分割手段とを有する。【選択図】図１

Description

本発明は、撮像された画像から検出した領域を分割する技術に関する。

撮像された画像から人体などの所定の物体を検出する際に、所定の物体の領域よりも広い領域が検出され、所定の物体が高精度に検出できないことがある。ここで、動きのある領域を検出し、検出した領域に含まれた物体が人体であるか否かを識別する場合を考える。この場合には、物体とその影を含む領域が検出されることがある。物体とその影を含む領域が検出されると、影の影響を受けて、物体が人体であるか否かを高精度に識別できない。

特許文献１には、予め定められた基準輝度値に基づいて、背景差分画像（対象物とその影を含む画像）から影を削除する技術が開示されている。

特開２００８－２４５０６３号公報

しかしながら、暗い環境下や逆光で撮像が行われた場合には、物体（対象物）の輝度値が影の輝度値に近くなるため、特許文献１に開示の技術で高精度に影を削除することはできない（物体の少なくとも一部が削除されてしまう）。つまり、特許文献１に開示の技術を用いても、物体とその影を含む領域を物体の領域と影の領域とに高精度に分離（分割）することはできない。

本発明は上記実情に鑑みなされたものであって、撮像された画像から検出した領域を好適に分割できる技術を提供することを目的とする。

上記目的を達成するために本発明は、以下の構成を採用する。

本発明の第一側面は、撮像された画像から、所定の特徴を有する特徴領域を検出する検出手段と、前記特徴領域の慣性主軸で前記特徴領域を分割する分割手段とを有することを特徴とする情報処理装置を提供する。

多くの場合、分離（分割）すべき２つの物体の間で、物体が伸びる方向は異なる。例えば、地面に人が立っている場合には、人は地面に略垂直な方向に伸び、影は地面に沿った方向に伸びる。そこで、上述した構成では、検出した特徴領域の慣性主軸で特徴領域を分割するとしている。こうすることで、特徴領域を好適に（所望の２つの物体にそれぞれ対応する２つの分割領域が得られるように）分割することができる。

特徴領域の慣性主軸は２つ存在し、使用する慣性主軸に依っては特徴領域を好適に分割できない。このため、前記分割手段は、前記特徴領域の重心が、前記特徴領域の外接矩形の中心を通る水平軸と垂直軸によって得られる４つの象限のうち、第１象限または第３象限に位置する場合には、前記特徴領域の２つの慣性主軸のうち、前記水平軸からの偏角が小さい方の慣性主軸で前記特徴領域を分割し、前記特徴領域の重心が、前記４つの象限の
うち、第２象限または第４象限に位置する場合には、前記特徴領域の２つの慣性主軸のうち、前記水平軸からの偏角が大きい方の慣性主軸で前記特徴領域を分割するとしてもよい。こうすることで、特徴領域をより好適に分割することができる（特徴領域の好適な分割をより確実に実現することができる）。

分割すべきでない１つの物体の領域と同等の特徴領域が検出された場合などのように、慣性主軸で特徴領域を分割すべきでない場合がある。そして、そのような場合に、特徴領域の外接矩形に占める特徴領域の割合は大きい傾向にある。このため、前記分割手段が前記特徴領域を分割して得た２つの分割領域を採用するか、前記特徴領域を採用するかを判断する判断手段をさらに有し、前記判断手段は、前記特徴領域の外接矩形に占める前記特徴領域の割合に対応する評価値が所定の閾値未満である場合に、前記２つの分割領域を採用すると判断し、前記評価値が前記所定の閾値以上である場合に、前記特徴領域を採用すると判断するとしてもよい。こうすることで、特徴領域をより好適に分割することができる（特徴領域を分割すべき場合に分割結果を採用し、特徴領域を分割すべきでない場合に特徴領域を採用する（分割結果を採用しない）という動作を高精度に実現することができる）。

前記評価値は、前記特徴領域の外接矩形の面積に対する、前記２つの分割領域それぞれの外接矩形の合計面積の割合であるとしてもよい。前記評価値は、前記特徴領域の外接矩形の面積に対する、前記２つの分割領域それぞれの外接矩形の論理和の面積の割合であるとしてもよい。

採用する領域の外接矩形に含まれた物体が所定の物体であるか否かを識別する識別手段をさらに有し、前記２つの分割領域が採用される場合に、前記識別手段は、前記２つの分割領域のそれぞれについて、その分割領域の外接矩形に含まれた物体が所定の物体であるか否かを識別するとしてもよい。こうすることで、所定の物体を高精度に識別（検出）することができる。例えば、特徴領域に所定の物体が含まれている場合には、特徴領域の分割によって、所定の物体の領域により近い分割領域が得られる。このため、得られた分割領域の外接矩形に含まれた物体が所定の物体であることは、特徴領域の外接矩形を用いる場合よりも高精度に識別（検出）することができる。

前記所定の物体は人体であるとしてもよい。こうすることで、人体を高精度に識別（検出）することができる。

前記検出手段は、動きのある領域を、前記特徴領域として検出するとしてもよい。前記検出手段は、所定範囲内の画素値を有する領域を、前記特徴領域として検出するとしてもよい。前記検出手段は、エッジで囲まれた領域を、前記特徴領域として検出するとしてもよい。

本発明の第二側面は、撮像された画像から、所定の特徴を有する特徴領域を検出する検出ステップと、前記特徴領域の慣性主軸で前記特徴領域を分割する分割ステップとを有することを特徴とする情報処理方法を提供する。

なお、本発明は、上記構成ないし機能の少なくとも一部を有する情報処理システム、人体検出装置、人体検出システムなどとして捉えることができる。また、本発明は、上記処理の少なくとも一部を含む、情報処理方法、人体検出方法、情報処理システムの制御方法、又は人体検出システムの制御方法や、これらの方法をコンピュータに実行させるためのプログラム、又は、そのようなプログラムを非一時的に記録したコンピュータ読取可能な記録媒体として捉えることもできる。上記構成及び処理の各々は技術的な矛盾が生じない限り互いに組み合わせて本発明を構成することができる。

本発明によれば、撮像された画像から検出した領域を好適に分割することができる。

図１は、本発明が適用された情報処理装置の構成例を示すブロック図である。図２は、本発明の実施形態１に係るカメラ（情報処理装置）の構成例を示すブロック図である。図３は、本発明の実施形態１に係るカメラの処理フロー例を示すフローチャートである。図４は、本発明の実施形態１に係るカメラの動作の具体例を示す図である。図５は、本発明の実施形態１に係るカメラの動作の具体例を示す図である。図６は、本発明の実施形態１に係る表示例を示す図である。図７は、本発明の実施形態２に係るカメラ（情報処理装置）の構成例を示すブロック図である。図８は、本発明の実施形態２に係るカメラの処理フロー例を示すフローチャートである。図９は、本発明の実施形態２に係るカメラの動作の具体例を示す図である。図１０（Ａ）～１０（Ｃ）は、領域分割の一例を示す図である。

＜適用例＞
本発明の適用例について説明する。

従来技術では、撮像された画像から人体などの所定の物体を検出する際に、所定の物体の領域よりも広い領域が検出され、所定の物体が高精度に検出できないことがある。ここで、動きのある領域を検出し、検出した領域に含まれた物体が人体であるか否かを識別する場合を考える。この場合には、物体とその影を含む領域が検出されることがある。物体とその影を含む領域が検出されると、影の影響を受けて、物体が人体であるか否かを高精度に識別できない。

検出された領域を輝度値に基づいて分割する従来技術も提案されているが、当該従来技術では領域を好適に分割することができない。例えば、暗い環境下や逆光で撮像が行われた場合には、物体の輝度値が影の輝度値に近くなるため、物体とその影を含む領域を物体の領域と影の領域とに高精度に分離（分割）することができない。

図１は、本発明が適用された情報処理装置１００の構成例を示すブロック図である。情報処理装置１００は、領域検出部１０１と領域分割部１０２を有する。領域検出部１０１は、撮像された画像から、所定の特徴を有する特徴領域を検出する。領域分割部１０２は、領域検出部１０１により検出された特徴領域の慣性主軸で、特徴領域を分割する。領域検出部１０１は本発明の検出手段の一例であり、領域分割部１０２は本発明の分割手段の一例である。特徴領域は、例えば、動きのある領域、所定範囲内の画素値（ＲＧＢ値や輝度値など）を有する領域、エッジで囲まれた領域などである。つまり、所定の特徴は、「領域に動きがある」、「領域が所定範囲内の画素値を有する」、「領域がエッジで囲まれている」などである。所定範囲は、例えば、人体などの所定の物体が取り得る画素値の範囲である。撮像の環境（例えば、太陽や照明などからの光）は時刻に依存するため、所定範囲は時刻に依って変化してもよい。

多くの場合、分離（分割）すべき２つの物体の間で、物体が伸びる方向は異なる。例え
ば、地面に人が立っている場合には、人は地面に略垂直な方向に伸び、影は地面に沿った方向に伸びる。そこで、上述した構成では、検出した特徴領域の慣性主軸で特徴領域を分割するとしている。こうすることで、特徴領域を好適に（所望の２つの物体にそれぞれ対応する２つの分割領域が得られるように）分割することができる。

＜実施形態１＞
本発明の実施形態１について説明する。

図２は、実施形態１に係るカメラ２００（情報処理装置）の構成例を示すブロック図である。カメラ２００は、撮像部２１０、制御部２２０、記憶部２３０、及び、表示部２４０を有する。

なお、実施形態１では、本発明をカメラに適用した場合の例を説明するが、本発明が適用される情報処理装置はカメラに限られない。例えば、本発明は、カメラ（撮像部２１０）とは別体のパーソナルコンピュータ（ＰＣ）に適用されてもよい。表示部２４０は、本発明が適用される情報処理装置とは別体の表示装置（モニタ）であってもよい。本発明が適用される情報処理装置がカメラとは別体の装置である場合には、情報処理装置の設置場所は特に限定されない。例えば、情報処理装置はカメラと同じ部屋に設置されてもよいし、そうでなくてもよい。上述したＰＣは、クラウド上のコンピュータであってもよいし、スマートフォンやタブレット端末などの各種端末であってもよい。

撮像部２１０は、画像を撮像して制御部２２０へ出力する。実施形態１では、撮像部２１０が動画を撮像するとする。撮像部２１０は、動画のフレームを撮像して制御部２２０へ出力する処理を、順次行う。なお、撮像部２１０は、静止画を撮像して制御部２２０へ出力する処理を、順次行ってもよい。

制御部２２０は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）やＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）などを含み、各構成要素の制御や、各種情報処理などを行う。

記憶部２３０は、制御部２２０で実行されるプログラムや、制御部２２０で使用される各種データなどを記憶する。例えば、記憶部２３０は、ハードディスクドライブやソリッドステートドライブなどの補助記憶装置である。

表示部２４０は、制御部２２０から出力された情報に基づく表示を行う。

制御部２２０について、より詳細に説明する。制御部２２０は、領域検出部２２１、慣性主軸算出部２２２、領域分割部２２３、領域選択部２２４、及び、人体識別部２２５を有する。

領域検出部２２１は、撮像部２１０により撮像された画像から、所定の特徴を有する特徴領域を検出する。そして、領域検出部２２１は、撮像部２１０により撮像された画像と、検出した特徴領域を示す情報とを、慣性主軸算出部２２２へ出力する。特徴領域は、例えば、動きのある領域、所定範囲内の画素値（ＲＧＢ値や輝度値など）を有する領域、エッジで囲まれた領域などである。つまり、所定の特徴は、「領域に動きがある」、「領域が所定範囲内の画素値を有する」、「領域がエッジで囲まれている」などである。所定範囲は、例えば、所定の物体（実施形態１では人体）が取り得る画素値の範囲である。撮像の環境（例えば、太陽や照明などからの光）は時刻に依存するため、所定範囲は時刻に依って変化してもよい。領域検出部２２１は本発明の検出手段の一例である。

なお、特徴領域の検出方法（動きの有無の判定方法や、エッジの検出方法など）は特に限定されず、特徴領域の検出には、提案されている様々な方法を用いることができる。動きの有無は、背景差分法により判定されてもよいし、フレーム間差分法により判定されてもよい。背景差分法は、例えば、撮像された画像のうち、所定の背景画像との画素値の差分（絶対値）が所定の閾値以上の画素を、動きのある画素として検出する方法である。フレーム間差分法は、例えば、撮像された現在の画像（現在のフレーム）のうち、撮像された過去の画像（過去のフレーム）との画素値の差分が所定の閾値以上の画素を、動きのある画素として検出する方法である。フレーム間差分法において、例えば、過去のフレームは、現在のフレームの所定数前のフレームであり、所定数は１以上である。所定数（現在のフレームから過去のフレームまでのフレーム数）は、制御部２２０の処理のフレームレートや、撮像部２１０による撮像のフレームレートなどに応じて決定されてもよい。

慣性主軸算出部２２２は、領域検出部２２１により検出された特徴領域を示す情報に基づいて、特徴領域の慣性主軸を算出する。そして、慣性主軸算出部２２２は、撮像部２１０により撮像された画像、領域検出部２２１により検出された特徴領域を示す情報、及び、算出した慣性主軸を示す情報を、領域分割部２２３へ出力する。慣性主軸の算出方法は特に限定されず、慣性主軸の算出には、提案されている様々な方法を用いることができる。

領域分割部２２３は、領域検出部２２１により検出された特徴領域を、慣性主軸算出部２２２により算出された慣性主軸で分割することにより、２つの分割領域を得る。そして、領域分割部２２３は、撮像部２１０により撮像された画像、領域検出部２２１により検出された特徴領域を示す情報、及び、取得した２つの分割領域を示す情報を、領域選択部２２４へ出力する。領域分割部２２３は本発明の分割手段の一例である。

領域選択部２２４は、領域分割部２２３により得られた２つの分割領域を採用するか、領域検出部２２１により検出された特徴領域を採用するかを判断する（採用する領域を選択する）。領域選択部２２４は本発明の判断手段の一例である。

分割すべきでない１つの物体の領域と同等の特徴領域が検出された場合などのように、慣性主軸で特徴領域を分割すべきでない場合がある。そして、そのような場合に、特徴領域の外接矩形に占める特徴領域の割合は大きい傾向にある。このため、特徴領域の外接矩形に占める特徴領域の割合に対応する評価値が所定の閾値未満である場合に、領域選択部２２４は、２つの分割領域を採用すると判断する。一方で、評価値が所定の閾値以上である場合には、領域選択部２２４は、特徴領域を採用すると判断する。こうすることで、特徴領域をより好適に分割することができる（特徴領域を分割すべき場合に分割結果を採用し、特徴領域を分割すべきでない場合に特徴領域を採用する（分割結果を採用しない）という動作を高精度に実現することができる）。

実施形態１では、領域選択部２２４は、領域検出部２２１により検出された特徴領域を示す情報に基づいて、特徴領域の外接矩形を算出し、領域分割部２２３により得られた２つの分割領域を示す情報に基づいて、２つの分割領域それぞの外接矩形を算出する。そして、領域選択部２２４は、特徴領域の外接矩形の面積（外接矩形内の画素数）に対する、２つの分割領域それぞれの外接矩形の合計面積の割合を、評価値として算出する。

なお、特徴領域の外接矩形の面積に対する、２つの分割領域それぞれの外接矩形の論理和の面積の割合が、評価値として算出されてもよい。こうすることで、特徴領域の外接矩形に占める特徴領域の割合により近い評価値を算出でき、領域の採用／不採用をより好適に判断することができる。もちろん、特徴領域の外接矩形に占める特徴領域の割合、つまり特徴領域の外接矩形の面積に対する特徴領域の面積の割合が、評価値として算出されて
もよい。

領域選択部２２４は、採用する領域を決定すると、撮像部２１０により撮像された画像と、採用する領域の外接矩形を示す情報とを、人体識別部２２５へ出力する。

人体識別部２２５は、領域選択部２２４から出力された情報（撮像部２１０により撮像された画像、及び、採用する領域の外接矩形を示す情報）に基づいて、採用する領域の外接矩形に含まれた物体が人体（所定の物体）であるか否かを識別する。２つの分割領域が採用される場合には、人体識別部２２５は、２つの分割領域のそれぞれについて、その分割領域の外接矩形に含まれた物体が人体であるか否かを識別する。こうすることで、人体を高精度に識別（検出）することができる。例えば、特徴領域に人体が含まれている場合には、特徴領域の分割によって、人体の領域により近い分割領域が得られる。このため、得られた分割領域の外接矩形に含まれた物体が人体であることは、特徴領域の外接矩形を用いる場合よりも高精度に識別（検出）することができる。人体識別部２２５は本発明の識別手段の一例である。

人体識別部２２５は、人体識別を終えると、撮像部２１０により撮像された画像と、人体識別の結果とを、表示部２４０へ出力する。こうすることで、表示部２４０は、人体識別の結果を、撮像された画像と共に表示することができる。例えば、人体識別の結果には、採用する領域の外接矩形を示す情報や、外接矩形に含まれた物体が人体であるか否かを示す情報などが含まれる。そして、表示部２４０は、採用する領域の外接矩形を、撮像された画像に重ねて表示する。外接矩形の態様（線種や輝度、色など）は、外接矩形に含まれた物体が人体であるか否かに応じて変更される。

なお、人体識別部２２５は、人体識別の結果を、撮像された画像と紐づけて記憶媒体に記録してもよい。記憶媒体は、カメラ２００の一部であってもよいし、そうでなくてもよい。

また、人体識別部２２５による人体識別にはどのようなアルゴリズムを用いてもよい。例えば、ＨｏＧやＨａａｒ－ｌｉｋｅなどの画像特徴とブースティングを組み合わせた識別器を用いてもよい。既存の機械学習により生成された学習済みモデルを用いてもよく、具体的にはディープラーニング（例えば、Ｒ－ＣＮＮ、ＦａｓｔＲ－ＣＮＮ、ＹＯＬＯ、ＳＳＤなど）により生成された学習済みモデルを用いてもよい。

図３は、カメラ２００の処理フロー例を示すフローチャートである。カメラ２００は、図３の処理フローを繰り返し実行する。制御部２２０の処理のフレームレート（繰り返し周期）は特に限定されないが、実施形態１では、撮像部２１０による撮像のフレームレート（例えば３０ｆｐｓ）と同じであるとする。

まず、撮像部２１０は、画像を撮像する（ステップＳ３０１）。次に、領域検出部２２１は、ステップＳ３０１で撮像された画像から、所定の特徴を有する特徴領域を検出する（ステップＳ３０２）。そして、慣性主軸算出部２２２は、ステップＳ３０２で検出された特徴領域の慣性主軸を算出する（ステップＳ３０３）。次に、領域分割部２２３は、ステップＳ３０２で検出された特徴領域を、ステップＳ３０３で算出された慣性主軸で分割することにより、２つの分割領域を得る（ステップＳ３０４）。

そして、領域選択部２２４は、ステップＳ３０２で検出された特徴領域とステップＳ３０４で得られた２つの分割領域とに基づいて評価値を算出し、算出した評価値が所定の閾値未満であるか否かを判定する（ステップＳ３０５）。評価値が所定の閾値未満であると判定された場合（ステップＳ３０５：ＹＥＳ）にはステップＳ３０６へ処理が進められ、
評価値が所定の閾値以上であると判定された場合（ステップＳ３０５：ＮＯ）にはステップＳ３０７へ処理が進められる。

ステップＳ３０６では、人体識別部２２５は、ステップＳ３０４で得られた２つの分割領域のそれぞれについて、その分割領域の外接矩形に含まれた物体が人体であるか否かを識別する。ステップＳ３０７では、人体識別部２２５は、ステップＳ３０２で検出された特徴領域の外接矩形に含まれた物体が人体であるか否かを識別する。ステップＳ３０６の処理またはステップＳ３０７の処理が行われた後、ステップＳ３０８へ処理が進められる。ステップＳ３０８では、表示部２４０は、ステップＳ３０１～Ｓ３０７の処理結果を表示する。

カメラ２００の動作の具体例について、図４を用いて説明する。図４の例では、人体とその影を含む特徴領域４０１が検出されている（ステップＳ３０２）。人体識別を高精度に行うために、特徴領域４０１は、人体の領域と影の領域とに分割すべきである。慣性主軸算出部２２２は、特徴領域４０１の重心４０２を算出し、重心４０２を通る、特徴領域４０１の慣性主軸４０３を算出する（ステップＳ３０３）。そして、領域分割部２２３は、特徴領域４０１を慣性主軸４０３で分割することにより、２つの分割領域４０４，４０５を得る（ステップＳ３０４）。図４から明らかなように、分割領域４０４は人体に対応し、分割領域４０５は影に対応する。このため、分割領域４０４，４０５を採用して人体識別を行うべきである。領域選択部２２４は、特徴領域４０１の外接矩形４０６、分割領域４０４の外接矩形４０７、及び、分割領域４０５の外接矩形４０８を算出する。そして、領域選択部２２４は、外接矩形４０６の面積に対する、外接矩形４０７の面積と外接矩形４０８の面積との和（合計面積）の割合を、評価値として算出する。図４から明らかなように、評価値として比較的小さい値（所定の閾値未満の値）が得られる（ステップＳ３０５：ＹＥＳ）。このため、分割領域４０４，４０５を採用して人体識別を行うことができる（ステップＳ３０６）。

カメラ２００の動作の他の具体例について、図５を用いて説明する。図５の例では、人体の領域と同等の特徴領域５０１が検出されている（ステップＳ３０２）。人体識別を高精度に行うために、特徴領域５０１は分割すべきでない。慣性主軸算出部２２２は、特徴領域５０１の重心５０２を算出し、重心５０２を通る、特徴領域５０１の慣性主軸５０３を算出する（ステップＳ３０３）。そして、領域分割部２２３は、特徴領域５０１を慣性主軸５０３で分割することにより、２つの分割領域５０４，５０５を得る（ステップＳ３０４）。図５から明らかなように、分割領域５０４は人体の上半身に対応し、分割領域５０５は人体の下半身に対応する。分割領域５０４，５０５を採用して人体識別を行うと、人体が検出できなかったり、人体の一部が検出されたりしてしまう。このため、分割領域５０４，５０５を採用して人体識別を行うべきではなく、特徴領域５０１を採用して人体識別を行うべきである。領域選択部２２４は、特徴領域５０１の外接矩形５０６、分割領域５０４の外接矩形５０７、及び、分割領域５０５の外接矩形５０８を算出する。そして、領域選択部２２４は、外接矩形５０６の面積に対する、外接矩形５０７の面積と外接矩形５０８の面積との和（合計面積）の割合を、評価値として算出する。図５から明らかなように、評価値として比較的大きい値（所定の閾値以上の値）が得られる（ステップＳ３０５：ＮＯ）。このため、分割領域５０４，５０５を採用せず、特徴領域５０１を採用して人体識別を行うことができる（ステップＳ３０６）。

図６は、表示部２４０による表示の一例を示す図である。図６では、撮像された画像は、人体６０１、自動車６０２、及び、それらの影を含む。人体６０１については、評価値が閾値未満となるため、人体６０１を含む枠６０３（分割領域の外接矩形）と、人体６０１の影を含む枠６０４（分割領域の外接矩形）とが表示される。自動車６０２については、評価値が閾値以上となるため、自動車６０２とその影を含む枠６０５（特徴領域の外接
矩形）が表示される。枠６０３に含まれる物体は人体として識別され、枠６０４に含まれる物体と枠６０５に含まれる物体とは人体として識別されないため、枠６０３は実線で、枠６０４，６０５は破線で表示される。

以上述べたように、実施形態１によれば、特徴領域の慣性主軸で特徴領域が分割される。これにより、特徴領域を好適に（所望の２つの物体にそれぞれ対応する２つの分割領域が得られるように）分割することができる。さらに、特徴領域の外接矩形に占める前記特徴領域の割合に対応する評価値に基づいて、特徴領域を分割して得た２つの分割領域を採用するか、前記特徴領域を採用するかが判断される。これにより、特徴領域をより好適に分割することができる（特徴領域を分割すべき場合に分割結果を採用し、特徴領域を分割すべきでない場合に特徴領域を採用する（分割結果を採用しない）という動作を高精度に実現することができる）。

＜実施形態２＞
本発明の実施形態２について説明する。特徴領域の慣性主軸は２つ存在し、使用する慣性主軸に依っては特徴領域を好適に分割できない。実施形態２では、特徴領域をより好適に分割することができる（特徴領域の好適な分割をより確実に実現することができる）ように、使用する慣性主軸を選択する。

図７は、実施形態２に係るカメラ７００（情報処理装置）の構成例を示すブロック図である。カメラ７００は、撮像部２１０、制御部７２０、記憶部２３０、及び、表示部２４０を有する。制御部７２０は、制御部２２０（図２）と同様の機能を有する。制御部７２０は、領域検出部２２１、慣性主軸算出部２２２、慣性主軸選択部７２１、領域分割部２２３、領域選択部２２４、及び、人体識別部２２５を有する。

慣性主軸算出部２２２は、撮像部２１０により撮像された画像、領域検出部２２１により検出された特徴領域を示す情報、及び、算出した慣性主軸を示す情報を、慣性主軸選択部７２１へ出力する。実施形態２では、慣性主軸算出部２２２が特徴領域の２つの慣性主軸を算出するとするが、そうでなくてもよい。例えば、慣性主軸算出部２２２が、２つの慣性主軸のうちの一方を算出し、慣性主軸選択部７２１が、必要に応じて、慣性主軸算出部２２２により算出された慣性主軸を補正して、２つの慣性主軸のうちの他方を取得してもよい。

慣性主軸選択部７２１は、特徴領域の２つの慣性主軸のうちの一方を選択する。特徴領域の重心が、特徴領域の外接矩形の中心を通る水平軸と垂直軸によって得られる４つの象限のうち、第１象限または第３象限に位置する場合には、２つの慣性主軸のうち、水平軸（水平方向）からの偏角が小さい方の慣性主軸が選択される。特徴領域の重心が、４つの象限のうち、第２象限または第４象限に位置する場合には、特徴領域の２つの慣性主軸のうち、水平軸からの偏角が大きい方の慣性主軸が選択される。そして、慣性主軸選択部７２１は、撮像部２１０により撮像された画像、領域検出部２２１により検出された特徴領域を示す情報、及び、選択した慣性主軸を示す情報を、領域分割部２２３へ出力する。領域分割部２２３は、領域検出部２２１により検出された特徴領域を、慣性主軸選択部７２１により選択された慣性主軸で分割する。こうすることで、特徴領域をより好適に分割することができる（特徴領域の好適な分割をより確実に実現することができる）。

図８は、カメラ７００の処理フロー例を示すフローチャートである。カメラ７００は、図８の処理フローを繰り返し実行する。制御部７２０の処理のフレームレート（繰り返し周期）は特に限定されないが、実施形態２では、撮像部２１０による撮像のフレームレート（例えば３０ｆｐｓ）と同じであるとする。

図８の処理フローでは、ステップＳ３０３の処理とステップＳ３０４の処理との間に、ステップＳ８００の処理が行われる。ステップＳ８００では、慣性主軸選択部７２１は、ステップＳ３０３で算出された２つの慣性主軸のうちの一方を選択する。ステップＳ３０４では、領域分割部２２３は、ステップＳ３０２で検出された特徴領域を、ステップＳ８００で選択された慣性主軸で分割する。

カメラ２００の動作の具体例について、図９を用いて説明する。

図９の例では、人体とその影を含む特徴領域９０１が検出されている（ステップＳ３０２）。人体識別を高精度に行うために、特徴領域９０１は、人体の領域と影の領域とに分割すべきである。慣性主軸算出部２２２は、特徴領域９０１の重心９０２を算出し、重心９０２を通る、特徴領域９０１の慣性主軸９０３，９０４を算出する（ステップＳ３０３）。水平方向から慣性主軸９０３までの偏角θ１は、水平方向から慣性主軸９０４までの偏角θ２よりも小さい。慣性主軸９０３と慣性主軸９０４とは互いに直交するため、偏角θ２は、偏角θ１＋９０°である。

慣性主軸選択部７２１は、慣性主軸９０３，９０４のうちの一方を選択する（ステップＳ８００）。図９から明らかなように、特徴領域９０１を慣性主軸９０３で分割しても、特徴領域９０１は人体の領域と影の領域とに分割されず、特徴領域９０１を慣性主軸９０４で分割することで、特徴領域９０１を人体の領域と影の領域とに分割することができる。そのため、慣性主軸選択部７２１は慣性主軸９０４を選択する必要がある。

慣性主軸選択部７２１は、領域検出部２２１により検出された特徴領域を示す情報に基づいて、特徴領域９０１の重心９０２と、特徴領域９０１の外接矩形の中心９０５とを算出する。そして、慣性主軸選択部７２１は、重心９０２の座標と中心９０５の座標とに基づいて、中心９０５を通る水平軸と垂直軸によって得られる４つの象限のうち、重心９０２が位置する象限を判断する。ここで、図９で水平軸として示されている矢印の方向に進むにつれて水平座標（水平方向の位置座標）が増加し、垂直軸として示されている矢印の方向に進むにつれて垂直座標（垂直方向の位置座標）が増加する場合を考える。この場合には、重心９０２の水平座標が中心９０５の水平座標よりも大きく、且つ、重心９０２の垂直座標が中心９０５の垂直座標よりも大きければ、重心９０１は第１象限に位置すると判断できる。重心９０２の水平座標が中心９０５の水平座標よりも小さく、且つ、重心９０２の垂直座標が中心９０５の垂直座標よりも大きければ、重心９０１は第２象限に位置すると判断できる。重心９０２の水平座標が中心９０５の水平座標よりも小さく、且つ、重心９０２の垂直座標が中心９０５の垂直座標よりも小さければ、重心９０１は第３象限に位置すると判断できる。重心９０２の水平座標が中心９０５の水平座標よりも大きく、且つ、重心９０２の垂直座標が中心９０５の垂直座標よりも小さければ、重心９０１は第４象限に位置すると判断できる。

そして、慣性主軸選択部７２１は、重心９０２が位置する象限の判断結果に応じて、慣性主軸９０３，９０４のうちの一方を選択する。重心９０２が第１象限または第３象限に位置する場合には、慣性主軸選択部７２１は、慣性主軸９０３，９０４のうち、水平軸（水平方向）からの偏角が小さい慣性主軸９０３を選択する。重心９０２が第２象限または第４象限に位置する場合には、慣性主軸選択部７２１は、慣性主軸９０３，９０４のうち、水平軸からの偏角が大きい慣性主軸９０４を選択する。図９では、重心９０２が第４象限に位置するため、慣性主軸選択部７２１は、慣性主軸９０４を選択することができる。ひいては、特徴領域９０１を人体の領域と影の領域とに分割することができる。

以上述べたように、実施形態２によれば、特徴領域の外接矩形の中心を通る水平軸と垂直軸によって得られる４つの象限のうち、特徴領域の重心が位置する象限に応じて、使用
する慣性主軸が選択される。これにより、特徴領域をより好適に分割することができる（特徴領域の好適な分割をより確実に実現することができる）。

＜その他＞
上記実施形態は、本発明の構成例を例示的に説明するものに過ぎない。本発明は上記の具体的な形態には限定されることはなく、その技術的思想の範囲内で種々の変形が可能である。例えば、識別する所定の物体は人体でなくてもよく、自動車や建物、指、腕、胴体、動物などであってもよい。また、特徴領域を人体の領域と影の領域に分割する例を説明したが、これに限られない。本発明によれば、図１０（Ａ）に示すように、特徴領域を２つの建物（２つの建物にそれぞれ対応する２つの領域）に分割することもできる。図１０（Ｂ）に示すように、特徴領域を電柱の領域と影の領域とに分割することもできる。図１０（Ｃ）に示すように、特徴領域を親指の領域と人差し指の領域とに分割することもできる。特徴領域（人体の領域）を胴体の領域と腕の領域とに分割することもできる。このように、本発明は、様々な用途で利用することができる。

＜付記１＞
撮像された画像から、所定の特徴を有する特徴領域を検出する検出手段（１０１，２２１）と、
前記特徴領域の慣性主軸で前記特徴領域を分割する分割手段（１０２，２２３）と
を有することを特徴とする情報処理装置（１００，２００，７００）。

＜付記２＞
撮像された画像から、所定の特徴を有する特徴領域を検出する検出ステップ（Ｓ３０２）と、
前記特徴領域の慣性主軸で前記特徴領域を分割する分割ステップ（Ｓ３０４）と
を有することを特徴とする情報処理方法。

１００：情報処理装置１０１：領域検出部１０２：領域分割部
２００：カメラ（情報処理装置）
２１０：撮像部２２０：制御部２３０：記憶部２４０：表示部
２２１：領域検出部２２２：慣性主軸算出部２２３：領域分割部
２２４：領域選択部２２５：人体識別部
７００：カメラ（情報処理装置）７２０：制御部７２１：慣性主軸選択部

Claims

撮像された画像から、所定の特徴を有する特徴領域を検出する検出手段と、
前記特徴領域の慣性主軸で前記特徴領域を分割する分割手段と
を有することを特徴とする情報処理装置。
前記分割手段は、
前記特徴領域の重心が、前記特徴領域の外接矩形の中心を通る水平軸と垂直軸によって得られる４つの象限のうち、第１象限または第３象限に位置する場合には、前記特徴領域の２つの慣性主軸のうち、前記水平軸からの偏角が小さい方の慣性主軸で前記特徴領域を分割し、
前記特徴領域の重心が、前記４つの象限のうち、第２象限または第４象限に位置する場合には、前記特徴領域の２つの慣性主軸のうち、前記水平軸からの偏角が大きい方の慣性主軸で前記特徴領域を分割する
ことを特徴とする請求項１に記載の情報処理装置。
前記分割手段が前記特徴領域を分割して得た２つの分割領域を採用するか、前記特徴領域を採用するかを判断する判断手段をさらに有し、
前記判断手段は、
前記特徴領域の外接矩形に占める前記特徴領域の割合に対応する評価値が所定の閾値未満である場合に、前記２つの分割領域を採用すると判断し、
前記評価値が前記所定の閾値以上である場合に、前記特徴領域を採用すると判断することを特徴とする請求項１または２に記載の情報処理装置。
前記評価値は、前記特徴領域の外接矩形の面積に対する、前記２つの分割領域それぞれの外接矩形の合計面積の割合である
ことを特徴とする請求項３に記載の情報処理装置。
前記評価値は、前記特徴領域の外接矩形の面積に対する、前記２つの分割領域それぞれの外接矩形の論理和の面積の割合である
ことを特徴とする請求項３に記載の情報処理装置。
採用する領域の外接矩形に含まれた物体が所定の物体であるか否かを識別する識別手段をさらに有し、
前記２つの分割領域が採用された場合に、前記識別手段は、前記２つの分割領域のそれぞれについて、その分割領域の外接矩形に含まれた物体が所定の物体であるか否かを識別する
ことを特徴とする請求項３～５のいずれか１項に記載の情報処理装置。
前記所定の物体は人体である
ことを特徴とする請求項６に記載の情報処理装置。
前記検出手段は、動きのある領域を、前記特徴領域として検出する
ことを特徴とする請求項１～７のいずれか１項に記載の情報処理装置。
前記検出手段は、所定範囲内の画素値を有する領域を、前記特徴領域として検出する
ことを特徴とする請求項１～７のいずれか１項に記載の情報処理装置。
前記検出手段は、エッジで囲まれた領域を、前記特徴領域として検出する
ことを特徴とする請求項１～７のいずれか１項に記載の情報処理装置。
撮像された画像から、所定の特徴を有する特徴領域を検出する検出ステップと、
前記特徴領域の慣性主軸で前記特徴領域を分割する分割ステップと
を有することを特徴とする情報処理方法。
請求項１１に記載の情報処理装置の各ステップをコンピュータに実行させるためのプログラム。