JP4281338B2 - 画像検出装置及び画像検出方法 - Google Patents

画像検出装置及び画像検出方法 Download PDF

Info

Publication number
JP4281338B2
JP4281338B2 JP2002339654A JP2002339654A JP4281338B2 JP 4281338 B2 JP4281338 B2 JP 4281338B2 JP 2002339654 A JP2002339654 A JP 2002339654A JP 2002339654 A JP2002339654 A JP 2002339654A JP 4281338 B2 JP4281338 B2 JP 4281338B2
Authority
JP
Japan
Prior art keywords
image
frame
search
detected
predetermined object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002339654A
Other languages
English (en)
Other versions
JP2004171490A (ja
Inventor
寛司 三原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2002339654A priority Critical patent/JP4281338B2/ja
Publication of JP2004171490A publication Critical patent/JP2004171490A/ja
Application granted granted Critical
Publication of JP4281338B2 publication Critical patent/JP4281338B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は,画像内の所定の対象物を検出する画像検出装置及び画像検出方法に関し,例えばビデオ映像から人間の顔を検出するのに好適な画像検出装置及び画像検出方法に関する。
【0002】
【従来の技術】
従来,ビデオ映像等の画像から,所定の対象物,例えば人間の顔等を検出・認識する技術が提案されており(例えば,特許文献1参照),監視システム,ロボット装置などへの応用が考えられている。この分野の検出・認識方法としては,サポートベクタマシン(SVM:Support Vector Machine)のようなテンプレートマッチングの手法を使用する方法が知られている。なお,本願発明に関連する先行技術文献情報には,次のものがある。
【0003】
【特許文献1】
特開2001−216515号公報
【0004】
【発明が解決しようとする課題】
ところで,上記のような顔検出・認識を行う装置においては,パターン認識アルゴリズムに要する演算量が膨大になる。そこで,演算処理を軽減しつつ,実用上十分な検出精度を実現することが重要となり,要望されている。従来,ビデオ映像から,縮小スケール画像からなる所定サイズのウィンドウ画像を作り,大まかに顔画像であるか否かを判断して,明らかに顔画像でないウィンドウ画像を除去することにより全体の演算量の軽減を図る手法が考案されている。しかしながら,この手法だけでは,連続した動画像から顔を検出するような場合,時間方向の冗長度を利用しておらず,演算量の軽減が十分とはいえなかった。
【0005】
本発明は上述した問題に鑑みてなされたもので,画像内の所定の対象物を検出するにあたり,演算量の軽減を推進可能な画像検出装置及び画像検出方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
上記課題を解決するために,本発明の第1の観点によれば,画像の中における所定の対象物の位置を検出する画像検出装置であって,連続した複数のフレームのなかで,前記所定の対象物を全く探索しない非探索フレームと,前記所定の対象物をフレーム内全ての領域にわたって探索する全探索フレームと,を設定し,前記非探索フレームの間に前記全探索フレームを所定の周期で設ける検出手段を具備することを特徴とする画像検出装置が提供される。
【0007】
本発明では,全てのフレームに対して対象物を探索するのではなく,対象物を全く探索しない非探索フレームを設定している。非探索フレームでは対象物を全く探索しないため,この分の演算量を大幅に軽減できる。非探索フレームの間に全探索フレームを所定の周期で設けることで,所定の対象物の位置を検出しつつ,演算量の軽減を達成できる。
【0008】
ここで,検出手段はさらに,前記所定の対象物の位置が検出されたフレームの後には,前記所定の対象物の位置の近傍を中心に探索する近傍探索フレームを設けることが好ましい。
【0009】
対象物が瞬時的に極端に位置を変更することは通常起こりにくいため,対象物の検出後は,対象物の位置の近傍を中心に探索すればよく,これにより,探索する画像を減らすことができる。
【0010】
その際に,近傍探索フレームにおける探索範囲は,検出された所定の対象物の大きさや,画像を撮影している撮影手段のズーム量および移動角度,動きベクトル等に応じて,決定,調整されることが好ましく,これらの情報を用いることにより,探索する画像を減らすことができ,また高精度な検出が可能になる。ここで,移動角度は,例えば,後述の本実施の形態にかかるパン・チルト等に該当する。
【0011】
また,検出手段は,所定のフレームにわたって全く動かない対象物を静止物体であるとして検出対象から除外するように構成してもよい。これにより,誤検出を排除でき,演算量を軽減できる。
【0012】
また,本発明の第2の観点によれば,画像内の所定の対象物を検出する画像検出方法であって,連続したフレームのなかで,前記所定の対象物を全く探索しない非探索フレームと,前記所定の対象物をフレーム内全ての領域にわたって探索する全探索フレームと,を設定し,前記非探索フレームの間に前記全探索フレームを所定の周期で設けることを特徴とする画像検出方法が提供される。
【0013】
本発明では,全てのフレームに対して対象物を探索するのではなく,対象物を全く探索しない非探索フレームを設定している。非探索フレームでは対象物を全く探索しないため,この分の演算量を大幅に軽減できる。非探索フレームの間に全探索フレームを所定の周期で設けることで,所定の対象物の位置を検出しつつ,演算量の軽減を達成できる。
【0014】
ここで,前記所定の対象物の位置が検出されたフレームの後には,前記所定の対象物の位置の近傍を中心に探索する近傍探索フレームを設けることが好ましい。
【0015】
対象物が瞬時的に極端に位置を変更することは通常起こりにくいため,対象物の検出後は,対象物の位置の近傍を中心に探索すればよく,これにより,探索する画像を減らすことができる。
【0016】
【発明の実施の形態】
以下,添付図面を参照しながら,本発明の好適な実施の形態にかかる画像検出装置および画像検出方法について詳細に説明する。
【0017】
まず,図1を参照しながら,本実施の形態にかかる画像検出装置の構成について説明する。なおここでは,検出する対象物を人間の顔とした場合を例にとり説明する。図1に示すように,本実施の形態にかかる画像検出装置は,画像入力手段としてのCCD(Charge Coupled Device)カメラ10と,画像処理を行って顔を検出する顔検出部20とを主要構成部として有する。
【0018】
本装置はさらに,画像を圧縮して伝送する画像圧縮・伸張部30,TV(テレビジョン)モニター40,マイク50,音声方向検出部60,音声圧縮・伸張部70,スピーカー80,多重・ネットワークインタフェース90のなかからそれぞれを必要に応じて組み合わせて構成することも可能である。
【0019】
CCDカメラ10は,映像入力デバイスからの動画像を取り込む画像入力手段であり,取り込んだ動画像を顔検出部20へ送出する。CCDカメラ10は,電動のPTZ装置(パン・チルト・ズーム装置)等により自由に向きを変えることができることが好ましく,その場合には例えば,顔だと認識した領域が画像の中央に来るように制御することが容易になる。
【0020】
顔検出部20は,CCDカメラ10で取り込んだ画像信号をフレーム単位で不図示の内部メモリに記憶し,取り込んだ映像から人間の顔画像を検出する。場合によっては,それに加えて人物の識別を処理する機能を持つよう構成してもよい。
【0021】
マイク50は,複数のマイクを配列したマイクアレーで構成することが好ましく,その場合は後述のように音声方向検出が可能になり,探索範囲の縮小に寄与できる。多重・ネットワークインタフェース90は電話回線等のネットワークと接続されている。
【0022】
図1に示す構成における全体的な情報の流れとしては,CCDカメラ10で撮影された映像が顔検出部20へ入力され,顔検出が行われる。CCDカメラ10がPTZ装置を装備している場合は,顔検出部20での処理結果に応じて顔検出部20からCCDカメラ10へPTZ制御の指示が出される。映像データは顔検出部20で画像処理を施された後,画像圧縮・伸張部30へ送出され,必要に応じ圧縮・伸張された後,TVモニター40及び多重・ネットワークインタフェース90へ送出される。なお場合に応じて,画像圧縮・伸張部30から顔検出部20へは動きベクトルの情報が送出される。
【0023】
一方,マイク50に集音された音声は音声方向検出部60により音声の方向が検出される。検出された音声方向のデータは顔検出部20へ送出される。また,音声は音声方向検出部60から音声圧縮・伸張部70へ送出され,必要に応じ圧縮・伸張された後,スピーカー80及び多重・ネットワークインタフェース90へ送出される。
【0024】
図2は,顔検出部20の処理内容を説明するための機能ブロック図である。図2に示すように,入力画像スケール変換部202,ウィンドウ切出部204,テンプレートマッチング部206,前処理部208,パターン識別部210,重なり判定部212に分けることができる。以下,各部の機能について概略的に説明する。
【0025】
入力画像スケール変換部202は,CCDカメラ10(図1)からの画像信号に基づくフレーム画像を不図示の内部メモリから読み出して,フレーム画像を縮小率が相異なる複数のスケール画像に変換する。例えば,25344(=176×144)画素からなるフレーム画像に対して,これを0.8倍ずつ順次縮小して5段階(1倍,0.8倍,0.64倍,0.51倍,0.41倍)のスケール画像に変換することが考えられる。
【0026】
ウィンドウ切出部204は,これらの複数のスケール画像のうち,まず1番目のスケール画像に対して,所定の画素量の矩形領域を順次切り出す。以下,この切り出した領域をウィンドウ画像と呼ぶ。
【0027】
そして,ウィンドウ切出部204は,1番目のスケール画像から切り出した複数のウィンドウ画像のうち先頭のウィンドウ画像を後段のテンプレートマッチング部206に送出する。
【0028】
テンプレートマッチング部206は,ウィンドウ切出部204から得られた先頭のウィンドウ画像について,当該ウィンドウ画像が顔画像か否かを判断する。ここで,テンプレートマッチング部206では,例えば100人程度の人物の平均的な顔画像をテンプレートとして,当該ウィンドウ画像との大まかなマッチングをとり得るようになされている。
【0029】
テンプレートマッチング部206で顔画像であると判断されたウィンドウ画像はスコア画像として後段の前処理部208に送出され,顔画像でないと判断された当該ウィンドウ画像はそのまま後段の重なり判定部212に送出される。
【0030】
前処理部208では,スコア画像について人間の顔画像と無関係である背景部分に相当する領域を除去し,撮影時の照明による濃淡,コントラスト等を補正する。さらに前処理部208では,スコア画像をベクトル変換して,パターン識別部210に送出する。
【0031】
パターン識別部210では,ここではサポートベクタマシンを用いてベクトルとして得られたスコア画像に対して顔データが存在するか否かを判断する。顔データが存在する場合は,画像の位置や大きさ,縮小率等をリスト化し,リストデータとして内部メモリに格納する。
【0032】
また,パターン識別部210は,ウィンドウ切出部204に対して先頭のウィンドウ画像について顔検出が終了した旨を通知する。この通知によりウィンドウ切出部204は次のウィンドウ画像テンプレートマッチング部206に送出する。パターン識別部210は,入力画像スケール変換部202に対して1番目のスケール画像について顔検出が終了した旨を通知する。この通知により入力画像スケール変換部202は2番目のスケール画像をウィンドウ切出部204に送出する。
【0033】
重なり判定部212は,内部メモリに格納されている複数のリストデータを読み出して,リストデータに含まれるスコア画像同士を比較して,重なり合う部分を含むか否かを判定し,その判定結果に基づいてスコア画像同士で重なり合う部分を除去し,各スケール画像において,複数のスコア画像から最終的に重なることなく寄せ集めた単一の画像領域を得,画像領域を顔決定データとして新たに内部メモリに格納する。
【0034】
なお,重なり判定部212は,テンプレートマッチング部206において顔画像でないと判断された場合には,そのまま何もすることなく,内部メモリの格納も行わない。
【0035】
このようにして,元のフレーム画像から顔画像を検出することができる。上記のような操作は演算量が膨大である。そこで,本実施の形態にかかる顔検出部20は,演算量を軽減するために,上記の機能に加えて,以下に説明する種種の機能を有する。
【0036】
(1) フレーム飛ばし探索機能
連続した動画像の中に含まれる人間の顔を認識する場合,毎フレーム,画像のすべての領域をパターンマッチングするのは非常に計算時間を要する。そこで,フレーム内すべての領域にわたってパターンマッチングによる顔探索を行うフレーム(以下,このフレームを全探索フレームと呼ぶ)と,全く顔の探索を行わないフレーム(以下,このフレームを非探索フレームと呼ぶ)と,を設定する。
【0037】
また,認識対象が人間の顔の場合,ひとつのビデオカメラで撮影された連続した動画においては,フレーム間で人間の顔の位置が動く範囲は通常の人間の移動速度などから判定して限られた範囲である。したがって突然画面の端から端に人間の位置が飛ぶことはほとんどありえず,画面内の上下左右のある限られた範囲内に顔が移動している方が多い。
【0038】
よって,上記2種類のフレームに加え,さらに前の画像で顔の場所が特定されたフレームを基準にして周辺領域を探索するフレーム,すなわち近傍探索するフレーム(以下,このフレームを近傍探索フレームと呼ぶ)を設定する。このように,全探索フレーム,非探索フレーム,近傍探索フレームの3種類のフレームを設けて探索を行うことにする。
【0039】
探索の仕方としてはまず,連続したフレームのうち,複数の非探索フレームの間に全探索フレームを所定の周期で設ける。そして,一度顔の存在を検出したら,その近傍のみを探索範囲として定義し,近傍探索フレームを設けることにする。
【0040】
図3に上記3種類のフレームを設けた場合の概念図を示す。図3では区別するために,全探索フレームAは黒塗り,非探索フレームBは白抜き,近傍探索フレームCは斜線付き,で示している。横方向は時間を示し,各フレームが図3に示すように時系列で設けられている様子を示す。
【0041】
すなわち,多数の非探索フレームBの中に全探索フレームAを一定の周期で設け,先頭の全探索フレームAで顔の存在を検出した場合として,その後に近傍探索フレームCを設けている。
【0042】
例えばNTSC方式のように30フレーム/秒の動画像を入力している場合,30枚に1枚だけ全探索フレームとし,残りを非探索フレームとする。この場合,1秒に一回のみ全探索を行えばよく,毎フレームを全探索する場合と比較して1/30の計算量にすることができる。最初に顔を検出するまではこのように全探索フレームを一定周期で設けることで処理する。顔検出や顔認識に伴う計算処理量を削減するためには,連続する動画像に非探索フレームを多数設けることが好ましい。
【0043】
図4に近傍探索フレームの探索範囲の例を示す。なお,この例ではカメラは静止しているものとする。図4では,前の探索フレームで顔検出された範囲f1,次の近傍探索フレームで探索する範囲f2,次の近傍探索フレームで探索しない範囲f3が示されている。範囲f3は,画像全体(図4における最外枠で示される範囲)から範囲f2を除いた範囲を指す。範囲f1は人間の顔の部分を示し,範囲f2は範囲f1を中心としてその近傍を含む範囲となっている。
【0044】
上記のように近傍探索フレームを設けることにより,前述の画像のスケーリング処理の回数を削減するとともに,パターンマッチングの処理を削減することが可能になる。例えば従来では前述の入力画像スケール変換部202において,フレーム内すべての領域にわたって顔探索を行い0.8倍ずつの5段階のスケーリング映像を作っていた。これに対して本実施の形態では,近傍探索フレームで前回の探索フレームで検出されたスケーリング段階とその前後1段階ずつの計3段階のスケーリング画像に減らすといったことが可能である。
【0045】
また,テンプレートマッチングに使うウィンドウ画像の切り出しにおいて,通常スケーリング映像の範囲すべてについて行うところを,前回の検出座標の近傍範囲のみに限定して行うことで計算量を大幅に削減することが可能になる。
【0046】
このような近傍探索フレームを例えば5枚に1枚挿入することで,人間の動きになめらかに追随することができるようになるとともに,全探索フレームの頻度を減らして計算量を削減することが可能になる。
【0047】
また,近傍探索のスケーリング処理において,顔がスケーリング画像の中央にくるようなスケーリング画像の切り出しをすることによって,スケーリング画像の境目に顔がかかる確率を減らすことが可能になる。
【0048】
(2) 対象物の大きさに応じた探索範囲の限定機能
近傍探索において,検出・認識する対象物の大きさに依存して探索範囲を限定する。人間の顔画像が画面内に大きく写っている場合と,小さく写っている場合では,人間が顔を移動させた移動量が同程度であっても,画面に映る移動の範囲が異なるという特性を利用することを考える。
【0049】
例えば,顔画像が大きく写っている場合は,顔やカメラの移動量が小量であっても,隣接する探索フレーム間では画面上の顔の位置が大きく変化することがあり,探索範囲を比較的広くとる必要がある。一方,顔画像が小さく写っている場合は,隣接する探索フレーム間で画面上の顔の位置はさほど変わらないため,探索範囲は比較的狭くて良い。この特性と,スケーリングアルゴリズムを組み合わせることで,探索するスケーリング画像を減らすことが可能となる。
【0050】
(3)カメラとの連動による探索範囲の調整機能
カメラ自体が左右にパンされた場合などは,画面内の顔画像もカメラの動きに応じて移動することが予想されるので,その特性を応用することができる。近傍探索において,探索する領域を決定する際に,画像を撮影するCCDカメラ10(図1)の動き情報と連動することで,さらに探索範囲を狭めたり,探索精度を向上させることが可能になる。
【0051】
例えば電動PTZ機構を有する首振りカメラを使用したTV会議システムを例にとると,カメラを右にパンした場合,映像に含まれる顔画像は左に動くことが予想される。また,その際の動き量は,顔画像の大きさとズーム量(画角)から予想することが可能であり,その動き予測を用いることで精度を向上することができる。なお,パンした場合だけでなく,カメラをチルトした場合も同様である。
【0052】
(4)音声方向検出との組み合わせによる探索範囲の縮小機能
2個あるいは3個程度のマイクアレーを使用して,そのマイクアレーに到達する音声の時間差から音源の方向を検出する音声方向検出技術が知られている。このような公知技術を利用して,マイク50(図1)をマイクアレーで構成し,音声方向検出部60(図1)に音声方向検出回路を持たせて,組み合わせて使用することにより,音源の方向を検出できる。
【0053】
例えばTV会議における話者にカメラを向けるアプリケーションにおいて,音声がする方向を大まかに音声方向検出回路により検出し,その検出結果を顔検出回路に伝達することにより,音源方向と思われる方向の近傍だけをパターンマッチング探索することが可能になる。これにより,パターンマッチングの処理が軽減される。
【0054】
(5)動きベクトルの利用による探索範囲の限定機能
画像圧縮・伸張部30での処理により,前フレームから現フレームまでの間に,対象物である顔が移動した方向と距離を表す動きベクトルが得られる。この動きベクトルを戻すことにより,カメラのズーム量や移動角度等の情報を用いずに探索範囲を限定でき,顔を検出することが可能である。
【0055】
(6)静止物体の排除機能
壁に人物の写真を含むポスターが貼ってあり,それも含めて画像内に取り込んだ場合等,人物の写真が画面の中に映っている場合は,通常のパターンマッチングによる顔検出手法では人間であると認識してしまい,アプリケーション上支障が出る場合がある。また,たまたま人間の顔に似た特徴を持つ模様があり,それを画像内に取り込んだ場合等,顔検出アルゴリズムが誤検出する場合もある。
【0056】
本来の検出対象物は生身の人間の顔であり,上記のようなものは検出対象物とは異なる。このような誤検出するのを防ぐために,「生きている人間は普通じっとしていることはない」という特性を利用する。仮にカメラの向きや倍率が固定されているときに,毎回画面上のまったく同じ場所に,同じ大きさの顔画像が検出されている場合,それは静止物体であると判定して検出対象から除外するアルゴリズムを追加することで,このような誤検出を排除することができる。例えば,連続する10枚の探索フレームの全てにおいて,毎回同じスケーリング倍率の同じ画素位置に顔画像が検出された場合は,これは静止物体であると判別し,顔として検出しないことにする。
【0057】
以上述べたように,本実施の形態によれば,画像から人間の顔を検出するにあたり,計算処理量を大幅に削減することが可能になる。これにより,安価なデバイスを使用してシステム構築ができたり,CPU(Central Processing Unit)の負荷が減ることによる消費電力の低減などの効果がある。また,低い計算処理量でありながら,誤検出を低減することができ,検出精度を向上させることが出来る。
【0058】
本実施の形態の画像検出装置及び画像検出方法は,TV会議システム以外にも,ロボット,監視システム等に適用可能であり,検出装置に限定されず,認識装置等にも適用可能なことは言うまでもない。また,上記説明では,検出する対象物を人間の顔とした場合を例にとり説明したが,必ずしもこれに限定するものではなく,他の物体を検出・認識対象とする検索システムにおいて同様の応用をすることが可能である。例えば検出・認識する対象物を車として,駐車場管理システムに本発明を適用することも考えられる。
【0059】
なお,上記説明では,非探索フレーム,全探索フレーム,近傍探索フレームのようにフレーム単位で設定した例を挙げて説明したが,フレームをフィールドに置き換えて,非探索フィールド,全探索フィールド,近傍探索フィールドのようにフィールド単位で設定することも当然考えられる。
【0060】
以上,添付図面を参照しながら本発明にかかる好適な実施形態について説明したが,本発明はかかる例に限定されないことは言うまでもない。当業者であれば,特許請求の範囲に記載された技術的思想の範疇内において,各種の変更例または修正例に想到し得ることは明らかであり,それらについても当然に本発明の技術的範囲に属するものと了解される。
【0061】
【発明の効果】
以上,詳細に説明したように本発明によれば,画像内の所定の対象物を検出するにあたり,演算量の軽減を推進可能な画像検出装置及び画像を提供することができる。
【図面の簡単な説明】
【図1】 本発明の1実施の形態にかかる画像検出装置の構成図である。
【図2】 顔検出部の処理内容を説明するための機能ブロック図である。
【図3】 各種フレームを設定した場合の概念図である。
【図4】 近傍探索フレームの探索範囲の例を示す図である。
【符号の説明】
10 CCDカメラ
20 顔検出部
30 画像圧縮・伸張部
50 マイク
60 音声方向検出部
202 入力画像スケール変換部
204 ウィンドウ切出部
206 テンプレートマッチング部
208 前処理部
210 パターン識別部
212 重なり判定部
A 全探索フレーム
B 非探索フレーム
C 近傍探索フレーム

Claims (12)

  1. 連続したフレーム画像のうち,前記フレーム画像内の所定の対象物を全く探索しない非探索フレームと,前記非探索フレームの間に所定の周期で設けられ,前記所定の対象物を前記フレーム画像内全ての領域にわたって探索する全探索フレームとを設定し,
    前記全探索フレームにおいて前記所定の対象物を検出し,
    前記全探索フレームで前記所定の対象物が検出されたフレームの後に,前記フレーム画像を縮小率が相異なる複数段階の複数のスケール画像に変換して,前記複数のスケール画像内の前記所定の対象物の位置の近傍を中心に探索する近傍探索フレームを設定して,前記近傍探索フレームにおいて前記スケール画像内の前記所定の対象物を検出し,
    前記近傍探索フレームで前記所定の対象物が検出されたとき,前記所定の対象物が検出されたスケール画像の段階を含みつつ,先の前記変換時より少ない段階数の複数のスケール画像に変換して,次の近傍探索フレームにおいて前記スケール画像内の前記所定の対象物を検出する検出手段を有する,画像検出装置。
  2. 前記検出手段は,前記近傍探索フレームにおける探索範囲を,検出された前記所定の対象物の大きさに応じて決定する,請求項に記載の画像検出装置。
  3. 前記検出手段は,前記近傍探索フレームにおける探索範囲に,前記画像を撮影している撮影手段のズーム量および移動角度に基づき調整を加える,請求項に記載の画像検出装置。
  4. 前記検出手段は,前記近傍探索フレームにおける探索範囲を,動きベクトルを用いることにより決定する,請求項に記載の画像検出装置。
  5. 前記検出手段は,所定のフレームにわたって全く動かない対象物を検出対象から除外する,請求項1に記載の画像検出装置。
  6. 音源の方向を検出する音声方向検出手段を更に有し,
    前記検出手段は,検出された前記音源の方向の近傍のみを前記近傍探索フレームにおける探索範囲として決定する,請求項1に記載の画像検出装置。
  7. 連続したフレーム画像のうち,前記フレーム画像内の所定の対象物を全く探索しない非探索フレームと,前記非探索フレームの間に所定の周期で設けられ,前記所定の対象物を前記フレーム画像内全ての領域にわたって探索する全探索フレームとを設定し,
    前記全探索フレームにおいて前記所定の対象物を検出し,
    前記全探索フレームで前記所定の対象物が検出されたフレームの後に,前記フレーム画像を縮小率が相異なる複数段階の複数のスケール画像に変換して,前記複数のスケール画像内の前記所定の対象物の位置の近傍を中心に探索する近傍探索フレームを設定して,前記近傍探索フレームにおいて前記スケール画像内の前記所定の対象物を検出し,
    前記近傍探索フレームで前記所定の対象物が検出されたとき,前記所定の対象物が検出されたスケール画像の段階を含みつつ,先の前記変換時より少ない段階数の複数のスケール画像に変換し,次の近傍探索フレームにおいて前記スケール画像内の前記所定の対象物を検出する,画像検出方法。
  8. 前記近傍探索フレームにおける探索範囲を,検出された前記所定の対象物の大きさに応じて決定する,請求項に記載の画像検出方法。
  9. 前記近傍探索フレームにおける探索範囲に,前記画像を撮影している撮影手段のズーム量および移動角度に基づき調整を加える,請求項に記載の画像検出方法。
  10. 前記近傍探索フレームにおける探索範囲を,動きベクトルを用いることにより決定する,請求項に記載の画像検出方法。
  11. 所定のフレームにわたって全く動かない対象物を検出対象から除外する,請求項に記載の画像検出方法。
  12. 音源の方向を検出し,
    検出された前記音源の方向の近傍のみを前記近傍探索フレームにおける探索範囲として決定する,請求項7に記載の画像検出装置。
JP2002339654A 2002-11-22 2002-11-22 画像検出装置及び画像検出方法 Expired - Fee Related JP4281338B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002339654A JP4281338B2 (ja) 2002-11-22 2002-11-22 画像検出装置及び画像検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002339654A JP4281338B2 (ja) 2002-11-22 2002-11-22 画像検出装置及び画像検出方法

Publications (2)

Publication Number Publication Date
JP2004171490A JP2004171490A (ja) 2004-06-17
JP4281338B2 true JP4281338B2 (ja) 2009-06-17

Family

ID=32702561

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002339654A Expired - Fee Related JP4281338B2 (ja) 2002-11-22 2002-11-22 画像検出装置及び画像検出方法

Country Status (1)

Country Link
JP (1) JP4281338B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12046044B2 (en) * 2017-03-30 2024-07-23 Nec Corporation Information processing apparatus, control method, and program

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4779610B2 (ja) * 2005-12-02 2011-09-28 オムロン株式会社 画像処理装置および方法、並びにプログラム
JP4732299B2 (ja) 2006-10-25 2011-07-27 富士フイルム株式会社 特定被写体像の検出方法およびデジタルカメラ
JP4863936B2 (ja) * 2007-06-25 2012-01-25 株式会社ソニー・コンピュータエンタテインメント 符号化処理装置および符号化処理方法
BRPI0917133B1 (pt) * 2008-08-22 2021-03-02 Sony Corporation dispositivo de exibição de imagem, método de controle, e, meio de armazenamento legível por computador
JP5066497B2 (ja) * 2008-09-09 2012-11-07 富士フイルム株式会社 顔検出装置及び方法
JP4719825B2 (ja) 2008-09-17 2011-07-06 富士通株式会社 画像処理装置、画像処理方法および画像処理プログラム
JP5247338B2 (ja) 2008-10-03 2013-07-24 キヤノン株式会社 画像処理装置及び画像処理方法
JP5625995B2 (ja) 2010-05-10 2014-11-19 カシオ計算機株式会社 被写体追跡装置、被写体追跡方法及びプログラム
JP2013074570A (ja) * 2011-09-29 2013-04-22 Sanyo Electric Co Ltd 電子カメラ
CN103248855B (zh) * 2012-02-07 2016-12-14 北京同步科技有限公司 基于固定机位的课程录制***、视频处理装置和录课方法
JP6220079B2 (ja) * 2014-09-08 2017-10-25 日本電信電話株式会社 表示制御装置、表示制御方法および表示制御プログラム
JP6993282B2 (ja) * 2018-04-12 2022-01-13 Kddi株式会社 情報端末装置、プログラム及び方法
JP6996538B2 (ja) * 2019-10-17 2022-01-17 ソニーグループ株式会社 画像処理装置、画像処理方法、および画像処理システム
CN112336381B (zh) * 2020-11-07 2022-04-22 吉林大学 一种基于深度学习的超声心动图收缩/舒张末期帧自动识别方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12046044B2 (en) * 2017-03-30 2024-07-23 Nec Corporation Information processing apparatus, control method, and program
US12046043B2 (en) 2017-03-30 2024-07-23 Nec Corporation Information processing apparatus, control method, and program

Also Published As

Publication number Publication date
JP2004171490A (ja) 2004-06-17

Similar Documents

Publication Publication Date Title
JP7140580B2 (ja) ステレオ撮像装置
JP4281338B2 (ja) 画像検出装置及び画像検出方法
JP4770178B2 (ja) カメラ制御装置、カメラシステム、電子会議システムおよびカメラ制御方法
US7355627B2 (en) Moving object monitoring surveillance apparatus for detecting, tracking and identifying a moving object by zooming in on a detected flesh color
US8159537B2 (en) Video surveillance equipment and video surveillance system
JP4715909B2 (ja) 画像処理装置及び方法、画像処理システム、並びに、画像処理プログラム
US6961447B2 (en) Image monitoring method, image monitoring apparatus and storage media
JP3801137B2 (ja) 侵入物体検出装置
JP6768537B2 (ja) 画像処理装置、画像処理方法、プログラム
US20070222858A1 (en) Monitoring system, monitoring method and program therefor
JP2001339703A (ja) テレビ会議システム及びテレビ会議システムに於けるカメラの制御装置並びにカメラの制御方法
JP4794938B2 (ja) 監視システム、監視装置、監視方法、及びプログラム
JP2016039539A (ja) 画像処理装置、画像処理方法およびプログラム
JP2006318364A (ja) 画像処理装置
JP2005173787A (ja) 移動物体の検出・認識を行う画像処理装置
JP5911227B2 (ja) 判定装置、判定方法及びプログラム
JP5247338B2 (ja) 画像処理装置及び画像処理方法
JP2009124644A (ja) 画像処理装置、撮像装置及び画像再生装置
JP5029986B2 (ja) 情報処理装置、プログラム
US7835552B2 (en) Image capturing apparatus and face area extraction method
JP3227179B2 (ja) 動物体検出および追跡処理方式
JP2004228770A (ja) 画像処理システム
TWI389060B (zh) 智慧型監控系統及其方法
KR100536747B1 (ko) 팬/틸트/줌 카메라를 이용한 영상 보안 시스템 및 방법
JP2000092368A (ja) カメラ制御装置及びコンピュータ読み取り可能な記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050909

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081202

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090224

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090309

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120327

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130327

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees