JP2017151536A - 画像処理装置、制御プログラム及び領域特定方法 - Google Patents

画像処理装置、制御プログラム及び領域特定方法 Download PDF

Info

Publication number
JP2017151536A
JP2017151536A JP2016031097A JP2016031097A JP2017151536A JP 2017151536 A JP2017151536 A JP 2017151536A JP 2016031097 A JP2016031097 A JP 2016031097A JP 2016031097 A JP2016031097 A JP 2016031097A JP 2017151536 A JP2017151536 A JP 2017151536A
Authority
JP
Japan
Prior art keywords
value
pixel
map
region
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016031097A
Other languages
English (en)
Inventor
健太 永峰
Kenta Nagamine
健太 永峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MegaChips Corp
Original Assignee
MegaChips Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MegaChips Corp filed Critical MegaChips Corp
Priority to JP2016031097A priority Critical patent/JP2017151536A/ja
Publication of JP2017151536A publication Critical patent/JP2017151536A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】フレーム画像において検出対象物が写る領域を適切に特定することが可能な技術を提供する。【解決手段】第1特定部は、フレーム間での物体の動きを示す動き領域を特定する第1特定処理を行う。第2特定部は、動画像に基づいて、当該動画像に含まれるフレーム画像において、静止している検出対象物が写る静止対象物領域の候補となる第1候補領域を特定する第2特定処理を行う。第1マップ更新部は、第1更新処理において、第1マップにおける、動き領域に対応する第1の値を第1所定値だけ増加し、第1マップにおける、動き領域に対応しない第1の値を第2所定値だけ減少する。第1特定処理及び第1更新処理は繰り返し実行される。第3特定部は、第1マップ及び第1候補領域に基づいて、フレーム画像において、静止している検出対象物が写る静止対象物領域を特定する。【選択図】図3

Description

本発明は、画像処理技術に関する。
特許文献1〜5に記載されているように、従来から様々な画像処理技術が提案されています。
特開2015−158837号公報 特開2015−125696号公報 特開2013−65151号公報 特開2011−123742号公報 特開2010−3177号公報
特許文献1及び2等に記載されているように、フレーム画像において検出対象物が写る領域を特定する場合には、当該領域を適切に特定できることが望まれる。
そこで、本発明は上述の点に鑑みて成されたものであり、フレーム画像において検出対象物が写る領域を適切に特定することが可能な技術を提供することを目的とする。
画像処理装置の一態様は、移動体である検出対象物が写る動画像についてのフレーム間差分を示す差分画像を生成し、生成した差分画像において、フレーム間での物体の動きを示す動き領域を特定する第1特定処理を行う第1特定部と、前記フレーム画像に含まれる複数の画素にそれぞれ対応する複数の第1の値が、当該複数の画素の位置に応じて並ぶ第1マップを更新する第1更新処理を行う第1マップ更新部と、前記動画像に基づいて、当該動画像に含まれるフレーム画像において、静止している前記検出対象物が写る静止対象物領域の候補となる第1候補領域を特定する第2特定処理を行う第2特定部とを備え、前記第1マップ更新部は、前記第1更新処理において、前記第1マップにおける、前記動き領域に対応する前記第1の値を第1所定値だけ増加し、前記第1マップにおける、前記動き領域に対応しない前記第1の値を第2所定値だけ減少し、前記第1特定処理及び前記第1更新処理は繰り返し実行され、前記第1更新処理が行われた前記第1マップ及び前記第1候補領域に基づいて、前記静止対象物領域を特定する第3特定部をさらに備える。
また、画像処理置の一態様では、前記フレーム画像に含まれる複数の画素にそれぞれ対応する複数の第2の値が、当該複数の画素の位置に応じて並ぶ第2マップを更新する第2更新処理を繰り返し行う第2マップ更新部がさらに設けられ、前記第2マップ更新部は、前記第2更新処理において、前記第2マップにおける、前記動き領域に対応する前記第2の値を、前記第1所定値以上の第3所定値だけ増加し、前記第2マップにおける、前記動き領域に対応しない前記第2の値を、前記第2所定値よりも大きい第4所定値だけ減少し、前記第2マップ更新部は、前記第1更新処理が行われた前記第1マップにおける、前記静止対象物領域に対応する前記第1の値を、前記第2更新処理が行われた前記第2マップにおける、前記静止対象物領域に対応する前記第2の値に加算する補正処理を行い、前記補正処理が行われた前記第2マップに基づいて、前記フレーム画像において、前記検出対象物が写る前景領域を特定する第4特定部をさらに備える。
また、画像処理装置の一態様では、前記第4特定部は、前記前景領域を暫定的に特定し、前記第4特定部が暫定的に特定した前記前景領域である第2候補領域と前記フレーム画像とに基づいて第1背景モデルを更新する背景モデル更新部と、前記フレーム画像に含まれる対象画素が、前記検出対象物を示す前景画素か背景画素かを、前記第1背景モデルに含まれる、当該対象画素に対応する背景情報に基づいて判定する判定部とがさらに設けられ、前記第1背景モデルは、過去の前記フレーム画像の画素値をモデル化した混合正規分布に基づく背景モデルであって、前記背景モデル更新部は、前記対象画素の画素値に基づいて、当該対象画素に対応する前記混合正規分布を更新し、更新後の前記混合正規分布に含まれる複数の正規分布から、当該対象画素に対応する前記背景情報として使用する正規分布を決定し、前記判定部は、前記正規分布の所定範囲内に前記対象画素の画素値が存在する場合、当該正規分布を適合正規分布とし、前記判定部は、前記対象画素に対応する前記背景情報に前記適合正規分布が含まれる場合、当該対象画素は前記背景画素であると判定し、前記対象画素に対応する前記背景情報に前記適合正規分布が含まれない場合、当該対象画素は前記前景画素であると判定し、前記背景モデル更新部は、前記対象画素が前記第2候補領域に含まれない場合には、前記対象画素に応じた前記混合正規分布を更新する際の学習率を第3の値に設定し、前記対象画素が前記第2候補領域に含まれる場合には、前記学習率を、前記第3の値よりも小さい第4の値に設定する。
また、画像処理装置の一態様では、前記第3特定部は、前記フレーム画像に含まれる複数の画素にそれぞれ対応する複数の第5の値が、当該複数の画素の位置に応じて並ぶ第3マップを更新する第3更新処理を繰り返し実行する第3マップ更新部を有し、前記第3マップ更新部は、前記第3更新処理において、前記第1更新処理が行われた前記第1マップにおける、前記第1候補領域に対応する前記第1の値を、前記第3マップにおける、前記第1候補領域に対応する前記第5の値として採用するコピー処理を実行し、前記第3マップにおいて、前記コピー処理が実行される前記第5の値以外の前記第5の値を、前記第2所定値よりも大きい第5所定値だけ減少し、前記第3特定部は、前記第3更新処理が行われた前記第3マップに基づいて前記静止対象物領域を特定する。
また、画像処理装置の一態様では、前記第3マップ更新部は、前記フレーム画像において、前記検出対象物が写る可能性が高い、互いに独立した複数の独立領域を特定し、前記第3マップ更新部は、前記第1マップにおける、前記第1候補領域を含む前記独立領域に対応する前記第1の値を、前記第3マップにおける、前記第1候補領域を含む前記独立領域に対応する前記第5の値として採用する。
また、画像処理装置の一態様では、前記静止対象物領域と前記フレーム画像とに基づいて第1背景モデルを更新する背景モデル更新部と、前記フレーム画像に含まれる対象画素が、前記検出対象物を示す前景画素か背景画素かを、前記第1背景モデルに含まれる、当該対象画素に対応する背景情報に基づいて判定する判定部とがさらに設けられ、前記第1背景モデルは、過去の前記フレーム画像の画素値をモデル化した混合正規分布に基づく背景モデルであって、前記背景モデル更新部は、前記対象画素の画素値に基づいて、当該対象画素に対応する前記混合正規分布を更新し、更新後の前記混合正規分布に含まれる複数の正規分布から、当該対象画素に対応する前記背景情報として使用する正規分布を決定し、前記判定部は、前記正規分布の所定範囲内に前記対象画素の画素値が存在する場合、当該正規分布を適合正規分布とし、前記判定部は、前記対象画素に対応する前記背景情報に前記適合正規分布が含まれる場合、当該対象画素は前記背景画素であると判定し、前記対象画素に対応する前記背景情報に前記適合正規分布が含まれない場合、当該対象画素は前記前景画素であると判定し、前記背景モデル更新部は、前記対象画素が前記静止対象物領域に含まれない場合には、前記対象画素に応じた前記混合正規分布を更新する際の学習率を第3の値に設定し、前記対象画素が前記静止対象物領域に含まれる場合には、前記学習率を、前記第3の値よりも小さい第4の値に設定する。
また、画像処理装置の一態様では、前記判定部は、前記対象画素の画素値が、前記正規分布の前記所定範囲内に存在しない場合であっても、前記対象画素の画素値が、当該正規分布の平均値よりも小さい下限値よりも大きくあるいは当該下限値以上であって、かつ当該平均値以下あるいは当該平均値未満の場合には、例外的に、当該正規分布を前記適合正規分布とする。
また、画像処理装置の一態様では、前記動画像に写る撮影領域の明るさの変化を検出する検出部をさらに備え、前記背景モデル更新部は、前記検出部が前記変化を検出した場合、前記学習率を、前記第3及び第4の値よりも大きい第5の値に所定期間設定する。
また、画像処理装置の一態様では、前記第2特定部は、前記フレーム画像の各画素について、当該画素の画素値の変化量を示す第1評価値と、当該画素の画素値の分散を示す第2評価値とを求め、第2背景モデルと、前記フレーム画像の各画素についての前記第1及び第2評価値に基づいて、前記第1候補領域を特定する。
また、制御プログラムの一態様は、画像処理装置を制御するための制御プログラムであって、前記画像処理装置に、(a)移動体である検出対象物が写る動画像についてのフレーム間差分を示す差分画像を生成し、生成した差分画像において、フレーム間での物体の動きを示す動き領域を特定する工程と、(b)前記フレーム画像に含まれる複数の画素にそれぞれ対応する複数の値が、当該複数の画素の位置に応じて並ぶマップを更新する工程と、(c)前記動画像に基づいて、当該動画像に含まれるフレーム画像において、静止している前記検出対象物が写る静止対象物領域の候補となる候補領域を特定する工程とを実行させ、前記工程(b)において、(b−1)前記マップにおける、前記動き領域に対応する前記値を第1所定値だけ増加する工程と、(b−2)前記マップにおける、前記動き領域に対応しない前記値を第2所定値だけ減少する工程とを実行させ、前記工程(a),(b)を繰り返し実行させ、(d)前記工程(b)で更新された前記マップ及び前記候補領域に基づいて、前記フレーム画像において、静止している前記検出対象物が写る静止対象物領域を特定する工程を実行させるためのものである。
また、領域特定方法の一態様は、画像処理装置での領域特定方法であって、(a)移動体である検出対象物が写る動画像についてのフレーム間差分を示す差分画像を生成し、静止した差分画像において、フレーム間での物体の動きを示す動き領域を特定する工程と、(b)前記フレーム画像に含まれる複数の画素にそれぞれ対応する複数の値が、当該複数の画素の位置に応じて並ぶマップを更新する工程と、(c)前記動画像に基づいて、当該動画像に含まれるフレーム画像において、静止している前記検出対象物が写る静止対象物領域の候補となる候補領域を特定する工程とを備え、前記工程(b)は、(b−1)前記マップにおける、前記動き領域に対応する前記値を第1所定値だけ増加する工程と、(b−2)前記マップにおける、前記動き領域に対応しない前記値を第2所定値だけ減少する工程とを有し、前記工程(a),(b)は繰り返し実行され、(d)前記工程(b)で更新された前記マップ及び前記候補領域に基づいて、前記フレーム画像において、静止している前記検出対象物が写る静止対象物領域を特定する工程をさらに備える。
フレーム画像において検出対象物が写る領域を適切に特定することができる。
画像処理システムの構成の一例を示す図である。 画像処理システムの構成の一例を示す図である。 画像処理装置の構成の一例を示す図である。 入力フレーム画像の一例を示す図である。 入力フレーム画像の一例を示す図である。 第1背景モデルの構成の一例を示す図である。 出現画素値情報の一例を説明するための図である。 判定部の動作の一例を説明するための図である。 判定部の動作の一例を説明するための図である。 判定部の動作の一例を説明するための図である。 画素単位背景更新処理の一例を示すフローチャートである。 初期学習処理の一例を示すフローチャートである。 画像処理装置の動作の一例を示すフローチャートである。 差分画像の一例を示す図である。 第1マップ(長期保存マップ)の一例を示す図である。 第2マップ(短期保存マップ)の一例を示す図である。 差分画像の一例を示す図である。 差分画像の一部の一例を拡大して示す図である。 第1マップの更新方法の一例を説明するための図である。 第1マップの更新方法の一例を説明するための図である。 差分画像の一部の一例を拡大して示す図である。 第1マップの更新方法の一例を説明するための図である。 第1マップの更新方法の一例を説明するための図である。 差分画像の一例を示す図である。 短期保存マップ画像の一例を示す図である。 長期保存マップ画像の一例を示す図である。 第2背景モデル更新処理の一例を示すフローチャートである。 PSAの一例を説明するための図である。 PSAの一例を説明するための図である。 第1暫定特定処理の一例を示すフローチャートである。 ST2値画像の一例を示す図である。 TR2値画像の一例を示す図である。 ST2値画像から得られる外接矩形の一例を示す図である。 第1候補領域の一例を示す図である。 PSAの一例を説明するための図である。 静止対象物特定処理の一例を示すフローチャートである。 長期保存マップ画像の一例を示す図である。 第1候補領域を包含する対応領域の一例を示す図である。 第2マップ補正処理の一例を説明するための図である。 第2暫定特定処理の一例を示すフローチャートである。 前景候補対応ブロック、前景候補領域及び背景候補領域の一例を示す図である。 画像処理装置の構成の一例を示す図である。 画像処理装置の構成の一例を示す図である。 画像処理装置の構成の一例を示す図である。 画像処理装置の構成の一例を示す図である。 コピー処理の一例を説明するための図である。 静止対象物対応領域及び静止対象物領域の一例を示す図である。 例外的な適合正規分布の一例を示す図である。 画像処理装置の構成の一例を示す図である。
<画像処理システムの構成>
図1は画像処理システム1の構成の一例を示す図である。画像処理システム1は、例えば、移動体を検出対象物とし、画像処理を用いて、所定空間に存在する検出対象物を検出する。画像処理システム1は、例えば、オフィスあるいは学校等に導入される。画像処理システム1は、オフィス等の室内に存在する人を検出する。
図1に示されるように、画像処理システム1は、カメラ2及び画像処理装置3を備える。カメラ2は、例えば、室内の天井に取り付けられる。カメラ2は、例えば全方位カメラであって、室内を俯瞰撮影する。したがって、カメラ2の撮影領域は室内となる。カメラ2は、所定のフレームレート(例えば30fps)で動画像100を撮影して出力する。カメラ2から出力される動画像100は画像処理装置3に入力される。つまり、動画像100を構成する複数枚のフレーム画像101は、順次画像処理装置3に入力される。以後、動画像100を「入力動画像100」と呼ぶことがある。また、入力動画像100のフレーム画像101を「入力フレーム画像101」と呼ぶことがある。
本例では、入力動画像100は、カラー画像であるが、グレースケール画像であっても良い。また、カメラ2は、天井以外に取り付けられても良い。また、カメラ2は全方位カメラ以外であっても良い。
画像処理装置3は、例えば、一種のコンピュータであって、図1に示されるように、プロセッサ4及び記憶部5等を備えている。画像処理装置3は、一種の回路構成であると言える。
プロセッサ4は、例えばCPU(Central Processing Unit)である。記憶部5は、ROM(Read Only Memory)及びRAM(Random Access Memory)等を備えている。ROM及びRAMは、プロセッサ4が読み取り可能な非一時的な記録媒体である。記憶部5には、画像処理装置3(コンピュータ)を制御するための制御プログラム6が記憶されている。制御プログラム6は、例えばROMに記憶されている。プロセッサ4が記憶部5内の制御プログラム6を実行することによって、画像処理装置3には様々な機能ブロックが形成される。
図2は、カメラ2と、プロセッサ4と、記憶部5が備えるROM7及びRAM8との間の電気的接続の一例を示す図である。図2に示されるように、カメラ2と、プロセッサ4と、ROM7と、RAM9とは、例えばバス10を介して互いに電気的に接続される。
なお、画像処理装置3は、複数のプロセッサ4、例えばCPU及びDSP(Digital Signal Processor)を備えても良い。この場合、画像処理装置3の機能は、複数のプロセッサ4が記憶部5内の制御プログラム6を実行することによって実現される。また、画像処理装置3は、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)あるいはPLD(Programmable Logic Device)などを備えても良い。また、画像処理装置3の機能の一部又は全部は、その機能の実現のためにプログラム(ソフトフェア)が不要な、例えば論理回路等を含むハードウェア回路で実現されても良い。また記憶部5は、ROM及びRAM以外の、コンピュータが読み取り可能な非一時的な記録媒体を備えていても良い。記憶部5は、例えば、小型のハードディスクドライブ及びSSD(Solid State Drive)等を備えていても良い。
<画像処理装置の構成>
図3は、プロセッサ4が制御プログラム6を実行することによって画像処理装置3に形成される主な機能ブロックを示す図である。
図3に示されるように、画像処理装置3は、機能ブロックとして、前処理部30、判定部31、背景モデル更新部32,38、動き特定部33、暫定特定部34,36、静止対象物特定部35、後処理部37、第1マップ更新部41及び第2マップ更新部42を備えている。これらの機能ブロックの少なくとも一つは、その機能の実現のためにプログラム(ソフトフェア)が不要な、例えば論理回路等を含むハードウェア回路で実現されても良い。
前処理部30は、カメラ2からの入力動画像100に対して前処理を実行し、前処理後の入力動画像100を入力動画像110として出力する。具体的には、前処理部30は、カメラ2から順次入力される入力フレーム画像101に対してグレースケール変換及びサイズ縮小処理を行い、処理後の入力フレーム画像101を入力フレーム画像111として順次出力する。したがって、前処理部30から出力される入力動画像110はグレースケール画像となる。なお、カメラ2から出力される入力動画像100の形式によっては、前処理部30は不要となる。以後、入力動画像110の入力フレーム画像111の画素を「入力画素」と呼ぶことがある。
図4,5は入力フレーム画像111の一例を示す図である。図5に示される入力フレーム画像111は、図4に示される入力フレーム画像111よりも後に撮影された画像である。図5に示される入力フレーム画像111は、図4に示される入力フレーム画像111よりも、例えば3フレーム後に撮影された画像である。入力フレーム画像111は魚眼画像とも呼ばれる。
図4,5に示されるように、入力フレーム画像111に写る室内300の床320の上には、複数の机330と複数の椅子340とが配置されている。室内300には複数の人200が存在する。具体的には、室内300には3人の人200a,200b,200cが存在している。したがって、入力フレーム画像111には、3人の人200a,200b,200cが写っている。人200a,200b,200cのそれぞれは室内300内を移動している。したがって、図4,5に示される2枚の入力フレーム画像111の間においては人200a,200b,200cの位置が異なっている。
画像処理装置3は、入力フレーム画像111において人200が写る領域を、前景領域(前景画像)として特定することによって、カメラ2の撮影領域内、つまり室内300に存在する人200を検出する。
判定部31は、記憶部5内の第1背景モデル500に基づいて、入力フレーム画像111の入力画素が前景画素か背景画素かを判定する前景判定処理を行う。これにより、入力フレーム画像111において、人が写る前景領域が特定される。第1背景モデル500は、入力動画像110に写る背景をモデル化した情報である。判定部31は、入力画素が、移動している人を示す画素であるか、静止している人を示す画素であるかを区別せずに、人を示す入力画素を前景画素として判定する。
判定部31は、入力フレーム画像111の各入力画素についての前景判定処理を行うと、例えば、その結果を示す判定結果画像150を生成する。判定結果画像150を構成する複数の画素は、入力フレーム画像を構成する複数の入力画素にそれぞれ対応している。判定結果画像150では、前景画素であると判定された入力画素の入力フレーム画像111での相対的な位置と同じ相対的な位置に存在する画素の画素値が1を示す。一方で、判定結果画像150では、背景画素であると判定された入力画素の入力フレーム画像111での相対的な位置と同じ相対的な位置に存在する画素の画素値が0を示す。判定結果画像150を参照することによって、各入力画素についての前景判定処理の結果が理解できる。以後、画素値が1の画素を「高輝度画素」と呼び、画素値が0の画素を「低輝度画素」と呼ぶことがある。また「相対的な位置」を単に「位置」と呼ぶ。
後処理部37は、判定結果画像150に対して後処理を行い、後処理後の判定結果画像150を出力画像151として出力する。出力画像151は、例えば、図示しない表示装置に表示される。なお、出力画像151の使用方法はこの限りではない。
後処理では、判定結果画像150に含まれるノイズが除去される。具体的には、後処理では、最初に孤立点除去が行われ、その後、クロージングが行われる。
孤立点除去では、後処理部37は、判定結果画像150において、その周囲の8個の画素がすべて低輝度画素である高輝度画素を低輝度画素に変更する。クロージングでは、後処理部37は、孤立点除去が行われた判定結果画像150に対して、膨脹をN回(N>1)行った後、収縮をN回行う。判定結果画像150に対して孤立点除去及びクロージングが行われることにより、判定結果画像150に含まれるノイズが除去される。
背景モデル更新部32は、入力フレーム画像111と、記憶部5内の後述する出現画素値情報510とに基づいて、第1背景モデル500を更新する第1背景モデル更新処理を行う。
背景モデル更新部38は、入力フレーム画像111に基づいて、記憶部5内の第2背景モデル550を更新する第2背景モデル更新処理を行う。第2背景モデル550は、入力動画像110に写る背景をモデル化した情報であって、第1背景モデル500とは別の背景モデルである。
動き特定部33は、入力動画像110についてのフレーム間差分を示す差分画像を生成する。そして、動き特定部33は、生成した差分画像において、フレーム間での物体の動きを示す動き領域を特定する動き特定処理を行う。
暫定特定部34は、記憶部5内の第2背景モデル550と入力動画像110に基づいて、入力フレーム画像111において、静止している人が写る静止対象物領域を暫定的に特定する第1暫定特定処理を行う。言い換えれば、暫定特定部34は、入力フレーム画像111において、静止している人(検出対象物)が写る静止対象物領域の候補となる第1候補領域を特定する。第1候補領域は、暫定的に特定された静止対象物領域である。
第1マップ更新部41は、動き特定部33で特定される動き領域に基づいて、記憶部5内の第1マップ410を更新する第1マップ更新処理を行う。第1マップ410は、物体の動きについての比較的最近の発生頻度の室内での分布を示す情報である。
静止対象物特定部35は、第1マップ410と、前記暫定特定部34で特定される第1候補領域とに基づいて、入力フレーム画像111において、静止対象物領域を特定する静止対象物特定処理を行う。
第2マップ更新部42は、動き特定部33で特定される動き領域に基づいて、記憶部5内の第2マップ420を更新する第2マップ更新処理を行う。また、第2マップ更新部42は、第1マップ410と、静止対象物特定部35で特定される静止対象物領域とに基づいて、第2マップ420を補正する第2マップ補正処理を行う。第2マップ420は、入力画素が前景画素である可能性を示す値についての入力フレーム画像111での分布を示す情報である。
暫定特定部36は、第2マップ420に基づいて、入力フレーム画像111において、人が写る前景領域を暫定的に特定する第2暫定特定処理を行う。言い換えれば、暫定特定部36は、第2マップ420に基づいて、入力フレーム画像111において、人が写る前景領域の候補となる第2候補領域を特定する。この第2候補領域は、暫定的に特定された前景領域である。以後、第2候補領域を「前景候補領域」と呼ぶことがある。背景モデル更新部32は、背景モデル500を使用する際に使用する後述の学習率を、前景候補領域(第2候補領域)に基づいて決定する学習率決定処理を行う。
画像処理装置3は、カメラ2から入力フレーム画像101が入力されるたびに、入力された入力フレーム画像101を処理対象として、前処理、動き特定処理、第1マップ更新処理、第2マップ更新処理、第2背景モデル更新処理、第1暫定特定処理、静止対象物特定処理、第2マップ補正処理、第2暫定特定処理、学習率決定処理、前景判定処理、第1背景モデル更新処理及び後処理を行う。以後、前処理部30が処理対象の入力フレーム画像101に対して前処理を行うことによって得られた入力フレーム画像111を「処理対象の入力フレーム画像111」と呼ぶことがある。
<画像処理装置の詳細動作>
次に画像処理装置3の各構成要素の詳細な動作について説明する。画像処理装置3の動作を理解し易くするために、まず、第1背景モデル500、前景判定処理及び第1背景モデル更新処理について説明する。
<第1背景モデル>
本例では、第1背景モデル500は、過去のフレーム画像の画素値をモデル化した混合正規分布(MoG)に基づく背景モデルである。このような背景モデルの一例については、例えば、上述の特許文献4及び5に開示されている。本例での画素値は例えば輝度である。
図6は第1背景モデル500の構成の一例を示す図である。図6に示されるように、第1背景モデル500では、入力フレーム画像111を構成する複数の画素のそれぞれに対して、少なくとも1つの背景情報501が対応付けられている。背景情報501は正規分布で表されている。以後、背景情報501を「背景正規分布501」と呼ぶことがある。
一方で、記憶部5には出現画素値情報510が記憶されている。出現画素値情報510は、過去のフレーム画像において現れた画素値に関する情報である。出現画素値情報510には、図7に示されるように、入力フレーム画像111を構成する複数の画素にそれぞれ対応する複数の混合正規分布511が含まれている。
混合正規分布511は、それに対応する画素についての過去の画素値をモデル化したものである。混合正規分布511は、それに対応する画素についての画素値ごとの出現確率を示している。言い換えれば、混合正規分布511は、それに対応する画素についての画素値ごとの出現頻度を示している。
混合正規分布511は、複数の正規分布512と、当該複数の正規分布512にそれぞれ設定された複数の重みwとで表される。混合正規分布511に含まれる複数の正規分布512のうちの一部が、当該混合正規分布511に対応する画素に対応する背景正規分布501として採用される。具体的には、混合正規分布511に含まれる複数の正規分布512のうち、重みwがしきい値th_wよりも大きい正規分布512が、当該混合正規分布511に対応する画素に対応する背景正規分布501として採用される。
<前景判定処理の詳細>
判定部31は、前景判定処理において、処理対象の入力フレーム画像111の各入力画素について、当該入力画素が前景画素か背景画素であるか否かを判定する。判定部31は、ある入力画素が前景画素か背景画素であるか否かを判定する場合には、第1背景モデル500における、当該入力画素に対応する背景正規分布501と、出現画素値情報510における、当該入力画素に対応する混合正規分布511とを使用する。以後、説明対象の入力画素を「対象入力画素」と呼ぶことがある。
判定部31は、対象入力画素に対応する混合正規分布511に含まれる複数の正規分布512において、対象入力画素の画素値に適合する正規分布512(以後、「適合正規分布512」と呼ぶことがある)が存在するか否かを判定する。判定部31は、対象入力画素に対応する混合正規分布511に含まれる複数の正規分布512に、適合正規分布512が存在しない場合には、対象入力画素が前景画素であると判定する。
一方で、判定部31は、対象入力画素に対応する混合正規分布511に含まれる複数の正規分布512に適合正規分布512が存在する場合には、第1背景モデル500における、対象入力画素に対応する背景正規分布501において、適合正規分布512と一致する背景正規分布501が存在するか否かを判定する。判定部31は、第1背景モデル500における、対象入力画素に対応する背景正規分布501に、適合正規分布512と一致する背景正規分布501が存在しない場合には、対象入力画素が前景画素であると判定する。これに対して、判定部31は、第1背景モデル500における、対象入力画素に対応する背景正規分布501に、適合正規分布512と一致する背景正規分布501が存在する場合には、対象入力画素が背景画素であると判定する。
判定部31は、入力画素の画素値が、正規分布512の所定範囲内に存在する場合、当該正規分布512を適合正規分布512とする。ここで、正規分布の平均値及び分散値をそれぞれμ及びσで表すと、所定範囲は、例えば、正規分布512のμ±4σの範囲である。
なお、入力画素の画素値が正規分布512に適合するということは、第1背景モデル500における、当該入力画素に対応する、当該正規分布512と同じ背景正規分布501にも適合することを意味する。したがって、判定部31は、第1背景モデル500における、対象入力画素に対応する背景正規分布501に、対象入力画素の画素値に適合する背景正規分布501が存在しない場合には、対象入力画素が前景画素であると判定すると言える。また、判定部31は、第1背景モデル500における、対象入力画素に対応する背景正規分布501に、対象入力画素の画素値に適合する背景正規分布501が存在する場合には、対象入力画素が背景画素であると判定すると言える。
以後、対象入力画素の画素値に適合する適合正規分布512のうち、対象入力画素の画素値が、μ±3σの範囲に存在する適合正規分布511を特に「1次適合正規分布512」と呼ぶ。また、対象入力画素の画素値に適合する適合正規分布512のうち、対象入力画素の画素値が、μ−4σからμ−3σの範囲に存在する適合正規分布511と、μ+3σからμ+4σの範囲に存在する適合正規分布511のそれぞれを特に「2次適合正規分布512」と呼ぶ。図8は、1次適合正規分布512の一例を示す図である。図9は、2次適合正規分布512の一例を示す図である。図10は、入力画素の画素値Xに適合しない正規分布512の一例を示す図である。
<第1背景モデル更新処理の詳細>
第1背景モデル更新処理において、背景モデル更新部32は、処理対象の入力フレーム画像111のある入力画素に対する判定部31での前景判定処理の結果に基づいて、出現画素値情報510での当該ある入力画素に対応する混合正規分布511を更新し、更新後の混合正規分布511に基づいて、第1背景モデル500での当該ある入力画素に対応する背景情報501(背景正規分布501)を更新する処理を行う。この一連の処理を「画素単位背景更新処理」と呼ぶ。背景モデル更新部32は、第1背景モデル更新処理において、入力フレーム画像111の各画素について画素単位背景更新処理を行う。
図11は画素単位背景更新処理を示すフローチャートである。図11を用いて画素単位背景更新処理を説明する。以後、処理対象の入力フレーム画像111の対象入力画素に対応する混合正規分布511を「対象混合正規分布511」と呼ぶ。また、対象入力画素に対応する背景情報501を「対象背景情報501」と呼ぶ。
図11に示されるように、ステップs1において、背景モデル更新部32は、対象入力画素に対する判定部31での前景判定処理の結果に基づいて、対象混合正規分布511を更新する。そしてステップs2において、背景モデル更新部32は、更新後の対象混合正規分布511に基づいて対象背景情報501を更新する。ステップs1はステップs11〜ステップs14で構成されている。
ステップs11において、背景モデル更新部32は、対象混合正規分布511に含まれる各正規分布512の重みwを更新する。背景モデル更新部32は、以下の式(1)に従って重みwを更新する。
式(1)中のw0、w1は、それぞれ、現在の重みw及び更新後の重みwを示している。式(1)中のMは、1あるいは0に設定される値である。対象混合正規分布511に含まれる複数の正規分布512のうち、対象の1次適合正規分布512の重みwを更新する際にはM=1に設定される。そして、対象混合正規分布511に含まれる複数の正規分布512のうち、対象の1次適合正規分布512以外の正規分布512の重みwを更新する際にはM=0に設定される。
ここで、対象の1次適合正規分布512とは、対象混合正規分布511に含まれる複数の正規分布512に、1次適合正規分布512が一つだけ存在する場合には、その1次適合正規分布512を意味する。また、対象の1次適合正規分布512とは、対象混合正規分布511に含まれる複数の正規分布512に、複数の1次適合正規分布512が存在する場合には、当該複数の1次適合正規分布512のうち、対応する重みwの現在値が最大の1次適合正規分布512を意味する。2次適合正規分布512の重みwが更新される際にはM=0に設定される。
式(1)中のαは学習率であって、0<α<1である。学習率αは、重みwを現在の値を元にして更新する際に、現在の値に対して、前景判定処理の結果をどの程度影響させるかを示している。学習率αが大きいほど、更新後の重みwは、前景判定処理の結果の影響を大きく受ける。したがって、学習率αが小さいほど重みwは変化しにくくなる。
背景モデル更新部32は、対象混合正規分布511の複数の重みwを更新すると、更新後の複数の重みwの総和が1となるように各重みwを正規化する。
式(1)から理解できるように、対象の1次適合正規分布512の重みwは大きくなり、それ以外の正規分布512の重みwは小さくなる。
ステップs11の後、ステップs12において、背景モデル更新部32は、対象混合正規分布511に1次適合正規分布512が含まれていると判定すると、ステップs14において、対象の1次適合正規分布512の平均値μ及び分散値σを更新する。
背景モデル更新部32は、以下の式(2)に従って対象の1次適合正規分布512の平均値μを更新する。また、背景モデル更新部32は、以下の式(3)に従って対象の1次適合正規分布512の分散値σを更新する。
式(2)中のμ0、μ1は、それぞれ、更新前の平均値μ及び更新後の平均値μを示している。式(3)中のσ0、σ1は、それぞれ、更新前の分散値σ及び更新後の分散値σを示している。式(2),(3)中のXは、対象入力画素の画素値を示している。
式(2),(3)中のβは学習率を示しており、0<β<1である。式(2)での学習率βは、平均値μを現在の値を元にして更新する際に、現在の値に対して、対象入力画素の画素値Xをどの程度影響させるかを示している。学習率βが大きいほど、更新後の平均値μは、対象入力画素の画素値Xの影響を大きく受ける。したがって、学習率βが小さいほど平均値μは変化しにくくなる。また、式(3)での学習率βは、分散値σを現在の値を元にして更新する際に、現在の値に対して、対象入力画素の画素値Xをどの程度影響させるかを示している。学習率βが大きいほど、更新後の分散値σは、対象入力画素の画素値Xの影響を大きく受ける。したがって、学習率βが小さいほど分散値σは変化しにくくなる。
学習率α,βは例えば以下の式(4),(5)で表される。
式(4)に示されるように、学習率αは、基準値REFに対して定数Aを足し合わせた値である。また式(5)に示されるように、学習率βは、基準値REFに対して定数Bを足し合わせた値である。基準値REFは、固定値であって、学習率α,βで共通に使用される。定数Aは学習率αに固有の値である。定数Bは学習率βに固有の値である。定数Aと定数Bとは互いに異なっている。学習率α,βの値は、後述する学習率決定処理で決定される。
一方で、背景モデル更新部32は、ステップs12において、対象混合正規分布511に第1適合正規分布512が含まれていないと判定すると、ステップs13を実行する。
ステップs13において、背景モデル更新部32は、対象入力画素の画素値を平均値μとした正規分布を新たに作成する。そして、背景モデル更新部32は、対象混合正規分布511に対して新たに作成した正規分布を追加する。ただし、対象混合正規分布511に含まれる複数の正規分布512の数が上限値(例えば5)に達している場合には、背景モデル更新部32は、対象混合正規分布511に含まれる複数の正規分布512のうちの一つ正規分布512を削除して、削除した正規分布512の代わりに新たに作成した正規分布を使用する。背景モデル更新部32は、対象混合正規分布511に含まれる複数の正規分布512のうち、例えば、重みwが最小の正規分布512を削除する。
背景モデル更新部32がステップs13を実行すると、対象混合正規分布511の更新が完了する。つまりステップs1が終了する。また、背景モデル更新部32がステップs14を実行すると、対象混合正規分布511の更新が完了する。
背景モデル更新部32は、ステップs1の後、ステップs2において、更新後の対象混合正規分布511に基づいて対象背景情報501を更新する。具体的には、背景モデル更新部32は、更新後の対象混合正規分布511に含まれる複数の正規分布512から、背景情報501として使用する正規分布512を決定する。背景モデル更新部32は、更新後の対象混合正規分布511に含まれる複数の正規分布511のうち、例えば、重みwがしきい値th_wよりも大きい正規分布512を、背景情報501として使用することを決定する。更新後の対象混合正規分布511に含まれる複数の正規分布511において、重みwがしきい値th_wよりも大きい正規分布512が複数存在する場合には、複数の正規分布512が、背景情報501として使用されると決定される。そして、背景モデル更新部32は、現在の対象背景情報501を、決定した新たな背景情報501に置き換える。これにより、対象背景情報501が更新される。
なお背景更新部32は、更新後の対象混合正規分布511に含まれる複数の正規分布512のうち、重みwがしきい値th_w以上の正規分布512を、背景情報501として使用することを決定しても良い。
以上の説明から理解できるように、対象入力画素において、同程度の画素値が現れる頻度が大きくなれば、対象入力画素に現れる画素値に応じた正規分布512が対象入力画素に対応する背景情報501として採用されるようになる。したがって、対象入力画素において、同程度の画素値が現れる頻度が大きくなれば、対象入力画素は判定部31において背景画素として判定されるようになる。一方で、対象入力画素において、同程度の画素値が現れる頻度が小さくなれば、その画素値に応じた背景正規分布501は削除される。したがって、対象入力画素において、同程度の画素値が現れる頻度が小さくなれば、対象入力画素は判定部31において前景画素として判定されるようになる。
このように、背景モデル更新部32は、対象入力画素において、同程度の画素値が現れる頻度に応じて、第1背景モデル500に含まれる、対象入力画素に対応する背景情報501を更新している。以後、このような背景情報の更新を「頻度型背景更新」と呼ぶ。
以上のような第1背景モデル500及びその更新方法を使用することによって、一時的に背景が変化する場合や、急激に背景が変化する場合であっても、適切に第1背景モデル500を更新することが可能となる。
<画像処理装置の動作段階>
画像処理装置3の動作段階として、準備段階と実動作段階とが存在する。画像処理装置3は、準備段階において、第1背景モデル500の初期学習処理を行う。第1背景モデル500の初期学習処理では、人が存在しない室内300が写る入力動画像100に基づいて第1背景モデル500が繰り返し更新される。画像処理装置3では、初期学習処理が完了すると、動作段階が準備段階から実動作段階へ移行する。画像処理装置3は、実動作段階において、入力動画像100での前景領域を特定する。以後、初期学習処理で使用する、人が存在しない室内300が写る入力動画像100のフレーム画像101を特に「学習用フレーム画像101」と呼ぶ。初期学習では、カメラ2から学習用フレーム画像101が順次画像処理装置3に入力される。
<準備段階での画像処理装置の動作>
図12は準備段階で行われる初期学習処理を示すフローチャートである。図12に示されるように、ステップs21において、画像処理装置3は、カメラ2から入力される学習用フレーム画像101を処理対象として、ステップs22において前処理、前景判定処理及び第1背景モデル更新処理を行う。ステップs22での第1背景モデル更新処理では、前処理部30が出力する、学習用フレーム画像101に対応する入力フレーム画像111を構成する各入力画素について、上述の画素単位背景更新処理が行われる。これにより、第1背景モデル500が1回更新される。
ステップs22の後、画像処理装置3は、ステップs23において、第1背景モデル500を所定回数更新したか否かを判定する。画像処理装置3は、第1背景モデル500を所定回数更新したと判定すると初期学習処理を終了する。一方で、画像処理装置3は、第1背景モデル500を所定回数更新していないと判定すると、ステップs21を再度実行して、カメラ2から新たに入力される学習用フレーム画像101を新たな処理対象として、ステップs22において前処理、暫定判定処理及び第1背景モデル更新処理を行う。以後、画像処理装置3は同様に動作する。
このように、人が存在しない室内300が写る入力動画像100に基づいて第1背景モデル500が繰り返し更新されることによって、記憶部5には、室内300内の背景に応じた第1背景モデル500が記憶される。
<実動作段階での画像処理装置の動作>
図13は実働動作段階での画像処理装置3の動作の一例を示すフローチャートである。図13に示されるように、ステップs31において、画像処理装置3は、カメラ2から入力フレーム画像101が入力されると、入力された入力フレーム画像101を処理対象とする。次に、ステップs32において、前処理部30は、処理対象の入力フレーム画像101に対して前処理を行って、前処理後の処理対象の入力フレーム画像101を処理対象の入力フレーム画像111として出力する。
次にステップs33において、動き特定部33は、処理対象の入力フレーム画像111に基づいて動き特定処理を行う。
次にステップs34において、第1マップ更新部41は、ステップs33で特定された動き領域に基づいて第1マップ更新処理を行う。
次にステップs35において、第2マップ更新部42は、ステップs33で特定された動き領域に基づいて第2マップ更新処理を行う。
次にステップs36おいて、背景モデル更新部38は、処理対象の入力フレーム画像111に基づいて第2背景モデル550を更新する第2背景モデル更新処理を行う。
次にステップs37において、暫定特定部34は、処理対象の入力フレーム画像111に基づいて第1暫定特定処理を行う。
次にステップs38において、静止対象物特定部35は、ステップs37で特定された第1候補領域と、ステップs34で更新された第1マップ410とに基づいて、静止対象物特定処理を行う。
次にステップs39において、第2マップ更新部42は、ステップs38で特定された静止対象物領域と、ステップs34で更新された第1マップ410とに基づいて、第2マップ補正処理を行う。
次にステップs40において、暫定特定部36は、ステップs39で補正された第2マップ420に基づいて第2暫定特定処理を行う。
次にステップs41において、背景モデル更新部32は、ステップs40で特定された前景候補領域に基づいて、学習率α,βを決定する学習率決定処理を行う。
次にステップs42において、判定部31は、処理対象の入力フレーム画像111に基づいて前景判定処理を行う。そして、判定部31は、前景判定処理の結果を示す判定結果画像150を生成する。
次にステップs43において、背景モデル更新部32は、ステップs42での前景判定処理の結果に基づいて、ステップs41で決定された学習率α,βを用いた第1背景モデル更新処理を行う。
次にステップs44において、後処理部37は、ステップs42で生成された判定結果画像150に対して後処理を行って出力画像151を生成する。
画像処理装置3は、カメラ2から新たな入力フレーム画像101が入力されると(ステップs31)、当該入力フレーム画像101を新たな処理対象として、ステップs32〜s44を再度実行する。画像処理装置3は、以後同様に動作して、カメラ2から入力フレーム画像101が入力されるたびに(ステップs31)、ステップs32〜s44を実行する。
なお、図13に示されるフローチャートは一例であって、画像処理装置3の動作フローは図13の例に限られない。例えば、第2背景モデル更新処理は、第2マップ更新処理よりも前であって前処理よりも後に実行されても良い。また、後処理は、第1背景モデル更新処理の前であって前景判定処理の後に実行されても良い。
<動き特定処理の詳細>
次にステップs33での動き特定処理について詳細に説明する。
動き特定処理において、動き特定部33は、処理対象の入力フレーム画像111と、それよりもM(≧1)フレーム前の入力フレーム画像111との差分を示す差分画像を生成する。Mは例えば3に設定される。動き特定部33は、各画素について、処理対象の入力フレーム画像111の画素値とMフレーム前の入力フレーム画像111の画素値との差分を求めて、それによって得られる各画素の差分値を2値化することによって差分画像を生成する。したがって、差分画像は2値画像である。差分値を2値化する際のしきい値th_aは例えば3に設定される。動き特定部33は、画素の差分値の絶対値が3以上であれば、差分画像での当該画素の画素値を1とし、当該絶対値が3未満であれば、差分画像での当該画素の画素値を0とする。
本明細書では、ある値がしきい値以上のとき、ある処理を実行し、当該ある値が当該しきい値未満のとき、別の処理を実行するということは、当該ある値が当該しきい値よりも大きいとき、当該ある処理を実行し、当該ある値が当該しきい値以下のとき、当該別の処理を実行するということに置き換えることができる。したがって、動き特定部33は、画素の差分値の絶対値がしきい値th_aよりも大きければ、差分画像での当該画素の画素値を1とし、当該絶対値がしきい値th_a以下であれば、差分画像での当該画素の画素値を0としても良い。
同様に、ある値がしきい値よりも大きいとき、ある処理を実行し、当該ある値が当該しきい値以下のとき、別の処理を実行するということは、当該ある値が当該しきい値以上のとき、当該ある処理を実行し、当該ある値が当該しきい値未満のとき、当該別の処理を実行するということに置き換えることができる。
動き特定部33は、処理対象の入力フレーム画像111と、それよりもMフレーム前の入力フレーム画像111との差分を示す差分画像600を生成すると、生成した差分画像600において、処理対象の入力フレーム画像111と、Mフレーム前の入力フレーム画像111との間での物体の動きを示す動き領域を特定する。具体的には、動き特定部33は、差分画像600において、画素値が1の高輝度領域を特定し、特定した高輝度領域を動き領域とする。
図14は差分画像600の一例を示す図である。図14に示される差分画像600は、図4に示される入力フレーム画像111と、図5に示される入力フレーム画像111との差分を示す差分画像である。図14では、画素値が1の高輝度領域601が白色で示されており、画素値が0の低輝度領域が黒色で示されている。図14に示される高輝度領域601a,601b,601cは、図4,5に示される2つの入力フレーム画像111の間での人200a,200b,200cの動きをそれぞれ示している。動き特定部33では、高輝度領域601a,601b,601cが動き領域として特定される。
<第1及び第2マップ更新処理の詳細>
次にステップs34,s35での第1及び第2マップ更新処理について詳細に説明する。
図15,16は、それぞれ、第1マップ410及び第2マップ420の一例を示す図である。 図15に示されるように、第1マップ410では、入力フレーム画像111に含まれる複数の入力画素にそれぞれ対応する複数の第1の値411が、当該複数の入力画素の当該入力フレーム画像111での位置に応じて並んでいる。第1マップ410での第1の値411の位置は、入力フレーム画像111での、当該第1の値411に対応する入力画素の位置と一致している。
同様に、第2マップ420では、図16に示されるように、入力フレーム画像111に含まれる複数の入力画素にそれぞれ対応する複数の第2の値421が、当該複数の入力画素の当該入力フレーム画像111での位置に応じて並んでいる。第2マップ420での第2の値421の位置は、入力フレーム画像111での、当該第2の値421に対応する入力画素の位置と一致している。
ステップs34での第1マップ更新処理において、第1マップ更新部41は、第1マップ410における、ステップs33で特定された動き領域(差分画像600での高輝度領域)に対応する各第1の値411を、所定値だけ増加する。つまり、第1マップ更新部41は、第1マップ410において、差分画像600での動き領域(高輝度領域)の位置と同じ位置に存在する部分領域を特定し、当該部分領域内の各第1の値411を、所定値だけ増加する。この所定値を「第1増加量」と呼ぶ。
一方で、第1マップ更新部41は、第1マップ410における、ステップs33で特定された動き領域に対応しない各第1の値411を、所定値だけ減少する。つまり、第1マップ更新部41は、第1マップ410において、差分画像600での低輝度領域の位置と同じ位置に存在する部分領域を特定し、当該部分領域内の各第1の値411を、所定値だけ減少する。この所定値を「第1減少量」と呼ぶ。第1減少量は、例えば、第1増加量よりも小さな値に設定される。
以下に、第1増加量及び第1減少量が例えば10及び5にそれぞれ設定された場合の第1マップ更新処理の具体例を図17〜23を用いて説明する。
図18は、図17に示される差分画像600の一部の領域である部分領域610を拡大して示す図である。部分領域610は(8×8)個の画素611で構成されている。図17に示される差分画像600は図14に示される差分画像600と同じである。
図19は、第1マップ410における、部分領域610に対応する部分領域413を示す図である。ステップs33で生成された差分画像600に、図18に示される部分領域610が含まれる場合には、ステップs34において、図19に示されるように、第1マップ410の部分領域413では、部分領域610に含まれる高輝度領域(白色の領域)に対応する各第1の値411が10だけ増加し、部分領域610に含まれる低輝度領域(黒色の領域)に対応する各第1の値411が5だけ減少する。本例では、第1の値411の最小値は0であるため、ステップs34の実行前の第1マップ410の各第1の値411が0である場合には、部分領域415での各第1の値411は図20に示されるようになる。
次のフレームでの処理対象の入力フレーム画像111に基づいて生成された差分画像600に、図21に示される部分領域610が含まれる場合には、ステップs34において、図22に示されるように、第1マップ410の部分領域413では、図21の部分領域610に含まれる高輝度領域(白色の領域)に対応する各第1の値が10だけ増加し、図21の部分領域610に含まれる低輝度領域(黒色の領域)に対応する各第1の値が5だけ減少する。その結果、部分領域413での各第1の値411は図23に示されるようになる。
第2マップ更新処理は第1マップ更新処理と同様に行われる。具体的には、ステップs35での第2マップ更新処理において、第2マップ更新部42は、第2マップ420における、ステップs33で特定された動き領域に対応する第2の値421を、所定値だけ増加する。つまり、第2マップ更新部42は、第2マップ420において、差分画像600での動き領域(高輝度領域)の位置と同じ位置に存在する部分領域を特定し、当該部分領域内の各第2の値421を、所定値だけ増加する。この所定値を「第2増加量」と呼ぶ。一方で、第2マップ更新部42は、第2マップ420における、ステップs33で特定された動き領域に対応しない第2の値421を、所定値だけ減少する。つまり、第2マップ更新部42は、第2マップ420において、差分画像600での低輝度領域の位置と同じ位置に存在する部分領域を特定し、当該部分領域内の各第2の値421を、所定値だけ減少する。この所定値を「第2減少量」と呼ぶ。第2減少量は、例えば、第2増加量よりも小さな値に設定される。また例えば、第2増加量は第1増加量以上に設定され、第2減少量は第1減少量よりも大きく設定される。本例では、第2増加量は第1増加量よりも大きく設定される。このように、第2マップ420の第2増加量及び第2減少量を、第1マップ410の第1増加量及び第1減少量よりもそれぞれ大きく設定することによって、第2マップ410は、処理対象の入力フレーム画像111の最近の変化の影響を強く受ける。これに対して、 第1マップ410は、処理対象の入力フレーム画像111の最近の変化の影響をあまり受けない。なお、第2増加量は第1増加量と同じであっても良い。
以上のように、第1マップ更新処理では、差分画像600における、フレーム間の物体の動きを示す動き領域に対応する第1の値411が増加し、当該動き領域に対応しない第1の値411が減少する。このように第1マップ410が繰り返し更新されることによって、第1マップ410では、室内において物体の動きが発生する頻度が最近高い場所に対応する第1の値411が大きな値を示しやすくなる。言い換えれば、第1マップ410では、差分画像600において物体の動きが現れる頻度が最近高い領域に対応する第1の値411が大きな値を示しやすくなる。したがって、第1マップ410では、処理対象の入力フレーム画像111における、現在動いている人が写る領域付近に対応する第1の値411が大きな値を示しやすくなる。
同様にして、第2マップ420では、室内において物体の動きが発生する頻度が最近高い場所に対応する第2の値421が大きな値を示しやすくなる。したがって、第2マップ420では、処理対象の入力フレーム画像111における、現在動いている人が写る領域付近に対応する第2の値421が大きな値を示しやすくなる。
また本例では、第1マップ410についての第1減少量が、第2マップ420についての第2減少量よりも小さく設定されている。そのため、第1マップ410では、室内において物体の動きが発生しなくなった場所に対応する第1の値411は小さくなりにくい。よって、室内において動いていた人が静止している場合、第1マップ410では、室内においてその静止している人が存在する場所付近に対応する第1の値411は、その人が静止した後においても比較的長い間大きな値を示しやすくなる。その結果、第1マップ410では、処理対象の入力フレーム画像111における、現在動いている人が写る領域付近に対応する第1の値411だけではなく、処理対象の入力フレーム画像111における、最近まで動いていたが現在は静止している人が写る領域付近に対応する第1の値411も大きな値を示しやすくなる。
これに対して、第2減少量が大きい第2マップ420では、処理対象の入力フレーム画像111における、現在動いている人が写る領域付近に対応する第2の値421は大きな値を示しやすいものの、処理対象の入力フレーム画像111における、最近まで動いていたが現在は静止している人が写る領域付近に対応する第2の値412は、第2マップ更新処理だけでは小さな値を示しやすい。
また、室内において机等の非移動体が移動させられた場合、第1マップ410では、室内において移動後の非移動体が存在する場所に対応する第1の値411は、当該非移動体が移動させられた後、比較的長い間大きな値を示しやすい。よって、第1マップ410では、処理対象の入力フレーム画像111における、最近移動させられた机等の非移動体が写る領域付近に対応する第1の値411は大きな値を示しやすい。これに対して、第2マップ420では、室内において移動後の非移動体が存在する場所に対応する第2の値412は、当該非移動体が移動させられた後、比較的すぐに小さな値となりやすい。よって、第2マップ420では、処理対象の入力フレーム画像111における、最近移動させられた机等の非移動体が写る領域付近に対応する第2の値421は小さな値を示しやすい。
また、室内において机等の非移動体が移動させられた場合、第1マップ410では、室内において移動前の非移動体が存在していた場所に対応する第1の値411は、当該非移動体が移動させられた後、比較的長い間大きな値を示しやすい。よって、第1マップ410では、処理対象の入力フレーム画像111における、最近移動させられた机等の非移動体が移動前に写っていた領域付近に対応する第1の値411は大きな値を示しやすい。これに対して、第2マップ420では、室内において移動前の非移動体が存在していた場所に対応する第2の値421は、当該非移動体が移動させられた後、比較的すぐに小さな値となりやすい。よって、第2マップ420では、処理対象の入力フレーム画像111における、最近移動させられた机等の非移動体が移動前に写っていた領域付近に対応する第2の値421は小さな値を示しやすい。
以後、第1マップ410を「長期保存マップ410」と呼び、第2マップ420を「短期保存マップ420」と呼ぶことがある。
図24は差分画像600の一例を示す図である。図25は、図24に示される差分画像600が得られた際の短期保存マップ420を画像化した短期保存マップ画像652の一例を示す図である。短期保存マップ画像652の元になる短期保存マップ420についての第2増加量及び第2減少量は例えばそれぞれ30及び20である。図26は、図24に示される差分画像600が得られた際の長期保存マップ410を画像化した長期保存マップ画像651の一例を示す図である。長期保存マップ画像651の元になる長期保存マップ410についての第1増加量及び第1減少量は例えばそれぞれ20及び2である。短期保存マップ画像652での各画素の画素値は、短期保存マップ420における、当該画素に対応する第2の値421と一致している。同様に、長期保存マップ画像651での各画素の画素値は、長期保存マップ410における、当該画素に対応する第1の値411と一致している。短期保存マップ画像652及び長期保存マップ画像651はグレースケール画像である。図25,26に示される短期保存マップ画像652及び長期保存マップ画像651では、画素値が0の領域が黒色が示され、画素値が大きいほど白色に近づくように示されている。図25,26から理解できるように、長期保存マップ410では、短期保存マップ420と比較して、1以上の値を示す領域の範囲が大きくなっている。
<第2背景モデル更新処理の詳細>
次にステップs36での第2背景モデル更新処理について詳細に説明する。
第2背景モデル550には、入力フレーム画像111を構成する複数の入力画素にそれぞれ対応する複数の背景情報が含まれている。背景モデル550に含まれる背景情報は、背景画素の画素値(以後、「背景画素値」と呼ぶ)で構成されている。背景モデル550に含まれる複数の背景画素値の初期値としては、例えば、人が存在しない室内300が写る入力フレーム画像111を構成する複数の画素の画素値がそれぞれ採用される。
背景モデル更新部38は、背景モデル更新部32が第1背景モデル500を更新する方法とは異なる方法で第2背景モデル550を更新する。背景モデル更新部38は、入力フレーム画像111に含まれる対象入力画素の画素値が一定期間連続して同程度の値を示す場合に、当該画素値に基づいて、第2背景モデル550における、対象入力画素に対応する背景画素値を更新する。背景モデル更新部38は、第2背景モデル550の各背景画素値を同様に更新する。以後、対象入力画素の画素値を「対象入力画素値」と呼ぶことがある。また、第2背景モデル550での、対象入力画素に対応する背景画素値を「対応背景画素値」と呼ぶことがある。
図27は対象入力画素に関する背景モデル更新部38の動作を示すフローチャートである。背景モデル更新部38は、処理対象の入力フレーム画像111の対象入力画素値に基づいて図27に示される一連の処理を実行する。また、背景モデル更新部38は、処理対象の入力フレーム画像111の各入力画素について図27に示される一連の処理を実行する。
図27に示されるように、背景モデル更新部38は、ステップs51において、処理対象の入力フレーム画像111の対象入力画素の画素値が、第2背景モデル550に含まれる対応背景画素値に一致するか否かを判定する。ステップs51において、対象入力画素値が対応背景画素値に一致すると判定されると、背景モデル更新部38は、ステップs54においてカウント値をリセットして零に設定する。一方で、ステップs51において、対象入力画素値が対応背景画素値に一致しないと判定されると、背景モデル更新部38はステップs52を実行する。
ステップs52では、背景モデル更新部38は、前回のフレームでの第2背景モデル更新処理でのステップs51において、対象入力画素値が対応背景画素値と一致すると判定されたか否かを判断する。つまり、背景モデル更新部38は、処理対象の入力フレーム画像111よりも1フレーム前の入力フレーム画像111での対象入力画素の画素値が対応背景画素値と一致するとステップs51で判定されたか否かを判断する。背景モデル更新部38は、前回のフレームでのステップs51において、対象入力画素値が対応背景画素値と一致すると判定されたと判断すると、ステップs53において、処理対象の入力フレーム画像111の対象入力画素の画素値を基準画素値とする。そして、ステップs54において、背景モデル更新部38はカウント値をリセットする。
このように、背景モデル更新部38は、現在のフレームにおいて、対象入力画素値が対応背景画素値と一致しない場合、前回のフレームにおいて、対象入力画素値が対応背景画素値と一致すると判定されていたときには、現在のフレームでの対象入力画素値を基準画素値とし、カウント値をリセットする。
一方で、ステップs52において、背景モデル更新部38は、前回のフレームでのステップs51において、対象入力画素値が対応背景画素値と一致しないと判定されたと判断すると、ステップs55を実行する。ステップs55において、背景モデル更新部38は、処理対象の入力フレーム画像111の対象入力画素値が基準画素値と同程度であるか否かを判断する。例えば、背景モデル更新部38は、処理対象の入力フレーム画像111の対象入力画素値と基準画素値との差分の絶対値がしきい値th_b未満の場合、対象入力画素値が基準画素値と同程度であると判断する。一方で、背景モデル更新部38は、当該絶対値がしきい値th_b以上の場合、対象入力画素値が基準画素値と同程度ではないと判断する。
背景モデル更新部38は、対象入力画素値が基準画素値と同程度ではないと判断すると、ステップs54を実行して、カウント値をリセットする。一方で、背景モデル更新部38は、対象入力画素値が基準画素値と同程度であると判断すると、ステップs56において、カウント値を1つだけ増加する。そして、ステップs57において、背景モデル更新部38は、カウント値がしきい値th_c以上であるか否かを判定する。しきい値th_cは、例えば100に設定される。
背景モデル更新部38は、カウント値がしきい値th_c以上であると判定すると、ステップs58において、対象入力画素値に基づいて対応背景画素値を更新する。背景モデル更新部38は、例えば、基準画素値を、対応背景画素値の新たな値として採用することによって、対応背景画素値を更新する。なお、背景モデル更新部38は、基準画素値が設定されてから現在まで得られた、対象入力画素についての複数の画素値(基準画素値を含む)の平均値を、対応背景画素値の新たな値として採用しても良い。
背景モデル更新部38は、対応背景画素値を更新すると、次の入力フレーム画像111(新たな処理対象の入力フレーム画像111)での対象入力画素についてステップs51を実行する。以後、背景モデル更新部38は同様に動作する。
一方で、背景モデル更新部38は、カウント値がしきい値th_c未満であると判定すると、次の入力フレーム画像111での対象入力画素についてステップs51を実行する。以後、背景モデル更新部38は同様に動作する。
なお、背景モデル更新部38は、ステップs51において、対象入力画素値が対応背景画素値と同程度であるか否かを判定しても良い。この場合には、対象入力画素値が対応背景画素値と同程度であると判定されるときステップs54が実行され、対象入力画素値が対応背景画素値と同程度ではないと判定されるときステップs52が実行される。また、ステップs52では、前回のフレームでのステップs51において、対象入力画素値が対応背景画素値と同程度であると判定された否かが判断される。対象入力画素値が対応背景画素値と同程度であるか否かは、例えば、対象入力画素値と対応背景画素値の差分の絶対値としきい値th_dとの比較結果に基づいて判定される。例えば、背景モデル更新部38は、対象入力画素値と対応背景画素値の差分の絶対値がしきい値th_d未満のときに、対象入力画素値が対応背景画素値と同程度であると判定し、当該絶対値がしきい値th_d以上のときに、対象入力画素値が対応背景画素値と同程度ではないと判定する。
背景モデル更新部38が以上のように動作することによって、入力画素の画素値が、複数フレームの間(一定期間)連続して同程度の値を示す場合、当該画素値に基づいて、第2背景モデル550における、当該入力画素に対応する背景情報(背景画素値)が更新される。以後、このような背景情報の更新を「連続型背景更新」と呼ぶことがある。
<第1暫定特定処理の詳細>
次にステップs37での第1暫定特定処理について詳細に説明する。
本例では、暫定特定部34は、例えばPSA(Pixel State Analysis)を用いて、処理対象の入力フレーム画像111において、静止している人が写る静止対象物領域の候補である第1候補領域を特定する。PSAとは、画素の状態(以後、「画素状態」と呼ぶ)を、背景(Background:BG)、静状態(Stationary:ST)及び動状態(Transient:TR)の三つの状態に分ける手法である。画素状態がBRの画素は、背景を示す画素である。画素状態がSTの画素は、静止している人を示す画素である。そして、画素状態がTRの画素は、動いている人を示す画素である。暫定特定部34は、処理対象の入力フレーム画像111の各画素についての画素状態が、BGであるのか、STであるのか、TRであるのかを判定する。暫定特定部34は、処理対象の入力フレーム画像111において、STであると判定された画素が存在する領域に基づいて第1候補領域を特定する。なお、暫定特定部34は、PSA以外の方法で第1候補領域を特定しての良い。暫定特定部34は、例えばオプティカルフローを用いて第1候補領域を特定しても良い。
以下にPSAの一例について説明する。
<PSAの一例>
ここでは、ある入力フレーム画像111をWフレーム目の入力フレーム画像111とし、Wフレーム目の入力フレーム画像111の各画素の画素状態をPSAを用いて判定する方法について説明する。以後、Wフレーム目の入力フレーム画像111を「注目入力フレーム画像111」と呼ぶことがある。
注目入力フレーム画像111の各画素の画素状態をPSAを用いて判定する場合には、図28に示されるように、注目入力フレーム画像111(Wフレーム目の入力フレーム画像111)と、注目入力フレーム画像111よりも前に撮影された(W−K)フレーム目から(W−1)フレーム目のK枚(K≧2)の入力フレーム画像111と、注目入力フレーム画像111よりも後に撮影された(W+1)フレーム目から(W+K)フレーム目のK枚の入力フレーム画像111とが使用される。つまり、(W−K)フレーム目から(W+K)フレーム目までの(2K+1)枚の入力フレーム画像111が使用される。Kは例えば5に設定される。
そして、Wフレーム目から(W+K)フレーム目の入力フレーム画像111で構成される第1フレーム画像群121Tが使用されて第1評価値Tが算出され、(W−K)フレーム目からWフレーム目の入力フレーム画像111で構成される第2フレーム画像群121Sが使用されて第2評価値Sが算出される。第1評価値T及び第2評価値Sのそれぞれは、入力フレーム画像111の各入力画素について求められる。
対象入力画素についての第1評価値Tは以下の式(6)で表される。
式(6)中のItは、注目入力フレーム画像111(Wフレーム目の入力フレーム画像111)の対象入力画素値(輝度)を示している。I(t+j)は、(W+j)フレーム目の入力フレーム画像111の対象入力画素値(輝度)を示している。式(6)に示されるように、第1評価値Tは、注目入力フレーム画像111の対象入力画素値と、(W+1)フレーム目から(W+K)フレーム目までの入力フレーム画像111のそれぞれの対象入力画素値との間の差分値の絶対値のうちの最大値を意味している。したがって、注目入力フレーム画像111の対象入力画素値を基準にして、(W+1)フレーム目から(W+K)フレーム目までのKフレームの間において対象入力画素値の急激な変化が発生した場合に、第1評価値Tは大きくなる。第1評価値Tは、それに対応する入力画素の画素値の変化量を示しているとも言える。
一方で、対象入力画素についての第2評価値Sは以下の式(7)で表される。
式(7)中のI(t−j)は、(W−j)フレーム目の入力フレーム画像111の対象入力画素値(輝度)を示している。式(7)に示されるように、第2評価値Sは、(W−K)フレーム目からWフレーム目までの入力フレーム画像111の間において、対象入力画素値がどの程度を分散しているかを示している。(W−K)フレーム目からWフレーム目までの入力フレーム画像111の間における、対象入力画素値の分散が大きければ、第2評価値Sは大きくなる。言い換えれば、(W−K)フレーム目からWフレーム目までの入力フレーム画像111において対象入力画素値が安定していれば、第2評価値Sは小さくなる。第2評価値Sは、それに対応する入力画素の画素値の安定度を示していると言える。
注目入力フレーム画像111の対象入力画素の画素状態は、注目入力フレーム画像111を含む、(W−K)フレーム目から(W+K)フレーム目までの入力フレーム画像111に基づいて求められた、対象入力画素についての第1評価値T及び第2評価値Sに基づいて判定される。
図29は画素状態の状態遷移図を示す図である。対象入力画素の画素状態は、現在の状態と、対象入力画素についての第1評価値T及び第2評価値Sと、第2背景モデル550における、対象入力画素に対応する背景画素値(対応背景画素値)とに基づいて決定される。各入力画素の画素状態の初期値は例えばBGとなっている。
以下に、現在の状態がBGであるのか、TRであるのか、STであるのかに分けて、対象入力画素の画素状態がどのようにして決定されるのかについて説明する。
<現在の状態がBGである場合>
現在の状態がBGである対象入力画素の画素状態は、対象入力画素の第1評価値Tがしきい値th_t以下のとき、BGに決定される。つまり、対象入力画素の画素状態がBGで維持される。また、対象入力画素の第1評価値Tがしきい値th_tよりも大きく、かつ対象入力画素の第2評価値Sがしきい値th_sよりも小さく、かつ対象入力画素値が対応背景画素値と同程度である場合には、対象入力画素の画素状態はBGに決定される。例えば、対象入力画素値と対応背景画素値との差分値の絶対値がしきい値th_e未満のとき、対象入力画素値は対応背景画素値と同程度であるとされ、当該絶対値がしきい値th_e以上のとき、対象入力画素値は対応背景画素値と同程度ではないとされる。
また、現在の状態がBGである対象入力画素の画素状態は、第1評価値Tがしきい値th_tよりも大きい場合であって、上記のBGに留まる条件に合致しない場合、BGからTRに遷移する。具体的には、現在の状態がBGである対象入力画素の画素状態は、第1評価値Tがしきい値th_tよりも大きく、かつ第2評価値Sがしきい値th_s以上の場合、BGからTRに遷移する。さらに、現在の状態がBGである対象入力画素の画素状態は、第1評価値Tがしきい値th_tよりも大きく、かつ対象入力画素値が対応背景画素値と同程度では無い場合、BGからTRに遷移する。上述のように、例えば、対象入力画素値と対応背景画素値との差分値の絶対値がしきい値th_e以上のとき、対象入力画素値は対応背景画素値と同程度ではないと判定される。
このように、BGである対象入力画素の画素状態は、第1評価値T及び第2評価値Sの両方が大きい場合に、つまり、対象入力画素値に急激な変化が発生し、かつ対象入力画素値が安定していない場合に、TRに遷移する。さらに、BGである対象入力画素の画素状態は、第1評価値Tが大きく、かつ対象入力画素値が対応背景画素値と同程度ではない場に、つまり、対象入力画素値に急激な変化が発生し、かつ対象入力画素値が対応背景画素値と明確に異なる場合に、TRに遷移する。撮影領域において、背景である位置に、動いている人が現れるときには、当該位置に対応する入力画素の画素値は、急激に変化し、安定せず、当該入力画素に対応する背景画素値と明確に異なるようになる。したがって、撮影領域において、背景である位置に、動いている人が現れるときには、当該位置に対応する入力画素の画素状態はBRからTRに遷移する。
<現在の状態がTRである場合>
現在の状態がTRである対象入力画素の画素状態は、対象入力画素の第2評価値Sがしきい値th_s以上のとき、TRに決定される。つまり、対象入力画素の画素状態がTRで維持される。また、対象入力画素の第2評価値Sがしきい値th_sよりも小さく、かつ対象入力画素値が対応背景画素値と同程度である場合には、対象入力画素の画素状態はBGに決定される。そして、現在の状態がTRである対象入力画素の画素状態は、第2評価値Sがしきい値th_sよりも小さく、かつ対象入力画素値が対応背景画素値と同程度ではない場合には、STに決定される。
このように、TRである対象入力画素の画素状態は、第2評価値Sが小さく、かつ対象入力画素値が対応背景画素値と同程度である場合、つまり、対象入力画素値が安定しており、対象入力画素値が対応背景画素値と同程度である場合、TRからBGに遷移する。撮影領域において、動いている人が存在する位置から、当該人が存在しなくなって、当該位置に背景が現れた場合、当該位置に対応する入力画素の画素値は、安定し、かつ当該入力画素に対応する背景画素値と同程度になる。したがって、撮影領域において、動いている人が存在する位置から、当該人が存在しなくなって、当該位置に背景が現れた場合、当該位置に対応する入力画素の画素状態がTRからBGに遷移する。
また、TRである対象入力画素の画素状態は、第2評価値Sが小さく、かつ対象入力画素値が対応背景画素値と同程度ではない場合、つまり、対象入力画素値が安定しており、対象入力画素値が対応背景画素値と明確に異なる場合、TRからSTに遷移する。撮影領域において、ある位置で動いている人が静止した場合、当該位置に対応する入力画素の画素値は、安定し、かつ当該入力画素に対応する背景画素値と同程度にはならない。したがって、撮影領域において、ある位置で動いている人が静止した場合、当該位置に対応する入力画素の画素状態がTRからSTに遷移する。
<現在の状態がSTである場合>
現在の状態がSTである対象入力画素の画素状態は、対象入力画素の第1評価値Tがしきい値th_t以下のとき、STに決定される。つまり、対象入力画素の画素状態がSTで維持される。また、対象入力画素の第1評価値Tがしきい値th_tよりも大きく、かつ対象入力画素値が対応背景画素値と同程度ではない場合には、対象入力画素の画素状態はTRに決定される。そして、現在の状態がSTである対象入力画素の画素状態は、対象入力画素値が対応背景画素値と同程度である場合には、BGに決定される。
このように、STである対象入力画素の画素状態は、第1評価値Tが大きく、かつ対象入力画素値が対応背景画素値と同程度ではない場合、つまり、対象入力画素値が急激に変化し、かつ対象入力画素値が対応背景画素値と明確に異なる場合、STからTRに遷移する。撮影領域において、ある位置で静止している人が動き出した場合、当該ある位置に対応する入力画素の画素値は、急激に変化し、かつ当該入力画素に対応する背景画素値と同程度にはならない。したがって、撮影領域において、ある位置で静止している人が動き出した場合、当該ある位置に対応する入力画素の画素状態がSTからTRに遷移する。
また、STである対象入力画素の画素状態は、対象入力画素値が対応背景画素値と同程度である場合、STからBGに遷移する。撮影領域において、静止している人が存在する位置から、当該人が存在しなくなって、当該位置に背景が現れた場合、当該位置に対応する入力画素の画素値は、安定し、かつ当該入力画素に対応する背景画素値と同程度になる。したがって、撮影領域において、静止している人が存在する位置から、当該人が存在しなくなって、当該位置に背景が現れた場合、当該位置に対応する入力画素の画素状態がSTからBGに遷移する。
本例に係るPSAでは、以上のようにして、注目入力フレーム画像111の各入力画素の画素状態が判定される。
なお、図29に示されるT≦th_tは、T<th_tに置き換えても良い。この場合、図29に示されるT>th_tは、T≧th_tに置き換えられる。また、図29に示されるS<th_sは、S≦th_sに置き換えても良い。この場合、図29に示されるS≧th_sは、S>th_sに置き換えられる。
また、PSAにおいて画素状態が決定される各種条件は、上記で説明した条件に限られない。
図30は第1暫定特定処理の一例を示すフローチャートである。図30に示されるように、ステップs61において、暫定特定部34は、処理対象の入力フレーム画像111の各入力画素の画素状態を判定する。ステップs61において、暫定特定部34は、処理対象の入力フレーム画像111を、(W+K)フレーム目の入力フレーム画像111として、注目フレーム入力画像111の各入力画素の画素状態を上述のようにして判定する。言い換えれば、暫定特定部34は、処理対象の入力フレーム画像111を、(W+K)フレーム目の入力フレーム画像111として、処理対象の入力フレーム画像111よりもKフレーム前の入力フレーム画像111の各入力画素の画素状態を判定する。そして、暫定特定部34は、注目入力フレーム画像111の各入力画素の画素状態を、処理対象の入力フレーム画像111の各入力画素の画素状態とする。つまり、暫定特定部34は、注目入力フレーム画像111の対象入力画素の画素状態を、処理対象の入力フレーム画像111の対象入力画素の画素状態として使用する。処理対象の入力フレーム画像111の撮影タイミングと、注目入力フレーム画像111の撮影タイミングとの間にはあまり差が無いことから(本例では5フレーム)、注目入力フレーム画像111の対象入力画素の画素状態を、処理対象の入力フレーム画像111の対象入力画素の画素状態として使用することができる。
次にステップs62において、暫定特定部34は、処理対象の入力フレーム画像111において、画素状態がSTであると判定された画素が存在する領域(以後、「ST領域」と呼ぶことがある)の範囲を示すST2値画像680を生成する。ST2値画像680は、処理対象の入力フレーム画像111において、ST領域の各画素値を1に設定し、ST領域以外の領域の各画素値を0に設定したものである。図31は、ST2値画像680の一例を示す図である。図31では、ST2値画像680において、画素値が1の領域が白色で示されている。
なお、図32は、処理対象の入力フレーム画像111において、画素状態がTRであると判定された画素が存在する領域(以後、「TR領域」と呼ぶことがある)の範囲を示すTR2値画像690を示す図である。TR2値画像690は、処理対象の入力フレーム画像111において、TR領域の各画素値を1に設定し、TR領域以外の領域の各画素値を0に設定したものである。図32では、TR2値画像690において、画素値が“1”の領域が白色で示されている。
次にステップs63において、暫定特定部34は、ST2値画像680における、画素値が“1”を示す領域に対して、4連結あるいは8連結等を用いたラベリングを行う。このとき、暫定特定部34は、ラベリングによって得られた複数の独立領域のうち、面積が小さすぎる独立領域を削除しても良い。つまり、暫定特定部34は、ラベリングによって得られた複数の独立領域のうち、画素数がしきい値th_nよりも小さい独立領域を削除しても良い。これによりノイズ除去が可能となる。なお、暫定特定部34は、ラベリングによって得られた複数の独立領域のうち、画素数がしきい値th_n以下の独立領域を削除して良い。
次にステップs64において、暫定特定部34は、得られた各独立領域(各連結領域)の外接矩形681を求める。図33は、図31に示されるST2値画像680から得られた外接矩形681を示す図である。図33には、4つの外接矩形681a〜681dが示されている。図33では、外接矩形681a〜681dの輪郭が示されている。処理対象の入力フレーム画像111における、外接矩形681a〜681dに対応する領域には、静止している人が写る可能性が高い。つまり、撮影領域(室内)における、外接矩形681a〜681dに対応する領域には、静止している人が存在する可能性が高い。
次にステップs65において、暫定特定部34は、処理対象の入力フレーム画像111において、各外接矩形681に対応する領域を、静止している人が写る静止対象物領域の候補である第1候補領域700とする。つまり、暫定特定部34は、処理対象の入力フレーム画像111において、ST2値画像680での各外接矩形681の位置と同じ位置に存在する領域を第1候補領域700とする。図34は、図33に示される外接矩形681a〜681dにそれぞれ対応する第1候補領域700a〜700dを示す図である。図34では、左側に外接矩形681a〜681dが示され、右側に第1候補領域700a〜700dが示される。
以上のように、暫定特定部34は、処理対象の入力フレーム画像111の各入力画素についての第1評価値T及び第2評価値Sに基づいて、処理対象の入力フレーム画像111において、静止している人が写る静止対象物領域の候補である第1候補領域700を特定する。
なお、注目入力フレーム画像111の各画素の画素状態を求めるために使用される入力フレーム画像111は上記の図28に示される例に限られない。例えば、Wフレーム目の各画素の画素状態を求めるために、Wフレームよりも前のフレームの入力フレーム画像111だけが使用されても良い。例えば、Wフレーム目の各画素の画素状態を求めるために、図35に示されるように、(W−2K)フレーム目から(W−1)フレーム目までの入力フレーム画像111が使用されても良い。この場合には、Wフレーム目の入力フレーム画像111が処理対象の入力フレーム画像111となる。また、第1評価値Tは、例えば、(W−K)フレーム目からWフレーム目の入力フレーム画像111で構成される第1フレーム画像群122Tが使用されて求められる。そして、第2評価値Sは、(W−2K)フレーム目から(W−K)フレーム目の入力フレーム画像111で構成される第2フレーム画像群122Sが使用されて求められる。
<静止対象物特定処理の詳細>
次にステップs38での静止対象物特定処理について詳細に説明する。図36は静止対象物特定処理の一例を示すフローチャートである。図36に示されるように、ステップs38での静止対象物特定処理では、まずステップs71において、静止対象物特定部35は、ステップs34で更新された長期保存マップ410(第1マップ410)を2値化して2値化マップを生成する。具体的には、静止対象物特定部35は、長期保存マップ410において、0よりも大きい各第1の値411を1に設定し、0の第1の値411を0に設定して、2値化マップを生成する。
次にステップs72において、静止対象物特定部35は、ステップs71で得られた2値化マップにおける、値が1を示す領域に対して、4連結あるいは8連結等を用いたラベリングを行う。
なお、ステップs72において、静止対象物特定部35は、ラベリングによって得られた複数の独立領域のうち、面積が大きすぎる独立領域は削除しても良い。つまり、静止対象物特定部35は、ラベリングによって得られた複数の独立領域のうち、画素数がしきい値th_fよりも大きい独立領域は削除しても良い。これによりノイズ除去が可能となる。静止対象物特定部35は、ラベリングによって得られた複数の独立領域のうち、画素数がしきい値th_f以上の独立領域を削除して良い。
また、静止対象物特定部35は、ラベリングによって得られた複数の独立領域のうち、幅(左右方向の長さ)が小さすぎる独立領域は削除しても良い。つまり、静止対象物特定部35は、ラベリングによって得られた複数の独立領域のうち、幅方向(左右方向)の画素数がしきい値th_gよりも小さい独立領域を削除しても良い。これによりノイズ除去が可能となる。静止対象物特定部35は、ラベリングによって得られた複数の独立領域のうち、幅方向の画素数がしきい値th_g以下の独立領域を削除して良い。
また、静止対象物特定部35は、ラベリングによって得られた複数の独立領域のうち、高さ(上下方向の長さ)が小さすぎる独立領域を削除しても良い。つまり、静止対象物特定部35は、ラベリングによって得られた複数の独立領域のうち、高さ方向(左右方向)の画素数がしきい値th_hよりも小さい独立領域は削除しても良い。これによりノイズ除去が可能となる。静止対象物特定部35は、ラベリングによって得られた複数の独立領域のうち、高さ方向の画素数がしきい値th_h以下の独立領域を削除して良い。
次にステップs73において、静止対象物特定部35は、ステップs72で得られた各独立領域の外接矩形720を求める。
図37は、ステップs71で2値化される長期保存マップ410の一例を画像化した長期保存マップ画像651を示す図である。図37では、長期保存マップ画像651に対応する長期保存マップ410に基づいて求められた外接矩形720が、長期保存マップ画像651に重ねて示されている。図37には一つの外接矩形720が示されている。また図37には、図33に示される外接矩形681a〜681dも長期保存マップ画像651に重ねて示されている。図37では、外接矩形720及び外接矩形681a〜681dの輪郭が示されている。
次にステップs74において、静止対象物特定部35は、ステップs37で特定された第1候補領域700と、ステップs73で得られた外接矩形720とに基づいて、処理対象の入力フレーム画像111において、静止している人が写る静止対象物領域を特定する。具体的には、まず静止対象物特定部35は、処理対象の入力フレーム画像111において、各外接矩形720に対応する対応領域730を求める。図38は、図37に示される外接矩形720に対応する対応領域730を示す図である。図38には、図34に示される第1候補領域700a〜700dも示されている。
静止体対象物特定部35は、求めた対応領域730のうち、少なくとも一つの第1候補領域700を包含する包含対応領域730を特定する。例えば、第1候補領域700のすべての頂点が対応領域730内に存在するとき、当該第1候補領域700は当該対応領域730に包含されるとする。図38に示される対応領域730は、第1候補領域700a,700b,700dを包含する包含対応領域730である。なお、図38に示される対応領域730は第1候補領域700cを包含しない。
ここで、長期保存マップ410では、上述のように、処理対象の入力フレーム画像111における、現在動いている人が写る領域付近に対応する第1の値411と、処理対象の入力フレーム画像111における、最近まで動いていたが現在は静止している人が写る領域付近に対応する第1の値411とが大きな値を示しやすい。そのため、長期保存マップ410を2値化して得られる2値化マップでは、処理対象の入力フレーム画像111における、現在動いている人が写る領域付近に対応する領域と、処理対象の入力フレーム画像111における、最近まで動いていたが現在は静止している人が写る領域付近に対応する領域とが1を示す可能性が高い。したがって、2値化マップにおける、値が1が示す領域に対してラベリングを行って得られた独立領域の外接矩形720は、撮影領域において、現在動いている人、あるいは最近まで動いていたが現在は静止している人が存在する可能性が高い範囲を示していると言える。よって、処理対象の入力フレーム画像111において、外接矩形720の位置と同じ位置に存在する対応領域730には、現在動いている人、あるいは最近まで動いていたが現在は静止している人が写っている可能性が高い。つまり、対応領域730は、処理対象フレーム画像111において、人が写っている可能性が高い領域であると言える。
このように、対応領域730には、現在動いている人、あるいは最近まで動いていたが現在は静止している人が写っている可能性が高いことから、処理対象の入力フレーム画像111において、静止対象物領域の候補である第1候補領域700を包含する包含対応領域730には、最近まで動いていたが現在は静止している人が写っている可能性が高く、現在動いている人が写っている可能性は低い。言い換えれば、撮影範囲において、第1候補領域700を包含する包含対応領域730に対応する領域には、最近まで動いていたが現在は静止している人が存在する可能性が高く、現在動いている人が存在する可能性は低い。
そこで、静止対象物特定部35は、包含対応領域730を、処理対象の入力フレーム画像111において、静止している人が写る静止対象物領域とする。図38の例では、第1候補領域700a,700b,700dを包含する対応領域730が、静止対象物領域となる。静止対象物特定処理において、複数の包含対応領域730が得られる場合には、複数の静止対象物領域が得られる。
以上のように、静止対象物特定部35が、長期保存マップ410と、静止対象物領域の候補である第1候補領域700とに基づいて、静止対象物領域を特定することによって、静止対象物領域を適切に特定することができる。
<第2マップ補正処理の詳細>
次にステップs39での第2マップ補正処理について詳細に説明する。ステップs39での第2マップ補正処理において、 第2マップ更新部42は、ステップs34で更新された長期保存マップ410における、ステップs38で特定された静止対象物領域に対応する各第1の値411を、ステップs35で更新された短期保存マップ420における、当該静止対象物領域に対応する各第2の値421に加算する。
図39は第2マップ補正処理を説明するための図である。図39の左側には、ステップs38で特定された静止対象物領域800の一例が示されている。ここでは、2つの静止対象物領域800a,800bが示されている。また図39の中央部には、ステップs34で更新された長期保存マップ410における、静止対象物領域800a,800bにそれぞれ対応する対応領域415a,415bが示されている。そして、図39の右側には、ステップs35で更新された短期保存マップ420における、静止対象物領域800a,800bにそれぞれ対応する対応領域425a,425bが示されている。処理対象の入力フレーム画像111での静止対象物領域800aの位置と、長期保存マップ410での対応領域415aの位置と、短期保存マップ420での対応領域425aの位置とは互いに一致している。また、処理対象の入力フレーム画像111での静止対象物領域800bの位置と、長期保存マップ410での対応領域415bの位置と、短期保存マップ420での対応領域425bの位置とは互いに一致している。
図39の例では、第2マップ更新部42は、長期保存マップ410の対応領域415a内の各第1の値411を、短期保存マップ420の対応領域425a内の各第2の値421に加算する。第2マップ更新部42は、長期保存マップ410の第1の値411を、短期保存マップ420の第2の値411に加算する際には、短期保存マップ420において、長期保存マップ410での当該第1の値411の位置と同じ位置に存在する第2の値411に対して、当該第1の値411を加算する。同様に、第2マップ更新部42は、長期保存マップ410の対応領域415b内の各第1の値411を、短期保存マップ420の対応領域425b内の各第2の値421に加算する。
<第2暫定特定処理の詳細>
次にステップs40での第2暫定特定処理について詳細に説明する。図40は第2暫定特定処理の一例を示すフローチャートである。図40に示されるように、ステップs81において、暫定特定部36は、ステップs39で補正された短期保存マップ420を複数のブロック428に区分する。例えば、入力フレーム画像111の画像サイズがQQVGA(160×120ピクセル)である場合には、短期保存マップ420は、例えば(16×15)個のブロック428に区分される。この場合に、短期保存マップ420では、行方向に16個のブロック428が存在し、列方向に15個のブロック428が存在する。入力フレーム画像111の画像サイズがQQVGAである場合には、短期保存マップ420は、(160×120)個の第2の値421で構成される。したがって、一つのブロック428内には、(10×8)個の第2の値421が存在する。
次にステップs82において、暫定特定部36は、各ブロック428について、ブロック428内での、しきい値th_i以上の第2の値421の数を数える。以後、当該数を「カウント数」と言う。しきい値th_i例えば5に設定される。なお、暫定特定部36は、ブロック428内での、しきい値th_iよりも大きい第2の値421の数を数えても良い。
次にステップs83において、暫定特定部36は、各ブロック428について、ステップs72で求めたカウント数がしきい値th_j以上であるか否かを判定する。そして、暫定特定部36は、カウント数がしきい値th_j以上のブロック428を前景候補対応ブロック428Fとする。なお、暫定特定部36は、カウント数がしきい値th_jよりも大きいブロック428を前景候補対応ブロック428Fとしても良い。
次にステップs84において、暫定特定部36は、処理対象の入力フレーム画像111において、各前景候補対応ブロック428Fに対応する領域を、前景候補領域850とする。つまり、暫定特定部36は、各前景候補対応ブロック428Fについて、処理対象の入力フレーム画像111において、短期保存マップ420での前景候補対応ブロック428Fの位置と同じ位置に存在する領域を、前景候補領域850とする。そして、暫定特定部36は、処理対象の入力フレーム画像111において、前景候補領域850以外の領域を背景候補領域860とする。
図41は、前景候補対応ブロック428F、前景候補領域850及び背景候補領域860の一例を示す図である。図41では、複数のブロック428に区分された短期保存マップ420が左側に示され、処理対象の入力フレーム画像111が右側に示されている。また図41では、前景候補対応ブロック428F及び前景候補領域850が斜線で示されている。図41に示されるように、処理対象の入力フレーム画像111では、短期保存マップ420での複数の前景候補対応ブロック428Fにそれぞれ対応する複数の領域のそれぞれが、前景候補領域850となっている。そして、処理対象の入力フレーム画像111では、前景候補領域850以外の領域が背景候補領域860となっている。
ここで、仮に、第2マップ補正処理が実行されない場合を考える。第2マップ更新処理で使用される第2減少量は大きな値に設定されていることから、第2マップ更新処理が行われる短期保存マップ420では、処理対象の入力フレーム画像111における、現在動いている人が写る領域付近に対応する第2の値421は大きな値を示しやすいものの、処理対象の入力フレーム画像111における、最近まで動いていたが現在は静止している人が写る領域付近に対応する第2の値412は小さい値を示しやすくなる。そのため、第2マップ補正処理が実行されない場合、処理対象の入力フレーム画像111における、短期保存マップ420での第2の値421が大きい領域に対応する領域には、現在動いている人が写る可能性は高いものの、静止している人が写る可能性は低い。よって、第2マップ補正処理が実行されない場合、短期保存マップ420を用いて、処理対象の入力フレーム画像111において、動いている人が写る領域を特定することは可能であるものの、静止している人が写る領域を特定することは容易ではない。
一方で、第2マップ補正処理では、長期保存マップ410における、静止対象物領域に対応する第1の値411が、短期保存マップ420における、当該静止対象物領域に対応する第2の値421に加算される。そのため、第2マップ補正処理後の短期保存マップ420では、静止対象物領域に対応する第2の値421が大きくなる。したがって、第2マップ補正処理後の短期保存マップ420では、処理対象の入力フレーム画像111における、現在動いている人が写る領域付近に対応する第2の値421だけではなく、処理対象の入力フレーム画像111における、最近まで動いていたが現在は静止している人が写る領域付近に対応する第2の値421も大きい可能性が高い。よって、処理対象の入力フレーム画像111における、短期保存マップ420での第2の値421が大きい領域に対応する領域には、動いている人と、静止している人とが写る可能性が高い。
このように、第2マップ補正処理の実行により、処理対象の入力フレーム画像111における、短期保存マップ420での第2の値421が大きい領域に対応する領域に、動いている人と、静止している人とが写る可能性は高くなる。そのため、処理対象の入力フレーム画像111において、第2マップ補正処理後の短期保存マップ420に基づいて特定された各前景候補対応ブロック428Fに対応する領域では、動いている人であるのか、静止している人であるのかにかかわらず、人が写っている可能性が高い。つまり、撮影範囲(室内)における、各前景候補対応ブロック428Fに対応する領域では、人が存在する可能性が高い。よって、本例では、処理対象の入力フレーム画像111における、各前景候補対応ブロック428Fに対応する領域が、前景候補領域850とされている。
<学習率決定処理の詳細>
次にステップs41での学習率決定処理について詳細に説明する。学習率決定処理において、背景モデル更新部32は、ステップs40で特定された前景候補領域850に含まれる入力画素に対応する混合正規分布511を更新する際に使用する学習率αを、ステップs40で特定された背景候補領域860に含まれる入力画素に対応する混合正規分布511を更新する際に使用する学習率αよりも小さな値に設定する。また、背景モデル更新部32は、前景候補領域850に含まれる入力画素に対応する混合正規分布511を更新する際に使用する学習率βを、背景候補領域860に含まれる入力画素に対応する混合正規分布511を更新する際に使用する学習率βよりも小さな値に設定する。
前景候補領域850に含まれる入力画素に対応する混合正規分布511を更新する際に使用される学習率α,βを学習率α1,β1とし、背景候補領域860に含まれる入力画素に対応する混合正規分布511を更新する際に使用される学習率α,βを学習率α2,β2とすると、学習率α1,β1,α2,β2は以下の式(8)〜(11)でそれぞれ表される。
ここで、式(8),(9)中の基準値REF1は、式(10),(11)中の基準値REF2よりも小さい値に設定される。基準値REF1は例えば0.00001に設定され、基準値REF2は例えば0.1に設定される。これにより、学習率α1は、例えば、学習率α2の数千分の一の値となる。また、学習率β1は、例えば、学習率β2の数千分の一の値となる。なお、式(8)〜(11)中の定数A,Bは、撮影領域等に応じて適宜決定される。
背景モデル更新部32は、入力フレーム画像111を構成する複数の入力画素のそれぞれについて、当該入力画素が前景候補領域850に含まれるか、背景候補領域860に含まれるかに応じて、当該入力画素に対応する混合正規分布511を更新する際に使用する学習率α,βを決定する。
ステップs43において、背景モデル更新部32は、ステップs41で決定した学習率α,βを用いて第1背景モデル500を更新する。具体的には、背景モデル更新部32は、対象入力画素が前景候補領域850に含まれる場合には、対象混合正規分布511に含まれる各正規分布512の重みwを、学習率α1が用いられた上記の式(1)に従って更新する。また、背景モデル更新部32は、対象入力画素が前景候補領域850に含まれる場合には、対象混合正規分布511に含まれる対象の1次適合正規分布512の平均値μ及び分散値σを、学習率β1が用いられた上記の式(2),(3)に従って更新する。また、背景モデル更新部32は、対象入力画素が背景候補領域860に含まれる場合には、対象混合正規分布511に含まれる各正規分布512の重みwを、学習率α2が用いられた式(1)に従って更新する。また、背景モデル更新部32は、対象入力画素が背景候補領域860に含まれる場合には、対象混合正規分布511に含まれる対象の1次適合正規分布512の平均値μ及び分散値σを、学習率β2が用いられた式(2),(3)に従って更新する。
このように、対象入力画素が前景候補領域850に含まれる場合に使用される学習率α1,β1は、対象入力画素が背景候補領域860に含まれる場合に使用される学習率α2,β2よりもそれぞれ小さな値に設定される。言い換えれば、対象入力画素が人(前景)を示す可能性が高い場合に使用される学習率α1,β1は、対象入力画素が背景を示す可能性が高い場合に使用される学習率α2,β2よりもそれぞれ小さな値に設定される。したがって、人を示す可能性が高い入力画素に対応する混合正規分布511は更新されにくくなる。よって、人を示す可能性が高い入力画素に対応する背景情報501も更新されにくくなる。
一方で、上述のように、第1背景モデル更新処理では、対象入力画素において、同程度の画素値が現れる頻度が大きくなれば、対象入力画素に現れる画素値に応じた正規分布512が対象入力画素に対応する背景情報501として採用されるようになる。したがって、対象入力画素において、同程度の画素値が現れる頻度が大きくなれば、対象入力画素は判定部31において背景画素として判定されるようになる。撮影領域でのある場所において、人が静止する場合には、入力フレーム画像111における、その場所に対応する各画素では、同程度の画素値が現れる頻度が大きくなる。したがって、撮影領域において人が静止していると、判定部31は、入力フレーム画像111における、静止している人を示す画素を、誤って背景画素であると判定する可能性がある。
本例では、人を示す可能性が高い入力画素に対応する背景情報501が更新されにくくなることから、静止している人を示す入力画素に対応する背景情報501が更新されにくくなる。よって、静止している人を示す入力画素の画素値に応じた正規分布512が当該入力画素に対応する背景情報501として採用されにくくなる。その結果、判定部31が、入力フレーム画像111における、静止している人を示す入力画素を、誤って背景画素であると判定する可能性を低減することができる。よって、入力フレーム画像111において人が写る領域を適切に特定することができる。
なお上記の例では、静止対象物特定部35は、包含対応領域730を静止対象物領域800としていたが、包含対応領域730に含まれる各第1候補領域700を、静止対象物領域800としても良い。包含対応領域730と同様に、包含対応領域730に含まれる第1候補領域700には、最近まで動いていたが現在は静止している人が写っている可能性が高く、現在動いている人が写っている可能性は低いと言える。よって、包含対応領域730に含まれる各第1候補領域700を、静止対象物領域800としても良い。
ここで、包含対応領域730に、複数の第1候補領域700が含まれる場合、当該複数の第1候補領域700が、静止している同じ人を示す可能性がある。包含対応領域730に含まれる複数の第1候補領域700のそれぞれを静止対象物領域800とする場合には、複数の静止対象物領域800が、静止している同じ人を示す可能性がある。つまり、静止対象物特定部35において、同じ人に対して複数の静止対象物領域800が特定される可能性がある。そのため、後処理部37が出力する出力画像151では、同じ人に対して、互いに独立した複数の前景領域が特定される可能性がある。出力画像151に基づいて、室内に存在する人の数をカウントする場合、特定された複数の前景領域が1人の人を示していたり、複数の人を示していたりすると、室内での人の数を正しくカウントできない可能性がある。
一方で、上述の説明から理解できるように、入力フレーム画像111での複数の包含対応領域730は、静止している人が写る可能性が高い、互いに独立した領域である。そのため、上記の例のように、複数の包含対応領域730のそれぞれを静止対象物領域800とする場合には、複数の静止対象物領域800は、互いに異なる複数の人を示す可能性が高い。よって、出力画像151に含まれる複数の前景領域は、互いに異なる複数の人を示す可能性が高い。その結果、出力画像151に基づいて、室内に存在する人の数をカウントする場合に、人の数をより正しくカウントすることができる。
<各種変形例>
以下に画像処理装置3の各種変形例について説明する。
<第1変形例:頻度型背景更新の未使用>
図42は本変形例に係る画像処理装置3の構成の一例を示す図である。本変形例に係る画像処理装置3は、上述の図3に示される画像処理装置3において、構成としては、判定部31、背景モデル更新部32、第1背景モデル500及び出現画素値情報510が削除され、暫定特定部36の代わりに特定部136が設けられたものである。
特定部136は、上述の暫定特定部36と同様にして、補正後の第2マップ420に基づいて前景領域を特定する。ただし、特定部136は、前景領域を暫定的に特定するのではなく、前景領域の特定結果を後処理部37に入力する。特定部136は、上述の判定結果画像150と同様の、前景領域の特定結果を示す特定結果画像160を生成する。特定結果画像160を構成する複数の画素は、入力フレーム画像111を構成する複数の入力画素にそれぞれ対応している。特定結果画像160では、特定された前景領域(上述の前景候補領域850に相当)と同じ位置に存在する領域の各画素の画素値が1に設定される。また、特定結果画像160では、入力フレーム画像111における、前景領域以外の領域(上述の背景候補領域860に相当)と同じ位置に存在する領域の各画素の画素値が0に設定される。
後処理部37は、判定結果画像150に対する後処理と同様にして、特定結果画像160に対して後処理を行い、後処理後の特定結果画像160を出力画像161として出力する。出力画像161において、値が1を示す領域が、人が写る前景領域となる。
このように、頻度型背景更新が使用されない場合であっても、入力フレーム画像111において、人が写る前景領域を適切に特定することができる。
本変形例に係る画像処理装置3の動作の一例を示すフローチャートは、上述の図13に示されるフローチャートにおいて、ステップs41,s42,s43が削除され、ステップs40において特定部136での前景特定処理が行われるものとなる。
<第2変形例:頻度型背景更新の未使用、静止している人の検出>
図43は本変形例に係る画像処理装置3の構成の一例を示す図である。本変形例に係る画像処理装置3は、上述の図42に示される画像処理装置3において、構成としては、第2マップ更新部42、第2マップ420及び特定部136が削除されたものである。本変形例に係る画像処理装置3は、動いている人、静止している人を問わず、室内に存在する人を検出するのではなく、室内で静止している人を検出する。つまり、画像処理装置3は、入力フレーム画像111において、動いている人、静止している人を問わず、人が写る領域を前景領域として特定するのではなく、静止している人を前景領域として特定する。
本変形例では、静止対象物特定部35は、静止対象物領域を前景領域として特定し、その特定結果を示す特定結果画像170を生成する。特定結果画像170を構成する複数の画素は、入力フレーム画像111を構成する複数の入力画素にそれぞれ対応している。特定結果画像170では、特定された静止対象物領域(前景領域)と同じ位置に存在する領域の各画素の画素値が1に設定される。また、特定結果画像170では、入力フレーム画像111における、静止対象物領域以外の領域と同じ位置に存在する領域の各画素の画素値が0に設定される。
後処理部37は、判定結果画像150に対する後処理と同様にして、特定結果画像170に対して後処理を行い、後処理後の特定結果画像170を出力画像171として出力する。出力画像171において、値が1を示す領域が、静止している人が写る前景領域となる。
このようにして、本変形例に係る画像処理装置3は、入力フレーム画像111において、静止している人を前景領域として適切に特定することができる。
なお、本変形例に係る画像処理装置3の動作の一例を示すフローチャートは、上述の図13に示されるフローチャートにおいて、ステップs35,s39〜s43が削除されたものとなる。
<第3変形例:静止対象物領域に基づいて学習率を決定>
図44は本変形例に係る画像処理装置3の構成の一例を示す図である。本変形例に係る画像処理装置3は、上述の図3に示される画像処理装置3において、構成としては、第2マップ更新部42、第2マップ420及び暫定特定部36が削除されたものである。本変形例に係る画像処理装置3は静止対象物領域に基づいて学習率α,βを設定する。
本変形例では、背景モデル更新部32は、静止対象物特定部35が特定した静止対象物領域に含まれる入力画素に対応する混合正規分布511を更新する際に使用する学習率αを、処理対象の入力フレーム画像111における、当該静止対象物領域以外の領域(以後、「非静止対象物領域」と呼ぶ)に含まれる入力画素に対応する混合正規分布511を更新する際に使用する学習率αよりも小さな値に設定する。
また、背景モデル更新部32は、静止対象物領域に含まれる入力画素に対応する混合正規分布511を更新する際に使用する学習率βを、非静止対象物領域に含まれる入力画素に対応する混合正規分布511を更新する際に使用する学習率βよりも小さな値に設定する。
静止対象物領域に含まれる入力画素に対応する混合正規分布511を更新する際に使用される学習率α,βを学習率α1,β1とすると、学習率α1,β1は上記の式(8),(9)でそれぞれ表される。また、非静止対象物領域に含まれる入力画素に対応する混合正規分布511を更新する際に使用される学習率α,βを学習率α2,β2とすると、学習率α2,β2は上記の式(10),(11)でそれぞれ表される。
背景モデル更新部32は、入力フレーム画像111を構成する複数の入力画素のそれぞれについて、当該入力画素が静止対象物領域に含まれるか、非静止対象物領域に含まれるかに応じて、当該入力画素に対応する混合正規分布511を更新する際に使用する学習率α,βを決定する。
このように、本変形例では、対象入力画素が静止対象物領域に含まれる場合に使用される学習率α1,β1は、対象入力画素が非静止対象物領域に含まれる場合に使用される学習率α2,β2よりもそれぞれ小さな値に設定される。つまり、対象入力画素が静止している人を示すと判定される場合に使用される学習率α1,β1は、対象入力画素が静止している人を示さないと判定される場合に使用される学習率α2,β2よりもそれぞれ小さな値に設定される。言い換えれば、対象入力画素が、静止している人を示す可能性が高い場合に使用される学習率α1,β1は、対象入力画素が静止している人を示さない可能性が高い場合に使用される学習率α2,β2よりもそれぞれ小さな値に設定される。したがって、静止している人を示す入力画素に対応する混合正規分布511は更新されにくくなる。よって、静止している人を示す入力画素の画素値に応じた正規分布512が当該入力画素に対応する背景情報501として採用されにくくなる。その結果、判定部31が、入力フレーム画像111における、静止している人を示す入力画素を、誤って背景画素であると判定する可能性を低減することができる。
なお、本変形例では、動いている人を示す入力画素に対応する混合正規分布511は更新されやすくなる。しかしながら、動いている人を示す入力画素では、同程度の画素値が現れる頻度は小さいことから、動いている人を示す入力画素に現れる画素値に応じた正規分布512が当該入力画素に対応する背景情報501として採用されにくい。したがって、動いている人を示す入力画素に対応する混合正規分布511は更新されやすくなったとしても、判定部31が、入力フレーム画像111における、動いている人を示す入力画素を、誤って背景画素であると判定する可能性を低減することができる。
本変形例に係る画像処理装置3の動作の一例を示すフローチャートは、上述の図13に示されるフローチャートにおいて、ステップs35,s39,s40が削除されたものとなる。
<第4変形例:静止対象物特定処理の変形例>
図45は本変形例に係る画像処理装置3の構成の一例を示す図である。本変形例に係る画像処理装置3は、上述の第3変形例に係る画像処理装置3(図44参照)において、構成としては、静止対象物特定部35の代わりに静止対象物特定部135を設けたものである。
静止対象物特定部135は、第3マップ更新部43と特定部236とを備えている。第3マップ更新部43は、静止対象物特定処理において、第1候補領域及び第1マップ410に基づいて、記憶部5内の第3マップ430を更新する。特定部236は、静止対象物特定処理において、更新後の第3マップ430に基づいて静止対象物領域を特定する。画像処理装置3は、第3変形例と同様に、特定した静止対象物領域に基づいて学習率α,βを決定する。
第3マップ430では、図15,16に示される第1マップ410及び第2マップ420と同様に、入力フレーム画像111に含まれる複数の入力画素にそれぞれ対応する複数の第3の値が、当該複数の入力画素の位置に応じて並んでいる。第3マップ430での第3の値の位置は、入力フレーム画像111での、当該第3の値に対応する入力画素の位置と一致している。
第3マップ更新部43は、ステップs37で特定される第1候補領域と、ステップs34で更新される第1マップ410とに基づいて、第3マップ430を更新する第3マップ更新処理を行う。
<第3マップ更新処理の詳細>
第3マップ更新処理において、まず第3マップ更新部43は、上述のステップs38での静止対象物特定処理と同様にして、少なくとも一つの第1候補領域700を含む包含対応領域730を求める。このとき、上記と同様に、複数の包含対応領域730が求められることがある。
次に第3マップ更新部43は、第1マップ410における、包含対応領域730に対応する第1の値411を、第3マップ430における、包含対応領域730に対応する第3の値として採用するコピー処理を実行する。つまり、第3マップ更新部43は、第1マップ410において、処理対象の入力フレーム画像111での包含対応領域730の位置と同じ位置に存在する領域内の各第1の値411について、当該第1の値411を、第3マップ430における、当該第1の値411に対応する第3の値として採用するコピー処理を実行する。第1の値411に対応する第3の値とは、第3マップ430において、当該第1の値411の第1マップ410での位置と同じ位置に存在する第3の値である。第3マップ更新部43は、複数の包含対応領域730が求められた場合には、各包含対応領域730についてコピー処理を行う。そして、第3マップ更新部43は、第3マップ430において、コピー処理が実行される第3の値以外の第3の値を第3減少量だけ減少する。第3マップ更新部43は、第1の値411を第3の値として採用することはあっても、第1の値411とは異なり、第3の値を所定値だけ増加することはない。第3減少量は、第1マップ410についての第1減少量よりも大きな値に設定される。
以後、第1マップ410の第1の値411を、第3マップ430における、当該第1の値411に対応する第3の値として採用することを、第1マップ410の第1の値411についての第3マップ430へのコピーと表現することがある。第3マップ更新部43は、第1マップ410における、包含対応領域730に対応する対応領域内の各第1の値411を、第3マップ430にコピーする。
図46は第1の値411が第3マップ430へコピーされる様子の一例を示す図である。図46の左側には包含対応領域730が示されている。ここでは、2つの包含対応領域730a,730bが示されている。図46の中央部には、第1マップ410において、包含対応領域730,730bにそれぞれ対応する対応領域418a,418bが示されている。図46の右側には、第3マップ430において、包含対応領域730a,730bにそれぞれ対応する対応領域438a,438bが示されている。処理対象の入力フレーム画像111での包含対応領域730aの位置と、第1マップ410での対応領域418aの位置と、第3マップ430での対応領域438aの位置とは互いに一致している。また、処理対象の入力フレーム画像111での包含対応領域730bの位置と、第1マップ410での対応領域418bの位置と、第3マップ430での対応領域438bの位置とは互いに一致している。
図46の例では、第3マップ更新部43は、第1マップ410の対応領域418a内の各第1の値411を、第3マップ430の対応領域438a内の第3の値として採用する。第3マップ更新部43は、第1マップ410の第1の値411を、第3マップ430の第3の値として採用する際には、第3マップ430において、第1マップ410での当該第1の値411の位置と同じ位置に存在する第3の値として、当該第1の値411を採用する。同様に、第3マップ更新部43は、第1マップ410の対応領域418b内の各第1の値411を、第3マップ430の対応領域438b内の第3の値として採用する。
このように、第3マップ更新部43が、第1マップ410における、各包含対応領域730に対応する第1の値411を、第3マップ430における、各包含対応領域730に対応する第3の値として採用するコピー処理を実行し、第3マップ430において、コピー処理が実行される第3の値以外の第3の値を第3減少量だけ減少することによって、第3マップ430が更新される。
ここで、上述のように、包含対応領域730には、最近まで動いていたが現在は静止している人が写っている可能性が高い。一方で、第1マップ410では、処理対象の入力フレーム画像111における、最近まで動いていたが現在は静止している人が写る領域付近に対応する第1の値411が大きな値を示しやすい。したがって、第1マップ410における、包含対応領域730に対応する第1の値411は大きな値を示す可能性が高い。そのため、第1マップ410における、包含対応領域730に対応する第1の値411を第3マップ430にコピーすることによって、第3マップ430では、処理対象の入力フレーム画像111における、静止している人が写る領域に対応する第3の値が大きな値を示す可能性が高い。よって。第3マップ430において、第3の値が0よりも大きい領域は、処理対象の入力フレーム画像111において、静止している人が写る領域に対応する可能性が高い。
そこで、特定部236は、更新された第3マップ430において、第3の値が0よりも大きい領域を、静止対象物対応領域439とする。そして、特定部236は、処理対象の入力フレーム画像111において、静止対象物対応領域429に対応する領域を、静止している人が写る静止対象物領域800とする。
図47は静止対象物対応領域439及び静止対象物領域800の一例を示す図である。図47の例では、第3マップ430に三つの静止対象物対応領域439a〜439cが含まれている。特定部236は、処理対象の入力フレーム画像111において、静止対象物対応領域439aに対応する領域を静止対象物領域800aとして特定する。つまり、特定部236は、処理対象の入力フレーム画像111において、静止対象物対応領域439aの第3マップ430での位置と同じ位置に存在する領域を静止対象物領域800aとして特定する。同様に、特定部236は、処理対象の入力フレーム画像111において、静止対象物対応領域439bに対応する領域を静止体対象物領域800bとして特定し、処理対象の入力フレーム画像111において、静止対象物対応領域439cに対応する領域を静止体対象物領域800cとして特定する。静止対象物領域800a〜800cは、互い異なる複数の静止している人にそれぞれ対応する可能性が高い。したがって、図47の例では、撮影領域には、静止している人が3人存在している可能性が高い。
なお、第3マップ更新部43は、第1候補領域700を含む包含対応領域730を求めなくても良い。この場合には、第3マップ更新部43は、暫定特定部34で特定された各第1候補領域700について、第1マップ410における、当該第1候補領域700に対応する各第1の値411を、第3マップ430にコピーする。そして、特定部236は、上記と同様に、第3マップ430において、第3の値が0よりも大きい領域を、静止対象物対応領域439とする。そして、特定部236は、処理対象の入力フレーム画像111において、静止対象物対応領域439に対応する領域を、静止している人が写る静止対象物領域800とする。このような場合であっても、適切に静止対象物領域800を特定することができる。
上述の図3,43,44の例では、第1マップ410に基づいて静止対象物領域800が特定されている。第1マップ410では、第1減少量が小さいため、入力フレーム画像111における、すでに人が写らなくなった領域に対応する各第1の値411は小さくなりにくい。したがって、第1マップ410を2値化して得られる2値化マップでは、入力フレーム画像111における、すでに人が写らなくなった領域に対応する各画素値が、比較的長い間、1を示す可能性がある。その結果、図3,43,44の例では、入力フレーム画像111における、人が写らなくなった領域が、比較的長い間、静止対象物領域800として特定される可能性がある。
これに対して、本変形例では、第3マップ430についての第3減少量が大きいため、第3マップ430では、入力フレーム画像111における、すでに人が写らなくなった領域に対応する各第3の値はすぐに0になりやすい。したがって、入力フレーム画像111における、人が写らなくなった領域が、長い間、静止対象物領域800として特定される可能性を抑制することができる。よって、静止対象物領域800をより適切に特定することができる。
また、入力フレーム画像111において、複数の第1候補領域700が特定された場合、当該複数の第1候補領域700が、静止している同じ人を示す可能性がある。複数の第1候補領域700のそれぞれについて、第1マップ410における、第1候補領域700に対応する各第1の値411を、第3マップ430にコピーする場合、第3マップ430に基づいて特定された複数の静止対象物領域800が、静止している同じ人を示す可能性がある。つまり、特定部236において、同じ人に対して複数の静止対象物領域800が特定される可能性がある。そのため、後処理部37が出力する出力画像151では、同じ人に対して、互いに独立した複数の前景領域が特定される可能性がある。出力画像151に基づいて、室内に存在する人の数をカウントする場合、特定された複数の前景領域が1人の人を示していたり、複数の人を示していたりすると、室内での人の数を正しくカウントできない可能性がある。
一方で、上述の説明から理解できるように、入力フレーム画像111での複数の包含対応領域730は、静止している人が写る可能性が高い、互いに独立した領域である。そのため、第1マップ410における、各包含対応領域730に対応する各第1の値411を、第3マップ430にコピーする場合には、特定された複数の静止対象物領域800は、互いに異なる複数の人を示す可能性が高い。よって、出力画像151に含まれる複数の前景領域は、互いに異なる複数の人を示す可能性が高い。その結果、出力画像151に基づいて、室内に存在する人の数をカウントする場合に、人の数をより正しくカウントすることができる。
なお、第1変形例に係る画像処理装置3(図42参照)及び第2変形例に係る画像処理装置3(図43参照)において、静止対象物特定部35の代わりに静止対象物特定部135を設けても良い。
<第5変形例:影の影響を排除>
背景を示す入力画素の画素値は、変化しにくく安定している。したがって、背景を示す入力画素に対応する背景正規分布501の分散値σは小さくなる可能性が高い。
一方で、背景での影が生じている部分は暗くなることから、当該部分を示す入力画素の画素値は小さくなる。背景を示す入力画素に対応する背景正規分布501の分散値σは小さくなる可能性が高いことから、背景での影が生じている部分を示す入力画素の画素値は、当該入力画素に対応する各背景正規分布501の所定範囲(例えば、μ±4σの範囲)よりも小さくなり易い。よって、判定部31は背景を示す入力画素を誤って前景画素と判定する可能性がある。
そこで、本変形例では、判定部31は、前景判定処理において、対象入力画素の画素値が、正規分布512の所定範囲内に存在しない場合であっても、対象入力画素の画素値が、当該正規分布512の平均値μよりも小さい下限値LL以上であって、かつ当該平均値μ以下である場合には、例外的に、当該正規分布512を適合正規分布512とする。つまり、対象入力画素の画素値Xが、正規分布512の所定範囲内に存在しない場合であっても、対象入力画素の画素値Xが以下の式(12)を満たす場合には、例外的に、当該正規分布512を適合正規分布512とする。下限値LLは、例えば、LL=0.85×μに設定される。
判定部31は、対象入力画素の画素値が、正規分布512の所定範囲内に存在しない場合に、当該正規分布512を例外的に適合正規分布512とする場合には、当該正規分布512を、例えば、1次適合正規分布512ではなく、2次適合正規分布512として取り扱う。
図48は、対象入力画素の画素値Xが、正規分布512の所定範囲内に存在しないものの、下限値LL以上であって、かつ平均値μ以下である様子を示す図である。
なお、判定部31は、対象入力画素の画素値が、正規分布512の所定範囲内に存在しない場合であっても、対象入力画素の画素値が、下限値LLよりも大きく、かつ平均値μ以下である場合に、例外的に、当該正規分布512を適合正規分布512としても良い。
また、判定部31は、対象入力画素の画素値が、正規分布512の所定範囲内に存在しない場合であっても、対象入力画素の画素値が、下限値LLよりも大きく、かつ平均値μ未満である場合に、例外的に、当該正規分布512を適合正規分布512としても良い。
また、判定部31は、対象入力画素の画素値が、正規分布512の所定範囲内に存在しない場合であっても、対象入力画素の画素値が、下限値LL以上であって、かつ平均値μ未満である場合に、例外的に、当該正規分布512を適合正規分布512としても良い。
このようにして、例外的に正規分布512を適合正規分布512とすることによって、判定部31が背景を示す入力画素を誤って前景画素と判定することを抑制することができる。
<第6変形例:明るさの変化の発生時に学習率を制御>
図49は本変形例に係る画像処理装置3の構成の一例を示す図である。本変形例に係る画像処理装置3は、上述の図3に示される画像処理装置3において、構成としては、検出部45をさらに備えるものである。
検出部45は、撮影領域の明るさの変化を検出する明るさ変化検出処理を行う。ここで、撮像領域の明るさの変化には、撮像領域の明るさの変動も含む。明るさ変化検出処理は、上述の図13に示されるフローチャートにおいて、ステップs32の後であって、ステップs41の前に実行される。
検出部45は、例えば、動き特定部33で生成される、処理対象の入力フレーム画像111と、それよりもMフレーム前の入力フレーム画像111との差分を示す差分画像600に基づいて、撮影領域の明るさの変化を検出する。具体的には、検出部45は、差分画像600での、画素値が1を示す領域の割合Rdがしきい値th_k以上であるか否かを判定する。言い換えれば、検出部45は、差分画像600での、動き領域の割合Rdがしきい値th_k以上であるか否かを判定する。検出部45は、割合Rdがしきい値th_k以上であれば、撮影領域の明るさが変化したと判定する。一方で、検出部45は、割合Rdがしきい値th_k未満であれば、撮影領域の明るさが変化していないと判定する。割合Pdは、例えば、差分画像600での、画素値が1を示す領域の画素数を、差分画像600の全画素数で割ることによって得られる。なお、検出部45は、他の条件に基づいて、撮影領域の明るさの変化を検出しても良い。
本変形例に係る学習率決定処理では、明るさ変化検出処理の結果と、第2暫定特定処理の結果とに基づいて、学習率α,βが決定される。学習率決定処理において、背景モデル更新部32は、処理対象の入力フレーム画像111についての明るさ変化検出処理において、撮影領域の明るさの変化が検出された場合には、第2暫定特定処理の結果にかかわらず、全入力画素に対応する学習率α,βを大きくする。撮影領域の明るさの変化が検出された場合の学習率α,βをそれぞれ学習率α3,β3とすると、学習率α3,β3は以下の式(13),(14)でそれぞれ表される。
式(13),(14)中の基準値REF3は、上述の基準値REF1,REF2よりも大きい値に設定される。基準値REF3は例えば0.65に設定される。これにより、学習率α3は、例えば学習率α2の数倍となる。また、学習率β3は、例えば学習率β2の数倍となる。
背景モデル更新部32は、学習率α3を使用することを決定すると、処理対象の入力フレーム画像111の各入力画素について、当該入力画素に対応する混合正規分布511に含まれる各正規分布512の重みwを、学習率α3が用いられた上記の式(1)に従って更新する。また、背景モデル更新部32は、学習率β3を使用することを決定すると、各入力画素について、当該入力画素に対応する混合正規分布511に含まれる対象の1次適合正規分布512の平均値μ及び分散値σを、学習率β3が用いられた上記の式(2),(3)に従って更新する。
一方で、背景モデル更新部32は、明るさ変化検出処理において撮影領域の明るさの変化が検出されなかった場合には、上記と同様にして、ステップs40で特定された前景候補領域に含まれる入力画素に対応する学習率α,βとして学習率α1,β1を使用し、ステップ40で特定された背景候補領域に含まれる入力画素に対応する学習率α,βとして学習率α2,β2を使用する。
背景モデル更新部32は、撮影領域の明るさの変化が検出されると、所定期間、学習率α3,β3を使用する。背景モデル更新部32は、例えば、撮影領域の明るさの変化が検出されたフレームを含む10フレームの間、学習率α3,β3を使用する。したがって、学習率α3,β3が使用される当該所定期間においては、明るさ変化検出処理、第2暫定特定処理及び学習率決定処理は実行されない。当該所定期間の経過後、明るさ変化検出処理、第2暫定特定処理及び学習率決定処理は再開する。
以上のように、本変形例では、撮影領域の明るさの変化が検出されたとき、学習率α、βが所定期間大きな値に設定されている。学習率α,βが大きな値に設定されると、混合正規分布511が更新されやすくなり、その結果、背景情報501も更新されやすくなる。
一方で、背景情報501が更新されにくい場合には、撮影領域の明るさが変化すると、明るさが変化した後の撮影領域での背景を示す入力画素値に適合する適合正規分布512が、背景情報501において、しばらくの間、現れない可能性がある。その結果、撮影領域の明るさが変化した後、しばらくの間、背景を示す画素を誤って背景画素として判定する可能性がある。
本変形例では、撮影領域の明るさの変化が検出された後、所定期間、背景情報501が更新されやすくなることから、明るさが変化した後の撮影領域での背景を示す入力画素値に適合する適合正規分布512が、背景情報501においてすぐに現れやすくなる。よって、撮影領域の明るさが変化した後、すぐに、背景を示す画素を適切に背景画素として判定することが可能となる。よって、人の検出精度が向上する。
なお、第1〜第5変形例に係る画像処理装置3においても、同様に、撮影領域の明るさの変化を検出し、当該変化が検出されたときに、所定期間、学習率α,βを大きな値に設定しても良い。
学習率α1,α2,α3,β1,β2,β3を規定する基準値REF1,REF2,REF3についての上述の具体的な値は、単なる一例であって、撮影領域等に応じて適宜設定される。
<その他の変形例>
上記の例では、画像処理システム1が検出する検出対象物は、人であったが、人以外の移動体であっても良い。検出対象物は、例えば、人以外の動物であっても良いし、自律的に移動するロボットであっても良い。
以上のように、画像処理システム1及び画像処理装置3は詳細に説明されたが、上記した説明は、全ての局面において例示であって、この発明がそれに限定されるものではない。また、上述した各種変形例は、相互に矛盾しない限り組み合わせて適用可能である。そして、例示されていない無数の変形例が、この発明の範囲から外れることなく想定され得るものと解される。
3 画像処理装置
6 制御プログラム
31 判定部
32,38 背景モデル更新部
33 動き特定部
34,36 暫定特定部
35,135 静止対象物特定部
41 第1マップ更新部
42 第2マップ更新部
43 第3マップ更新部
45 検出部
111 入力フレーム画像
410 第1マップ
420 第2マップ
430 第3マップ
500 第1背景モデル
550 第2背景モデル

Claims (11)

  1. 移動体である検出対象物が写る動画像についてのフレーム間差分を示す差分画像を生成し、生成した差分画像において、フレーム間での物体の動きを示す動き領域を特定する第1特定処理を行う第1特定部と、
    前記フレーム画像に含まれる複数の画素にそれぞれ対応する複数の第1の値が、当該複数の画素の位置に応じて並ぶ第1マップを更新する第1更新処理を行う第1マップ更新部と、
    前記動画像に基づいて、当該動画像に含まれるフレーム画像において、静止している前記検出対象物が写る静止対象物領域の候補となる第1候補領域を特定する第2特定処理を行う第2特定部と
    を備え、
    前記第1マップ更新部は、前記第1更新処理において、
    前記第1マップにおける、前記動き領域に対応する前記第1の値を第1所定値だけ増加し、
    前記第1マップにおける、前記動き領域に対応しない前記第1の値を第2所定値だけ減少し、
    前記第1特定処理及び前記第1更新処理は繰り返し実行され、
    前記第1更新処理が行われた前記第1マップ及び前記第1候補領域に基づいて、前記静止対象物領域を特定する第3特定部をさらに備える、画像処理装置。
  2. 請求項1に記載の画像処理装置であって、
    前記フレーム画像に含まれる複数の画素にそれぞれ対応する複数の第2の値が、当該複数の画素の位置に応じて並ぶ第2マップを更新する第2更新処理を繰り返し行う第2マップ更新部をさらに備え、
    前記第2マップ更新部は、前記第2更新処理において、
    前記第2マップにおける、前記動き領域に対応する前記第2の値を、前記第1所定値以上の第3所定値だけ増加し、
    前記第2マップにおける、前記動き領域に対応しない前記第2の値を、前記第2所定値よりも大きい第4所定値だけ減少し、
    前記第2マップ更新部は、前記第1更新処理が行われた前記第1マップにおける、前記静止対象物領域に対応する前記第1の値を、前記第2更新処理が行われた前記第2マップにおける、前記静止対象物領域に対応する前記第2の値に加算する補正処理を行い、
    前記補正処理が行われた前記第2マップに基づいて、前記フレーム画像において、前記検出対象物が写る前景領域を特定する第4特定部をさらに備える、画像処理装置。
  3. 請求項2に記載の画像処理装置であって、
    前記第4特定部は、前記前景領域を暫定的に特定し、
    前記第4特定部が暫定的に特定した前記前景領域である第2候補領域と前記フレーム画像とに基づいて第1背景モデルを更新する背景モデル更新部と、
    前記フレーム画像に含まれる対象画素が、前記検出対象物を示す前景画素か背景画素かを、前記第1背景モデルに含まれる、当該対象画素に対応する背景情報に基づいて判定する判定部と
    をさらに備え、
    前記第1背景モデルは、過去の前記フレーム画像の画素値をモデル化した混合正規分布に基づく背景モデルであって、
    前記背景モデル更新部は、前記対象画素の画素値に基づいて、当該対象画素に対応する前記混合正規分布を更新し、更新後の前記混合正規分布に含まれる複数の正規分布から、当該対象画素に対応する前記背景情報として使用する正規分布を決定し、
    前記判定部は、前記正規分布の所定範囲内に前記対象画素の画素値が存在する場合、当該正規分布を適合正規分布とし、
    前記判定部は、前記対象画素に対応する前記背景情報に前記適合正規分布が含まれる場合、当該対象画素は前記背景画素であると判定し、前記対象画素に対応する前記背景情報に前記適合正規分布が含まれない場合、当該対象画素は前記前景画素であると判定し、
    前記背景モデル更新部は、
    前記対象画素が前記第2候補領域に含まれない場合には、前記対象画素に応じた前記混合正規分布を更新する際の学習率を第3の値に設定し、
    前記対象画素が前記第2候補領域に含まれる場合には、前記学習率を、前記第3の値よりも小さい第4の値に設定する、画像処理装置。
  4. 請求項1乃至請求項3のいずれか一つに記載の画像処理装置であって、
    前記第3特定部は、
    前記フレーム画像に含まれる複数の画素にそれぞれ対応する複数の第5の値が、当該複数の画素の位置に応じて並ぶ第3マップを更新する第3更新処理を繰り返し実行する第3マップ更新部を有し、
    前記第3マップ更新部は、前記第3更新処理において、
    前記第1更新処理が行われた前記第1マップにおける、前記第1候補領域に対応する前記第1の値を、前記第3マップにおける、前記第1候補領域に対応する前記第5の値として採用するコピー処理を実行し、
    前記第3マップにおいて、前記コピー処理が実行される前記第5の値以外の前記第5の値を、前記第2所定値よりも大きい第5所定値だけ減少し、
    前記第3特定部は、前記第3更新処理が行われた前記第3マップに基づいて前記静止対象物領域を特定する、画像処理装置。
  5. 請求項4に記載の画像処理装置であって、
    前記第3マップ更新部は、前記フレーム画像において、前記検出対象物が写る可能性が高い、互いに独立した複数の独立領域を特定し、
    前記第3マップ更新部は、前記第1マップにおける、前記第1候補領域を含む前記独立領域に対応する前記第1の値を、前記第3マップにおける、前記第1候補領域を含む前記独立領域に対応する前記第5の値として採用する、画像処理装置。
  6. 請求項1に記載の画像処理装置であって、
    前記静止対象物領域と前記フレーム画像とに基づいて第1背景モデルを更新する背景モデル更新部と、
    前記フレーム画像に含まれる対象画素が、前記検出対象物を示す前景画素か背景画素かを、前記第1背景モデルに含まれる、当該対象画素に対応する背景情報に基づいて判定する判定部と
    をさらに備え、
    前記第1背景モデルは、過去の前記フレーム画像の画素値をモデル化した混合正規分布に基づく背景モデルであって、
    前記背景モデル更新部は、前記対象画素の画素値に基づいて、当該対象画素に対応する前記混合正規分布を更新し、更新後の前記混合正規分布に含まれる複数の正規分布から、当該対象画素に対応する前記背景情報として使用する正規分布を決定し、
    前記判定部は、前記正規分布の所定範囲内に前記対象画素の画素値が存在する場合、当該正規分布を適合正規分布とし、
    前記判定部は、前記対象画素に対応する前記背景情報に前記適合正規分布が含まれる場合、当該対象画素は前記背景画素であると判定し、前記対象画素に対応する前記背景情報に前記適合正規分布が含まれない場合、当該対象画素は前記前景画素であると判定し、
    前記背景モデル更新部は、
    前記対象画素が前記静止対象物領域に含まれない場合には、前記対象画素に応じた前記混合正規分布を更新する際の学習率を第3の値に設定し、
    前記対象画素が前記静止対象物領域に含まれる場合には、前記学習率を、前記第3の値よりも小さい第4の値に設定する、画像処理装置。
  7. 請求項3及び請求項6のいずれか一つに記載の画像処理装置であって、
    前記判定部は、前記対象画素の画素値が、前記正規分布の前記所定範囲内に存在しない場合であっても、前記対象画素の画素値が、当該正規分布の平均値よりも小さい下限値よりも大きくあるいは当該下限値以上であって、かつ当該平均値以下あるいは当該平均値未満の場合には、例外的に、当該正規分布を前記適合正規分布とする、画像処理装置。
  8. 請求項3、請求項6及び請求項7のいずれか一つに記載の画像処理装置であって、
    前記動画像に写る撮影領域の明るさの変化を検出する検出部をさらに備え、
    前記背景モデル更新部は、前記検出部が前記変化を検出した場合、前記学習率を、前記第3及び第4の値よりも大きい第5の値に所定期間設定する、画像処理装置。
  9. 請求項1乃至請求項8のいずれか一つに記載の画像処理装置であって、
    前記第2特定部は、
    前記フレーム画像の各画素について、当該画素の画素値の変化量を示す第1評価値と、当該画素の画素値の分散を示す第2評価値とを求め、
    第2背景モデルと、前記フレーム画像の各画素についての前記第1及び第2評価値に基づいて、前記第1候補領域を特定する、画像処理装置。
  10. 画像処理装置を制御するための制御プログラムであって、
    前記画像処理装置に、
    (a)移動体である検出対象物が写る動画像についてのフレーム間差分を示す差分画像を生成し、生成した差分画像において、フレーム間での物体の動きを示す動き領域を特定する工程と、
    (b)前記フレーム画像に含まれる複数の画素にそれぞれ対応する複数の値が、当該複数の画素の位置に応じて並ぶマップを更新する工程と、
    (c)前記動画像に基づいて、当該動画像に含まれるフレーム画像において、静止している前記検出対象物が写る静止対象物領域の候補となる候補領域を特定する工程と
    を実行させ、
    前記工程(b)において、
    (b−1)前記マップにおける、前記動き領域に対応する前記値を第1所定値だけ増加する工程と、
    (b−2)前記マップにおける、前記動き領域に対応しない前記値を第2所定値だけ減少する工程と
    を実行させ、
    前記工程(a),(b)を繰り返し実行させ、
    (d)前記工程(b)で更新された前記マップ及び前記候補領域に基づいて、前記フレーム画像において、静止している前記検出対象物が写る静止対象物領域を特定する工程を実行させるための制御プログラム。
  11. 画像処理装置での領域特定方法であって、
    (a)移動体である検出対象物が写る動画像についてのフレーム間差分を示す差分画像を生成し、静止した差分画像において、フレーム間での物体の動きを示す動き領域を特定する工程と、
    (b)前記フレーム画像に含まれる複数の画素にそれぞれ対応する複数の値が、当該複数の画素の位置に応じて並ぶマップを更新する工程と、
    (c)前記動画像に基づいて、当該動画像に含まれるフレーム画像において、静止している前記検出対象物が写る静止対象物領域の候補となる候補領域を特定する工程と
    を備え、
    前記工程(b)は、
    (b−1)前記マップにおける、前記動き領域に対応する前記値を第1所定値だけ増加する工程と、
    (b−2)前記マップにおける、前記動き領域に対応しない前記値を第2所定値だけ減少する工程と
    を有し、
    前記工程(a),(b)は繰り返し実行され、
    (d)前記工程(b)で更新された前記マップ及び前記候補領域に基づいて、前記フレーム画像において、静止している前記検出対象物が写る静止対象物領域を特定する工程をさらに備える、領域特定方法。
JP2016031097A 2016-02-22 2016-02-22 画像処理装置、制御プログラム及び領域特定方法 Pending JP2017151536A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016031097A JP2017151536A (ja) 2016-02-22 2016-02-22 画像処理装置、制御プログラム及び領域特定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016031097A JP2017151536A (ja) 2016-02-22 2016-02-22 画像処理装置、制御プログラム及び領域特定方法

Publications (1)

Publication Number Publication Date
JP2017151536A true JP2017151536A (ja) 2017-08-31

Family

ID=59741934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016031097A Pending JP2017151536A (ja) 2016-02-22 2016-02-22 画像処理装置、制御プログラム及び領域特定方法

Country Status (1)

Country Link
JP (1) JP2017151536A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021060778A1 (ko) * 2019-09-27 2021-04-01 (주)서울로보틱스 3차원 공간에 대응되는 맵을 생성하는 차량 및 방법
JP2021135794A (ja) * 2020-02-27 2021-09-13 ソフトバンク株式会社 画像処理装置、プログラム、システム及び画像処理方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11296653A (ja) * 1998-04-06 1999-10-29 Sanyo Electric Co Ltd 画像処理装置及びこれを用いた人体検知装置
JP2003123074A (ja) * 2001-10-11 2003-04-25 Sanyo Electric Co Ltd 動物体検出装置、動物体検出方法及び動物体検出プログラム
JP2008257693A (ja) * 2007-04-05 2008-10-23 Mitsubishi Electric Research Laboratories Inc シーン中に置き去りにされた物体を検出する方法
JP2011215968A (ja) * 2010-03-31 2011-10-27 Namco Bandai Games Inc プログラム、情報記憶媒体及び物体認識システム
JP2013024534A (ja) * 2011-07-26 2013-02-04 Panasonic Corp 状況認識装置
CN103310422A (zh) * 2013-06-28 2013-09-18 新晨易捷(北京)科技有限公司 获取图像的方法及装置
JP2017107407A (ja) * 2015-12-10 2017-06-15 株式会社メガチップス 画像処理装置、制御プログラム及び前景画像特定方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11296653A (ja) * 1998-04-06 1999-10-29 Sanyo Electric Co Ltd 画像処理装置及びこれを用いた人体検知装置
JP2003123074A (ja) * 2001-10-11 2003-04-25 Sanyo Electric Co Ltd 動物体検出装置、動物体検出方法及び動物体検出プログラム
JP2008257693A (ja) * 2007-04-05 2008-10-23 Mitsubishi Electric Research Laboratories Inc シーン中に置き去りにされた物体を検出する方法
JP2011215968A (ja) * 2010-03-31 2011-10-27 Namco Bandai Games Inc プログラム、情報記憶媒体及び物体認識システム
JP2013024534A (ja) * 2011-07-26 2013-02-04 Panasonic Corp 状況認識装置
CN103310422A (zh) * 2013-06-28 2013-09-18 新晨易捷(北京)科技有限公司 获取图像的方法及装置
JP2017107407A (ja) * 2015-12-10 2017-06-15 株式会社メガチップス 画像処理装置、制御プログラム及び前景画像特定方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021060778A1 (ko) * 2019-09-27 2021-04-01 (주)서울로보틱스 3차원 공간에 대응되는 맵을 생성하는 차량 및 방법
JP2022545213A (ja) * 2019-09-27 2022-10-26 ソウル ロボティクス カンパニー リミテッド 三次元空間に対応するマップを生成する車両、及びその方法
JP7289470B2 (ja) 2019-09-27 2023-06-12 ソウル ロボティクス カンパニー リミテッド 三次元空間に対応するマップを生成する車両、及びその方法
JP2021135794A (ja) * 2020-02-27 2021-09-13 ソフトバンク株式会社 画像処理装置、プログラム、システム及び画像処理方法

Similar Documents

Publication Publication Date Title
JP4855556B1 (ja) 動体検出装置、動体検出方法、動体検出プログラム、動体追跡装置、動体追跡方法及び動体追跡プログラム
JP7272024B2 (ja) 物体追跡装置、監視システムおよび物体追跡方法
CN110008795B (zh) 图像目标追踪方法及其***与计算机可读取记录介质
WO2019064375A1 (ja) 情報処理装置、制御方法、及びプログラム
JP6024658B2 (ja) 物体検出装置、物体検出方法及びプログラム
JPWO2011013299A1 (ja) 移動体検出装置及び移動体検出方法
EP2570992A1 (en) Image processing apparatus, image processing method, and program
JP7334432B2 (ja) 物体追跡装置、監視システムおよび物体追跡方法
JP7092615B2 (ja) 影検出装置、影検出方法、影検出プログラム、学習装置、学習方法、及び学習プログラム
JP2008259161A (ja) 目標追尾装置
JP5147670B2 (ja) 画像処理装置及び画像処理方法、撮像装置
JP2007067559A (ja) 画像処理方法、画像処理装置、及び撮像装置の制御方法
US20180220065A1 (en) Information processing apparatus, image capturing apparatus, information processing method, and recording medium storing program
JP5648452B2 (ja) 画像処理プログラムおよび画像処理装置
JP2008035301A (ja) 移動体追跡装置
JP2017151536A (ja) 画像処理装置、制御プログラム及び領域特定方法
JP7243372B2 (ja) 物体追跡装置および物体追跡方法
JP2011071925A (ja) 移動体追尾装置および方法
US12002279B2 (en) Image processing apparatus and method, and image capturing apparatus
JP2021149687A (ja) 物体認識装置、物体認識方法及び物体認識プログラム
CN112132110A (zh) 一种智能判断人体姿态的方法及看护设备
JP6893812B2 (ja) 物体検出装置
JP6630140B2 (ja) 画像処理装置、制御プログラム及び前景画像特定方法
JP2020071717A (ja) 情報処理装置、情報処理方法及びプログラム
JP6266461B2 (ja) 対象検出装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191211

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191224

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200623