JP4644022B2 - 映像解析装置および映像解析プログラム - Google Patents

映像解析装置および映像解析プログラム Download PDF

Info

Publication number
JP4644022B2
JP4644022B2 JP2005108094A JP2005108094A JP4644022B2 JP 4644022 B2 JP4644022 B2 JP 4644022B2 JP 2005108094 A JP2005108094 A JP 2005108094A JP 2005108094 A JP2005108094 A JP 2005108094A JP 4644022 B2 JP4644022 B2 JP 4644022B2
Authority
JP
Japan
Prior art keywords
silhouette
area
video
tracking
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005108094A
Other languages
English (en)
Other versions
JP2006285878A (ja
Inventor
俊彦 三須
正樹 高橋
眞 蓼沼
英樹 住吉
雅規 佐野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2005108094A priority Critical patent/JP4644022B2/ja
Publication of JP2006285878A publication Critical patent/JP2006285878A/ja
Application granted granted Critical
Publication of JP4644022B2 publication Critical patent/JP4644022B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、映像の解析に係り、特に、スポーツ映像を対象にして、当該スポーツ映像内に含まれている人物の座標、移動速度、色等を評価して、スポーツ映像におけるシーンを解析する映像解析装置および映像解析プログラムに関する。
従来の映像解析装置(画像解析システム)としては、入力された映像内における物体領域を追跡して、当該物体領域の座標を出力するものが開示されている(例えば、特許文献1〜3)。
特許文献1に開示されている「運動物体計測装置および球技分析システムおよびデータサービスシステム」は、サッカー等の球技を対象として、複数組のTVカメラを利用して撮影した映像により、横方向や奥行き方向のみではなく、高さ方向を含めた3次元で、ボール位置を計測する手法である。
特許文献2に開示されている「画像解析システム、画像解析方法および画像解析プログラム記録媒体」は、入力された映像を解析して、複数の物体の分離・合体を想定した追跡手法である。
特許文献3に開示されている「画像特徴抽出装置、画像特徴照合装置および画像検索装置」は、入力された映像を構成する画像から得られた様々な特徴量をファジィルールによって、演算することで、所望の画像を当該映像から検索する手法である。
特開2001−273500号公報 特開2002−63577号公報 特開平5−6437号公報
しかしながら、従来の映像解析装置(画像解析システム)では、映像を構成する画像から物体追跡を行って、この追跡した物体の座標を出力するか、または、映像を構成する画像から直接得られる特徴量(色など)によって、当該画像を分類するものが主流を占めており、画像からの物体追跡の結果と、画像から得られる特徴量を複合的に解析することにより、映像におけるイベント(出来事)、特に、スポーツ映像におけるイベント(特定のプレイ等)を検出することが可能なものが存在していなかった。
そこで、本発明では、映像を解析して、当該映像におけるイベント(出来事)、特に、スポーツ映像におけるイベント(特定のプレイ等)を検出することができる映像解析装置および映像解析プログラムを提供することを目的とする。
前記課題を解決するため、請求項1に記載の映像解析装置は、入力された映像を解析する映像解析装置であって、シルエット映像生成手段と、領域追跡手段と、色識別手段と、特徴ベクトル計算手段と、イベント検出手段と、ポストフィルタ手段と、を備える構成とした。
かかる構成によれば、映像解析装置は、シルエット映像生成手段によって、入力された映像からシルエット映像を生成する。シルエット映像とは、背景色の情報に基づいて、人物等の被写体のシルエットを抽出した映像であり、例えば、背景差分法を用いて生成する。なお、ここでいうシルエットとは、背景色と設定した色と異なった色の、任意の面積を有している領域を指し、人物、物体、風景等を指している。続いて、映像解析装置は、領域追跡手段によって、シルエット映像生成手段で生成されたシルエット映像を構成するシルエット画像に含まれるシルエットを追跡領域とし、シルエット画像間の差に基づいて追跡し、当該追跡領域を識別するための識別番号と対応付けて、当該追跡領域の推定座標および推定速度と、当該追跡領域の面積とを出力する。
そして、映像解析装置は、色識別手段によって、推定座標と、シルエット映像と、映像とに基づき、追跡領域の色を識別して、識別した結果に基づいて、当該色を分類するために予め設定した色分類番号と識別番号とを出力し、特徴ベクトル計算手段によって、識別番号と対応付けられた、推定座標および推定速度と、追跡領域の面積と、色分類番号との少なくとも一つに基づき、特徴ベクトルに含める特徴量を計算する。
それから、映像解析装置は、イベント検出手段によって、特徴ベクトル計算手段で計算された特徴ベクトルに含まれる特徴量が、予め設定した条件を満たした場合を、映像に含まれる各シーンで発生した出来事を示すイベントとして検出し、検出した結果を示すフラグ信号を出力し、ポストフィルタ手段によって、イベント検出手段で出力されたフラグ信号に、一定時間区間内において、フラグの真理値がTRUEである割合を求め、この割合に応じた真理値を出力する時間率フィルタ、および、真理値立ち下がり後、一定時間にわたって真理値TRUEを継続出力する単安定マルチバイブレータの少なくとも一方の処理からなる時間方向のフィルタ処理と、イベント検出手段から入力したフラグ信号、時間方向のフィルタ処理のなされたフラグ信号、または、異なるイベントに関する本論理演算で出力された論理演算結果たるフラグ信号のうち、複数のフラグ信号間で、その複数の真理値入力に関する論理演算結果の真理値を出力する論理演算との少なくとも一方の処理を行って、その処理の結果出力される真理値のTRUEまたはFALSEによりイベントを特定するイベント出力信号を出力する。
なお、予め設定した条件とは、例えば、特徴量ごとの閾値を予め設定しておき、特徴量のいずれかが閾値を越えた場合や、複数の特徴量の組み合わせにおいて、それぞれの特徴量が閾値を越えた場合を指すものである。また、時間方向のフィルタ処理とは、時間方向において、起こりうるイベントを予測することで、フラグ信号を絞り込んでいく処理を指し、フラグ信号間の論理演算とは、フラグ信号同士で、論理演算を行うことで、同一時刻に起こり得ないイベントを除去していく処理を指している。
請求項2に記載の映像解析装置は、請求項1に記載の映像解析装置において、前記領域追跡手段が、ラベリング手段と、面積判定手段と、逆投影変換手段と、検出追跡手段と、予測推定手段と、遅延手段と、を備える構成とした。
かかる構成によれば、映像解析装置は、ラベリング手段によって、シルエット画像に含まれるそれぞれのシルエットを単連結領域とし、この単連結領域に対してラベル番号を付加し、当該ラベル番号を付加した単連結領域の形状に関する領域情報を生成する。なお、単連結領域とは、ある領域がその内部を通る曲線によって、2点を繋ぐことができる場合を連結領域とすると、この連結領域上での任意の単一閉曲線の内部が常に当該連結領域の内部である場合を指すものである。また、領域情報は、少なくとも単連結領域の形状を推定することが可能な座標や長さ(座標間距離)を含むものである。
続いて、映像解析装置は、面積判定手段によって、領域情報に基づいて、各単連結領域の面積を求め、求めた面積が一定範囲内にある単連結領域について、ラベル番号および単連結領域の面積を出力する。そして、映像解析装置は、逆投影変換手段によって、ラベリング手段で生成された領域情報と映像を撮影したカメラの投影中心に基づいて、3次元空間(実際の空間)における各単連結領域の存在場所を示す実座標を、ラベル番号と共に出力する。そして、映像解析装置は、検出追跡手段によって、追跡領域の座標および速度の予測された予測座標および予測速度が予め設定された所定単位時間遅延されて出力された、遅延予測座標および遅延予測速度と、ラベル番号と、面積判定手段から出力された単連結領域の面積と、実座標とに基づいて、ラベル番号に対応させた識別番号と、実座標と遅延予測座標とを対応させた観測座標とを出力すると共に、面積判定手段から出力された単連結領域の面積を追跡領域の面積として出力する。
そして、映像解析装置は、予測推定手段によって、検出追跡手段で出力された観測座標を、観測座標入力値、観測座標入力値の履歴、当該予測推定手段の履歴、のいずれか一つ以上に対する演算によって定義されるフィルタにより時間方向に予測し、推定座標および推定速度と、予測座標および予測速度とを識別信号と共にそれぞれ出力し、遅延手段によって、予測推定手段から出力された予測座標および予測速度を所定単位時間遅延して、識別番号と共に検出追跡手段に出力する。
請求項3に記載の映像解析装置は、請求項1または請求項2に記載の映像解析装置において、前記特徴ベクトルが、シルエット数推定値、シルエット群分布定量化値、シルエット間距離定量化値、シルエット群重心定量化値、シルエット速さ定量化値、シルエット速度定量化値および判定値の少なくとも一つ以上の特徴量によって構成されることを特徴とする。
かかる構成によれば、特徴ベクトル計算手段により計算した特徴ベクトルを構成する特徴量(値)の一つとなるシルエット数推定値は、シルエットの数を推定したものであり、シルエット群分布定量化値は、複数のシルエットからなるシルエット群の分布の散らばり度合いを定量化したものであり、シルエット間距離定量化値は、シルエット間の距離を定量化したものである。また、シルエット群重心定量化値は、シルエット群の分布を代表する座標を定量化したものであり、シルエット速さ定量化値は、シルエットの速さを定量化したものである。また、特徴ベクトルを構成する値の一つとなるシルエット速度定量化値は、シルエットの速度を定量化したものであり、判定値は、予め特定したシルエットである特定シルエットが特定の場所に存在するか否かを判定したものである。
請求項4に記載の映像解析装置は、入力されたスポーツ映像を解析する映像解析装置であって、シルエット映像生成手段と、領域追跡手段と、色識別手段と、特徴ベクトル計算手段と、イベント検出手段と、ポストフィルタ手段と、を備える構成とした。
かかる構成によれば、映像解析装置は、シルエット映像生成手段によって、スポーツ映像からシルエット映像を生成し、領域追跡手段によって、シルエット映像生成手段で生成されたシルエット映像を構成するシルエット画像に含まれる所定面積範囲の領域である人物のシルエットを追跡領域とし、シルエット画像間の差に基づいて当該追跡領域を追跡し、当該追跡領域を識別するための識別番号と対応付けて、当該追跡領域の推定座標および推定速度と、当該追跡領域の面積とを出力する。
続いて、映像解析装置は、色識別手段によって、推定座標と、シルエット映像と、スポーツ映像とに基づき、追跡領域の色を識別して、識別した結果に基づいて、当該色を分類するために予め設定した色分類番号と識別番号とを対応付けて出力し、特徴ベクトル計算手段によって、識別番号と対応付けられた、推定座標および推定速度と、追跡領域の面積と、色分類番号との少なくとも一つに基づき、特徴ベクトルに含める特徴量を計算する。
そして、映像解析装置は、イベント検出手段によって、特徴ベクトル計算手段で計算された特徴ベクトルに含まれる特徴量が、予め設定した条件を満たした場合を、映像に含まれる各シーンで発生した出来事を示すイベントとして検出し、検出した結果を示すフラグ信号を出力し、ポストフィルタ手段によって、イベント検出手段で出力されたフラグ信号に、一定時間区間内において、フラグの真理値がTRUEである割合を求め、この割合に応じた真理値を出力する時間率フィルタ、および、真理値立ち下がり後、一定時間にわたって真理値TRUEを継続出力する単安定マルチバイブレータの少なくとも一方の処理からなる時間方向のフィルタ処理と、イベント検出手段から入力したフラグ信号、時間方向のフィルタ処理のなされたフラグ信号、または、異なるイベントに関する本論理演算で出力された論理演算結果たるフラグ信号のうち、複数のフラグ信号間で、その複数の真理値入力に関する論理演算結果の真理値を出力する論理演算との少なくとも一方の処理を行って、その処理の結果出力される真理値のTRUEまたはFALSEによりイベントを特定するイベント出力信号を出力する。
請求項5に記載の映像解析装置は、請求項4に記載の映像解析装置において、前記領域追跡手段が、ラベリング手段と、面積判定手段と、逆投影変換手段と、検出追跡手段と、予測推定手段と、遅延手段と、を備える構成とした。
かかる構成によれば、映像解析装置は、ラベリング手段によって、シルエット画像に含まれるそれぞれの所定面積範囲の領域である人物のシルエットを単連結領域とし、この単連結領域に対してラベル番号を付加し、当該ラベル番号を付加した単連結領域に関する領域情報を生成し、面積判定手段によって、領域情報に基づいて、各単連結領域の面積を求め、求めた面積が一定範囲内にある単連結領域について、ラベル番号および面積を出力する。そして、映像解析装置は、逆投影変換手段によって、ラベリング手段で生成された領域情報とスポーツ映像を撮影したカメラの投影中心とに基づいて、3次元空間における各単連結領域の存在場所を示す実座標を、ラベル番号と共に出力する。
そして、映像解析装置は、検出追跡手段によって、追跡領域の座標および速度の予測された予測座標および予測速度が予め設定された所定単位時間遅延されて出力された、遅延予測座標および遅延予測速度と、ラベル番号と、面積判定手段から出力された単連結領域の面積と、実座標とに基づいて、ラベル番号に対応させた識別番号と、実座標と遅延予測座標とを対応させた観測座標とを出力すると共に、面積判定手段から出力された単連結領域の面積を追跡領域の面積として出力する。そして、映像解析装置は、予測推定手段によって、検出追跡手段で出力された観測座標を、観測座標入力値、観測座標入力値の履歴、当該予測推定手段の履歴、のいずれか一つ以上に対する演算によって定義されるフィルタにより時間方向に予測し、推定座標および推定速度と、予測座標および予測速度とを識別信号と共にそれぞれ出力し、遅延手段によって、予測推定手段から出力された予測座標および予測速度を所定単位時間遅延して、識別番号と共に検出追跡手段に出力する。
請求項6に記載の映像解析装置は、請求項4または請求項5に記載の映像解析装置において、前記特徴ベクトルが、人物領域数推定値、人物領域群分布定量化値、人物領域間距離定量化値、人物群重心定量化値、人物領域速さ定量化値、人物領域速度定量化値および判定値の少なくとも一つ以上の特徴量によって構成されることを特徴とする。
かかる構成によれば、特徴ベクトル計算手段により計算された特徴ベクトルを構成する特徴量(値)の一つとなる人物領域数推定値は、人物のシルエットの数を推定したものであり、人物領域群分布定量化値は、複数の人物のシルエットからなる人物シルエット群の分布の散らばり度合いを定量化したものであり、人物間距離定量化値は、人物のシルエット間の距離を定量化したものである。また、人物群重心定量化値は、人物シルエット群の分布を代表する座標を定量化したものであり、人物領域速さ定量化値は、人物のシルエットの速さを定量化したものである。また、特徴ベクトルを構成する値の一つとなる人物領域速度定量化値は、人物のシルエットの速度を定量化したものであり、判定値は、予め特定した人物のシルエットである特定人物シルエットが特定の場所に存在するか否かを判定したものである。
請求項7に記載の映像解析プログラムは、入力された映像を解析するために、コンピュータを、シルエット映像生成手段、領域追跡手段、色識別手段、特徴ベクトル計算手段、イベント検出手段、ポストフィルタ手段、として機能させる構成とした。
かかる構成によれば、映像解析プログラムは、シルエット映像生成手段によって、映像からシルエット映像を生成し、領域追跡手段によって、シルエット映像生成手段で生成されたシルエット映像を構成するシルエット画像に含まれるシルエットを追跡領域とし、シルエット画像間の差に基づいて当該追跡領域を追跡し、当該追跡領域を識別するための識別番号と対応付けて、当該追跡領域の推定座標および推定速度と、当該追跡領域の面積とを出力する。続いて、映像解析プログラムは、色識別手段によって、推定座標と、シルエット映像と、映像とに基づき、追跡領域の色を識別して、識別した結果に基づいて、当該色を分類するために予め設定した色分類番号と識別番号とを対応付けて出力し、特徴ベクトル計算手段によって、識別番号と対応付けられた、推定座標および推定速度と、追跡領域の面積と、色分類番号との少なくとも一つに基づき、特徴ベクトルに含める特徴量を計算する。
そして、映像解析プログラムは、イベント検出手段によって、特徴ベクトル計算手段で計算された特徴ベクトルに含まれる特徴量が、予め設定した条件を満たした場合を、映像に含まれる各シーンで発生した出来事を示すイベントとして検出し、検出した結果を示すフラグ信号を出力し、ポストフィルタ手段によって、イベント検出手段で出力されたフラグ信号に、一定時間区間内において、フラグの真理値がTRUEである割合を求め、この割合に応じた真理値を出力する時間率フィルタ、および、真理値立ち下がり後、一定時間にわたって真理値TRUEを継続出力する単安定マルチバイブレータの少なくとも一方の処理からなる時間方向のフィルタ処理と、イベント検出手段から入力したフラグ信号、時間方向のフィルタ処理のなされたフラグ信号、または、異なるイベントに関する本論理演算で出力された論理演算結果たるフラグ信号のうち、複数のフラグ信号間で、その複数の真理値入力に関する論理演算結果の真理値を出力する論理演算との少なくとも一方の処理を行って、その処理の結果出力される真理値のTRUEまたはFALSEによりイベントを特定するイベント出力信号を出力する。
請求項8に記載の映像解析プログラムは、入力されたスポーツ映像を解析するために、コンピュータを、シルエット映像生成手段、領域追跡手段、色識別手段、特徴ベクトル計算手段、イベント検出手段、ポストフィルタ手段、として機能させる構成とした。
かかる構成によれば、映像解析プログラムは、シルエット映像生成手段によって、スポーツ映像からシルエット映像を生成し、領域追跡手段によって、シルエット映像生成手段で生成されたシルエット映像を構成するシルエット画像に含まれる所定面積範囲の領域である人物のシルエットを追跡領域とし、シルエット画像間の差に基づいて当該追跡領域を追跡し、当該追跡領域を識別するための識別番号と対応付けて、当該追跡領域の推定座標および推定速度と、当該追跡領域の面積とを出力する。続いて、映像解析プログラムは、色識別手段によって、推定座標と、シルエット映像と、スポーツ映像とに基づき、追跡領域の色を識別して、識別した結果に基づいて、当該色を分類するために予め設定した色分類番号と識別番号とを対応付けて出力し、特徴ベクトル計算手段によって、識別番号と対応付けられた、推定座標および推定速度と、追跡領域の面積と、色分類番号との少なくとも一つに基づき、特徴ベクトルに含める特徴量を計算する。
そして、映像解析プログラムは、イベント検出手段によって、特徴ベクトル計算手段で計算された特徴ベクトルに含まれる特徴量が、予め設定した条件を満たした場合を、映像に含まれる各シーンで発生した出来事を示すイベントとして検出し、検出した結果を示すフラグ信号を出力し、ポストフィルタ手段によって、イベント検出手段で出力されたフラグ信号に、一定時間区間内において、フラグの真理値がTRUEである割合を求め、この割合に応じた真理値を出力する時間率フィルタ、および、真理値立ち下がり後、一定時間にわたって真理値TRUEを継続出力する単安定マルチバイブレータの少なくとも一方の処理からなる時間方向のフィルタ処理と、イベント検出手段から入力したフラグ信号、時間方向のフィルタ処理のなされたフラグ信号、または、異なるイベントに関する本論理演算で出力された論理演算結果たるフラグ信号のうち、複数のフラグ信号間で、その複数の真理値入力に関する論理演算結果の真理値を出力する論理演算との少なくとも一方の処理を行って、その処理の結果出力される真理値のTRUEまたはFALSEによりイベントを特定するイベント出力信号を出力する。
請求項1、7に記載の発明によれば、映像からシルエット映像を生成し、シルエット映像に含まれるシルエットを追跡領域とし、当該追跡領域の推定座標および推定速度と、当該追跡領域の面積と、当該追跡領域の色を示す色分類番号を出力し、これらの少なくとも一つに基づき、特徴ベクトルに含める特徴量を計算する。さらに、特徴ベクトルに含まれる特徴量が、予め設定した条件を満たした場合を、映像に含まれる各シーンで発生した出来事を示すイベントとして検出し、時間方向のフィルタ処理と、フラグ信号間の論理演算との少なくとも一方の処理を行って、イベントを特定する。このため、入力された映像を解析して、当該映像に含まれている被写体(人物や物体等)の実際の空間上における座標と、速度と、色と、大きさ(面積)によって特徴付けられるイベント(出来事)を検出することができる。
請求項2に記載の発明によれば、シルエット映像に含まれるそれぞれのシルエットを単連結領域とし、ラベル番号を付加し、各単連結領域の面積が一定範囲内にある単連結領域について、遅延予測座標および遅延予測速度と、ラベル番号と、単連結領域の面積と、実座標とに基づいて、ラベル番号に対応させた識別番号と、実座標と遅延予測座標とを対応させた観測座標とを出力すると共に、面積判定手段から出力された単連結領域の面積を追跡領域の面積として出力する。そして、出力された観測座標を、時間方向に濾波予測し、推定座標および推定速度を出力する。このため、映像に含まれる被写体(人物や物体等)を、当該映像の進行時間に沿って(時間方向に)追跡して、当該被写体の座標を出力すると共に、当該被写体の速度および当該被写体の見かけの大きさを出力することができる。
請求項3に記載の発明によれば、特徴ベクトルに含まれる特徴量が、シルエット数推定値と、シルエット群分布定量化値と、シルエット速さ定量化値と、シルエット速度定量化値と、判定値との少なくとも1つを備えているので、こういった座標と、速度と、面積と、色分類といった低次の映像特徴量を、映像のイベントに関する高次の映像特徴量に変換することができる。
請求項4、8に記載の発明によれば、スポーツ映像からシルエット映像を生成し、シルエット映像に含まれる人物のシルエットを追跡領域とし、当該追跡領域の推定座標および推定速度と、当該追跡領域の面積と、当該追跡領域の色を示す色分類番号を出力し、これらの少なくとも一つに基づき、特徴ベクトルに含める特徴量を計算する。さらに、特徴ベクトルに含まれる特徴量が、予め設定した条件を満たした場合を、スポーツ映像に含まれる各シーンで発生した特定のプレイを示すイベントとして検出し、時間方向のフィルタ処理と、フラグ信号間の論理演算との少なくとも一方の処理を行って、イベントを特定する。このため、スポーツ映像を解析して、当該スポーツ映像における特定のプレイ等を検出することができる。
請求項5に記載の発明によれば、シルエット映像に含まれるそれぞれの人物のシルエットを単連結領域とし、ラベル番号を付加し、各単連結領域の面積が一定範囲内にある単連結領域について、遅延予測座標および遅延予測速度と、ラベル番号と、単連結領域の面積と、実座標とに基づいて、ラベル番号に対応させた識別番号と、実座標と遅延予測座標とを対応させた観測座標とを出力すると共に、面積判定手段から出力された単連結領域の面積を追跡領域の面積として出力する。そして、出力された観測座標を、時間方向に濾波予測し、推定座標および推定速度を出力する。このため、スポーツ映像に含まれる被写体(選手等)を、当該スポーツ映像の進行時間に沿って(時間方向に)追跡して、当該被写体の座標を出力すると共に、当該被写体の速度および当該被写体の見かけの大きさを出力することができる。
請求項6に記載の発明によれば、特徴ベクトルに含まれる特徴量が、人物数推定値と、人物群分布定量化値と、人物速さ定量化値と、人物速度定量化値と、判定値との少なくとも1つを備えているので、こういった座標と、速度と、面積と、色分類といった低次の映像特徴量を、スポーツ映像のイベント(特定のプレイ等)に関する高次の映像特徴量に変換することができる。
次に、本発明の実施形態について、適宜、図面を参照しながら詳細に説明する。
(映像解析装置の構成)
図1は映像解析装置のブロック図である。図1に示すように、映像解析装置1は、入力された映像(入力映像)を解析して、当該入力映像によって表現されているイベント(出来事)を出力するもので、シルエット映像生成手段2と、人物追跡手段(領域追跡手段)3と、色識別手段4と、特徴ベクトル抽出手段(特徴ベクトル計算手段)5と、イベント検出手段6と、ポストフィルタ手段7とを備えている。特に、この映像解析装置1は、スポーツ映像を解析して、当該スポーツ映像のイベント(特定のプレイ等)を出力するものである。
この映像解析装置1では、入力映像を構成する1枚1枚の画像を入力画像I(x,y)とし、この入力画像I(x,y)の画像座標(x,y)に含まれている画素値をi(x,y)とする。なお、画素値i(x,y)は、輝度値のみで表される場合もあれば、色(色彩)を表現する2次元以上のベクトルで表される場合もある。この映像解析装置1では、例えば、画素値i(x,y)として、色彩を表現する赤成分、緑成分および青成分からなる3次元の色ベクトルを用いることができる。また、この映像解析装置1では、画素値i(x,y)として、輝度値および2種類の色差値からなる3次元の色ベクトルを用いることができる。なお、この実施形態では、画素値i(x,y)として、輝度値および2種類の色差値からなる3次元の色ベクトルを用いている。
シルエット映像生成手段2は、入力画像I(x,y)から人物領域(追跡領域)と、非人物領域とを分割した2値(0または1)のシルエット画像S(x,y)を生成するものである。なお、シルエット映像は、複数のシルエット画像S(x,y)によって構成される。ここでは、例えば、所定面積範囲の領域である人物領域(人物のシルエット)にはS(x,y)=1の値を、非人物領域にはS(x,y)=0の値をそれぞれ割り当てるものとする。なお、ここでいうシルエットとは、背景色と設定した色と異なった色の、任意の面積を有している領域を指し、人物、物体、風景等を指している。
このシルエット映像生成手段2によって、シルエット画像S(x,y)を生成する手法としては、例えば、ハードクロマキーに代表されるような背景色情報に基づく手法を用いることができる。この背景色情報に基づく手法では、まず、色ベクトルcに対して、K(c)なる関数を定義する。この関数K(c)は、背景色が色ベクトルcで表されるときにはK(c)=0となり、背景色が色ベクトルcで表されないときにはK(c)=1となるように予め設定されているものである。
このような関数K(c)は、色ベクトルcを入力とする表形式の要素群(データ群)、つまり、ルックアップテーブル(予め設定した色分類番号に相当)によって実現することができる。この場合、ルックアップテーブルの各要素のうち、背景色に対応する要素には“0”を、その他の要素には“1”を予め設定(登録)しておくものとする。例えば、芝生で行うスポーツに関する入力映像の場合、芝生らしい色(例えば、緑色)に対応する要素を“0”とし、それ以外の色に対応する要素を“1”と設定しておくことが想定される。
具体的に説明すると、関数K(c)を用いたハードクロマキーは、次に示す(1)式を用いることで実現される。
Figure 0004644022
また、シルエット映像生成手段2によって、シルエット画像S(x,y)を生成する手法としては、例えば、背景差分法を用いることができる。この背景差分法による場合、予め、人物の映っていない画像(以下、背景画像という)B(x,y)を作成しておき、入力画像I(x,y)との差分を計算し、さらに、閾値処理することでシルエット画像S(x,y)を生成する。例えば、閾値処理を行う関数をT(c)として、次に示す(2)式を用いることで、シルエット画像S(x,y)が生成される。
Figure 0004644022
(2)式において、閾値処理の関数T(c)は、入力画像I(x,y)の画素値が輝度値のみである場合には、例えば、ゼロ未満(以下)の閾値θ0およびゼロ以上(を越える)の閾値θ1に基づいて定義される、次に示す(3)式を用いることができる。
Figure 0004644022
また、入力画像I(x,y)の画素値として、多次元の色ベクトルを用いる場合には、色ベクトルcが色ベクトル空間内の一定領域内にある場合には、T(c)=0、それ以外の場合にはT(c)=1とする。例えば、色ベクトルcが赤成分cR、緑成分cGおよび青成分cBにより構成される場合に、ゼロ未満(以下)の三つの閾値θR0、θG0およびθB0、並びに、ゼロ以上(を越える)の三つの閾値θR1、θG1およびθB1に基づいて定義される、次に示す(4)式を用いることができる。
Figure 0004644022
人物追跡手段3は、シルエット映像生成手段2で生成された複数のシルエット画像からなるシルエット映像中の各人物のシルエット(追跡領域)を追跡して、時間方向の対応付けを行って、実空間(実際の空間、3次元空間)内における各人物の座標、速度および大きさに関する情報を出力するものである。この人物追跡手段3の詳細な構成を、図2に示す。
図2に示すように、人物追跡手段3は、ラベリング手段31と、面積判定手段32と、逆投影変換手段33と、検出・追跡手段(検出追跡手段)34と、予測・推定手段(予測推定手段)35と、遅延手段36とを備えている。
ラベリング手段31は、入力されたシルエット映像を構成するシルエット画像S(x,y)に含まれている各シルエットに対して、各々異なるラベル番号l∈{1,2,・・・,N}を付加(付与)するものである。ここで、シルエット画像S(x,y)に含まれている各シルエットは単連結領域であり、S(x,y)=1で表すこととする。
面積判定手段32は、ラベリング手段31でラベル番号が付加された各シルエットの面積A(l)を求めると共に、このシルエット面積A(l)が人物の大きさとして妥当であるか否かを判定し、判定した結果、妥当な面積のシルエットのみを抽出するものである。なお、抽出されたラベル番号の集合をLとすると、この集合Lは次に示す(5)式で表せる。つまり、集合Lは、人物として妥当な面積のシルエットの集合であるといえる。
L={l|A(l)が人物の大きさとして妥当、l∈{1,2,・・・,N}}
・・・(5)式
そして、この面積判定手段32は、集合Lを領域情報として、逆投影変換手段33に出力すると共に、ラベル番号lおよびシルエット面積A(l)を検出・追跡手段34に出力する。なお、領域情報は、シルエット(単連結領域)の形状に関するものであればよい。例えば、領域情報として、シルエットの座標、座標間距離(長さ)等を含んでいればよい。
この面積判定手段32において、各シルエットの面積A(l)が人物の大きさとして妥当であるか否かの判定の仕方は、ここでは、人物の大きさとして妥当であるとする面積の上限および下限の閾値を設け、所定範囲を設定しておき、各シルエットの面積A(l)が所定範囲にある場合には妥当であると判定する仕方を採用している。
ここで、集合Lを求める手法について、図3、図4を参照して説明する。
図3に示すように、ラベル番号lのシルエットの重心(シルエット領域の画像上における重心)G(l)を求め、入力映像を撮影したカメラ(図示せず)の投影中心からシルエット画像平面上のシルエットの重心G(l)を通る半直線を引く。この半直線が実空間上における地面から高さhの平面と交差する点H(l)を求める。例えば、高さhの値として人物の身長(例えば、成人の平均身長)の1/2程度の値を設定することにより、シルエットの重心G(l)が当該シルエットの高さのほぼ1/2の高さに位置することから、点H(l)は、実空間上における人物の重心座標とほぼ一致することになる。なお、この点H(l)が実座標に相当している。
続いて、図4に示すように、人物の大きさ程度の立体(人物の体積に相当する立体、直方体や円柱等)を点H(l)の座標に配置したと仮定し、この立体を透視変換して、シルエット画像平面上における立体の像を求める。人物の大きさ程度の立体として、直方体を用いた場合には、当該直方体を投影面(表示装置(図示せず)の表示面)に写像した際の像の輪郭は、四角形、五角形または六角形の多角形の形状となる。
そして、得られた直方体の像において、投影面に対面する面の面積、または、得られた直方体の像に外接する方形(バウンディングボックス)の面積を求め、Aest(l)とする。また、0<k0≦k1に基づいて定義される、次に示す(6)式を用いた閾値処理により集合Lを求めてもよい。
Figure 0004644022
これら図3、図4を参照して説明した、集合Lを求める手法では、カメラ(図示せず)から人物までの距離に応じて、正規化した面積を評価しているので、カメラから人物までの距離によらずに人物らしい大きさのシルエット(領域)のみを抽出することができる。
図2に戻って、映像解析装置1における人物追跡手段3の構成の説明を続ける。
逆投影変換手段33は、面積判定手段32から出力された集合L(人物として妥当な面積のシルエットに付加されているラベル番号の集合)に属する各シルエット(各人物領域)のシルエット画像平面上における重心を、実空間に逆投影することにより、実空間上での人物の座標を計算するものである。ここでは、逆投影変換手段33は、図3に示した点H(l)を人物の実座標として、ラベル番号lと共に、検出・追跡手段34に出力している。
検出・追跡手段34は、集合Lに属する各ラベル番号l(l∈L)のシルエット(以下、人物領域という)の各実座標(H(l))と、遅延手段36から出力された1単位時間前(所定時間単位)までに追跡・予測されているシルエットの各座標との距離を比較することで、ラベル番号lと、既に付加(付与)されている識別番号mとの対応付けを行うものである。
この検出・追跡手段34は、例えば、ラベル番号lの人物領域の実空間上での座標H(l)と、既に追跡されている識別番号mの人物領域との座標(遅延手段36から出力された予測座標)xt|t-1(m)との距離に基づいて、次に示す(7)式を用いて、識別番号mに対応するラベル番号lmatch(m)を求める。このラベル番号lmatch(m)を求めることで、ラベル番号lと識別番号mとの対応付けがなされることになる。
Figure 0004644022
或いは、検出・追跡手段34は、ラベル番号lmatch(m)を求める際に、実座標H(l)と予測座標xt|t-1(m)との距離が閾値以内でない場合には、対応付けに失敗したとして、ラベル番号lmatch(m)に特別な値を設定してもよい。つまり、ラベル番号lmatch(m)に特別な値を設定しておくことで、ラベル番号lmatch(m)が当該特別な値をとった場合、ラベル番号lに対応する識別番号mは存在していないとする。この特別な値には、例えば、“0”を用いることができる。このように閾値を用いて、実座標H(l)と予測座標xt|t-1(m)との対応付けを行う場合、次に示す(8)式を用いる。
Figure 0004644022
そして、検出・追跡手段34は、実座標と予測座標との対応付けを行った結果であるラベル番号lmatch(m)が付加された人物領域のシルエット画像上における座標に基づいて、識別番号mが付加された人物領域の実空間上における座標(以下、観測座標という)yt(m)を求める。ここでは、ラベル番号lmatch(m)が付加された人物領域の実空間上における重心H(lmatch(m))の示す座標を、観測座標yt(m)としている。
なお、検出・追跡手段34は、集合Lには存在するが、対応する識別番号mの存在しないラベル番号lが検出された場合には、当該ラベル番号lに、新たな識別番号mを付加(付与)し、且つ、この新たな識別番号mが付加された人物領域の実空間上における座標H(l)に基づいて観測座標yt(m)を設定し、出力してもよい。
また、検出・追跡手段34は、対応するラベル番号lの無い識別番号mが存在した場合には、当該識別番号mを無効とし、当該識別番号mが付加されている人物領域の観測座標yt(m)を出力しなくてもよい。
さらに、検出・追跡手段34は、逆投影変換手段33からラベル番号lごとに入力された面積A(l)の中から、ラベル番号lmatch(m)のものを面積α(m)として出力する。すなわち、α(m)=A(lmatch(m))とする。なお、この面積α(m)および識別番号mは、特徴ベクトル抽出手段5(図1)に出力される。
予測・推定手段35は、検出・追跡手段34から出力された識別番号mと、観測座標yt(m)とを受け取って、観測座標yt(m)にフィルタ処理を行うことで、推定座標xt|t(m)、推定速度vt|t(m)、予測座標xt+1|t(m)および予測速度vt+1|t(m)を出力するものである。
この予測・推定手段35は、例えば、推定座標xt|t(m)として、観測座標yt(m)をそのまま出力してもよい。また、予測・推定手段35は、推定速度vt|t(m)を推定座標xt|t(m)の履歴から計算することが可能である。予測・推定手段35は、例えば、次に示す(9)式を用いて、推定速度vt|t(m)を、現在の推定座標xt|t(m)と、1単位時間過去における推定座標xt-1|t-1(m)との差分から計算することが可能である。
Figure 0004644022
また、予測・推定手段35は、推定座標xt|t(m)を計算する際に、例えば、ラベル番号lmatch(m)の観測座標yt(m)の履歴と、推定座標xt|t(m)の履歴とを重み付けして、加算した値を、現在の推定座標xt|t(m)とすることも可能である。
さらに、予測・推定手段35は、例えば、カルマン(kalman)フィルタ、或いは、拡張カルマンフィルタによって、推定座標xt|t(m)と推定速度vt|t(m)との少なくとも一方を求めてもよい。予測・推定手段35がカルマンフィルタを採用する場合は、次に示す(10)式を用いて、状態ベクトルzt|tを定義する。
Figure 0004644022
また、遅延手段36(詳細は後記する)から出力される、遅延された予測座標xt|t-1(m)と、遅延された予測速度vt|t-1(m)とにより構成される状態ベクトルzt|t-1を、次に示す(11)式を用いて定義する。
Figure 0004644022
このように、状態ベクトルzt|tと、状態ベクトルzt|t-1とから、次に示す(12)式(カルマンフィルタを観測更新式)を適用することにより、遅延手段36から出力される、遅延された予測座標xt|t-1(m)および遅延された予測速度vt|t-1(m)から、現在(現時点)の推定座標xt|t(m)および推定速度vt|t(m)を求めることができる。
Figure 0004644022
なお、この(12)式において、Pt|t-1は、時点t−1までの情報から推定された、時点tにおける状態ベクトルの誤差共分散行列であり、P0|-1を初期値として、例えば、4行×4列の任意の半正定値行列を設定している。Ktは、時点tにおけるカルマンフィルタからの出力(推定座標xt|t(m)および推定速度vt|t(m))を示す行列である。また、(12)式において、Aは観測行列であり、I2×2は2行2列の単位行列であり、O2×2は2行2列のゼロ行列であり、次に示す(13)式によって定義される。
Figure 0004644022
この(13)式では、観測行列Aとして、2行4列の行列を設定している。さらに、Rtは時点tにおける観測雑音の共分散行列であり、次に示す(14)式によって定義される。
Figure 0004644022
この(14)式では、観測雑音の共分散行列Rtとして、2行2列の対角行列を設定している。なお、この(14)式におけるρxおよびρyには、適切な正の定数、若しくは、経過時間に伴って変化する正の変数を設定することが可能である。例えば、(7)式または(8)式の計算に用いた座標H(l)と予測座標xt|t-1(m)との距離に応じて、ρxまたはρyを変化させてもよい。なお、予測・推定手段35がカルマンフィルタを採用する場合、対応するラベル番号lの存在しない識別番号m(すなわち、観測座標yt(m)が予測・推定手段35に入力されなかった場合)に対しては、(9)式の代わりに、次に示す(15)式を用いることとする。
Figure 0004644022
さらに、予測・推定手段35は、推定座標xt|t(m)と推定速度vt|t(m)に基づき、次の時点t+1における予測座標xt+1|t(m)と予測速度vt+1|t(m)を、次に示す(16)式を用いて求め、出力する。
Figure 0004644022
この(16)式では、等速度モデルを参照することで、予測座標xt+1|t(m)と予測速度vt+1|t(m)とを求めることができる。なお、(16)式において、Δtは処理の時間間隔であり、例えば、1単位時間周期(周期T)で行う場合、Δt=1となる。
また、予測・推定手段35は、カルマンフィルタを採用した場合、次に示す(17)式(漸化式)を用いて、予測座標xt+1|t(m)と予測速度vt+1|t(m)とを求めることが可能である。
Figure 0004644022
この(17)式において、Fは、1単位時間における状態遷移モデルを表す行列(状態遷移行列)であり、この状態遷移行列Fは、等速度モデルを参照する場合、次に示す(18)式によって定義される。
Figure 0004644022
また、(17)式において、Qは、状態遷移行列Fによる予測によって、新たに加えられる誤差をモデル化したプロセス雑音の共分散行列であり、例えば、プロセス雑音の共分散行列Qは、4行4列の半正定値行列を設定している。
さらに、(17)式において、状態ベクトルの誤差共分散行列Pt|tまたはPt+1|tのある成分、若しくは、いずかの行列、或いは、トレースがある数値範囲に入った場合、すなわち、推定誤差が大きくなったと想定された場合には、予測・推定手段35は、該当する識別番号mを無効とし、該当する推定座標xt|t(m)、予測座標xt+1|t(m)、推定速度vt|t(m)および予測速度vt+1|t(m)を出力しない。
つまり、推定誤差が大きくなったと想定された場合には、状態ベクトルの誤差共分散行列Pt|tまたはPt+1|tのある成分が大きくなることが確認されており、これらの行列のある成分、特に対角成分に着目し、当該対角成分が、ある閾値を越えた場合には、該当する推定座標xt|t(m)および推定速度vt|t(m)、または、予測座標xt+1|t(m)、および予測速度vt+1|t(m)が信頼できないものとして無効化する。例えば、次に示す(19)式のように、状態ベクトルの誤差共分散行列Pt|tのトレースが閾値θP以上になった場合には、予測・推定手段35は、該当する識別番号mを無効にすることができる。
Figure 0004644022
遅延手段36は、予測・推定手段35から出力された予測座標xt+1|t(m)および予測速度vt+1|t(m)を、1単位時間遅延して、遅延された予測座標xt|t-1(m)および遅延された予測速度vt|t-1(m)を、検出・追跡手段34に出力するものである。
図1に戻って、映像解析装置1の構成の説明を続ける。
色識別手段4は、入力映像と、シルエット映像生成手段2で生成されたシルエット映像(複数のシルエット画像S(x,y))と、人物追跡手段3の予測・推定手段35から出力された識別番号m、推定座標xt|t(m)および推定速度vt|t(m)とに基づいて、入力映像中の各人物のシルエット(各追跡領域、識別番号m)の着衣の色(追跡領域の色)を識別して、色分類番号C(m)を出力するものである。
この色識別手段4は、例えば、特願2005−11959の「色識別装置および色識別プログラム」に記載されている手法を用いることができる。
例えば、当該装置1に入力する入力映像を、サッカー競技映像とする場合、一方のチームのフィールド選手を“0”、一方のチームのゴールキーパーを“1”、他方のチームのフィールド選手を“2”、他方のチームのゴールキーパーを“3”、審判を“4”、その他(ボールボーイ、監督、観客等)を“5”といったように、色分類番号C(m)を定める(割り振る)ことができる。
特徴ベクトル抽出手段5は、人物追跡手段3の検出・追跡手段34から出力された識別番号mおよび面積α(m)と、人物追跡手段3の予測・推定手段35から出力された識別番号m、推定座標xt|t(m)および推定速度vt|t(m)と、色識別手段4から出力された識別番号mおよび色分類番号C(m)とに基づいて、特徴ベクトルに含める特徴量を求めて出力するものである。
なお、この特徴ベクトル抽出手段5では、識別番号mと対応付けられた、面積α(m)と、推定座標xt|t(m)と、推定速度vt|t(m)と、色分類番号C(m)との少なくとも一つの入力情報に基づいて、特徴ベクトルに含める特徴量を計算しているが、入力情報の種類(数)が増加するほど、特徴ベクトルに含める特徴量の種類(数)も増加することになり、この結果、イベント検出手段6によるイベントの検出精度が向上することになる。この特徴ベクトル抽出手段5の詳細な構成を図5に示す。
図5に示すように、特徴ベクトル抽出手段5は、人数計測手段51と、人物群分散計測手段52と、人物間距離計測手段53と、人物群重心計測手段54と、平均速さ計測手段55と、平均速度計測手段56と、特定領域監視手段57とを備えている。
人数計測手段51は、入力された各人物(各追跡領域)の識別番号mの推定座標xt|t(m)、推定速度vt|t(m)、色分類番号C(m)および面積α(m)の少なくとも1つの情報に基づいて、入力映像内に含まれる人物の数(人数)N(シルエット数推定値、人物数推定値)を推定するものである。この人数計測手段51は、最も簡単な手法として、入力された識別番号mの総数を数えることで、人数Nを求めることができる。また、人数計測手段51は、図6に示す構成によって、人数Nを求めてもよい。
図6に示すように、人数計測手段51は、クロック手段511と、順次面積選択手段512と、順次座標選択手段513と、人物像面積推定手段514と、除算手段515と、総和演算手段516とを備えている。
クロック手段511は、順次増加または減少する数値時系列を生成して、この数値時系列を、順次面積選択手段512、順次座標選択手段513および総和演算手段516に出力するものである。この数値時系列は、各手段512、513、516において、入力された情報を処理するタイミングを同期させるために基準となるものである。
順次面積選択手段512は、識別番号m、面積α(m)および色分類番号C(m)が入力され、クロック手段511から出力された数値時系列に従ったタイミングで、順次指定される識別番号mの色分類番号C(m)が特定の値(色識別手段4の説明のところで示した例であれば、0〜5の整数)のものを抽出して、該当したものの面積α(m)を除算手段515に出力するものである。
例えば、前記したように、当該装置1に入力された入力映像がサッカー競技映像であり、一方のチームのフィールド選手が“0”、一方のチームのゴールキーパーが“1”、他方のチームのフィールド選手が“2”、他方のチームのゴールキーパーが“3”、審判が“4”、その他(ボールボーイ、監督、観客等)が“5”と、色分類番号C(m)が設定されている場合、色分類番号C(m)が“0”から“3”のもののみを抽出することにより、選手のみを選択する(選び出す)ことができる。
順次座標選択手段513は、識別番号m、色分類番号C(m)、推定座標xt|t(m)および推定速度vt|t(m)が入力され、クロック手段511から出力された数値時系列に従ったタイミングで、順次指定される識別番号mの色分類番号C(m)が特定の値(色識別手段4の説明のところで示した例であれば、0〜5の整数)のものを抽出して、該当したものの推定座標xt|t(m)を人物像面積推定手段514に出力するものである。この順次座標選択手段513は、順次面積選択手段512と同様に、色分類番号C(m)が特定の値のものを抽出し、そして、識別番号mを介在させ、当該識別番号mが対応している推定座標xt|t(m)を出力している。順次座標選択手段513は、順次面積選択手段512と同様に、入力映像がサッカー競技映像である場合、特定の値を“0”から“3”とすれば、選手のみを選択する(選び出す)ことができる。
人物像面積推定手段514は、人物の大きさ程度の立体(人物の体積に相当する立体、直方体や円柱等)を、順次座標選択手段513から出力された推定座標xt|t(m)に配置したと仮定し、透視変換を行うことで、画像平面における像を推定するものである。図7に示すように、立体として、直方体を用いた場合には、当該直方体を画像平面(投影面、表示装置(図示せず)の表示面)に写像した際の像の輪郭は、四角形、五角形または六角形の多角形の形状となる。
そして、人物像面積推定手段514は、得られた直方体の像において、画像平面(投影面)に対面する面の面積、または、得られた像に外接する方形(バウンディングボックス)の面積を求め、推定面積αest(m)とする。
図6に戻って、映像解析装置1の特徴ベクトル抽出手段5の人数計測手段51の構成の説明を続ける。
除算手段515は、順次面積選択手段512から出力された面積α(m)を、人物像面積推定手段514から出力された推定面積αest(m)で除算して、除算した結果である面積比r(m)を総和演算手段516に出力するものである。この除算手段515から出力される面積比r(m)は、次に示す(20)式で表される。
Figure 0004644022
この(20)式で表される面積比r(m)は、入力画像I(x,y)に映っている人物間のオクルージョンがなく(重なり合いがなく)、シルエット画像S(x,y)に含まれているシルエット一つに対して、人物一人が丁度含まれている場合には、入力映像を撮影しているカメラの撮影地点(カメラの投影中心)から、人物までの距離によらずにほぼ一定の値をとる。
また、シルエット画像S(x、y)に含まれているシルエット一つに対して、複数の人物が含まれている場合には、通常、含まれている人物数の増加に伴って、面積比r(m)の値も増加することが推測される。
そこで、(20)式の代わりに、次に示す(21)式を用いて、面積比r(m)を求めてもよい。
Figure 0004644022
この(21)式において、kは定数とし、この定数の値は、面積比r(m)が一つのシルエット内に含まれる人物の数とほぼ一致するような値をとることが好適である。
総和演算手段516は、除算手段515から出力された面積比r(m)を、クロック手段511から出力された数値時系列に従ったタイミングで累積し、累積した結果(累積結果)を人数Nとし、特徴ベクトルを構成する特徴量の一つとして出力するものである。
図5に示した人物群分散計測手段52は、入力された各人物(各追跡領域)の識別番号mの推定座標xt|t(m)、推定速度vt|t(m)、色分類番号C(m)に基づいて、入力映像内に含まれる人物の分布が広がっている度合いを定量化し、人物群分布面積V(シルエット群分布定量化値、人物群分布定量化値)として出力するものである。この人物群分散計測手段52の詳細な構成を図8に示す。
図8に示すように、人物群分散計測手段52は、クロック手段521と、順次座標選択手段522と、共分散行列演算手段523と、分布面積演算手段524とを備えている。なお、クロック手段521および順次座標選択手段522は、図6に示したクロック手段511および順次座標選択手段513と同様であるので、説明を省略する。
共分散行列演算手段523は、順次座標選択手段522から出力された推定座標xt|t(m)の共分散行列を求めるものである。この共分散行列演算手段523は、例えば、順次座標選択手段522から出力された推定座標xt|t(m)およびxt|t(m)[xt|t(m)]T(Tはベクトルの転置を表す)を、クロック手段521から出力された数値時系列に従ったタイミングで累積すると共に、順次座標選択手段522から出力された推定座標xt|t(m)の個数(サンプル数)を数えることで、共分散行列Dを求める。
この共分散行列演算手段523により求められた共分散行列Dの各成分を、次に示す(22)式によって定義する。
Figure 0004644022
分布面積演算手段524は、共分散行列演算手段523で求められた共分散行列Dに基づいて、実空間上での人物分布範囲を定量化した人物群分布面積Vを求め、特徴ベクトルを構成する特徴量の一つとして出力するものである。人物群分布面積Vは、実空間上での面積と同じ次元を有しており、次に示す(23)式を用いて求めることができる。なお、(23)式において、βは、0以上の定数である。
Figure 0004644022
図5に示した人物間距離計測手段53は、入力された各人物(各追跡領域)の識別番号mの推定座標xt|t(m)および推定速度vt|t(m)に基づいて、入力映像内に含まれる人物間が近接している度合いを定量化し、人物間距離d(シルエット間距離定量化値、人物間距離定量化値)として出力するものである。この人物間距離計測手段53の詳細な構成を図9に示す。
図9に示すように、人物間距離計測手段53は、カウンタ手段531と、第一番号対応座標選択手段532と、第二番号対応座標選択手段533と、距離演算手段534と、最小値演算手段535と、平均値演算手段536とを備えている。
カウンタ手段531は、二つのカウンタ(図示せず)を備えてなり、当該カウンタの出力m1およびm2を組み合わせて、二つの識別番号m1およびm2の全ての組み合わせを走査するものである。なお、ここでいう「走査」とは、いわゆるラスタスキャンを指しており、ここでは、(m1,m2)を(0,0)(1,0)(2,0)、・・・、(0,1)(1,1)(2,1)、・・・、(0,2)(1,2)(2,2)といったように全ての組み合わせを発生させることを意味している。
第一番号対応座標選択手段532は、識別番号mの推定座標xt|t(m)および推定速度vt|t(m)が入力され、カウンタ手段531から出力された識別番号m1に対応する推定座標xt|t(m1)を、距離演算手段534に出力するものである。
第二番号対応座標選択手段533は、識別番号mの推定座標xt|t(m)および推定速度vt|t(m)が入力され、カウンタ手段531から出力された識別番号m2に対応する推定座標xt|t(m2)を、距離演算手段534に出力するものである。
距離演算手段534は、第一番号対応座標選択手段532から出力された識別番号mの推定座標xt|t(m)と、第二番号対応座標選択手段533から出力された識別番号mの推定座標xt|t(m)との距離d m1,m2を求め、最小値演算手段535に出力するものである。この距離dm1,m2は、次に示す式(24)によって表される。
Figure 0004644022
最小値演算手段535は、距離演算手段534から出力された距離dm1,m2と、カウンタ手段531から出力された識別番号mとに基づいて、識別番号mの推定座標xt|t(m)から最も距離の近い推定座標xt|t(m)までの距離dmin(m)を、次に示す(25)式を用いて求め、平均値演算手段536に出力するものである。
Figure 0004644022
平均値演算手段536は、最小値演算手段535から出力された距離dmin(m2)と、カウンタ手段531から出力された識別番号m2とに基づいて、次に示す(26)式を用いて、距離dmin(m2)を識別番号m2に亘って平均演算を行って、平均値dを求め、この平均値dを人物間距離dとし、特徴ベクトルを構成する特徴量の一つとして出力するものである。
Figure 0004644022
図5に示した人物群重心計測手段54は、入力された各人物(各追跡領域)の識別番号mの推定座標xt|t(m)、推定速度vt|t(m)および色分類番号C(m)に基づいて、入力映像内に含まれる人物が分布している人物分布(人物群)の重心を、人物群重心g(シルエット群重心定量化値、人物群重心定量化値)として出力するものである。この人物群重心計測手段54の詳細な構成を図10に示す。
図10に示すように、人物群重心計測手段54は、クロック手段541と、順次座標選択手段542と、平均値演算手段543とを備えている。クロック手段541および順次座標選択手段542は、図6に示したクロック手段511および順次座標選択手段513と同様であるので、説明を省略する。
平均値演算手段543は、順次座標選択手段542から出力された推定座標xt|t(m)の平均値(ベクトル)を、次に示す(27)式を用いて、クロック手段541から出力された数値時系列に従ったタイミングで求め、人物群重心gとし、特徴ベクトルを構成する特徴量の一つとして出力するものである。
Figure 0004644022
図5に示した平均速さ計測手段55は、入力された各人物(各追跡領域)の識別番号mの推定座標xt|t(m)、推定速度vt|t(m)および色分類番号C(m)に基づいて、入力映像内に含まれる人物が分布している人物分布(人物群)の重心の速さを、平均速さs(シルエット速さ定量化値、人物速さ定量化値)として出力するものである。この平均速さ計測手段55の詳細な構成を図11に示す。
図11に示すように、平均速さ計測手段55は、クロック手段551と、順次速度選択手段552と、絶対値演算手段553と、平均値演算手段554とを備えている。クロック手段551は、図6に示したクロック手段511と同様であるので、説明を省略する。
順次速度選択手段552は、識別番号m、色分類番号C(m)、推定座標xt|t(m)および推定速度vt|t(m)が入力され、クロック手段551から出力された数値時系列に従ったタイミングで、順次指定される識別番号mの色分類番号C(m)が特定の値のものを抽出して、該当したものの推定速度vt|t(m)を、絶対値演算手段553に出力するものである。順次速度選択手段552は、前記したように、入力映像がサッカー競技映像である場合、特定の値を“0”から“3”とすれば、選手のみの推定速度vt|t(m)を選択する(選び出す)ことができる。
絶対値演算手段553は、順次速度選択手段552から出力された推定速度vt|t(m)の絶対値を求めるものである。この推定速度vt|t(m)の絶対値は、次に示す(28)式によって定義される。
Figure 0004644022
平均値演算手段554は、絶対値演算手段553から出力された推定速度vt|t(m)の絶対値の平均値を、次に示す(29)式を用いて求めた平均速さsとし、特徴ベクトルを構成する特徴量の一つとして出力するものである。
Figure 0004644022
図5に示した平均速度計測手段56は、入力された各人物(各追跡領域)の識別番号mの推定座標xt|t(m)、推定速度vt|t(m)および色分類番号C(m)に基づいて、入力映像内に含まれる人物が分布している人物分布(人物群)の重心の速度を、平均速度u(シルエット速度定量化値、人物速度定量化値)として出力するものである。この平均速度計測手段56の詳細な構成を図12に示す。
図12に示すように、平均速度計測手段56は、クロック手段561と、順次速度選択手段562と、平均値演算手段563とを備えている。なお、クロック手段561は図6に示したクロック手段511と同様であり、順次速度選択手段562は図11に示した順次速度選択手段552と同様であるので、説明を省略する。
平均値演算手段563は、順次速度選択手段552から出力された推定速度vt|t(m)の平均値を、次に示す(30)式を用いて、クロック手段561から出力された数値時系列に従ったタイミングで求め、平均速度uとし、特徴ベクトルを構成する特徴量の一つとして出力するものである。
Figure 0004644022
図5に示した特定領域監視手段57は、入力された各人物(各追跡領域)の識別番号mの推定座標xt|t(m)、推定速度vt|t(m)および色分類番号C(m)に基づいて、入力映像内に含まれる人物が特定領域に含まれているか否かを判定し、判定した結果を、監視結果w(判定値)として出力するものである。この特定領域監視手段57の詳細な構成を図13に示す。
図13に示すように、特定領域監視手段57は、クロック手段571と、順次番号対応座標選択手段572と、色分類別2次元閾値演算手段573とを備えている。なお、クロック手段571は、図6に示したクロック手段511と同様であるので、説明を省略する。
順次番号対応座標選択手段572は、識別番号m、推定座標xt|t(m)および推定速度vt|t(m)が入力され、クロック手段571から出力された数値時系列に従ったタイミングで、順次指定される識別番号mの推定座標xt|t(m)を、色分類別2次元閾値演算手段573に出力するものである。
色分類別2次元閾値演算手段573は、識別番号mおよび色分類番号C(m)が入力され、順次番号対応座標選択手段572から出力された識別番号mの推定座標xt|t(m)に基づいて、色分類番号C(m)ごとに予め設定された領域W(C)内に、当該色分類番号C(m)が付加(付与)されている人物の識別番号mの推定座標xt|t(m)(色分類番号C(m)が該当している人物の推定座標xt|t(m)とする)が含まれているか否かを判定するものである。
そして、色分類別2次元閾値演算手段573は、次に示す(31)式を用いて、領域W(C)内に、色分類番号C(m)が該当している人物の推定座標xt|t(m)が含まれている場合には、監視結果w=TRUEを、領域W(C)内に、色分類番号C(m)が該当している人物の推定座標xt|t(m)が含まれていない場合には、監視結果w=FALSEを、特徴ベクトルを構成する特徴量の一つとして出力するものである。
Figure 0004644022
例えば、色分類別2次元閾値演算手段573は、入力映像がサッカー競技映像である場合、サッカーコートの右側の二つのコーナー(右奥または右手前のコーナー)を中心とするそれぞれ半径qメートルの2円内の和集合で構成される領域W(1)と、サッカーコートの左側の二つのコーナー(左奥または左手前のコーナー)を中心とするそれぞれ半径qメートルの2円内の和集合で構成される領域W(3)とする。
なお、これらW(1)およびW(3)の括弧内の数字“1”および“3”は色分類番号を指している。ここでは、この色分類番号は、右側に向かって攻撃するチームのフィールド選手を“1”、右側に向かって攻撃するチームのゴールキーパーを“2”、左側に向かって攻撃するチームのフィールド選手を“3”、左側に向かって攻撃するチームのゴールキーパーを“4”、審判を“5”、その他(ボールボーイ、監督、観客等)を“6”としている。
つまり、W(1)は、色分類番号1の選手(右側に向かって攻撃するチームのフィール選手)が右奥または右手前のコーナーに来た(いる)場合、W(3)は色分類番号3の選手(左側に向かって攻撃するチームのフィールド選手)が左奥または左手前のコーナーに来た(いる)場合に監視結果w=TRUEとなる。なお、通常、右側または左側に向かって攻撃しているチーム(攻撃側)のゴールキーパーが、守備側のコーナーに来ることはないので、W(2)(色分類番号2のゴールキーパー(右側に向かって攻撃するチームのゴールキーパー)が右奥または右手前のコーナーに来た(いる)場合)と、W(4)(色分類番号4のゴールキーパー(左側に向かって攻撃するチームのゴールキーパー)が左奥または左手前のコーナーに来た(いる)場合)とは空集合φとしておく。
また、W(5)(色分類番号5の審判がいずれかのコーナーに来た(いる)場合)およびW(6)(色分類番号6のボールボーイ、監督、観客等がいずれかのコーナーに来た(いる)場合)も空集合φと設定しておく。そうすることで、守備側のコーナーに、攻撃側の選手(フィールド選手)がいるか否かを判定することができる。
なお、特徴ベクトル抽出手段5(図1、図5参照)を実装する場合には、クロック手段511(図6参照)、クロック手段521(図8参照)、クロック手段541(図10参照)、クロック手段551(図11参照)、クロック手段561(図12参照)およびクロック手段571(図13参照)を共通化し、順次座標選択手段513(図6参照)、順次座標選択手段522(図8参照)および順次座標選択手段542(図10参照)を共通化し、順次速度選択手段552(図11参照)および順次速度選択手段562(図12参照)を共通化して、より少ない手段数によって行ってもよい。
図1に戻って、映像解析装置1の構成の説明を続ける。
イベント検出手段6は、特徴ベクトル抽出手段5から出力された特徴ベクトルの少なくとも1つの成分(特徴量)に基づいて、入力映像に含まれている映像シーンを特徴付けるイベント(出来事)を検出し、検出した結果を、フラグE(フラグ信号)として、ポストフィルタ手段7に出力するものである。なお、このイベント検出手段6は、必要に応じた数n(nは任意の整数)のイベント検出手段6(6−1)、6(6−2)、・・・、6(6−n)を備えることができる。
つまり、このイベント検出手段6は、特徴ベクトルに含まれている特徴量が、予め設定した条件を満たした場合を、イベントとして検出し、検出した結果を示すフラグE(フラグ信号)として出力するものである。なお、予め設定した条件とは、ここでは、入力映像を、サッカー映像として、後記する(36)式から(42)式までに示した条件を採用している。このイベント検出手段6の詳細な構成を図14に示す。
図14に示すように、イベント検出手段6は、特徴ベクトルを構成する特徴量の数nに応じた数の特徴量間演算手段61(61−1)、61(61−2)、・・・、61(61−n)と、閾値演算手段62(62−1)、62(62−2)、・・・、62(62−n)と、論理演算手段63と、遅延手段64とを備えている。
特徴量間演算手段61は、特徴ベクトルを構成する複数の特徴量の間で演算を行って、演算した結果の値をγとして、閾値演算手段62に出力するものである。以下、γを複合特徴量と呼称し、必要に応じて下付きの添え字をして区別するものとする。
この特徴量間演算手段61は、例えば、入力された特徴ベクトルの複数種類の特徴量の中から、一種類の特徴量のみを選択し、選択した特徴量の値を変換すること無く出力することができる。次に示す(32)式は、人数N、人物間距離d、平均速さsに関する複合特徴量(一種類(単一)の特徴量をそのまま選択して出力しているので、実際には複合していないが、便宜上、複合特徴量と呼称する)γpop、γdistおよびγspdの一例を示している。
Figure 0004644022
なお、この場合、イベント検出手段6には、特徴量間演算手段61を設けずに、一種類の特徴ベクトルのみを直接、閾値演算手段62に入力するようにしてもよい。
また、特徴量間演算手段61は、例えば、入力れた特徴ベクトルのうち、一種類の特徴量のベクトル値を選択し、当該特徴量に線形または非線形の変換を施して出力することが可能である。次に示す(33)式は、人物群重心gの第一成分(水平成分)、平均速度uの第一成分(水平成分)を抽出した複合特徴量γgravおよびγveloの一例を示している。
Figure 0004644022
さらに、特徴量間演算手段61は、例えば、入力された特徴ベクトルのうち、複数種の特徴量の間で演算を行った結果を、複合特徴量γとして出力することが可能である。例えば、人数Nと人物群分布面積Vとに基づいて、次に示す(34)式を用いて、人口密度に相当する複合特徴量γpdを演算(計算)することが可能である。
Figure 0004644022
さらにまた、特徴量間演算手段61は、例えば、入力された特徴ベクトルのうち、真理値たる一種類の特徴量のみを選択し、当該真理値のTRUEおよびFALSEに応じて、それぞれ異なる値を出力することが可能である。次に示す(35)式は、特定領域監視手段57から出力された監視結果wに応じた複合特徴量γrgnの一例を示している。
Figure 0004644022
なお、この特定領域監視手段57から出力された監視結果wに応じた複合特徴量γrgnの場合、イベント検出手段6には、特徴量間演算手段61および閾値演算手段62を設けずに、監視結果w(真理値たる一種類の特徴量)を直接、論理演算手段63に入力してもよい。
閾値演算手段62は、特徴量間演算手段61から出力された複合特徴量γが、予め設定された範囲内にある場合に、真理値L=TRUEを、予め設定された範囲内にない場合に、真理値L=FALSEを、論理演算手段63に出力するものである。この閾値演算手段62は、例えば、複合特徴量γとして、平均速さγsが入力され、予め設定された閾値θs(以下、θに下付添え字は、添え字に対応した閾値を示す)により設定された範囲γs≧θsを、平均速さγsが満たす場合、真理値L=TRUEを、平均速さγsを満たさない場合、真理値L=FALSEを出力することが可能である。
論理演算手段63は、少なくとも1つの閾値演算手段62から出力された真理値L1、L2、・・・、Ln(以下、真理値Lの下付添え字により、複数の真理値Lを区別する)および遅延手段64から出力された真理値J(詳細は後記する)に基づいて、予め設定した論理演算を行って、この論理演算を行った演算結果を、イベントを示すフラグE(以下、フラグEの下付添え字により、複数のフラグEを区別する)として出力するものである。
この論理演算手段63は、遅延手段64から出力された真理値Jが存在する場合には、当該真理値Jに対しても、真理値Lに行った論理演算と、同一または異なる論理演算を行って、この論理演算を行った演算結果を、真理値(複数の真理値からなるベクトル)eとして、遅延手段64に出力する。
遅延手段64は、論理演算手段63から出力された真理値e(真理値eがベクトルの場合、各成分)を所定時間遅延して、真理値Jとして、論理演算手段63に出力するものである。なお、イベント検出手段6には、遅延手段64を設けずに、論理演算手段63から真理値eを出力することと、真理値Jを出力することとを省略してもよい。
ここで、入力映像がサッカー映像である場合のイベント検出手段6の処理について説明する。
サッカー映像において、コーナーキックのイベントを検出する場合には、例えば、コーナーに一人の攻撃側の選手がいて、攻撃側の選手および守備側の選手の動きが少なく、ペナルティエリア内に多くの選手が存在し、且つ、人口密度が高い状態を検出すればよいことになる。こういった状況を、次に示す(36)式を用いて表し、コーナーキックのイベントに関するフラグECKを求めることができる。
Figure 0004644022
この(36)式において、Lcorner1は、コーナー(右側の2コーナーに設定した半径qメートルの2つ円内の和集合W(1)および左側の2コーナーに設定した半径qメートルの2つの円内の和集合W(3)、並びに、空集合φであるW(2)、W(4)、W(5)およびW(6))のいずれかに選手がいるか否かを示す真理値であり、この場合、w(TRUE)であるので、コーナーに選手がいることを示している。Lstatic1は、平均速さsが平均速さsの閾値θstatic1以内または以上であるかを示す真理値であり、この場合、s≦θstatic1であるので、平均速さsは閾値θstatic1以内であることを示している。また、Lmany1は、人数Nが人数Nの閾値θmany1以内または以上であるかを示す真理値であり、この場合、N≧θmanyであるので、人数Nは閾値θmany1以上であることを示している。Ldense1は、人口密度γpdが人口密度の閾値θdense1以内または以上であるかを示す真理値であり、この場合、γpd≧θdense1であるので、人口密度γpdはθdense1以上であることを示している。Eck1は、コーナーキックのイベントに関するフラグの一つであり、この場合、Lcorner1、Lstatic1、Lmany1およびLdense1のすべてを満たす場合に検出される。
なお、ここでは、イベント検出手段6は、特定領域監視手段57(図5、図13参照)から出力された監視結果wを、特徴量間演算手段61および閾値演算手段62を介さずに、直接、真理値Lcorner1として、設定している。また、イベント検出手段6は、人物計測手段51(図5、図6参照)から出力された人数Nと、平均速さ計測手段55(図5、図11参照)から出力された平均速さsとを、特徴量間演算手段61を介さず、直接、閾値演算手段62に入力し、この閾値演算手段62の演算結果(計算結果)を、真理値Lmany1、Lstatic1として設定している。
また、サッカー映像において、フリーキックのイベントを検出する場合、フリーキックのイベントに関するフラグEFKは、次に示す(37)式を用いて求めることができる。
Figure 0004644022
この(37)式において、Lcorner2は、コーナー(右側の2コーナーに設定した半径qメートルの2つ円内の和集合W(1)および左側の2コーナーに設定した半径qメートルの2つの円内の和集合W(3)、並びに、空集合φであるW(2)、W(4)、W(5)およびW(6))のいずれかに選手がいるか否かを示す真理値であり、この場合、w(TRUE)であるので、コーナーに選手がいることを示している。Lstatic2は、平均速さsが平均速さsの閾値θstatic2以内または以上であるかを示す真理値であり、この場合、s≦θstatic2であるので、平均速さsは閾値θstatic2以内であることを示している。また、Lmany2は、人数Nが人数Nの閾値θmany2以内または以上であるかを示す真理値であり、この場合、N≧θmany2であるので、人数Nは閾値θmany2以上であることを示している。Ldense2は、人口密度γpdが人口密度の閾値θdense以内または以上であるかを示す真理値であり、この場合、γpd≧θdense2であるので、人口密度γpdはθdense2以上であることを示している。EFk2は、フリーキックのイベントに関するフラグの一つであり、この場合、Lcorner2に(¬:論理否定)が付加されているので、Lcorner2を満たさず、且つ、Lstatic2、Lmany2およびLdense2を満たす場合に検出される。
つまり、フリーキックの場合、コーナーキックとは異なり、コーナーエリアに選手がいることはないと想定でき、他の状況はコーナーキックとほぼ同じとなる。
また、サッカー映像において、左側に向かって攻撃しているイベントを検出する場合、左側に向かって攻撃しているイベントに関するフラグEleftは、次に示す(38)式を用いて求めることができる。
Figure 0004644022
この(38)式において、Lleft3は、平均速度uの第一成分(右向きを正とした場合の平均速度uの水平成分)を符号反転した−γvelo(左に向かう選手の平均速度)が平均速度uの閾値θleft3以内または以上であるかを示す真理値であり、この場合、−γvelo≧θleft3であるので、平均速度uの第一成分を符号反転した−γveloは閾値θleft3以上であることを示している。また、Lmany3は、人数Nが人数Nの閾値θmany3以内または以上であるかを示す真理値であり、この場合、N≧θmany3であるので、人数Nは閾値θmany3以上であることを示している。Eleft3は、左側に向かって攻撃しているイベントに関するフラグの一つであり、この場合、Lleft3およびLmany3を満たす場合に検出される。
また、サッカー映像において、右側に向かって攻撃しているイベントを検出する場合、右側に向かって攻撃しているイベントに関するフラグErightは、次に示す(39)式を用いて求めることができる。
Figure 0004644022
この(39)式において、Lright4は、平均速度uの第一成分(右向きを正とした場合の平均速度uの水平成分)γvelo(右に向かう選手の平均速度)が平均速度uの閾値θright4以内または以上であるかを示す真理値であり、この場合、γvelo≧θright4であるので、平均速度uの第一成分γveloは閾値θright4以上であることを示している。また、Lmany4は、人数Nが人数Nの閾値θmany4以内または以上であるかを示す真理値であり、この場合、N≧θmany4であるので、人数Nは閾値θmany4以上であることを示している。Eright4は、右側に向かって攻撃しているイベントに関するフラグの一つであり、この場合、Lright4およびLmany4を満たす場合に検出される。
さらに、サッカー映像において、左側のゴール付近で、左側に向かって攻撃しているイベントを検出する場合、この左側ゴール付近で、左側に向かって攻撃しているイベントに関するフラグEleft_goalは、次に示す(40)式を用いて求めることができる。
Figure 0004644022
この(40)式において、Lleft5は、平均速度uの第一成分(右向きを正とした場合の平均速度uの水平成分)を符号反転した−γvelo(左に向かう選手の平均速度)が平均速度uの閾値θleft5以内または以上であるかを示す真理値であり、この場合、−γvelo≧θleft5であるので、平均速度uの第一成分を符号反転した−γveloは閾値θleft5以上であることを示している。また、Lgoal5は、人物群重心gの第一成分(右向きを正とした場合の人物群重心gの水平成分)を符合反転した−γgravが人物群重心gの閾値θgoal5以内または以上であるかを示す真理値であり、この場合、−γgrav≧θgoal5であるので、人物群重心gの第一成分を符合反転した−γgravは閾値θgoal5以上であることを示している。Lmany5は、人数Nが人数Nの閾値θmany5以内または以上であるかを示す真理値であり、この場合、N≧θmany5であるので、人数Nは閾値θmany5以上であることを示している。Eleft_goal5は、左側ゴール付近で、左側に向かって攻撃しているイベントに関するフラグの一つであり、この場合、Lleft5、Lgoal5およびLmany5を満たす場合に検出される。
さらにまた、サッカー映像において、右側のゴール付近で、右側に向かって攻撃しているイベントを検出する場合、この右側ゴール付近で、右側に向かって攻撃しているイベントに関するフラグEright_goalは、次に示す(41)式を用いて求めることができる。
Figure 0004644022
この(41)式において、Lright6は、平均速度uの第一成分(右向きを正とした場合の平均速度uの水平成分)γvelo(右に向かう選手の平均速度)が平均速度uの閾値θright6以内または以上であるかを示す真理値であり、この場合、γvelo≧θright6であるので、平均速度uの第二成分γveloは閾値θright6以上であることを示している。また、Lgoal6は、人物群重心gの第一成分(右向きを正とした場合の人物群重心gの水平成分)γgravが人物群重心gの閾値θgoal6以内または以上であるかを示す真理値であり、この場合、γgrav≧θgoal6であるので、人物群重心gの第一成分γgravは閾値θgoal6以上であることを示している。Lmany6は、人数Nが人数Nの閾値θmany6以内または以上であるかを示す真理値であり、この場合、N≧θmany6であるので、人数Nは閾値θmany6以上であることを示している。Eright_goal6は、右側ゴール付近で、右側に向かって攻撃しているイベントに関するフラグの一つであり、この場合、Lright6、Lgoal6およびLmany6を満たす場合に検出される。
或いはまた、サッカー映像において、攻撃の方向が右方向から左方向に、または、左方向から右方向に変化する瞬間のイベントに関するフラグEturnは、次に示す(42)式を用いて求めることができる。
Figure 0004644022
この(42)式において、Lright7は、平均速度uの第一成分γvelo(右に向かう選手の平均速度)が平均速度uの閾値θright7以内または以上であるかを示す真理値であり、この場合、γvelo≧θright7であるので、平均速度uの第一成分γveloは閾値θright7以上であることを示している。Lleft7は、平均速度uの第一成分を符合反転した−γvelo(左に向かう選手の平均速度)が平均速度uの閾値θleft7以内または以上であるかを示す真理値であり、この場合、−γvelo≦θleft7であるので、平均速度uの第一成分を符合反転した−γveloは閾値θleft7以内であることを示している。また、Lmany7は、人数Nが人数Nの閾値θmany7以内または以上であるかを示す真理値であり、この場合、N≧θmany7であるので、人数Nは閾値θmany7以上であることを示している。eright7はフラグEturnを検出するために遅延手段64に入力する真理値の一つであり、Lright7およびLmany7を満たす場合に検出される。eleft7はフラグEturnを検出するために遅延手段64に入力する真理値の一つであり、Lleft7およびLmany7を満たす場合に検出される。Eturn7は、攻撃の方向が右方向から左方向に、または、左方向から右方向に変化する瞬間のイベントに関するフラグの一つであり、この場合、Lleft7および1単位時間過去のeright7(遅延手段64で遅延されたeright7)を満たすか、または、Lright7および1単位時間過去のeleft7(遅延手段64で遅延されたeleft7)を満たし、且つ、Lmany7を満たす場合に検出される。
図1に戻って、映像解析装置1の構成の説明を続ける。
ポストフィルタ手段7は、イベント検出手段6から出力された1以上のフラグEに対して、時間方向のフィルタ処理と、フラグE間の論理演算処理との少なくとも一方の処理を行って、最終的なイベント出力(イベントを特定するイベント出力信号)εを求めるものである。以下、イベント出力εに付される下付添え字(後記する)により、複数のイベント出力εを区別することとする。このポストフィルタ手段7の詳細な構成を図15に示す。
図15に示すように、ポストフィルタ手段7は、時間率フィルタ手段71(71−1、71−2、・・・、71−7)と、タイムアウト処理手段72(72−1、72−2、・・・、72−7)と、イベント特定論理演算手段73(73−2、73−4、73−5、73−6)とを備えている。
時間率フィルタ手段71は、入力されたフラグEそれぞれに対して、時間方向のフィルタ処理を施すものである。この時間率フィルタ手段71の詳細な構成を図16に示す。
図16に示すように、時間率フィルタ手段71は、遅延手段711(711−1、711−2、711−3、・・・、711−(Δ−1))と、時間率演算手段712と、閾値演算手段713とを備えている。
遅延手段711は、複数(Δ−1)個(Δは1以上の整数)から構成されており、入力されたフラグEを1単位時間遅延させて、時間率演算手段712に出力すると共に、連続して配置されている次の遅延手段711に出力するものである。
時間率演算手段712は、時間率フィルタ手段71に入力されるフラグEの真理値TRUEおよび遅延手段711から出力される(Δ−1)個のフラグEの真理値TRUEの総数を数え、数えた総数をΔで除算した結果(除算結果、時間率ρ)を、閾値演算手段713に出力するものである。
閾値演算手段713は、時間率演算手段712から出力された除算結果(時間率ρ)が予め設定した閾値θρ以上であるか否かを判定し、閾値θρ以上であった場合に、真理値TRUEを、閾値θρ以上でなかった場合に、真理値FALSEを、タイムアウト処理手段72(図15)に出力するものである。
ここで、時間率フィルタ手段71の処理を、図17に示すフラグEの真理値(TRUEまたはFALSE)の例を参照して説明する(適宜、図16参照)。
まず、時間率フィルタ手段71は、(Δ−1)個の遅延手段711によって、時刻t(現時点t)から時刻t−Δ(Δ単位時間過去の時点t−Δ)に至る幅Δの窓を、入力されたフラグEの真理値の時系列に対して設定する。続いて、時間率フィルタ手段71は、時間率演算手段712によって、当該窓内において、真理値がTRUEであった割合(時間率ρ)を求めて閾値演算手段713に出力する。そして、時間率フィルタ手段71は、閾値演算手段713によって、時間率ρと閾値θρとの比較を行い、時間率ρが閾値θρ以上になった場合には、出力をTRUE(入力真理値をTRUE)とし、時間率ρが閾値θρ未満の場合には、出力をFALSE(入力真理値をFALSE)とする。
図15に示したタイムアウト処理手段72は、時間率フィルタ手段71から入力された入力真理値(TRUEまたはFALSE)を、δ単位時間に基づいて、タイムアウト処理を行って、真理値TRUEまたは真理値FALSEを、イベント特定論理演算手段73に出力するものである。
すなわち、このタイムアウト処理手段72は、時間率フィルタ手段71から入力された入力真理値がTRUEの場合には、真理値TRUEを、イベント特定論理演算手段73に出力するものである。また、タイムアウト処理手段72は、入力真理値がFALSEであり、且つ、入力真理値がTRUEからFALSEに立ち下がった時点からδ単位時間を経過するまでの間は、真理値TRUEを出力する。
また、このタイムアウト処理手段72は、時間率フィルタ手段71から入力された入力真理値がFALSEであり、且つ、入力真理値がTRUEからFALSEに立ち下がった時点からδ単位時間を超える場合には、真理値FALSEを出力する。このタイムアウト処理手段72の詳細な構成を図18に示す。
図18に示すように、タイムアウト処理手段72は、単安定マルチバイブレータ手段721と、論理和演算手段722とを備えている。
単安定マルチバイブレータ手段721は、入力真理値(TRUEまたはFALSE)の立ち下がりエッジ(TRUEからFALSEになった瞬間)を検出し、最近(直近)の立ち下がりの時点からδ単位時間を経過するまでの間のみ真理値TRUEを、論理和演算手段722に出力する。また、単安定マルチバイブレータ手段721は、最近の立ち下がり時点からδ単位時間を経過した後は、真理値FALSEを、論理和演算手段722に出力するものである。
論理和演算手段722は、タイムアウト処理手段72に入力された入力真理値と、単安定マルチバイブレータ手段721から出力された真理値との論理和を演算(計算)し、演算結果を出力するものである。
ここで、タイムアウト処理手段72の処理を、図19に示す入力真理値の例を参照して説明する(適宜、図18参照)。
まず、タイムアウト処理手段72は、入力真理値の時系列に対して、単安定マルチバイブレータ手段721によって、入力真理値の立ち下がりエッジを検出し、最近(直近)の立ち下がりの時点からδ単位時間を経過するまでの間のみ真理値TRUEを、最近の立ち下がり時点からδ単位時間を経過した後は、真理値FALSEを、論理和演算手段722に出力する。そして、タイムアウト処理手段72は、論理和演算手段722によって、入力された入力真理値と、単安定マルチバイブレータ手段721から出力された真理値との論理和(いわゆる、or)をとる。つまり、タイムアウト処理手段72の入力と、単安定マルチバイブレータ手段721の出力とのいずれかがTRUEの場合には、真理値TRUEを出力する。
なお、図15に示したイベント特定論理演算手段73は、タイムアウト処理手段72から出力された真理値TRUEまたは真理値FALSEとに基づいて、論理演算を行って、論理演算を行った結果をイベント出力(イベント出力信号)として出力するものである。
例えば、イベント特定論理演算手段73(73−2)は、タイムアウト処理手段72(72−1)から出力された真理値FALSEと、タイムアウト処理手段72(72−)から出力された真理値との論理積(いわゆる、and)を計算し、論理演算を行った結果を、イベント出力εFKとして出力する。
このように、コーナーキックのイベント出力εCKと、フリーキックのイベント出力εFKとの論理積をとっている理由は、サッカー映像において、コーナーキックとフリーキックとを比較すると、ボールを蹴る位置(コーナーか任意の箇所)が異なっているだけで、選手の平均速さや人口密度といった状況は似かよっていて、区別が難しいからである。つまり、コーナーキックとフリーキックとは同時には起こり得ないことを根拠に、この論理積をとることによって、いずれかのイベントを特定することができる。
例えば、イベント特定論理演算手段73(73−4)は、タイムアウト処理手段72(72−3)から出力された真理値FALSEと、タイムアウト処理手段72(72−4)から出力された真理値との論理積(いわゆる、and)を計算し、論理演算を行った結果を、イベント出力εright_goalとして出力する。
このように、左側ゴール付近で、左側に向かって攻撃しているイベント出力εleft_goaと、右側ゴール付近で、右側に向かって攻撃しているイベント出力εright_goaとの論理積をとっている理由は、サッカー映像において、ボールの位置する場所が左側ゴール付近にあるのか右側ゴール付近にあるのかが異なっているだけで、選手の平均速さや人物群重心の場所は似かよっていて、区別が難しいからである。つまり、左側ゴール付近と右側ゴール付近とには同時にボールが存在しないことを根拠に、この論理積をとることによって、いずれかのイベントを特定することができる。
例えば、イベント特定論理演算手段73(73−5)は、イベント特定論理演算手段73(73−4)から出力されたイベント出力εright_goalの論理否定と、タイムアウト処理手段72(72−5)から出力された真理値との論理積(いわゆる、and)を計算し、論理演算を行った結果を、イベント出力εleftとして出力する。
このように、右側ゴール付近で、右側に向かって攻撃しているイベント出力εright_goalと、左側に向かって攻撃しているイベント出力εleftとの論理積をとっている理由は、サッカー映像において、右側ゴール付近にボールが位置しているが、左側に攻撃する選手にボールが奪われた、いわゆる“カウンター”を検出するためである。
例えば、イベント特定論理演算手段73(73−6)は、イベント特定論理演算手段73(73−5)から出力されたイベント出力εleftの論理否定と、タイムアウト処理手段72(72−6)から出力された真理値との論理積(いわゆる、and)を計算し、論理演算を行った結果を、イベント出力εrightとして出力する。
このように、左側に向かって攻撃しているイベント出力εleftと、右側に向かって攻撃しているイベント出力εrightとの論理積をとっている理由は、サッカー映像において、ボールを蹴っている選手が左方向に攻撃する選手なのか右方向に攻撃する選手なのかが異なっているだけで、選手の平均速さや人物群重心の場所は似かよっていて、区別が難しいからである。つまり、右側に向かって攻撃することと左側に向かって攻撃することとは同時に発生しないことを根拠に、この論理積をとることによって、いずれかのイベントを特定することができる。
なお、ポストフィルタ手段7(図15参照)は、入力されたフラグEの真理値や、時間率フィルタ手段71から出力された真理値や、タイムアウト処理手段72から出力された真理値や、イベント特定論理演算手段73から出力されたイベント出力を、任意の時間率フィルタ手段71、タイムアウト処理手段72およびイベント特定論理演算手段73に出力することが可能である(ポストフィルタ手段7内の各構成の任意の接続が可能である)。
例えば、図20に示すように、ポストフィルタ手段7Aを、構成することも可能である。図20に示したポストフィルタ手段7Aは、フラグECKの真理値とフラグEFKの真理値とを入力とし、図15に示した時間率フィルタ手段71(71−1)およびタイムアウト処理手段72(72−1)によってイベント出力εCKを出力する系統と、時間率フィルタ手段71(71−2)、タイムアウト処理手段72(72−2)およびイベント特定論理演算手段73(73−2)によってイベント出力εFKを出力する系統とに、新たに、イベント特定論理演算手段73(73−8)およびイベント特定論理演算手段73(73−9)を付加した構成となっている。
イベント特定論理演算手段73(73−8)は、フラグECKの真理値とフラグEFKの真理値とに基づいて、イベント出力εを時間率フィルタ手段71(71−2)に出力するものである。
イベント特定論理演算手段73(73−9)は、時間率フィルタ手段71(71−1)から出力された真理値と、時間率フィルタ手段71(71−2)から出力された真理値とに基づいて、イベント出力εをタイムアウト処理手段72(72−2)に出力するものである。
図1に示した映像解析装置1によれば、シルエット映像生成手段2によって、スポーツ映像からシルエット映像を生成し、シルエット映像に含まれる人物のシルエットを追跡領域とし、当該追跡領域の推定座標および推定速度と、当該追跡領域の面積と、当該追跡領域の色を示す色分類番号を出力し、特徴ベクトル抽出手段5によって、これらの少なくとも一つに基づき、特徴ベクトルに含める特徴量を計算し、イベント検出手段6によって、特徴量が、予め設定した条件を満たした場合を、スポーツ映像に含まれる各シーンで発生した特定のプレイを示すイベントとして検出し、ポストフィルタ手段7によって、イベントを特定する。このため、スポーツ映像を解析して、当該スポーツ映像における特定のプレイ等を検出することができる。
また、この映像解析装置1によれば、人物追跡手段3によって、シルエット映像に含まれるそれぞれの人物のシルエットを単連結領域とし、ラベル番号を付加し、各単連結領域の面積が一定範囲内にある単連結領域について、遅延予測座標および遅延予測速度と、ラベル番号と、単連結領域の面積と、実座標とに基づいて、ラベル番号に対応させた識別番号と、実座標と遅延予測座標とを対応させた観測座標とを出力すると共に、面積判定手段から出力された単連結領域の面積を追跡領域の面積として出力する。そして、出力された観測座標を、時間方向に濾波予測し、推定座標および推定速度を出力する。このため、スポーツ映像に含まれる被写体(選手等)を、当該スポーツ映像の進行時間に沿って(時間方向に)追跡して、当該被写体の座標を出力すると共に、当該被写体の速度および当該被写体の見かけの大きさを出力することができる。
さらに、この映像解析装置1によれば、特徴ベクトル抽出手段5によって、特徴ベクトルに含まれる特徴量が、人物数推定値と、人物群分布定量化値と、人物間距離定量化値と、人物速さ定量化値と、人物速度定量化値と、判定値との少なくとも1つを備えているので、こういった座標と、速度と、面積と、色分類といった低次の映像特徴量を、スポーツ映像のイベント(特定のプレイ等)に関する高次の映像特徴量に変換することができる。
(映像解析装置の全体動作)
次に、図21に示すフローチャートを参照して、映像解析装置1の全体の動作を説明する(適宜、図1参照)。なお、この図21に示したフローチャートは、入力映像として、サッカー映像が入力された場合に、映像解析装置1の概略の動作を説明したものである。
まず、映像解析装置1は、シルエット映像生成手段2によって、入力映像(複数の入力画像I(x,y))からシルエット映像(複数のシルエット画像S(x,y))を生成し(ステップS1)、人物追跡手段3によって、シルエット映像に含まれている領域(人物のシルエット)を追跡領域とし、識別番号m、推定座標xt|t(m)、推定速度vt|t(m)および面積α(m)を出力する(ステップS2)。
また、映像解析装置1は、入力映像と、シルエット映像生成手段2から出力されたシルエット映像と、人物追跡手段3から出力された追跡領域および識別番号mとから、色識別手段4によって、識別番号mと色分類番号C(m)とを対応付ける(ステップS3)。そして、映像解析装置1は、特徴ベクトル抽出手段5によって、入力された識別番号m、推定座標xt|t(m)、推定速度vt|t(m)、面積α(m)および色分類番号C(m)とに基づいて、人数N、人物分布面積V、人物間距離d、人物群重心g、平均速さs、平均速度uおよび監視結果wの少なくとも1つを含む特徴ベクトルを出力する(ステップS4)。
そして、映像解析装置1は、イベント検出手段6によって、イベント(特定のプレイ)を示すフラグによって、当該イベントを検出し(ステップS5)、ポストフィルタ手段7によって、イベントを特定し、コーナーキックを示すイベント出力εCKと、フリーキックを示すイベント出力εFKと、左側ゴール付近で、左側に向かって攻撃していることを示すイベント出力εleft_goalと、右側ゴール付近で、右側に向かって攻撃していることを示すイベント出力εright_goalと、左側に向かって攻撃していることを示すイベント出力εleftと、右側に向かって攻撃イベント出力εrightと、選手の攻撃する向き(右方向から左方向、または、左方向から右方向)が変わったことを示すイベント出力εturnとのいずれかを出力する(ステップS6)。
以上、本発明の実施形態について説明したが、本発明は前記実施形態には限定されない。例えば、本実施形態では、映像解析装置1に入力される入力映像を、専ら、スポーツ映像として説明したがこれに限定されるものではなく、風景が描写された映像や、ドラマの映像等であってもよい。
また、映像解析装置1の各構成の処理を行わせるように、一般的または汎用的なコンピュータ言語によって記述した映像解析プログラムとして構成することも可能である。この場合、映像解析装置1と同様の効果を得ることができる。
本発明の実施形態に係る映像解析装置のブロック図である。 図1に示した人物追跡手段の構成の一例を示したブロック図である。 面積判定手段による処理の概念を説明した図である。 面積判定手段および逆投影手段による処理の概念を説明した図である。 特徴ベクトル抽出手段の構成の一例を示したブロック図である。 人数計測手段の構成の一例を示したブロック図である。 人物像面積推定手段の構成の一例を示したブロック図である。 人物群分散計測手段の構成の一例を示したブロック図である。 人物間距離計測手段の構成の一例を示したブロック図である。 人物群重心計測手段の構成の一例を示したブロック図である。 平均速さ計測手段の構成の一例を示したブロック図である。 平均速度計測手段の構成の一例を示したブロック図である。 特定領域監視手段の構成の一例を示したブロック図である。 イベント検出手段の構成の一例を示したブロック図である。 ポストフィルタ手段の構成の一例を示したブロック図である。 時間率フィルタ手段の構成の一例を示したブロック図である。 時間率フィルタ手段による処理を説明した図である。 タイムアウト処理手段の構成の一例を示したブロック図である。 タイムアウト処理手段による処理を説明した図である。 ポストフィルタ手段の別の構成の一例を示したブロック図である。 図1に示した映像解析装置の全体動作を説明したフローチャートである。
符号の説明
1 映像解析装置
2 シルエット映像生成手段
3 人物追跡手段
4 色識別手段
5 特徴ベクトル抽出手段(特徴ベクトル計算手段)
6 イベント検出手段
7 ポストフィルタ手段
31 ラベリング手段
32 面積判定手段
33 逆投影変換手段
34 検出・追跡手段(検出追跡手段)
35 予測・推定手段(予測推定手段)
36 遅延手段
51 人数計測手段
52 人物群分散計測手段
53 人物間距離計測手段
54 人物群重心計測手段
55 平均速さ計測手段
56 平均速度計測手段
57 特定領域監視手段
61 特徴量間演算手段
62 閾値演算手段
63 論理演算手段
64 遅延手段
71 時間率フィルタ手段
72 タイムアウト処理手段
73 イベント特定論理演算手段
511 クロック手段
512 順次面積選択手段
513 順次座標選択手段
514 人物像面積推定手段
515 除算手段
516 総和演算手段
521 クロック手段
522 順次座標選択手段
523 共分散行列演算手段
524 分布面積演算手段
531 クロック手段
532 第一番号対応座標選択手段
533 第二番号対応座標選択手段
534 距離演算手段
535 最小値演算手段
536 平均値演算手段
541 クロック手段
542 順次座標選択手段
543 平均値演算手段
551 クロック手段
552 順次速度選択手段
553 絶対値演算手段
554 平均値演算手段
561 クロック手段
562 順次速度選択手段
563 平均値演算手段
571 クロック手段
572 順次番号対応座標選択手段
573 色分類別2次元閾値演算手段
711 遅延手段
712 時間率演算手段
713 閾値演算手段
721 単安定マルチバイブレータ手段
722 論理和演算手段

Claims (8)

  1. 入力された映像を解析する映像解析装置であって、
    前記映像からシルエット映像を生成するシルエット映像生成手段と、
    このシルエット映像生成手段で生成されたシルエット映像を構成するシルエット画像に含まれるシルエットを追跡領域とし、前記シルエット画像間の差に基づいて当該追跡領域を追跡し、当該追跡領域を識別するための識別番号と対応付けて、当該追跡領域の推定座標および推定速度と、当該追跡領域の面積とを出力する領域追跡手段と、
    前記推定座標と、前記シルエット映像と、前記映像とに基づき、前記追跡領域の色を識別し、識別した結果に基づいて、当該色を分類するために予め設定した色分類番号と前記識別番号とを対応付けて出力する色識別手段と、
    前記識別番号と対応付けられた、前記推定座標および前記推定速度と、前記追跡領域の面積と、前記色分類番号との少なくとも一つに基づき、特徴ベクトルに含める特徴量を計算する特徴ベクトル計算手段と、
    この特徴ベクトル計算手段で計算された特徴ベクトルに含まれる特徴量が、予め設定した条件を満たした場合を、前記映像に含まれる各シーンで発生した出来事を示すイベントとして検出し、検出した結果を示すフラグ信号を出力するイベント検出手段と、
    このイベント検出手段で出力されたフラグ信号に、一定時間区間内において、フラグの真理値がTRUEである割合を求め、この割合に応じた真理値を出力する時間率フィルタ、および、真理値立ち下がり後、一定時間にわたって真理値TRUEを継続出力する単安定マルチバイブレータの少なくとも一方の処理からなる時間方向のフィルタ処理と、前記イベント検出手段から入力したフラグ信号、時間方向のフィルタ処理のなされたフラグ信号、または、異なるイベントに関する本論理演算で出力された論理演算結果たるフラグ信号のうち、複数のフラグ信号間で、その複数の真理値入力に関する前記論理演算結果の真理値を出力する前記論理演算との少なくとも一方の処理を行って、その処理の結果出力される真理値のTRUEまたはFALSEにより前記イベントを特定するイベント出力信号を出力するポストフィルタ手段と、
    を備えることを特徴とする映像解析装置。
  2. 前記領域追跡手段は、
    前記シルエット画像に含まれるそれぞれのシルエットを単連結領域とし、この単連結領域に対してラベル番号を付加し、当該ラベル番号を付加した単連結領域の形状に関する領域情報を生成するラベリング手段と、
    前記領域情報に基づいて、各単連結領域の面積を求め、求めた面積が一定範囲内にある単連結領域について、前記ラベル番号および前記単連結領域の面積を出力する面積判定手段と、
    前記ラベリング手段で生成された領域情報と前記映像を撮影したカメラの投影中心とに基づいて、3次元空間における各単連結領域の存在場所を示す実座標を、前記ラベル番号と共に出力する逆投影変換手段と、
    前記追跡領域の座標および速度の予測された予測座標および予測速度が予め設定された所定単位時間遅延されて出力された、遅延予測座標および遅延予測速度と、前記ラベル番号と、前記面積判定手段から出力された単連結領域の面積と、前記実座標とに基づいて、前記ラベル番号に対応させた前記識別番号と、前記実座標と前記遅延予測座標とを対応させた観測座標とを出力すると共に、前記面積判定手段から出力された単連結領域の面積を前記追跡領域の面積として出力する検出追跡手段と、
    この検出追跡手段で出力された観測座標を、観測座標入力値、観測座標入力値の履歴、当該予測推定手段の履歴、のいずれか一つ以上に対する演算によって定義されるフィルタにより時間方向に予測し、前記推定座標および前記推定速度と、前記予測座標および前記予測速度とを前記識別番号と共にそれぞれ出力する予測推定手段と、
    この予測推定手段から出力された前記予測座標および前記予測速度を、前記所定単位時間遅延して、前記識別番号と共に前記検出追跡手段に出力する遅延手段と、
    を備えることを特徴とする請求項1に記載の映像解析装置。
  3. 前記特徴ベクトルは、前記シルエットの数を推定したシルエット数推定値、複数の前記シルエットからなるシルエット群の分布の散らばり度合いを定量化したシルエット群分布定量化値、前記シルエット間の距離を定量化したシルエット間距離定量化値、前記シルエット群の分布を代表する座標を定量化したシルエット群重心定量化値、前記シルエットの速さを定量化したシルエット速さ定量化値、前記シルエットの速度を定量化したシルエット速度定量化値および予め特定したシルエットである特定シルエットが特定の場所に存在するか否かを判定した判定値の少なくとも一つ以上の特徴量によって構成されることを特徴とする請求項1または請求項2に記載の映像解析装置。
  4. 入力されたスポーツ映像を解析する映像解析装置であって、
    前記スポーツ映像からシルエット映像を生成するシルエット映像生成手段と、
    このシルエット映像生成手段で生成されたシルエット映像を構成するシルエット画像に含まれる所定面積範囲の領域である人物のシルエットを追跡領域とし、前記シルエット画像間の差に基づいて当該追跡領域を追跡し、当該追跡領域を識別するための識別番号と対応付けて、当該追跡領域の推定座標および推定速度と、当該追跡領域の面積とを出力する領域追跡手段と、
    前記推定座標と、前記シルエット映像と、前記スポーツ映像とに基づき、前記追跡領域の色を識別し、識別した結果に基づいて、当該色を分類するために予め設定した色分類番号と前記識別番号とを対応付けて出力する色識別手段と、
    前記識別番号と対応付けられた、前記推定座標および前記推定速度と、前記追跡領域の面積と、前記色分類番号との少なくとも一つに基づき、特徴ベクトルを計算する特徴ベクトル計算手段と、
    この特徴ベクトル計算手段で計算された特徴ベクトルに含まれる特徴量が、予め設定した条件を満たした場合を、前記映像に含まれる各シーンで発生した出来事を示すイベントとして検出し、検出した結果を示すフラグ信号を出力するイベント検出手段と、
    このイベント検出手段で出力されたフラグ信号に、一定時間区間内において、フラグの真理値がTRUEである割合を求め、この割合に応じた真理値を出力する時間率フィルタ、および、真理値立ち下がり後、一定時間にわたって真理値TRUEを継続出力する単安定マルチバイブレータの少なくとも一方の処理からなる時間方向のフィルタ処理と、前記イベント検出手段から入力したフラグ信号、時間方向のフィルタ処理のなされたフラグ信号、または、異なるイベントに関する本論理演算で出力された論理演算結果たるフラグ信号のうち、複数のフラグ信号間で、その複数の真理値入力に関する前記論理演算結果の真理値を出力する前記論理演算との少なくとも一方の処理を行って、その処理の結果出力される真理値のTRUEまたはFALSEにより前記イベントを特定するイベント出力信号を出力するポストフィルタ手段と、
    を備えることを特徴とする映像解析装置。
  5. 前記領域追跡手段は、
    前記シルエット画像に含まれるそれぞれの所定面積範囲の領域である人物のシルエットを単連結領域とし、この単連結領域に対してラベル番号を付加し、当該ラベル番号を付加した単連結領域の形状に関する領域情報を生成するラベリング手段と、
    前記領域情報に基づいて、各単連結領域の面積を求め、求めた面積が一定範囲内にある単連結領域について、前記ラベル番号および前記単連結領域の面積を出力する面積判定手段と、
    前記ラベリング手段で生成された領域情報と前記スポーツ映像を撮影したカメラの投影中心とに基づいて、3次元空間における各単連結領域の存在場所を示す実座標を、前記ラベル番号と共に出力する逆投影変換手段と、
    前記追跡領域の座標および速度の予測された予測座標および予測速度が予め設定された所定単位時間遅延されて出力された、遅延予測座標および遅延予測速度と、前記ラベル番号と、前記面積判定手段から出力された単連結領域の面積と、前記実座標とに基づいて、前記ラベル番号に対応させた前記識別番号と、前記実座標と前記遅延予測座標とを対応させた観測座標とを出力すると共に、前記面積判定手段から出力された単連結領域の面積を前記追跡領域の面積として出力する検出追跡手段と、
    この検出追跡手段で出力された観測座標を、観測座標入力値、観測座標入力値の履歴、当該予測推定手段の履歴、のいずれか一つ以上に対する演算によって定義されるフィルタにより時間方向に予測し、前記推定座標および前記推定速度と、前記予測座標および前記予測速度とを前記識別番号と共にそれぞれ出力する予測推定手段と、
    この予測推定手段から出力された前記予測座標および前記予測速度を前記所定単位時間遅延して、前記識別番号と共に前記検出追跡手段に出力する遅延手段と、
    を備えることを特徴とする請求項4に記載の映像解析装置。
  6. 前記特徴ベクトルは、前記人物のシルエットの数を推定した人物数推定値、複数の前記人物のシルエットからなる人物シルエット群の分布の散らばり度合いを定量化した人物群分布定量化値、前記人物のシルエット間の距離を定量化した人物間距離定量化値、前記人物群の分布を代表する座標を定量化した人物群重心定量化値、前記人物のシルエットの速さを定量化した人物速さ定量化値、前記人物のシルエットの速度を定量化した人物速度定量化値および予め特定した人物のシルエットである特定人物シルエットが特定の場所に存在するか否かを判定した判定値の少なくとも一つ以上の特徴量によって構成されることを特徴とする請求項4または請求項5に記載の映像解析装置。
  7. 入力された映像を解析するために、コンピュータを、
    前記映像からシルエット映像を生成するシルエット映像生成手段、
    このシルエット映像生成手段で生成されたシルエット映像を構成するシルエット画像に含まれるシルエットを追跡領域とし、前記シルエット画像間の差に基づいて当該追跡領域を追跡し、当該追跡領域を識別するための識別番号と対応付けて、当該追跡領域の推定座標および推定速度と、当該追跡領域の面積とを出力する領域追跡手段、
    前記推定座標と、前記シルエット映像と、前記映像とに基づき、前記追跡領域の色を識別し、識別した結果に基づいて、当該色を分類するために予め設定した色分類番号と前記識別番号とを対応付けて出力する色識別手段、
    前記識別番号と対応付けられた、前記推定座標および前記推定速度と、前記追跡領域の面積と、前記色分類番号との少なくとも一つに基づき、特徴ベクトルに含める特徴量を計算する特徴ベクトル計算手段、
    この特徴ベクトル計算手段で計算された特徴ベクトルに含まれる特徴量が、予め設定した条件を満たした場合を、前記映像に含まれる各シーンで発生した出来事を示すイベントとして検出し、検出した結果を示すフラグ信号を出力するイベント検出手段、
    このイベント検出手段で出力されたフラグ信号に、一定時間区間内において、フラグの真理値がTRUEである割合を求め、この割合に応じた真理値を出力する時間率フィルタ、および、真理値立ち下がり後、一定時間にわたって真理値TRUEを継続出力する単安定マルチバイブレータの少なくとも一方の処理からなる時間方向のフィルタ処理と、前記イベント検出手段から入力したフラグ信号、時間方向のフィルタ処理のなされたフラグ信号、または、異なるイベントに関する本論理演算で出力された論理演算結果たるフラグ信号のうち、複数のフラグ信号間で、その複数の真理値入力に関する前記論理演算結果の真理値を出力する前記論理演算との少なくとも一方の処理を行って、その処理の結果出力される真理値のTRUEまたはFALSEにより前記イベントを特定するイベント出力信号を出力するポストフィルタ手段、
    として機能させることを特徴とする映像解析プログラム。
  8. 入力されたスポーツ映像を解析するために、コンピュータを、
    前記スポーツ映像からシルエット映像を生成するシルエット映像生成手段、
    このシルエット映像生成手段で生成されたシルエット映像を構成するシルエット画像に含まれる所定面積範囲の領域である人物のシルエットを追跡領域とし、前記シルエット画像間の差に基づいて当該追跡領域を追跡し、当該追跡領域を識別するための識別番号と対応付けて、当該追跡領域の推定座標および推定速度と、当該追跡領域の面積とを出力する領域追跡手段、
    前記推定座標と、前記シルエット映像と、前記スポーツ映像とに基づき、前記追跡領域の色を識別し、識別した結果に基づいて、当該色を分類するために予め設定した色分類番号と前記識別番号とを対応付けて出力する色識別手段、
    前記識別番号と対応付けられた、前記推定座標および前記推定速度と、前記追跡領域の面積と、前記色分類番号との少なくとも一つに基づき、特徴ベクトルに含める特徴量を計算する特徴ベクトル計算手段、
    この特徴ベクトル計算手段で計算された特徴ベクトルに含まれる特徴量が、予め設定した条件を満たした場合を、前記スポーツ映像に含まれる各シーンで発生した特定のプレイを示すイベントとして検出し、検出した結果を示すフラグ信号を出力するイベント検出手段、
    この特徴ベクトル計算手段で計算された特徴ベクトルに含まれる特徴量が、予め設定した条件を満たした場合を、前記映像に含まれる各シーンで発生した出来事を示すイベントとして検出し、検出した結果を示すフラグ信号を出力するイベント検出手段、
    このイベント検出手段で出力されたフラグ信号に、一定時間区間内において、フラグの真理値がTRUEである割合を求め、この割合に応じた真理値を出力する時間率フィルタ、および、真理値立ち下がり後、一定時間にわたって真理値TRUEを継続出力する単安定マルチバイブレータの少なくとも一方の処理からなる時間方向のフィルタ処理と、前記イベント検出手段から入力したフラグ信号、時間方向のフィルタ処理のなされたフラグ信号、または、異なるイベントに関する本論理演算で出力された論理演算結果たるフラグ信号のうち、複数のフラグ信号間で、その複数の真理値入力に関する前記論理演算結果の真理値を出力する前記論理演算との少なくとも一方の処理を行って、その処理の結果出力される真理値のTRUEまたはFALSEにより前記イベントを特定するイベント出力信号を出力するポストフィルタ手段、
    として機能させることを特徴とする映像解析プログラム。
JP2005108094A 2005-04-04 2005-04-04 映像解析装置および映像解析プログラム Expired - Fee Related JP4644022B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005108094A JP4644022B2 (ja) 2005-04-04 2005-04-04 映像解析装置および映像解析プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005108094A JP4644022B2 (ja) 2005-04-04 2005-04-04 映像解析装置および映像解析プログラム

Publications (2)

Publication Number Publication Date
JP2006285878A JP2006285878A (ja) 2006-10-19
JP4644022B2 true JP4644022B2 (ja) 2011-03-02

Family

ID=37407706

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005108094A Expired - Fee Related JP4644022B2 (ja) 2005-04-04 2005-04-04 映像解析装置および映像解析プログラム

Country Status (1)

Country Link
JP (1) JP4644022B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4670010B2 (ja) * 2005-10-17 2011-04-13 株式会社国際電気通信基礎技術研究所 移動体分布推定装置、移動体分布推定方法及び移動体分布推定プログラム
JP4764332B2 (ja) * 2006-12-28 2011-08-31 日本放送協会 パラメータ情報作成装置及びパラメータ情報作成プログラム、並びに、イベント検出装置及びイベント検出プログラム
JP4764362B2 (ja) * 2007-02-15 2011-08-31 日本放送協会 イベント判別装置及びイベント判別プログラム
US8391547B2 (en) * 2007-03-26 2013-03-05 Thomson Licensing Method and apparatus for detecting objects of interest in soccer video by color
JP4670923B2 (ja) * 2008-09-22 2011-04-13 ソニー株式会社 表示制御装置、表示制御方法、およびプログラム
JP5461597B2 (ja) * 2012-01-30 2014-04-02 日本電信電話株式会社 移動体追跡方法及びコンピュータプログラム
JP6354229B2 (ja) 2014-03-17 2018-07-11 富士通株式会社 抽出プログラム、方法、及び装置
EP3657356B1 (en) 2017-07-21 2023-08-09 Sony Group Corporation Information processing device and information processing method
CN110674769A (zh) * 2019-09-29 2020-01-10 新华智云科技有限公司 一种基于深度学习算法的足球视频片段未进球、普通进球、定位球分类方法
JP7440332B2 (ja) * 2020-04-21 2024-02-28 株式会社日立製作所 事象解析システムおよび事象解析方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002099918A (ja) * 2000-09-12 2002-04-05 Internatl Business Mach Corp <Ibm> 画像処理方法、画像処理システムおよび記録媒体
JP2003032544A (ja) * 2001-07-13 2003-01-31 Nippon Hoso Kyokai <Nhk> シーン内容情報付加装置及びシーン内容情報付加方法
JP2004005462A (ja) * 2002-03-07 2004-01-08 Samsung Electronics Co Ltd 映像信号から対象物を追跡する方法及びその装置
JP2004046647A (ja) * 2002-07-12 2004-02-12 Univ Waseda 動画像データに基づく移動物体追跡方法及び装置
JP2004240848A (ja) * 2003-02-07 2004-08-26 Nippon Telegr & Teleph Corp <Ntt> データ分析装置、データ分析方法及びデータ分析プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002099918A (ja) * 2000-09-12 2002-04-05 Internatl Business Mach Corp <Ibm> 画像処理方法、画像処理システムおよび記録媒体
JP2003032544A (ja) * 2001-07-13 2003-01-31 Nippon Hoso Kyokai <Nhk> シーン内容情報付加装置及びシーン内容情報付加方法
JP2004005462A (ja) * 2002-03-07 2004-01-08 Samsung Electronics Co Ltd 映像信号から対象物を追跡する方法及びその装置
JP2004046647A (ja) * 2002-07-12 2004-02-12 Univ Waseda 動画像データに基づく移動物体追跡方法及び装置
JP2004240848A (ja) * 2003-02-07 2004-08-26 Nippon Telegr & Teleph Corp <Ntt> データ分析装置、データ分析方法及びデータ分析プログラム

Also Published As

Publication number Publication date
JP2006285878A (ja) 2006-10-19

Similar Documents

Publication Publication Date Title
JP4644022B2 (ja) 映像解析装置および映像解析プログラム
JP6525453B2 (ja) オブジェクト位置推定システム、及びそのプログラム
CN109076198B (zh) 基于视频的对象跟踪遮挡检测***、方法和设备
US10965886B2 (en) System and method of generating a composite frame
US8619135B2 (en) Detection of abnormal behaviour in video objects
JP6148480B2 (ja) 画像処理装置、画像処理方法
Ren et al. Tracking the soccer ball using multiple fixed cameras
WO2016114134A1 (ja) 移動状況推定装置、移動状況推定方法およびプログラム記録媒体
KR20080021804A (ko) 오버헤드 비디오 스트림에 의한 목표물 탐지 및 추적
JP6185517B2 (ja) 画像監視装置
Khan Congestion detection in pedestrian crowds using oscillation in motion trajectories
Ferryman et al. Performance evaluation of crowd image analysis using the PETS2009 dataset
KR20080020595A (ko) 보안 어플리케이션을 위한 사람을 감지하고 추적하는시스템
Ren et al. Multi-camera video surveillance for real-time analysis and reconstruction of soccer games
JP6850751B2 (ja) 物体追跡装置、物体追跡方法、及びコンピュータプログラム
Srivastava et al. Crowd flow estimation using multiple visual features for scenes with changing crowd densities
David An intellectual individual performance abnormality discovery system in civic surroundings
JP2017068598A (ja) 群衆解析装置
TWI493510B (zh) 跌倒偵測方法
JP2009163639A (ja) オブジェクト軌道識別装置、オブジェクト軌道識別方法、及びオブジェクト軌道識別プログラム
Heydari et al. An MLP-based player detection and tracking in broadcast soccer video
CN104123569B (zh) 一种基于有监督学习的视频人数信息统计方法
JP4533037B2 (ja) オフサイドライン検出装置及びそのプログラム
Li et al. Evaluating the performance of systems for tracking football players and ball
Kurilkin et al. A comparison of methods to detect people flow using video processing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100805

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100810

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101109

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101203

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees