JP7451130B2 - 制御装置、制御システム、制御方法、及びプログラム - Google Patents

制御装置、制御システム、制御方法、及びプログラム Download PDF

Info

Publication number
JP7451130B2
JP7451130B2 JP2019184555A JP2019184555A JP7451130B2 JP 7451130 B2 JP7451130 B2 JP 7451130B2 JP 2019184555 A JP2019184555 A JP 2019184555A JP 2019184555 A JP2019184555 A JP 2019184555A JP 7451130 B2 JP7451130 B2 JP 7451130B2
Authority
JP
Japan
Prior art keywords
subject
human body
unit
ball
estimating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019184555A
Other languages
English (en)
Other versions
JP2021061529A (ja
Inventor
卓矢 豊田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019184555A priority Critical patent/JP7451130B2/ja
Priority to US17/063,406 priority patent/US11557122B2/en
Publication of JP2021061529A publication Critical patent/JP2021061529A/ja
Application granted granted Critical
Publication of JP7451130B2 publication Critical patent/JP7451130B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/251Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/695Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30232Surveillance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30241Trajectory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30244Camera pose

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)
  • Details Of Cameras Including Film Mechanisms (AREA)
  • Lens Barrels (AREA)

Description

本開示は、制御装置、制御システム、制御方法、及びプログラムに関する。
近年では、リモートで制御可能な撮像装置を利用して、スポーツのシーン等のような動きのあるシーンを自動で撮像可能とするシステムのニーズが高まっている。自動撮像を実現する技術の一例として、被写体の動きに応じて、撮像装置のパン・チルト・ズーム制御を行うことで当該撮像装置の画角を調整し、被写体を画角内に収める技術が提案されている。例えば、特許文献1には、被写体の動きの量を算出し、当該動きの量の算出結果に応じて撮像装置のズーム制御に係る拡大率を制御することで、被写体が画角外に移動した場合においても、迅速に当該被写体を画角内に捉え直す技術が提案されている。
特開2018-19410号公報
一方で、被写体の動きの検出結果に応じて撮像装置の画角を制御することで、被写体の動きの検出から画角の制御までに遅延が生じ、被写体を画角内に収めることが困難となる場合がある。特に、スポーツシーンのように被写体の動きがその時々で変化するような状況下においては、上述した遅延の影響がより顕著に顕在化する場合がある。
本発明の目的は、被写体の動きが変化するような状況下においても、より好適な態様で被写体を画角内に収めることを可能とすることである。
本発明の制御装置は、撮像装置により撮像した画像から、注目対象として設定された第1の被写体である物体と、当該第1の被写体とは異なり、かつ複数の部位からなる第2の被写体と、を抽出する抽出手段と、前記抽出手段により抽出された前記第1の被写体と前記第2の被写体とを対応付ける対応付け手段と、抽出された前記第2の被写体の骨格を推定する第1の推定手段と、前記第1の推定手段による前記第2の被写体の骨格の推定結果に基づき、当該第2の被写体の状態を推定し、前記第2の被写体の状態の推定結果に基づき、前記対応付け手段により当該第2の被写体に対応付けられた前記第1の被写体の以降の動きを推定する第2の推定手段と、前記第2の推定手段による前記第1の被写体の以降の動きの推定結果に基づき、前記撮像装置の画角を制御する制御手段と、を備える。
本発明によれば、被写体の動きが変化するような状況下においても、より好適な態様で被写体を画角内に収めることが可能となる。
撮像システムの機能構成の一例を示したブロック図である。 人体とボールとの対応付けの一例について示した図である。 人体とボールとの対応付けの一例について示した図である。 骨格情報に基づく人体及びボールの状況の判定方法の一例を示した図である。 骨格情報に基づく人体及びボールの状況の判定方法の一例を示した図である。 骨格情報に基づく人体及びボールの状況の判定方法の一例を示した図である。 骨格情報に基づく人体及びボールの状況の判定方法の一例を示した図である。 画角制御の一例について示した図である。 画角制御の一例について示した図である。 画角制御の一例について示した図である。 情報処理装置のハードウェア構成の一例を示した図である。 撮像システムの処理の一例を示したフローチャートである。 撮像システムの機能構成の一例を示したブロック図である。 画像の撮像に係る拡大率を決定する処理の一例について示した図である。 画像の撮像に係る拡大率を決定する処理の一例について示した図である。 撮像システムの処理の一例を示したフローチャートである。 撮像システムの機能構成の一例を示したブロック図である。 画像の撮像に係る拡大率を決定する処理の一例について示した図である。 画像の撮像に係る拡大率を決定する処理の一例について示した図である。 撮像システムの処理の一例を示したフローチャートである。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
<第1の実施形態>
以下に、本発明の第1の実施形態に係る撮像システムについて説明する。本実施形態に係る撮像システムは、主に、スポーツシーンのように選手や競技に使われるボール等のような被写体の動きが逐次変化するような状況下においても、より好適な態様で被写体を画角内に収めることを可能とすることを目的としている。
具体的には、スポーツシーンにおけるボール等は、人がどのように動作するかに応じて次の動き方が大きく変化する。このようなシーンにおいては、サッカーにおいてシュートが行われた場合のように、急に動作が速くなるとボールが画角から外れてしまう場合がある。また、スポーツシーンにおけるボールは、ボール自身が自律的に動き回る訳ではなく、ボールに付随する人体(例えば、ボールを操る選手等)の動作に応じて動作が変化する場合がある。
本実施形態に係る撮像システムは、上記のような特性を鑑み、人体の骨格情報を利用して当該人体の動きを推定し、当該推定結果を撮像装置の画角の制御に利用することで、ボール等の注目する被写体が画角内に収められるように当該画角を制御する。
なお、以降では、本実施形態に係る撮像システムの特徴をよりわかりやすくするために、サッカーにおいてボールの動きに注目して撮像装置の画角を制御する場合を想定して、撮像システムの特徴について詳しく説明する。また、本実施形態に係る撮像システムや、後述する第2及び第3の実施形態に係る撮像システムのうち、特に画角の制御に係る部分が「制御システム」の一例に相当する。
(機能構成)
図1を参照して、本実施形態に係る撮像システムA1000の機能構成の一例について説明する。撮像システムA1000は、サッカーの競技場内が撮像された画像から人体とボールとを認識し、ボールが撮像装置の画角内に収まるように画角調整を行ったうえで、撮像結果に応じた画像をディスプレイ等の出力装置に出力させるシステムである。
撮像システムA1000は、撮像装置A1001と、画角制御装置A1002と、出力装置A1014とを含む。撮像装置A1001と画角制御装置A1002とは、例えば、ビデオインタフェースを介して接続されている。これにより、撮像装置A1001による撮像結果に応じた画像データを画角制御装置A1002に転送することが可能となる。なお、撮像装置A1001による撮像結果に応じた画像データを画角制御装置A1002に転送することが可能であれば、撮像装置A1001と画角制御装置A1002とを接続するインタフェースは特に限定されない。
撮像装置A1001は、周囲の環境を撮像して、撮像結果に応じた静止画像や動画像等のような画像のデータ(以降では、「画像データ」とも称する)を生成する。なお、以降では、単に「画像」と記載した場合には、特に説明がない限りは、静止画像と動画像とのいずれも含み得るものとする。撮像装置A1001は、撮像結果に応じた画像データを画角制御装置A1002に出力する。なお、撮像装置A1001が、撮像結果に応じた画像データをリアルタイムで画角制御装置A1002に逐次出力することで、後述する画角制御装置A1002による画角制御に係る精度をより向上させることが可能となる。
出力装置A1014は、例えば、ディスプレイ等のような表示装置により実現され、所望の情報を画面等に表示することで当該情報をユーザに提示する。
画角制御装置A1002は、撮像装置A1001から撮像結果に応じた画像データを取得し、当該画像データが示す画像中から、注目対象として設定された被写体(ボール)と、当該被写体以外の他の被写体である人体とを抽出する。画角制御装置A1002は、画像から抽出された人体の骨格情報を推定することで当該人体の動きを推定し、当該人体の推定結果を利用することで、注目対象であるボールの以降の動きを推定する。画角制御装置A1002は、ボールの動きの推定結果に基づき、撮像装置A1001の画角を制御する。なお、本実施形態においては、注目対象であるボールが「第1の被写体」の一例に相当し、骨格情報に基づく動きの推定の対象となる人体が「第2の被写体」の一例に相当する。
画角の制御としては、例えば、画像が撮像される方向を左右及び上下に調整することで画角の向き(撮像方向)を制御するパン制御及びチルト制御と、画像の撮像に係る拡大率を制御するズーム制御とが挙げられる。なお、上述した画角の制御を実現することが可能であれば、その方法は特に限定されない。
例えば、画角制御装置A1002は、画像処理等のデジタル処理により画角を制御してもよい。この場合には、画角制御装置A1002は、撮像装置A1001による撮像結果に応じた画像の一部を切り出し、必要に応じてデジタルズーム処理により切り出された当該画像の一部(以下、「部分画像」とも称する)を拡大してもよい。
また、他の一例として、画角制御装置A1002は、撮像装置A1001の向きの制御(パン制御及びチルト制御)や、当該撮像装置A1001による画像の撮像に係る拡大率の制御(ズーム制御)を行うことで、光学的に画角を制御してもよい。
そして、画角制御装置A1002は、画角が制御された後の画像を出力装置A1014に表示させる。
ここで、画角制御装置A1002の機能構成について以下により詳しく説明する。画角制御装置A1002は、映像取得部A1003と、人体抽出部A1004と、注目対象抽出部A1005と、対応付け部A1006と、物体情報記録部A1007とを含む。また、画角制御装置A1002は、移動方向推定部A1008と、骨格情報推定部A1009と、状況判定部A1010と、画角判定部A1011と、画角制御部A1012と、出力制御部A1013とを含む。
映像取得部A1003は、撮像装置A1001から撮像結果に応じた画像データを取得する。映像取得部A1003は、取得した画像データを、人体抽出部A1004、注目対象抽出部A1005、及び画角制御部A1012のそれぞれに出力する。
人体抽出部A1004は、映像取得部A1003から画像データを取得し、当該画像データが示す画像に対して画像処理を施すことで、当該画像中に撮像された人体を抽出する。なお、画像中に撮像された人体を抽出することが可能であれば、その方法は特に限定されない。具体的な一例として、テンプレートマッチング法や、意味的領域分割法等に基づき、画像中に撮像された人体を抽出することが可能である。なお、テンプレートマッチング法や意味的領域分割法については公知の技術のため詳細な説明は省略する。
人体抽出部A1004は、画像中からの人体の抽出結果に応じた情報(例えば、画像中において人体が撮像された領域の位置を示す座標等)を対応付け部A1006に出力する。
注目対象抽出部A1005は、映像取得部A1003から画像データを取得し、当該画像データが示す画像に対して画像処理を施すことで、当該画像中に撮像された被写体のうち注目対象として設定された被写体を抽出する。本実施形態では、ボールが注目対象として設定されており、注目対象抽出部A1005は、画像中からボールを抽出するものとする。なお、画像中に撮像された所望の被写体(例えば、ボール)を抽出することが可能であれば、その方法は特に限定されない。具体的な一例として、テンプレートマッチング法や、意味的領域分割法等に基づき、画像中に撮像された所望の被写体を抽出することが可能である。
注目対象抽出部A1005は、画像中からのボールの抽出結果に応じた情報(例えば、画像中においてボールが撮像された領域の位置を示す座標等)を対応付け部A1006に出力する。
対応付け部A1006は、人体抽出部A1004から、画像中からの人体の抽出結果に応じた情報を取得する。また、対応付け部A1006は、上記画像中からのボール(すなわち、注目対象として設定された被写体)の抽出結果に応じた情報を取得する。対応付け部A1006は、画像中から抽出されたボールと、当該画像中から抽出された人体と、の対応付けを行う。
ここで、図2及び図3を参照して、画像中からの人体及びボールの抽出結果に基づき、人体とボールとを対応付ける方法の一例について説明する。
まず、図2について説明する。D001は、画角制御装置A1002が撮像装置A1001から取得した画像データが示す画像、すなわち、撮像装置A1001による撮像結果に応じた画像を示している。また、P000及びP001は、画像D001に撮像されたボール及び人体を示している。また、P002は、ボールP000と人体P001との間の距離を示している。例えば、対応付け部A1006は、距離P002として、人体P001の両脚間における重心位置と、ボールP000の重心位置と、の間の実空間における距離を算出する。
なお、画像中の距離から実空間における距離を算出する方法としては、既知の方法を適用することが可能である。具体的な一例として、画像中における複数の被写体それぞれの座標間の距離と、当該画像の撮像に係る拡大率と、に基づき、実空間における当該複数の被写体間の距離を算出することが可能である。また、この際に、撮像の対象となる領域と、画像を撮像する撮像装置と、の間の位置や姿勢の関係が、複数の被写体間の距離の算出に考慮されてもよい。具体的には、撮像対象となる領域の各位置と、撮像装置と、の間の距離が異なる場合がある。このような場合には、複数の被写体それぞれが当該領域中のどの位置に存在するかに応じて、各被写体と撮像装置との間の距離を推定し、当該距離の推定結果を鑑みて、当該複数の被写体間の距離を算出することも可能である。
対応付け部A1006は、画像中に人体とボールとのそれぞれが一つずつ存在する場合には、当該人体と当該ボールとの間の距離P002が閾値以下である場合に、当該人体と当該ボールとを対応付ける。なお、本実施形態では、対応付け部A1006は、人体とボールトの間の距離P002が0.3m以下の場合に当該人体と当該ボールトを対応付けるものとするが、必ずしも対応付け部A1006の機能を限定するものではない。すなわち、距離P002の判定に利用される閾値については、撮像システムA1000の適用を想定しているユースケースや環境に応じて適宜変更されてもよい。
続いて、図3について説明する。D101は、画角制御装置A1002が撮像装置A1001から取得した画像データが示す画像、すなわち、撮像装置A1001による撮像結果に応じた画像を示している。また、P100は、画像D001に撮像されたボールを示している。また、P101及びP102のそれぞれは、画像D001に撮像された人体を示している。また、P103は、ボールP100と人体P101との間の距離を示している。同様に、P104は、ボールP100と人体P102との間の距離を示している。なお、距離P103及びP104の算出方法については、図2に示す例における距離P002の算出方法と実質的に同様の方法を適用することが可能であるため、詳細な説明は省略する。
対応付け部A1006は、画像中にボールとの間の距離が閾値以下の人体が複数存在する場合には、例えば、ボールとの距離がより短い人体を当該ボールと対応付けてもよい。
例えば、図3に示す例の場合には、距離P103の方が、距離P104に比べて短い。すなわち、人体P101の方が、人体P102に比べてボールP100のより近くに位置する。そのため、この場合には、対応付け部A1006は、ボールP100に対して人体P101を対応付ける。
そして、対応付け部A1006は、画像中から抽出されたボールと人体との間の対応付けの結果に応じた情報を、物体情報記録部A1007と骨格情報推定部A1009とのそれぞれに出力する。なお、本実施形態では、対応付け部A1006は、ボールと人体との対応付けの結果に応じた情報として、ボールに対応付けられた人体の画像中における座標情報を、物体情報記録部A1007と骨格情報推定部A1009とのそれぞれに出力するものとする。
物体情報記録部A1007は、対応付け部A1006から、ボールに対応付けられた人体の画像中における座標情報を取得して記録する。この際に、物体情報記録部A1007は、取得した当該座標情報を、当該座標情報の導出元となる画像が撮像されたフレームごとに個別に記録してもよい。なお、以降の説明では、ボールに対応付けられた人体の画像中における座標情報を、単に「人体の座標情報」とも称する。
また、物体情報記録部A1007は、互いに異なる複数のフレームそれぞれについて取得された人体の座標情報を、移動方向推定部A1008に出力する。なお、本実施形態では、物体情報記録部A1007は、最新のフレーム(例えば、現在のフレーム)と、当該フレームの1つ前のフレームと、のそれぞれに対応する人体の座標情報を、移動方向推定部A1008に出力するものとする。
移動方向推定部A1008は、互いに異なる複数のフレームそれぞれについて取得された人体の座標情報を物体情報記録部A1007から取得する。移動方向推定部A1008は、複数のフレームそれぞれについて取得した人体の座標情報に基づき当該人体の移動ベクトルを算出し、当該移動ベクトルの算出結果に基づき、当該複数のフレーム間における当該人体の移動方向を推定する。これにより、例えば、最新のフレームと、当該フレームの1つ前のフレームと、について上記人体の移動ベクトルを算出することで、当該移動ベクトルに基づき、最新のフレームにおける当該人体の移動方向を推定することが可能となる。
そして、移動方向推定部A1008は、人体の移動方向の推定結果に応じた情報を画角制御部A1012に出力する。
骨格情報推定部A1009は、対応付け部A1006から人体の座標情報を取得し、当該人体の座標情報に基づき人体の骨格情報を推定する。
近年では、画像中に撮像された人体の骨格情報を推定する技術として、DeepLearningに代表される機械学習を応用した骨格推定技術が各種提案されている。このような骨格推定技術の中には、OpenPoseやDeepPose等のOSS(Open Source Software)が提供されているものもあり、骨格推定を容易に行うことが可能となってきている。なお、本実施形態では、人体の骨格情報の推定に、機械学習を応用した骨格推定技術を適用するものとする。ただし、人体の骨格情報を推定することが可能であれば、その方法は特に限定されない。
骨格情報推定部A1009は、撮像装置A1001から取得された画像データが示す画像から、人体の座標情報が示す領域の部分画像を切り出し、当該部分画像に対して骨格推定技術を適用することで人体の骨格情報を推定する。そして、骨格情報推定部A1009は、人体の骨格情報の推定結果を状況判定部A1010に出力する。
状況判定部A1010は、人体の骨格情報の推定結果を状況判定部A1010から取得し、当該人体の骨格情報の推定結果に基づき、人体及びボールの状況を判定する。具体的には、状況判定部A1010は、例えば、人体の骨格情報に基づき人体の重心位置の高さ、姿勢の傾き、特定部位の角度等の情報を解析し、解析結果に基づき人体及びボールの状況を判定してもよい。そこで、図4~図7を参照して、人体の骨格情報に基づき人体及びボールの状況を判定する方法の一例について以下に説明する。
まず、図4について説明する。図4は、人体が撮像された画像に基づく人体の骨格情報の推定結果と、当該推定結果に基づき得られる情報の一例と、を示している。D201は、人体の骨格情報の推定に使用された画像を示している。P200及びP201は、画像D201に撮像されたボール及び人体を示している。P202は、人体P201の重心位置を示している。P203、P204、P205、P206、P207、及びP208は、人体P201の右肘、左肘、右膝、左膝、首、及び腰の関節を示している。P209は、人体P201の両脚がなす角度を示している。P210は、人体P210が振り上げる脚の角度を示している。
次いで、図5について説明する。図5は、人体が走行していることを判定する方法の一例について説明するための説明図である。D301は、人体の骨格情報の推定に使用された画像を示している。P300は、ボールを示している。P301は、正立している状態の人体を示している。これに対して、P302は、走行している状態の人体を示している。P306及びP307は、人体P302の首及び腰の関節を示している。P307は、首関節P303と腰関節P304とを通る直線の鉛直方向に対する傾きを示している。つまり傾きP307は、人体P302の姿勢の傾きを示している。P304は、正立している状態の人体P301の重心位置を示している。これに対して、P305は、走行している状態の人体P302の重心位置を示している。
人体は、走行している状態では正立している状態に比べて、重心位置がより低くなり、姿勢がより傾く傾向にある。そのため、人体が正立している状態に比べて、当該人体の重心位置がより低く、姿勢がより傾いている場合には、当該人体が走行している状態であると判定することが可能である。
次いで、図6について説明する。図6は、人体がボールを蹴ることを判定する方法の一例について説明するための説明図である。D401は、人体の骨格情報の推定に使用された画像を示している。P400及びP401は、ボールを示している。P402は、正立している状態の人体を示している。また、P403は、走行している状態の人体を示している。これに対して、P404は、ボールを蹴る状態の人体を示している。P405は、正立している状態の人体P402の脚の角度を示している。また、P406は、走行している状態の人体P403の脚の角度を示している。これに対して、P407は、ボールを蹴る状態の人体P404の脚の角度を示している。
脚の角度P405、P406、及びP407を比較するとわかるように、人体がボールを蹴る際の脚の角度P407は、正立している状態の人体の脚の角度P405や、走行している状態の人体の脚の角度P406に比べてより小さくなる傾向にある。そのため、人体が正立している状態や走行している状態に比べて脚の角度が小さい場合には、当該人体がボールを蹴ると判定することが可能となる。
次いで、図7について説明する。図7は、人体がボールを蹴る強さを判定する方法の一例について説明するための説明図である。D501は、人体の骨格情報の推定に使用された画像を示している。P500及びP501は、ボールを示している。P502は、ボールを弱い力で蹴る状態の人体を示している。これに対して、P503は、ボールを強い力で蹴る状態の人体を示している。P504は、ボールを弱い力で蹴る状態の人体P502の両脚がなす角度を示している。これに対して、P505は、ボールを強い力で蹴る状態の人体P503の両脚がなす角度を示している。P506は、ボールを弱い力で蹴る状態の人体P502の重心位置を示している。これに対してP507は、ボールを強い力で蹴る状態の人体P503の重心位置を示している。
重心位置P506及びP507間の比較と、角度P504及びP505間の比較と、からわかるように、人体がボールを強い力で蹴る場合には、ボールを弱い力で蹴る場合に比べて、重心位置がより低くなり、両脚がなす角度がより大きくなる傾向にある。そのため、人体がボールを弱い力で蹴る場合に比べて、当該人体の重心位置がより低く、両脚がなす角度がより大きい場合には、当該人体がボールを強い力で蹴ると判定することが可能となる。また、このような判定をサッカーにおける人体の状態の判定に適用することで、人体がショートパスを行おうとしているのか、シュートまたはロングパスを行おうとしているのか、を判定することも可能となる。
また、人体がボールを弱い力で蹴る場合と、人体がボールを強い力で蹴る場合と、を判別することで、その後のボールの移動量を推定することも可能となる。具体的には、人体がボールを強い力で蹴る場合には、ボールの移動量がより多くなり、人体がボールを弱い力で蹴る場合には、ボールの移動量がより少なくなる。このような特性を利用し、例えば、状況判定部A1010は、ボールの移動量を、「少ない」、「多い」、「かなり多い」の三段階で判定することも可能である。
以上のようにして、状況判定部A1010は、人体の骨格情報の推定結果に基づき、人体及びボールの状況を判定し、当該判定の結果に応じた情報を画角判定部A1011に出力する。具体的な一例として、状況判定部A1010は、ボールの移動量の推定結果を、人体及びボールの状況判定の結果に応じた情報として、画角判定部A1011に出力する。
画角判定部A1011は、状況判定部A1010から、人体及びボールの状況判定の結果に応じた情報を取得し、当該情報に基づき画像の撮像に係る画角の制御方法や制御量を判定する。具体的な一例として、画角判定部A1011は、ボールの移動量の推定結果に基づき、画像の撮像に係る拡大率(すなわち、ズーム制御に適用する拡大率)を決定してもよい。この場合には、画角判定部A1011は、例えば、ボールの移動量の推定結果を所定の条件式に当てはめることで拡大率を算出してもよい。また、他の一例として、画角判定部A1011は、ボールの移動量の推定結果に応じて、あらかじめ設定された拡大率の候補の中から適用する候補を選択してもよい。
そして、画角判定部A1011は、画角の制御方法や制御量の判定結果に応じた情報を画角制御部A1012に出力する。具体的な一例として、画角判定部A1011は、ボールの移動量の推定結果に基づき決定した画像の撮像に係る拡大率に関する情報を画角制御部A1012に出力する。
画角制御部A1012は、映像取得部A1003から撮像装置A1001による撮像結果に応じた画像データを取得する。画角制御部A1012は、移動方向推定部A1008から人体の移動方向の推定結果に応じた情報を取得する。また、画角制御部A1012は、画角判定部A1011から画角の制御方法や制御量の判定結果に応じた情報(例えば、画像の撮像に係る拡大率に関する情報等)を取得する。画角制御部A1012は、人体の移動方向の推定結果に応じた情報と、画角の制御方法や制御量の判定結果に応じた情報と、に基づき、画角の制御を行う。
具体的な一例として、画角制御部A1012は、画角判定部A1011から画像の撮像に係る拡大率に関する情報を取得した場合には、当該拡大率に応じてズーム制御を行ってもよい。
また、画角制御部A1012は、移動方向推定部A1008から取得した人体の移動方向の推定結果に応じた情報に基づき、パン制御やチルト制御等のような画角の向き(撮像方向)の制御を行ってもよい。なお、画角制御部A1012は、移動方向推定部A1008が人体の移動を検出していない場合には、画角の向きの制御を行わなくてもよいし、従前の検出時に移動方向推定部A1008から取得した情報に応じた画角の向きの制御を継続してもよい。また、画角制御部A1012は、移動方向推定部A1008から人体の移動方向の推定結果に応じた情報が出力されない場合には、従前に移動方向推定部A1008から取得した当該情報に応じた画角の向きの制御を継続してもよい。
ここで、図8~図10を参照して画角制御の一例についてより詳しく説明する。
まず、図8について説明する。D601は、撮像装置A1001による撮像結果に応じた画像を示している。P600及びP601は、ボール及び人体を示している。ここで、状況判定部A1010により、人体P601がボールを強い力で蹴ると判定したものとする。この場合には、画角制御部A1012は、ボールP600が画角から外れないようにズーム制御を行う。
例えば、図9は、人体P601がボールを強い力で蹴ると判定された場合における、図8に示す画像D601に対するズーム制御の適用結果の一例を示している。D701は、図8に示す画像D601に対してズーム制御が適用された後の画像を示している。P700は、ボールを示しており、図8に示すボールP600に相当する。P701~P704は、人体を示している。特に、人体P701は、図8に示す人体P601に相当する。
図9に示す例では、人体がボールを強い力で蹴ると判定されたため、図8に示す画像D601に比べて、より広い領域が画角内に収まるようにズーム制御(ズームアウト制御)が行われている。
また、図10は、図9に示す画像D701に対する、移動方向推定部A1008による人体の移動方向の推定結果に基づく画角の向きの制御(例えば、パン制御及びチルト制御)の適用結果の一例を示している。D801は、画角の向きの制御が適用される前の画像を示しており、図9に示す画像D701に相当する。また、D802は、画像D801に対して画角の向きの制御が適用された後の画像を示している。P800は、ボールを示しており、図9に示すボールP700に相当する。P801~P804は、人体を示しており、図9に示す人体P701~P704に相当する。
図10に示す例では、人体の移動方向の推定結果に基づきボールP800が図面の右上方向に向けて移動することが推定され、当該ボールP800の移動方向にあわせて画角の向きが図面の右上方向に向けて移動するように制御されている。これにより、ボールP800の移動に追随するように画角の向きが制御され、ボールP800を画角内に収め続けることが可能となる。
以上のようにして、画角制御部A1012は、画角の制御を行い、画角が制御された後の画像を示す画像データを、出力制御部A1013に出力する。
なお、画角制御部A1012は、デジタル処理により画角の制御を行う場合には、映像取得部A1003から取得した画像データが示す画像から、制御後の画角に対応する部分画像を切り出し、当該部分画像を示す画像データを出力制御部A1013に出力する。
一方で、前述したように、画角制御部A1012は、撮像装置A1001の向きの制御(パン制御及びチルト制御)や、当該撮像装置A1001による画像の撮像に係る拡大率の制御(ズーム制御)を行うことで、画角を制御してもよい。この場合には、画角制御部A1012は、画角が制御された後における撮像装置A1001による撮像結果に応じた画像を示す画像データを映像取得部A1003から取得し、当該画像データを出力制御部A1013に出力すればよい。
出力制御部A1013は、画角制御部A1012から画像データを取得し、当該画像データが示す画像を出力装置A1014に出力させる。
出力装置A1014は、出力制御部A1013からの指示に基づき上記画像データに基づく画像を画面に表示させることで、当該画像をユーザに提示する。
なお、上記では、人体の骨格情報の推定結果に基づき、ボールの移動量を推定する場合の一例について説明したが、必ずしも人体の骨格情報に基づく人体及びボールの状況判定の対象やその方法を限定するものではない。すなわち、人体の骨格情報に基づき推定や判定が可能な事象であれば、当該事象の推定や判定の結果が画角の制御に利用されてもよい。
具体的な一例として、人体がボールを蹴ると判定された場合には、当該人体の脚が振り上げられた方向に基づき、ボールが蹴られる方向(すなわち、その後にボールが移動する方向)を推定することも可能となる。このような推定結果を利用することで、人体によりボールが蹴られることで当該ボールの動きが急激に変化するような状況下においても、当該ボールの動きにより正確に追随するように画角の向きを制御することも可能となる。
(ハードウェア構成)
図11を参照して、情報処理装置200のハードウェア構成の一例について説明する。本実施形態では、画角制御装置A1002は、情報処理装置200と同様の情報処理装置によって実現される。情報処理装置200は、CPU211、ROM212、RAM213、補助記憶装置214、表示部215、操作部216、通信I/F217、及びバス218を有する。
CPU211は、ROM212やRAM213に格納されているコンピュータプログラムやデータを用いて情報処理装置200の全体を制御する。これにより、CPU211は、図1に示す画角制御装置A1002の各機能を実現する。なお、情報処理装置200がCPU211とは異なる1又は複数の専用のハードウェアを有し、CPU211による処理の少なくとも一部を専用のハードウェアが実行してもよい。専用のハードウェアの例としては、ASIC(特定用途向け集積回路)、FPGA(フィールドプログラマブルゲートアレイ)、およびDSP(デジタルシグナルプロセッサ)などがある。ROM212は、変更を必要としないプログラム等を格納する。RAM213は、補助記憶装置214から供給されるプログラムやデータ、及び通信I/F217を介して外部から供給されるデータ等を一時的に記憶する。補助記憶装置214は、例えばハードディスクドライブ等で構成され、画像データなどの種々のデータを記憶する。
表示部215は、例えば液晶ディスプレイやLED等で構成され、ユーザが情報処理装置200を操作するためのGUI(Graphical User Interface)などを表示する。操作部216は、例えばキーボードやマウス、ジョイスティック、タッチパネル等で構成され、ユーザによる操作を受けて各種の指示をCPU211に入力する。
通信I/F217は、情報処理装置200の外部の装置との通信に用いられる。例えば、情報処理装置200が外部の装置と有線で接続される場合には、通信用のケーブルが通信I/F217に接続される。情報処理装置200が外部の装置と無線通信する機能を有する場合には、通信I/F217はアンテナを備える。バス218は、情報処理装置200の各部をつないで情報を伝達する。
図11では、表示部215と操作部216が情報処理装置200の内部に存在する場合の一例について示しているが、表示部215と操作部216とのうち少なくとも一方が情報処理装置200の外部に別の装置として存在していてもよい。この場合には、CPU211が、表示部215を制御する表示制御部、及び操作部216を制御する操作制御部として動作してもよい。
画角制御装置A1002のCPU211が、画角制御装置A1002のROM212または補助記憶装置214に記憶されたプログラムにしたがって処理を実行することで、図1に示す機能及び図12に示す処理が実現される。これは、詳細を後述する、第2の実施形態における図13に示す機能及び図16に示す処理や、第3の実施形態における図17に示す機能及び図20に示す処理についても同様である。
(処理)
図12を参照して、撮像システムA1000の処理の一例について説明する。撮像システムA1000は、例えば、所定の入力装置を介して受け付けたユーザからの指示に基づき、図12に示す一連の処理の実行を開始する。
S001において、映像取得部A1003は、撮像装置A1001から撮像結果に応じた画像データを取得する。
S002において、人体抽出部A1004は、映像取得部A1003により取得された画像データが示す画像に対して画像処理を施すことで、当該画像中に撮像された人体を抽出する。
S003において、注目対象抽出部A1005は、映像取得部A1003により取得された画像データが示す画像に対して画像処理を施すことで、当該画像中に撮像されたボール(注目対象として設定された被写体)を抽出する。
S004において、対応付け部A1006は、S002において画像中から抽出されたボールと、S003において当該画像中から抽出された人体と、の対応付けを行う。具体的な一例として、対応付け部A1006は、ボールとの距離が閾値以下の人体が抽出されている場合に、当該ボールに対して当該人体を対応付ける。
S005において、対応付け部A1006は、ボールに対して人体を対応付けたか否かを判定する。対応付け部A1006は、S005においてボールに対して人体を対応付けていないと判定した場合には、処理をS012に進める。これに対して、対応付け部A1006は、S005においてボールに対して人体を対応付けたと判定した場合には、ボールと人体との対応付けの結果に応じた情報を、物体情報記録部A1007と骨格情報推定部A1009とのそれぞれに出力する。なお、以降の説明では、ボールと人体との対応付けの結果に応じた情報を、便宜上「対応付け情報」とも称する。そして、対応付け部A1006は、処理をS006に進める。
S006において、物体情報記録部A1007は、対応付け部A1006から対応付け情報をフレームごとに取得し、当該対応付け情報を記録する。また、物体情報記録部A1007は、最新のフレームと、当該フレームの1つの前フレームと、のそれぞれについて対応付け情報を記録している場合には、これらのフレームに対応する対応付け情報を移動方向推定部A1008に出力する。一方で、物体情報記録部A1007は、最新のフレームの1つの前フレームに対応する対応付け情報が記録されていない場合には、当該最新のフレームに対応する対応付け情報を移動方向推定部A1008に出力する。そして、物体情報記録部A1007は、処理をS007に進める。
S007において、移動方向推定部A1008は、物体情報記録部A1007から、最新のフレームと、当該フレームの1つの前フレームと、のそれぞれについて対応付け情報を取得する。移動方向推定部A1008は、これらのフレームについて取得した対応付け情報に基づき、人体及びボールの移動方向を推定し、当該推定結果に応じた情報を画角制御部A1012に出力する。
S008において、骨格情報推定部A1009は、対応付け部A1006から対応付け情報をフレームごとに取得し、当該対応付け情報に基づき、人体の骨格情報の推定を行う。骨格情報推定部A1009は、人体の骨格情報の推定結果を状況判定部A1010に出力する。
S009において、状況判定部A1010は、人体の骨格情報の推定結果を骨格情報推定部A1009から取得し、当該人体の骨格情報の推定結果に基づき、人体の状況(例えば、動作状況)を判定する。また、状況判定部A1010は、人体の状況の判定結果に基づきボールの状況(例えば、動作状況)を判定する。状況判定部A1010は、ボールの状況の判定結果に基づき、当該ボールの移動量の推定を行う。状況判定部A1010は、人体やボールの状況の判定結果に応じた情報(例えば、ボールの移動量の推定結果に応じた情報)を、画角判定部A1011に出力し、処理をS010に進める。
S010において、画角判定部A1011は、状況判定部A1010から、人体やボールの状況の判定結果に応じた情報(例えば、ボールの移動量の推定結果に応じた情報)を取得する。画角判定部A1011は、人体やボールの状況の判定結果に応じた情報に基づきボールの移動量の推定結果(以降では、「ボールの移動推定量」とも称する)が閾値よりも大きいか否かを判定する。
画角判定部A1011は、S010においてボールの移動推定量が閾値よりも大きいと判定した場合には、当該ボールの移動推定量に応じて画像の撮像に係る拡大率を決定し、当該拡大率に関する情報を画角制御部A1012に出力する。そして、画角判定部A1011は、処理をS011に進める。
これに対して、画角判定部A1011は、S010においてボールの移動推定量が閾値以下と判定した場合には、処理をS012に進める。この場合には、S011の処理がスキップされる。
S011において、画角制御部A1012は、画角判定部A1011から画像の撮像に係る拡大率に関する情報を取得し、当該拡大率に応じてズーム制御を行う。
S012において、画角制御部A1012は、移動方向推定部A1008から人体及びボールの移動方向の推定結果に応じた情報を取得する。画角制御部A1012は、取得した当該情報に基づき、パン制御やチルト制御等のような画角の向きの制御を行う。一方で、画角制御部A1012は、移動方向推定部A1008から上記情報が出力されない場合(例えば、移動方向推定部A1008が人体の移動を検出していない場合)には、前回と同様の方向に画角の向きの制御を行ってもよい。以上のようにして、画角制御部A1012は、画角の制御を行い、画角が制御された後の画像を示す画像データを、出力制御部A1013に出力する。
S013において、出力制御部A1013は、画角制御部A1012から画像データを取得し、当該画像データが示す画像を出力装置A1014に出力させる。出力装置A1014は、出力制御部A1013からの指示に基づき上記画像データに基づく画像を画面に表示させることで、当該画像をユーザに提示する。
S014において、画角制御装置A1002は、図12に示す一連の処理の終了が指示されたか否かを判定する。具体的な一例として、画角制御装置A1002は、図1には不図示の入力部(例えば、On/Offスイッチ等)が撮像処理の停止に係る指示をユーザから受け付けたか否かに応じて、図12に示す一連の処理の終了が指示されたか否かを判定してもよい。
画角制御装置A1002は、S014において一連の処理の終了が指示されていないと判定した場合には、処理をS001に進め、改めてS001から図12に示す一連を実行する。
一方で、画角制御装置A1002は、S014において一連の処理の終了が指示されたと判定した場合には、図12に示す一連の処理を終了する。
以上のような制御が適用されることで、ボールの動作や移動速度が急激に変化した場合においても、ボールに対応付けられた人体の動作状況を解析することで、ボールの動作を推定し、当該推定の結果を利用して画角の制御行うことが可能となる。これにより、撮像システムA1000は、ボールの動作や移動速度が急激に変化するような状況下においても、当該ボールを画角から外すことなく撮像を継続することが可能となる。
<第2の実施形態>
以下に、本発明の第2の実施形態に係る撮像システムについて説明する。なお、本実施形態においても、第1の実施形態と同様に、サッカーにおいてボールの動きに注目して撮像装置の画角を制御する場合を想定して、撮像システムの特徴について詳しく説明する。また、本実施形態では、主に第1の実施形態と異なる部分に着目して説明し、第1の実施形態と実質的に同様の部分については詳細な説明は省略する。そのため、特に説明がない部分については、第1の実施形態と同様のハードウェア構成、機能構成、及び処理等を適用することが可能であるものとする。
(機能構成)
図13を参照して、本実施形態に係る撮像システムの機能構成の一例について説明する。なお、以降では、本実施形態に係る撮像システムを、他の実施形態に係る撮像システムと区別するために、「撮像システムB1000」と称する場合がある。同様に、本実施形態に係る画角制御装置を、他の実施形態に係る画角制御装置と区別するために、「画角制御装置B1002」と称する場合がある。
撮像システムB1000は、サッカーの競技場内が撮像された画像から人体とボールとを認識し、ボールが撮像装置の画角内に収まるように画角調整を行ったうえで、撮像結果に応じた画像をディスプレイ等の出力装置に出力させるシステムである。
撮像システムB1000は、撮像装置A1001と、画角制御装置B1002と、出力装置A1014とを含む。撮像装置A1001と画角制御装置B1002とは、例えば、ビデオインタフェースを介して接続されている。これにより、撮像装置A1001による撮像結果に応じた画像データを画角制御装置B1002に転送することが可能となる。なお、撮像装置A1001による撮像結果に応じた画像データを画角制御装置B1002に転送することが可能であれば、撮像装置A1001と画角制御装置B1002とを接続するインタフェースは特に限定されない。
画角制御装置B1002は、撮像装置A1001から撮像結果に応じた画像データを取得し、当該画像データが示す画像中から、注目対象として設定された被写体(ボール)と、当該被写体以外の他の被写体である人体とを抽出する。画角制御装置B1002は、画像から抽出された人体の骨格情報を推定することで当該人体の動きを推定し、当該人体の動きの推定結果を利用することで、注目対象であるボールの以降の動きを推定する。画角制御装置B1002は、ボールの動きの推定結果に基づき、撮像装置A1001の画角を制御する。
画角の制御としては、例えば、画像が撮像される方向を左右及び上下に調整することで画角の向きを制御するパン制御及びチルト制御と、画像の撮像に係る拡大率を制御するズーム制御とが挙げられる。なお、第1の実施形態に係る画角制御装置A1002と同様に、上述した画角の制御を実現することが可能であれば、その方法は特に限定されない。
ここで、画角制御装置B1002の機能構成について以下により詳しく説明する。画角制御装置B1002は、映像取得部A1003と、人体抽出部A1004と、注目対象抽出部A1005と、対応付け部A1006と、物体情報記録部A1007とを含む。また、画角制御装置A1002は、移動方向推定部A1008と、骨格情報推定部B1009と、状況判定部A1010と、画角判定部B1011と、画角制御部A1012と、出力制御部A1013とを含む。
骨格情報推定部B1009は、対応付け部A1006から人体の座標情報を取得し、当該人体の座標情報に基づき人体の骨格情報を推定する。骨格情報の推定方法については、第1の実施形態に係る骨格情報推定部A1009と同様のため詳細な説明は省略する。
骨格情報推定部B1009は、撮像装置A1001から取得された画像データが示す画像から、人体の座標情報が示す領域の部分画像を切り出し、当該部分画像に対して骨格推定技術を適用することで人体の骨格情報を推定する。そして、骨格情報推定部B1009は、人体の骨格情報の推定結果を状況判定部A1010に出力する。この場合には、状況判定部A1010は、当該人体の骨格情報の推定結果に基づき、人体及びボールの状況を判定し、当該判定の結果に応じた情報(例えば、ボールの移動量の推定結果に応じた情報)を画角判定部A1011に出力する。また、骨格情報推定部B1009は、身体の骨格情報の推定を行った旨を画角判定部B1011に出力する。
一方で、骨格情報推定部B1009は、人体の骨格情報の推定を行わなかった場合(例えば、人体の骨格情報の推定が困難な場合)には、その旨を画角判定部B1011に出力する。
画角判定部B1011は、骨格情報推定部B1009が人体の骨格情報の推定を行った場合には、状況判定部A1010から、人体及びボールの状況判定の結果に応じた情報を取得し、当該情報に基づき画像の撮像に係る画角の制御方法や制御量を判定する。具体的な一例として、画角判定部B1011は、状況判定部A1010からボールの移動推定量を取得し、当該ボール移動推定量に基づき、画角の制御方法や制御量を判定してもよい。
一方で、画角判定部B1011は、骨格情報推定部B1009が人体の骨格情報の推定を行わなかった場合には、その旨を示す情報を骨格情報推定部B1009から取得する。この場合には、画角判定部B1011は、人体の骨格情報の推定が可能となる程度に撮像画像中の人体の大きさが確保されるように、画像の撮像に係る拡大率を決定し、当該拡大率に関する情報を画角制御部A1012に出力する。なお、人体の骨格情報の推定を行うために、画像中に人体がどの程度の大きさで撮像されていればよいかについては、例えば、事前の実験等に基づきあらかじめ特定しておけばよい。また、当該特定の結果に応じた情報については、画角判定部B1011が参照可能な記憶領域に記憶させておけばよい。
ここで、図14及び図15を参照して、画角判定部B1011が、人体の骨格情報の推定が可能となる程度に撮像画像中の人体の大きさが確保されるように、画像の撮像に係る拡大率を決定する処理の一例について説明する。
まず、図14について説明する。D901は、人体の骨格情報の推定の対象となる画像を示している。P900は、画像D901に撮像されたボールを示している。P901及びP902は、画像D901に撮像された人体を示しており、人体P901がボールP900に対応付けられている。図14に示す例では、画像D901に撮像された人体P901の大きさが小さいため、人体P901の各部位を識別することが困難であり、骨格情報を推定することが困難となっている。そのため、画角判定部B1011は、画像D901中のP903で示した領域が拡大されることで人体の骨格情報の推定が可能となるように、画像の撮像に係る拡大率を決定する。
次いで、図15について説明する。D1001は、図14に示す画像D901における領域P903を拡大した画像を示している。P1000は、画像D1001に撮像されたボールを示しており、図14に示す画像D901におけるボールP900に対応している。P1001は、画像D1001に撮像された人体を示しており、図14に示す画像D901における人体P901に対応している。図15に示すように、人体P1001が十分な大きさで撮像されることで、人体P1001の各部位を識別することが可能となり、ひいては当該人体P1001の骨格情報を推定することが可能となる。
なお、画像D1001を取得可能とするためのズームイン制御については、画角制御部A1012が、画角判定部B1011から通知された画像の撮像に係る拡大率に関する情報に基づき行う。
以上、第2の実施形態に係る撮像システムB1000の機能構成について、特に、第1の実施形態に係る撮像システムA1000と異なる部分に着目して説明した。なお、上記以外の機能ブロックの動作については、第1の実施形態に係る撮像システムA1000と実質的に同様のため、詳細な説明は省略する。
(処理)
図16を参照して、撮像システムB1000の処理の一例について説明する。撮像システムB1000は、例えば、所定の入力装置を介して受け付けたユーザからの指示に基づき、図16に示す一連の処理の実行を開始する。
S101において、映像取得部A1003は、撮像装置A1001から撮像結果に応じた画像データを取得する。
S102において、人体抽出部A1004は、映像取得部A1003により取得された画像データが示す画像に対して画像処理を施すことで、当該画像中に撮像された人体を抽出する。
S103において、注目対象抽出部A1005は、映像取得部A1003により取得された画像データが示す画像に対して画像処理を施すことで、当該画像中に撮像されたボール(注目対象として設定された被写体)を抽出する。
S104において、対応付け部A1006は、S102において画像中から抽出されたボールと、S103において当該画像中から抽出された人体と、の対応付けを行う。具体的な一例として、対応付け部A1006は、ボールとの距離が閾値以下の人体が抽出されている場合に、当該ボールに対して当該人体を対応付ける。
S105において、対応付け部A1006は、ボールに対して人体を対応付けたか否かを判定する。対応付け部A1006は、S105においてボールに対して人体を対応付けていないと判定した場合には、処理をS114に進める。これに対して、対応付け部A1006は、S105においてボールに対して人体を対応付けたと判定した場合には、ボールと人体との対応付けの結果に応じた対応付け情報を、物体情報記録部A1007と骨格情報推定部B1009とのそれぞれに出力する。そして、対応付け部A1006は、処理をS106に進める。
S106において、物体情報記録部A1007は、対応付け部A1006から対応付け情報をフレームごとに取得し、当該対応付け情報を記録する。また、物体情報記録部A1007は、最新のフレームと、当該フレームの1つの前フレームと、のそれぞれについて対応付け情報を記録している場合には、これらのフレームに対応する対応付け情報を移動方向推定部A1008に出力する。一方で、物体情報記録部A1007は、最新のフレームの1つの前フレームに対応する対応付け情報が記録されていない場合には、当該最新のフレームに対応する対応付け情報を移動方向推定部A1008に出力する。そして、物体情報記録部A1007は、処理をS107に進める。
S107において、移動方向推定部A1008は、物体情報記録部A1007から、最新のフレームと、当該フレームの1つの前フレームと、のそれぞれについて対応付け情報を取得する。移動方向推定部A1008は、これらのフレームについて取得した対応付け情報に基づき、人体及びボールの移動方向を推定し、当該推定結果に応じた情報を画角制御部A1012に出力する。
S108において、骨格情報推定部B1009は、対応付け部A1006から対応付け情報をフレームごとに取得し、当該対応付け情報に基づき、人体の骨格情報の推定を行う。
S109において、骨格情報推定部B1009は、人体の骨格情報を推定できたか否か(推定したか否か)を判定する。骨格情報推定部B1009は、S109において人体の骨格情報を推定できた(推定した)と判定した場合には、人体の骨格情報の推定結果に応じた情報を状況判定部A1010に出力する。また、骨格情報推定部B1009は、身体の骨格情報の推定ができた旨(身体の骨格情報の推定を行った旨)を画角判定部B1011に出力する。そして、骨格情報推定部B1009は、処理をS111に進める。
これに対して、骨格情報推定部B1009は、S109において人体の骨格情報を推定できなかった(推定しなかった)と判定した場合には、身体の骨格情報の推定ができなかった旨(身体の骨格情報の推定を行わなかった旨)を画角判定部B1011に出力する。そして、骨格情報推定部B1009は、処理をS110に進める。
S110において、画角判定部B1011は、人体の骨格情報の推定が可能となる程度に撮像画像中の人体の大きさが確保されるように、画像の撮像に係る拡大率を決定し、当該拡大率に関する情報を画角制御部A1012に出力する。画角制御部A1012は、画角判定部B1011から通知された画像の撮像に係る拡大率に関する情報に基づき、ズームイン制御を行う。そして、画角制御部A1012は、処理をS108に進める。この場合には、S108において、骨格情報推定部B1009は、画角制御部A1012によるズーム制御後の画像に基づき、改めて人体の骨格情報の推定を行うこととなる。
S111において、状況判定部A1010は、人体の骨格情報の推定結果を骨格情報推定部B1009から取得し、当該人体の骨格情報の推定結果に基づき、人体の状況(例えば、動作状況)を判定する。また、状況判定部A1010は、人体の状況の判定結果に基づきボールの状況(例えば、動作状況)を判定する。状況判定部A1010は、ボールの状況の判定結果に基づき、当該ボールの移動量の推定を行う。状況判定部A1010は、人体やボールの状況の判定結果に応じた情報(例えば、ボールの移動量の推定結果に応じた情報)を、画角判定部A1011に出力する。
S112において、画角判定部A1011は、状況判定部A1010から、人体やボールの状況の判定結果に応じた情報(例えば、ボールの移動量の推定結果に応じた情報)を取得する。画角判定部A1011は、人体やボールの状況の判定結果に応じた情報に基づきボールの移動量の推定結果(ボールの移動推定量)が閾値よりも大きいか否かを判定する。
画角判定部A1011は、S112においてボールの移動推定量が閾値よりも大きいと判定した場合には、当該ボールの移動推定量に応じて画像の撮像に係る拡大率を決定し、当該拡大率に関する情報を画角制御部A1012に出力する。具体的な一例として、画角判定部A1011は、ボールの移動推定量が閾値よりも大きい場合には、ズームアウト制御が必要と判定し、ズームアウト制御に係る拡大率を決定したうえで、当該拡大率に関する情報を画角制御部A1012に出力する。そして、画角判定部A1011は、処理をS113に進める。
これに対して、画角判定部A1011は、S112においてボールの移動推定量が閾値以下と判定した場合には、処理をS114に進める。この場合には、S113の処理がスキップされる。
S113において、画角制御部A1012は、画角判定部A1011から画像の撮像に係る拡大率に関する情報を取得し、当該拡大率に応じてズーム制御を行う。
S114において、画角制御部A1012は、移動方向推定部A1008から人体及びボールの移動方向の推定結果に応じた情報を取得する。画角制御部A1012は、取得した当該情報に基づき、パン制御やチルト制御等のような画角の向きの制御を行う。一方で、画角制御部A1012は、移動方向推定部A1008から上記情報が出力されない場合(例えば、移動方向推定部A1008が人体の移動を検出していない場合)には、前回と同様の方向に画角の向きの制御を行ってもよい。以上のようにして、画角制御部A1012は、画角の制御を行い、画角が制御された後の画像を示す画像データを、出力制御部A1013に出力する。
S115において、出力制御部A1013は、画角制御部A1012から画像データを取得し、当該画像データが示す画像を出力装置A1014に出力させる。出力装置A1014は、出力制御部A1013からの指示に基づき上記画像データに基づく画像を画面に表示させることで、当該画像をユーザに提示する。
S116において、画角制御装置A1002は、図16に示す一連の処理の終了が指示されたか否かを判定する。具体的な一例として、画角制御装置A1002は、図13には不図示の入力部(例えば、On/Offスイッチ等)が撮像処理の停止に係る指示をユーザから受け付けたか否かに応じて、図16に示す一連の処理の終了が指示されたか否かを判定してもよい。
画角制御装置A1002は、S116において一連の処理の終了が指示されていないと判定した場合には、処理をS001に進め、改めてS101から図16に示す一連を実行する。
一方で、画角制御装置A1002は、S116において一連の処理の終了が指示されたと判定した場合には、図16に示す一連の処理を終了する。
以上のような制御が適用されることで、ボールの動作や移動速度が急激に変化した場合においても、ボールに対応付けられた人体の動作状況を解析することで、ボールの動作を推定し、当該推定の結果を利用して画角の制御行うことが可能となる。また、撮像された画像から人体の骨格情報の推定が困難な場合には、対象となる人体の骨格情報の推定が可能となる程度にズーム制御が行われる。これにより、画像に撮像された人体の部位の判別が困難な場合においても、当該人体が拡大して撮像されるように画角の大きさが制御されるため、人体の動作状況を正確に解析することが可能となり、ひいてはボールの動作を正確に推定することが可能となる。
<第3の実施形態>
以下に、本発明の第3の実施形態に係る撮像システムについて説明する。なお、本実施形態においても、第1及び第2の実施形態と同様に、サッカーにおいてボールの動きに注目して撮像装置の画角を制御する場合を想定して、撮像システムの特徴について詳しく説明する。また、本実施形態では、主に第1及び第2の実施形態と異なる部分に着目して説明し、第1及び第2の実施形態と実質的に同様の部分については詳細な説明は省略する。そのため、特に説明がない部分については、第1及び第2の実施形態と同様のハードウェア構成、機能構成、及び処理等を適用することが可能であるものとする。
(機能構成)
図17を参照して、本実施形態に係る撮像システムの機能構成の一例について説明する。なお、以降では、本実施形態に係る撮像システムを、他の実施形態に係る撮像システムと区別するために、「撮像システムC1000」と称する場合がある。同様に、本実施形態に係る画角制御装置を、他の実施形態に係る画角制御装置と区別するために、「画角制御装置C1002」と称する場合がある。
撮像システムC1000は、サッカーの競技場内が撮像された画像から人体とボールとを認識し、ボールが撮像装置の画角内に収まるように画角調整を行ったうえで、撮像結果に応じた画像をディスプレイ等の出力装置に出力させるシステムである。
撮像システムB1000は、撮像装置A1001と、画角制御装置C1002と、出力装置A1014とを含む。撮像装置A1001と画角制御装置C1002とは、例えば、ビデオインタフェースを介して接続されている。これにより、撮像装置A1001による撮像結果に応じた画像データを画角制御装置C1002に転送することが可能となる。なお、撮像装置A1001による撮像結果に応じた画像データを画角制御装置C1002に転送することが可能であれば、撮像装置A1001と画角制御装置C1002とを接続するインタフェースは特に限定されない。
画角制御装置C1002は、撮像装置A1001から撮像結果に応じた画像データを取得し、当該画像データが示す画像中から、注目対象として設定された被写体(ボール)と、当該被写体以外の他の被写体である人体とを抽出する。画角制御装置C1002は、画像から抽出された人体の骨格情報を推定することで当該人体の動きを推定し、当該人体の動きの推定結果を利用することで、注目対象であるボールの以降の動きを推定する。画角制御装置C1002は、ボールの動きの推定結果に基づき、撮像装置A1001の画角を制御する。
画角の制御としては、例えば、画像が撮像される方向を左右及び上下に調整することで画角の向きを制御するパン制御及びチルト制御と、画像の撮像に係る拡大率を制御するズーム制御とが挙げられる。なお、第1の実施形態に係る画角制御装置A1002と同様に、上述した画角の制御を実現することが可能であれば、その方法は特に限定されない。
ここで、画角制御装置C1002の機能構成について以下により詳しく説明する。画角制御装置C1002は、映像取得部A1003と、人体抽出部A1004と、注目対象抽出部A1005と、対応付け部A1006と、物体情報記録部A1007とを含む。また、画角制御装置A1002は、移動方向推定部A1008と、骨格情報推定部A1009と、状況判定部A1010と、画角判定部A1011と、画角制御部A1012と、出力制御部A1013と、を含む。また、画角制御装置C1002は、人体間距離算出部C1015と、拡大率制御部C1016とを含む。
人体間距離算出部C1015は、人体抽出部A1004から、画像中からの人体の抽出結果に応じた情報を取得する。また、人体間距離算出部C1015は、骨格情報推定部A1009が人体の骨格情報の推定を行わなかった場合(行えなかった場合)に、その旨を示す情報と、画像中から抽出されたボールと人体との間の対応付けの結果に応じた対応付け情報と、を取得する。
人体間距離算出部C1015は、骨格情報推定部A1009が人体の骨格情報の推定を行わなかった場合に、画像中からの人体の抽出結果と、対応付け情報と、に基づき、ボールに対応付けられた人体と、当該人体以外の他の人体それぞれと、の間の距離を算出する。人体間距離算出部C1015は、ボールに対応付けられた人体との距離がより近い順に、他の人体のリスト(以下、「人体間距離リスト」とも称する)を作成し、当該人体間距離リストと、各人体の座標情報と、を拡大率制御部C1016へ出力する。
拡大率制御部C1016は、人体間距離算出部C1015から、人体間距離リストと、各人体の座標情報とを取得する。拡大率制御部C1016は、取得した人体間距離リストと、各人体の座標情報と、に基づき、ボールに対応付けられた人体を中心として所定の人数の人体が画角内に収まるように、画像の撮像に係る拡大率(換言すると、画角の大きさ)を決定する。
ここで、図18及び図19を参照して、拡大率制御部C1016が、ボールに対応付けられた人体を中心として所定の人数の人体が画角内に収まるように、画像の撮像に係る拡大率を決定する処理の一例について説明する。
まず、図18について説明する。D1101は、人体の抽出の対象となる画像を示している。P1100は、画像D1101に撮像されたボールを示している。P1101~P1108は、画像D1101に撮像された人体を示しており、人体P1101がボールP1100に対応付けられている。
拡大率制御部C1016は、取得した人体間距離リストに基づき、ボールP1100に対応付けられた人体P1101により近い他の人体を、人体P1102~P1108の中からあらかじめ決められた人体の数から1減算した数分だけ選択する。これにより、ボールP1100に対応付けられた人体P1101と、当該人体P1101のより近くに位置する人体と、合計があらかじめ決められた数となるように人体が選択される。そして、拡大率制御部C1016は、選択した人体がすべて含まれるように画角の大きさを算出する。
例えば、図18に示す例では、あらかじめ決められた人体の数が3であるものとする。この場合には、拡大率制御部C1016は、ボールP1100に対応付けられた人体P1101により近い人体として、人体P1102及びP1103を選択することとなる。そして、拡大率制御部C1016は、人体P1101~P1103のすべてが画角内に収まるように、画角の大きさを制御する。例えば、P1109は、人体P1101~P1103のすべてが画角内に収まる領域の一例を示している。
次いで、図19について説明する。D1201は、図18に示す画像D1101における領域P1109を拡大した画像を示している。P1200は、画像D1201に撮像されたボールを示しており、図18に示す画像D1101におけるボールP1100に対応している。P1201~P1203は、画像D1201に撮像された人体を示しており、図18に示す画像D1101における人体P1101~P1103に対応している。
なお、画像D1201を取得可能とするためのズームイン制御については、画角制御部A1012が、拡大率制御部C1016による画像の撮像に係る拡大率の算出結果に応じた情報に基づき行う。
拡大率制御部C1016は、画像の撮像に係る拡大率に関する情報を画角判定部A1011へ出力する。
以上、第3の実施形態に係る撮像システムC1000の機能構成について、特に、第1の実施形態に係る撮像システムA1000と異なる部分に着目して説明した。なお、上記以外の機能ブロックの動作については、第1の実施形態に係る撮像システムA1000と実質的に同様のため、詳細な説明は省略する。
(処理)
図20を参照して、撮像システムC1000の処理の一例について説明する。撮像システムC1000は、例えば、所定の入力装置を介して受け付けたユーザからの指示に基づき、図20に示す一連の処理の実行を開始する。
S201において、映像取得部A1003は、撮像装置A1001から撮像結果に応じた画像データを取得する。
S202において、人体抽出部A1004は、映像取得部A1003により取得された画像データが示す画像に対して画像処理を施すことで、当該画像中に撮像された人体を抽出する。人体抽出部A1004は、画像中からの人体の抽出結果に応じた情報を、対応付け部A1006と人体間距離算出部C1015とに出力する。
S203において、注目対象抽出部A1005は、映像取得部A1003により取得された画像データが示す画像に対して画像処理を施すことで、当該画像中に撮像されたボール(注目対象として設定された被写体)を抽出する。
S204において、対応付け部A1006は、S202において画像中から抽出されたボールと、S203において当該画像中から抽出された人体と、の対応付けを行う。具体的な一例として、対応付け部A1006は、ボールとの距離が閾値以下の人体が抽出されている場合に、当該ボールに対して当該人体を対応付ける。
S205において、対応付け部A1006は、ボールに対して人体を対応付けたか否かを判定する。対応付け部A1006は、S205においてボールに対して人体を対応付けていないと判定した場合には、処理をS216に進める。これに対して、対応付け部A1006は、S205においてボールに対して人体を対応付けたと判定した場合には、ボールと人体との対応付けの結果に応じた対応付け情報を、物体情報記録部A1007と骨格情報推定部A1009とのそれぞれに出力する。そして、対応付け部A1006は、処理をS206に進める。
S206において、物体情報記録部A1007は、対応付け部A1006から対応付け情報をフレームごとに取得し、当該対応付け情報を記録する。また、物体情報記録部A1007は、最新のフレームと、当該フレームの1つの前フレームと、のそれぞれについて対応付け情報を記録している場合には、これらのフレームに対応する対応付け情報を移動方向推定部A1008に出力する。一方で、物体情報記録部A1007は、最新のフレームの1つの前フレームに対応する対応付け情報が記録されていない場合には、当該最新のフレームに対応する対応付け情報を移動方向推定部A1008に出力する。そして、物体情報記録部A1007は、処理をS207に進める。
S207において、移動方向推定部A1008は、物体情報記録部A1007から、最新のフレームと、当該フレームの1つの前フレームと、のそれぞれについて対応付け情報を取得する。移動方向推定部A1008は、これらのフレームについて取得した対応付け情報に基づき、人体及びボールの移動方向を推定し、当該推定結果に応じた情報を画角制御部A1012に出力する。
S209において、骨格情報推定部A1009は、人体の骨格情報を推定できたか否か(推定したか否か)を判定する。骨格情報推定部A1009は、S209において人体の骨格情報を推定できた(推定した)と判定した場合には、人体の骨格情報の推定結果に応じた情報を状況判定部A1010に出力する。また、骨格情報推定部A1009は、身体の骨格情報の推定ができた旨(身体の骨格情報の推定を行った旨)を画角判定部A1011に出力する。そして、骨格情報推定A1009は、処理をS213に進める。
これに対して、骨格情報推定部A1009は、S209において人体の骨格情報を推定できなかった(推定しなかった)と判定した場合には、身体の骨格情報の推定ができなかった旨(身体の骨格情報の推定を行わなかった旨)を画角判定部A1011に出力する。そして、骨格情報推定部A1009は、処理をS210に進める。
S210において、人体間距離算出部C1015は、人体抽出部A1004から、画像中からの人体の抽出結果に応じた情報を取得する。また、人体間距離算出部C1015は、骨格情報推定部A1009が人体の骨格情報の推定を行わなかった場合(行えなかった場合)に、その旨を示す情報と、画像中から抽出されたボールと人体との間の対応付けの結果に応じた対応付け情報と、を取得する。
人体間距離算出部C1015は、骨格情報推定部A1009が人体の骨格情報の推定を行わなかった場合に、画像中からの人体の抽出結果と、対応付け情報と、に基づき、ボールに対応付けられた人体と、当該人体以外の他の人体それぞれと、の間の距離を算出する。人体間距離算出部C1015は、ボールに対応付けられた人体との距離がより近い順に、他の人体のリスト(人体間距離リスト)を作成し、当該人体間距離リストと、各人体の座標情報と、を拡大率制御部C1016へ出力する。
S211において、拡大率制御部C1016は、人体間距離算出部C1015から、人体間距離リストと、各人体の座標情報とを取得する。拡大率制御部C1016は、取得した人体間距離リストと、各人体の座標情報と、に基づき、ボールに対応付けられた人体を中心として所定の人数の人体が画角内に収まるように、画像の撮像に係る拡大率を決定する。拡大率制御部C1016は、画像の撮像に係る拡大率に関する情報を画角判定部A1011へ出力する。
S212において、画角判定部A1011は拡大率制御部C1016から画像の撮像に係る拡大率に関する情報を取得し、当該情報を画角制御部A1012に転送する。画角制御部A1012は、画角判定部A1011を介して拡大率制御部C1016から取得した画像の撮像に係る拡大率に関する情報に基づき、ズーム制御を行うことで、画角の大きさを制御する。以上のようにして、画角制御部A1012は、ボールに対応付けられた人体を含め、あらかじめ決められた数の人体が画角内に収まるように、画角の大きさを制御する。そして、画角制御部A1012は、処理をS208に進める。この場合には、S208において、骨格情報推定部A1009は、画角制御部A1012によるズーム制御後の画像に基づき、改めて人体の骨格情報の推定を行うこととなる。
S213において、状況判定部A1010は、人体の骨格情報の推定結果を骨格情報推定部A1009から取得し、当該人体の骨格情報の推定結果に基づき、人体の状況(例えば、動作状況)を判定する。また、状況判定部A1010は、人体の状況の判定結果に基づきボールの状況(例えば、動作状況)を判定する。状況判定部A1010は、ボールの状況の判定結果に基づき、当該ボールの移動量の推定を行う。状況判定部A1010は、人体やボールの状況の判定結果に応じた情報(例えば、ボールの移動量の推定結果に応じた情報)を、画角判定部A1011に出力する。
S214において、画角判定部A1011は、状況判定部A1010から、人体やボールの状況の判定結果に応じた情報(例えば、ボールの移動量の推定結果に応じた情報)を取得する。画角判定部A1011は、人体やボールの状況の判定結果に応じた情報に基づきボールの移動量の推定結果(ボールの移動推定量)が閾値よりも大きいか否かを判定する。
画角判定部A1011は、S214においてボールの移動推定量が閾値よりも大きいと判定した場合には、当該ボールの移動推定量に応じて画像の撮像に係る拡大率を決定し、当該拡大率に関する情報を画角制御部A1012に出力する。具体的な一例として、画角判定部A1011は、ボールの移動推定量が閾値よりも大きい場合には、ズームアウト制御が必要と判定し、ズームアウト制御に係る拡大率を決定したうえで、当該拡大率に関する情報を画角制御部A1012に出力する。そして、画角判定部A1011は、処理をS214に進める。
これに対して、画角判定部A1011は、S112においてボールの移動推定量が閾値以下と判定した場合には、処理をS216に進める。この場合には、S215の処理がスキップされる。
S215において、画角制御部A1012は、画角判定部A1011から画像の撮像に係る拡大率に関する情報を取得し、当該拡大率に応じてズーム制御を行う。
S216において、画角制御部A1012は、移動方向推定部A1008から人体及びボールの移動方向の推定結果に応じた情報を取得する。画角制御部A1012は、取得した当該情報に基づき、パン制御やチルト制御等のような画角の向きの制御を行う。一方で、画角制御部A1012は、移動方向推定部A1008から上記情報が出力されない場合(例えば、移動方向推定部A1008が人体の移動を検出していない場合)には、前回と同様の方向に画角の向きの制御を行ってもよい。以上のようにして、画角制御部A1012は、画角の制御を行い、画角が制御された後の画像を示す画像データを、出力制御部A1013に出力する。
S217において、出力制御部A1013は、画角制御部A1012から画像データを取得し、当該画像データが示す画像を出力装置A1014に出力させる。出力装置A1014は、出力制御部A1013からの指示に基づき上記画像データに基づく画像を画面に表示させることで、当該画像をユーザに提示する。
S218において、画角制御装置A1002は、図20に示す一連の処理の終了が指示されたか否かを判定する。具体的な一例として、画角制御装置A1002は、図17には不図示の入力部(例えば、On/Offスイッチ等)が撮像処理の停止に係る指示をユーザから受け付けたか否かに応じて、図20に示す一連の処理の終了が指示されたか否かを判定してもよい。
画角制御装置A1002は、S218において一連の処理の終了が指示されていないと判定した場合には、処理をS001に進め、改めてS201から図20に示す一連を実行する。
一方で、画角制御装置A1002は、S218において一連の処理の終了が指示されたと判定した場合には、図20に示す一連の処理を終了する。
以上のような制御が適用されることで、ボールの動作や移動速度が急激に変化した場合においても、ボールに対応付けられた人体の動作状況を解析することで、ボールの動作を推定し、当該推定の結果を利用して画角の制御行うことが可能となる。また、撮像された画像から人体の骨格情報の推定が困難な場合には、あらかじめ指定された数の人体が画角内に収まる範囲で人体が拡大して撮像されるように画角の大きさが制御される。そのため、人体の動作状況を正確に解析することが可能となり、ひいてはボールの動作を正確に推定することが可能となる。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記録媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
また、図1に示す機能構成はあくまで一例であり、図1に示す各機能構成を実現することが可能であれば、必ずしも撮像システムA1000の機能構成を限定するものではない。例えば、画角制御装置A1002の各機能構成が、複数の装置が協働することで実現されてもよい。具体的な一例として、画角制御装置A1002の各機能構成のうち少なくとも一部の機能構成の処理の実行に伴う処理負荷が複数の装置に分散されてもよい。また、他の一例として、画角制御装置A1002の各機能構成のうち一部に相当する機能構成が他の装置に設けられていてもよい。具体的な一例として、人体抽出部A1004や注目対象抽出部A1005に相当する機能構成が、他の装置に設けられていてもよい。
また、上記は図1に示す撮像システムA1000に限らず、図13に示す撮像システムB1000や、図17に示す撮像システムC1000についても同様である。
また、図11に示すハードウェア構成はあくまで一例であり、必ずしも画角制御装置A1002、B1002、及びC1002を実現するための情報処理装置200のハードウェア構成を限定するものではない。例えば、図11に示す情報処理装置200の各構成のうち一部の構成が外部装置として情報処理装置200に外付けされていてもよい。具体的な一例として、表示部215や操作部216に相当する構成が、情報処理装置200に対して外付けされていてもよい。
また、上述した各実施形態では、画角制御部は、主に画像に撮像された人体を対象として骨格情報(換言すると、各部位の位置関係)を推定し、当該骨格情報に基づき当該人体の動きを推定している。このような構成に基づき、当該画角制御部は、人体の動きの推定結果を利用して、注目対象として設定された被写体が画角内に収まるように、画角の向きや画角の大きさを制御している。
一方で、複数の部位からなる被写体を対象として、当該複数の部位の位置関係に基づき、当該被写体の動きを推定することが可能であれば、当該推定の対象となる被写体は必ずしも人体には限定されない。具体的な一例として、所定の動物を対象として骨格情報を推定することで、当該動物の動きを推定することが可能である。また、多関節体を対象とした場合においても、当該多関節体を構成する各関節の可動範囲が既知の場合には、上記と同様の思想に基づき、当該多関節体の動きを推定することが可能である。
また、注目対象として設定される被写体についても、必ずしもボールには限定されない。すなわち、注目対象(撮像対象)として設定される第1の被写体以外の第2の被写体の動きを推定することで、当該第1の被写体の動きを推定することが可能であれば、当該第1の被写体として設定される対象は特に限定されない。
A1000 撮像システム
A1002 画角制御装置
A1008 移動方向推定部
A1009 骨格情報推定部
A1010 状況判定部
A1011 画角判定部
A1012 画角制御部

Claims (15)

  1. 撮像装置により撮像した画像から、注目対象として設定された第1の被写体である物体と、当該第1の被写体とは異なり、かつ複数の部位からなる第2の被写体と、を抽出する抽出手段と、
    前記抽出手段により抽出された前記第1の被写体と前記第2の被写体とを対応付ける対応付け手段と、
    抽出された前記第2の被写体の骨格を推定する第1の推定手段と、
    前記第1の推定手段による前記第2の被写体の骨格の推定結果に基づき、当該第2の被写体の状態を推定し、前記第2の被写体の状態の推定結果に基づき、前記対応付け手段により当該第2の被写体に対応付けられた前記第1の被写体の以降の動きを推定する第2の推定手段と、
    前記第2の推定手段による前記第1の被写体の以降の動きの推定結果に基づき、前記撮像装置の画角を制御する制御手段と、
    を備える、制御装置。
  2. 前記第2の推定手段は、
    前記第1の推定手段による前記第2の被写体の骨格の推定結果に基づき、当該第2の被写体の重心位置を特定し、
    当該重心位置に基づき、当該第2の被写体の状態を推定する、
    請求項1に記載の制御装置。
  3. 前記第2の推定手段は、
    前記第1の推定手段による前記第2の被写体の前記骨格の推定結果に基づき、当該第2の被写体の姿勢を特定し、
    当該姿勢に基づき、当該第2の被写体の状態を推定する、
    請求項1または2に記載の制御装置。
  4. 前記対応付け手段は、前記抽出手段により複数の第2の被写体が抽出された場合に、前記第1の被写体と前記複数の第2の被写体それぞれと、の間の距離に応じて、当該第1の被写体に対して対応付ける第2の被写体を決定する、請求項1~3のいずれか1項に記載の制御装置。
  5. 前記対応付け手段は、前記抽出手段により複数の第2の被写体が抽出された場合に、当該複数の第2の被写体のうち、前記第1の被写体からの距離がより短い第2の被写体を、当該第1の被写体に対応付ける、請求項に記載の制御装置。
  6. 前記第1の被写体の以降の動きの推定結果は、当該第1の被写体の移動量の推定結果を含み、
    前記制御手段は、前記第1の被写体の移動量の推定結果に基づき、前記撮像装置の画角
    の制御に係る制御量を決定する、
    請求項1~5のいずれか1項に記載の制御装置。
  7. 前記第2の推定手段は、
    前記第2の被写体の骨格の推定結果に基づく当該第2の被写体の複数の部位の位置関係に基づき、前記第2の被写体の状態として、前記第1の被写体に対する前記第2の被写体の動作を推定し、
    当該動作の推定結果に基づき、当該第1の被写体の以降の動きの前記移動量を推定する、
    請求項6に記載の制御装置。
  8. 前記第2の推定手段は、
    前記第2の被写体の所定の複数の部位がなす角度に基づき、前記第2の被写体の状態として、前記第1の被写体に対する前記第2の被写体の動作を推定し、
    前記角度がより大きいほど、当該動作による前記第1の被写体の以降の動きの前記移動量がより多くなるもの推定する、
    請求項7に記載の制御装置。
  9. 前記制御手段は、前記第1の被写体が前記画角内に収まるように、当該画角の向き及び大きさのうち少なくともいずれかを制御する、請求項1~8のいずれか1項に記載の制御装置。
  10. 前記制御手段は、前記第2の被写体の前記骨格が前記撮像装置の画角内に収まり、かつ当該第2の被写体が拡大して撮像されるように、当該撮像装置の拡大率を制御し、
    前記抽出手段は、前記第2の被写体が拡大して撮像された前記画像から、当該第2の被写体を抽出し、
    前記第1の推定手段は、前記抽出手段により前記第2の被写体が拡大して撮像された前記画像から抽出された当該第2の被写体の前記骨格を推定し、
    前記第2の推定手段は、前記第1の推定手段による前記第2の被写体の骨格の推定結果に基づき、当該第2の被写体の状態を推定する、
    請求項1~9のいずれか1項に記載の制御装置。
  11. 前記制御手段は、前記第1の被写体からの距離がより短いあらかじめ決められた数の前記第2の被写体が前記撮像装置の画角内に収まるように、当該撮像装置の拡大率を制御する、請求項10に記載の制御装置。
  12. 撮像装置により撮像した画像から、注目対象として設定された第1の被写体である物体と、当該第1の被写体とは異なり、かつ複数の部位からなる第2の被写体と、を抽出する抽出手段と、
    前記抽出手段により抽出された前記第1の被写体と前記第2の被写体とを対応付ける対応付け手段と、
    抽出された前記第2の被写体の骨格を推定する第1の推定手段と、
    前記第1の推定手段による前記第2の被写体の骨格の推定結果に基づき、当該第2の被写体の状態を推定し、前記第2の被写体の状態の推定結果に基づき、前記対応付け手段により当該第2の被写体に対応付けられた前記第1の被写体の以降の動きを推定する第2の推定手段と、
    前記第2の推定手段による前記第1の被写体の以降の動きの推定結果に基づき、前記撮像装置の画角を制御する制御手段と、
    を備える、制御システム。
  13. 前記撮像装置を備える、請求項12に記載の制御システム。
  14. 制御装置が実行する制御方法であって、
    撮像装置により撮像した画像から、注目対象として設定された第1の被写体である物体と、当該第1の被写体とは異なり、かつ複数の部位からなる第2の被写体と、を抽出する抽出ステップと、
    前記抽出ステップにて抽出された前記第1の被写体と前記第2の被写体とを対応付ける対応付けステップと、
    抽出された前記第2の被写体の骨格を推定する第1の推定ステップと、
    前記第1の推定ステップにおける前記第2の被写体の骨格の推定結果に基づき、当該第2の被写体の状態を推定し、前記第2の被写体の状態の推定結果に基づき、前記対応付けステップにて当該第2の被写体に対応付けられた前記第1の被写体の以降の動きを推定する第2の推定ステップと、
    前記第2の推定ステップにおける前記第1の被写体の以降の動きの推定結果に基づき、前記撮像装置の画角を制御する制御ステップと、
    を含む、制御方法。
  15. コンピュータを、請求項1~11のいずれか1項に記載の制御装置の各手段として機能させるためのプログラム。
JP2019184555A 2019-10-07 2019-10-07 制御装置、制御システム、制御方法、及びプログラム Active JP7451130B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019184555A JP7451130B2 (ja) 2019-10-07 2019-10-07 制御装置、制御システム、制御方法、及びプログラム
US17/063,406 US11557122B2 (en) 2019-10-07 2020-10-05 Control apparatus, control system, control method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019184555A JP7451130B2 (ja) 2019-10-07 2019-10-07 制御装置、制御システム、制御方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2021061529A JP2021061529A (ja) 2021-04-15
JP7451130B2 true JP7451130B2 (ja) 2024-03-18

Family

ID=75274493

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019184555A Active JP7451130B2 (ja) 2019-10-07 2019-10-07 制御装置、制御システム、制御方法、及びプログラム

Country Status (2)

Country Link
US (1) US11557122B2 (ja)
JP (1) JP7451130B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12033261B2 (en) * 2021-07-26 2024-07-09 Adobe Inc. Contact-aware retargeting of motion
US11386580B1 (en) * 2021-08-13 2022-07-12 Goodsize Inc. System apparatus and method for guiding user to comply with application-specific requirements

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090324010A1 (en) 2008-06-26 2009-12-31 Billy Hou Neural network-controlled automatic tracking and recognizing system and method
JP2015061579A (ja) 2013-07-01 2015-04-02 株式会社東芝 動作情報処理装置
JP2016179048A (ja) 2015-03-24 2016-10-13 国立大学法人埼玉大学 関節負荷可視化システム
JP2017086184A (ja) 2015-11-02 2017-05-25 国立大学法人埼玉大学 筋活動可視化システムと筋活動可視化方法
JP2019154575A (ja) 2018-03-08 2019-09-19 オムロン株式会社 個人識別装置および特徴収集装置
JP2020017107A (ja) 2018-07-26 2020-01-30 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015142019A1 (en) * 2014-03-21 2015-09-24 Samsung Electronics Co., Ltd. Method and apparatus for preventing a collision between subjects
JP6487192B2 (ja) 2014-11-26 2019-03-20 オリンパス株式会社 光学機器およびレンズ制御方法
JP6853528B2 (ja) * 2016-10-25 2021-03-31 東芝デジタルソリューションズ株式会社 映像処理プログラム、映像処理方法、及び映像処理装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090324010A1 (en) 2008-06-26 2009-12-31 Billy Hou Neural network-controlled automatic tracking and recognizing system and method
JP2015061579A (ja) 2013-07-01 2015-04-02 株式会社東芝 動作情報処理装置
JP2016179048A (ja) 2015-03-24 2016-10-13 国立大学法人埼玉大学 関節負荷可視化システム
JP2017086184A (ja) 2015-11-02 2017-05-25 国立大学法人埼玉大学 筋活動可視化システムと筋活動可視化方法
JP2019154575A (ja) 2018-03-08 2019-09-19 オムロン株式会社 個人識別装置および特徴収集装置
JP2020017107A (ja) 2018-07-26 2020-01-30 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
US11557122B2 (en) 2023-01-17
JP2021061529A (ja) 2021-04-15
US20210103736A1 (en) 2021-04-08

Similar Documents

Publication Publication Date Title
US8639020B1 (en) Method and system for modeling subjects from a depth map
JP5242938B2 (ja) ビデオ追跡システム及び方法
JP7451130B2 (ja) 制御装置、制御システム、制御方法、及びプログラム
JP6532217B2 (ja) 画像処理装置、画像処理方法、及び画像処理システム
US10812686B2 (en) Method and system for mimicking human camera operation
KR20190013759A (ko) 연산 처리 장치 및 연산 처리 방법
JP6484321B2 (ja) 高速ビデオカメラを用いた飛行物体の飛行データ測定装置及び方法、及びこれを遂行するためのプログラムを記録したコンピュータで読取可能な記録媒体
CN108416285A (zh) 枪球联动监控方法、装置及计算机可读存储介质
JP2014192700A (ja) 追尾処理装置及びこれを備えた追尾処理システム並びに追尾処理方法
KR20190103146A (ko) 사람을 추적하는 로봇
JP2015219879A (ja) 画像認識システム、画像認識方法およびプログラム
JP2008005208A (ja) スポーツ競技におけるカメラ自動制御システム、カメラ自動制御方法、カメラ自動制御装置、およびプログラム
KR102186875B1 (ko) 움직임 추적 시스템 및 방법
JP2010123019A (ja) 動作認識装置及び方法
Yang et al. Multiple marker tracking in a single-camera system for gait analysis
JP7246005B2 (ja) 移動体追跡装置及び移動体追跡方法
KR101290517B1 (ko) 촬영장치 및 이의 대상 추적방법
KR102386673B1 (ko) 오브젝트 검출 방법 및 장치
JP7401968B2 (ja) 撮影制御装置、撮影システム及び撮影制御方法
JP2017130889A (ja) カメラのキャリブレーション装置、方法及びプログラム
KR101320922B1 (ko) 가중 탐색 영역을 이용한 움직임 추적 및 아바타 제어 방법
US20230177860A1 (en) Main object determination apparatus, image capturing apparatus, and method for controlling main object determination apparatus
JP2022158513A (ja) 撮影制御装置、撮影制御方法、及びプログラム
US10122921B2 (en) Apparatus and method for automatically recognizing object by using low-speed camera in dual photographing mode
JP7359306B2 (ja) 追跡装置、追跡システム、追跡方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221003

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230817

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230919

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231025

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240306

R151 Written notification of patent or utility model registration

Ref document number: 7451130

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151