JP2017512398A - 映像を提示する方法及び装置 - Google Patents

映像を提示する方法及び装置 Download PDF

Info

Publication number
JP2017512398A
JP2017512398A JP2016550835A JP2016550835A JP2017512398A JP 2017512398 A JP2017512398 A JP 2017512398A JP 2016550835 A JP2016550835 A JP 2016550835A JP 2016550835 A JP2016550835 A JP 2016550835A JP 2017512398 A JP2017512398 A JP 2017512398A
Authority
JP
Japan
Prior art keywords
video
orientation
rotation
translation
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016550835A
Other languages
English (en)
Other versions
JP2017512398A5 (ja
Inventor
デマルティ,クレア−エレーヌ
オワゼル,リオネル
ペレス,パトリック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2017512398A publication Critical patent/JP2017512398A/ja
Publication of JP2017512398A5 publication Critical patent/JP2017512398A5/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30244Camera pose
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2219/00Indexing scheme for manipulating 3D models or images for computer graphics
    • G06T2219/20Indexing scheme for editing of 3D models
    • G06T2219/2016Rotation, translation, scaling

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Abstract

映像の向きを特定する方法及び装置が提案される。方法は、映像の動きを推定するステップと、映像の推定された動きから平行移動に基づくパラメータを抽出するステップと、平行移動に基づくパラメータに従って、垂直平行移動の展開に対する時間にわたる水平平行移動の展開を与える少なくとも1つの特徴を計算するステップとを有し、特徴は映像の向きを特定するために使用される。

Description

本開示は、概して、画像処理に関係がある。特に、本開示は、映像の向きを特定する方法及び装置に関係がある。
映像コンテンツのコンピュータ処理のいくつかの利用では、与えられている映像の向きを推定する必要がある。例えば、そのような利用の情況は、人が映像をブラウズし鑑賞したいと望む場合に、映像の正確な表示のために映像の正確な向きを有する必要があることである。他の情況は、顔検出、特定のオブジェクトの検出及び認識、空領域検出、並びに寄り一般的なセマンティック映像パーシングのような、コンピュータビジョン処理にある。この場合における最初の要件として、処理されるべき画像及び映像は、正確な向きで提案されるはずである。従って、映像の向きの特定は、そのようなコンピュータビジョン処理のための第1且つ必須の前処理として適用されてよい。
映像の正確な向きを得るための1つの既知の解決法は、映像の捕捉中に映像コンテンツとともに記憶される付加的なメタデータを使用する必要がある。例えば、そのような付加的なメタデータは、Exif(Exchangeable image file format)標準において定義されているメタデータタグからであることができる。向きを知ることは、ジャイロ情報に依存する。この場合に、そのようなメタデータの存在は、使用される捕捉デバイスに依存する。しかし、そのような情報は、低価格のデバイスには通常は利用可能でない。特定の携帯電話機(例えば、iPhone(登録商標))は、そのような情報を有さず、一方、低価格のスマートフォンは、情報を記憶しない。更には、映像の場合に、向きの情報は、映像の最初の画像に基づいてのみ計算され、捕捉中に回転が起こった場合に変化しない。この既知の解決法によれば、向きの情報は、従って、映像の最初の部分についてのみ正確であり得る。
他の既知の解決法は自動システムと呼ばれる。以下の非特許文献1〜3は、静止画の向きを自動的に検出することができる斯様な自動システムに関係がある。
しかし、映像を処理するシステムについての論及がないことから、上述されたように、以下の非特許文献1〜3の目的は静止画の向きを検出することであるように思われる。静止画のための提案されているシステムは、通常、画像からの特徴の抽出及び何らかの機械学習技術の使用に基づく。このことは、モデルのトレーニングの第1ステップが注釈付き画像のデータベースに対して必要とされ、費用のかかるオフライン処理を生じさせ得ることを暗示する。最適なパフォーマンスをあげるシステムはまた、色又はテクスチャに関連する低レベルの特徴(第1色モーメント、エッジ方向ヒストグラム、など)から高レベルのセマンティック情報(顔検出、空検出、ライン検出、など)に及ぶ、映像コンテンツから抽出された種々の特徴を使用する。このことは、システムの時間の大部分を費やし、重い計算負荷を生じさせる。静止画に対するそのような処理は、フレーム単位で映像の夫々のフレームに、あるいは、それらのフレームのサブサンプリングに適用されてよい。しかし、結果として、処理は、計算視点から、より一層高価になる。
従って、適度な計算負荷により、所与の映像の正確な向きを検出し、同時に、検出された向きが映像の各フレームについて正確であることを確かにする必要がある(映像を捕捉するデバイスは、捕捉フェーズの間に回転され得ると仮定する。)。
Cingovska, I.;Ivanovski, Z.;Martin, F.,"Automatic image orientation detection with prior hierarchical content-based classification",Image Processing (ICIP),2011 18th IEEE International Conference on,vol.,no.,pp.2985,2988,2011年9月11〜14日 G. Sharma,A. Dhall,S. Chaudhury及びR. Bhatt,"Hierarchical System for Content Based Categorization and Orientation of Consumer Images",Pattern Recognition and Machine Intelligence,vol.5909,p 495-500,2009年 Jiebo Luo;Boutell, M.,"Automatic image orientation detection via confidence-based integration of low-level and semantic cues",Pattern Analysis and Machine Intelligence,IEEE Transactions on,vol.27,no.5,pp.715,726,2005年5月 J.M. Odobez,P. Bouthemy,"Robust multiresolution estimation of parametric motion models",Journal of Visual Communication and Image Representation,6(4):348-365,1995年12月
従来技術における上記の問題を鑑みて、本開示は、映像の夫々の向き一様な部分について適度な計算負荷により映像の向きを特定する方法及び装置を提供する。
本開示に従って、いくつかの特徴は、映像シーンの推定された動き(ドミナント又はオブジェクトベース)に基づき抽出される。それらの動きに基づいた特徴から、あるフレームに基づく向き情報は、向きの潜在的な変化とともに計算される。時間的な向き情報とともに、本開示は、映像の向き一様な部分への関連するセグメンテーションももたらす。
本開示の第1実施形態に従って、映像の向きを特定する方法が提供される。方法は、前記映像の動きを推定するステップと、前記映像の前記推定された動きから、平行移動に基づくパラメータを抽出するステップと、前記平行移動に基づくパラメータに従って、垂直平行移動の展開に対する時間にわたる水平平行移動の展開を与える少なくとも1つの特徴を計算するステップであって、前記特徴は前記映像の向きを特定するために使用される、前記計算するステップとを有する。
第1実施形態において、方法は、前記映像の前記推定された動きから、回転に基づくパラメータを抽出するステップと、前記回転に基づくパラメータに従って検出された回転によって分けられる少なくとも1つのセグメントに前記映像を分割するステップと、前記少なくとも1つのセグメントの夫々にわたる前記少なくとも1つの特徴の積分の関数として前記映像の向きを特定するステップとを更に有する。
本開示の第2実施形態に従って、映像の向きを特定する装置が提供される。装置は、前記映像の動きを推定し、前記映像の前記推定された動きから、平行移動に基づくパラメータを抽出し、前記平行移動に基づくパラメータに従って、垂直平行移動の展開に対する時間にわたる水平平行移動の展開を与える少なくとも1つの特徴を計算し、前記特徴は前記映像の向きを特定するために使用される、よう構成されるプロセッサを有する。
本開示の第3実施形態に従って、通信ネットワークからダウンロード可能であり、及び/又はコンピュータによって読み出し可能な媒体において記録されており、及び/又はプロセッサによって実行可能であるコンピュータプログラム製品が提供される。コンピュータプログラム製品は、本開示の一態様に従う方法のステップを実施するプログラムコード命令を有する。
本開示の第4実施形態に従って、プロセッサによって実行されることが可能なコンピュータプログラム製品が記録されている非一時的なコンピュータ可読媒体が提供される。非一時的なコンピュータ可読媒体は、本開示の一態様に従う方法のステップを実施するプログラムコード命令を含む。
本開示の更なる態様及び利点は、本開示の以下の詳細な説明において見つけられることが理解されるべきである。
添付の図面は、実施形態の原理を説明するのに役立つ記載とともに本開示の実施形態の更なる理解を提供するために含まれている。本開示は、実施形態に制限されない。
本開示の実施形態に従って映像の向きを特定する方法を示すフローチャートである。 積分された状態で時間にわたる絶対的な水平及び垂直平行移動の差の展開を示す図である。 積分された状態で回転パラメータの展開の例を示す図である。 本開示の他の実施形態に従って映像の向きを特定する方法を示すフローチャートである。 時計回りのカメラの回転の前及び後の種々の起こり得る向きを示す例図である(表1における場合2)。 反時計回りのカメラの回転の前及び後の種々の起こり得る向きを示す例図である(表1における場合3)。 本開示の実施形態に従って映像の向きを特定する方法が実装され得るコンピュータデバイスを示すブロック図である。
本開示の実施形態は、これより、図面と併せて詳細に説明される。以下の記載では、既知の機能及び構成の一部の詳細な説明は、簡潔さのために省略されることがある。
本開示の実施形態は、映像の向きを特定する方法を提供する。次に、本開示の実施形態の方法が詳細に説明される。
図1は、本開示の実施形態に従って映像の向きを特定する方法を示すフローチャートである。
簡単のために、本開示の実施形態は、映像のフレームごとに0°、90°、−90°及び180°の4つの向きの間、すなわち、2つの横向き(0°、180°)及び縦向き(90°、−90°)の間、を区別することについてしか論じられない。従って、本開示は、それら4つのクラスへのフレーム分類のみを論じ、それ以上の正確な姿勢角度は抽出されない。更には、本開示のいくつかの実施形態において、システムは、2つの起こり得る縦向き(90°、−90°)の間及び2つの起こり得る横向き(0°、180°)の間を区別せずに縦/横への第1分類を提供する。なお、本開示は、より複雑な姿勢分類を伴う場合にも適用され得ることが知られる。
図1に示されるように、ステップS101で、映像の動きが推定される。映像のドミナント・モーションがステップS101での動き推定にとって好ましいことが留意されるべきである。しかし、映像におけるドミナント・モーションが推定されるべきでない場合には、何らかのオブジェクトベースの動き推定が頼りにされてよい。ドミナント・モーション推定は、映像のドミナント・モーションのパラメトリック近似を各瞬間において計算することによって、実施され得る。ドミナント・モーションの推定のために、何らかの既知の解決法が使用されてよい。例えば、上記の非特許文献4には、このための最新技術が開示されている。
次に、ステップS102で、映像の推定されたドミナント・モーションから、平行移動に基づくパラメータ及び回転に基づくパラメータが抽出される。
動き推定器は、推定された動きモデルを出力し、それから、回転の推定とともに、水平方向及び垂直方向の両方における平行移動の推定が抽出され得る。
動きモデルは、ドミナント・モーション推定から入手可能であり、推定される動きに応じたパラメータを含んでよいことが知られる。本明細書では、6つのパラメータを伴うアフィンモデルが、以下の行列として考えられ得る:

a0 a1 a2
b0 b1 b2

上記のモデルにおいて、例えば、最初の2つのパラメータa0及びb0は、x軸及びy軸における平行移動値であるTx及びTyに夫々対応する。残り4つのパラメータは、回転及びズームの動きに関する情報を提供する。a2−b1の値を考えることによって、適用される回転のサイナス(sinus)に比例する量が入手され得る。
このステップにおいて、任意に、平行移動に基づくパラメータ及び回転に基づくパラメータは、ある期間にわたって積分され得る。積分のために、定積分を近似するためのよく知られた技術である台形則が、所与のウィンドウに対して適用され得る。この実施形態において、所与のウィンドウのサイズは、例えば20フレームに、経験的に固定され得る。しかし、このサイズは、情況に応じて適応されてよい。ドミナント・モーション推定からは、小さな平行移動及び回転値しかフレームごとに入手され得ない。それらの値からは、回転及び平行移動を正確に検出することは困難である。積分の利点は、より長い期間における動きのより大きいビューを提供することである。
次に、ステップS103で、平行移動に基づくパラメータに従って、垂直平行移動の展開に対する時間にわたる水平平行移動の展開を与える少なくとも1つの特徴が計算される。そのような特徴は、映像が縦向き又は横向きモードにおいて捕捉されたかどうかに関する何らかの手掛かりを与えることができる。ほとんどの場合に、ドミナント・モーションの並進運動成分の振幅が垂直方向におけるよりも水平方向において相当に大きいときに、チルティングよりもパニングの方が映像のシーンの捕捉中に使用される傾向があるので、映像は横向きモードにおいて捕捉された可能性が高い。
以下、特徴の解析は、例えば、求められた情報を与える:

Featuretrans(frame)=abs(tx(frame))-abs(ty(frame))

図2は、Tx及びTyの積分値から、時間わたる斯様な特徴の展開の例を示す。正の値は、映像の横向きを示す傾向があり、一方、負の値は、映像の縦向きを示す傾向がある。任意のステップで、上記の特徴は、解析の精度を改善するよう、所与のスライディング・タイム・ウィンドウにわたって平滑化されてよい。
ステップS104で、ステップS103と並行して、積分されていようとなかろうと、回転に基づくパラメータに従って検出された回転によって分けられるセグメントに映像が分割される。
回転に基づくパラメータは、転じて、カメラが捕捉中に回転されたかどうかに関する何らかの情報を与えることが知られる。セグメンテーションは、抽出された回転に基づくパラメータの閾値化を通じて実施され得る。
図3は、積分後の回転に基づくパラメータの展開の例を示す図である。この場合に、閾値化は、3つのセグメント、回転前のセグメント1と、回転後のセグメント3と、回転に対応し、システムが当該実施形態において如何なる向き情報も与えないセグメント2と、を与える。図3は、簡単な閾値が適用されるところの、映像の分割の例を表す。閾値を上回る領域は時計回りの回転に対応し、反対側の閾値を下回る領域は反時計回りの回転に対応し、その間の領域は回転を伴わない領域に対応する。この例では、閾値は0.2の経験値に固定されている。しかし、映像コンテンツにおいて、更なる適応、例えば、単に値を平均−2シグマを下回ったままとする平滑化、が行われてよい。任意に、精緻化が回転境界の検出において加えられてよい。この精緻化は、潜在的な回転のマーカを与える高位閾値から始まる。次いで、それは、回転パラメータの絶対値が極めて低い(すなわち、イプシロン値よりも低い)フレームに対応する回転開始を見つけるために、時間的に後退する。次に、それは、回転パラメータの絶対値がイプシロンよりも低い最初のフレームに対応する回転の終わりを順方向検索する。
ステップS105で、ステップS104によって得られた夫々のセグメントにわたる、ステップS103で得られた少なくとも1つの特徴の積分に従って、映像の向きが特定される。
映像の向きは、セグメントごとにFeaturetransの1つの代表単一値を得るために、セグメントの全フレームについてFeaturetransを積分することによって、回転の前及び後に各セグメントの向きを計算することで、特定される。この実施形態において、それは、単に、セグメントにわたる図2における曲線の下の面積(ハッチングされた領域を参照。)の計算であることができる。他の実施形態では、更なる閾値Tが、平行移動に基づくパラメータに関して使用される。Featuretrans>T及びFeaturetrans<−Tである連続した部分の数は、それらの部分の存続期間とともに、数えられる。それら2つのカウンタの単純な正規化された和は、Featuretransの新たな‘積分された’値を与える。
回転が検出されない場合には、映像全体にわたる又は予め定義されたサイズのウィンドウにわたるFeaturetransの積分値が計算される。具体的に、回転が検出されなかった場合には、映像全体においてただ1つの大きいセグメントしか存在しない。この場合に、Featuretransのための同じ積分プロセスは、映像全体に行われるものであるがセグメントに行われるものとして単に適用され得る。変形例として、映像が非常に長い場合に、それはウィンドウごとに処理されてよい。この場合に、積分は、前と同じように、しかし、予め定義されたウィンドウサイズにわたって、行われる。
この実施形態において、各セグメントの向きは、次いで、次のように与えられる:
Featuretrans_integrated_over_segment(セグメントにわたって積分されたFeaturetrans)>0の場合に、向きは横向きである。
Featuretrans_integrated_over_segment<0の場合に、向きは縦向きである。
上述されたように、簡単のために、本開示の実施形態は、限られた数の向きを識別することについてしか論じられない。本開示の更なる改良において、例えば、顔検出のような、何らかの追加の処理は、2つの縦向き又は2つの横向きの間を更に区別するために適用されてよい。当業者に明らかなように、人々、従って顔は、逆さまである可能性が極めて低いので、ピクチャにおいて顔を検出することによって、ピクチャの最も可能性が高い向きの何らかの情報が取得され得る。また、立っている人々と比べて、画像において横たわっている人々、従って、顔を有する可能性も極めて低い。そのような情報は、映像の向きを更に識別するために使用され得る。これに関してこれ以上の詳細は与えられない。
図4は、本開示の他の実施形態に従って映像の向きを特定する方法を示すフローチャートである。
図4に示される実施形態において、ステップS401〜S405は、図1におけるステップS101〜S105と夫々同じである。更なるステップS406が加えられている。このステップは、回転の角度(例えば、この角度は、ステップS402で抽出された回転に基づくパラメータから抽出されてよい。)に従って、ステップS406で得られた映像の向きを更に識別する。図1を参照して記載される実施形態に関連して、加えられたステップS406は、ステップS405で特定された2つの縦向き及び2つの横向きを区別するのを助けることができる。
ステップS404から、回転が映像において起こったか否かに関する情報が、取得され得る(回転パラメータの絶対値は所与の閾値を上回る。)。ステップS402で得られた回転パラメータの符号に応じて、回転の方向に関する情報が入手され得る(rotation_parameter>0の場合に、フレームの中心に対して、シーンは時計回りに回転し、すなわち、カメラは反時計回りに回転されており、rotation_parameter<0の場合に、フレームの中心に対して、シーンは反時計回りに回転し、すなわち、カメラは時計回りに回転されている。)。回転に対応する映像の最終の回転値は、セグメントにわたる回転パラメータの積分、又は単に、±max_over_segment(abs(rotation_parameter))、のいずれかであってよい。この量の符号は、現在のセグメントに対するrotation_parameterの符号に依存する。
以下の記載では、フレームが3つのクラス0°、90°、−90°にしか属さない、より簡単な場合のみが検討される。逆さまの向きを有する映像は非常にまれであることが知られており、従って、以下の記載では検討されない。本開示の改良において、180°の向きクラスが、同様の論理的思考に従うことで加えられてよい。
表1は、以下で、推定された回転パラメータ(イプシロン1>0)に従って、回転の前及び後で、セグメントの向きに関する情報を示す。
表1において、orient_before及びorient_afterは、回転前の全フレームの向き及び回転後の全フレームの向きを夫々意味する。回転パラメータは、各列において検討されている。パラメータの符号及び値に応じて、回転が起こるという事実、及びこの場合に、回転が起こる方向(時計回り、反時計回り)、の両方に関して、何らかの見識が取得され得る。
図5及び6は、表1で論じられている種々の場合を表す。図5及び6から、且つ、回転方向から、回転の前及び後で平行移動値にはほんのいくつかの可能性がある。
図5は、時計回りのカメラの回転(表1における場合2)の前及び後の種々の起こり得る向きを示す例図である。最初の2つの場合のみが以下の記載で検討される。図6は、反時計回りのカメラの回転(表2における場合3)の前及び後の種々の起こり得る向きを示す例図である。同様に、最初の2つの場合のみが以下の記載で検討される。
表1における状態A及びB、又はC及びDの間のあいまいさを更に解消するよう、ステップS405で記載されるように計算された、回転の前及び後の平行移動値の積分値は、もしあれば、場合に応じて回転の前及び後のフレームの0、1又は2つの起こり得る向きを求めるよう、次の表2に従って比較されて混合される。
表2は、平行移動及び回転のパラメータ/特徴に従う向きの決定を示す。場合1、2、3は表1において記載されている(イプシロン2は正である。)。
FeaturetransIntegrated(積分された平行移動の特徴)又はrotation(回転)の値が小さすぎる場合について、ある拒絶ポリシーが適用される:向き情報は出力されない。本開示の変形例において、未定義の場合(いくつかの起こり得る向き)は、拒絶される場合に変換されてよい。
加えて、回転の前及び後の平行移動パラメータがいずれも、回転の前及び後のセグメントを、例えば、縦向きセグメントとして分類することで一致する場合には、回転は誤って検出された可能性がある。この場合に、ステップS406の追加は、このフォールス・アラームを除く助けとなり得る。それら2つの継続中のプロシージャの一方又は他方を選択することは、我々が回転パラメータ及び平行移動パラメータの両方に関して有し得る信頼値に依存してよい。
いくつかの回転が映像において検出される場合に、表2において記載された規則のような、同様の規則が、未定義の場合を解決するよう、導出されて映像とともに伝搬されてよい。
有利なことに、平行移動がドミナント・モーション推定から検出されないときに、シーンにおけるいくつかのオブジェクトの動きが推定されてよく、それらのオブジェクトの何らかの平行移動情報は、もしあれば、ドミナント・モーションの平行移動情報の代わりに、使用され得る。
カメラ及びオブジェクトが動いている場合に、両方の領域の平行移動情報を積分するスキーマが使用され得る。それでもなお、一様な向きの映像セグメントへのセグメンテーションのために、ドミナント回転は唯一の信頼できる基準のままである。
方法のロバスト性を高めるよう、計算負荷が許すならば、静止画において使用されるいくつかの更なる機能も使用されてよい。例えば、顔の向きは、依然として、本開示で提案されている動きに基づいた機能と結合される興味深いキューのままである。
本開示は、有利なことに、回転が捕捉中に起こる場合でさえ、与えられている映像の全フレームについて向き情報を提供する。それは、映像に対して適用されている、ある簡単な動きに基づく処理に基づいており、従って、オフラインの学習プロセスを必要としない。動き推定のステップは実時間において実現され得、オンラインの向き検出プロセスは、映像全体にわたる、あるいは、ある予め定義されたタイム・ウィンドウにわたる動き推定の直後に、適用される。
本開示は、例えば、前もって捕捉された映像の再生を提供するビデオプレイヤーにおいて実装され得る。ビデオプレイヤーは、制限なしに、PC上のVideoLAN、オンラインの映像ウェブサイト、及びスマートフォンを有する。
本開示の実施形態は、映像の向きを特定する、対応する装置を提供する。
図7は、本開示の実施形態に従って映像の向きを特定する方法が実装され得るコンピュータデバイス700を示すブロック図であるコンピュータデバイス700は、標準のパーソナル・コンピュータ(PC;Personal Computer)のような、計算を実施可能な如何なる種類の適切なコンピュータ又はデバイスであることもできる。デバイス700は、少なくとも1つのプロセッサ710と、RAMメモリ720と、ユーザと相互作用するユーザインターフェイス730とを有する。当業者に明らかなように、表されているコンピュータは、明りょうさのために非常に簡略化されており、実際のコンピュータは、ネットワーク接続及び固定記憶デバイスのような機構を更に有する。
ユーザインターフェイス730によれば、ユーザは、再生のために映像を入力/選択することができる。映像の特定された向きの結果も、必要に応じて、ユーザインターフェイス730によってユーザに出力され得る。
プロセッサ710は、映像の動きを推定する第1ユニットを有する。
プロセッサ710は、映像の推定された動きから、平行移動に基づくパラメータ及び回転に基づくパラメータを抽出する第2ユニットを更に有する。
プロセッサ710は、平行移動に基づくパラメータに従って、垂直平行移動の展開に対する時間にわたる水平平行移動の展開を与える少なくとも1つの特徴を計算する第3ユニットを更に有する。
プロセッサ710は、回転に基づくパラメータに従って検出された回転によって分けられたセグメントへと映像を分割する第4ユニットを更に有する。
プロセッサ710は、セグメントの夫々にわたる少なくとも1つの特徴の積分の関数として映像の向きを特定する第5ユニットを更に有する。
本開示の実施形態は、通信ネットワークからダウンロード可能であり、及び/又はコンピュータによって読み出し可能な媒体において記録されており、及び/又はプロセッサによって実行可能であるコンピュータプログラム製品であって、上記の方法のステップを実施するプログラムコード命令を有するコンピュータプログラム製品を提供する。
本開示の実施形態は、プロセッサによって実行されることが可能であって、上記の方法のステップを実施するプログラムコード命令を含むコンピュータプログラム製品が記録されている非一時的なコンピュータ可読媒体を提供する。
本開示は、様々な形態のハードウェア、ソフトウェア、ファームウェア、特別目的のプロセッサ、又はそれらの組み合わせにおいて実装されてよいことが理解されるべきである。更には、ソフトウェアは、望ましくは、プログラム記憶デバイスにおいて有形に具現されているアプリケーションプログラムとして実装される。アプリケーションプログラムは、如何なる適切なアーキテクチャも有する機械へアップロードされてそれによって実行されてよい。望ましくは、機械は、1つ以上の中央演算処理装置(CPU;central processing unit)、ランダムアクセスメモリ(RAM;random access memory)、及び/又は入力/出力(I/O)インターフェイスのようなハードウェアを備えたコンピュータプラットフォームにおいて実装される。コンピュータプラットフォームは、オペレーティングシステム及びミクロ命令コードを更に含む。ここで記載されている様々なプロセス及び機能は、オペレーティングシステムを介して実行されるミクロ命令コードの部分又はアプリケーションプログラムの部分(あるいは、それらの組み合わせ)のいずれかであってよい。加えて、追加のデータ記憶デバイス及び印刷機のような、様々な他の周辺機器が、コンピュータプラットフォームへ接続されてよい。
添付の図面で表されている、構成するシステムコンポーネント及び方法ステップのいくつかは、望ましくは、ソフトウェアにおいて実装されるので、システムコンポーネント(又はプロセスステップ)間の実際の接続は、本開示がプログラミングされる様態に応じて様々であってよいことが更に理解されるべきである。ここでの教示を鑑み、当業者であれば、本開示のそれら及び同様の実装又は構成を考え付くことができる。
添付の図面で表されている、構成するシステムコンポーネント及び方法ステップのいくつかは、望ましくは、ソフトウェアにおいて実装されるので、システムコンポーネント(又はプロセスステップ)間の実際の接続は、本開示がプログラミングされる様態に応じて様々であってよいことが更に理解されるべきである。ここでの教示を鑑み、当業者であれば、本開示のそれら及び同様の実装又は構成を考え付くことができる。
上記の実施形態に加えて、以下の付記を開示する。
(付記1)
映像の向きを特定する方法であって、
前記映像の動きを推定するステップと、
前記映像の前記推定された動きから、平行移動に基づくパラメータを抽出するステップと、
前記平行移動に基づくパラメータに従って、垂直平行移動の展開に対する時間にわたる水平平行移動の展開を与える少なくとも1つの特徴を計算するステップであって、前記特徴は前記映像の向きを特定するために使用される、前記計算するステップと
を有する方法。
(付記2)
前記映像の前記推定された動きから、回転に基づくパラメータを抽出するステップと、
前記回転に基づくパラメータに従って検出された回転によって分けられる少なくとも1つのセグメントに前記映像を分割するステップと、
前記少なくとも1つのセグメントの夫々にわたる前記少なくとも1つの特徴の積分の関数として前記映像の向きを特定するステップと
を更に有する付記1に記載の方法。
(付記3)
前記推定は、前記映像のドミナント・モーションを推定することを含む、
付記1に記載の方法。
(付記4)
前記特定された向きは、前記映像のフレームごとに横向き及び縦向きを有する、
付記2に記載の方法。
(付記5)
前記推定は、前記映像の動きのパラメトリック近似を各瞬間において計算することを含む、
付記1に記載の方法。
(付記6)
前記分割するステップは、前記抽出された回転に基づくパラメータの閾値化を含む、
付記2に記載の方法。
(付記7)
前記特定は、セグメントごとに前記少なくとも1つの特徴の1つの代表単一値を得るよう当該セグメントの全フレームについて前記少なくとも1つの特徴を積分することによって、回転の前及び後で各セグメントの向きを計算することを含む、
付記2に記載の方法。
(付記8)
スライディング・タイム・ウィンドウにわたって前記少なくとも1つの特徴を平滑化するステップ
を更に有する付記1に記載の方法。
(付記9)
前記回転に基づきパラメータの回転角度に従って前記特定された結果から前記映像の向きを特定するステップ
を更に有する付記2に記載の方法。
(付記10)
前記回転角度は、前記回転に基づくパラメータのサイナスに従って決定される、
付記9に記載の方法。
(付記11)
前記特定された向きは、前記映像のフレームごとに0°、90°、−90°及び180°の向きを有する、
付記9に記載の方法。
(付記12)
映像の向きを特定する装置であって、
前記映像の動きを推定し、
前記映像の前記推定された動きから、平行移動に基づくパラメータを抽出し、
前記平行移動に基づくパラメータに従って、垂直平行移動の展開に対する時間にわたる水平平行移動の展開を与える少なくとも1つの特徴を計算し、前記特徴は前記映像の向きを特定するために使用される、
よう構成されるプロセッサを有する
装置。
(付記13)
通信ネットワークからダウンロード可能であり、及び/又はコンピュータによって読み出し可能な媒体において記録されており、及び/又はプロセッサによって実行可能であるコンピュータプログラム製品であって、
付記1乃至11のうちの少なくとも一つに記載される方法のステップを実施するプログラムコード命令を有する
コンピュータプログラム製品。
(付記14)
プロセッサによって実行されることが可能であって、請求項1乃至11のうちの少なくとも一項に記載される方法のステップを実施するプログラムコード命令を含むコンピュータプログラム製品が記録されている
非一時的なコンピュータ可読媒体。

Claims (14)

  1. 映像の向きを特定する方法であって、
    前記映像の動きを推定するステップと、
    前記映像の前記推定された動きから、平行移動に基づくパラメータを抽出するステップと、
    前記平行移動に基づくパラメータに従って、垂直平行移動の展開に対する時間にわたる水平平行移動の展開を与える少なくとも1つの特徴を計算するステップであって、前記特徴は前記映像の向きを特定するために使用される、前記計算するステップと
    を有する方法。
  2. 前記映像の前記推定された動きから、回転に基づくパラメータを抽出するステップと、
    前記回転に基づくパラメータに従って検出された回転によって分けられる少なくとも1つのセグメントに前記映像を分割するステップと、
    前記少なくとも1つのセグメントの夫々にわたる前記少なくとも1つの特徴の積分の関数として前記映像の向きを特定するステップと
    を更に有する請求項1に記載の方法。
  3. 前記推定は、前記映像のドミナント・モーションを推定することを含む、
    請求項1に記載の方法。
  4. 前記特定された向きは、前記映像のフレームごとに横向き及び縦向きを有する、
    請求項2に記載の方法。
  5. 前記推定は、前記映像の動きのパラメトリック近似を各瞬間において計算することを含む、
    請求項1に記載の方法。
  6. 前記分割するステップは、前記抽出された回転に基づくパラメータの閾値化を含む、
    請求項2に記載の方法。
  7. 前記特定は、セグメントごとに前記少なくとも1つの特徴の1つの代表単一値を得るよう当該セグメントの全フレームについて前記少なくとも1つの特徴を積分することによって、回転の前及び後で各セグメントの向きを計算することを含む、
    請求項2に記載の方法。
  8. スライディング・タイム・ウィンドウにわたって前記少なくとも1つの特徴を平滑化するステップ
    を更に有する請求項1に記載の方法。
  9. 前記回転に基づきパラメータの回転角度に従って前記特定された結果から前記映像の向きを特定するステップ
    を更に有する請求項2に記載の方法。
  10. 前記回転角度は、前記回転に基づくパラメータのサイナスに従って決定される、
    請求項9に記載の方法。
  11. 前記特定された向きは、前記映像のフレームごとに0°、90°、−90°及び180°の向きを有する、
    請求項9に記載の方法。
  12. 映像の向きを特定する装置であって、
    前記映像の動きを推定し、
    前記映像の前記推定された動きから、平行移動に基づくパラメータを抽出し、
    前記平行移動に基づくパラメータに従って、垂直平行移動の展開に対する時間にわたる水平平行移動の展開を与える少なくとも1つの特徴を計算し、前記特徴は前記映像の向きを特定するために使用される、
    よう構成されるプロセッサを有する
    装置。
  13. 通信ネットワークからダウンロード可能であり、及び/又はコンピュータによって読み出し可能な媒体において記録されており、及び/又はプロセッサによって実行可能であるコンピュータプログラム製品であって、
    請求項1乃至11のうちの少なくとも一項に記載される方法のステップを実施するプログラムコード命令を有する
    コンピュータプログラム製品。
  14. プロセッサによって実行されることが可能であって、請求項1乃至11のうちの少なくとも一項に記載される方法のステップを実施するプログラムコード命令を含むコンピュータプログラム製品が記録されている
    非一時的なコンピュータ可読媒体。
JP2016550835A 2014-02-27 2015-02-23 映像を提示する方法及び装置 Pending JP2017512398A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14305275.1 2014-02-27
EP14305275 2014-02-27
PCT/EP2015/053746 WO2015128294A1 (en) 2014-02-27 2015-02-23 Method and apparatus for determining an orientation of a video

Publications (2)

Publication Number Publication Date
JP2017512398A true JP2017512398A (ja) 2017-05-18
JP2017512398A5 JP2017512398A5 (ja) 2018-03-15

Family

ID=50288014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016550835A Pending JP2017512398A (ja) 2014-02-27 2015-02-23 映像を提示する方法及び装置

Country Status (6)

Country Link
US (1) US10147199B2 (ja)
EP (1) EP3111419A1 (ja)
JP (1) JP2017512398A (ja)
KR (1) KR20160126985A (ja)
CN (1) CN106030658B (ja)
WO (1) WO2015128294A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11178531B2 (en) * 2019-03-26 2021-11-16 International Business Machines Corporation Link devices using their relative positions
US11172132B1 (en) * 2020-04-16 2021-11-09 Lenovo (Singapore) Pte. Ltd. Image save orientation determined based on orientation of object within image

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08191411A (ja) * 1994-11-08 1996-07-23 Matsushita Electric Ind Co Ltd シーン判別方法および代表画像記録・表示装置
JPH09214973A (ja) * 1996-01-30 1997-08-15 Tsushin Hoso Kiko 動画像符号化装置及び動画像復号化装置
JP2002051341A (ja) * 2000-08-02 2002-02-15 Fujitsu Ltd 動画像符号化装置および動画像の特殊効果シーン検出装置
US20050110875A1 (en) * 2003-11-24 2005-05-26 Yu-Fei Ma Robust camera motion analysis for home video
JP2009539273A (ja) * 2006-02-03 2009-11-12 イーストマン コダック カンパニー ビデオクリップからのキーフレーム候補の抽出
JP2010258702A (ja) * 2009-04-23 2010-11-11 Sony Corp 特徴区間判定装置、特徴区間判定方法、およびプログラム
US20110255844A1 (en) * 2007-10-29 2011-10-20 France Telecom System and method for parsing a video sequence
JP2013012821A (ja) * 2011-06-28 2013-01-17 Sony Corp 画像フォーマット判別装置、画像フォーマット判別方法および電子機器

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4209852A (en) * 1974-11-11 1980-06-24 Hyatt Gilbert P Signal processing and memory arrangement
US6459822B1 (en) * 1998-08-26 2002-10-01 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Video image stabilization and registration
AU768455B2 (en) * 2000-12-18 2003-12-11 Canon Kabushiki Kaisha A method for analysing apparent motion in digital video sequences
KR20040071945A (ko) * 2003-02-07 2004-08-16 엘지전자 주식회사 부화면 조정이 가능한 영상표시기기 및 그 방법
EP3196805A3 (en) 2003-06-12 2017-11-01 Honda Motor Co., Ltd. Target orientation estimation using depth sensing
US8279283B2 (en) * 2005-11-18 2012-10-02 Utc Fire & Security Americas Corporation, Inc. Methods and systems for operating a video surveillance system
JP4958497B2 (ja) * 2006-08-07 2012-06-20 キヤノン株式会社 位置姿勢測定装置及び位置姿勢測定方法、複合現実感提示システム、コンピュータプログラム及び記憶媒体
US8238612B2 (en) * 2008-05-06 2012-08-07 Honeywell International Inc. Method and apparatus for vision based motion determination
US9124804B2 (en) * 2010-03-22 2015-09-01 Microsoft Technology Licensing, Llc Using accelerometer information for determining orientation of pictures and video images
WO2012044218A1 (en) * 2010-10-01 2012-04-05 Saab Ab A method and an apparatus for image-based navigation
WO2012044216A1 (en) 2010-10-01 2012-04-05 Saab Ab Method and apparatus for solving position and orientation from correlated point features in images
US8879890B2 (en) * 2011-02-21 2014-11-04 Kodak Alaris Inc. Method for media reliving playback
US9082452B2 (en) * 2011-02-21 2015-07-14 Kodak Alaris Inc. Method for media reliving on demand
US8335350B2 (en) 2011-02-24 2012-12-18 Eastman Kodak Company Extracting motion information from digital video sequences
AU2012226283B2 (en) 2011-03-10 2016-09-15 Vidyo, Inc. Render-orientation information in video bitstream
US8744169B2 (en) * 2011-05-31 2014-06-03 Toyota Motor Europe Nv/Sa Voting strategy for visual ego-motion from stereo
US8708494B1 (en) * 2012-01-30 2014-04-29 Ditto Technologies, Inc. Displaying glasses with recorded images
US9529426B2 (en) * 2012-02-08 2016-12-27 Microsoft Technology Licensing, Llc Head pose tracking using a depth camera
US9367145B2 (en) * 2013-03-14 2016-06-14 Qualcomm Incorporated Intelligent display image orientation based on relative motion detection

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08191411A (ja) * 1994-11-08 1996-07-23 Matsushita Electric Ind Co Ltd シーン判別方法および代表画像記録・表示装置
JPH09214973A (ja) * 1996-01-30 1997-08-15 Tsushin Hoso Kiko 動画像符号化装置及び動画像復号化装置
JP2002051341A (ja) * 2000-08-02 2002-02-15 Fujitsu Ltd 動画像符号化装置および動画像の特殊効果シーン検出装置
US20050110875A1 (en) * 2003-11-24 2005-05-26 Yu-Fei Ma Robust camera motion analysis for home video
JP2009539273A (ja) * 2006-02-03 2009-11-12 イーストマン コダック カンパニー ビデオクリップからのキーフレーム候補の抽出
US20110255844A1 (en) * 2007-10-29 2011-10-20 France Telecom System and method for parsing a video sequence
JP2010258702A (ja) * 2009-04-23 2010-11-11 Sony Corp 特徴区間判定装置、特徴区間判定方法、およびプログラム
JP2013012821A (ja) * 2011-06-28 2013-01-17 Sony Corp 画像フォーマット判別装置、画像フォーマット判別方法および電子機器

Also Published As

Publication number Publication date
WO2015128294A1 (en) 2015-09-03
CN106030658A (zh) 2016-10-12
US20160371828A1 (en) 2016-12-22
US10147199B2 (en) 2018-12-04
CN106030658B (zh) 2019-07-23
KR20160126985A (ko) 2016-11-02
EP3111419A1 (en) 2017-01-04

Similar Documents

Publication Publication Date Title
US10198823B1 (en) Segmentation of object image data from background image data
US10217195B1 (en) Generation of semantic depth of field effect
WO2018137623A1 (zh) 图像处理方法、装置以及电子设备
EP3542304B1 (en) System and method for object tracking
JP6655878B2 (ja) 画像認識方法及び装置、プログラム
US9158985B2 (en) Method and apparatus for processing image of scene of interest
EP2619728B1 (en) An adaptable framework for cloud assisted augmented reality
US9008366B1 (en) Bio-inspired method of ground object cueing in airborne motion imagery
WO2020018359A1 (en) Three-dimensional living-body face detection method, face authentication recognition method, and apparatuses
US9542735B2 (en) Method and device to compose an image by eliminating one or more moving objects
WO2019057197A1 (zh) 运动目标的视觉跟踪方法、装置、电子设备及存储介质
JP2016015045A (ja) 画像認識装置、画像認識方法及びプログラム
US20180068451A1 (en) Systems and methods for creating a cinemagraph
EP2960859A1 (en) Constructing a 3d structure
CN113239937A (zh) 镜头偏移检测方法、装置、电子设备及可读存储介质
JP2017512398A (ja) 映像を提示する方法及び装置
WO2020244076A1 (zh) 人脸识别方法、装置、电子设备及存储介质
CN108334811B (zh) 一种人脸图像处理方法及装置
CN110610178A (zh) 图像识别方法、装置、终端及计算机可读存储介质
CN116051736A (zh) 一种三维重建方法、装置、边缘设备和存储介质
WO2022206679A1 (zh) 图像处理方法、装置、计算机设备和存储介质
US10282633B2 (en) Cross-asset media analysis and processing
JP2017016592A (ja) 主被写体検出装置、主被写体検出方法及びプログラム
CN111368608B (zh) 一种人脸识别方法、装置及***
CN113177967A (zh) 视频数据的物体追踪方法、***和存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180201

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180201

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181220

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20181227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190627

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20191111

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200406

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20200406

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20200507

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20200508

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20200717

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20200721

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20201118

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20201221

C23 Notice of termination of proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C23

Effective date: 20210419

C03 Trial/appeal decision taken

Free format text: JAPANESE INTERMEDIATE CODE: C03

Effective date: 20210520

C30A Notification sent

Free format text: JAPANESE INTERMEDIATE CODE: C3012

Effective date: 20210520