JP6888098B2 - デジタル静止画像へのモーション効果の追加 - Google Patents

デジタル静止画像へのモーション効果の追加 Download PDF

Info

Publication number
JP6888098B2
JP6888098B2 JP2019536817A JP2019536817A JP6888098B2 JP 6888098 B2 JP6888098 B2 JP 6888098B2 JP 2019536817 A JP2019536817 A JP 2019536817A JP 2019536817 A JP2019536817 A JP 2019536817A JP 6888098 B2 JP6888098 B2 JP 6888098B2
Authority
JP
Japan
Prior art keywords
movable
regions
frame
areas
fixed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019536817A
Other languages
English (en)
Other versions
JP2020504537A (ja
JP2020504537A5 (ja
Inventor
ローチェ,ドナルド
カラー,ブラッドリー
オストローバー,ルイス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Warner Bros Entertainment Inc
Original Assignee
Warner Bros Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Warner Bros Entertainment Inc filed Critical Warner Bros Entertainment Inc
Publication of JP2020504537A publication Critical patent/JP2020504537A/ja
Publication of JP2020504537A5 publication Critical patent/JP2020504537A5/ja
Application granted granted Critical
Publication of JP6888098B2 publication Critical patent/JP6888098B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • G06F16/743Browsing; Visualisation therefor a collection of video files or sequences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/802D [Two Dimensional] animation, e.g. using sprites
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20004Adaptive image processing
    • G06T2207/20012Locally adaptive
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Processing Or Creating Images (AREA)
  • Studio Circuits (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本開示は、デジタル静止画像にモーション効果(motion effect)を追加する方法および装置に関する。
様々なアニメーション技法が当技術分野で既知であるが、そのような技法は、しばしば、モーション・データまたはビデオ・データを必要とし、単一の静止画像だけまたはビデオ・データによって関係付けられていない静止画像の小さいセットが使用可能である場合に、動画の作成に不適切である。
たとえば、グラフィック・ノベルの画像は、しばしば、伝統的な紙媒体上での印刷のために1コマごとに描かれる。電子媒体(たとえば、電子ブック)のために同一コンテンツを準備する時には、劇的な効果またはより人目を引く外見のために、モーション効果を用いてグラフィック・ノベルの1つまたは複数の静的画像の質を高めることが望ましい場合がある。さらなる例として、電子媒体での使用のために、印刷広告で使用される販売促進静止画像にモーション効果を追加することが望ましい場合がある。
しかし、静止画像へのモーション効果の追加は、アーティストまたはアニメータによるかなりの手作業の処理を必要とし、一部の応用に関してコストを禁止的に高める。さらに、高解像度画像がアニメーションされる場合に、アニメーションされる高解像度フレームを作るために必要なメモリは、所望の電子製品に適用されるメモリ限界を超える可能性がある。したがって、プロデューサは、モーション効果の追加または画像の品質の低下の間で選択する必要がある場合がある。
したがって、従来技術の上記および他の制限を克服し、単一の静止画像だけまたはビデオ・データによって関係付けられていない静止画像の小さいセットが使用可能である場合に動画を作成することのできる新しい方法、装置、およびシステムを開発することが望ましい。利点は、ある種のモーション効果の追加を自動化しまたは合理化することと、モーショナイズ(motionize)された画像を保持するのに必要なコンピュータ・メモリの量を倹約しながら画像データの品質を保つこととを含むことができる。
この「発明の概要」および以下の「発明を実施するための形態」は、その諸部分が冗長な主題および/または補足的な主題を含む場合がある、統合された開示の相補的な部分と解釈されなければならない。いずれかのセクションでの省略は、統合された明細書で説明される要素の優先順位または相対的な重要性を示すものではない。セクションの間の相違は、それぞれの開示から明白になるように、代替実施形態の補足的な開示、追加の詳細、または異なる用語法を使用する同一実施形態の代替の説明を含む場合がある。
一態様では、デジタル静止画像にモーション効果を追加するためにメモリに結合されたプロセッサを含むコンピュータによる方法は、メモリからソース・デジタル静止画像を選択することと、ソース・デジタル静止画像を少なくとも2つの領域に分割することとを含むことができる。少なくとも2つの領域は、1つまたは複数のオーバーラップしない固定領域と固定領域の上にレイヤ化されるかのように扱われる1つまたは複数の可動領域とを含むことができる。分割することは、1つまたは複数の可動領域のそれぞれの幾何領域境界データ(たとえば、デジタル・マスク)およびモーション・データのセットに基づくものとすることができる。モーション・データは、メモリから取り出された、デジタル静止画像のモーショナイジング・パラメータのセットまたはデジタル静止画像のセットとすることができ、あるいはこれらを含むことができる。いくつかの実施形態では、オーバーラップしない領域のそれぞれは、単一の画素からなる。
この方法は、モーショナイズされた結果の任意のフレーム内の1つまたは複数の可動領域によって遮られる1つまたは複数の固定領域の各画素の値を判定することを含むことができる。これは、たとえば、画素が1つまたは複数の可動領域によって遮られていない第2のソース・デジタル画像から画素値を抽出することによって少なくとも部分的に、1つまたは複数の可動領域によって遮られる1つまたは複数の固定領域の各画素の値を判定することを含むことができる。その代わりにまたはそれに加えて、判定することは、連続する遮られた画素領域の境界に隣接する遮られていない画素値に基づいて値を手続き的に生成することによって少なくとも部分的に、1つまたは複数の可動領域によって遮られる1つまたは複数の固定領域の各画素の値を判定することを含むことができる。
この方法は、シーケンス内でビデオ・フレームのセットを生成することであって、ビデオ・フレームのセット内の各フレームは、1つまたは複数の固定領域の上にレイヤ化される各フレームの時刻に基づいてモーション・データによって変形される1つまたは複数の可動領域を含む、生成することと、不揮発性コンピュータ・メモリ内のビデオ・ファイルとしてビデオ・フレームのセットを記憶することとをさらに含むことができる。一態様では、ビデオ・フレームのセットを生成することは、ビデオ・フレームのセットをエンドレス・ループに配置することを含むことができる。
一態様では、1つまたは複数の可動領域のそれぞれのモーション・データは、独立に判定されたモーション・ベクトルを含むことができる。オプションで、独立に判定されたモーション・ベクトルは、ある経路上で経時的に変化する。したがって、1つまたは複数の可動領域のそれぞれのモーション・データは、経路上で経時的に変化するモーション・ベクトルを含むことができる。
この方法は、ビデオ・フレームのセットのそれぞれのフレームの1つまたは複数の可動領域を変形することをさらに含むことができる。変形することは、モーション・ベクトルと、各フレームの時刻と、カメラ位置および焦点距離を定義するデータとに基づいて1つまたは複数の可動領域をスケーリングすることを含むことができる。変形することは、選択されたぼかしアルゴリズムに基づいて各フレーム内の1つまたは複数の可動領域の少なくとも一部をぼかすことをさらに含むことができる。その代わりにまたはそれに加えて、変形することは、選択された鮮明化アルゴリズムに基づいて各フレーム内の1つまたは複数の可動領域の少なくとも一部を鮮明化することをさらに含むことができる。ぼかしまたは鮮明化は、経時的に変化し、または画素位置に伴って変化することができる。
別の態様では、この方法は、ビデオ・フレームのセットのそれぞれのフレームの1つまたは複数の固定領域を変形することを含むことができる。この変形することは、1つまたは複数の固定領域のうちの少なくとも1つに画素変形フィルタを適用することを含むことができる。フィルタの適用は、たとえば、各フレームの時刻に基づいてフィルタの入力パラメータを変更することを含むことができる。さらなる例として、フィルタの適用は、シーケンスの先行するフレームのフィルタの出力にフィルタを適用することを含むことができる。異なるフレームで異なるパラメータを有するフィルタを適用することは、固定領域内に現れる1つまたは複数の物体のモーションの幻覚または他の動的な視覚効果を作成するのに使用され得る。
したがって、本明細書で使用される時に、句「固定領域」は、画像のうちで、モーショナイズされた結果内で何も動かないように見える領域を記述しまたは暗示することを意図されたものではない。逆に、フィルタの動的適用またはパンもしくはズームなどの動作が、固定領域内の他の物体に対して、またはモーショナイズされた結果のフレーム(たとえば、ビデオ・フレーム)に対して、固定領域内でイメージングされる物体を動かし、または動いて見えさせる場合がある。その代わりに、用語「固定領域」は、経路に沿ってまたはモーション・ベクトルもしくはベクトルのセットに従ってなど、画像に対して相対的に全体としては移動しない領域を記述するのに使用される。しかし、可動領域は、なんらかの経路、ベクトルに従って、画像の他の部分に対して相対的に、移動し、増大し、縮小し、または回転する。さらに、可動領域が、可動領域自体の中で他の動的効果を得るために、固定領域と同一の形で処理されることも可能である。
本開示の別の態様では、デジタル静止画像にモーション効果を追加する装置は、画像プロセッサに結合されたメモリを含む。メモリは、プロセッサによって実行された時に、装置に、上で説明された方法およびオプションで1つまたは複数の追加動作を実行させるプログラム命令を保持することができる。
前述のおよび関連する目的の達成のために、1つまたは複数の例は、本明細書で後に十分に説明され、特許請求の範囲で具体的に指摘される特徴を含む。前述の説明および添付図面は、ある種の例の態様を詳細に示し、例の原理を使用できる様々な形のうちの少数を示す。他の利点および新規の特徴は、すべてのそのような態様およびその同等物を包含する、図面および開示される例に関連して検討される時に、以下の「発明を実施するための形態」から明白になる。
本開示の特徴、性質、および利点は、図面に関連して解釈される時に下に示された「発明を実施するための形態」から明白になり、図面では、同様の符号が、本明細書および図面の全体を通じて対応して同様の要素を識別する。
デジタル静止画像にモーション効果を追加する装置の態様を示すブロック図である。 デジタル・ディスプレイ・デバイスによって表示されるデジタル静止画像の部分を示す概略図である。 モーショナイズされたデジタル画像を生成する、デジタル・ディスプレイ・デバイスによって表示された2つのデジタル静止画像の部分を示す概略図である。 モーショナイジングに使用される様々なデータ・パラメータを示すデータ・テーブルである。 モーショナイジング装置によって実行され得るデジタル静止画像をモーショナイズする方法の要素を示す流れ図である。 図5によって示されるデジタル静止画像のモーショナイジングの一部であるビデオ・シーケンスの生成を示す流れ図である。 モーショナイジング装置によって実行され得るデジタル静止画像をモーショナイズする方法の他の要素を示す直線流れ図である。 デジタル静止画像にモーション効果を追加するモーショナイジング装置の態様を示すブロック図である。
これから、様々な態様を、図面を参照して説明する。以下の説明では、説明において、1つまたは複数の態様の完全な理解を提供するために、多数の特定の詳細を示す。しかし、様々な態様が、これらの特定の詳細なしで実践され得ることは明白であろう。他の場合には、これらの態様の説明を容易にするために、周知の構造およびデバイスをブロック図形式で示す。
図1を参照すると、本開示は、デジタル静止画像にモーション効果を追加する装置102およびシステム100に関する。装置102およびシステム100は、装置102のプロセッサ104によって実行された時に、静止画像データをモーショナイズする方法をプロセッサ104に実行させるプログラム命令108を保持するメモリ106を含むことができる。これらの方法は、たとえば、実際の運動データのビデオが問題のシーンに関して入手可能ではない時、または伝統的なアニメーション技法(たとえば、中割りまたはロトスコープ)を使用するそのようなビデオの処理が非効率的またはあまりに高コストである場合に、静止画像データをモーショナイズするのに有用である可能性がある。
本発明の一態様では、デジタル静止画像112(たとえば、TIFF、GIF、JPEG、PNGなどのフォーマットのファイル)が、コンピュータ上で動作するアルゴリズム的モーショナイジング・プロセスに入力として供給される。たとえば、画像112は、デジタル形式で作成され、電子メモリ内にデジタル・ファイルとして常駐する場合があり、この電子メモリ内で、画像は、モーショナイジング・プロセスを実行するプロセッサによって読み取られ得る。代替案では、画像は、物理媒体から電子フォーマットにスキャンされ、メモリ内に配置され得る。本方法がその上で動作するプロセス108およびコンピュータ・ハードウェア104は、本明細書では時々、一緒に「モーショナイジング・モジュール」と呼ばれる。モーショナイジング・パラメータ110は、たとえばデータ・ストアから読み取られたバッチ・データとして、モーショナイジング・モジュールに供給され、あるいは、ユーザ・インターフェースを介して入力される。モーショナイジング・モジュールの様々なモーショナイジング・パラメータ110および関連するアルゴリズム108を、順番に説明する。これらのアルゴリズムは、並列動作または順次動作によって組み合わされ、デジタル・ディスプレイ・デバイス120上に表示され得るものなどの出力のモーショナイズされたデジタル画像112に追加される様々なモーション効果を作成することができる。ユーザは、端末118を介してモーショナイジング・モジュールと対話し、モーショナイジング・パラメータ110の値をセットすることを含むがこれに限定されないユーザ入力をモーショナイジング・モジュールに供給することができる。
一態様では、アルゴリズム108は、スチール(1つまたは複数)の物体またはレイヤを一意に識別することと、1)1つのみ(または複数)の異なるスチール写真ソースを提供することによって、遮られた情報を追加することとを含む。図2を参照すると、これらの画像のすべてが、本明細書では「キー」フレームと呼ばれ、たとえば、移動するサッカー・ボールのシーン200では、キー・フレームは、サッカー・ボール204の背後にあるもの208を遮るはずである。図示の画像200は、少なくとも3つの別個の領域すなわち、サッカー・ボール204、芝生206、および空202を含む。1つの代替案では、システム100は、遮る物体204の周囲の境界条件に基づいて、遮られたデータ208を充填することができる。たとえば、ボール204が芝生によって囲まれている場合には、補間および転写アルゴリズムが、芝生領域206に類似するパターンを用いて遮られた空間208を充填し、遮られた領域の境界の周囲でこれをマッチさせるのに使用され得る。これは、複製されるか、遮られた部分を充填するのに必要な画素パターンを生成するための基礎として使用される、芝生画像206の部分をオペレータが選択することによって支援され得る。
図3を参照すると、出力画像320を作るために2つの入力静止画像302、310のセット300を使用するアルゴリズムの動作が示されている。第1の画像302は、雲領域307、ボール306、芝生308、および空304を含む第1のキー・フレームを表す。ボールなしまたはX軸もしくはY軸に沿った(またはさらにZ軸方向に)異なる位置にボール312があるのいずれかのシーンの単一のキー・フレーム310を、フレーム310に示されているように加算することによって、システム100は、モーショナイズされた出力画像320を作成する時に、そうでなければ隠されている情報(たとえば、領域208)を充填し、3つすべての軸に沿った識別された物体(すなわち、サッカー・ボール)の様々な運動をも可能にし、同一の概念を、実際の画像データの代わりにメタデータを供給することによって達成することができる。
一態様では、X軸およびY軸に沿った(画像データの平面内の)運動だけではなく、Z軸運動(画像平面に垂直)が、所与のカメラ位置および焦点距離に基づいてシミュレートされ得る。たとえば、アルゴリズムは、フレーム302内のボール306と第2のフレーム310内のボール312とが同一の物体であることを認識することと、その後、1つまたは複数の対応する点(この場合には、中央点)に基づいてベクトル322を計算することとによって、モーショナイジング・ベクトル322を導出することができる。同様に、システム100は、Z軸内でのカメラに対する相対的なボールの運動に対応するスケール・パラメータおよび/またはぼかし係数を計算することができる。たとえば、ボールがより近くに動く場合に、スケール係数(たとえば、200%)が、ボール306、312の画像を比較することによって計算され得る。画像306または312が焦点ずれである場合には、ぼかし係数を計算することもできる。スケールおよびぼかしは、キー・フレーム302と310との間で線形補間され得、あるいは、より洗練された補間技法が、より興味深いまたは真に迫ったモーションを実現するのに使用され得る。たとえば、非線形補間法が、スケール、ぼかし、または別のパラメータの変化を、非線形曲線、たとえば指数曲線、二次曲線、または三角曲線に従わせるのに使用され得る。同様に、同一の入力画像302、310を使用して、システム100は、任意の2つの他の対応する物体、たとえば第1の雲307および第2の雲314の異なる位置および方位に基づいて、異なる直線運動ベクトル324および回転ベクトル326を独立に計算することができる。
画像306、312は、剛体または弾性体としてモデル化され得る単一の物体(たとえば、ボール)としても分析され得る。したがって、この本体は、それ自体の回転ベクトルまたは変形ベクトルを与えられ得、その既知の表面の着色は、それに応じて回転されまたは変形され得る。すべてのビューで遮られている表面着色は、遮られた画像データを提供する、本明細書で説明される方法のいずれかを使用して提供され得る。
画像平面内の運動に関して、背景データの遮りは、オーバーレイによって計算され得、その後に、問題の物体(1つまたは複数)がある位置から第2の位置に十分に移動した後に完全に明らかにされ得る。たとえば、2枚の写真で、対象のサッカー・ボールがある位置から別の位置に再位置決めされ、これによって、その第1の位置によって遮られていた背景を完全に露出すると仮定する。Z軸サッカー・ボールの例(図示せず)では、元々の遮られた情報の一部のみ(100%ではない)が、たとえば最初にズーム・インされたキー・フレームからズーム・アウトした時に、サッカー・ボールの運動によって明らかにされる可能性がある。
知覚された運動の方向は、2つ(以上)のキー・フレームが処理される順序を変更することによって制御され得る。これは、2つ(以上)のキー・フレームがX軸、Y軸、および/またはZ軸での関心を持たれている物体(1つまたは複数)の位置決めにおいて異なる場合に、変化する度合であてはまる。キー・フレーム処理の順序は、運動の結果のビデオ方向(1つまたは複数)に関係し、これは、画素のベクトル(スカラではなく)変位によって判定される。運動の方向性は、キー・フレーム処理の順序に依存して変化する可能性があり、結果の運動は、異なる効果のために調整され得る。たとえば、少なくとも2つのキー・フレーム画像すなわち、ボールが見る人からより遠い(z軸)第2のキー・フレーム(「ズーム・アウトされている」)とは異なってボールが見る人により近い(z軸)(「ズーム・インされている」)第1のキー・フレームを与えられて、処理の順序は、モーショナイズされた出力がボールに「ズーム・イン」するのか「ズーム・アウト」するのかを判定するのに使用され得る。結果のモーションは、フレームが第1−第2のシーケンスで処理される場合にはズーム・アウトし、第2−第1のシーケンスで処理される場合にはズーム・インする可能性がある。
さらなる例として、モーションは、右から左へのキー・フレーム302、310および結果の運動とは異なって、第1のキー・フレームが、左側にサッカー・ボールを示し、第2のフレームが、右側にサッカー・ボールを示す場合に、右から左または左から右とすることができ、垂直運動も、同様に計算され得る。さらに、キー・フレーム処理順序の相違は、異なるぼかし効果すなわち、背景または前景またはその中の物体(1つまたは複数)の異なる焦点深度、その中の物体(1つまたは複数)の異なる運動特性、その中の物体(1つまたは複数)の一部のタイミングの異なる運動(1つまたは複数)、またはシーン内の一部の物体(1つまたは複数)の異なる詳細のレベルによって証明され得る。
様々なパラメータによってもたらされるモーショナイズされた効果を追加するアルゴリズム108は、異なる効果のためのフィルタまたは関数(たとえば、Adobe Photoshop(商標)、GIMP(商標)、および同様の画像処理ソフトウェアによって提供される)を含むことができる。したがって、不均一なぼかし、鮮明化、またはモーション(たとえば、ガウス・フィルタまたはガウス関数を使用する)が、不均一な分布での問題のぼかし、鮮明化、またはモーションを分散させるために使用され得る。たとえば、輪郭強調で使用されるものなどの鮮明化フィルタまたは鮮明化関数が、関連する物体エッジを検出することができ、識別されたエッジに対する低域フィルタリングを介して、結果のより鋭明なエッジを用いて高周波数を高めることができる。
たとえば、移動する宇宙カプセルの背後の星空の画像をモーショナイズする時には、相対的に固定された星(おそらく編集上関係する星)は、ぼかされるのではなく鮮明化される可能性がある。モーショナイジング効果は、たとえば、星のフィルタリングされていないキー・フレーム画像と鮮明化されたキー・フレーム画像との間でサイクルする可能性がある。いくつかの場合に、鮮明化効果またはぼかし効果は、明らかに異なる焦点深度(z軸ズーム・イン/アウト)変化を示す2つのキー・フレームの間の差から、または窓、ガーゼのひだ、ちり雲、せっけんの泡、その他などの部分的に透過する、部分的に不透明な、または半透明な媒体を介して見る(あるキー・フレームの少なくとも重要な部分の部分的に透過する眺めが、他のキー・フレームとは異なる)ことから生じる可能性がある。ぼかすことまたは鮮明化と共に、アルゴリズムは、写真測量技法を適用することによるなど、光源を識別し(または導出し)、適当な影または陰影を追加するために、第2のキー・フレームを含むことができる。
一態様では、モーショナイジング・アルゴリズムは、たとえば単一のキー・フレームにズーム・インすることと、前景を鮮明化すると同時に背景をぼかす(おそらく、上で概要を示したように不均一な形で)ことによって、第2のキー・フレームを第1のキー・フレームから作成することによって(またはその逆)、少なくとも2つを要求するのではなく1つのキー・フレームだけに頼ることができる。やはり、サッカー・ボールの例を参照すると、現在は「より大きい」ボールは、ズーム・インされたフレーム内でより多くの背景を遮る。
図4を参照すると、デジタル静止画像をモーショナイズするパラメータ400は、メタデータとして記録され、画像内のどの部分または物体(1つまたは複数)がモーショナイズされるのか、どの部分または物体が静的なままになるのか、およびどの画像変形が、たとえばぼかし、鮮明化、不均一な運動、均一な運動、一定のモーション、または一定ではないモーションなど、モーショナイジング効果の一部になるべきなのかを識別するのに使用され得る。
領域パラメータ402は、たとえば、モーショナイズされる画像領域および静的なままになる領域の位置および幾何形状と、領域の位置、形状、または方位が静的である(固定される)のか、モーショナイズの対象になるのかどうかと、モーショナイズされる領域が剛体または変形体のどちらとしてモーショナイズされるべきかとを含むことができる。
モーション・データ・パラメータ404は、たとえば、モーション経路と、回転の中心と、回転モーションまたは直線モーションの速度、加速度、および方向、モーショナイズされる物体または領域のスケール(たとえば、100%、50%、200%)、非剛体パラメータ(たとえば、弾性、粘性、力ベクトル)と、任意のスカラまたはベクトルのモーション・データ・パラメータの変化の速度とを含むことができる。
画像の固定された(モーショナイズされない)領域または移動しない部分のパラメータ406は、モーショナイズされる領域の運動によって明らかにされる遮られた領域にテクスチャを与えるためのデータ、フィルタ(たとえば、ぼかし、鮮明化、エッジ検出、または様々な特殊効果)、フィルタ進行(たとえば、異なるフィルタが適用される順序)、および固定されたデータ・パラメータ406によって制御される画像内のすべての変化の速度を含むことができる。
照明および彩色を制御するパラメータ408は、たとえば、光源の位置および方向と、輝度と、色相、彩度、ならびに照明および彩色パラメータ408によって制御される画像内のすべての変化の速度とを含むことができる。
出力ビデオ・パラメータ410は、たとえば、画像フレーム・サイズ、ソース・キー・フレーム識別子、出力フレーム数、フレーム・レート、およびビデオ・フォーマットを含むことができる。適切なビデオ・フォーマットは、たとえば、MPEG−1、MPEG−2、MPEG−4、Adobe(商標)Flash、Windows(商標)Media Video、Quicktimeファイル・フォーマット、GIF、WebM、3GPP、3GPP2、Nullsoft(商標)ストリーミング・ビデオ、または他の適切なフォーマットを含むことができる。通常、上記などの出力ビデオ・パラメータは、単一のファイルまたはストリーミング・セッション内で変更されない。
モーショナイジング・アルゴリズム108は、キー・フレーム内の相違と、望まれる運動のタイプ、距離、および/または速度とに基づいてフィルタに関する「スマートな」決断を行うように設計され得る。ユーザは、セッティングまたはプリファレンス・インターフェース内でそのような決断をオーバーライドすることを可能にされ得る。生の画像キー・フレームと一緒に提供されるメタデータが、出力、たとえば前述の「一定のまたは一定ではないモーション」の例を調整するのに使用され得る。一態様では、画像メタデータは、XMLタグ、VRMLタグ、または別々のファイル内の2進データとしてさえ提供され得る。
メタデータは、たとえば、ユーザ・フィードバックに応答して同一のキー・フレームにメタデータの異なるセットを適用し、異なる結果を出力することによって、モーショナイズされた画像とのユーザ対話性をサポートするのにも使用され得る。モーショナイジング・モジュールは、メタデータ値に応じて、キー・フレーム・データまたは導出されたフレーム・データを異なってアニメートしまたは他の形で操作することができる。たとえば、バットマンがバットラング(コウモリ形のブーメラン・デバイス)を投げるシーンでは、モーショナイジング・モジュールは、ユーザがどのメタデータのセットを選択するのかに応じて、x平面、y平面、またはz平面内で移動させ、時計回りまたは反時計回りに回し、あるいは詳細のぼかしもしくは鮮明化の変化を他の形で変更して、バットラングをアニメートすることができる。
他の態様では、一意に識別された物体またはレイヤを使用して、モーショナイジングは、a)一定のモーションだけではなく、可変速モーション、たとえば、穀物を乱す風の可変風を伴う穀物の琥珀色の波、b)モーションのレイヤ、すなわち、異なる平面またはレイヤの異なるモーションを示すレイヤ、たとえば、背景に雲を有する穀物の琥珀色の波および異なる速度またはレートで動く小麦を有する前景内の小麦対雲のパノラマ的キー・フレームを含むことができる。
パラメータをモーショナイジング・モジュールに追加して、結果の外見の質を高めるぼかし係数を制御することができる。たとえば、ぼかし係数は、システムがぼかすことを許されるソース画素(1つまたは複数)に隣接する画素の個数を指定することができる。この係数は、画像と共に、別々のデータとして帯域外で、または単純にメタデータとして提供され得る。
モーショナイジング・モジュールは、アニメートされた絵の任意の適切なデジタル・フォーマットのアニメーション・ループを含む、モーショナイズされたデジタル画像を出力する。出力のモーショナイズされたデジタル画像は、静止画像が、たとえば電子ブック、電子雑誌、デジタル・グラフィック・ノベル、ウェブサイト、絵画もしくはポスタ、またはユーザ・インターフェース内で使用される任意の文脈で、静止画像の代わりに使用され得る。一実施形態では、モーショナイズされた画像が、ユーザがそれに電子ソース画像を提供する電子的な「絵画用額縁」または「ポスタ額縁」内に表示される。電子的な額縁は、ある種の所定のモーショナイジング・アルゴリズムを自動的に作成するようにプログラムされ得る。たとえば、オーバーラップする画像領域を有する複数の供給された画像を検出する際に、モーショナイジング・モジュールは、自動的にパノラマ画像を縫い合わせ、パノラマ画像より実質的に小さいビュー・フレームを使用して画像上でゆっくりとパンすることによって、モーショナイズされたサイクルを作成することができる。さらなる例として、複数の画像の背景が同一であるが、前景物体が移動したことを検出する際に、モーショナイジング・モジュールは、前景物体のアニメーションを自動的に生成することができる。
前述の詳細は、モーショナイジング装置102によって実行され得る、1つまたは複数の静止画像をモーショナイズする方法に組み込まれ得る。図5は、デジタル静止画像をモーショナイズする1つのそのような方法500の要素を示す。502では、装置が、モーショナイジングのために1つまたは複数の入力静止画像を選択し、1つまたは複数の選択された画像のセットをもたらす。一態様では、装置は、ユーザ入力、たとえば、装置がアクセス可能なコンピュータ・メモリ位置内の1つまたは複数の静止画像ファイルのユーザ選択に応答して画像を選択することができる。その代わりにまたはそれに加えて、装置は、指定された電子ディレクトリ・フォルダまたは他のデータ構造内に配置された静止画像ファイルを分析し、モーショナイジング方法500への入力としての使用に適する複数の類似する画像を識別することができる。別の代替案では、装置は、技巧的な効果または他の効果のために代替のモーショナイズされたビデオを作成するモーショナイジング・プロセスへの入力としての使用の適切性に基づいて、ビデオ・ファイルから複数のビデオ・フレームを選択することができる。画像選択502は、モーショナイズされた出力との互換性を保証するための画像フォーマット、解像度、およびサイズのチェック、物体認識のための画像内容の分析、光源、露出セッティング、遮られた区域の識別、ならびに、選択されたモーショナイジング・プロセスおよび所望の出力に関係する他の動作を含むことができる。一般に、選択されたセット内の画像は、同一の画像サイズおよび画素解像度を有する必要があり、あるいは、それを有するように変換される必要がある。
入力画像の選択502と平行に、前記選択502の前に、または前記選択502の後に、モーショナイジング装置は、1つまたは複数の選択された画像のセットに適用すべきモーショナイジング・パラメータ518を判定することができる(504)。モーショナイジング・パラメータ518は、1つまたは複数の様々なソースから、すなわち、デフォルト(所定の)リストから導出され、ユーザ入力から導出され、アルゴリズム的に生成され、またはランダムに生成され得る。多くの実施形態では、パラメータ・ソースの混合物が使用され得る。たとえば、多くのパラメータは、固定されまたは所定のものとされるが、ユーザ・インターフェースを介するユーザ変更の対象とすることができ、他のパラメータは、入力画像の品質に基づいてアルゴリズムによって選択され得、他のパラメータは、ランダムに変更され得る。ユーザは、適切なユーザ・インターフェースを介してモーショナイジング・パラメータを選択することができる。特定のモーショナイジング・パラメータの例が、前述の説明および図4で提供されている。他のパラメータも適切である可能性がある。一般に、モーション・パラメータの判定504は、システム・ユーザによって指定されるなんらかの所望の結果を達成する可能性が高いパラメータの選択に基づくものでなければならない。
506では、モーショナイジング装置が、502で選択された入力画像および504で判定されたモーショナイジング・パラメータに基づいて、ビデオ・シーケンスを生成することができる。ビデオ・シーケンスの生成506は、モーショナイジング・パラメータに基づき、補間、選択的フィルタリング、および本明細書で説明される他のモーショナイジング技法(所望の出力フォーマットのために任意の適切なアニメーション・アルゴリズムと組み合わされ得る)を使用して、複数のキー・フレームおよびすべての介在するフレームを生成することを含むことができる。アニメーション・アルゴリズムは、元の静止画像からのモーショナイジングに適合されなければならず、既知の2Dまたは3Dのコンピュータ・アニメーション法を介して入手される情報をも含むことができる。ビデオ・シーケンスの生成506は、選択されたビデオ・フォーマットに従ってビデオ・ファイルを生成することと、生成されたビデオ・ファイルをコンピュータ・メモリまたは記憶媒体に保存することとをさらに含むことができる。ビデオ・シーケンスの生成のさらなる詳細は、図6に関連して、本開示の他所で提供する。
508では、モーショナイジング装置が、適切なディスプレイ・デバイス、たとえば、コンピュータ・モニタもしくは他のディスプレイ・スクリーン、ビデオ・プロジェクタ、または仮想現実感バイザを使用して、ビデオ・シーケンスの生成506から生じた1つまたは複数のビデオ・シーケンスを表示することができる。ユーザは、ビデオを再検討することができ、モーショナイジング装置は、510で、是認または不賛成を示す信号を受け取ることができる。ビデオが是認される場合には、モーショナイジング装置は、1つまたは複数の選択されたビデオ・ファイル・フォーマットでビデオ・シーケンスを記憶し514、方法500を終了することができる。ビデオが是認されない場合には、モーショナイジング装置は、1つまたは複数のモーショナイジング・パラメータを調整し512、調整されたモーショナイジング・パラメータに基づいて新しいビデオ・シーケンスを生成することができる(506)。
モーショナイジング方法500のクリティカルな動作は、ビデオ・シーケンスの生成506を含む可能性がある。図6は、デジタル静止画像のモーショナイジング500の一部としてのビデオ・シーケンスの生成のより詳細な態様600を示す。示された動作は、単なる例である。602では、モーショナイジング装置が、1つまたは複数のデジタル静止画像の領域を選択することができる。たとえば、領域は、画像を構成するグリッド・アレイ内の第1のグリッドとすることができる。代替案では、またはこれに加えて、領域を、画像内に現れる認識された移動する物体とすることができる。
604では、モーショナイジング装置が、モーショナイジング・パラメータに基づいて現在の領域を変形することができる。現在のフレームが、記憶された入力画像データから直接に供給されるキー・フレームである場合には、適用される変形を、ヌルとすることができ、これは、その領域が未変更のまま残され得ることを意味する。現在のフレームがキー・フレームではない場合には、1つまたは複数のモーショナイジング動作、たとえば、ぼかし、鮮明化、移動、以前に遮られていた部分の充填、光源の移動、照明の色または強度の変更などが、本明細書で説明されるように適用され得る。1つまたは複数の異なる変形が、1つもしくは複数の対応するレイヤまたは1つの共有されるレイヤに適用され得る。606では、モーショナイジング装置が、現在のフレームの領域キャッシュ608に結果を書き込むことができる。610では、モーショナイジング装置が、変形が現在のフレームに関して完了したかどうかを判定する。追加の領域が変形を必要とする場合には、装置は、画像の次の領域を選択し612、次の領域に関して動作604、606、610を繰り返す。
610で、装置が、領域が変形をこれ以上必要としないと判定する場合には、装置は、領域キャッシュ608内の領域データから一体化された変形されたフレームをコンパイルすることができる(614)。フレームをコンパイルした後に、装置は、領域キャッシュを空にするか(616)、現在のフレームの終了および次のフレームの開始を示すキャッシュ内のフラグをセットすることができる。618では、装置が、変形されたフレームをフレーム・キャッシュ624(フレーム・バッファとも呼ばれる)内に記憶することができる(618)。
その後、装置は、620で、終了したシーケンスの判定されたパラメータ(たとえば、フレーム数)に基づいて、現在のビデオ・シーケンスが終了したかどうかを判定することができる。ビデオ・シーケンスが終了していない場合には、装置は、次のフレームを処理するようにそれ自体をセットし(622)、箱602にループ・バックすることができる。ビデオ・シーケンスが終了している場合には、装置は、完了したフレームをシーケンス内に配置することと、フレーム・シーケンスを1つまたは複数の所望のビデオ・フォーマットに変換することとによって、フレーム・キャッシュ624内に記憶されたフレームからビデオ・シーケンスをコンパイルする626ことができる。所望のビデオ・ファイルが作成された後に、装置は、ビデオ生成動作600の次の適用のためにフレーム・キャッシュを空にし(628)、結果のビデオ・ファイルをビデオ・プレイヤ、ストレージ・デバイス、またはその両方に出力することができる(630)。
方法500およびより詳細な動作600は、図7によって示される方法700によって要約される。方法700は、デジタル静止画像へのモーション効果の追加のためにメモリに結合されたプロセッサを含むコンピュータ、たとえばモーショナイジング装置102によって実行され得る。方法700は、メモリからソース・デジタル静止画像を選択することを含むことができる(710)。この方法は、ソース・デジタル静止画像を少なくとも2つの領域に分割することをさらに含むことができる(720)。少なくとも2つの領域は、1つまたは複数のオーバーラップしない固定領域と固定領域の上にレイヤ化されるかのように扱われる1つまたは複数の可動領域とを含むことができる。「レイヤ化されるかのように扱われる」は、可動領域がソース画像内の固定領域とは別々の1つまたは複数のレイヤ内に存在しようとしまいと、ソース画像を処理する時に、可動領域が、一時的にのみの場合であっても固定領域とは別々の1つまたは複数のレイヤ内で処理されるか、または別々のレイヤ内に存在するかのように別々に処理されるかのいずれかであることを意味する。分割は、1つまたは複数の可動領域のそれぞれの幾何領域境界データ(たとえば、デジタル・マスク)およびモーション・データのセットに基づくものとすることができる。代替案ではまたはこれに追加して、分割は、グリッド内の正方形または長方形など、固定された幾何領域に基づくものとすることができる。モーション・データは、メモリから取り出された、1つのデジタル静止画像またはデジタル静止画像のセットのモーショナイジング・パラメータのセットとすることができ、あるいはこれを含むことができる。いくつかの実施形態では、オーバーラップしない領域のそれぞれは、単一画素ほどの少数からなるものとすることができる。
方法700は、1つまたは複数の可動領域によって遮られる1つまたは複数の固定領域の各画素の値を判定することをさらに含むことができる(730)。これは、たとえば、画素が1つまたは複数の可動領域によって遮られていない第2のソース・デジタル静止画像から画素値を抽出することによって少なくとも部分的に、1つまたは複数の可動領域によって遮られる1つまたは複数の固定領域の各画素の値を判定することを含むことができる。代替案ではまたはこれに追加して、判定は、連続する遮られた画素領域の境界に隣接する遮られていない画素値に基づいて値を手続き的に生成することによって少なくとも部分的に、1つまたは複数の可動領域によって遮られる1つまたは複数の固定領域の各画素の値を判定することを含むことができる。
方法700は、シーケンス内でビデオ・フレームのセットを生成することであって(740)、ビデオ・フレームのセット内の各フレームは、各フレームの時刻に基づいてモーション・データによって変形され、1つまたは複数の固定領域の上にレイヤ化される、1つまたは複数の可動領域を含む、生成することと、不揮発性コンピュータ・メモリ内のビデオ・ファイルとしてビデオ・フレームのセットを記憶することとをさらに含むことができる。一態様では、ビデオ・フレームのセットの生成は、ビデオ・フレームのセットをエンドレス・ループに配置することを含むことができる。
一態様では、1つまたは複数の可動領域のそれぞれのモーション・データは、独立に判定されたモーション・ベクトルを含むことができる。オプションで、独立に判定されたモーション・ベクトルは、経路上で経時的に変化する。したがって、1つまたは複数の可動領域のそれぞれのモーション・データは、経路上で経時的に変化するモーション・ベクトルを含むことができる。たとえば、プロセッサは、領域が経路に沿って移動する時にフレームの間で適用されるモーション・ベクトルのスケール・パラメータまたは方向パラメータを変更することができる。プロセッサは、たとえば異なるアルゴリズムまたは異なるパラメータを使用して、別の領域のモーション・ベクトルとは独立に各領域のモーション・ベクトルを判定することができる。
方法700は、ビデオ・フレームのセットのそれぞれのフレームの1つまたは複数の可動領域を変形することをさらに含むことができる。変形は、モーション・ベクトルと、各フレームの時刻と、カメラ位置および焦点距離を定義するデータとに基づいて1つまたは複数の可動領域をスケーリングすることを含むことができる。変形は、選択されたぼかしアルゴリズムに基づいて各フレーム内の1つまたは複数の可動領域の少なくとも一部をぼかすことをさらに含むことができる。代替案ではまたはそれに加えて、変形は、選択された鮮明化アルゴリズムに基づいて各フレーム内の1つまたは複数の可動領域の少なくとも一部を鮮明化することをさらに含むことができる。ぼかしまたは鮮明化は、経時的にまたは画素位置に伴って変化することができる。たとえば、プロセッサは、フレームの間で、周期的に、または非周期的に、ぼかしアルゴリズムまたは鮮明化アルゴリズムを変更することができる(たとえば、ぼかしアルゴリズムまたは鮮明化アルゴリズムのパラメータを変更することによって)。この変化は、特殊視覚効果として出力内に可視の差を引き起こすことができる。さらに、プロセッサは、画素の位置または画素の領域に基づいてぼかしアルゴリズムまたは鮮明化アルゴリズムを変更することができる。たとえば、プロセッサは、画像の定義された参照フレーム内の画素の位置とパラメータ値との間の線形関係または非線形関係に基づいて、初期値とターゲット値との間でアルゴリズムのパラメータ値を補間することができる。そのような補間は、変形する領域と変形しない領域との間の滑らかな推移または他の特殊効果(たとえば、波、熱ノイズなど)を提供するのに使用され得る。
別の態様では、方法700は、ビデオ・フレームのセットのそれぞれのフレームの1つまたは複数の固定領域を変形することを含むことができる。変形は、1つまたは複数の固定領域のうちの少なくとも1つに画素変形フィルタを適用することを含むことができる。フィルタの適用は、たとえば、各フレームの時刻に基づいてフィルタの入力パラメータを変更することを含むことができる。さらなる例として、フィルタの適用は、シーケンスの先行するフレームのフィルタの出力にフィルタを適用することを含むことができる。方法700は、1つまたは複数の元のデジタル静止画像がその中でモーショナイズされているビデオ・ファイルとして、上で説明した動作によって準備されたビデオ・フレームのセットを記憶すること750を含むことができる。
前述の開示に鑑みて、開示される主題に従って実施され得る方法論が、複数の流れ図を参照して説明された。説明の単純さのために、方法論は、一連のブロックとして図示され、説明されるが、一部のブロックが、図示され本明細書で説明されるものとは異なる順序で、かつ/または他のブロックと同時に実行され得るので、請求される主題が、ブロックの順序によって限定されないことを理解し、了解されたい。さらに、すべての図示されたブロックが、本明細書で説明される方法論を実施するために必ずしも要求されるものではない。さらに、いくつかの動作は、説明されたが、図示の単純さのために図示されていない。
本開示の別の態様では、図8を参照すると、デジタル静止画像にモーション効果を追加する装置800は、画像プロセッサ810に結合されたメモリ816を含む。メモリは、プロセッサ810によって実行された時に、装置800に、上で説明された方法500または700およびオプションでこれらの方法に関連して説明した1つまたは複数の追加動作を実行させるプログラム命令を保持することができる。装置800は、デジタル・ビデオ・ファイルをビデオ・ディスプレイ・デバイス、たとえばLCDディスプレイまたは類似物による使用に適するビデオ信号に変換するディスプレイ・アダプタ814をさらに含むことができる。装置800の構成要素は、バス819または別の電子コネクタによって結合され得る。
装置800は、デジタル静止画像を固定領域および可動領域に分割する機能構成要素802を含むことができる。構成要素802は、デジタル静止画像を固定領域および可動領域に分割する手段を含むことができる。前記手段は、プロセッサ810およびメモリ816を含むことができ、メモリは、前記分割のためのアルゴリズムを保持し、プロセッサは、そのアルゴリズムを実行する。そのアルゴリズムは、たとえば、複数の静止画像内の物体を比較することと、可動領域から固定領域をマスク・オフすることとによって、画像を固定領域および可動領域に分割することを含むことができる。
装置800は、可動領域および静止領域を変形する機能構成要素804を含むことができる。構成要素804は、前記変形のための手段を含むことができる。前記手段は、プロセッサ810およびメモリ816を含むことができ、メモリは、前記変形のためのアルゴリズムを保持し、プロセッサは、そのアルゴリズムを実行する。そのアルゴリズムは、たとえば、モーション・ベクトルに基づいて次のフレーム内の画素位置を計算することと、運動によって見せられる遮られた背景画像部分を充填することと、ぼかし、鮮明化、または色調整などのフィルタリング動作に基づいて画素の彩色を変更することとを含むことができる。
装置800は、変形された固定領域および可動領域からビデオ・フレームを合成する機能構成要素805を含むことができる。構成要素805は、前記合成のための手段を含むことができる。前記手段は、プロセッサ810およびメモリ816を含むことができ、メモリは、前記合成のためのアルゴリズムを保持し、プロセッサは、そのアルゴリズムを実行する。そのアルゴリズムは、たとえば、移動される領域を固定領域の上でレイヤ化することと、固定された背景レイヤと一致するように、すべての見せられた画素内で着色することとを含むことができる。
装置800は、ビデオ・ファイルのためにビデオ・フレームを順序付ける機能構成要素806を含むことができる。構成要素806は、前記順序付けのための手段を含むことができる。前記手段は、プロセッサ810およびメモリ816を含むことができ、メモリは、前記順序付けのためのアルゴリズムを保持し、プロセッサは、そのアルゴリズムを実行する。そのアルゴリズムは、たとえば、図6に関連して説明した動作600を含むことができる。
当業者は、本明細書で開示される態様に関連して説明された様々な例の論理ブロック、モジュール、回路、およびアルゴリズム・ステップが、電子ハードウェア、コンピュータ・ソフトウェア、またはその両方の組合せとして実施され得ることをさらに了解するはずである。ハードウェアとソフトウェアとのこの交換可能性を明瞭に示すために、様々な例の構成要素、ブロック、モジュール、回路、およびステップが、上では全般的にその機能性に関して説明された。そのような機能性が、ハードウェアまたはソフトウェアのどちらとして実施されるのかは、特定の応用例と、システム全体に課せられる設計制約とに依存する。当業者は、特定の応用例ごとに変化する形で説明された機能性を実施することができるが、そのような実施判断が、本開示の範囲からの逸脱を引き起こすものと解釈してはならない。
本願で使用される時に、用語「構成要素」、「モジュール」、「システム」、および類似物は、ハードウェア、ハードウェアとソフトウェアとの組合せ、ソフトウェア、または実行中のソフトウェアのいずれであれ、コンピュータ関連の実体を指すことが意図されている。たとえば、構成要素またはモジュールは、プロセッサ上で走行するプロセス、プロセッサ、オブジェクト、実行可能ファイル、実行のスレッド、プログラム、および/またはコンピュータとすることができるが、これであることに限定はされない。例として、サーバ上で走行するアプリケーションとサーバとの両方を、構成要素またはモジュールとすることができる。1つまたは複数の構成要素またはモジュールが、1つのプロセスおよび/または実行のスレッド内に存在することができ、1つの構成要素またはモジュールが、1つのコンピュータ上に局所化され、かつ/または複数のコンピュータの間で分散され得る。
様々な態様が、複数の構成要素、モジュール、および類似物を含むことができるシステムに関して提示される。様々なシステムが、追加の構成要素、モジュールなどを含むことができ、かつ/または図面に関連して議論された構成要素、モジュールなどの一部を含まない場合があることを理解し、了解されたい。これらの手法の組合せを使用することもできる。本明細書で開示される様々な態様は、タッチ・スクリーン・ディスプレイ技術、ヘッドアップ・ユーザ・インターフェース、ウェアラブル・インターフェース、ならびに/またはマウスおよびキーボード・タイプのインターフェースを利用するデバイスを含む電子デバイス上で実行され得る。そのようなデバイスの例は、仮想現実感または増補現実感の出力デバイス(たとえば、ヘッドセット)、コンピュータ(デスクトップおよびモバイル)、スマート・フォン、携帯情報端末(PDA)、および有線と無線との両方の他の電子デバイスを含む。
さらに、本明細書で開示される態様に関連して説明される様々な例の論理ブロック、モジュール、および回路は、本明細書で説明される機能を実行するように設計された、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲート・アレイ(FPGA)もしくは他のプログラム可能論理デバイス、ディスクリート・ゲート論理もしくはトランジスタ論理、ディスクリート・ハードウェア構成要素、またはそれらの任意の組合せを用いて実施されまたは実行され得る。汎用プロセッサは、マイクロプロセッサとすることができるが、代替案では、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械とすることができる。プロセッサは、コンピューティング・デバイスの組合せ、たとえば、DSPとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、DSPコアに関連する1つもしくは複数のマイクロプロセッサ、または任意の他のそのような構成としても実施され得る。
本明細書で開示される動作態様は、ハードウェアで直接に、プロセッサによって実行されるソフトウェア・モジュール内で、またはこの2つの組合せで実施され得る。ソフトウェア・モジュールは、RAMメモリ、フラッシュ・メモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハード・ディスク、リムーバブル・ディスク、CD−ROM、デジタル多用途ディスク(DVD)、Blu−ray(商標)、または当技術分野で既知の任意の他の形の記憶媒体内に存在することができる。例示的な記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるようにプロセッサに結合される。代替案では、記憶媒体は、プロセッサに一体化され得る。プロセッサおよび記憶媒体は、ASIC内に存在することができる。ASICは、クライアント・デバイスまたはサーバ内に存在することができる。代替案では、プロセッサおよび記憶媒体は、クライアント・デバイスまたはサーバ内に別個の構成要素として存在することができる。
さらに、1つまたは複数のバージョンが、開示される態様を実施するようにコンピュータを制御するためのソフトウェア、ファームウェア、ハードウェア、またはその任意の組合せを作るための標準的なプログラミング技法および/または工学技法を使用して、方法、装置、または製造品として実施され得る。非一時的なコンピュータ可読媒体は、磁気ストレージ・デバイス(たとえば、ハード・ディスク、フロッピ・ディスク、磁気ストリップ、または他のフォーマット)、光ディスク(たとえば、コンパクト・ディスク(CD)、DVD、Blu−ray(商標)、または他のフォーマット)、スマート・カード、およびフラッシュ・メモリ・デバイス(たとえば、カード、スティック、または別のフォーマット)を含むことができるが、これに限定はされない。もちろん、当業者は、開示される態様の範囲から逸脱することなく、多数の変更がこの構成に対して行われ得ることを認めよう。
開示される態様の前の説明は、当業者が本開示を作りまたは使用することを可能にするために提供される。これらの態様に対する様々な変更は、当業者にたやすく明白になり、本明細書で定義される包括的な原理は、本開示の趣旨または範囲から逸脱することなく、他の実施形態に適用され得る。したがって、本開示は、本明細書で示される実施形態に限定されることを意図されたものではなく、本明細書で開示される原理および新規の特徴と一貫する最も広い範囲に従わなければならない。

Claims (15)

  1. メモリに結合されたプロセッサを含むコンピュータによって実現される方法であって、
    前記メモリから二次元のソース・デジタル静止画像を選択することと、
    前記メモリ内において、1つまたは複数の可動領域のそれぞれにおける幾何領域境界データおよびモーション・データのセットに基づいて、1つまたは複数のオーバーラップしない固定領域と、前記固定領域の上にレイヤ化されるように扱われる前記1つまたは複数の可動領域と、を含む少なくとも2つの二次元の領域に前記ソース・デジタル静止画像を分割することと、
    前記1つまたは複数の可動領域のそれぞれにおける前記幾何領域境界データおよび前記モーション・データのセットから選択された情報と、各フレームの時刻と、カメラ位置および焦点距離を定義するデータと、アルゴリズムと、に基づいて、ビデオ・フレームのセットのそれぞれのフレームにおける1つまたは複数の可動領域を変形することと、
    前記1つまたは複数の可動領域によって遮られる前記1つまたは複数の固定領域の画素の値を判定することと、
    前記ソース・デジタル静止画像および前記モーション・データから、シーケンス内でビデオ・フレームのセットを生成することであって、
    前記ビデオ・フレームのセット内の各フレームは、前記1つまたは複数の固定領域の上にレイヤ化され、前記各フレームの時刻に基づいて前記モーション・データによって変形される、前記1つまたは複数の可動領域を含み、
    前記モーション・データは、前記固定領域に対して相対的に、前記1つまたは複数の可動領域のうちの1つに対応する運動として定義され、
    不揮発性コンピュータ・メモリ内のビデオ・ファイルとして前記ビデオ・フレームのセットを記憶することと
    を含む方法。
  2. 前記オーバーラップしない固定領域のそれぞれは、単一の画素からなる、請求項1に記載の方法。
  3. 前記1つまたは複数の可動領域におけるそれぞれの前記モーション・データは、経路上で経時的に変化するモーション・ベクトルを含む、請求項1に記載の方法。
  4. 前記1つまたは複数の可動領域を変形することには、前記モーション・ベクトルと、前記各フレームの時刻と、カメラ位置および焦点距離を定義するデータとに基づいて、前記1つまたは複数の可動領域をスケーリングすることによって少なくとも部分的に、前記ビデオ・フレームのセットのそれぞれのフレームにおける前記1つまたは複数の可動領域を変形することをさらに含む、請求項3に記載の方法。
  5. 前記1つまたは複数の可動領域を変形することには、選択されたぼかしアルゴリズムに基づいて、前記ビデオ・フレームのセットの各フレーム内において前記1つまたは複数の可動領域の少なくとも一部をぼかすこと、または選択された鮮明化アルゴリズムに基づいて、前記各フレーム内において前記1つまたは複数の可動領域の少なくとも一部を鮮明化すること、のうちの1つまたは複数によって少なくとも部分的に、前記各フレームの前記1つまたは複数の可動領域を変形することをさらに含む、請求項1に記載の方法。
  6. 前記ぼかすことまたは鮮鋭化することのうちの少なくとも1つは、経時的に変化する、請求項5に記載の方法。
  7. 前記ぼかすことまたは鮮鋭化することのうちの少なくとも1つは、画素位置に伴って変化する、請求項5に記載の方法。
  8. 前記1つまたは複数の可動領域によって遮られる前記1つまたは複数の固定領域の画素の値を判定することは、前記固定領域の画素が前記1つまたは複数の可動領域によって遮られていない第2のソース・デジタル画像から画素値を抽出することを含む、請求項1に記載の方法。
  9. 前記1つまたは複数の可動領域によって遮られる前記1つまたは複数の固定領域の画素の値を判定することは、連続する遮られた画素領域の境界に隣接する遮られていない画素値に基づいて、前記画素の値を手続き的に生成することを含む、請求項1に記載の方法。
  10. 前記1つまたは複数の固定領域のうちの少なくとも1つに画素変形フィルタを適用することによって少なくとも部分的に、前記ビデオ・フレームのセットにおけるそれぞれのフレームの前記1つまたは複数の固定領域を変形することをさらに含む、請求項1に記載の方法。
  11. 前記画素変形フィルタの適用は、前記各フレームの時刻に基づいて、前記画素変形フィルタの入力パラメータを変更することを含む、請求項10に記載の方法。
  12. 前記画素変形フィルタの適用は、前記シーケンスの先行するフレームの前記画素変形フィルタの出力に、前記画素変形フィルタを適用することをさらに含む、請求項11に記載の方法。
  13. メモリに結合された画像処理用のプロセッサを含む装置であって、前記メモリは、前記プロセッサによって実行される時に、前記装置に
    前記メモリから二次元のソース・デジタル静止画像を選択することと、
    前記メモリ内の1つまたは複数の可動領域のそれぞれにおける幾何領域境界データおよびモーション・データのセットに基づいて、1つまたは複数のオーバーラップしない固定領域と、前記固定領域の上にレイヤ化されるように扱われる前記1つまたは複数の可動領域と、を含む少なくとも2つの二次元の領域に前記ソース・デジタル静止画像を分割することと、
    前記1つまたは複数の可動領域のそれぞれにおける前記幾何領域境界データおよび前記モーション・データのセットから選択された情報と、各フレームの時刻と、カメラ位置および焦点距離を定義するデータと、アルゴリズムと、に基づいて、ビデオ・フレームのセットのそれぞれのフレームにおける1つまたは複数の可動領域を変形することと、
    前記1つまたは複数の可動領域によって遮られる前記1つまたは複数の固定領域の画素の値を判定することと、
    前記ソース・デジタル静止画像および前記モーション・データから、シーケンス内でビデオ・フレームのセットを生成することであって、
    前記ビデオ・フレームのセット内の各フレームは、前記1つまたは複数の固定領域の上にレイヤ化され、前記各フレームの時刻に基づいて前記モーション・データによって変形される、前記1つまたは複数の可動領域を含み、
    前記モーション・データは、前記固定領域に対して相対的に、前記1つまたは複数の可動領域のうちの1つに対応する運動として定義され、
    不揮発性コンピュータ・メモリ内のビデオ・ファイルとして前記ビデオ・フレームのセットを記憶することと
    を実行させる命令を含む、装置。
  14. メモリから二次元のソース・デジタル静止画像を選択するための手段と、
    前記メモリ内の1つまたは複数の可動領域のそれぞれにおける幾何領域境界データおよびモーション・データのセットに基づいて、1つまたは複数のオーバーラップしない固定領域と、前記固定領域の上にレイヤ化されるように扱われる前記1つまたは複数の可動領域と、を含む少なくとも2つの二次元の領域に前記ソース・デジタル静止画像を分割するための手段と、
    前記1つまたは複数の可動領域のそれぞれにおける前記幾何領域境界データおよび前記モーション・データのセットから選択された情報と、各フレームの時刻と、カメラ位置および焦点距離を定義するデータと、アルゴリズムと、に基づいて、ビデオ・フレームのセットのそれぞれのフレームにおける1つまたは複数の可動領域を変形する手段と、
    前記1つまたは複数の可動領域によって遮られる前記1つまたは複数の固定領域の画素の値を判定するための手段と、
    前記ソース・デジタル静止画像および前記モーション・データから、シーケンス内でビデオ・フレームのセットを生成するための手段であって、
    前記ビデオ・フレームのセット内の各フレームは、前記1つまたは複数の固定領域の上にレイヤ化され、前記各フレームの時刻に基づいて前記モーション・データによって変形される、前記1つまたは複数の可動領域を含み、
    前記モーション・データは、前記固定領域に対して相対的に、前記1つまたは複数の可動領域のうちの1つに対応する運動として定義され、
    不揮発性コンピュータ・メモリ内のビデオ・ファイルとして前記ビデオ・フレームのセットを記憶するための手段と
    を含む装置。
  15. 画像処理装置によって実行される時に、前記画像処理装置に、
    メモリから二次元のソース・デジタル静止画像を選択することと、
    前記メモリ内の1つまたは複数の可動領域のそれぞれにおける幾何領域境界データおよびモーション・データのセットに基づいて、1つまたは複数のオーバーラップしない固定領域と、前記固定領域の上にレイヤ化されるものとして扱われる前記1つまたは複数の可動領域と、を含む少なくとも2つの二次元の領域に前記ソース・デジタル静止画像を分割することと、
    前記1つまたは複数の可動領域のそれぞれにおける前記幾何領域境界データおよび前記モーション・データのセットから選択された情報と、各フレームの時刻と、カメラ位置および焦点距離を定義するデータと、アルゴリズムと、に基づいて、ビデオ・フレームのセットのそれぞれのフレームにおける1つまたは複数の可動領域を変形することと、
    前記1つまたは複数の可動領域によって遮られる前記1つまたは複数の固定領域の画素の値を判定することと、
    前記ソース・デジタル静止画像および前記モーション・データから、シーケンス内でビデオ・フレームのセットを生成することであって、
    前記ビデオ・フレームのセット内の各フレームは、前記1つまたは複数の固定領域の上にレイヤ化され、前記各フレームの時刻に基づいて前記モーション・データによって変形される、前記1つまたは複数の可動領域を含み、
    前記モーション・データは、前記固定領域に対して相対的に、前記1つまたは複数の可動領域のうちの1つに対応する運動として定義され、
    不揮発性コンピュータ・メモリ内のビデオ・ファイルとして前記ビデオ・フレームのセットを記憶することと
    を実行させるためのプログラムを記録したコンピュータ読み取り可能な記憶媒体
JP2019536817A 2017-01-13 2018-01-12 デジタル静止画像へのモーション効果の追加 Active JP6888098B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762446149P 2017-01-13 2017-01-13
US62/446,149 2017-01-13
PCT/US2018/013651 WO2018132760A1 (en) 2017-01-13 2018-01-12 Adding motion effects to digital still images

Publications (3)

Publication Number Publication Date
JP2020504537A JP2020504537A (ja) 2020-02-06
JP2020504537A5 JP2020504537A5 (ja) 2021-02-25
JP6888098B2 true JP6888098B2 (ja) 2021-06-16

Family

ID=62839542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019536817A Active JP6888098B2 (ja) 2017-01-13 2018-01-12 デジタル静止画像へのモーション効果の追加

Country Status (5)

Country Link
US (1) US10867425B2 (ja)
EP (1) EP3568832A4 (ja)
JP (1) JP6888098B2 (ja)
KR (1) KR102309722B1 (ja)
WO (1) WO2018132760A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11380366B2 (en) * 2019-11-21 2022-07-05 Vooks, Inc. Systems and methods for enhanced closed captioning commands
US11341301B2 (en) * 2020-02-28 2022-05-24 Unity Technologies, SF Method for generating simulations of fluid interfaces for improved animation of fluid interactions
WO2021185068A1 (en) * 2020-03-18 2021-09-23 Maycas Inventions Limited Methods and apparatus for pasting advertisement to video
CN114339447B (zh) 2020-09-29 2023-03-21 北京字跳网络技术有限公司 图片转视频的方法、装置、设备及存储介质
US11880917B2 (en) * 2020-11-17 2024-01-23 Bria Artificial Intelligence Ltd. Synthetic visual content creation and modification using textual input
US11915383B2 (en) 2021-07-05 2024-02-27 Huawei Technologies Co., Ltd. Methods and systems for high definition image manipulation with neural networks

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5969721A (en) * 1997-06-03 1999-10-19 At&T Corp. System and apparatus for customizing a computer animation wireframe
US7327368B2 (en) * 1997-07-10 2008-02-05 Paceworks, Inc. Methods and apparatus for supporting and implementing computer based animation
US6268864B1 (en) * 1998-06-11 2001-07-31 Presenter.Com, Inc. Linking a video and an animation
US6081278A (en) * 1998-06-11 2000-06-27 Chen; Shenchang Eric Animation object having multiple resolution format
US6278466B1 (en) * 1998-06-11 2001-08-21 Presenter.Com, Inc. Creating animation from a video
JP4071422B2 (ja) * 2000-06-28 2008-04-02 株式会社東芝 モーションブラー画像描画方法及び描画装置
US7193629B2 (en) * 2001-05-18 2007-03-20 Sony Computer Entertainment Inc. Display apparatus
US7359576B1 (en) * 2004-02-27 2008-04-15 Adobe Systems Incorporated Using difference kernels for image filtering
KR100643230B1 (ko) * 2004-08-30 2006-11-10 삼성전자주식회사 디스플레이장치의 제어방법
JP4613313B2 (ja) * 2005-04-01 2011-01-19 国立大学法人 東京大学 画像処理システムおよび画像処理プログラム
KR100713531B1 (ko) * 2005-05-17 2007-04-30 삼성전자주식회사 영상데이터에 특정효과 표시방법
US7609271B2 (en) * 2006-06-30 2009-10-27 Microsoft Corporation Producing animated scenes from still images
US8405662B2 (en) * 2006-07-04 2013-03-26 Iti Scotland Limited Generation of video
US8600189B2 (en) * 2007-11-12 2013-12-03 Qualcomm Incorporated Block-based image stabilization
JP4591576B2 (ja) * 2008-08-18 2010-12-01 ソニー株式会社 画像処理装置、画像処理方法、プログラム
KR20100085328A (ko) * 2009-01-20 2010-07-29 삼성전자주식회사 디스플레이장치 및 영상표시방법
US10326978B2 (en) * 2010-06-30 2019-06-18 Warner Bros. Entertainment Inc. Method and apparatus for generating virtual or augmented reality presentations with 3D audio positioning
US8755432B2 (en) * 2010-06-30 2014-06-17 Warner Bros. Entertainment Inc. Method and apparatus for generating 3D audio positioning using dynamically optimized audio 3D space perception cues
US8766985B1 (en) * 2011-01-18 2014-07-01 Pixar Generating animation using image analogies to animate according to particular styles
US20120188148A1 (en) * 2011-01-24 2012-07-26 Microvision, Inc. Head Mounted Meta-Display System
US20130093786A1 (en) * 2011-04-08 2013-04-18 Naohisa Tanabe Video thumbnail display device and video thumbnail display method
US9363522B2 (en) * 2011-04-28 2016-06-07 Warner Bros. Entertainment, Inc. Region-of-interest encoding enhancements for variable-bitrate mezzanine compression
US9532027B2 (en) * 2011-05-27 2016-12-27 Warner Bros. Entertainment Inc. Methods for controlling scene, camera and viewing parameters for altering perception of 3D imagery
JP5408205B2 (ja) * 2011-08-25 2014-02-05 カシオ計算機株式会社 制御点設定方法、制御点設定装置及びプログラム
US9058757B2 (en) * 2012-08-13 2015-06-16 Xerox Corporation Systems and methods for image or video personalization with selectable effects
US9979952B2 (en) * 2013-12-13 2018-05-22 Htc Corporation Method of creating a parallax video from a still image
JP6391383B2 (ja) * 2014-02-10 2018-09-19 キヤノン株式会社 画像処理装置、その制御方法、プログラム及び記憶媒体
KR20160093809A (ko) * 2015-01-29 2016-08-09 한국전자통신연구원 프레임 영상과 모션 벡터에 기초하는 객체 검출 방법 및 장치
US9922238B2 (en) * 2015-06-25 2018-03-20 West Virginia University Apparatuses, systems, and methods for confirming identity
US10402955B2 (en) * 2016-12-21 2019-09-03 Facebook, Inc. Long exposure filter

Also Published As

Publication number Publication date
US20190378318A1 (en) 2019-12-12
JP2020504537A (ja) 2020-02-06
US10867425B2 (en) 2020-12-15
KR20190105023A (ko) 2019-09-11
EP3568832A4 (en) 2020-09-16
EP3568832A1 (en) 2019-11-20
WO2018132760A1 (en) 2018-07-19
KR102309722B1 (ko) 2021-10-07

Similar Documents

Publication Publication Date Title
JP6888098B2 (ja) デジタル静止画像へのモーション効果の追加
US7348985B2 (en) Variable motion blur
US9171390B2 (en) Automatic and semi-automatic generation of image features suggestive of motion for computer-generated images and video
Joshi et al. Cliplets: juxtaposing still and dynamic imagery
US8102428B2 (en) Content-aware video stabilization
US8872850B2 (en) Juxtaposing still and dynamic imagery for cliplet creation
US20080246759A1 (en) Automatic Scene Modeling for the 3D Camera and 3D Video
O'Donovan et al. Anipaint: Interactive painterly animation from video
US20150161823A1 (en) Methods and Systems for Viewing Dynamic High-Resolution 3D Imagery over a Network
US8416245B2 (en) Creation of motion blur in image processing
US20130278600A1 (en) Rendering interactive photorealistic 3d model representations
WO2021135320A1 (zh) 一种视频的生成方法、装置及计算机***
WO2011026850A1 (en) Method for art-directable retargeting for streaming video
WO2014188235A1 (en) Creation of a cinemagraph file
US9092912B1 (en) Apparatus and method for parallax, panorama and focus pull computer graphics
KR20160016812A (ko) 조밀한 모션 필드들을 통한 기저 비디오 시퀀스로의 이미지 편집들 전파
JP4987124B2 (ja) グラフィックデータ提供方法及びグラフィックデータ表示方法
Liao et al. Depth Map Design and Depth-based Effects With a Single Image.
Masuch et al. Animating Frame-to-Frame Coherent Line Drawings for Illustrative Purposes
Mujika et al. Web-based video-assisted point cloud annotation for ADAS validation
Liao et al. Depth annotations: Designing depth of a single image for depth-based effects
Luo et al. Controllable motion-blur effects in still images
Siogkas Visual media processing using matlab beginner's guide
Fearing Importance ordering for real-time depth of field
KR100322618B1 (ko) 디지털 동화 생성 방법 및 장치

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210112

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210112

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210112

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20210201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210421

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210519

R150 Certificate of patent or registration of utility model

Ref document number: 6888098

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250