JP2011526013A - 画像処理 - Google Patents

画像処理 Download PDF

Info

Publication number
JP2011526013A
JP2011526013A JP2011514180A JP2011514180A JP2011526013A JP 2011526013 A JP2011526013 A JP 2011526013A JP 2011514180 A JP2011514180 A JP 2011514180A JP 2011514180 A JP2011514180 A JP 2011514180A JP 2011526013 A JP2011526013 A JP 2011526013A
Authority
JP
Japan
Prior art keywords
images
image
processing
aligned
defining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011514180A
Other languages
English (en)
Inventor
アー ペーテルス,マルク
ツォネヴァ,ツヴェトミラ
フォンセカ,ペドロ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2011526013A publication Critical patent/JP2011526013A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Television Signal Processing For Recording (AREA)
  • Processing Or Creating Images (AREA)

Abstract

複数の画像を処理する方法が、複数の画像を受領し、前記複数の画像から処理のための画像のセットを定義し、ここで、この定義することは、前記複数の画像中で、ある異なる画像に関して類似性閾値に基づいて似すぎている一つまたは複数の画像を破棄することを含み、前記画像のセット中の一つまたは複数の要素を整列させ、整列された画像の一つまたは複数を、画像のクロッピング、サイズ変更および/または回転によって変換して一連の変換された画像を生成し、前記一連の変換された画像を含む出力を生成することを含み、前記出力はストップモーション・ビデオ・シーケンスを含む。

Description

本発明は、複数の画像を処理する方法およびシステムに関する。
デジタル・カメラにより写真を撮ることはますます一般的になりつつある。そのようなデジタル・カメラを使うことの利点の一つは、デジタル・カメラおよび/またはコンピュータを使うことにより、複数の画像を取り込み、保存し、操作することができるということである。ひとたび一群の画像が取り込まれ、記憶されると、それらの画像へのアクセスをもつユーザーはそれらのデジタル画像をどのように使うかを決定する必要がある。たとえばユーザーに利用可能な、種々のデジタル画像を扱うプログラムがある。たとえば、ユーザーは写真編集アプリケーションを用いてデジタル画像の全部または一部を編集してもよいし、画像を友人や家族と共有するためにインターネット上のリモート・リソースにデジタル画像ファイルを転送してもよいし、および/または伝統的な仕方で一つまたは複数の画像をプリントしてもよい。そのようなデジタル画像を扱うタスクは通例コンピュータを使って実行されるが、他の装置を使ってもよい。たとえば、いくつかのデジタル・カメラにはそのような機能が組み込まれている。
一般に、人はますます多くのデジタル画像を、しばしば一つの特定のオブジェクト、シーンまたは機会のいくつかの画像を撮影する傾向がある。それらをたとえばデジタルフォトフレーム中でスライドショーで見せることにより、似たような画像のセット全体を次々に通常の表示時間をもって表示させることはあまり魅力のあることではない。他方、これらの画像はしばしば、同じイベントまたは機会に関係するという意味で接続されているので、セットの中の画像の一つだけを表示のために選択することはユーザーの体験から多くを取り去ることになりうる。このコンテキストにおいて、退屈なスライドショーにすることなくいかにして画像のすべてを使うかという問題が生じる。
デジタル画像を扱う技法の一つの例が、特許文献1において開示されている。これは、コンテンツ・ベースの動的な写真からビデオへの方法に関する。特許文献1の方法によれば、一つまたは複数のデジタル画像(写真)を一つまたは複数の写真モーション・クリップに自動的に変換する方法、装置およびシステムが提供される。写真モーション・クリップは、デジタル画像(単数または複数)内でのシミュレートされたビデオ・カメラなどのような動き/モーションを定義する。動き/モーションは、画像(単数または複数)の選択された部分の複数またはシーケンスを定義するために使うことができる。よって、一つまたは複数の写真モーション・クリップはビデオ出力をレンダリングするために使用されうる。動き/モーションは、初期デジタル画像中に同定される一つまたは複数のフォーカス領域に基づくことができる。動き/モーションはたとえばパンおよびズームを含みうる。
この方法によって提供される出力は、もとの写真に基づくアニメーションである。このアニメーションは、エンドユーザーにとって常に望ましい出力を提供するよう画像の十分な処理を提供するものではない。
米国特許出願公開第2004/0264939号
http://www.visionbib.com/bibliography/match-pl494.html、たとえばF. Zhao et al.による「Image Matching by Multiscale Oriented Corner Correlation」ACCV06, 2006を含む。 http://iris.usc.edu/Vision-Notes/bibliography/applicat805.html、たとえばS. K. Chang et al.による「Picture Information Measures for Similarity Retrieval」、CVGIP、vol.23、no.3、1983を含む。
したがって、従来技術を改善することが本発明の目的である。
本発明の第一の側面によれば、複数の画像を処理する方法であって、複数の画像を受領し、前記複数の画像から処理のための画像のセットを定義し、前記画像のセット中の一つまたは複数の要素を整列させ、整列された画像の一つまたは複数を、画像のクロッピング、サイズ変更および/または回転によって変換して一連の変換された画像を生成し、前記一連の変換された画像を含む出力を生成することを含み、前記出力は画像シーケンスまたは単一の画像を含む、方法が提供される。
本発明の第二の側面によれば、複数の画像を処理するシステムであって、複数の画像を受領するよう構成されている受領器と、前記複数の画像から処理のための画像のセットを定義し、前記画像のセット中の一つまたは複数の要素を整列させ、整列された画像の一つまたは複数を、画像のクロッピング、サイズ変更および/または回転によって変換して一連の変換された画像を生成するよう構成されたプロセッサと、前記一連の変換された画像を含む出力を表示するよう構成された表示装置とを有し、前記出力は画像シーケンスまたは単一の画像を含む、システムが提供される。
本発明の第三の側面によれば、複数の画像を処理するためのコンピュータ可読媒体上のコンピュータ・プログラム・プロダクトであって、複数の画像を受領し、前記複数の画像から処理のための画像のセットを定義し、前記画像のセット中の一つまたは複数の要素を整列させ、整列された画像の一つまたは複数を、画像のクロッピング、サイズ変更および/または回転によって変換して一連の変換された画像を生成し、前記一連の変換された画像を含む出力を生成するための命令を含み、前記出力は画像シーケンスまたは単一の画像を含む、コンピュータ・プログラム・プロダクトが提供される。
本発明のおかげで、あるイベントを描き出す写真のシーケンスを表示するよう構成されたいくつかの画像から成るストップモーションの画像シーケンスを自動的に生成することにより、あるいは「ストーリーを語る画像(story telling image)」を自動的に生成することによって同様の諸画像を表示する魅力的な方法を自動的に生成するシステムを提供することが可能となる。これは、デジタルフォトフレームに簡単に適用でき、ユーザーが自分の写真を見るのを享受する仕方を高める技法である。複数の画像を自動的に同じ参照点に整列させることにより、それらの画像が画像シーケンスとして示されるときに、ビデオ・シーケンスの見え方が、たとえ異なる視点およびズームが元の画像の取り込みに使われていたとしても、固定カメラから撮影されたかのようになる。
これらの技法はデジタルフォトフレームにおいて使用できる。ここで、画像のクラスタリングおよび整列は、パソコン上で、含まれているソフトウェアを使って実行できる。さらに、これらの技法は、画像表示機能をもついかなるソフトウェアまたはハードウェア・プロダクトによって使用されることもできる。さらに、これらの技法は、(家庭)ビデオ・シーケンスから抽出されたフレームに基づいて同様の効果を生成するためにも使用できる。この場合、一群の写真を処理する代わりに、そのシーケンスから取られた一群のフレーム(必ずしも個々のフレームすべてでなくてもよい)を使うことができる。
有利には、複数の画像から処理のための画像のセットを定義する段階は、画像に関連付けられたメタデータに基づいて密接に関連している一つまたは複数の画像を選択することを含む。出力を生成するプロセッサは、多数の画像(たとえば、メディア・カードのような大容量記憶メディアに現在記憶されている画像全部)を受領し、それらの画像の知的な選択を行うことができる。たとえば、それらの画像に関連付けられたメタデータは、元の画像の時間および/または位置に関係してもよく、プロセッサは密接に関係している画像を選択することができる。これは、10秒の期間などの所定の閾値によって定義される、同様の時刻に撮影された画像であってもよい。同様に、密接に関係した画像を判別するために、他のメタデータ要素も適切なスケール上で計算できる。メタデータは画像自身から直接、たとえば色またはエッジといった低レベルの特徴を抽出することによって導出されることができる。これは画像をクラスタリングする助けとなりうる。実際、異なる型のメタデータの組み合わせを使うことができる。これは、画像と一緒に(通例取り込み時に)記憶されているメタデータに画像から導出されるメタデータを加えたものを組み合わせて使うことができるということを意味する。
好ましくは、複数の画像から処理のための画像のセットを定義する段階は、前記複数の画像中で、ある異なる画像に関して類似性閾値を下回る一つまたは複数の画像を破棄することを含む。二つの画像があまりに似すぎている場合、最終的な出力は同様の画像の一方を削除することによって改善できる。類似性は、多くの異なる仕方で、たとえば二つの異なる画像の間の低レベル特徴(色情報またはエッジ・データのような)における変化を基準として、定義できる。プロセッサは、使用するセットを定義するときに、前記複数の画像を通じて作業を進め、似すぎている画像があれば除去することができる。これは、最終的な画像がユーザーに対して生成されるときに、諸画像における明白な反復を防止することになる。
理想的には、本方法論はさらに、整列された画像の変換に続いて、整列された画像内の一つまたは複数の関心の低い要素を検出し、整列された画像をクロッピングして検出された関心の低い要素(単数または複数)を除去することを含む。ここでもまた、最終的な出力は、画像のさらなる処理によって改善できる。ひとたび画像が整列され、変換されたら、それらの画像はさらに、画像の重要な部分にフォーカスすることによって改善できる。これが達成できる一つの方法は、画像中の静的な要素を除去することによるものである。静的な要素は比較的関心が低いと想定でき、画像はそれらの要素を(それぞれの画像の一部をクロッピングで取り去ることによって)除去し、最終的な画像が画像の動いている部分にフォーカスを当てているようにするよう適応されることができる。他の技法は画像中の顔検出を使い、画像の他の部分は関心が低いものとして分類できると想定してもよい。
有利には、複数の画像から処理のための画像のセットを定義する段階は、一つまたは複数の画像を選択するユーザー入力を受領することを含む。システムは、上記の方法論に従って処理されるべき画像を定義するユーザー入力を受け入れるよう構成されることができる。これは、ユーザーが画像シーケンスとして、あるいは処理された画像から成る組み合わされた単一画像として出力されるのを見たい画像を選択することを許容する。
本発明の諸実施形態について、これから、単に例として、付属の図面を参照して記述する。
画像を処理するシステムの概略図である。 画像を処理する方法のフローチャートである。 処理される複数の画像の概略図である。 デジタルフォトフレームの概略図である。 画像を処理する方法の第二の実施形態のフローチャートである。 図5の画像処理方法の出力の概略図である。
デスクトップ・コンピューティング・システムが図1に示されている。これは、表示装置10、プロセッサ12ならびにキーボード14aおよびマウス14bであるユーザー・インターフェース装置14を有する。さらに、ユーザーがカメラ16をプロセッサ12に、USBのような通常の接続技術を使って接続している。カメラ16のプロセッサ12への接続は、カメラ16によって取り込まれた画像にユーザーがアクセスできるようにする。これらの画像はフォルダ18として示されている。フォルダ18は表示装置10によって表示されるグラフィカル・ユーザー・インターフェースのコンポーネントである。表示装置10はアイコン20も示している。アイコン20は、プロセッサ12上にインストールされている、(「STOP MO」と呼ばれる)インストール・アプリケーションを表している。
ユーザーは、インストール・アプリケーションSTOP MOを使って画像を処理できる。たとえば、ユーザーは単に、よく知られたユーザー・インターフェース技法を使ってフォルダ18をアイコン20上にドラッグアンドドロップすることにより、フォルダ18の内容がアイコン20によって表されているアプリケーションによって処理されることを要求することができる。すると、フォルダ18に記憶されているカメラ16が生成した画像がアプリケーションによって処理される。本処理方法を引き起こす他の方法も可能である。たとえば、STOP MOアプリケーションは、通常の仕方でアイコン29をダブルクリックすることによって立ち上げることができ、次いで、このアプリケーション内で、コンピュータの記憶装置をブラウズすることによってソース画像を見出すことができる。
アプリケーションSTOP MOの目的は、ユーザーにとって魅力的な出力を提供するようユーザーの画像を処理することである。ある実施形態では、アプリケーションは、ソース画像から個人的なストップモーション画像シーケンスを与えるために使うことができる。アイコン20によって表されているアプリケーションは、ストップモーションの画像シーケンスを自動的に生成することにより、あるいはあるイベントを描き出す写真のシーケンスを表示するよう配列されたいくつかの画像から成る「ストーリーを語る画像」を自動的に生成することによって同様の画像を表示する魅力的な方法を自動的に生成するシステムを提供する。これは、デジタルフォトフレームに簡単に適用でき、ユーザーが自分の写真を見るのを享受する仕方を高める技法である。
アプリケーションによって実行される処理が図2にまとめられている。この処理フローチャートは基本レベルの処理を表している。この基本的な処理に対していくつかの任意的な改善が可能であり、のちに図5を参照してより詳細に述べる。図2のプロセスは、好適な処理装置によって自動的に実行される。本方法における第一のステップ、ステップS1は、複数の画像を受領するステップである。上述したように、これはユーザーがアプリケーションをさまざまな画像を含んでいるフォルダの内容にポイントするという簡単なことであってもよい。処理はまた、たとえばユーザーが最初に画像をコンピュータにまたはデジタルフォトフレームにアップロードするときに自動的に開始されることもできる。
次のステップS2は、ステップS1で受領された複数の画像から処理のための画像のセットを定義するステップである。最も簡単な実施形態では、セットは受領された画像全部を含むが、これは常に最良の結果を与えるものではない。アプリケーションはユーザーが表示したいであろう画像のクラスターを利用することができる。クラスタリングはたとえば、低レベル特徴(色情報、エッジなど)を抽出し、画像間で該特徴をそれらの特徴についての距離指標に基づいて比較することによって実行できる。たとえばEXIFデータを通じて日時情報が利用可能であれば、二つの画像がほぼ同じ時点に撮影されたかどうかを判定するためにこれを用いることができる。また、視覚的に類似した画像をまとめる他のクラスタリング方法を使うこともできる。視覚的な見え方に基づくクラスタリング技法は既知である。そのような技法の参考文献は、非特許文献1および非特許文献2に見出すことができる。デジタル・カメラをもつ多くのユーザーにとって、クラスタリングは同じイベント、機会またはオブジェクトに属する画像の多くのクラスターを与えるであろう。
ステップS2はまた、受領された画像24を順序付ける(順序付け直す)ことをも含みうる。画像24のデフォルト順は理想的でないことがあり、実はデフォルト順がないこともあり、あるいは画像がかちあうシーケンスをもつ複数のソースから受領されることもある。これらすべての場合、処理は選択された画像24がある順序にされることを要求する。これは、画像24内のメタデータから導出される類似性指標に基づくことができ、あるいはここでもまた順序を導出するために画像24と一緒に記憶されたメタデータに頼ってもよい。
アプリケーションは、画像のセットを表示する種々の仕方を生成するためにクラスターを使う。画像(のいくつか)の間に著しい相違があるとすると、アプリケーションは自動化された仕方で以下のステップを実行する。ステップS3では、画像のセット内の一つまたは複数の要素を整列させることによって画像を整列させる処理ステップが実行される。これは、たとえば、画像中の特徴点(ハリス・コーナー点(Harris corner points)またはSIFT特徴(SIFT features)といった)を判別してそれをマッチング〔対応付け〕することによって実行できる。特徴点は並進(パンのような)、ズームおよびさらには回転によってマッチングされることができる。いかなる既知の画像整列技法を使ってもよい。
次いで、ステップS4で、プロセスは、整列された画像の一つまたは複数を画像のクロッピング、サイズ変更および/または回転によって変換して一連の変換された画像を生成することに進む。アプリケーションは画像のクロッピング、サイズ変更および回転を、画像の残りの部分も整列されるために実行する。変換ステップの間に色補正も行われてもよい。整列および変換ステップS3およびS4は、整列が先に起こる逐次的なものとして示されているが、これらのステップが組み合わせとして行われる、あるいは整列の前に変換が行われることも可能である。
最後に、ステップS5において、処理されたクラスター中の画像を伝統的な仕方で示すのではなく、それらの画像をストップモーション画像シーケンスとして、または単一画像として示すことができる。これは、撮影した写真を見るときにユーザーにとって非常に生き生きとした体験を作り出す。ユーザーはさらに出力を自分で処理することができる。それはたとえば、整列および変換後に自動的にシーケンス中の一部または全部の画像とともに使われるべき効果またはフレーム・ボーダーを選択することによる。画像シーケンス中の画像の表示速度および単一画像中の画像の配置(大きさおよび位置に関する)は、自動的に、あるいはユーザー対話によって確立されることができる。このようにして、呈示タイムスタンプが生成されてもよく、あるいはすべてまたは個々の画像について「フレーム・レート」を設定できる。このようにして、ユーザーは最終的な結果をカスタマイズおよび/または編集できる。
一例として、図3は処理されるべき画像24の複数22を示している。画像24の複数22は三つの異なる画像を含む。これらの画像は上記のようにプロセッサ12によって実行されるアプリケーションにユーザーが供給したものである。ユーザーはこれらの画像24が加工されて画像シーケンスまたは単一画像にされることを望む。まず、プロセッサ12は画像適応技法が使用される画像のセットを定義する。この例では、元の入力画像24の三つ全部が該セットとして使われる。上記のステップS2を計算して、三つの写真中の低レベル情報に基づいて、三つの入力画像24がクラスターと考えることができることが見て取れるであろう。画像24についてのメタデータのような他の情報(画像が取り込まれた時刻のような)が追加的または代替的にクラスタリング・プロセスにおいて使用できる。
画像24のセットの画像24は、次いで個々に処理されて整列された画像26を生じる。これらは、画像24のセット内の一つまたは複数の要素を整列させることによって生成される。一般に、そのような整列は画像中の一つの(小さな)オブジェクト上で実行されない。整列は、コーナー点またはエッジのような特別な属性をもつ画像24じゅうに広がった任意の点上で、あるいは種々の整列を試行したのちに一方の画像24を他方から引くことから帰結する差分を最小にすることによってグローバル・レベルで、実行できる。整列における変化は、二つの写真の撮影の間にカメラ位置が動いた、あるいは焦点が変わったことを示す。要素の整列に関わるプロセス・ステップは、同じ状況の複数の画像が撮られるときに非常に一般的なこれらのユーザー変更について補正する。
整列された画像26は次いで系列30に変換される。これは、画像のクロッピング、サイズ変更および/または回転によって、整列された画像の一つまたは複数を変換して、変換された画像の系列30にすることによる。説明されるような技法の適用は、サイズ変更され、クロッピングされ、整列された諸画像30を生じる。次に、プロセッサは、写真30を非常に短い時間間隔で逐次的に表示することによってストップモーション画像シーケンスを生成できる。プロセッサ12はまた、適切なコーデックが利用可能であれば、画像シーケンスの諸画像をビデオ・シーケンスとして保存することもできる。重複フレームを追加することによって、あるいは既知の補間技法を使って介在フレームを生成することによって、好適なフレーム・レートを得るために介在フレームを生成する必要があることがある。
あるいはまた、ストップモーション画像シーケンスを生成する代わりに、プロセッサ12は、定義されたクラスターの整列されクロッピングされた画像24からなる一つの画像を生成するよう制御されることもできる。この手順は、特定のイベントまたは機会のストーリーを語り、ユーザーの体験を高めることもできる一つのコラージュ画像を生じる。図3に示される画像24については、結果として得られるコラージュは図4に示されるデジタルフォトフレーム32に対応する。この場合、画像24の元の複数22からの画像24は、ひとたび図2の方法に従って処理されたら、フォトフレーム32中の単一画像34としてユーザーに対して出力される。実際、機能があれば、最終的な出力34はユーザーのためにプリントされることができる。
図4に示されるフォトフレームは、最終的な出力画像34を、図1のコンピュータのプロセッサ12から受け取っている。しかしながら、コンピュータの処理機能および画像24を処理するアプリケーションのソフトウェア機能は、デジタルフォトフレーム32内で内部的に設けられることもできる。この場合、処理のために供給される画像24は、フォトフレーム32において直接受領されることができる。これはたとえば、USBキーのような大容量記憶装置をフォトフレーム32中に直接差し込むことによる。すると、フォトフレーム32の内部プロセッサが画像24を取得し、図2の方式に従ってこれを処理し、次いでこれを最終的な出力34として表示することになる。
フォトフレーム32はまた、単一画像34ではなく画像シーケンスを出力するよう制御されることもできる。これは、単一画像34を作るのに使われる諸画像に基づくストップモーション画像シーケンスとしてであることができる。そのような画像シーケンスを表示するのに使うために、メタデータが生成され、画像と一緒に提供されてもよい。このメタデータは画像ヘッダに、あるいは画像シーケンスを記述する別個の画像シーケンス記述子ファイルに埋め込まれていてもよい。このメタデータは、これに限られないが、シーケンス中の諸画像への参照および/または呈示タイムスタンプを包含しうる。あるいはまた、画像シーケンスは、フォトフレーム上にAVIとして直接記憶されることができる。それにより、フォトフレームにおいて利用可能な既存のコーデックを使うことができる。
任意的に、フォトフレーム32が十分な処理リソースを有するならば、与えられた元の(生)画像に基づいて出力画像または出力画像シーケンスを得るために必要とされる整列および処理ステップを記述するメタデータを含む画像シーケンス記述子ファイルが用いられてもよい。結果として、元の画像の画像の完全性(integrity)が保存され、それにより情報の損失なしに、すなわち元の画像に影響することなく、新しい画像シーケンスが生成できる。
ストップモーション・シーケンスのフレーム・レートは通常のビデオ・シーケンスのフレーム・レートより実質的に低いことがありうるので、ストップモーション・シーケンスを表示する処理リソース要件は実際のところ、元の画像を参照する別個の画像シーケンス記述子ファイルを使うための限られた処理リソースをもつディスプレイを許容しうる。
画像24を処理する基本的な方法へのさまざまな改善が可能である。図5は、図2と同様だが、ユーザーに対する最終的な出力を改善するいくつかの向上をもつフローチャートを示している。これらの任意的な特徴はそれ自身で、あるいは組み合わせにおいて使われることができる。これらの特徴が処理方法に含められるかどうかは、ユーザーの制御下にあることができ、実際、処理は用いられる特徴の異なる組み合わせで実行できる。それにより、ユーザーは種々の可能な最終結果を見て特徴の組み合わせを適切なものとして選ぶことができる。特徴は、アプリケーションが処理装置12によって実行されるときのアプリケーションのグラフィカル・ユーザー・インターフェース内でアプリケーションによってユーザーに呈示されることができる。
図5の実施形態では、複数の画像から処理のための画像のセットを定義するステップは、ステップS21で、画像24に関連付けられたメタデータに基づいて密接に関係している一つまたは複数の画像を選択することを含む。これは、画像24から抽出される、色などの低レベル特徴のようなメタデータであってもよいし、あるいは画像24が取り込まれたときに画像24と一緒に記憶されたメタデータであってもよいし、あるいはこれらの特徴の組み合わせであってもよい。与えられる元の複数22の画像24は、密接に関係していると考えられる画像24だけを選択することによって、数を削減できる。一般に、カメラ16によって取り込まれた画像は、EXIFのような既知の規格に従って、あるいはカメラ・メーカー固有の独自規格に従って同時に画像24と一緒に記憶された何らかの種類のメタデータをもつ。たとえば画像24が取り込まれた時刻であってもよいこのメタデータは、特定の所定の時間窓の範囲内にはいる画像24だけを選択するために使うことができる。
もう一つの任意的な次のステップ、ステップS22は、画像24が、画像24の個々の対の間にほとんど相違がないという意味であまりに似すぎていないことを検査することである。これは、たとえばあとで選択できるよう少なくとも一つのいい画像24をもつというねらいで単に建物の数枚の写真を撮る場合によく起こる。その場合、プロセスをクラスター全体に適用する理由はなく、実際、一つの画像だけを選択してその画像を使うほうが賢明である。ステップS21およびS22は並列してまたは逐次的にまたは選択的に(一方または他方だけを使う)実行できる。これらの実装上の改善は、プロセスの最終的な帰結におけるよりよい最終結果につながる。
図5の方法はまた、整列された画像の変換に続いて、整列された画像内での一つまたは複数の関心の低い要素の検出が実行され、次いで検出された関心の低い要素(単数または複数)を除去するよう整列された画像をクリッピングする任意的ステップS4aをも含む。たとえば、プロセッサ12が画像24の特定の領域がほとんど変化を含んでいないことを検出する場合、プロセッサ12はこれらの領域を関心が低いと見なして、変化が最も著しい特定の領域に画像24をクロッピングすることができる。プロセッサ12がオブジェクトを認識する場合、処理はオブジェクトを全体として保つよう努めるべきであることが重要である。したがって、これは空または海のような大量の背景がある場合に使うことができる。現在のフォトフレームについては、画像サイズは一般に大きすぎ、よってクロッピングはその品質を劣化させることはないだろう。
図6は、図5のフローチャートに基づく処理の出力34を示している。この場合、ステップ4aが画像処理における任意的な改善として使われた。この例では、水平ビューを生成するために、画像の一部を選択し、さらにクロッピングするために顔検出が使われた。画像内の関心の低い要素は画像の一部をクロッピングすることによって除去されている。最も重要であると一般に考えられる画像部分のために使われる表示領域の量を増やすためである。画像のアスペクト比は維持されており、最終的な出力34は、ストップモーション画像シーケンスではなく単一画像34として構築されている。

Claims (15)

  1. 複数の画像を処理する方法であって:
    複数の画像を受領する段階と、
    前記複数の画像から処理のための画像のセットを定義する段階と、
    前記画像のセット中の一つまたは複数の要素を整列させる段階と、
    整列された画像の一つまたは複数を、画像のクロッピング、サイズ変更および/または回転によって変換して一連の変換された画像を生成する段階と、
    前記一連の変換された画像を含む出力を生成する段階とを含み、前記出力は画像シーケンスまたは単一の画像を含む、
    方法。
  2. 前記複数の画像から処理のための画像のセットを定義する段階は、画像に関連付けられたメタデータに基づいて密接に関連している一つまたは複数の画像を選択することを含む、請求項1記載の方法。
  3. 前記複数の画像から処理のための画像のセットを定義する段階は、前記複数の画像中で、ある異なる画像に関して類似性閾値を下回る一つまたは複数の画像を破棄することを含む、請求項1または2記載の方法。
  4. 前記整列された画像の変換に続いて、整列された画像内の一つまたは複数の関心の低い要素を検出し、整列された画像をクロッピングして検出された関心の低い要素(を除去する段階をさらに含む、請求項1ないし3のうちいずれか一項記載の方法。
  5. 前記複数の画像から処理のための画像のセットを定義する段階は、一つまたは複数の画像を選択するユーザー入力を受領することを含む、請求項1ないし4のうちいずれか一項記載の方法。
  6. 複数の画像を処理するシステムであって:
    複数の画像を受領するよう構成されている受領器と、
    前記複数の画像から処理のための画像のセットを定義し、前記画像のセット中の一つまたは複数の要素を整列させ、整列された画像の一つまたは複数を、画像のクロッピング、サイズ変更および/または回転によって変換して一連の変換された画像を生成するよう構成されたプロセッサと、
    前記一連の変換された画像を含む出力を表示するよう構成された表示装置とを有し、前記出力はストップモーション・ビデオ・シーケンスまたは単一の画像を含む、
    システム。
  7. 前記プロセッサは、前記複数の画像から処理のための画像のセットを定義するときに、画像に関連付けられたメタデータに基づいて密接に関連している一つまたは複数の画像を選択するよう構成されている、請求項6記載のシステム。
  8. 前記プロセッサは、前記複数の画像から処理のための画像のセットを定義するときに、前記複数の画像中で、ある異なる画像に関して類似性閾値を下回る一つまたは複数の画像を破棄するよう構成されている、請求項6または7記載のシステム。
  9. 前記プロセッサはさらに、前記整列された画像の変換に続いて、整列された画像内の一つまたは複数の関心の低い要素を検出し、整列された画像をクロッピングして検出された関心の低い要素を除去するよう構成されている、請求項6ないし8のうちいずれか一項記載のシステム。
  10. 一つまたは複数の画像を選択するユーザー入力を受領するよう構成されたユーザー・インターフェースをさらに有しており、前記プロセッサは、前記複数の画像から処理のための画像のセットを定義するときに、前記のユーザー選択を用いるよう構成されている、請求項6ないし9のうちいずれか一項記載のシステム。
  11. 複数の画像を処理するためのコンピュータ可読媒体上のコンピュータ・プログラムであって:
    複数の画像を受領し、
    前記複数の画像から処理のための画像のセットを定義し、
    前記画像のセット中の一つまたは複数の要素を整列させ、
    整列された画像の一つまたは複数を、画像のクロッピング、サイズ変更および/または回転によって変換して一連の変換された画像を生成し、
    前記一連の変換された画像を含む出力を生成するための命令を含み、前記出力はストップモーション・ビデオ・シーケンスまたは単一の画像を含む、
    コンピュータ・プログラム。
  12. 前記複数の画像から処理のための画像のセットを定義するための命令は、画像に関連付けられたメタデータに基づいて密接に関連している一つまたは複数の画像を選択するための命令を含む、請求項11記載のコンピュータ・プログラム。
  13. 前記複数の画像から処理のための画像のセットを定義するための命令は、前記複数の画像中で、ある異なる画像に関して類似性閾値を下回る一つまたは複数の画像を破棄するための命令を含む、請求項11または12記載のコンピュータ・プログラム。
  14. 前記整列された画像の変換に続いて、整列された画像内の一つまたは複数の関心の低い要素を検出し、整列された画像をクロッピングして検出された関心の低い要素を除去するための命令をさらに含む、請求項11ないし13のうちいずれか一項記載のコンピュータ・プログラム。
  15. 前記複数の画像から処理のための画像のセットを定義するための命令は、一つまたは複数の画像を選択するユーザー入力を受領するための命令を含む、請求項11ないし14のうちいずれか一項記載のコンピュータ・プログラム。
JP2011514180A 2008-06-24 2009-06-17 画像処理 Withdrawn JP2011526013A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP08158825.3 2008-06-24
EP08158825 2008-06-24
PCT/IB2009/052576 WO2009156905A1 (en) 2008-06-24 2009-06-17 Image processing

Publications (1)

Publication Number Publication Date
JP2011526013A true JP2011526013A (ja) 2011-09-29

Family

ID=41061222

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011514180A Withdrawn JP2011526013A (ja) 2008-06-24 2009-06-17 画像処理

Country Status (6)

Country Link
US (1) US20110080424A1 (ja)
EP (1) EP2291995A1 (ja)
JP (1) JP2011526013A (ja)
KR (1) KR20110043612A (ja)
CN (1) CN102077570A (ja)
WO (1) WO2009156905A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016500881A (ja) * 2012-10-26 2016-01-14 グーグル インコーポレイテッド 写真に関連した分類
US9954916B2 (en) 2012-06-27 2018-04-24 Google Llc System and method for event content stream
US10115118B2 (en) 2012-10-23 2018-10-30 Google Llc Obtaining event reviews
US10432728B2 (en) 2017-05-17 2019-10-01 Google Llc Automatic image sharing with designated users over a communication network
US10476827B2 (en) 2015-09-28 2019-11-12 Google Llc Sharing images and image albums over a communication network
US11263492B2 (en) 2011-02-18 2022-03-01 Google Llc Automatic event recognition and cross-user photo clustering

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8914483B1 (en) 2011-03-17 2014-12-16 Google Inc. System and method for event management and information sharing
US9449411B2 (en) * 2011-04-29 2016-09-20 Kodak Alaris Inc. Ranking image importance with a photo-collage
US9100587B2 (en) * 2011-07-22 2015-08-04 Naturalpoint, Inc. Hosted camera remote control
US20130089301A1 (en) * 2011-10-06 2013-04-11 Chi-cheng Ju Method and apparatus for processing video frames image with image registration information involved therein
US9286710B2 (en) * 2013-05-14 2016-03-15 Google Inc. Generating photo animations
CN104239005B (zh) * 2013-06-09 2018-07-27 腾讯科技(深圳)有限公司 图形对齐方法及装置
JP5962600B2 (ja) * 2013-06-26 2016-08-03 カシオ計算機株式会社 動画生成装置、動画生成方法、及びプログラム
WO2015100518A1 (en) 2013-12-31 2015-07-09 Google Inc. Systems and methods for converting static image online content to dynamic online content
US20150294686A1 (en) * 2014-04-11 2015-10-15 Youlapse Oy Technique for gathering and combining digital images from multiple sources as video
US20160119672A1 (en) * 2014-10-24 2016-04-28 The Nielsen Company (Us), Llc Methods and apparatus to identify media using image recognition
US9870637B2 (en) * 2014-12-18 2018-01-16 Intel Corporation Frame removal and replacement for stop-action animation
US9992413B2 (en) * 2015-09-18 2018-06-05 Raytheon Company Method and system for creating a display with a distributed aperture system
CN106558034A (zh) * 2015-09-30 2017-04-05 北京奇虎科技有限公司 一种在移动设备中清理图像数据的方法和装置
KR102553886B1 (ko) 2015-12-24 2023-07-11 삼성전자주식회사 전자 장치 및 전자 장치의 이미지 제어 방법
CN105955170A (zh) * 2016-06-28 2016-09-21 铜仁学院 一种用于水利的自动化控制***
KR20180013523A (ko) 2016-07-29 2018-02-07 삼성전자주식회사 이미지의 유사도에 기초하여 이미지들을 연속적으로 표시하는 방법 및 장치
US10074205B2 (en) 2016-08-30 2018-09-11 Intel Corporation Machine creation of program with frame analysis method and apparatus
CN107093002A (zh) * 2017-03-02 2017-08-25 平顶山天安煤业股份有限公司 一种基于云计算的钻孔封闭质量分类及危险性评价***
KR102092840B1 (ko) * 2019-08-12 2020-03-24 박옥생 저작물의 자산화 및 접근성을 확장하는 저작물 거래 서비스 제공 방법

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6744922B1 (en) * 1999-01-29 2004-06-01 Sony Corporation Signal processing method and video/voice processing device
US7019773B1 (en) * 2000-05-25 2006-03-28 Prc Inc. Video mosaic
US6798911B1 (en) * 2001-03-28 2004-09-28 At&T Corp. Method and system for fuzzy clustering of images
US7006701B2 (en) * 2002-10-09 2006-02-28 Koninklijke Philips Electronics N.V. Sequential digital image compression
US20040252286A1 (en) * 2003-06-10 2004-12-16 Eastman Kodak Company Method and apparatus for printing a special effect preview print
US7904815B2 (en) * 2003-06-30 2011-03-08 Microsoft Corporation Content-based dynamic photo-to-video methods and apparatuses
US7573486B2 (en) * 2003-08-18 2009-08-11 LumaPix Inc. Method and system for automatic generation of image distributions
US7697785B2 (en) * 2004-03-31 2010-04-13 Fuji Xerox Co., Ltd. Generating a highly condensed visual summary
WO2008059422A1 (en) * 2006-11-14 2008-05-22 Koninklijke Philips Electronics N.V. Method and apparatus for identifying an object captured by a digital image
KR100886337B1 (ko) * 2006-11-23 2009-03-02 삼성전자주식회사 이미지 내 선택 영역을 일괄 저장하는 장치 및 이미지정보의 문서화 장치

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11263492B2 (en) 2011-02-18 2022-03-01 Google Llc Automatic event recognition and cross-user photo clustering
US9954916B2 (en) 2012-06-27 2018-04-24 Google Llc System and method for event content stream
US10270824B2 (en) 2012-06-27 2019-04-23 Google Llc System and method for event content stream
US10115118B2 (en) 2012-10-23 2018-10-30 Google Llc Obtaining event reviews
JP2016500881A (ja) * 2012-10-26 2016-01-14 グーグル インコーポレイテッド 写真に関連した分類
US10514818B2 (en) 2012-10-26 2019-12-24 Google Llc System and method for grouping related photographs
US10476827B2 (en) 2015-09-28 2019-11-12 Google Llc Sharing images and image albums over a communication network
US11146520B2 (en) 2015-09-28 2021-10-12 Google Llc Sharing images and image albums over a communication network
US10432728B2 (en) 2017-05-17 2019-10-01 Google Llc Automatic image sharing with designated users over a communication network
US11212348B2 (en) 2017-05-17 2021-12-28 Google Llc Automatic image sharing with designated users over a communication network
US11778028B2 (en) 2017-05-17 2023-10-03 Google Llc Automatic image sharing with designated users over a communication network

Also Published As

Publication number Publication date
CN102077570A (zh) 2011-05-25
EP2291995A1 (en) 2011-03-09
US20110080424A1 (en) 2011-04-07
WO2009156905A1 (en) 2009-12-30
KR20110043612A (ko) 2011-04-27

Similar Documents

Publication Publication Date Title
JP2011526013A (ja) 画像処理
TWI253860B (en) Method for generating a slide show of an image
US9013604B2 (en) Video summary including a particular person
EP2710594B1 (en) Video summary including a feature of interest
TWI375917B (en) Image processing apparatus, imaging apparatus, image processing method, and computer program
US20150074107A1 (en) Storing and serving images in memory boxes
US11580155B2 (en) Display device for displaying related digital images
US20140211065A1 (en) Method and system for creating a context based camera collage
TWI578782B (zh) 基於場景辨識的影像處理
JP2011217125A (ja) 画像処理装置、画像処理方法およびプログラム
US10127455B2 (en) Apparatus and method of providing thumbnail image of moving picture
US9081801B2 (en) Metadata supersets for matching images
CN105814905B (zh) 用于使使用信息在装置与服务器之间同步的方法和***
JP2009044463A (ja) 電子カメラ及び被写界像再生装置
JP6230386B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US9779306B2 (en) Content playback system, server, mobile terminal, content playback method, and recording medium
TW201601541A (zh) 網路攝影資料管理系統與方法
TW201724864A (zh) 彙總及瀏覽視訊內容之方法、裝置及安排
US20110304644A1 (en) Electronic apparatus and image display method
JP2006099532A (ja) 情報処理装置、画像データ出力方法およびプログラム
JP2008040851A (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
US8090872B2 (en) Visual media viewing system and method
CN115917647A (zh) 自动非线性编辑风格转移
JP2012109696A (ja) 画像処理装置
JP2006173854A (ja) 画像表示装置、画像表示プログラム、および撮像装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120614

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20121210