JP5765940B2

JP5765940B2 - 画像を再生するための方法及び装置

Info

Publication number: JP5765940B2
Application number: JP2010538982A
Authority: JP
Inventors: シェンジン; シンチェン; ペン　ヤン; ヤンペン; ニンジャンチェン; ユンジシャ
Original assignee: Koninklijke Philips NV; Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2007-12-21
Filing date: 2008-12-11
Publication date: 2015-08-19
Anticipated expiration: 2028-12-11
Also published as: KR20100095633A; WO2009083845A2; JP2011511499A; EP2225758A2; CN101971262A; US20100312559A1; KR101513847B1; WO2009083845A3; US8438034B2

Description

本発明は、画像を再生するための方法及び装置に関する。

例えば、ＰＤＡ（携帯情報端末）、携帯電話、ＴＶ（テレビ）、ＰＣ（パーソナルコンピュータ）、デジタルフォトフレーム等の電子装置が画像を再生するためにますます用いられる。画像を再生するために用いられる電子装置は、写真を格納、管理及び共有することができる。これらは、内蔵ディスプレイスクリーン上で、これらの内部メモリ又は外部メモリカードに格納されるデジタル画像のスライドショーも再生することができる。画像は、写真、画像、グラフィックス等である。

格納されたデジタル画像のスライドショーを最新の電子装置上で非常に簡単に再生することが可能である。しかしながら、ユーザは、ユーザと電子装置との間の双方向性を増大させるためにスライドショーに付随するより多くの機能を要求するかもしれない。電子装置とユーザとの間の双方向性を向上させるために、音声記録により格納媒体を介して画像を分類するためのデバイスである既知の電子装置が、特開２０００−５８２０５号公報に開示されている。このデバイスは、予め格納された音声データ及び画像データと、画像データに付随する音声データを認識するための認識手段と、認識手段により認識された予め格納された音声データに基づいて画像データを分類するための分類手段と、予め格納された音声データに類似する入力音声データにより画像又は画像カテゴリを検索するための検索手段とを有する。

しかしながら、既知の電子装置は、予め規定された及び固定された音声に基づいてユーザとインタラクトするだけであり、これは、ユーザインタフェースを非知能的及び非ユーザフレンドリなものにし、ユーザと電子装置との間の双方向性を十分に向上させていない。

本発明の目的は、画像を再生するための改良された方法及び装置を提供することである。

画像を再生する方法は、音声メッセージを受信するステップと、前記音声メッセージからの重要な特徴を抽出するステップと、前記重要な特徴を予め格納された画像情報とマッチングすることにより画像を選択するステップと、選択された前記画像及び前記音声メッセージを統合することにより画像音声シーケンスを生成するステップと、前記画像音声シーケンスを再生するステップとを有する。

また、本発明は、本発明の方法の異なるステップを実行するための処理ユニットを有する電子装置を提供する。

この方法及び装置において、ユーザによりランダムに入力された音声メッセージと前記音声メッセージに関連する対応する画像とが、画像音声再生シーケンスに統合され、これは、ユーザと電子装置との間の双方向性を向上させる。

本発明の画像を再生するための方法及び装置のこれら及び他の態様は、添付図面を参照して後述された実装及び実施形態から明らかになりこれらに関して説明されるだろう。

本発明の一実施形態の方法のフローチャートである。本発明の一実施形態の装置を示す概略的な図である。

同一の参照符号は図中の同様のパーツを示すために用いられる。

図１は本発明の一実施形態の方法のフローチャートである。

画像を再生する方法は以下のステップを有する。

音声メッセージを受信するステップ１１。音声メッセージは、ユーザ、又は、ＰＤＡ（携帯情報端末）、携帯電話、ＴＶ（テレビ）、ＰＣ（パーソナルコンピュータ）、デジタルフォトフレーム等の第２の電子装置から受信される。音声メッセージの内容は、ユーザによりランダムに決定され得る。音声メッセージは、単語、文、音楽等から成り得る。受信するステップ１１は、音声メッセージを記録し、これを第１の電子装置のメモリに格納することを意図している。例えば、息子が学校から帰宅したときに、彼は、第１の電子装置を介して彼の母に対して、"私はバスケットボールをしに行って午後７時に帰る"等の音声メッセージを残したいかもしれない。また、第１の電子装置は、ＰＤＡ（携帯情報端末）、携帯電話、ＴＶ（テレビ）、ＰＣ（パーソナルコンピュータ）、デジタルフォトフレーム等である。

音声メッセージから重要な特徴（key feature）を抽出するステップ１２。抽出するステップ１２は、キーワード、ユーザ識別子、及び／又は、対応するイントネーションのような重要な特徴を抽出するために単語単位で音声メッセージの内容を解析することを意図している。イントネーションは、"楽しい"、"悲しい"、"中間"のような異なるカテゴリで予め分類され、第１の電子装置のメモリに格納され得る。例えば、キーワードは"バスケットボール"であり、イントネーションは"楽しい"であり、ユーザ識別子は"息子"である。抽出するステップ１２は、音声メッセージの再生時間を計算することを更に意図しており、例えば、計算後、音声メッセージを再生する期間は１分である。

重要な特徴を予め格納された画像情報とマッチングすることにより画像を選択するステップ１３。予め格納された画像情報は、第１の電子装置のメモリに格納される。予め格納された画像情報は、画像名、画像内容の簡単な説明等を含み得る。例えば、"バスケットボール"、"楽しい"及び"息子"に関連する画像は、これらが音声メッセージの重要な特徴とマッチするので選択される。マッチングの重み付けは、選択された画像が例えば４つのレベルに分類されるように、メモリ内に予め規定され得る。マッチングの重み付けは、第１のレベルに対して１００であり、これは、第１のレベルに含まれる選択された画像が音声メッセージに非常に関連することを意味し、前記重み付けは、第２のレベルに対して６０であり、第３のレベルに対して２０であり、第４のレベルに対して０である。レベル１の画像は、再生されるべき最も高い優先度をもち、レベル２，３，４の順に続く。

選択された画像及び音声メッセージを統合することにより画像音声シーケンスを生成するステップ１４。生成するステップ１４は、音声メッセージの重要な特徴、音声メッセージの期間、及び、予め格納された画像情報に従って画像音声シーケンスを生成することを意図している。生成するステップ１４は、画像音声シーケンスの再生時間、選択された画像の再生順序、及び、各選択画像の再生時間を決定することを更に意図している。画像音声シーケンスの再生時間は、音声メッセージの期間に等しい。選択された画像の再生順序は、マッチングの重み付けに従って決定され得る。例えば、マッチングの重み付けが高い場合には、対応する選択画像はより早い時点で再生され得、マッチングの重み付けが低い場合には、対応する選択画像はより遅い時点で再生され得る。各選択画像の再生時間は、そのマッチングの重み付けに従って決定されてもよい。例えば、マッチングの重み付けが高い場合には、対応する画像はより長い時間で再生され得、マッチングの重み付けが低い場合には、対応する画像はより短い時間で再生され得る。勿論、再生される各選択画像は、同一の再生時間の長さをもってもよい。音声メッセージが１分の再生時間をもつ場合には、画像音声シーケンスの再生時間も１分であってもよい。従って、例えば６つの画像が選択されて各選択画像が同一の再生時間の長さで再生されるべきである場合には、各選択画像は、１０秒の再生時間をもつだろう。

画像音声シーケンスを再生するステップ１５。再生するステップ１５は、３つの状況を有する。第１の状況は、この画像音声シーケンスを生成した直後に画像音声シーケンスを再生する。第２の状況は、再生が中断されるまで画像音声シーケンスを循環的に再生する。第３の状況は、ユーザの命令に従って画像音声シーケンスを再生する。第３の状況において、ユーザは、画像音声シーケンスのためのリマインディングフラッシュライト（例えばＬＥＤ）又は電子装置上で示される他の警告に気付くときに、画像音声シーケンスを再生するように第１の電子装置に指示する。ユーザが画像音声シーケンスを再生するために命令を与える前に、画像音声シーケンスは、第１の電子装置のメモリに格納され得る。例えば、母が帰宅したときに、彼女は、フォトフレームのような電子装置のフラッシュライトに気付き、これは、彼女に家族の誰かが音声メッセージを残したことを気付かせ、そして、彼女は、画像音声シーケンスを閲覧するようにフォトフレーム上のボタンを押すことができる。前述した３つの状況の全てにおいて、画像音声シーケンスは、このシーケンスが再生された後にメモリに自動的に格納され得る。１つよりも多い画像シーケンスが生成される場合には、再生するステップ１５は、各画像音声シーケンスの生成時間に従って或る順番で画像音声シーケンスを再生することを意図し得る。

図２は、本発明の一実施形態の装置を示す概略的な図である。電子装置２０は、ＰＤＡ（携帯情報端末）、携帯電話、ＴＶ（テレビ）、ＰＣ（パーソナルコンピュータ）、デジタルフォトフレーム等である。

画像を再生するための電子装置２０は以下のユニットを有する。

音声メッセージを受信する受信ユニット２１。音声メッセージは、ユーザ、又は、ＰＤＡ（携帯情報端末）、携帯電話、ＴＶ（テレビ）、ＰＣ（パーソナルコンピュータ）、デジタルフォトフレーム等の他の電子装置から受信される。音声メッセージの内容は、ユーザによりランダムに決定され得る。音声メッセージは、単語、文、音楽等から成り得る。受信ユニット２１は、音声メッセージを記録し、これを第１の電子装置のメモリに格納するために用いられる。受信ユニット２１は、無線ユニット、レコーダ等である。

音声メッセージから重要な特徴を抽出する抽出ユニット２２。抽出ユニット２２は、キーワード、ユーザ識別子、及び、対応するイントネーションのような重要な特徴を抽出するために単語単位で音声メッセージの内容を解析するために用いられる。イントネーションは、"楽しい"、"悲しい"、"中間"のような異なるカテゴリで予め分類され、予め分類されたイントネーション基準は電子装置２０のメモリに格納され得る。抽出ユニット２２は、音声メッセージの再生時間を計算するために更に用いられる。

重要な特徴を予め格納された画像情報とマッチングすることにより画像を選択する選択ユニット２３。予め格納された画像情報は、電子装置２０のメモリに格納される。画像情報は、画像名、画像内容の簡単な説明等を含み得る。マッチングの重み付けは、選択された画像が例えば４つのレベルに分類されるように、メモリ内に予め規定され得る。マッチングの重み付けは、第１のレベルに対して１００であり、これは、第１のレベルに含まれる選択された画像が音声メッセージに非常に関連することを意味し、前記重み付けは、第２のレベルに対して６０であり、第３のレベルに対して２０であり、第４のレベルに対して０である。レベル１の画像は、再生されるべき最も高い優先度をもち、レベル２，３，４の順に続く。

選択された画像及び音声メッセージを統合することにより画像音声シーケンスを生成する生成ユニット２４。生成ユニット２４は、音声メッセージの重要な特徴、音声メッセージの期間、及び、予め格納された画像情報に従って画像音声シーケンスを生成するために用いられる。生成ユニット２４は、画像音声シーケンスの再生時間、選択された画像の再生順序、及び、各選択画像の再生時間を決定するために更に用いられる。画像音声シーケンスの再生時間は、音声メッセージの期間に等しい。選択された画像の再生順序は、マッチングの重み付けに従って生成ユニット２４により決定され得る。各選択画像の再生時間は、マッチングの重み付けに従って生成ユニット２４により決定されてもよい。勿論、再生される各選択画像は、同一の再生時間の長さをもってもよい。

画像音声シーケンスを再生する再生ユニット２５。再生ユニット２５は、以下の３つの状況において画像音声シーケンスを再生するために用いられる。第１の状況は、この画像音声シーケンスを生成した直後に画像音声シーケンスを再生する。第２の状況は、再生が中断されるまで画像音声シーケンスを循環的に再生する。第３の状況は、ユーザの命令に従って画像音声シーケンスを再生する。第３の状況において、ユーザは、画像音声シーケンスのためのリマインディングフラッシュライト（例えばＬＥＤ）又は電子装置上で示される他の警告に気付くときに、画像音声シーケンスを再生するように第１の電子装置に指示する。ユーザが画像音声シーケンスを再生するために命令を与える前に、画像音声シーケンスは、メモリに格納され得る。前述した３つの状況の全てにおいて、画像音声シーケンスは、このシーケンスが再生された後にメモリに自動的に格納され得る。１つよりも多い画像シーケンスが生成される場合には、再生ユニット２５は、各画像音声シーケンスの生成時間に従って或る順番で画像音声シーケンスを再生するために用いられ得る。

電子装置２０の構成要素は、少なくとも１つのＣＰＵによりサポートされている。

前述した実施形態は本発明を限定するよりはむしろ例示であり、当業者は特許請求の範囲から逸脱することなく多くの代替実施形態を設計可能であることが留意されるべきである。特許請求の範囲において、括弧内の如何なる参照符号も特許請求の範囲を限定するものとして考慮されるべきではない。"有する"という用語の使用及びその活用は、特許請求の範囲に記載されたもの以外の要素又はステップの存在を除外するものではない。要素の単数表記の使用は、斯様な要素の複数の存在を除外するものではない。本発明は、幾つかの別個の要素を有するハードウェアにより、及び、適切にプログラムされたコンピュータにより、実行され得る。幾つかの手段を列挙する装置に係る請求項において、これらの手段の幾つかは、同一アイテムのハードウェアにより具現されてもよい。第１、第２及び第３等の用語の使用は、いずれかの順番を示すものではない。これらの用語は名前として解釈されるべきである。

Claims

画像を再生する方法であって、
音声メッセージを受信するステップと、
前記音声メッセージから予め分類されたイントネーション基準のうち１つに対応するイントネーションを重要な特徴として抽出するステップと、
前記重要な特徴を予め格納された画像情報とマッチングすることにより複数の画像を選択するステップと、
選択された前記複数の画像及び前記音声メッセージを統合することにより画像音声シーケンスを生成するステップと、
前記画像音声シーケンスを再生するステップとを有し、
前記選択された複数の画像の再生順序は、抽出された重要な特徴に非常にマッチする高い重みを有する第１の選択された画像が、前記抽出された重要な特徴に前記第１の選択された画像ほどマッチしない低い重みを有する第２の選択された画像の前に再生されるように、予め規定されたマッチングの重み付けに従って決定される、方法。
前記抽出するステップは、前記重要な特徴を抽出するために単語単位で前記音声メッセージの内容を解析する、請求項１に記載の方法。
前記抽出するステップは、前記音声メッセージの再生時間を計算する、請求項１又は請求項２に記載の方法。
前記予め格納された画像情報は、画像名、及び、前記画像の内容の簡単な説明を有する、請求項３に記載の方法。
前記生成するステップは、前記音声メッセージの前記重要な特徴、前記音声メッセージの期間、及び、前記予め格納された画像情報に従って画像音声シーケンスを生成する、請求項４に記載の方法。
前記生成するステップは、前記画像音声シーケンスの再生時間、前記選択された複数の画像の再生順序、及び、各選択画像の再生時間を決定する、請求項１又は請求項２に記載の方法。
前記画像音声シーケンスの再生時間は、前記音声メッセージの期間に等しい、請求項６に記載の方法。
各選択画像の再生時間は、予め規定されたマッチングの重み付けに従って決定される、請求項６に記載の方法。
再生される各選択画像は、同一の再生時間の長さをもつ、請求項１又は請求項２に記載の方法。
画像を再生するための電子装置であって、
音声メッセージを受信する受信ユニットと、
前記音声メッセージから予め分類されたイントネーション基準のうち１つに対応するイントネーションを重要な特徴として抽出する抽出ユニットと、
前記重要な特徴を予め格納された画像情報とマッチングすることにより複数の画像を選択する選択ユニットと、
選択された前記複数の画像及び前記音声メッセージを統合することにより画像音声シーケンスを生成する生成ユニットと、
前記画像音声シーケンスを再生する再生ユニットとを有し、
前記選択された複数の画像の再生順序は、抽出された重要な特徴に非常にマッチする高い重みを有する第１の選択された画像が、前記抽出された重要な特徴に前記第１の選択された画像ほどマッチしない低い重みを有する第２の選択された画像の前に再生されるように、予め規定されたマッチングの重み付けに従って決定される、電子装置。
前記抽出ユニットは、前記重要な特徴を抽出するために単語単位で前記音声メッセージの内容を解析するために用いられる、請求項１０に記載の電子装置。
前記抽出ユニットは、前記音声メッセージの再生時間を計算するために用いられる、請求項１０に記載の電子装置。
前記予め格納された画像情報は、画像名、及び、前記画像の内容の簡単な説明を有する、請求項１２に記載の電子装置。
前記生成ユニットは、前記音声メッセージの前記重要な特徴、前記音声メッセージの期間、及び、前記予め格納された画像情報に従って画像音声シーケンスを生成するために用いられる、請求項１３に記載の電子装置。
前記生成ユニットは、前記画像音声シーケンスの再生時間、前記選択された複数の画像の再生順序、及び、各選択画像の再生時間を決定するために更に用いられる、請求項１０に記載の電子装置。
前記画像音声シーケンスの再生時間は、前記音声メッセージの期間に等しい、請求項１５に記載の電子装置。
前記生成ユニットは、予め規定されたマッチングの重み付けに従って、各選択画像の再生時間を決定するために用いられる、請求項１５に記載の電子装置。
再生される各選択画像は、同一の再生時間の長さをもつ、請求項１０に記載の電子装置。