JP2004363719A - 音声付き映像信号再生装置及び方法並びにプログラム - Google Patents
音声付き映像信号再生装置及び方法並びにプログラム Download PDFInfo
- Publication number
- JP2004363719A JP2004363719A JP2003157082A JP2003157082A JP2004363719A JP 2004363719 A JP2004363719 A JP 2004363719A JP 2003157082 A JP2003157082 A JP 2003157082A JP 2003157082 A JP2003157082 A JP 2003157082A JP 2004363719 A JP2004363719 A JP 2004363719A
- Authority
- JP
- Japan
- Prior art keywords
- reverberation
- image
- synthesized
- afterimage
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
【課題】音声とともに記録された連続画像について音と映像を組み合わせた効果的な視聴覚表現を実現し得る音声付き映像信号再生装置及び方法並びにプログラムを提供する。
【解決手段】音声付き動画データから、適当な間隔でフレーム画像(71〜74)を取り出し、これらフレーム画像を順に重ねて表示用メモリに書き込むことにより、画像内の動きの激しい部分を残像のように重ねた残像合成画像76を生成する。このとき、画像と同時に記録媒体に書き込まれている音声データから復号された音声レベルを示すサンプリング信号81を適当な時間遅らせて、レベルも小さくし、元の信号に加算する。これを適当な回数行うことにより残響が合成された残響合成音声84を生成する。こうして、生成された残像合成画像を残響合成音声とともに再生する。
【選択図】 図2
【解決手段】音声付き動画データから、適当な間隔でフレーム画像(71〜74)を取り出し、これらフレーム画像を順に重ねて表示用メモリに書き込むことにより、画像内の動きの激しい部分を残像のように重ねた残像合成画像76を生成する。このとき、画像と同時に記録媒体に書き込まれている音声データから復号された音声レベルを示すサンプリング信号81を適当な時間遅らせて、レベルも小さくし、元の信号に加算する。これを適当な回数行うことにより残響が合成された残響合成音声84を生成する。こうして、生成された残像合成画像を残響合成音声とともに再生する。
【選択図】 図2
Description
【0001】
【発明の属する技術分野】
本発明は音声付き映像信号再生装置及び方法並びにプログラムに係り、特にデジタルカメラ、デジタルムービーカメラ、或いは映像再生機能をコンピュータに実現させるためのアプリケーションソフトウェア(プログラム)などに適用される信号処理技術に関する。
【0002】
【従来の技術】
特許文献1に示された特殊効果装置は、圧縮情報信号を伸張する際の伸張動作に変更を加えて特殊効果を付与した信号を出力する復号化手段を備えている。この装置では、復号化を制御する方法の一つとして、オーディオ信号のレベルに応じて画像の拡大縮小を行っている。すなわち、特許文献1に開示された発明は、復号化に際して伸張信号に細工を施し、人間の感性に快い映像と音声をリアルタイムで作り出すことを主眼としている。
【0003】
特許文献2は、カメラ一体型VTR等の磁気記録再生装置において、映像信号をセピア色に変換する特殊効果(セピア効果)の処理に合わせて音声信号の周波数特性を変化させるとともに、ランダムノイズを付加することで回顧調の特殊効果の雰囲気を強調する方法が提案されている。
【0004】
【特許文献1】
特開平7−288741号公報
【0005】
【特許文献2】
特開平7−131753号公報
【0006】
【発明が解決しようとする課題】
近時、民生用のデジタルカメラにおいて毎秒数コマの画像を連写できるようになってきた。さらには、テレビジョン並みの毎秒30コマの動画撮影もできるようになっている。この種のカメラで撮影された複数コマの画像を合成し、ストロボモーション撮影のように、動きの激しい部分の軌跡を残像のように重ねて表示することが可能である。
【0007】
その一方、上記のような動画撮影時に映像と同時に音声を記録するように構成されたデジタルカメラも知られている。しかしながら、音声情報が付加された画像情報から残像処理によって合成画像を得る場合における音声情報の活用については考慮されていない。
【0008】
本発明はこのような事情に鑑みてなされたもので、音声とともに記録された連続画像について音と映像を組み合わせた効果的な視聴覚表現を実現し得る音声付き映像信号再生装置及び方法並びにプログラムを提供することを目的とする。
【0009】
【課題を解決するための手段】
前記目的を達成するために本発明に係る音声付き映像信号再生装置は、連続撮影によって取得された複数の画像を重ね合わせて残像が合成された画像を生成する残像処理手段と、前記連続撮影時に画像とともに記録された音声信号の一部を利用して残響が合成された音声信号を生成する残響処理手段と、前記残像処理手段により生成された残像合成画像を表示する表示手段と、前記残響処理手段により生成された残響合成音声を出力する音声出力手段と、前記表示手段に前記残響合成画像を表示させると同時に前記音声出力手段から前記残響合成音声を出力させる再生制御手段と、を備えたことを特徴とする。
【0010】
本発明の音声付き映像信号再生装置は、デジタルカメラやビデオカメラに代表される電子撮像装置(電子カメラ)によって記録された動画、或いは連写モードによって記録された一連の静止画群などから取り出した複数の画像を重ね合わせ、画像内の動く部分(動被写体部分)を残像として描出した合成画像(静止画又は動画、若しくはその両方)を生成する。また、本発明の音声付き映像信号再生装置は、画像とともに記録されている音声信号の一部を利用して残響信号を作り出し、元の音声信号に加算して残響合成音声を生成する。この残響処理においては、信号レベルの増減、遅延時間の調整、加算回数などの処理パラメータが適宜選択される。こうして、残像合成画像に合った残響合成音声を同時に再生することにより、視覚的効果と聴覚的効果の相乗作用による魅力的な表現が可能となる。
【0011】
本発明の一態様に係る音声付き映像信号再生装置は、上記構成に加えて、前記連続撮影時に記録された音声信号の中から閾値を超えるレベルの音声部分を自動的に抽出する音声レベル検出手段を有し、前記残響処理手段は、前記音声レベル検出手段により抽出した音声信号を用いて残響合成音声を生成することを特徴とする。
【0012】
この場合、音声レベルの判定基準となる閾値は、予め固定値として設定されていてもよいし、ユーザが所定のユーザインターフェイスを通じて変更可能に設定できるように閾値設定手段を備えていてもよい。
【0013】
また、本発明の他の態様に係る音声付き映像信号再生方法は、連続撮影によって取得された複数の画像を重ね合わせて残像が合成された画像を生成する残像処理工程と、前記連続撮影時に画像とともに記録された音声信号の一部を利用して残響が合成された音声信号を生成する残響処理工程と、前記残像処理工程で生成された残像合成画像を表示すると同時に前記残響処理工程で生成された残響合成音声を出力する再生出力工程と、を含むことを特徴とする。
【0014】
本発明のさらに他の態様は本発明の音声付き映像信号再生機能をコンピュータに実現させるためのプログラムを提供する。すなわち、本発明に係るプログラムは、連続撮影によって取得された複数の画像を重ね合わせて残像が合成された映像を生成する残像処理機能と、前記連続撮影時に画像とともに記録された音声の一部を利用して残響が合成された音声を生成する残響処理機能と、前記残像処理機能により生成された残像合成画像をディスプレイに表示させると同時に、前記残響処理機能により生成された残響合成音声をスピーカから出力させる再生制御機能と、をコンピュータに実現させることを特徴とする。
【0015】
本発明に係るプログラムは、単独のアプリケーションソフトウエアとして構成されてもよいし、画像加工ソフトやファイル管理用ソフトなどのアプリケーションの一部として組み込まれてもよい。
【0016】
本発明に係るプログラムは、インターネットなどの通信回線を利用したダウンロードサービスを通じて利用者に提供され得る。また、本発明に係るプログラムをCD−ROMその他の記録媒体に記録し、記録媒体を通じて当該プログラムを配布することも可能である。
【0017】
【発明の実施の形態】
以下添付図面に従って本発明の好ましい実施の形態について詳説する。ここでは、本発明に係る音声付き映像信号再生装置をコンピュータによって実現する例を述べる。
【0018】
図1は本発明の実施形態に係る画像再生用プログラムが組み込まれたパーソナル・コンピュータ(以下、「パソコン」という。)のハードウェア構成例を示すブロック図である。図示のように、パソコン10は、本体12内部にCPU14、メインメモリ16、バスコントローラ18、IDEインターフェイス(I/F)部20、キーボードI/F部22、プリンタI/F部24、シリアル入出力I/F部26、マウスI/F部28、赤外線通信(IrDA)I/F部30、メモリカードI/F部32、アナログボリューム/ミキサ回路34、ビデオアクセラレータ36を備えており、これら各回路ブロックはバス38に接続されている。
【0019】
IDEI/F部20には、ハードディスクドライブ(HDD)40、CD−ROMドライブ42、フロッピーディスクドライブ(FDD)44などの記憶装置が接続される。HDD40には、オペレーティングシステム(OS)や各種のアプリケーションソフト、ユーザが記録した画像ファイル等が格納される。本発明による画像再生用プログラムは、該HDD40に格納されており、必要に応じてメインメモリ16に展開される。
【0020】
キーボードI/F部22は、キーボード46の操作に伴う指示信号の入力を受け付ける。同様に、マウスI/F部28は、マウス48からの指示信号の入力を受け付ける。
【0021】
メモリカードI/F部32は、例えば、PCMCIA規格のPCカードに適合したインターフフェイスであり、カードスロット50に装着されるメモリカード52の読み書き制御を行う。
【0022】
アナログボリューム/ミキサ回路34は、音声信号の変換処理を行う回路であり、デジタル音声信号をアナログの音声信号に変換する。アナログボリューム/ミキサ回路34で生成された音声信号はスピーカ54に供給され、スピーカ54から音声として出力される。
【0023】
ビデオアクセラレータ36は、描画処理を行う信号処理部であり、表示用メモリを備えている。ビデオアクセラレータ36において生成された描画信号はD/A変換器56によりアナログ信号に変換された後、アナログスイッチ回路58を介してCRTディスプレイ60に出力される。なお、表示手段は、CRTディスプレイ60に限らず、液晶ディスプレイその他の表示装置を用いてもよい。
【0024】
パソコン10の本体12内にはスイッチング電源回路62が搭載されており、電源プラグ64を介して外部電源から供給される電力は、該スイッチング電源回路62において所定の電圧に変換された後、各回路ブロックに供給される。
【0025】
CPU14は、制御部及び演算装置として機能し、パソコン10の各回路を統括制御する。なお、図1中符号66はCPU14に対してクロック信号を供給するクロック発生器である。メインメモリ16は、データの一時記憶やCPU14によるプログラム実行時の作業用領域として利用される。
【0026】
次に、本発明の実施形態に係る画像再生用プログラムについて説明する。
【0027】
図2は、本発明により実現される音声付き映像信号の再生方法の概要を示した図である。
【0028】
再生対象となる動画(又は連写により取得された一連の静止画)は、予めデジタルカメラ等によって撮影され、HDD40やメモリカード52或いは不図示のCD−ROM等の記録媒体に格納されているものとする。
【0029】
連続撮影された複数の画像71〜74は記録媒体から読み出され、時系列順に順次重ね合わせて表示用メモリに書き込まれる。すると、画像内の動きの激しい部分のみが画面内において異なる位置に飛び飛びで現れ、ストロボモーション撮影のような残像が合成された映像(残像合成画像)76が得られる。
【0030】
残像合成画像76は、一枚の静止画像でもよいし、残像が次第に重ね合わされていく様子を表した短時間の動画であってもよい。
【0031】
例えば、再生対象のファイルが毎秒30コマの動画であれば、全フレームの中から対象とするフレーム範囲を切り出し、その中から適当な時間間隔でフレーム間引きを行いながら、複数のコマを抽出し、表示用メモリに書き込む。
【0032】
このとき、画像と同時に記録媒体に書き込まれている音声データを再生するが、音声データの再生にあたり、時系列的に読み出され復号された音声レベルを示すサンプリング信号81を適当な時間遅らせて、さらにレベルも小さくして元の信号に加算する。それを適当な回数行うことにより、残響が合成された音声(残響合成音声)84を得る。図2では、元の音声が次第に減衰しながらエコーのような効果によって繰り返し出力される様子が示されている。
【0033】
図3は本例の画像再生用プログラムの動作手順を示すフローチャートであり、図4はGUI画面の例を示す図である。
【0034】
図3に示したように、まず、画像データの格納場所(フォルダ)を指定してフォルダ内の画像を一覧表示させ、この画像一覧の中から所望の動画ファイルを選択する操作を行う(ステップS110)。
【0035】
動画ファイルは、例えば、モーションJPEG形式によって記録されている。モーションJPEG形式では、動画を構成する各フレームの画像が1画像内でJPEG圧縮されており、画像データとそれに対応する音声データとが巡回式にインターリーブされて連続的に記録されている。したがって、動画内から特定のコマや音声を抽出する処理の制御が比較的容易である。もちろん、動画のファイル形式はモーションJPEGに限定されず、MPEGなど他のファイル形式を適用してもよい。
【0036】
その後メニューから「残像処理」のコマンドを選択する操作を行うと(ステップS112)、図3のような残像処理ウインドウ200が表示される。
【0037】
図3によれば、残像処理ウインドウ200は、指定された動画ファイル内から抽出された複数のフレームの縮小画像202を時系列に沿って並べて表示する画像表示エリア210と、音声信号の波形212を表示する音声波形表示エリア220と、画像の間引き間隔を指定する入力ボックス232と、画像の取り込み時間を指定する入力ボックス234と、音声記憶時間の指定を行うチェックボックス236及び入力ボックス238と、音声再生ボタン240と、残像処理の実行を指令する実行ボタン242と、ウインドウを閉じるための終了ボタン244とを備えている。
【0038】
「画像の間引き間隔」とは、選択された動画の指定部分(ある時間範囲内)からフレーム画像を抽出する際の間隔を意味している。例えば、間引き間隔を「10フレーム」に指定すると、10フレームおきに1つのフレームが抽出される。「画像の取り込み時間」は、動画の先頭から末尾までの全体の中から残像処理に使用する範囲を決めるものである。本例では、動画の先頭からの時間によってその範囲を指定する。「音声記憶時間」は、残響信号の生成に用いる音声信号を切り出すときの時間長を決めるものである。
【0039】
ユーザは図1で説明したキーボード46やマウス48を利用して、図4の残像処理ウインドウ200上の入力ボックス232、234、238に所望の数値を入力することができる。なお、各入力ボックス232、234、238右横の選択肢ボタン252、254、258をクリックすると選択肢の一覧が表示されるので、その一覧の中から目的の項目をクリックすることによってそれぞれの入力ボックス232、234、238への情報の入力が可能である。
【0040】
図4の残像処理ウインドウ200上で画像の間引き間隔の設定(図3のステップS114)、並びに画像の取り込み時間の設定(ステップS116)を行うと、これら設定に従って動画中の指定範囲から指定の間引き間隔でフレーム画像が抽出され、各フレームの縮小画像202が画像表示エリア210に表示される(図4参照)。
【0041】
次いで、ユーザは音声記憶時間の設定を行う(図3のステップS118)。図4に示した音声記憶時間の設定欄で「自動」のチェックボックス236を選択すると、取り込み対象範囲内の音声情報の中から残響処理に使用される音声部分が自動的に切り出される。
【0042】
このとき、図4のように、音声波形表示エリア220において音声検出用の閾値を指定するためのスライダ260を図4上で上下方向に動かすことにより、音声検出レベルを任意に設定できる。
【0043】
音声検出レベル(閾値)の設定が行われると(図3のステップS120)、この設定された閾値に基づいて音声情報の信号レベルが判定され、最初に閾値を超える大きな音がしたところを含む所定の時間範囲(図4の囲み枠線262で示した範囲)が残響処理用の音声部分として自動的に抽出される。
【0044】
また、上記の自動検出に代えて、図4に示した「設定」のチェックボックス236にチェックを入れると、音声全体の中から任意の音声範囲を指定することができる。例えば、音声再生ボタン240をクリックすると、波形212の表示とともに音声信号のみが再生され、その波形212上で囲み枠線262を移動させることにより所望の範囲を指定できるようになっている。或いは、所望のコマ画像を選択することで、そのコマに対応する音声部分を指定するようなユーザインターフェイスも可能である。
【0045】
上記の各種設定を行った後に、実行ボタン242をクリックすると、残像合成画像を生成する処理及び残響合成音声を生成する処理が実行される(図3のステップS122)。
【0046】
そして、生成された処理結果の映像と音声が同時に再生される(ステップS124)。ユーザは、得られた結果の良否を判断し(ステップS126)、意図する結果が得られていなければ、ステップS114に戻って、各種の設定をやり直す。
【0047】
その一方、ステップS126において、意図する結果が得られた場合には、生成された残像合成画像及び残響合成音声を適宜の保存場所に記録した後、終了ボタン244をクリックして処理を終了させる。
【0048】
残響合成音声のデータと残像合成画像のデータは、一つの同じ電子ファイル内に記録されてもよいし、それぞれ別々のファイルとして記録されてもよい。ただし、別ファイルで記録する場合については、再生時に残像合成画像の表示と同時に残響合成音声の出力を行うことができるように、ヘッダーの情報(タグ情報など)を利用して両者を関連付けて記録する。
【0049】
上述したように、本実施形態によれば、ユーザが意図する視聴覚表現を容易に行うことができる。なお、本発明の実施に際しては、上記した実施形態に限定されず、様々な変形が可能である。
【0050】
〔変形例1〕残響音を合成する音声処理部についてデジタル信号処理を用いる態様の他、遅延回路とアッテネータと加算回路を用いるなどアナログ的な信号処理手段を用いてもよい。
【0051】
〔変形例2〕図2では、切り出した音声部分のレベルを低減させながら、遅延加算していく例を述べたが、このようなエコー処理に限らず、音声レベルを次第に大きくしたり、或いはレベルの増減を組み合わせたりする態様も可能である。
【0052】
〔変形例3〕残響処理に使用する音声部分の切り出し方法について、デフォルトは、先頭から所定時間(例えば、先頭から2秒)を切り出すように設定され、ユーザが所定の操作を行うことによって、音声全体の中から任意の期間を切り出すことができるように構成してもよい。
【0053】
また、残像処理のために抽出されたコマの画像に対応する音声データの中から最も信号レベルの高いものを自動的に抽出し、これを残響処理に使用する態様も可能である。
【0054】
〔変形例4〕残像処理によって、画像内で動く部分が時間とともに順次移動しながらその残像が順次追加されていく映像を作り出す場合には、映像上で新たな残像が追加されるタイミングで音声の出力が行われる態様が好ましい。この場合、追加されるコマに対応する音声を順に加算してもよい。
【0055】
〔変形例5〕残像処理の編集時において編集画面上で残像が順次追加されていくような動画映像を表示し、編集終了後、合成処理で得られた最終画像を静止画として記録する態様も可能である。また、編集時と同様の短時間動画を記録するモードと、最終画像(静止画)を記録するモードとを選択可能に構成する態様も好ましい。
【0056】
〔変形例6〕MPEG形式の動画は、フレーム内符号化によって圧縮されたIピクチャ(フレーム内符号化画像)、過去のフレームから予測したデータとの差分をエンコードしたPピクチャ(フレーム間順方向予測符号化画像)、過去, 未来両方のフレームから予測したデータとの差分をエンコードしたBピクチャ(双方向予測符号化画像)によって構成されているため、残像処理に使用するコマを抽出する際にはIピクチャの画像を取り出すことが好ましい。また、MPEG形式で記録されている音声は、一旦音声全体を復元してから残響処理用の切り出し処理を行う。
【0057】
〔変形例7〕残像処理によって生成される画像に応じて残響処理の処理パラメータを自動的に制御してもよい。例えば、▲1▼残像処理に用いる画像の枚数が少ない場合には、エコー処理の加算回数を少なく設定して残響音を短くするという具合に、重ね合わせる画像の枚数に応じて残響信号の加算回数を制御する。▲2▼画像の取り込み時間が長いほど音声の切り出し時間も長く設定するという具合に、画像の取り込み時間に応じて音声の切り出し時間を制御する。▲3▼画像の間引き間隔が大きいほど残響信号の遅延時間を長くするという具合に、画像間の時間間隔に応じて残響信号の遅延時間を制御する。
【0058】
〔変形例8〕また、上記した実施形態ではパソコン10を例示したが、本発明の適用範囲はこれに限定されず、本発明に係る音声付き映像信号再生装置をデジタルカメラやビデオカメラなどの電子カメラに搭載することも可能である。
【0059】
【発明の効果】
以上説明したように本発明によれば、音声付きの映像信号から残像処理によって残像合成画像を生成するとともに、残響処理によって残響合成音声を生成し、残像合成画像と同時に残響合成音声を再生するようにしたので、ユーザが意図する効果的な視聴覚表現が可能となる。
【図面の簡単な説明】
【図1】本発明の実施形態に係る画像再生用プログラムが組み込まれたパソコンのハードウェア構成例を示すブロック図
【図2】本発明により実現される音声付き映像信号の再生方法の概要を示した図
【図3】本例の画像再生用プログラムの動作手順を示すフローチャート
【図4】本例の画像再生用プログラムによって実現されるGUI画面の例を示す図
【符号の説明】
10…パソコン、12…本体、14…CPU、16…メインメモリ、34…アナログボリューム/ミキサ回路、36…ビデオアクセラレータ、54…スピーカ
【発明の属する技術分野】
本発明は音声付き映像信号再生装置及び方法並びにプログラムに係り、特にデジタルカメラ、デジタルムービーカメラ、或いは映像再生機能をコンピュータに実現させるためのアプリケーションソフトウェア(プログラム)などに適用される信号処理技術に関する。
【0002】
【従来の技術】
特許文献1に示された特殊効果装置は、圧縮情報信号を伸張する際の伸張動作に変更を加えて特殊効果を付与した信号を出力する復号化手段を備えている。この装置では、復号化を制御する方法の一つとして、オーディオ信号のレベルに応じて画像の拡大縮小を行っている。すなわち、特許文献1に開示された発明は、復号化に際して伸張信号に細工を施し、人間の感性に快い映像と音声をリアルタイムで作り出すことを主眼としている。
【0003】
特許文献2は、カメラ一体型VTR等の磁気記録再生装置において、映像信号をセピア色に変換する特殊効果(セピア効果)の処理に合わせて音声信号の周波数特性を変化させるとともに、ランダムノイズを付加することで回顧調の特殊効果の雰囲気を強調する方法が提案されている。
【0004】
【特許文献1】
特開平7−288741号公報
【0005】
【特許文献2】
特開平7−131753号公報
【0006】
【発明が解決しようとする課題】
近時、民生用のデジタルカメラにおいて毎秒数コマの画像を連写できるようになってきた。さらには、テレビジョン並みの毎秒30コマの動画撮影もできるようになっている。この種のカメラで撮影された複数コマの画像を合成し、ストロボモーション撮影のように、動きの激しい部分の軌跡を残像のように重ねて表示することが可能である。
【0007】
その一方、上記のような動画撮影時に映像と同時に音声を記録するように構成されたデジタルカメラも知られている。しかしながら、音声情報が付加された画像情報から残像処理によって合成画像を得る場合における音声情報の活用については考慮されていない。
【0008】
本発明はこのような事情に鑑みてなされたもので、音声とともに記録された連続画像について音と映像を組み合わせた効果的な視聴覚表現を実現し得る音声付き映像信号再生装置及び方法並びにプログラムを提供することを目的とする。
【0009】
【課題を解決するための手段】
前記目的を達成するために本発明に係る音声付き映像信号再生装置は、連続撮影によって取得された複数の画像を重ね合わせて残像が合成された画像を生成する残像処理手段と、前記連続撮影時に画像とともに記録された音声信号の一部を利用して残響が合成された音声信号を生成する残響処理手段と、前記残像処理手段により生成された残像合成画像を表示する表示手段と、前記残響処理手段により生成された残響合成音声を出力する音声出力手段と、前記表示手段に前記残響合成画像を表示させると同時に前記音声出力手段から前記残響合成音声を出力させる再生制御手段と、を備えたことを特徴とする。
【0010】
本発明の音声付き映像信号再生装置は、デジタルカメラやビデオカメラに代表される電子撮像装置(電子カメラ)によって記録された動画、或いは連写モードによって記録された一連の静止画群などから取り出した複数の画像を重ね合わせ、画像内の動く部分(動被写体部分)を残像として描出した合成画像(静止画又は動画、若しくはその両方)を生成する。また、本発明の音声付き映像信号再生装置は、画像とともに記録されている音声信号の一部を利用して残響信号を作り出し、元の音声信号に加算して残響合成音声を生成する。この残響処理においては、信号レベルの増減、遅延時間の調整、加算回数などの処理パラメータが適宜選択される。こうして、残像合成画像に合った残響合成音声を同時に再生することにより、視覚的効果と聴覚的効果の相乗作用による魅力的な表現が可能となる。
【0011】
本発明の一態様に係る音声付き映像信号再生装置は、上記構成に加えて、前記連続撮影時に記録された音声信号の中から閾値を超えるレベルの音声部分を自動的に抽出する音声レベル検出手段を有し、前記残響処理手段は、前記音声レベル検出手段により抽出した音声信号を用いて残響合成音声を生成することを特徴とする。
【0012】
この場合、音声レベルの判定基準となる閾値は、予め固定値として設定されていてもよいし、ユーザが所定のユーザインターフェイスを通じて変更可能に設定できるように閾値設定手段を備えていてもよい。
【0013】
また、本発明の他の態様に係る音声付き映像信号再生方法は、連続撮影によって取得された複数の画像を重ね合わせて残像が合成された画像を生成する残像処理工程と、前記連続撮影時に画像とともに記録された音声信号の一部を利用して残響が合成された音声信号を生成する残響処理工程と、前記残像処理工程で生成された残像合成画像を表示すると同時に前記残響処理工程で生成された残響合成音声を出力する再生出力工程と、を含むことを特徴とする。
【0014】
本発明のさらに他の態様は本発明の音声付き映像信号再生機能をコンピュータに実現させるためのプログラムを提供する。すなわち、本発明に係るプログラムは、連続撮影によって取得された複数の画像を重ね合わせて残像が合成された映像を生成する残像処理機能と、前記連続撮影時に画像とともに記録された音声の一部を利用して残響が合成された音声を生成する残響処理機能と、前記残像処理機能により生成された残像合成画像をディスプレイに表示させると同時に、前記残響処理機能により生成された残響合成音声をスピーカから出力させる再生制御機能と、をコンピュータに実現させることを特徴とする。
【0015】
本発明に係るプログラムは、単独のアプリケーションソフトウエアとして構成されてもよいし、画像加工ソフトやファイル管理用ソフトなどのアプリケーションの一部として組み込まれてもよい。
【0016】
本発明に係るプログラムは、インターネットなどの通信回線を利用したダウンロードサービスを通じて利用者に提供され得る。また、本発明に係るプログラムをCD−ROMその他の記録媒体に記録し、記録媒体を通じて当該プログラムを配布することも可能である。
【0017】
【発明の実施の形態】
以下添付図面に従って本発明の好ましい実施の形態について詳説する。ここでは、本発明に係る音声付き映像信号再生装置をコンピュータによって実現する例を述べる。
【0018】
図1は本発明の実施形態に係る画像再生用プログラムが組み込まれたパーソナル・コンピュータ(以下、「パソコン」という。)のハードウェア構成例を示すブロック図である。図示のように、パソコン10は、本体12内部にCPU14、メインメモリ16、バスコントローラ18、IDEインターフェイス(I/F)部20、キーボードI/F部22、プリンタI/F部24、シリアル入出力I/F部26、マウスI/F部28、赤外線通信(IrDA)I/F部30、メモリカードI/F部32、アナログボリューム/ミキサ回路34、ビデオアクセラレータ36を備えており、これら各回路ブロックはバス38に接続されている。
【0019】
IDEI/F部20には、ハードディスクドライブ(HDD)40、CD−ROMドライブ42、フロッピーディスクドライブ(FDD)44などの記憶装置が接続される。HDD40には、オペレーティングシステム(OS)や各種のアプリケーションソフト、ユーザが記録した画像ファイル等が格納される。本発明による画像再生用プログラムは、該HDD40に格納されており、必要に応じてメインメモリ16に展開される。
【0020】
キーボードI/F部22は、キーボード46の操作に伴う指示信号の入力を受け付ける。同様に、マウスI/F部28は、マウス48からの指示信号の入力を受け付ける。
【0021】
メモリカードI/F部32は、例えば、PCMCIA規格のPCカードに適合したインターフフェイスであり、カードスロット50に装着されるメモリカード52の読み書き制御を行う。
【0022】
アナログボリューム/ミキサ回路34は、音声信号の変換処理を行う回路であり、デジタル音声信号をアナログの音声信号に変換する。アナログボリューム/ミキサ回路34で生成された音声信号はスピーカ54に供給され、スピーカ54から音声として出力される。
【0023】
ビデオアクセラレータ36は、描画処理を行う信号処理部であり、表示用メモリを備えている。ビデオアクセラレータ36において生成された描画信号はD/A変換器56によりアナログ信号に変換された後、アナログスイッチ回路58を介してCRTディスプレイ60に出力される。なお、表示手段は、CRTディスプレイ60に限らず、液晶ディスプレイその他の表示装置を用いてもよい。
【0024】
パソコン10の本体12内にはスイッチング電源回路62が搭載されており、電源プラグ64を介して外部電源から供給される電力は、該スイッチング電源回路62において所定の電圧に変換された後、各回路ブロックに供給される。
【0025】
CPU14は、制御部及び演算装置として機能し、パソコン10の各回路を統括制御する。なお、図1中符号66はCPU14に対してクロック信号を供給するクロック発生器である。メインメモリ16は、データの一時記憶やCPU14によるプログラム実行時の作業用領域として利用される。
【0026】
次に、本発明の実施形態に係る画像再生用プログラムについて説明する。
【0027】
図2は、本発明により実現される音声付き映像信号の再生方法の概要を示した図である。
【0028】
再生対象となる動画(又は連写により取得された一連の静止画)は、予めデジタルカメラ等によって撮影され、HDD40やメモリカード52或いは不図示のCD−ROM等の記録媒体に格納されているものとする。
【0029】
連続撮影された複数の画像71〜74は記録媒体から読み出され、時系列順に順次重ね合わせて表示用メモリに書き込まれる。すると、画像内の動きの激しい部分のみが画面内において異なる位置に飛び飛びで現れ、ストロボモーション撮影のような残像が合成された映像(残像合成画像)76が得られる。
【0030】
残像合成画像76は、一枚の静止画像でもよいし、残像が次第に重ね合わされていく様子を表した短時間の動画であってもよい。
【0031】
例えば、再生対象のファイルが毎秒30コマの動画であれば、全フレームの中から対象とするフレーム範囲を切り出し、その中から適当な時間間隔でフレーム間引きを行いながら、複数のコマを抽出し、表示用メモリに書き込む。
【0032】
このとき、画像と同時に記録媒体に書き込まれている音声データを再生するが、音声データの再生にあたり、時系列的に読み出され復号された音声レベルを示すサンプリング信号81を適当な時間遅らせて、さらにレベルも小さくして元の信号に加算する。それを適当な回数行うことにより、残響が合成された音声(残響合成音声)84を得る。図2では、元の音声が次第に減衰しながらエコーのような効果によって繰り返し出力される様子が示されている。
【0033】
図3は本例の画像再生用プログラムの動作手順を示すフローチャートであり、図4はGUI画面の例を示す図である。
【0034】
図3に示したように、まず、画像データの格納場所(フォルダ)を指定してフォルダ内の画像を一覧表示させ、この画像一覧の中から所望の動画ファイルを選択する操作を行う(ステップS110)。
【0035】
動画ファイルは、例えば、モーションJPEG形式によって記録されている。モーションJPEG形式では、動画を構成する各フレームの画像が1画像内でJPEG圧縮されており、画像データとそれに対応する音声データとが巡回式にインターリーブされて連続的に記録されている。したがって、動画内から特定のコマや音声を抽出する処理の制御が比較的容易である。もちろん、動画のファイル形式はモーションJPEGに限定されず、MPEGなど他のファイル形式を適用してもよい。
【0036】
その後メニューから「残像処理」のコマンドを選択する操作を行うと(ステップS112)、図3のような残像処理ウインドウ200が表示される。
【0037】
図3によれば、残像処理ウインドウ200は、指定された動画ファイル内から抽出された複数のフレームの縮小画像202を時系列に沿って並べて表示する画像表示エリア210と、音声信号の波形212を表示する音声波形表示エリア220と、画像の間引き間隔を指定する入力ボックス232と、画像の取り込み時間を指定する入力ボックス234と、音声記憶時間の指定を行うチェックボックス236及び入力ボックス238と、音声再生ボタン240と、残像処理の実行を指令する実行ボタン242と、ウインドウを閉じるための終了ボタン244とを備えている。
【0038】
「画像の間引き間隔」とは、選択された動画の指定部分(ある時間範囲内)からフレーム画像を抽出する際の間隔を意味している。例えば、間引き間隔を「10フレーム」に指定すると、10フレームおきに1つのフレームが抽出される。「画像の取り込み時間」は、動画の先頭から末尾までの全体の中から残像処理に使用する範囲を決めるものである。本例では、動画の先頭からの時間によってその範囲を指定する。「音声記憶時間」は、残響信号の生成に用いる音声信号を切り出すときの時間長を決めるものである。
【0039】
ユーザは図1で説明したキーボード46やマウス48を利用して、図4の残像処理ウインドウ200上の入力ボックス232、234、238に所望の数値を入力することができる。なお、各入力ボックス232、234、238右横の選択肢ボタン252、254、258をクリックすると選択肢の一覧が表示されるので、その一覧の中から目的の項目をクリックすることによってそれぞれの入力ボックス232、234、238への情報の入力が可能である。
【0040】
図4の残像処理ウインドウ200上で画像の間引き間隔の設定(図3のステップS114)、並びに画像の取り込み時間の設定(ステップS116)を行うと、これら設定に従って動画中の指定範囲から指定の間引き間隔でフレーム画像が抽出され、各フレームの縮小画像202が画像表示エリア210に表示される(図4参照)。
【0041】
次いで、ユーザは音声記憶時間の設定を行う(図3のステップS118)。図4に示した音声記憶時間の設定欄で「自動」のチェックボックス236を選択すると、取り込み対象範囲内の音声情報の中から残響処理に使用される音声部分が自動的に切り出される。
【0042】
このとき、図4のように、音声波形表示エリア220において音声検出用の閾値を指定するためのスライダ260を図4上で上下方向に動かすことにより、音声検出レベルを任意に設定できる。
【0043】
音声検出レベル(閾値)の設定が行われると(図3のステップS120)、この設定された閾値に基づいて音声情報の信号レベルが判定され、最初に閾値を超える大きな音がしたところを含む所定の時間範囲(図4の囲み枠線262で示した範囲)が残響処理用の音声部分として自動的に抽出される。
【0044】
また、上記の自動検出に代えて、図4に示した「設定」のチェックボックス236にチェックを入れると、音声全体の中から任意の音声範囲を指定することができる。例えば、音声再生ボタン240をクリックすると、波形212の表示とともに音声信号のみが再生され、その波形212上で囲み枠線262を移動させることにより所望の範囲を指定できるようになっている。或いは、所望のコマ画像を選択することで、そのコマに対応する音声部分を指定するようなユーザインターフェイスも可能である。
【0045】
上記の各種設定を行った後に、実行ボタン242をクリックすると、残像合成画像を生成する処理及び残響合成音声を生成する処理が実行される(図3のステップS122)。
【0046】
そして、生成された処理結果の映像と音声が同時に再生される(ステップS124)。ユーザは、得られた結果の良否を判断し(ステップS126)、意図する結果が得られていなければ、ステップS114に戻って、各種の設定をやり直す。
【0047】
その一方、ステップS126において、意図する結果が得られた場合には、生成された残像合成画像及び残響合成音声を適宜の保存場所に記録した後、終了ボタン244をクリックして処理を終了させる。
【0048】
残響合成音声のデータと残像合成画像のデータは、一つの同じ電子ファイル内に記録されてもよいし、それぞれ別々のファイルとして記録されてもよい。ただし、別ファイルで記録する場合については、再生時に残像合成画像の表示と同時に残響合成音声の出力を行うことができるように、ヘッダーの情報(タグ情報など)を利用して両者を関連付けて記録する。
【0049】
上述したように、本実施形態によれば、ユーザが意図する視聴覚表現を容易に行うことができる。なお、本発明の実施に際しては、上記した実施形態に限定されず、様々な変形が可能である。
【0050】
〔変形例1〕残響音を合成する音声処理部についてデジタル信号処理を用いる態様の他、遅延回路とアッテネータと加算回路を用いるなどアナログ的な信号処理手段を用いてもよい。
【0051】
〔変形例2〕図2では、切り出した音声部分のレベルを低減させながら、遅延加算していく例を述べたが、このようなエコー処理に限らず、音声レベルを次第に大きくしたり、或いはレベルの増減を組み合わせたりする態様も可能である。
【0052】
〔変形例3〕残響処理に使用する音声部分の切り出し方法について、デフォルトは、先頭から所定時間(例えば、先頭から2秒)を切り出すように設定され、ユーザが所定の操作を行うことによって、音声全体の中から任意の期間を切り出すことができるように構成してもよい。
【0053】
また、残像処理のために抽出されたコマの画像に対応する音声データの中から最も信号レベルの高いものを自動的に抽出し、これを残響処理に使用する態様も可能である。
【0054】
〔変形例4〕残像処理によって、画像内で動く部分が時間とともに順次移動しながらその残像が順次追加されていく映像を作り出す場合には、映像上で新たな残像が追加されるタイミングで音声の出力が行われる態様が好ましい。この場合、追加されるコマに対応する音声を順に加算してもよい。
【0055】
〔変形例5〕残像処理の編集時において編集画面上で残像が順次追加されていくような動画映像を表示し、編集終了後、合成処理で得られた最終画像を静止画として記録する態様も可能である。また、編集時と同様の短時間動画を記録するモードと、最終画像(静止画)を記録するモードとを選択可能に構成する態様も好ましい。
【0056】
〔変形例6〕MPEG形式の動画は、フレーム内符号化によって圧縮されたIピクチャ(フレーム内符号化画像)、過去のフレームから予測したデータとの差分をエンコードしたPピクチャ(フレーム間順方向予測符号化画像)、過去, 未来両方のフレームから予測したデータとの差分をエンコードしたBピクチャ(双方向予測符号化画像)によって構成されているため、残像処理に使用するコマを抽出する際にはIピクチャの画像を取り出すことが好ましい。また、MPEG形式で記録されている音声は、一旦音声全体を復元してから残響処理用の切り出し処理を行う。
【0057】
〔変形例7〕残像処理によって生成される画像に応じて残響処理の処理パラメータを自動的に制御してもよい。例えば、▲1▼残像処理に用いる画像の枚数が少ない場合には、エコー処理の加算回数を少なく設定して残響音を短くするという具合に、重ね合わせる画像の枚数に応じて残響信号の加算回数を制御する。▲2▼画像の取り込み時間が長いほど音声の切り出し時間も長く設定するという具合に、画像の取り込み時間に応じて音声の切り出し時間を制御する。▲3▼画像の間引き間隔が大きいほど残響信号の遅延時間を長くするという具合に、画像間の時間間隔に応じて残響信号の遅延時間を制御する。
【0058】
〔変形例8〕また、上記した実施形態ではパソコン10を例示したが、本発明の適用範囲はこれに限定されず、本発明に係る音声付き映像信号再生装置をデジタルカメラやビデオカメラなどの電子カメラに搭載することも可能である。
【0059】
【発明の効果】
以上説明したように本発明によれば、音声付きの映像信号から残像処理によって残像合成画像を生成するとともに、残響処理によって残響合成音声を生成し、残像合成画像と同時に残響合成音声を再生するようにしたので、ユーザが意図する効果的な視聴覚表現が可能となる。
【図面の簡単な説明】
【図1】本発明の実施形態に係る画像再生用プログラムが組み込まれたパソコンのハードウェア構成例を示すブロック図
【図2】本発明により実現される音声付き映像信号の再生方法の概要を示した図
【図3】本例の画像再生用プログラムの動作手順を示すフローチャート
【図4】本例の画像再生用プログラムによって実現されるGUI画面の例を示す図
【符号の説明】
10…パソコン、12…本体、14…CPU、16…メインメモリ、34…アナログボリューム/ミキサ回路、36…ビデオアクセラレータ、54…スピーカ
Claims (4)
- 連続撮影によって取得された複数の画像を重ね合わせて残像が合成された画像を生成する残像処理手段と、
前記連続撮影時に画像とともに記録された音声信号の一部を利用して残響が合成された音声信号を生成する残響処理手段と、
前記残像処理手段により生成された残像合成画像を表示する表示手段と、
前記残響処理手段により生成された残響合成音声を出力する音声出力手段と、前記表示手段に前記残響合成画像を表示させると同時に前記音声出力手段から前記残響合成音声を出力させる再生制御手段と、
を備えたことを特徴とする音声付き映像信号再生装置。 - 前記連続撮影時に記録された音声信号の中から閾値を超えるレベルの音声部分を自動的に抽出する音声レベル検出手段を有し、
前記残響処理手段は、前記音声レベル検出手段により抽出した音声信号を用いて残響合成音声を生成することを特徴とする請求項1記載の音声付き映像信号再生装置。 - 連続撮影によって取得された複数の画像を重ね合わせて残像が合成された画像を生成する残像処理工程と、
前記連続撮影時に画像とともに記録された音声信号の一部を利用して残響が合成された音声信号を生成する残響処理工程と、
前記残像処理工程で生成された残像合成画像を表示すると同時に前記残響処理工程で生成された残響合成音声を出力する再生出力工程と、
を含むことを特徴とする音声付き映像信号再生方法。 - 連続撮影によって取得された複数の画像を重ね合わせて残像が合成された画像を生成する残像処理機能と、
前記連続撮影時に画像とともに記録された音声信号の一部を利用して残響が合成された音声信号を生成する残響処理機能と、
前記残像処理機能により生成された残像合成画像をディスプレイに表示させると同時に前記残響処理機能により生成された残響合成音声をスピーカから出力させる再生制御機能と、
をコンピュータに実現させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003157082A JP2004363719A (ja) | 2003-06-02 | 2003-06-02 | 音声付き映像信号再生装置及び方法並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003157082A JP2004363719A (ja) | 2003-06-02 | 2003-06-02 | 音声付き映像信号再生装置及び方法並びにプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004363719A true JP2004363719A (ja) | 2004-12-24 |
Family
ID=34050969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003157082A Pending JP2004363719A (ja) | 2003-06-02 | 2003-06-02 | 音声付き映像信号再生装置及び方法並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004363719A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008154065A (ja) * | 2006-12-19 | 2008-07-03 | Roland Corp | 効果付与装置 |
JP2011049822A (ja) * | 2009-08-27 | 2011-03-10 | Casio Computer Co Ltd | 表示制御装置及び表示制御プログラム |
-
2003
- 2003-06-02 JP JP2003157082A patent/JP2004363719A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008154065A (ja) * | 2006-12-19 | 2008-07-03 | Roland Corp | 効果付与装置 |
JP2011049822A (ja) * | 2009-08-27 | 2011-03-10 | Casio Computer Co Ltd | 表示制御装置及び表示制御プログラム |
CN102006413A (zh) * | 2009-08-27 | 2011-04-06 | 卡西欧计算机株式会社 | 显示控制装置及显示控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018149175A1 (zh) | 视频录制方法、装置和电子设备 | |
JP4683116B2 (ja) | 情報処理装置、情報処理方法、情報処理プログラムおよび撮像装置 | |
JP2006157893A (ja) | 撮像装置 | |
US8391669B2 (en) | Video processing apparatus and video processing method | |
JP2012100216A (ja) | カメラおよび動画撮影プログラム | |
JP4572615B2 (ja) | 情報処理装置および方法、記録媒体、並びにプログラム | |
JP3870123B2 (ja) | 画像処理装置、画像処理方法、プログラム及び記録媒体 | |
US7084908B2 (en) | Image signal recording apparatus with controlled recording of main, preceding and succeeding moving image signals | |
JPH11215458A (ja) | 画像記録装置及び方法、画像再生装置及び方法、画像記録再生装置及び方法、並びに記録媒体 | |
JP2004363719A (ja) | 音声付き映像信号再生装置及び方法並びにプログラム | |
KR101285382B1 (ko) | 동영상 편집 기능을 구비한 동영상 촬영 장치 및 방법 | |
JP2007200390A (ja) | データ出力装置、データ出力方法、データ出力プログラム、および記録媒体 | |
JP5268608B2 (ja) | 撮像再生装置 | |
JP2004215123A (ja) | 画像再生装置、画像再生方法及び画像再生プログラム | |
JP2004312743A (ja) | デジタルデータ複製装置及びその方法 | |
JP3038244B2 (ja) | イメージ情報処理システムの同期装置 | |
JP2008112495A (ja) | 記録再生装置 | |
JP2001238154A (ja) | 動画表示装置 | |
US7742686B2 (en) | Signal processor | |
JP2002237973A (ja) | 記録装置、記録方法及び撮像装置 | |
JP4422538B2 (ja) | 音付映像の再生装置 | |
JPH11168692A (ja) | 画像処理装置およびその制御方法 | |
JP2010141414A5 (ja) | ||
JP2007081466A (ja) | 画像処理装置及び方法 | |
JP2006246039A (ja) | ビデオカメラおよび画像管理方法 |