JP2004158913A - 音声画像処理装置 - Google Patents
音声画像処理装置 Download PDFInfo
- Publication number
- JP2004158913A JP2004158913A JP2002320122A JP2002320122A JP2004158913A JP 2004158913 A JP2004158913 A JP 2004158913A JP 2002320122 A JP2002320122 A JP 2002320122A JP 2002320122 A JP2002320122 A JP 2002320122A JP 2004158913 A JP2004158913 A JP 2004158913A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- data
- image
- watermark
- time information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Systems (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
【課題】音声画像データにおいて、音声と画像をそれぞれ別のツールで編集する場合や、他のフォーマット形式へファイル変換を行なった場合でも、画像及び音声の再生を良好に行なうことができるようにする。
【解決手段】画像データ及び音声データに時間情報を透かしとしてそれぞれ埋め込む時間情報埋め込み手段(画像透かし挿入器6及び音声透かし挿入器11)によって画像データ及び音声データを生成しておき、再生の際には、前記画像データ及び音声データに埋め込まれている時間情報を抽出し、この抽出した時間情報に基づいて、画像データと音声データとの対応をとるようにしたので、画像と音声の同期を図ることができるようになる。
【選択図】 図1
【解決手段】画像データ及び音声データに時間情報を透かしとしてそれぞれ埋め込む時間情報埋め込み手段(画像透かし挿入器6及び音声透かし挿入器11)によって画像データ及び音声データを生成しておき、再生の際には、前記画像データ及び音声データに埋め込まれている時間情報を抽出し、この抽出した時間情報に基づいて、画像データと音声データとの対応をとるようにしたので、画像と音声の同期を図ることができるようになる。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、音声画像処理装置に関し、特に、音声データと動画像データとを別々のツールで編集した際に行う同期処理のために用いて好適なものである。
【0002】
【従来の技術】
動画像データの符号化方式には、フレーム内符号化方式、またはフレーム間予測符号化方式等が知られている。
前記フレーム内符号化方式としては、例えば、Motion JPEG(Joint Photographic Coding Experts Group)や、Digital Video等の符号化方式が挙げられる。
【0003】
一方、前記フレーム間予測符号化としては、例えば、H.261、H.263、MPEG(Moving Picture Coding Experts Group)−1、MPEG−2、及びMPEG−4等の符号化方式が挙げられる。
【0004】
前記2つの符号化方式の規格は、ISO(International Organization for Standardization:国際標準化機構)やITU(International Telecommunication Union:国際電気通信連合)によって国際標準化されている。
【0005】
このようなディジタル符号化規格の普及に伴い、前記符号化方式をコンピュータ上で統一的に扱うためのファイルフォーマットが策定されている。例えば、MPEG−4の規格には、そのファイルフォーマットが定義されている。また、コンピュータのOSやネットワークの構成に依存して定義されたファイルフォーマットが、多数普及している。
【0006】
このような状況の中で、コンテンツ業界においては、著作権保護に関する問題提起を大きくするようになってきた。そして、この問題提起を契機にして、セキュリティに関する情報を暗号化するための電子透かし技術が開発されてきている。
【0007】
この電子透かし技術とは、画像データを再生する時に、前記画像データが変化しないか、または前記画像データの変化を人間が知覚できないレベルで、著作権を保護するために必要なデータを前記画像データに埋め込む技術である。
【0008】
画像データに対して前記電子透かしデータを埋め込むための技術としては、例えば、特許文献1の「動画像エンコードプログラムを記録した記録媒体及び動画像エンコード装置」、または特許文献2の「電子透かし埋め込み装置および抽出装置」などが提案されている。
【0009】
また、オーディオデータに関しては、前記電子透かしデータを埋め込むための技術として、例えば、特許文献3の「音声データに透かし情報を埋め込む方法、透かし情報埋め込み装置、透かし情報検出装置、透かし情報が埋め込まれた記録媒体、及び透かし情報を埋め込む方法を記録した記録媒体」、または特許文献4の「電子透かし埋め込み装置、オーディオ符号化装置および記録媒体」などが提案されている。
【0010】
【特許文献1】
特開平10−243398号公報
【特許文献2】
特開平11−341450号公報
【特許文献3】
特開2001−202089号公報
【特許文献4】
特開平11−316599号公報
【0011】
【発明が解決しようとする課題】
画像データに関するフレーム同期及びフレーム制御については各種各様の方式がある。前述した符号化方式をコンピュータ上で統一的に扱うための従来のファイルフォーマットでは、それぞれのファイルフォーマットごとに、異なるフレーム同期(フレーム制御)方式を採用している。
【0012】
例えば、同じMotion JPEGのファイルである、AVIファイルまたはQuickTimeファイルでも、フレーム同期のためのタイムスタンプを付与する方法はそれぞれ異なっている。
【0013】
このため、前記タイムスタンプの付与方法が同じ画像ファイル同士でファイルフォーマット変換した場合、変換後の画像ファイルにおいて、画像ファイルに記録されている画像と音を同期させることは比較的容易に行なうことができるが、前記タイムスタンプの付与方法が異なる画像ファイル同士でファイルフォーマット変換した場合、変換前と変換後の画像ファイルで対応する時間情報が消失してしまうことから、画像ファイルに記録されている画像と音を同期させることは非常に困難であるという問題があった。
【0014】
そこで、本発明は前記問題点にかんがみ、フォーマットが異なる複数の画像データファイルのあいだで、互いにファイル変換を行っても、画像と音声の同期再生を良好に行なうことができるようにすることを目的とする。
【0015】
【課題を解決するための手段】
本発明の音声画像処理装置は、画像データ及び前記音声データに時間情報を透かしとしてそれぞれ埋め込む時間情報埋め込み手段を有することを特徴としている。
【0016】
すなわち、本発明の音声画像処理装置は、画像データや音声データに時間情報を透かしデータとして埋め込み、埋め込んだ時間情報を基に、画像と音声との同期をするようになされている。
【0017】
【発明の実施の形態】
以下、本発明の音声画像処理装置の実施の形態の一例を、図面を用いて詳細に説明する。
(第1の実施の形態)
図1は、本発明の第1の実施の形態における音声画像処理装置1の構成を示すブロック図である。
【0018】
図1において、1は本実施の形態における音声画像処理装置である。2は被写体を撮像することにより得られる画像信号を、フレーム単位で連続して取得するためのカメラである。8は音声信号をフレーム単位で連続して取得するためのマイクである。
【0019】
3はカメラ2が取得した画像信号をフレーム単位で符号化して画像符号化データを生成するための画像符号化器である。9はマイク8が取得した音声信号をフレーム単位で符号化して音声符号化データを生成するための音声符号化器である。
【0020】
4は前述した画像符号化データと音声符号化データとを同期させるための時間情報を発生する同期情報発生器である。5は同期情報発生器4が発生する時間情報から、画像透かしデータを生成するための画像透かし生成器である。
【0021】
6は画像透かし生成器5で生成した画像透かしデータを、画像符号化器3が生成した画像符号化データに埋め込むための画像透かし挿入器である。7は画像透かし挿入器6が生成した画像符号化データを記録するための画像記録装置である。
【0022】
10は同期情報発生器4が出力する時間情報から、音声透かしデータを生成するための音声透かし生成器である。11は音声透かし生成器10で生成した音声透かしデータを、音声符号化器9が生成した音声符号化データに埋め込むための音声透かし挿入器である。12は音声透かし挿入器11が生成した音声符号化データを記録するための音声記録装置である。なお、画像透かし挿入器6及び音声透かし挿入器11により、時間情報埋め込み手段がそれぞれ構成されているようにしたが、画像透かし挿入器6及び音声透かし挿入器11をまとめた1つの透かし挿入器により、時間情報埋め込み手段が構成されているようにしてもよい。
【0023】
前記のように構成された本実施の形態の音声画像処理装置1が音声画像データを処理する動作を以下に説明する。
先ず、カメラ2で被写体を撮像することによって得られた画像信号は、音声画像処理装置1に設けられている画像符号化器3に、1フレームずつ入力される。
【0024】
画像符号化器3は、カメラ2より入力された画像信号に対して所定のアルゴリズムに基づく符号化処理を施して画像符号化データを生成し、前記生成した画像符号化データを画像透かし挿入器6へ出力する。
【0025】
次に、画像透かし挿入器6は、画像透かし生成器5より入力された画像透かしデータを、前述した画像符号化器3より入力された画像符号化データに埋め込んだデータを生成する。そして、画像記録装置7は、画像透かし挿入器6により生成された画像符号化データ(画像透かしデータが埋め込まれた画像符号化データ)を記録する。
【0026】
なお、画像記録装置7に記録される画像符号化データのファイルフォーマットに、画像データと音声データとを同期させるための時間情報を保存する機能があれば、前述した画像透かしデータを埋め込む処理を省略しても良い。
【0027】
前述した画像信号と同様に、マイク8で収録された音声信号は、音声符号化器9に1フレームずつ入力される。音声符号化器9は、マイク8より入力される音声信号に対して所定のアルゴリズムに基づく符号化処理を施して、音声符号化データを生成し、前記生成した音声符号化データを音声透かし挿入器11へ出力する。
【0028】
音声透かし生成器10は、同期情報発生器4から画像データと音声データとを同期させるための時間情報が入力されると、前記時間情報に基づいて音声用の透かしデータを生成し、これを音声透かし挿入器11へ出力する。
【0029】
音声透かし挿入器11は、音声透かし生成器10より入力された音声透かしデータを、前述した音声符号化器9より入力された音声符号化データに埋め込んだデータを生成する。そして、音声透かし挿入器11で生成された音声符号化データ(音声透かしデータが埋め込まれた音声符号化データ)を音声記録装置12に記録する。
【0030】
なお、一般に、音声データ専用のエディタやファイルフォーマットには、時間情報を保存するための機能、または時間情報を保存するための記録領域を有していないことが多い。このため、前述した音声符号化データに対しては、音声透かしデータを埋め込むような処理をする必要がある。
【0031】
画像用の透かしデータが埋め込まれた符号化データ、及び音声用の透かしデータが埋め込まれた符号化データは、画像記録装置7及び音声記録装置12の所定の記録領域にそれぞれ格納される。
【0032】
本実施の形態の音声画像処理装置1によれば、前記一連のデータ生成動作により、画像記録装置7に記録された画像データと、音声記録装置12に記録された音声データとを、フレーム単位で読み出して前記画像データ及び音声データを合体させて再生する際に、データの合体に必要な同期情報を、透かしデータとして元の画像データ及び音声データに埋め込んでいるため、再生側でのフレーム(同期)操作を容易に行なうことができる。
【0033】
(第2実施例)
図2は、本発明の第2の実施の形態における音声画像処理装置の構成を示すブロック図である。
【0034】
図2において、13は本実施の形態の音声画像処理装置である。7は画像記録装置であり、第1の実施の形態で示した画像符号化データ(画像透かしデータが埋め込まれた画像符号化データ)を記録している。
また、12は音声記録装置であり、第1の実施の形態で示した音声符号化データ(音声透かしデータが埋め込まれた音声符号化データ)を記録している。
【0035】
15は画像記録装置7に記録された画像符号化データから、画像透かしデータを抽出するための画像透かし抽出器である。18は画像符号化データをフレーム単位で復号するための画像復号器である。20は音声記録装置12に記録された音声符号化データから、音声透かしデータを抽出するための音声透かし抽出器である。21は音声符号化データをフレーム単位で復号するための音声復号器である。
【0036】
16は音声符号化データ及び画像符号化データにそれぞれ記録されている時間情報に基づいて、機器の動作を制御するための制御情報を発生して出力する制御情報発生器である。
【0037】
17は制御情報発生器16から出力される制御情報に基づいて、画像記録装置7及び音声記録装置12から所定のデータを抽出するように動作制御するための制御器である。
19は画像復号器18によって復号されて再生された画像データを表示するモニタである。22は音声復号器21によって復号されて再生された音声データを発音するスピーカである。
【0038】
前記のように構成された音声画像処理装置13が音声画像データを処理する動作を以下に説明する。
【0039】
先ず、画像透かし抽出器15は、画像記録装置7に記録された画像符号化データを読み出して、そこに埋め込まれている画像透かしデータを抽出する。同様に、音声画像透かし抽出器20は、音声記録装置12に記録された音声符号化データを読み出して、そこに埋め込まれている音声透かしデータを抽出する。
【0040】
次に、画像透かし抽出器15及び音声画像透かし抽出器20は、抽出した透かしデータを制御情報発生器16にそれぞれ出力する。前記透かしデータが入力された制御情報発生器16は、抽出された画像透かしデータに含まれている時間情報と、音声透かしデータに含まれている時間情報とを比較する。そして、この比較結果に基づいて、次のデータを抽出するのに必要な制御情報を制御器17へ出力する。
【0041】
制御器17は、前記制御情報発生器16から入力される制御情報に基づいて、画像記録装置7及び音声記録装置12にアクセスして、対応するビットストリーム(画像符号化データ及び音声符号化データ)を抽出する。
【0042】
次に、画像透かし抽出器15及び音声透かし抽出器20は、抽出されたビットストリームから、音声透かしデータ及び画像透かしデータをそれぞれ抽出して、同期用の時間情報を再度得ることを繰り返し行なう。
【0043】
前述した制御情報発生器16によって画像符号化データの時間情報と音声符号化データの時間情報とを比較する際に、例えば、画像符号化データの時間情報の方が進んでいる場合には、画像用のビットストリームの抽出を一時的に停止するような情報を生成して、これを制御器17に出力する。このようにして、画像符号化データ及び音声符号化データの読み出しタイミングの同期が図られている。
【0044】
なお、画像記録装置7及び音声記録装置12の記録フォーマットが時間情報を含むフォーマットである場合は、前述した透かしデータの抽出を行わずに、前記時間情報を入手するようにしてもよい。
【0045】
画像復号器18は、画像透かし抽出器15より画像データのみのビットストリームを受けて動画像データに変換し、前記変換した動画像データがモニタ19上に再生表示される。
音声復号器21は、音声透かし抽出器20より入力される音声のみのビットストリームを音声データに変換し、前記変換した音声データがスピーカ22から発音される。
【0046】
(第3実施例) 図3は、本発明の第3の実施の形態における音声画像処理装置の構成を示すブロック図である。なお、前記第1の実施の形態で示した図1と同様の構成要素については同一の番号を付してあり、その詳細な説明を省略している。
【0047】
図3において、23は本実施の形態の音声画像処理装置である。音声画像処理装置23に配設されている24は、画像符号化データと音声符号化データとを多重化するための多重化器である。また、25は多重化器24で1本に多重化されたストリームを保存するための記録装置である。
【0048】
画像透かし挿入器6、及び音声透かし挿入器11によって、透かしデータが画像符号化データ及び音声符号化データにそれぞれ埋め込まれるまでの動作は、第1の実施の形態における音声画像処理装置1の動作と同様に行われる。
【0049】
なお、多重化器24が画像符号化データと音声符号化データとを1本のストリームに多重化する際に、連続した時間情報をビットストリームに入れる場合もある。その場合、画像符号化データまたは音声符号化データに透かしとして入れた時間情報と、ビットストリームに入れた時間情報とが異なっていてもよい。何故ならば、透かしに入れる時間情報は、音声データと画像データとを同期するために用いる情報であって、経過時間を知るための情報とは異なるので、厳密に連続する時間情報である必要はないためである。
【0050】
本実施の形態の音声画像処理装置によれば、前記一連のデータ生成動作により、記録媒体に記録された画像フレーム及び音声フレームを読み出して再生する際に、画像データと音声データとを同期するために必要な符号長に関する情報を、1本に多重化したビットストリームに透かしとして埋め込むため、再生側でのフレーム操作(同期操作)を容易に行なうようにすることができる。
【0051】
なお、本発明の目的は、第1〜第3の実施の形態の音声画像処理装置の各部または全部の機能を実現するソフトウェアのプログラムコードを記憶した記録媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(CPU等)が記録媒体に格納されたプログラムコードを読みだして実行することによっても達成される。
【0052】
この場合、記録媒体から読み出されたプログラムコード自体が第1〜第3の実施の形態の機能を実現することとなり、そのプログラムコードを記録した記録媒体及び前記プログラムコードは本発明を構成することとなる。
プログラムコードを供給するための記録媒体としては、ROM、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード等を用いることができる。
また、コンピュータが読みだしたプログラムコードを実行することにより、第1〜第3の実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS等が実際の処理の一部又は全部を行い、その処理によって第1〜第3の実施の形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された拡張機能ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によって第1〜第3の実施の形態の機能が実現される場合も含まれることは言うまでもない。
図4は、前記コンピュータシステム310の一例を示したものである。
図4において、メモリ301には、音声画像処理装置全体を制御し、各種ソフトウェアを動作させるためのOS、音声画像を符号化する符号化ソフトウェア、及び透かしデータの生成と埋め込みを行なうための透かし埋め込みソフトウェア等が格納されている。
【0053】
また、符号化データ生成の際に画像データを格納する画像エリア、生成された符号や透かしが埋め込まれた符号化データを格納する符号エリア、及び各種演算のパラメータ等を格納するワーキングエリアが存在する。
【0054】
このような構成において、端末303から指示されたマイク305、及びカメラ306を介して、画像(動画像)信号及び音声信号が入力される。そして、符号化された画像データ及び音声データは、記録部(記録媒体等)304に格納される。また、前記画像データ及び音声データの再生時には、記録部304に格納された画像データ及び音声データが読み出されて復号化される。この復号化された画像データはモニタ307に出力され、復号化された音声データはスピーカ308に出力される。
【0055】
本発明の実施態様の例を以下に列挙する。
〔実施態様1〕画像データ及び前記音声データに時間情報を透かしとしてそれぞれ埋め込む時間情報埋め込み手段を有することを特徴とする音声画像処理装置。
【0056】
〔実施態様2〕画像データを入力する画像入力手段と、音声データを入力する音声入力手段と、前記画像入力手段により入力された画像データのフレーム、及び前記音声入力手段により入力された音声データに、それぞれ、時間情報を透かしとして埋め込む時間情報埋め込み手段とを有することを特徴とする音声画像処理装置。
【0057】
〔実施態様3〕前記時間情報が透かしとして埋め込まれた画像データと音声データとを多重化するための多重化手段を有し、前記多重化手段は、前記画像データ及び前記音声データのそれぞれに埋め込まれた時間情報を基にして前記画像データ及び前記音声データを一本のビットストリームとして生成することを特徴とする実施態様2に記載の音声画像処理装置。
【0058】
〔実施態様4〕時間情報が透かしデータとして埋め込まれた画像データ及び音声データを再生するための音声画像処理装置であって、前記画像データを記録した第1の記録媒体、及び前記音声データを記録した第2の記録媒体にアクセスして、前記画像データの時間情報及び前記音声データの時間情報を対応させて、前記画像データ及び前記音声データを選択して一連のビットストリームを生成するようにことを特徴とする音声画像処理装置。
【0059】
〔実施態様5〕時間情報が透かしデータとして埋め込まれた画像データを入力する画像データ入力手段と、時間情報が透かしデータとして埋め込まれた音声データを入力する音声データ入力手段と、前記画像データ入力手段により入力された画像データから第1の時間情報を抽出する画像透かし抽出手段と、前記音声データ入力手段により入力された音声データから第2の時間情報を抽出する音声透かし抽出手段とを有することを特徴とする音声画像処理装置。
【0060】
〔実施態様6〕前記画像透かし抽出手段により抽出された第1の時間情報と、前記音声透かし抽出手段により抽出された第2の時間情報とを比較する時間情報比較手段と、前記時間情報比較手段による比較結果に基づいて、記録媒体から画像データ及び音声データを読み出す際の制御情報を生成する制御情報発生手段と、前記制御情報発生手段により生成された制御情報に基づいて、前記記録媒体から画像データ及び音声データを読み出して、前記画像データ及び前記音声データよりなる一連のビットストリームを生成するビットストリーム生成手段とを有することを特徴とする実施態様5に記載の音声画像処理装置。
【0061】
〔実施態様7〕画像データ及び前記音声データに時間情報を透かしとしてそれぞれ埋め込む時間情報埋め込み手順を有することを特徴とする音声画像処理方法。
【0062】
〔実施態様8〕画像データを入力する画像入力手順と、音声データを入力する音声入力手順と、前記画像入力手順により入力された画像データのフレーム、及び前記音声入力手順により入力された音声データに、時間情報を透かしとしてそれぞれ埋め込む時間情報埋め込み手順とを有することを特徴とする音声画像処理方法。
【0063】
〔実施態様9〕時間情報が透かしデータとして埋め込まれた画像データ及び音声データを再生するための音声画像処理方法であって、前記画像データを記録した第1の記録媒体、及び前記音声データを記録した第2の記録媒体にアクセスして、前記画像データの時間情報及び前記音声データの時間情報を対応させて、前記画像データ及び前記音声データを選択して一連のビットストリームを生成するようにすることを特徴とする音声画像処理方法。
【0064】
〔実施態様10〕時間情報が透かしデータとして埋め込まれた画像データを入力する画像データ入力手順と、時間情報が透かしデータとして埋め込まれた音声データを入力する音声データ入力手順と、前記画像データ入力手順により入力された画像データから第1の時間情報を抽出する画像透かし抽出手順と、前記音声データ入力手順により入力された音声データから第2の時間情報を抽出する音声透かし抽出手順とを有することを特徴とする音声画像処理方法。
【0065】
〔実施態様11〕コンピュータに画像データ及び前記音声データに時間情報を透かしとしてそれぞれ埋め込む時間情報埋め込み手順を実行させるためのコンピュータプログラム。
【0066】
〔実施態様12〕コンピュータに、画像データを入力する画像入力手順と、音声データを入力する音声入力手順と、前記画像入力手順により入力された画像データのフレーム、及び前記音声入力手順により入力された音声データに、時間情報を透かしとしてそれぞれ埋め込む時間情報埋め込み手順とを実行させるためのコンピュータプログラム。
【0067】
〔実施態様13〕時間情報が透かしデータとして埋め込まれた画像データ及び音声データを再生するための音声画像処理方法を実行させるためのコンピュータプログラムであって、前記画像データを記録した第1の記録媒体、及び前記音声データを記録した第2の記録媒体にアクセスして、前記画像データの時間情報及び前記音声データの時間情報を対応させて、前記画像データ及び前記音声データを選択して一連のビットストリームを生成するようにすることを特徴とするプログラム。
【0068】
〔実施態様14〕時間情報が透かしデータとして埋め込まれた画像データを入力する画像データ入力手順と、時間情報が透かしデータとして埋め込まれた音声データを入力する音声データ入力手順と、前記画像データ入力手順により入力された画像データから第1の時間情報を抽出する画像透かし抽出手順と、前記音声データ入力手順により入力された音声データから第2の時間情報を抽出する音声透かし抽出手順とを実行させるためのコンピュータプログラム。
【0069】
〔実施態様15〕上記実施態様11〜14の何れか1項に記載のコンピュータプログラムを記憶したことを特徴とするコンピュータ読み取り可能な記憶媒体。
【0070】
【発明の効果】
以上説明したように、本発明によれば、画像データ及び音声データに時間情報を透かしとしてそれぞれ埋め込むようにしたので、ファイルフォーマット形式に依存することなく画像データ及び音声データを再生することが可能となり、画像と音声との同期を容易かつ迅速に行なうようにすることができる。
【0071】
また、音声と画像をそれぞれ別のツールで編集したり、異なるファイルフォーマット間でデータ変換を複数回行なったりする場合でも、時間情報が消失することを防止して、画像と音声の同期が適切になされた再生処理を行なうようにすることができる。また、音声データと画像データを、異なるファイルフォーマット形式によってそれぞれ記録した場合でも、それぞれの時間情報に基づいて同期のとれた再生を行なうようにすることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の音声画像処理装置の構成を示すブロック図である。
【図2】本発明の第2の実施の形態の音声画像処理装置の構成を示すブロック図である。
【図3】本発明の第3の実施の形態の音声画像処理装置の構成を示すブロック図である。
【図4】音声画像処理装置の機能をコンピュータに実現させるためのプログラムをコンピュータ読み取り可能な記録媒体から読み出して実行する場合のシステム構成を示すブロック図である。
【符号の説明】
1 音声画像処理装置
2 カメラ
3 画像符号化器
4 同期情報発生器
5 画像透かし生成器
6 画像透かし挿入器
7 画像記録装置
8 マイク
9 音声符号化器
10 音声透かし生成器
11 音声透かし挿入器
12 音声記録装置
【発明の属する技術分野】
本発明は、音声画像処理装置に関し、特に、音声データと動画像データとを別々のツールで編集した際に行う同期処理のために用いて好適なものである。
【0002】
【従来の技術】
動画像データの符号化方式には、フレーム内符号化方式、またはフレーム間予測符号化方式等が知られている。
前記フレーム内符号化方式としては、例えば、Motion JPEG(Joint Photographic Coding Experts Group)や、Digital Video等の符号化方式が挙げられる。
【0003】
一方、前記フレーム間予測符号化としては、例えば、H.261、H.263、MPEG(Moving Picture Coding Experts Group)−1、MPEG−2、及びMPEG−4等の符号化方式が挙げられる。
【0004】
前記2つの符号化方式の規格は、ISO(International Organization for Standardization:国際標準化機構)やITU(International Telecommunication Union:国際電気通信連合)によって国際標準化されている。
【0005】
このようなディジタル符号化規格の普及に伴い、前記符号化方式をコンピュータ上で統一的に扱うためのファイルフォーマットが策定されている。例えば、MPEG−4の規格には、そのファイルフォーマットが定義されている。また、コンピュータのOSやネットワークの構成に依存して定義されたファイルフォーマットが、多数普及している。
【0006】
このような状況の中で、コンテンツ業界においては、著作権保護に関する問題提起を大きくするようになってきた。そして、この問題提起を契機にして、セキュリティに関する情報を暗号化するための電子透かし技術が開発されてきている。
【0007】
この電子透かし技術とは、画像データを再生する時に、前記画像データが変化しないか、または前記画像データの変化を人間が知覚できないレベルで、著作権を保護するために必要なデータを前記画像データに埋め込む技術である。
【0008】
画像データに対して前記電子透かしデータを埋め込むための技術としては、例えば、特許文献1の「動画像エンコードプログラムを記録した記録媒体及び動画像エンコード装置」、または特許文献2の「電子透かし埋め込み装置および抽出装置」などが提案されている。
【0009】
また、オーディオデータに関しては、前記電子透かしデータを埋め込むための技術として、例えば、特許文献3の「音声データに透かし情報を埋め込む方法、透かし情報埋め込み装置、透かし情報検出装置、透かし情報が埋め込まれた記録媒体、及び透かし情報を埋め込む方法を記録した記録媒体」、または特許文献4の「電子透かし埋め込み装置、オーディオ符号化装置および記録媒体」などが提案されている。
【0010】
【特許文献1】
特開平10−243398号公報
【特許文献2】
特開平11−341450号公報
【特許文献3】
特開2001−202089号公報
【特許文献4】
特開平11−316599号公報
【0011】
【発明が解決しようとする課題】
画像データに関するフレーム同期及びフレーム制御については各種各様の方式がある。前述した符号化方式をコンピュータ上で統一的に扱うための従来のファイルフォーマットでは、それぞれのファイルフォーマットごとに、異なるフレーム同期(フレーム制御)方式を採用している。
【0012】
例えば、同じMotion JPEGのファイルである、AVIファイルまたはQuickTimeファイルでも、フレーム同期のためのタイムスタンプを付与する方法はそれぞれ異なっている。
【0013】
このため、前記タイムスタンプの付与方法が同じ画像ファイル同士でファイルフォーマット変換した場合、変換後の画像ファイルにおいて、画像ファイルに記録されている画像と音を同期させることは比較的容易に行なうことができるが、前記タイムスタンプの付与方法が異なる画像ファイル同士でファイルフォーマット変換した場合、変換前と変換後の画像ファイルで対応する時間情報が消失してしまうことから、画像ファイルに記録されている画像と音を同期させることは非常に困難であるという問題があった。
【0014】
そこで、本発明は前記問題点にかんがみ、フォーマットが異なる複数の画像データファイルのあいだで、互いにファイル変換を行っても、画像と音声の同期再生を良好に行なうことができるようにすることを目的とする。
【0015】
【課題を解決するための手段】
本発明の音声画像処理装置は、画像データ及び前記音声データに時間情報を透かしとしてそれぞれ埋め込む時間情報埋め込み手段を有することを特徴としている。
【0016】
すなわち、本発明の音声画像処理装置は、画像データや音声データに時間情報を透かしデータとして埋め込み、埋め込んだ時間情報を基に、画像と音声との同期をするようになされている。
【0017】
【発明の実施の形態】
以下、本発明の音声画像処理装置の実施の形態の一例を、図面を用いて詳細に説明する。
(第1の実施の形態)
図1は、本発明の第1の実施の形態における音声画像処理装置1の構成を示すブロック図である。
【0018】
図1において、1は本実施の形態における音声画像処理装置である。2は被写体を撮像することにより得られる画像信号を、フレーム単位で連続して取得するためのカメラである。8は音声信号をフレーム単位で連続して取得するためのマイクである。
【0019】
3はカメラ2が取得した画像信号をフレーム単位で符号化して画像符号化データを生成するための画像符号化器である。9はマイク8が取得した音声信号をフレーム単位で符号化して音声符号化データを生成するための音声符号化器である。
【0020】
4は前述した画像符号化データと音声符号化データとを同期させるための時間情報を発生する同期情報発生器である。5は同期情報発生器4が発生する時間情報から、画像透かしデータを生成するための画像透かし生成器である。
【0021】
6は画像透かし生成器5で生成した画像透かしデータを、画像符号化器3が生成した画像符号化データに埋め込むための画像透かし挿入器である。7は画像透かし挿入器6が生成した画像符号化データを記録するための画像記録装置である。
【0022】
10は同期情報発生器4が出力する時間情報から、音声透かしデータを生成するための音声透かし生成器である。11は音声透かし生成器10で生成した音声透かしデータを、音声符号化器9が生成した音声符号化データに埋め込むための音声透かし挿入器である。12は音声透かし挿入器11が生成した音声符号化データを記録するための音声記録装置である。なお、画像透かし挿入器6及び音声透かし挿入器11により、時間情報埋め込み手段がそれぞれ構成されているようにしたが、画像透かし挿入器6及び音声透かし挿入器11をまとめた1つの透かし挿入器により、時間情報埋め込み手段が構成されているようにしてもよい。
【0023】
前記のように構成された本実施の形態の音声画像処理装置1が音声画像データを処理する動作を以下に説明する。
先ず、カメラ2で被写体を撮像することによって得られた画像信号は、音声画像処理装置1に設けられている画像符号化器3に、1フレームずつ入力される。
【0024】
画像符号化器3は、カメラ2より入力された画像信号に対して所定のアルゴリズムに基づく符号化処理を施して画像符号化データを生成し、前記生成した画像符号化データを画像透かし挿入器6へ出力する。
【0025】
次に、画像透かし挿入器6は、画像透かし生成器5より入力された画像透かしデータを、前述した画像符号化器3より入力された画像符号化データに埋め込んだデータを生成する。そして、画像記録装置7は、画像透かし挿入器6により生成された画像符号化データ(画像透かしデータが埋め込まれた画像符号化データ)を記録する。
【0026】
なお、画像記録装置7に記録される画像符号化データのファイルフォーマットに、画像データと音声データとを同期させるための時間情報を保存する機能があれば、前述した画像透かしデータを埋め込む処理を省略しても良い。
【0027】
前述した画像信号と同様に、マイク8で収録された音声信号は、音声符号化器9に1フレームずつ入力される。音声符号化器9は、マイク8より入力される音声信号に対して所定のアルゴリズムに基づく符号化処理を施して、音声符号化データを生成し、前記生成した音声符号化データを音声透かし挿入器11へ出力する。
【0028】
音声透かし生成器10は、同期情報発生器4から画像データと音声データとを同期させるための時間情報が入力されると、前記時間情報に基づいて音声用の透かしデータを生成し、これを音声透かし挿入器11へ出力する。
【0029】
音声透かし挿入器11は、音声透かし生成器10より入力された音声透かしデータを、前述した音声符号化器9より入力された音声符号化データに埋め込んだデータを生成する。そして、音声透かし挿入器11で生成された音声符号化データ(音声透かしデータが埋め込まれた音声符号化データ)を音声記録装置12に記録する。
【0030】
なお、一般に、音声データ専用のエディタやファイルフォーマットには、時間情報を保存するための機能、または時間情報を保存するための記録領域を有していないことが多い。このため、前述した音声符号化データに対しては、音声透かしデータを埋め込むような処理をする必要がある。
【0031】
画像用の透かしデータが埋め込まれた符号化データ、及び音声用の透かしデータが埋め込まれた符号化データは、画像記録装置7及び音声記録装置12の所定の記録領域にそれぞれ格納される。
【0032】
本実施の形態の音声画像処理装置1によれば、前記一連のデータ生成動作により、画像記録装置7に記録された画像データと、音声記録装置12に記録された音声データとを、フレーム単位で読み出して前記画像データ及び音声データを合体させて再生する際に、データの合体に必要な同期情報を、透かしデータとして元の画像データ及び音声データに埋め込んでいるため、再生側でのフレーム(同期)操作を容易に行なうことができる。
【0033】
(第2実施例)
図2は、本発明の第2の実施の形態における音声画像処理装置の構成を示すブロック図である。
【0034】
図2において、13は本実施の形態の音声画像処理装置である。7は画像記録装置であり、第1の実施の形態で示した画像符号化データ(画像透かしデータが埋め込まれた画像符号化データ)を記録している。
また、12は音声記録装置であり、第1の実施の形態で示した音声符号化データ(音声透かしデータが埋め込まれた音声符号化データ)を記録している。
【0035】
15は画像記録装置7に記録された画像符号化データから、画像透かしデータを抽出するための画像透かし抽出器である。18は画像符号化データをフレーム単位で復号するための画像復号器である。20は音声記録装置12に記録された音声符号化データから、音声透かしデータを抽出するための音声透かし抽出器である。21は音声符号化データをフレーム単位で復号するための音声復号器である。
【0036】
16は音声符号化データ及び画像符号化データにそれぞれ記録されている時間情報に基づいて、機器の動作を制御するための制御情報を発生して出力する制御情報発生器である。
【0037】
17は制御情報発生器16から出力される制御情報に基づいて、画像記録装置7及び音声記録装置12から所定のデータを抽出するように動作制御するための制御器である。
19は画像復号器18によって復号されて再生された画像データを表示するモニタである。22は音声復号器21によって復号されて再生された音声データを発音するスピーカである。
【0038】
前記のように構成された音声画像処理装置13が音声画像データを処理する動作を以下に説明する。
【0039】
先ず、画像透かし抽出器15は、画像記録装置7に記録された画像符号化データを読み出して、そこに埋め込まれている画像透かしデータを抽出する。同様に、音声画像透かし抽出器20は、音声記録装置12に記録された音声符号化データを読み出して、そこに埋め込まれている音声透かしデータを抽出する。
【0040】
次に、画像透かし抽出器15及び音声画像透かし抽出器20は、抽出した透かしデータを制御情報発生器16にそれぞれ出力する。前記透かしデータが入力された制御情報発生器16は、抽出された画像透かしデータに含まれている時間情報と、音声透かしデータに含まれている時間情報とを比較する。そして、この比較結果に基づいて、次のデータを抽出するのに必要な制御情報を制御器17へ出力する。
【0041】
制御器17は、前記制御情報発生器16から入力される制御情報に基づいて、画像記録装置7及び音声記録装置12にアクセスして、対応するビットストリーム(画像符号化データ及び音声符号化データ)を抽出する。
【0042】
次に、画像透かし抽出器15及び音声透かし抽出器20は、抽出されたビットストリームから、音声透かしデータ及び画像透かしデータをそれぞれ抽出して、同期用の時間情報を再度得ることを繰り返し行なう。
【0043】
前述した制御情報発生器16によって画像符号化データの時間情報と音声符号化データの時間情報とを比較する際に、例えば、画像符号化データの時間情報の方が進んでいる場合には、画像用のビットストリームの抽出を一時的に停止するような情報を生成して、これを制御器17に出力する。このようにして、画像符号化データ及び音声符号化データの読み出しタイミングの同期が図られている。
【0044】
なお、画像記録装置7及び音声記録装置12の記録フォーマットが時間情報を含むフォーマットである場合は、前述した透かしデータの抽出を行わずに、前記時間情報を入手するようにしてもよい。
【0045】
画像復号器18は、画像透かし抽出器15より画像データのみのビットストリームを受けて動画像データに変換し、前記変換した動画像データがモニタ19上に再生表示される。
音声復号器21は、音声透かし抽出器20より入力される音声のみのビットストリームを音声データに変換し、前記変換した音声データがスピーカ22から発音される。
【0046】
(第3実施例) 図3は、本発明の第3の実施の形態における音声画像処理装置の構成を示すブロック図である。なお、前記第1の実施の形態で示した図1と同様の構成要素については同一の番号を付してあり、その詳細な説明を省略している。
【0047】
図3において、23は本実施の形態の音声画像処理装置である。音声画像処理装置23に配設されている24は、画像符号化データと音声符号化データとを多重化するための多重化器である。また、25は多重化器24で1本に多重化されたストリームを保存するための記録装置である。
【0048】
画像透かし挿入器6、及び音声透かし挿入器11によって、透かしデータが画像符号化データ及び音声符号化データにそれぞれ埋め込まれるまでの動作は、第1の実施の形態における音声画像処理装置1の動作と同様に行われる。
【0049】
なお、多重化器24が画像符号化データと音声符号化データとを1本のストリームに多重化する際に、連続した時間情報をビットストリームに入れる場合もある。その場合、画像符号化データまたは音声符号化データに透かしとして入れた時間情報と、ビットストリームに入れた時間情報とが異なっていてもよい。何故ならば、透かしに入れる時間情報は、音声データと画像データとを同期するために用いる情報であって、経過時間を知るための情報とは異なるので、厳密に連続する時間情報である必要はないためである。
【0050】
本実施の形態の音声画像処理装置によれば、前記一連のデータ生成動作により、記録媒体に記録された画像フレーム及び音声フレームを読み出して再生する際に、画像データと音声データとを同期するために必要な符号長に関する情報を、1本に多重化したビットストリームに透かしとして埋め込むため、再生側でのフレーム操作(同期操作)を容易に行なうようにすることができる。
【0051】
なお、本発明の目的は、第1〜第3の実施の形態の音声画像処理装置の各部または全部の機能を実現するソフトウェアのプログラムコードを記憶した記録媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(CPU等)が記録媒体に格納されたプログラムコードを読みだして実行することによっても達成される。
【0052】
この場合、記録媒体から読み出されたプログラムコード自体が第1〜第3の実施の形態の機能を実現することとなり、そのプログラムコードを記録した記録媒体及び前記プログラムコードは本発明を構成することとなる。
プログラムコードを供給するための記録媒体としては、ROM、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード等を用いることができる。
また、コンピュータが読みだしたプログラムコードを実行することにより、第1〜第3の実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS等が実際の処理の一部又は全部を行い、その処理によって第1〜第3の実施の形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された拡張機能ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によって第1〜第3の実施の形態の機能が実現される場合も含まれることは言うまでもない。
図4は、前記コンピュータシステム310の一例を示したものである。
図4において、メモリ301には、音声画像処理装置全体を制御し、各種ソフトウェアを動作させるためのOS、音声画像を符号化する符号化ソフトウェア、及び透かしデータの生成と埋め込みを行なうための透かし埋め込みソフトウェア等が格納されている。
【0053】
また、符号化データ生成の際に画像データを格納する画像エリア、生成された符号や透かしが埋め込まれた符号化データを格納する符号エリア、及び各種演算のパラメータ等を格納するワーキングエリアが存在する。
【0054】
このような構成において、端末303から指示されたマイク305、及びカメラ306を介して、画像(動画像)信号及び音声信号が入力される。そして、符号化された画像データ及び音声データは、記録部(記録媒体等)304に格納される。また、前記画像データ及び音声データの再生時には、記録部304に格納された画像データ及び音声データが読み出されて復号化される。この復号化された画像データはモニタ307に出力され、復号化された音声データはスピーカ308に出力される。
【0055】
本発明の実施態様の例を以下に列挙する。
〔実施態様1〕画像データ及び前記音声データに時間情報を透かしとしてそれぞれ埋め込む時間情報埋め込み手段を有することを特徴とする音声画像処理装置。
【0056】
〔実施態様2〕画像データを入力する画像入力手段と、音声データを入力する音声入力手段と、前記画像入力手段により入力された画像データのフレーム、及び前記音声入力手段により入力された音声データに、それぞれ、時間情報を透かしとして埋め込む時間情報埋め込み手段とを有することを特徴とする音声画像処理装置。
【0057】
〔実施態様3〕前記時間情報が透かしとして埋め込まれた画像データと音声データとを多重化するための多重化手段を有し、前記多重化手段は、前記画像データ及び前記音声データのそれぞれに埋め込まれた時間情報を基にして前記画像データ及び前記音声データを一本のビットストリームとして生成することを特徴とする実施態様2に記載の音声画像処理装置。
【0058】
〔実施態様4〕時間情報が透かしデータとして埋め込まれた画像データ及び音声データを再生するための音声画像処理装置であって、前記画像データを記録した第1の記録媒体、及び前記音声データを記録した第2の記録媒体にアクセスして、前記画像データの時間情報及び前記音声データの時間情報を対応させて、前記画像データ及び前記音声データを選択して一連のビットストリームを生成するようにことを特徴とする音声画像処理装置。
【0059】
〔実施態様5〕時間情報が透かしデータとして埋め込まれた画像データを入力する画像データ入力手段と、時間情報が透かしデータとして埋め込まれた音声データを入力する音声データ入力手段と、前記画像データ入力手段により入力された画像データから第1の時間情報を抽出する画像透かし抽出手段と、前記音声データ入力手段により入力された音声データから第2の時間情報を抽出する音声透かし抽出手段とを有することを特徴とする音声画像処理装置。
【0060】
〔実施態様6〕前記画像透かし抽出手段により抽出された第1の時間情報と、前記音声透かし抽出手段により抽出された第2の時間情報とを比較する時間情報比較手段と、前記時間情報比較手段による比較結果に基づいて、記録媒体から画像データ及び音声データを読み出す際の制御情報を生成する制御情報発生手段と、前記制御情報発生手段により生成された制御情報に基づいて、前記記録媒体から画像データ及び音声データを読み出して、前記画像データ及び前記音声データよりなる一連のビットストリームを生成するビットストリーム生成手段とを有することを特徴とする実施態様5に記載の音声画像処理装置。
【0061】
〔実施態様7〕画像データ及び前記音声データに時間情報を透かしとしてそれぞれ埋め込む時間情報埋め込み手順を有することを特徴とする音声画像処理方法。
【0062】
〔実施態様8〕画像データを入力する画像入力手順と、音声データを入力する音声入力手順と、前記画像入力手順により入力された画像データのフレーム、及び前記音声入力手順により入力された音声データに、時間情報を透かしとしてそれぞれ埋め込む時間情報埋め込み手順とを有することを特徴とする音声画像処理方法。
【0063】
〔実施態様9〕時間情報が透かしデータとして埋め込まれた画像データ及び音声データを再生するための音声画像処理方法であって、前記画像データを記録した第1の記録媒体、及び前記音声データを記録した第2の記録媒体にアクセスして、前記画像データの時間情報及び前記音声データの時間情報を対応させて、前記画像データ及び前記音声データを選択して一連のビットストリームを生成するようにすることを特徴とする音声画像処理方法。
【0064】
〔実施態様10〕時間情報が透かしデータとして埋め込まれた画像データを入力する画像データ入力手順と、時間情報が透かしデータとして埋め込まれた音声データを入力する音声データ入力手順と、前記画像データ入力手順により入力された画像データから第1の時間情報を抽出する画像透かし抽出手順と、前記音声データ入力手順により入力された音声データから第2の時間情報を抽出する音声透かし抽出手順とを有することを特徴とする音声画像処理方法。
【0065】
〔実施態様11〕コンピュータに画像データ及び前記音声データに時間情報を透かしとしてそれぞれ埋め込む時間情報埋め込み手順を実行させるためのコンピュータプログラム。
【0066】
〔実施態様12〕コンピュータに、画像データを入力する画像入力手順と、音声データを入力する音声入力手順と、前記画像入力手順により入力された画像データのフレーム、及び前記音声入力手順により入力された音声データに、時間情報を透かしとしてそれぞれ埋め込む時間情報埋め込み手順とを実行させるためのコンピュータプログラム。
【0067】
〔実施態様13〕時間情報が透かしデータとして埋め込まれた画像データ及び音声データを再生するための音声画像処理方法を実行させるためのコンピュータプログラムであって、前記画像データを記録した第1の記録媒体、及び前記音声データを記録した第2の記録媒体にアクセスして、前記画像データの時間情報及び前記音声データの時間情報を対応させて、前記画像データ及び前記音声データを選択して一連のビットストリームを生成するようにすることを特徴とするプログラム。
【0068】
〔実施態様14〕時間情報が透かしデータとして埋め込まれた画像データを入力する画像データ入力手順と、時間情報が透かしデータとして埋め込まれた音声データを入力する音声データ入力手順と、前記画像データ入力手順により入力された画像データから第1の時間情報を抽出する画像透かし抽出手順と、前記音声データ入力手順により入力された音声データから第2の時間情報を抽出する音声透かし抽出手順とを実行させるためのコンピュータプログラム。
【0069】
〔実施態様15〕上記実施態様11〜14の何れか1項に記載のコンピュータプログラムを記憶したことを特徴とするコンピュータ読み取り可能な記憶媒体。
【0070】
【発明の効果】
以上説明したように、本発明によれば、画像データ及び音声データに時間情報を透かしとしてそれぞれ埋め込むようにしたので、ファイルフォーマット形式に依存することなく画像データ及び音声データを再生することが可能となり、画像と音声との同期を容易かつ迅速に行なうようにすることができる。
【0071】
また、音声と画像をそれぞれ別のツールで編集したり、異なるファイルフォーマット間でデータ変換を複数回行なったりする場合でも、時間情報が消失することを防止して、画像と音声の同期が適切になされた再生処理を行なうようにすることができる。また、音声データと画像データを、異なるファイルフォーマット形式によってそれぞれ記録した場合でも、それぞれの時間情報に基づいて同期のとれた再生を行なうようにすることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の音声画像処理装置の構成を示すブロック図である。
【図2】本発明の第2の実施の形態の音声画像処理装置の構成を示すブロック図である。
【図3】本発明の第3の実施の形態の音声画像処理装置の構成を示すブロック図である。
【図4】音声画像処理装置の機能をコンピュータに実現させるためのプログラムをコンピュータ読み取り可能な記録媒体から読み出して実行する場合のシステム構成を示すブロック図である。
【符号の説明】
1 音声画像処理装置
2 カメラ
3 画像符号化器
4 同期情報発生器
5 画像透かし生成器
6 画像透かし挿入器
7 画像記録装置
8 マイク
9 音声符号化器
10 音声透かし生成器
11 音声透かし挿入器
12 音声記録装置
Claims (1)
- 画像データ及び前記音声データに時間情報を透かしとしてそれぞれ埋め込む時間情報埋め込み手段を有することを特徴とする音声画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002320122A JP2004158913A (ja) | 2002-11-01 | 2002-11-01 | 音声画像処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002320122A JP2004158913A (ja) | 2002-11-01 | 2002-11-01 | 音声画像処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004158913A true JP2004158913A (ja) | 2004-06-03 |
Family
ID=32801138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002320122A Pending JP2004158913A (ja) | 2002-11-01 | 2002-11-01 | 音声画像処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004158913A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007180999A (ja) * | 2005-12-28 | 2007-07-12 | Nomura Research Institute Ltd | 情報同期システム、情報送信装置、情報受信装置、情報同期プログラム、情報送信プログラム、及び情報受信プログラム |
JP2007215011A (ja) * | 2006-02-10 | 2007-08-23 | Hitachi Ltd | 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、およびコンテンツのデータ構造 |
WO2007116205A1 (en) * | 2006-04-10 | 2007-10-18 | Tektronix International Sales Gmbh | Method and apparatus for measuring audio/video sync delay |
JP2009515371A (ja) * | 2005-07-22 | 2009-04-09 | ネクスタンプ ソシエテ アノニム | タイムスタンプ付き透かしの方法、タイムスタンプ復号の方法およびデバイス、対応するコンピュータの使用およびプログラム製品 |
JP2011145541A (ja) * | 2010-01-15 | 2011-07-28 | Yamaha Corp | 再生装置、楽音信号出力装置、再生システム及びプログラム |
WO2011134373A1 (zh) * | 2010-04-29 | 2011-11-03 | 华为终端有限公司 | 多路视频同步传输方法、装置及*** |
JP2012114779A (ja) * | 2010-11-26 | 2012-06-14 | Foster Electric Co Ltd | 映像・音声同期方法、映像・音声同期システムおよび映像同期音声調整装置 |
WO2013042098A1 (en) * | 2011-09-23 | 2013-03-28 | Tomorrow Options - Microelectronics, S.A. | Synchronization of video and real-time data collection streams |
JP2015163975A (ja) * | 2011-02-07 | 2015-09-10 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 透かし入り信号を符号化し検出するための機器 |
-
2002
- 2002-11-01 JP JP2002320122A patent/JP2004158913A/ja active Pending
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009515371A (ja) * | 2005-07-22 | 2009-04-09 | ネクスタンプ ソシエテ アノニム | タイムスタンプ付き透かしの方法、タイムスタンプ復号の方法およびデバイス、対応するコンピュータの使用およびプログラム製品 |
JP2007180999A (ja) * | 2005-12-28 | 2007-07-12 | Nomura Research Institute Ltd | 情報同期システム、情報送信装置、情報受信装置、情報同期プログラム、情報送信プログラム、及び情報受信プログラム |
JP2007215011A (ja) * | 2006-02-10 | 2007-08-23 | Hitachi Ltd | 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、およびコンテンツのデータ構造 |
JP4728136B2 (ja) * | 2006-02-10 | 2011-07-20 | 株式会社日立製作所 | コンテンツ配信システムおよびコンテンツ配信方法 |
WO2007116205A1 (en) * | 2006-04-10 | 2007-10-18 | Tektronix International Sales Gmbh | Method and apparatus for measuring audio/video sync delay |
US8796527B2 (en) | 2010-01-15 | 2014-08-05 | Yamaha Corporation | Tone reproduction apparatus and method |
JP2011145541A (ja) * | 2010-01-15 | 2011-07-28 | Yamaha Corp | 再生装置、楽音信号出力装置、再生システム及びプログラム |
WO2011134373A1 (zh) * | 2010-04-29 | 2011-11-03 | 华为终端有限公司 | 多路视频同步传输方法、装置及*** |
CN102238421A (zh) * | 2010-04-29 | 2011-11-09 | 华为终端有限公司 | 多路视频同步传输方法、装置及*** |
JP2012114779A (ja) * | 2010-11-26 | 2012-06-14 | Foster Electric Co Ltd | 映像・音声同期方法、映像・音声同期システムおよび映像同期音声調整装置 |
JP2015163975A (ja) * | 2011-02-07 | 2015-09-10 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 透かし入り信号を符号化し検出するための機器 |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
WO2013042098A1 (en) * | 2011-09-23 | 2013-03-28 | Tomorrow Options - Microelectronics, S.A. | Synchronization of video and real-time data collection streams |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6674874B1 (en) | Data processing apparatus and method and storage medium | |
US6546189B1 (en) | Method and apparatus for editing compressed moving pictures and storage medium | |
US6339760B1 (en) | Method and system for synchronization of decoded audio and video by adding dummy data to compressed audio data | |
JP3976932B2 (ja) | データ処理方法及び装置並びに記憶媒体 | |
JP4109772B2 (ja) | データ処理方法及びその装置 | |
JP2010022003A (ja) | 動画ファイル再生装置、動画ファイル再生方法、プログラム | |
JPH10243342A (ja) | ビデオ・ファイルの編集方法および装置、ビデオ・ファイルからセグメントを切り取る方法、ビデオ・ファイルからセグメントをコピーする方法および装置、ビデオ・ファイル・セグメントを貼り付けるための方法および装置、コンピュータ読み取り可能な媒体 | |
JP2004158913A (ja) | 音声画像処理装置 | |
JP2009260933A (ja) | 動画素材編集装置とそのプログラム及び動画素材編集方法 | |
JP4552802B2 (ja) | 記録装置、記録方法、記録方法のプログラム及び記録方法のプログラムを記録した記録媒体 | |
JP4262139B2 (ja) | 信号処理装置 | |
JP2012015989A (ja) | 画像処理装置 | |
JP2002077803A (ja) | 映像情報記録装置及び撮像装置 | |
EP1422945A1 (en) | Image data recording with after-recording on the recording medium | |
JP2004080094A (ja) | 情報処理装置及び情報処理方法並びにプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP2004297229A (ja) | 画像処理装置及びその方法並びにそれを用いた画像処理システム及びプログラム | |
JP2005198350A (ja) | アフレコ信号再生方法 | |
JP2004312743A (ja) | デジタルデータ複製装置及びその方法 | |
JP2006180315A (ja) | 動画撮影装置、動画再生装置および動画撮影方法、動画再生方法 | |
JPH08130712A (ja) | データ編集方法及び編集装置 | |
JP4916418B2 (ja) | 画像編集装置、画像編集方法及びプログラム | |
JP2005064575A (ja) | デジタル放送番組処理装置 | |
JP2005218019A (ja) | 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体 | |
JP2004228679A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2005176330A (ja) | 画像処理装置及びその制御方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体 |