JPWO2004102528A1 - オーディオ電子透かし装置 - Google Patents

オーディオ電子透かし装置 Download PDF

Info

Publication number
JPWO2004102528A1
JPWO2004102528A1 JP2004571864A JP2004571864A JPWO2004102528A1 JP WO2004102528 A1 JPWO2004102528 A1 JP WO2004102528A1 JP 2004571864 A JP2004571864 A JP 2004571864A JP 2004571864 A JP2004571864 A JP 2004571864A JP WO2004102528 A1 JPWO2004102528 A1 JP WO2004102528A1
Authority
JP
Japan
Prior art keywords
watermark
data
generation
audio data
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004571864A
Other languages
English (en)
Inventor
俊文 坂口
俊文 坂口
雅英 羽山
雅英 羽山
幸久 井上
幸久 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of JPWO2004102528A1 publication Critical patent/JPWO2004102528A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

オーディオデータに透かしデータを埋め込んでも雑音にならず、非可逆圧縮などによる変形に対して耐久性があり、透かしデータの埋め込み過程が可逆で、透かしデータの検出が容易であるオーディオデータ電子透かし装置を実現する。 人間の耳では聞き取れない低周波数の音を透かし生成用データとして用い、元のオーディオデータと重畳して重畳オーディオデータとすることで所定周期ごとの重畳オーディオデータの所定総和の値を制御し、符号化する。透かしデータ検出時にはその透かしの入った重畳オーディオデータの所定周期ごとの所定総和の結果から透かしデータの0/1を判定し、復号する。

Description

本発明は、オーディオデータに著作識別情報などを透かしデータとして埋め込む装置、及びその透かしデータの埋め込まれたオーディオデータから透かしデータを検出し、復号する装置に関する。
音楽等のオーディオデータに電子透かしを埋め込む技術は数多くあるが、一般に透かしデータを埋め込むことによる音質の劣化と透かしデータの耐久性とはトレードオフの関係にあり、両立させることが難しかった。例えば、オーディオデータのサンプル値の下位の数ビットで透かしデータを表現するとノイズはあまり目立たないが、この情報は周波数変換したとき高周波成分として現れるためMP3等の圧縮ソフトで圧縮をかけると容易に消えてしまう。また、はじめからMP3圧縮に特化した電子透かし、たとえば量子化された周波数成分の偶奇等を使って符号化するといった電子透かしもあるが、圧縮率を変えて再圧縮すると消えてしまう場合が多い。さらに、圧縮方式のシンタックスに着目して音質をまったく劣化させずに透かしデータを埋め込むという方法もあるが、この場合、一旦波形データに変換すると透かし情報は消えてしまう。その他にも、たとえば統計的な偏り等を利用した方法もあるが、電子透かしの耐久性を高めるために1ビットを表現するのに必要なサンプルの数を増やすとそれだけ埋め込むことの出来るデータの量が少なくなり、また、偏りを大きくするとそれだけ透かしデータの強度は増すが、元のオーディオデータの音質の劣化の度合いも大きくなるという問題がある。このように、元のオーディオデータの音質を劣化させることなく透かしデータを埋め込むことができ、非可逆圧縮等による変形を与えても透かしデータが残り、且つ容易に透かしデータを検出できるという理想的な電子透かしの技術はまだ確立されていないというのが現状であった。
特開2002−304184
近年デジタル化が進み、元のオーディオデータと寸分違わないコピーを誰でも簡単に作れるようになってきた。また、これらのデータはMP3(MPEGオーディオレイヤー3)等の圧縮ソフトで圧縮され、インターネットを介して配布されることも多くなった。
このような行為は、そのオーディオデータを正規に購入したユーザが個人的に利用する分には問題ないが、違法コピーし、不正に配布される場面も多く見られるようになった。このような状況下では著作権者は著作料を徴収することが困難になり、創作意欲も低下しかねない。
そこで、このような不正行為から著作権者の権利を守るため、個々のオーディオデータにその作者の著作権に関する情報を電子透かしとして埋め込む技術が模索されている。
第一の発明は、音声記録媒体に透かしデータを記録するためのオーディオ電子透かし装置であって、オーディオデータを取得するオーディオデータ取得部と、透かしデータを取得する透かしデータ取得部と、前記オーディオデータ取得部で取得したオーディオデータと重畳して重畳オーディオデータとすることで所定周期ごとの重畳オーディオデータの所定総和の結果が前記透かしデータ取得部で取得した透かしデータを表す透かし生成用データを生成する透かし生成用データ生成部と、前記オーディオデータ取得部で取得したオーディオデータと、前記透かし生成用データ生成部で生成した透かし生成用データとを重畳して重畳オーディオデータを生成する重畳オーディオデータ生成部と、を有するオーディオ電子透かし装置に関する。
第二の発明は、前記透かし生成用データ生成部は、人間の耳で聞きとれない低周波の透かし生成用データを生成する請求項1に記載のオーディオ電子透かし装置に関する。
第三の発明は、前記透かし生成用データ生成部は、それによって生成される透かし生成用データの表す関数の振幅の変化する境界における値と傾きが常にゼロである前記透かし生成用データを生成する請求項1又は2に記載のオーディオ電子透かし装置に関する。
第四の発明は、前記透かし生成用データ生成部は、前記所定周期ごとの前記所定総和の結果が前記透かしデータ取得部で取得した透かしデータを表すように、前記透かし生成用データの表す関数の振幅を半周期ごとに適応的に変化させる請求項1から3のいずれか一に記載のオーディオ電子透かし装置に関する。
第五の発明は、前記所定周期ごとの前記所定総和の結果は、前記透かし生成用データの半周期ごとの前記重畳オーディオデータの総和の符号である請求項1から4のいずれか一に記載のオーディオ電子透かし装置に関する。
第六の発明は、前記所定周期ごとの前記所定総和の結果は、前記透かし生成用データの前半周期と後半周期に対応する前記重畳オーディオデータの総和の差分の符号である請求項1から4のいずれか一に記載のオーディオ電子透かし装置に関する。
第七の発明は、音声記録媒体に記録された透かしデータを復号するためのオーディオ電子透かし復号装置であって、重畳オーディオデータを取得する重畳オーディオデータ取得部と、重畳オーディオデータ取得部で取得した重畳オーディオデータの前記所定周期ごとの所定総和の結果を算出する総和算出部と、前記総和算出部で算出された前記所定総和の結果に基づいて前記透かしデータを復号する透かしデータ復号部と、を有するオーディオ電子透かし復号装置に関する。
第八の発明は、前記総和算出部は、前記重畳オーディオデータ取得部で取得した重畳オーディオデータの、前記透かし生成用データの半周期の時間にわたる総和の符号を算出する請求項7に記載のオーディオ電子透かし復号装置に関する。
第九の発明は、前記総和算出部は、前記重畳オーディオデータ取得部で取得した重畳オーディオデータの、前記透かし生成用データの1周期の前半の半周期の時間にわたる総和と後半の半周期の時間にわたる総和の差の符号を算出する請求項7に記載のオーディオ電子透かし復号装置に関する。
図1は実施形態1の機能ブロック図である。
図2は実施形態1で取得されるオーディオデータの波形パターンを示す図である。
図3は実施形態1で生成される透かし生成用データの基関数の波形パターンを示す図である。
図4は実施形態1で生成される透かし生成用データの基関数のサンプリングパターンを示す図である。
図5は実施形態1で生成される文字「C」の透かし生成用データの波形パターンを示す図である。
図6は実施形態1の電子透かし埋め込み過程を示す図である。
図7は実施形態1の処理の流れを示す図である。
図8は実施形態2の機能ブロック図である。
図9は実施形態2の処理の流れを示す図である。
図10は実施形態3の機能ブロック図である。
図11は実施形態3で生成される透かし生成用データの基関数の波形パターンを示す図である。
図12は実施形態3の処理の流れを示す図である。
図13は実施形態4の機能ブロック図である。
図14は実施形態4で生成される透かし生成用データの基関数の波形パターンを示す図である。
図15は実施形態4で生成される透かし生成用データの基関数のサンプリングパターンを示す図である。
図16は実施形態4で生成される文字「C」の透かし生成用データの波形パターンを示す図である。
図17は実施形態4の処理の流れを示す図である。
図18は実施形態5の機能ブロック図である。
図19は実施形態5の電子透かし埋め込み過程を示す図である。
図20は実施形態5の処理の流れを示す図である。
図21は実施形態6の機能ブロック図である。
図22は実施形態6の処理の流れを示す図である。
図23は実施形態7の機能ブロック図である。
図24は実施形態7の電子透かし検出過程を示す図である。
図25は実施形態7に処理の流れを示す図である。
図26は実施形態8の機能ブロック図である。
図27は実施形態8の電子透かし検出過程を示す図である。
図28は実施形態8の処理の流れを示す図である。
図29は実施形態9の機能ブロック図である。
図30は実施形態9の電子透かし検出過程を示す図である。
図31は実施形態9の処理の流れを示す図である。
以下に本件発明の実施形態を説明する。実施形態と、請求項との関係はおおむね次のようなものである。
実施形態1は、主に、請求項1、請求項10などについて説明している。
実施形態2は、主に、請求項2、請求項11などについて説明している。
実施形態3は、主に、請求項3、請求項12などについて説明している。
実施形態4は、主に、請求項4、請求項13などについて説明している。
実施形態5は、主に、請求項5、請求項14などについて説明している。
実施形態6は、主に、請求項6、請求項15などについて説明している。
実施形態7は、主に、請求項7、請求項16などについて説明している。
実施形態8は、主に、請求項8、請求項17などについて説明している。
実施形態9は、主に、請求項9、請求項18などについて説明している。
<<実施形態1>>
<実施形態1の概念>
実施形態1に記載の発明は、著作識別情報などを透かしデータとして取得し、オーディオデータと重畳して重畳オーディオデータとし、その所定周期ごとの所定総和の結果を用いることにより、その著作識別情報などの透かしデータを埋め込むオーディオ電子透かし装置に関する。
<構成要件の明示>
図1に示すように、実施形態1のオーディオ電子透かし装置0100は、オーディオデータ取得部0101と、透かしデータ取得部0102と、透かし生成用データ生成部0103と、重畳オーディオデータ生成部0104と、からなる。
<構成の説明>
<基本機能ブロック図の導入>
(構成要件:オーディオデータ取得部)
オーディオデータ取得部は、オーディオデータを取得する。
(構成要件:透かしデータ取得部)
透かしデータ取得部は、透かしデータを取得する。
ここで「透かしデータ」には、著作識別情報等のコードやテキスト、コンテンツ配信等に用いるID等のデジタルデータが該当する。
(構成要件:透かし生成用データ生成部)
透かし生成用データ生成部は、オーディオデータ取得部で取得したオーディオデータと重畳して重畳オーディオデータとすることで所定周期ごとの所定総和の結果が透かしデータ取得部で取得した透かしデータを表す透かし生成用データを生成する。
ここで「所定周期ごとの所定総和の結果」とは、重畳オーディオデータの、透かし生成用データの所定周期ごとの所定総和の結果をいう。「所定周期」には、半周期、1周期、1.5周期、2周期、2.5周期、3周期、・・・などが該当する。「所定総和」には、半周期分の総和、1周期分の総和などが該当する。「所定総和の結果」には、半周期、1周期にわたる総和、総和の符号、総和の差の符号などが該当する。
(構成要件:重畳オーディオデータ生成部)
重畳オーディオデータ生成部は、オーディオデータ取得部で取得したオーディオデータと、透かし生成用データ生成部で生成した透かし生成用データとを重畳して重畳オーディオデータを生成する。
<具体例に基づく説明>
以下、本発明の実施形態1について、具体的な例を使って詳細に説明する。
(オーディオデータ取得)
図2に示すような波形パターンのオーディオデータを取得する。
なお、オーディオデータとしては、PCM(Pulse Code Modulation)等のすでにデジタル化されたものを取得してもよいし、アナログ波形を取得し、それをサンプリング/量子化してデジタルデータに変換してもよい。また、圧縮されたオーディオデータを復号してPCMデータとして取り出したものでもよい。
(透かしデータ取得)
次に、透かしデータについて述べる。透かしデータはデジタル情報であれば何でもよく、一例としては、著作識別情報等を示すコードや文字列があるが、いずれの場合も2進数で表しておく。例えば、アルファベットからなる文字列を非圧縮で埋め込む場合、ASCIIコードに変換してその値を2進数表示しておく。
ここでは、一例として、「Copyright」の「C」という文字を透かしデータとして取得する場合を考える。この文字に対するASCIIコードは2進数で表現すると「01000011」となる。
(透かし生成用データ:基関数生成)
次に、透かし生成用データの生成方法について述べる。透かし生成用データは、基になる関数(以下基関数と呼ぶ)に振幅aを掛けた関数で表される。一例として、オーディオデータのサンプリングレートがRヘルツで、透かし生成用データとして周波数fヘルツの波を使う場合を考える。ここで、fはR/fが整数になるように選ぶ。
この波をサンプリングレートRでサンプリングしたものを基関数u(t)とする。(実際にサンプリングを実行するのではなく、そのような関数を数式を使って求める。)ここで、tはサンプル点である。図3に示すのは基関数u(t)の一例で、周期R/fの正弦波を上方に移動させ、最大値と最小値がそれぞれ1と0になるように調整したものである。
この関数u(t)の値は透かしデータの埋め込み時に頻繁に使われるので、あらかじめ1周期分を計算し、その関数値のリストをメモリーに格納しておく。
すなわち、
u(0),u(1),…,u(R/f−1)
をメモリーに格納しておく。
図4に示すように、第1周期のサンプル点tにおける値はつぎの関係式を用いて上記1周期分の値から求めることができる。
u(t)=u(t−(i−1)・R/f)
(透かし生成用データ:総和算出)
上記透かし生成用データと元のオーディオデータとを足し合わせることにより重畳オーディオデータを生成する。元のオーディオデータのサンプル値をv(t)とすると、重畳されたオーディオデータはつぎのようになる。
a(0)・u(0)+v(0)

a(R/f−1)・u(R/f−1)+v(R/f−1)
a(R/f)・u(R/f)+v(R/f)

a(2・R/f−1)・u(2・R/f−1)+v(2・R/f−1)
a(2・R/f)・u(2・R/f)+v(2・R/f)

a(3・R/f−1)・u(3・R/f−1)+v(3・R/f−1)


透かし生成用データと重畳されたオーディオデータのサンプル点tにおけるサンプル値をw(t)とすると、上記の例は次の式で表すことができる。
w(t)=v(t)+a(t)・u(t)
このw(t)を透かし生成用データの第i周期の1周期にわたって足し合わせる。このとき、a(t)は1周期の中では一定の値をとるようにする。この一定値をaとすると、
Σw(t)=Σv(t)+a・Σu(t)
となる。ここで、Σは透かし生成用データの第i周期の1周期分の総和を表す。また、以降の説明で
=Σv(t)
U=Σu(t)
とおく。Vは一般に周期iごとに変化するが、Uは一定の定数である。
この定数Uもメモリーにあらかじめ格納しておく。
(透かし生成用データ:振幅生成)
次に、この重畳されたオーディオデータの総和の絶対値が一定で符号が透かしデータのビット値を表すようにaの値を決める。ビット値をb(0または1)とし、重畳オーディオデータの総和の絶対値をSとすると、
(−1)・S=V+a・U
したがって、
={(−1)・S−V}/U
となる。なお、この例では1周期で1ビットを表しているので、一般にbはiごとに異なる値をとる。
(透かし生成用データ生成)
透かし生成用データを表す関数は、透かし生成用データの基関数にこの振幅aをかけたもの、すなわち、
{(−1)・S−V}・u(t)/U
となる。
図5に示すのは、透かしデータの文字「C」に対応する透かし生成用データの波形パターンの概略図である。なお、この図では振幅aの符号と(−1)の符号は一致しているが、Vの大きさによっては反転することもあり得る。ビット値を表しているのは透かし生成用データの振幅の符号ではなく、重畳オーディオデータの総和の符号である。
(重畳オーディオデータ生成)
以上より、透かし生成用データと重畳された重畳オーディオデータw(t)は次式のようになる。
w(t)=v(t)+{(−1)・S−V}・u(t)/U
(電子透かしの埋め込み過程)
次に、この式を用い、オーディオデータに電子透かしを埋め込む過程を、図6を参照しながら説明する。まず、透かし生成用データの1周期分のオーディオデータがA01に入り、そこで上式の総和が計算されてA03に出力される。一方、透かしデータはA02に入り、そこでビット値に応じて透かし生成用データの1周期ごとに上式の(−1)の符号がA03に出力される。すなわち、ビット値が0のときは「正」、1のときは「負」が出力される。A03ではこれら2つの値を使って上式に従って透かし生成用データを生成し、その透かし生成用データのデータをA04に出力する。A04ではこの透かし生成用データのデータと元のオーディオデータとを重畳することにより透かしデータの入った重畳オーディオデータを生成し、出力する。
(その他)
この透かしデータの埋め込み過程は可逆であり、透かしデータの埋め込み時に使用された透かし生成用データの振幅の時系列データがあれば完全に元に戻すことができる。さらに、ある人が透かしデータを埋め込んだあと、別の人が別の透かしデータを埋め込んでも、それぞれの過程で使用された透かし生成用データの振幅の時系列データがあれば、それぞれの透かしデータを取り出し、且つ、元のオーディオデータに戻すことができる。このように、何重にでも埋め込むことができるので、例えば著作権者が著作権に関する情報を埋め込んだ後、その著作権を保護した状態で、コンテンツ配信業者が不正な二次配信を防止する目的で独自のIDを埋め込むといったようなことも可能となる。
また、逆に、透かしデータを埋め込んだときに使用された透かし生成用データの振幅の時系列データがないと元の状態に戻すことはできない(ビット値は重畳オーディオデータの総和で表現されており、これをもとのオーディオデータと透かし生成データに分解するする仕方は一意には定まらない)ので、このことを利用して改ざんされにくい電子透かしシステムを構築することも可能である。例えば、透かしデータを埋め込むときにこの時系列のデータを出力し、著作権を管理しているところにそれを保管しておく。オーディオデータの著作権を主張する者は、自分の持っている透かしの入っていないオリジナルの(と主張する)元のオーディオデータをその著作権を管理しているところに持っていき、上記透かし生成用データの振幅の時系列データを使ってその持ち込まれた元のオーディオデータと合成する。これが実際に配布されている透かしデータの入った重畳オーディオデータと一致すれば間違いなくその者が作成したものであると判断できる。
なお、これまでの説明で、透かしデータの開始点の検出やエラー処理等については割愛したが、これらは従来のよく知られた技術で容易に実装できる。たとえば、透かしデータの開始点の検出については、あらかじめ特定のビットパターンを透かしデータの前に挿入しておき、そのパターンが見つかった直後から復号を開始すればよい。具体的には、振幅がゼロのところを無条件でスキップし、その後スタート位置を少しずつずらしながらスタートコードと同期するところを見つけ、その後透かしデータの1周期分ずつ進めてデコードする等の方法がある。エラー処理についてはチェックサム等を透かしデータとして埋め込み、デコード時にチェックする等の方法がある。
<処理の流れ>
図7に示すのは、実施形態1の処理の流れである。
まず、オーディオデータ取得部は、オーディオデータを取得する(ステップS0701)。
次に、透かしデータ取得部は、透かしデータを取得する(ステップS0702)。
次に、透かし生成用データ生成部は、ステップS0702で取得した透かしデータに基づいて、ステップS0701で取得したオーディオデータと重畳して重畳オーディオデータとすることで所定周期ごとの所定総和の結果がステップS0702で取得した透かしデータを表す透かし生成用データを生成する(ステップS0703)。
次に、重畳オーディオデータ生成部は、ステップS0701で取得したオーディオデータと、ステップS0703で生成した透かし生成用データとを重畳して重畳オーディオデータを生成する(ステップS0704)。
<実施形態1の効果の簡単な説明>
実施形態1に記載の発明では、著作識別情報などを透かしデータとして取得し、オーディオデータと重畳して重畳オーディオデータとし、その所定周期ごとの所定総和の結果で透かし情報を表現するという手法を用いることにより、透かしデータを埋め込むことによる音質の劣化を防止している。
また、透かし生成用データの1波長で1ビットが符号化されるので、透かし生成用データが長波長であるにもかかわらず、効率よく多くの透かしデータを埋め込むことができる。
<<実施形態2>>
<実施形態2の概念>
実施形態2に記載の発明は、人間の耳では聞き取れない低周波の透かし生成用データを生成する請求項1に記載のオーディオ電子透かし装置に関する。
<構成要件の明示>
図8に示すように、実施形態2のオーディオ電子透かし装置0800は、オーディオデータ取得部0801と、透かしデータ取得部0802と、透かし生成用データ生成部0803と、重畳オーディオデータ生成部0804と、からなる。
<構成の説明>
<基本機能ブロック図の導入>
(構成要件:オーディオデータ取得部)
実施形態1の(構成要件:オーディオデータ取得部)と同様なので説明を省略する。
(構成要件:透かしデータ取得部)
実施形態1の(構成要件:透かしデータ取得部)と同様なので説明を省略する。
(構成要件:透かし生成用データ生成部)
透かし生成用データ生成部は、人間の耳では聞き取れない低周波の透かし生成用データを生成する。
ここで「人間の耳では聞き取れない低周波」とは、約20Hz以下の低い周波数のことをいう。
それ以外は、実施形態1の(構成要件:透かし生成用データ生成部)と同様なので説明を省略する。
(構成要件:重畳オーディオデータ生成部)
実施形態1の(構成要件:重畳オーディオデータ生成部)と同様なので説明を省略する。
<具体例に基づく説明>
以下、本発明の実施形態2について、具体的な例を使って詳細に説明する。
(オーディオデータ取得)
実施形態1の(オーディオデータ取得)と同様なので説明を省略する。
(透かしデータ取得)
実施形態1の(透かしデータ取得)と同様なので説明を省略する。
(透かし生成用データ:基関数生成)
実施形態2の場合、透かし生成用データは人間の耳では聞き取れない低周波を用いる。一例として、オーディオデータのサンプリングレートが44.1kヘルツで、透かし生成用データとして周波数10ヘルツの関数を使う場合を考える。
基関数u(t)は、周期44.1k/10の関数である。
実施形態2の場合、実施形態1のR=44.1k、f=10となる。
それ以外は、実施形態1の(透かし生成用データ:基関数生成)と同様なので説明を省略する。
(透かし生成用データ:総和算出)
実施形態2の場合、実施形態1のR=44.1k、f=10となること以外は、実施形態1の(透かし生成用データ:総和算出)と同様なので説明を省略する。
(透かし生成用データ:振幅生成)
実施形態2の場合、実施形態1のR=44.1k、f=10となること以外は、実施形態1の(透かし生成用データ:振幅生成)と同様なので説明を省略する。
(透かし生成用データ生成)
実施形態2の場合、実施形態1のR=44.1k、f=10となること以外は、実施形態1の(透かし生成用データ生成)と同様なので説明を省略する。
(重畳オーディオデータ生成)
実施形態1の(重畳オーディオデータ生成)と同様なので説明を省略する。
(電子透かしの埋め込み過程)
実施形態1の(電子透かしの埋め込み過程)と同様なので説明を省略する。
(その他)
実施形態1の(その他)と同様なので説明を省略する。
<処理の流れ>
図9に示すのは、実施形態2の処理の流れである。
まず、オーディオデータ取得部は、オーディオデータを取得する(ステップS0901)。
次に、透かしデータ取得部は、透かしデータを取得する(ステップS0902)。
次に、透かし生成用データ生成部は、ステップS0902で取得した透かしデータに基づいて、ステップS0901で取得したオーディオデータと重畳して重畳オーディオデータとすることで所定周期ごとの所定総和の結果がステップS0902で取得した透かしデータを表す、人間の耳では聞き取れない低周波の透かし生成用データを生成する(ステップS0903)。
次に、重畳オーディオデータ生成部は、ステップS0901で取得したオーディオデータと、ステップS0903で生成した透かし生成用データとを重畳して重畳オーディオデータを生成する(ステップS0904)。
<実施形態2の効果の簡単な説明>
実施形態2に記載の発明では、人間の耳では聞き取れない低周波のデータを透かし生成用データとして用いているので、透かし生成用データの振幅を大きくしても元のオーディオデータの音質を劣化させることがなく、ロバストな電子透かしを実現できる。
また、透かし生成用データの1波長で1ビットが符号化されるので、透かし生成用データが長波長であるにもかかわらず、効率よく多くの透かしデータを埋め込むことができる。
<<実施形態3>>
<実施形態3の概念>
実施形態3に記載の発明は、透かし生成用データを表す関数として振幅の変化する境界における値と傾きが常にゼロとなるものを用いる請求項1又は2に記載のオーディオ電子透かし装置に関する。
<構成要件の明示>
図10に示すように、実施形態3のオーディオ電子透かし装置1000は、オーディオデータ取得部1001と、透かしデータ取得部1002と、透かし生成用データ生成部1003と、重畳オーディオデータ生成部1004と、からなる。
<構成の説明>
<基本機能ブロック図の導入>
(構成要件:オーディオデータ取得部)
実施形態1又は2の(構成要件:オーディオデータ取得部)と同様なので説明を省略する。
(構成要件:透かしデータ取得部)
実施形態1又は2の(構成要件:透かしデータ取得部)と同様なので説明を省略する。
(構成要件:透かし生成用データ生成部)
透かし生成用データ生成部は、それによって生成される透かし生成データの表す関数の振幅の変化する境界における値と傾きが常にゼロである透かし生成用データを生成する。
それ以外は、実施形態1又は2の(構成要件:透かし生成用データ生成部)と同様なので説明を省略する。
(構成要件:重畳オーディオデータ生成部)
実施形態1又は2の(構成要件:重畳オーディオデータ生成部)と同様なので説明を省略する。
<具体例に基づく説明>
以下、本発明の実施形態3について、具体的な例を使って詳細に説明する。
(オーディオデータ取得)
実施形態1又は2の(オーディオデータ取得)と同様なので説明を省略する。
(透かしデータ取得)
実施形態1又は2の(透かしデータ取得)と同様なので説明を省略する。
(透かし生成用データ:基関数生成)
実施形態3の場合、透かし生成用データの表す関数として、振幅の変化する境界における値と傾きが常にゼロになるものを用いる。そのためには、透かし生成用データの基関数u(x)として上記の境界点で値と傾きがゼロになるものを用いればよい。すなわち、
u(x)=u′(x)=0
ここで、xは上記振幅の変化するn番目の境界点である。
図11に示すのは、x=n・π(nは整数)の場合である。
それ以外は、実施形態1又は2の(透かし生成用データ:基関数生成)と同様なので説明を省略する。
(透かし生成用データ:総和算出)
実施形態3の場合、基関数u(x)が(透かし生成用データ:基関数生成)の条件を満足すること以外は、実施形態1又は2の(透かし生成用データ:総和算出)と同様なので説明を省略する。
(透かし生成用データ:振幅生成)
実施形態3の場合、基関数u(x)が(透かし生成用データ:基関数生成)の条件を満足すること以外は、実施形態1又は2の(透かし生成用データ:振幅生成)と同様なので説明を省略する。
(透かし生成用データ生成)
実施形態1又は2の(透かし生成用データ生成)と同様なので説明を省略する。
(重畳オーディオデータ生成)
実施形態3の場合、基関数u(x)が(透かし生成用データ:基関数生成)の条件を満足すること以外は、実施形態1又は2の(重畳オーディオデータ生成)と同様なので説明を省略する。
(電子透かしの埋め込み過程)
実施形態1又は2の(電子透かしの埋め込み過程)と同様なので説明を省略する。
(その他)
実施形態1の(その他)と同様なので説明を省略する。
<処理の流れ>
図12に示すのは、実施形態3の処理の流れである。
まず、オーディオデータ取得部は、オーディオデータを取得する(ステップS1201)。
次に、透かしデータ取得部は、透かしデータを取得する(ステップS1202)。
次に、透かし生成用データ生成部は、ステップS1202で取得した透かしデータに基づいて、ステップS1201で取得したオーディオデータと重畳して重畳オーディオデータとすることで所定周期ごとの所定総和の結果がステップS1202で取得した透かしデータを表し、透かし生成用データの表す関数の振幅の変化する境界における値と傾きが常にゼロである透かし生成用データを生成する(ステップS1203)。
次に、重畳オーディオデータ生成部は、ステップS1201で取得したオーディオデータと、ステップS1203で生成した透かし生成用データとを重畳して重畳オーディオデータを生成する(ステップS1204)。
<実施形態3の効果の簡単な説明>
実施形態3に記載の発明では、透かし生成用データの表す関数の振幅の変化する境界における値と傾きが常にゼロなので、振幅が変動しても滑らかに繋がり、高周波ノイズの発生を防止することができる。
また、透かし生成用データの1波長で1ビットが符号化されるので、透かし生成用データが長波長であるにもかかわらず、効率よく多くの透かしデータを埋め込むことができる。
<<実施形態4>>
<実施形態4の概念>
実施形態4に記載の発明は、重畳オーディオデータの所定周期ごとの所定総和の結果が透かしデータを表すように、透かし生成用データの振幅を、半周期ごとに適応的に変化させる請求項1から3のいずれか一に記載のオーディオ電子透かし装置に関する。
<構成要件の明示>
図13に示すように、実施形態4のオーディオ電子透かし装置1300は、オーディオデータ取得部1301と、透かしデータ取得部1302と、透かし生成用データ生成部1303と、重畳オーディオデータ生成部1304と、からなる。
<構成の説明>
<基本機能ブロック図の導入>
(構成要件:オーディオデータ取得部)
実施形態1から3のいずれか一の(構成要件:オーディオデータ取得部)と同様なので説明を省略する。
(構成要件:透かしデータ取得部)
実施形態1から3のいずれか一の(構成要件:透かしデータ取得部)と同様なので説明を省略する。
(構成要件:透かし生成用データ生成部)
透かし生成用データ生成部は、所定周期ごとの所定総和の結果が透かしデータ取得部で取得した透かしデータを表すように、透かし生成用データの振幅を、半周期ごとに適応的に変化させる。
それ以外は、実施形態1から3のいずれか一の(構成要件:透かし生成用データ生成部)と同様なので説明を省略する。
(構成要件:重畳オーディオデータ生成部)
実施形態1から3のいずれか一の(構成要件:重畳オーディオデータ生成部)と同様なので説明を省略する。
<具体例に基づく説明>
以下、本発明の実施形態4について、具体的な例を使って詳細に説明する。
(オーディオデータ取得)
実施形態1から3のいずれか一の(オーディオデータ取得)と同様なので説明を省略する。
(透かしデータ取得)
実施形態1から3のいずれか一の(透かしデータ取得)と同様なので説明を省略する。
(透かし生成用データ:基関数生成)
次に、透かし生成用データの生成方法について述べる。透かし生成用データは、基になる関数(以下基関数と呼ぶ)に振幅aを掛けた関数で表される。一例としてつぎのような関数u(t)を考える。
u(t)=sin(2π・f・t/R)
=(3/4)・sin(2π・f・t/R)
−(1/4)・sin(3・2π・f・t/R)
図14に示すように、この関数は半周期ごとに関数値と傾きがゼロになる。従って、その半周期ごとに現れる関数値と傾きがゼロになる点の前後で振幅を変化させると滑らかにつながり、高周波ノイズの発生を防止することができる。なお、この関数には周波数がf/Rの波の他に3f/Rの波も含まれるが、後者の振幅は前者の振幅の1/3なのでほとんど聞き取れない。
この関数u(t)の値は透かしデータの埋め込み時に頻繁に使われるので、あらかじめ半周期分を計算し、その関数値のリストをメモリーに格納しておく。
一例として、
u(0),u(1),…,u(R/f/2−1),
をメモリーに格納しておく。後半の半周期における値
u(R/f/2),u(R/f/2+1),…,u(R/f−1)
は、前半の半周期における値の符号を反転させたものである。
また、図15に示すように、第i周期のサンプル点tにおける値はつぎの関係式を用いて上記の関数値のリストから求めることができる。
u(t)=u(t−(i−1)・R/f)
t=(i−1)・R/f,(i−1)・R/f+1,…,
(i−1)・R+(R/f/2−1),(i−1)・R+R/f/2,…,
i・R/f−1
(透かし生成用データ:総和算出)
透かし生成用データの入った重畳オーディオデータのサンプル点tにおけるサンプル値をw(t)とすると、次の式で表すことができる。
w(t)=v(t)+a(t)・u(t)
このw(t)を、透かし生成用データの第i周期の半周期分にわたって足し上げる。このとき、a(t)はこの半周期の中では一定の値をとるようにする。この一定値をaとすると、
Σw(t)=Σv(t)+a・Σu(t)
となる。ここで、Σは透かし生成用データの第i周期の半周期分の総和を表す。また、以降の説明で
第i周期の前半の半周期:
1i=Σv(t)
=Σu(t)
1i=a
第i周期の後半の半周期:
2i=Σv(t)
=Σu(t)
2i=a
とおく。V1i、V2iは一般に周期iごとに変化するが、U、Uは一定の定数である。(上記の例ではU=−Uとなる。)
この定数U、Uもメモリーにあらかじめ格納しておく。
(透かし生成用データ:振幅生成)
次に、この透かし生成用データの半周期ごとの重畳されたオーディオデータの総和の絶対値が一定で符号が透かしデータのビット値を表すようにa1i、a2iの値を決める。このとき、透かし生成用データの後半周期の重畳されたオーディオデータの総和が前半周期の総和と符号が反対になるようにする。ビット値をb(0または1)とし、透かし生成用データの半周期ごとの重畳オーディオデータの総和の絶対値をSとすると、
第i周期の前半周期:Σw(t)=(−1)・S=V1i+a1i・U
第i周期の後半周期:Σw(t)=−(−1)・S=V2i+a2i・U
したがって、
第i周期の前半周期:a1i={(−1)・S−V1i}/U
第i周期の後半周期:a2i={−(−1)・S−V2i}/U
となる。なお、この例では1周期で1ビットを表しているので、一般にbはiごとに異なる。
(透かし生成用データ生成)
透かし生成用データを表す関数は、透かし生成用データの基関数u(t)に振幅a1i、a2iをかけたもの、すなわち、
第i周期の前半周期:{{(−1)・S−V1i}/U}・u(t)
第i周期の後半周期:{{−(−1)・S−V2i}/U}・u(t)
となる。
図16に示すのは、透かしデータの文字「C」に対応する生成用データの波形パターンの概略図である。なお、この図では透かし生成用データの符号はビット値に対応しているが、一般にはV1i、V2iの大きさによって反転することもあり得る。ビット値に対応しているのは透かし生成用データの符号ではなく、重畳されたオーディオデータの総和の符号である。
(重畳オーディオデータ生成)
以上より、透かし生成用データと合成されたオーディオデータw(t)は次式のようになる。
第i周期の前半周期:
w(t)=v(t)+{{(−1)・S−V1i}/U}・u(t)
第i周期の後半周期:
w(t)=v(t)+{{−(−1)・S−V2i}/U}・u(t)
(その他)
実施形態1の(その他)と同様なので説明を省略する。
<処理の流れ>
図17に示すのは、実施形態4の処理の流れである。
まず、オーディオデータ取得部は、オーディオデータを取得する(ステップS1701)。
次に、透かしデータ取得部は、透かしデータを取得する(ステップS1702)。
次に、透かし生成用データ生成部は、重畳オーディオデータの所定周期ごとの所定総和の結果がステップS1702で取得した透かしデータを表すように、透かし生成用データの振幅を、半周期ごとに適応的に変化させる(ステップS1703)。
次に、重畳オーディオデータ生成部は、ステップS1701で取得したオーディオデータと、ステップS1703で生成した透かし生成用データとを重畳して重畳オーディオデータを生成する(ステップS1704)。
<実施形態4の効果の簡単な説明>
実施形態4に記載の発明では、重畳オーディオデータの所定周期ごとの総和の符号が毎回反転するのでDCオフセットが残るのを防止できる。
<<実施形態5>>
<実施形態5の概念>
実施形態5に記載の発明は、重畳オーディオデータの所定周期ごとの所定総和の結果が、透かし生成用データの半周期ごとの前記重畳オーディオデータの総和の符号である請求項1から4のいずれか一に記載のオーディオ電子透かし装置に関する。
<構成要件の明示>
図18に示すように、実施形態5のオーディオ電子透かし装置1800は、オーディオデータ取得部1801と、透かしデータ取得部1802と、透かし生成用データ生成部1803と、重畳オーディオデータ生成部1804と、からなる。
<構成の説明>
<基本機能ブロック図の導入>
(構成要件:オーディオデータ取得部)
実施形態4の(構成要件:オーディオデータ取得部)と同様なので説明を省略する。
(構成要件:透かしデータ取得部)
実施形態4の(構成要件:透かしデータ取得部)と同様なので説明を省略する。
(構成要件:透かし生成用データ生成部)
透かし生成用データ生成部は、重畳オーディオデータの所定周期ごとの所定総和の結果が透かしデータ取得部で取得した透かしデータを表すように、透かし生成用データを生成する。
ここで「所定周期ごとの所定総和の結果」とは、透かし生成用データの半周期ごとの重畳オーディオデータの総和の符号のことをいう。
それ以外は、実施形態4の(構成要件:透かし生成用データ生成部)と同様なので説明を省略する。
(構成要件:重畳オーディオデータ生成部)
実施形態4の(構成要件:重畳オーディオデータ生成部)と同様なので説明を省略する。
<具体例に基づく説明>
以下、本発明の実施形態5について、具体的な例を使って詳細に説明する。
(オーディオデータ取得)
実施形態4の(オーディオデータ取得)と同様なので説明を省略する。
(透かしデータ取得)
実施形態4の(透かしデータ取得)と同様なので説明を省略する。
(透かし生成用データ:基関数生成)
実施形態4の(透かし生成用データ:基関数生成)と同様なので説明を省略する。
(透かし生成用データ:総和算出)
実施形態4の(透かし生成用データ:総和算出)と同様なので説明を省略する。
(透かし生成用データ:振幅生成)
実施形態4の(透かし生成用データ:振幅生成)の説明において、
第i周期の前半周期:Σw(t)=(−1)・S
第i周期の後半周期:Σw(t)=−(−1)・S
となっているので、透かし生成用データの半周期おきに(前半周期ごとあるいは後半周期ごとに)重畳オーディオデータの総和を求めれば、その符号で透かしデータの各ビットの0/1を判定できる。したがって、実施形態4に記載されているのと同様な方法で振幅を生成すればよい。
(透かし生成用データ生成)
実施形態4の(透かし生成用データ生成)と同様なので説明を省略する。
(重畳オーディオデータ生成)
実施形態4の(重畳オーディオデータ生成)と同様なので説明を省略する。
(電子透かしの埋め込み過程)
次に、オーディオデータに電子透かしを埋め込む過程を、図19を参照しながら説明する。まず、透かし生成用データの半周期分のオーディオデータがA01に入り、そこで上式の総和が計算されてA03に出力される。一方、透かしデータはA02に入り、そこでビット値に応じて透かし生成用データの半周期ごとに上式の(−1)または−(−1)の符号がA03に出力される。つまり、前半の半周期ではビット値が0のときは「正」、1のときは「負」が出力され、後半の半周期ではビット値が0のときは「負」、1のときは「正」が出力される。A03ではこれら2つの値を使って上式に従って透かし生成用データを生成し、その透かし生成用データのデータをA04に出力する。A04ではこの透かし生成用データのデータと元のオーディオデータとを重畳することにより透かしデータの入った重畳オーディオデータを生成し、出力する。
(その他)
実施形態1の(その他)と同様なので説明を省略する。
<処理の流れ>
図20に示すのは、実施形態5の処理の流れである。
まず、オーディオデータ取得部は、オーディオデータを取得する(ステップS2001)。
次に、透かしデータ取得部は、透かしデータを取得する(ステップS2002)。
次に、透かし生成用データ生成部は、重畳オーディオデータの、透かし生成用データ半周期ごとの総和の符号が、ステップS2002で取得した透かしデータを表すように、透かし生成用データを生成する(ステップS2003)。
次に、重畳オーディオデータ生成部は、ステップS2001で取得したオーディオデータと、ステップS2003で生成した透かし生成用データとを重畳して重畳オーディオデータを生成する(ステップS2004)。
<実施形態5の効果の簡単な説明>
実施形態5に記載の発明では、透かし生成用データの半周期にわたる重畳オーディオデータの総和の符号が透かしデータの各ビットの0/1を表すので、透かしデータの検出/復号が容易である。また、その総和の絶対値が常にゼロと異なる一定の値を持つのでオーディオデータの変形に対して耐久性のある電子透かしを実現できる。
<<実施形態6>>
<実施形態6の概念>
実施形態6に記載の発明は、所定周期ごとの所定総和の結果は、透かし生成用データの前半周期と後半周期の重畳オーディオデータの総和の差分の符号である請求項1から4のいずれか一に記載のオーディオ電子透かし装置に関する。
<構成要件の明示>
図21に示すように、実施形態6のオーディオ電子透かし装置2100は、オーディオデータ取得部2101と、透かしデータ取得部2102と、透かし生成用データ生成部2103と、重畳オーディオデータ生成部2104と、からなる。
<構成の説明>
<基本機能ブロック図の導入>
(構成要件:オーディオデータ取得部)
実施形態4の(構成要件:オーディオデータ取得部)と同様なので説明を省略する。
(構成要件:透かしデータ取得部)
実施形態4の(構成要件:透かしデータ取得部)と同様なので説明を省略する。
(構成要件:透かし生成用データ生成部)
透かし生成用データ生成部は、重畳オーディオデータの所定周期ごとの所定総和の結果が透かしデータ取得部で取得した透かしデータを表すように、透かし生成用データを、半周期ごとに振幅を適応的に変化させる。
ここで「所定周期ごとの所定総和の結果」とは、透かし生成用データの前半周期と後半周期の重畳オーディオデータの総和の差の符号のことをいう。
それ以外は、実施形態4の(構成要件:透かし生成用データ生成部)と同様なので説明を省略する。
(構成要件:重畳オーディオデータ生成部)
実施形態4の(構成要件:重畳オーディオデータ生成部)と同様なので説明を省略する。
<具体例に基づく説明>
以下、本発明の実施形態6について、具体的な例を使って詳細に説明する。
(オーディオデータ取得)
実施形態4の(オーディオデータ取得)と同様なので説明を省略する。
(透かしデータ取得)
実施形態4の(透かしデータ取得)と同様なので説明を省略する。
(透かし生成用データ:基関数生成)
実施形態4の(透かし生成用データ:基関数生成)と同様なので説明を省略する。
(透かし生成用データ:総和算出)
実施形態4の(透かし生成用データ:総和算出)と同様なので説明を省略する。
(透かし生成用データ:振幅生成)
実施形態4の(透かし生成用データ:振幅生成)の説明において、
第i周期の前半周期:Σw(t)=(−1)・S
第i周期の後半周期:Σw(t)=−(−1)・S
となっているので、透かし生成用データの前半の半周期の時間にわたる重畳オーディオデータの総和と後半の半周期の時間にわたる総和の差は
(−1)・2S
となり、この符号で透かしデータの各ビットの0/1を判定できる。したがって、実施形態4に記載されているのと同様な方法で振幅を生成すれよい。
(透かし生成用データ生成)
実施形態4の(透かし生成用データ生成)と同様なので説明を省略する。
(重畳オーディオデータ生成)
実施形態4の(重畳オーディオデータ生成)と同様なので説明を省略する。
(電子透かしの埋め込み過程)
実施形態5の(電子透かしの埋め込み過程)と同様なので説明を省略する。
(その他)
実施形態1の(その他)と同様なので説明を省略する。
<処理の流れ>
図22に示すのは、実施形態6の処理の流れである。
まず、オーディオデータ取得部は、オーディオデータを取得する(ステップS2201)。
次に、透かしデータ取得部は、透かしデータを取得する(ステップS2202)。
次に、透かし生成用データ生成部は、重畳オーディオデータの、透かし生成用データ前半周期分と後半周期分の総和の差分の符号が、ステップS2202で取得した透かしデータを表すように、透かし生成用データを生成する(ステップS2203)。
次に、重畳オーディオデータ生成部は、ステップS2201で取得したオーディオデータと、ステップS2203で生成した透かし生成用データとを重畳して重畳オーディオデータを生成する(ステップS2204)。
<実施形態6の効果の簡単な説明>
実施形態6に記載の発明では、透かしの入った重畳オーディオデータの所定の前半周期分と後半周期分の総和の差の符号で透かしデータの各ビットの0/1を表現しているので、DCオフセットがかかっても判定に影響しないロバストな電子透かしを実現できる。
<<実施形態7>>
<実施形態7の概念>
実施形態7に記載の発明は、取得した重畳オーディオデータの、透かし生成用データの所定周期分ごとの所定総和の結果を算出し、その結果に基づいて透かしデータを復号するオーディオ電子透かし復号装置に関する。
<構成の説明>
<構成要件の明示>
図23に示すように、実施形態7のオーディオ電子透かし復号装置2300は、重畳オーディオデータ取得部2301と、総和算出部2302と、透かしデータ復号部2303と、からなる。
<構成の説明>
<基本機能ブロック図の導入>
(構成要件:重畳オーディオデータ取得部)
重畳オーディオデータ取得部は、重畳オーディオデータを取得する。
(構成要件:総和算出部)
総和算出部は、重畳オーディオデータ取得部で取得した重畳オーディオデータの所定周期ごとの所定総和の結果を算出する。
ここで「所定周期ごとの所定総和の結果」とは、重畳オーディオデータの、透かし生成用データの所定周期ごとの所定総和の結果をいう。「所定周期」には、半周期、1周期、1.5周期、2周期、2.5周期、3周期、・・・などが該当する。「所定総和」には、半周期の総和、1周期の総和などが該当する。「所定総和の結果」には、半周期、1周期にわたる総和、総和の符号、および総和の差の符号などが該当する。
(構成要件:透かしデータ復号部)
透かしデータ復号部は、総和算出部で算出された所定総和の結果に基づいて透かしデータを復号する。
<具体例に基づく説明>
以下、本発明の実施形態7について、具体的な例を使って詳細に説明する。
(重畳オーディオデータ取得)
実施形態7の重畳オーディオデータ取得は、一例として、実施形態1で生成された重畳オーディオデータw(t)を取得するものとすると、
w(t)=v(t)+{(−1)・S−V}・u(t)/U
となる。記号の意味は実施形態1と同様であるとする(以下同じ)。
(総和算出)
実施形態1で説明したように、第i周期の1周期分にわたる重畳オーディオデータの総和は、
Σw(t)=(−1)・S
=+S (b=0)
=−S (b=1)
となる。
(透かしデータ復号)
上式のように透かしデータの各ビット値の違いは重畳オーディオデータの総和の符号の違いとなって現れているので、1周期分の総和を求め、その符号で透かしデータの各ビットの0/1を判定し、復号することが出来る。
(透かしデータ検出過程)
この透かしデータ検出過程をブロック図で表したものを図24に示す。図中で透かしデータの入った重畳オーディオデータの各サンプル値が透かし生成用データ1周期分ずつB01に入り、そこで1周期分の総和が計算され、その符号がB02に出力される。B02ではその符号に応じて0または1が選択され、透かしデータとして出力される。
(その他)
実施形態1の(その他)と同様なので説明を省略する。
<処理の流れ>
図25に示すのは、実施形態7の処理の流れである。
まず、重畳オーディオデータ取得部は、透かし生成用データとオーディオデータの重畳オーディオデータを取得する(ステップS2501)。
次に、総和算出部は、ステップS2501で取得した重畳オーディオデータの、透かし生成用データの所定周期分ごとの所定総和の結果を算出する(ステップS2502)。
次に、透かしデータ復号部は、ステップS2502で算出された所定総和の結果に基づいて透かしデータのビット値を判定し、復号する(ステップS2503)。
<実施形態7の効果の簡単な説明>
実施形態7に記載の発明では、透かし生成用データの所定周期分の重畳オーディオデータの所定総和の結果で透かしデータの各ビットの0/1を判定できるため、透かしデータの検出/復号が容易である。また、上記所定総和の結果はオーディオデータの変形に対して影響を受けにくいのでロバストな電子透かしを実現できる。
<<実施形態8>>
<実施形態8の概念>
実施形態8に記載の発明は、透かし生成用データの半周期の時間にわたって重畳オーディオデータを総和した値の符号に基づいて透かしデータを復号する請求項7に記載のオーディオ電子透かし復号装置に関する。
<構成の説明>
<構成要件の明示>
図26に示すように、実施形態8のオーディオ電子透かし復号装置2600は、重畳オーディオデータ取得部2601と、総和算出部2602と、透かしデータ復号部2603と、からなる。
<構成の説明>
<基本機能ブロック図の導入>
(構成要件:重畳オーディオデータ取得部)
重畳オーディオデータ取得部は、重畳オーディオデータを取得する。
(構成要件:総和算出部)
総和算出部は、透かし生成用データの半周期の時間にわたって総和した値の符号を算出する。
(構成要件:透かしデータ復号部)
透かしデータ復号部は、総和算出部で算出された総和の符号に基づいて透かしデータを復号する。
<具体例に基づく説明>
以下、本発明の実施形態8について、具体的な例を使って詳細に説明する。
(重畳オーディオデータ取得)
実施形態8の重畳オーディオデータ取得は、一例として、実施形態5で生成された重畳オーディオデータw(t)を取得するものとすると、
第i周期の前半周期:
w(t)=v(t)+{{(−1)・S−V1i}/U}・u(t)
第i周期の後半周期:
w(t)=v(t)+{{−(−1)・S−V2i}/U}・u(t)
となる。記号の意味は実施形態5と同様であるとする(以下同じ)。
(総和算出)
実施形態5で説明したように、第i期の前半周期、後半周期にわたる重畳オーディオデータの総和は、
第i周期の前半周期:Σw(t)=V1i+a1i・U
=+S (b=0)
=−S (b=1)
第i周期の後半周期:Σw(t)=V2i+a2i・U
=−S (b=0)
=+S (b=1)
となる。
(透かしデータ復号)
上式のように透かしデータの各ビット値の違いは重畳オーディオデータの総和の符号の違いとなって現れているので、前半周期ごと、あるいは後半周期ごとに総和を求め、その符号で透かしデータの各ビットの0/1を判定し、復号することができる。
(透かしデータ検出過程)
この透かしデータ検出過程をブロック図で表したものを図27に示す。図中で透かしデータの入った重畳オーディオデータの各サンプル値が透かし生成用データ半周期分ずつ(前半周期ごと、あるいは後半周期ごとに)B01に入り、そこで半周期分の総和が計算され、その符号がB02に出力される。B02ではその符号に応じて0または1が選択され、透かしデータとして出力される。
(その他)
実施形態1の(その他)と同様なので説明を省略する。
<処理の流れ>
図28に示すのは、実施形態8の処理の流れである。
まず、重畳オーディオデータ取得部は、透かし生成用データとオーディオデータの重畳オーディオデータを取得する(ステップS2801)。
次に、総和算出部は、ステップS2801で取得した重畳オーディオデータを、透かし生成用データの半周期の時間にわたって(前半周期ごとあるいは後半周期ごとに)総和した値の符号を算出する(ステップS2802)。
次に、透かしデータ復号部は、ステップS2802で算出された総和の符号からビット値を判定し、復号する(ステップS2803)。
<実施形態8の効果の簡単な説明>
実施形態8に記載の発明では、透かし生成用データの半周期の時間にわたる重畳オーディオデータの総和の符号のみで透かしデータの各ビットの0/1を判定できるため、透かしデータの検出/復号が容易である。また、上記所定総和の絶対値は常にゼロと異なる一定の値をとるので、オーディオデータの変形に対して耐久性のある頑丈電子透かしを実現できる。
<<実施形態9>>
<実施形態9の概念>
実施形態9に記載の発明は、重畳オーディオデータの、透かし生成用データ前半周期の時間にわたる総和と後半周期の時間にわたる総和の差の符号に基づいて透かしデータを復号する請求項7に記載のオーディオ電子透かし復号装置に関する。
<構成の説明>
<構成要件の明示>
図29に示すように、実施形態9のオーディオ電子透かし復号装置2900は、重畳オーディオデータ取得部2901と、総和算出部2902と、透かしデータ復号部2903と、からなる。
<構成の説明>
<基本機能ブロック図の導入>
(構成要件:重畳オーディオデータ取得部)
重畳オーディオデータ取得部は、重畳オーディオデータを取得する。
(構成要件:総和算出部)
総和算出部は、重畳オーディオデータ取得部で取得した重畳オーディオデータの、透かし生成用データ前半周期の時間にわたる総和と後半周期の時間にわたる総和の差の符号を算出する。
(構成要件:透かしデータ復号部)
透かしデータ復号部は、上記総和算出部で算出された総和の差の符号に基づいて透かしデータを復号する。
<具体例に基づく説明>
以下、本発明の実施形態9について、具体的な例を使って詳細に説明する。
(重畳オーディオデータ取得)
実施形態9の重畳オーディオデータ取得は、一例として、実施形態6で生成された重畳オーディオデータw(t)を取得するものとすると、
第i周期の前半周期:
w(t)=v(t)+{{(−1)・S−V1i}/U}・u(t)
第i周期の後半周期:
w(t)=v(t)+{{−(−1)・S−V2i}/U}・u(t)
となる。記号の意味は実施形態6と同様であるとする(以下同じ)。
(総和算出)
実施形態6で説明したように、第i周期の前半周期、後半周期にわたる重畳オーディオデータの総和は、
第i周期の前半周期:Σw(t)=+S (b=0)
=−S (b=1)
第i周期の後半周期:Σw(t)=−S (b=0)
=+S (b=1)
となる。
(透かしデータ復号)
実施形態8で説明したように、透かしデータの各ビット値の違いは上式の符号の違いとなって現れている。
前半周期分の総和から後半周期分の総和を引くと
+2S (b=0)
−2S (b=1)
となるので、この符号でもビット値を判定できる。このようにするとDCオフセットがキャンセルされる。実施形態9ではこのようにしてDCオフセットの影響を受けないようにしている。
(透かしデータ検出過程)
この透かしデータ検出過程をブロック図で表したものを図30に示す。図中で透かしデータの入った重畳オーディオデータが透かし生成用データ半周期分ずつB01入り、そこで前半周期の総和と後半周期の総和の差分が計算され、その符号がB02に出力される。B02ではその符号に応じて0または1が選択され、透かしデータとして出力される。
(その他)
実施形態1の(その他)と同様なので説明を省略する。
<処理の流れ>
図31に示すのは、実施形態9の処理の流れである。
まず、重畳オーディオデータ取得部は、透かし生成用データとオーディオデータの重畳オーディオデータを取得する(ステップS3101)。
次に、総和算出部は、ステップS3101で取得した重畳オーディオデータの、透かし生成用データ前半周期の時間にわたる総和と後半周期の時間にわたる総和の差の符号を算出する(ステップS3102)。
次に、透かしデータ復号部は、ステップS3102で算出された値の符号が透かしデータのビット値を表すように透かしデータを復号する(ステップS3103)。
<実施形態9の効果の簡単な説明>
実施形態9に記載の発明では、重畳オーディオデータの、透かし生成用データ前半周期の時間にわたる総和と後半周期の時間にわたる総和の差の符号で透かしデータの各ビットの0/1を判定しているため、DCオフセットがかかってもキャンセルされ、歪に対してより耐久性のある電子透かしを実現できる。
本発明によると、人間の耳では聞き取れない低周波数の音を透かし生成用データとして用いているので、元のオーディオデータの音質を劣化させることなく透かし生成用データの振幅を任意に大きくすることができ、透かし強度を上げることができる。
また、透かし生成用データの1波長で1ビットが符号化されるので、透かし生成用データが長波長であるにもかかわらず、効率よく多くの透かしデータを埋め込むことができる。
また、透かし生成用データそのものではなく、それと元のオーディオデータと重畳して出来る重畳オーディオデータの所定周期ごとの所定総和の結果の符号が透かしデータのビット値に対応しているので、容易に透かしデータを検出/復号することができる。
また、この透かしデータの埋め込み過程は可逆であり、透かしデータの埋め込み時に使用された透かし生成用データの振幅の時系列データがあれば完全に元に戻すことができる。さらに、ある人が透かしデータを埋め込んだあと、別の人が別の透かしデータを埋め込んでも、それぞれの過程で使用された透かし生成用データの振幅の時系列データがあれば、それぞれの透かしデータを取り出し、且つ、元のオーディオデータに戻すことができる。このように、何重にでも埋め込むことができるので、例えば著作権者が著作権情報を埋め込んだ後、その著作権を保護した状態でコンテンツ配信業者が不正な二次配信を防止する目的で独自のIDを埋め込むといったようなことも可能となる。
また、逆にその半周期ごとの透かしデータの振幅の時系列データがないと元のオーディオデータを復元することは原理的に不可能なので、最初に透かしデータを埋め込んだときの上記時系列データをもっている者以外は元のオーディオデータを復元できず、このことを利用して改ざんに対し抑止力のあるシステムを構築することも可能である。

Claims (18)

  1. 音声記録媒体に透かしデータを記録するためのオーディオ電子透かし装置であって、
    オーディオデータを取得するオーディオデータ取得部と、
    透かしデータを取得する透かしデータ取得部と、
    前記オーディオデータ取得部で取得したオーディオデータと重畳して重畳オーディオデータとすることで所定周期ごとの重畳オーディオデータの所定総和の結果が前記透かしデータ取得部で取得した透かしデータを表す透かし生成用データを生成する透かし生成用データ生成部と、
    前記オーディオデータ取得部で取得したオーディオデータと、前記透かし生成用データ生成部で生成した透かし生成用データとを重畳して重畳オーディオデータを生成する重畳オーディオデータ生成部と、
    を有するオーディオ電子透かし装置。
  2. 前記透かし生成用データ生成部は、人間の耳で聞きとれない低周波の透かし生成用データを生成する請求項1に記載のオーディオ電子透かし装置。
  3. 前記透かし生成用データ生成部は、それによって生成される透かし生成用データの表す関数の振幅の変化する境界における値と傾きが常にゼロである前記透かし生成用データを生成する請求項1又は2に記載のオーディオ電子透かし装置。
  4. 前記透かし生成用データ生成部は、前記所定周期ごとの前記所定総和の結果が前記透かしデータ取得部で取得した透かしデータを表すように、前記透かし生成用データの表す関数の振幅を半周期ごとに適応的に変化させる請求項1から3のいずれか一に記載のオーディオ電子透かし装置。
  5. 前記所定周期ごとの前記所定総和の結果は、前記透かし生成用データの半周期ごとの前記重畳オーディオデータの総和の符号である請求項1から4のいずれか一に記載のオーディオ電子透かし装置。
  6. 前記所定周期ごとの前記所定総和の結果は、前記透かし生成用データの前半周期と後半周期に対応する前記重畳オーディオデータの総和の差分の符号である請求項1から4のいずれか一に記載のオーディオ電子透かし装置。
  7. 音声記録媒体に記録された透かしデータを復号するためのオーディオ電子透かし復号装置であって、
    重畳オーディオデータを取得する重畳オーディオデータ取得部と、
    重畳オーディオデータ取得部で取得した重畳オーディオデータの前記所定周期ごとの所定総和の結果を算出する総和算出部と、
    前記総和算出部で算出された前記所定総和の結果に基づいて前記透かしデータを復号する透かしデータ復号部と、
    を有するオーディオ電子透かし復号装置。
  8. 前記総和算出部は、前記重畳オーディオデータ取得部で取得した重畳オーディオデータの、前記透かし生成用データの半周期の時間にわたる総和の符号を算出する請求項7に記載のオーディオ電子透かし復号装置。
  9. 前記総和算出部は、前記重畳オーディオデータ取得部で取得した重畳オーディオデータの、前記透かし生成用データの1周期の前半の半周期の時間にわたる総和と後半の半周期の時間にわたる総和の差の符号を算出する請求項7に記載のオーディオ電子透かし復号装置。
  10. 音声記録媒体に透かしデータを記録するためのオーディオ電子透かし記録方法であって、
    オーディオデータを取得するオーディオデータ取得ステップと、
    透かしデータを取得する透かしデータ取得ステップと、
    前記オーディオデータ取得ステップで取得したオーディオデータと重畳して重畳オーディオデータとすることで所定周期ごとの重畳オーディオデータの所定総和の結果が前記透かしデータ取得ステップで取得した透かしデータを表す透かし生成用データを生成する透かし生成用データ生成ステップと、
    前記オーディオデータ取得ステップで取得したオーディオデータと、前記透かし生成用データ生成ステップで生成した透かし生成用データとを重畳して重畳オーディオデータを生成する重畳オーディオデータ生成ステップと、
    を有するオーディオ電子透かし記録方法。
  11. 前記透かし生成用データ生成ステップは、人間の耳で聞きとれない低周波の透かし生成用データを生成する請求項10に記載のオーディオ電子透かし記録方法。
  12. 前記透かし生成用データ生成ステップは、それによって生成される透かし生成用データの表す関数の振幅の変化する境界における値と傾きが常にゼロである前記透かし生成用データを生成する請求項10又は11に記載のオーディオ電子透かし記録方法。
  13. 前記透かし生成用データ生成ステップは、前記所定周期ごとの前記所定総和の結果が前記透かしデータ取得ステップで取得した透かしデータを表すように、前記透かし生成用データの表す関数の振幅を半周期ごとに適応的に変化させる請求項10から12のいずれか一に記載のオーディオ電子透かし記録方法。
  14. 前記所定周期ごとの前記所定総和の結果は、前記透かし生成用データの半周期ごとの前記重畳オーディオデータの総和の符号である請求項10から13のいずれか一に記載のオーディオ電子透かし記録方法。
  15. 前記所定周期ごとの前記所定総和の結果は、前記透かし生成用データの前半周期と後半周期に対応する前記重畳オーディオデータの総和の差分の符号である請求項10から13のいずれか一に記載のオーディオ電子透かし記録方法。
  16. 音声記録媒体に記録された透かしデータを復号するためのオーディオ電子透かし復号方法であって、
    重畳オーディオデータを取得する重畳オーディオデータ取得ステップと、
    重畳オーディオデータ取得ステップで取得した重畳オーディオデータの前記所定周期ごとの所定総和の結果を算出する総和算出ステップと、
    前記総和算出ステップで算出された所定総和の結果に基づいて前記透かしデータを復号する透かしデータ復号ステップと、
    を有するオーディオ電子透かし復号方法。
  17. 前記総和算出ステップは、前記重畳オーディオデータ取得ステップで取得した重畳オーディオデータの、前記透かし生成用データの半周期の時間にわたる総和の符号を算出する請求項16に記載のオーディオ電子透かし復号方法。
  18. 前記総和算出ステップは、前記重畳オーディオデータ取得ステップで取得した重畳オーディオデータの、前記透かし生成用データの1周期の前半の半周期の時間にわたる総和と後半の半周期の時間にわたる総和の差の符号を算出する請求項16に記載のオーディオ電子透かし復号方法。
JP2004571864A 2003-05-16 2003-05-16 オーディオ電子透かし装置 Pending JPWO2004102528A1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2003/006114 WO2004102528A1 (ja) 2003-05-16 2003-05-16 オーディオ電子透かし装置

Publications (1)

Publication Number Publication Date
JPWO2004102528A1 true JPWO2004102528A1 (ja) 2006-07-13

Family

ID=33446551

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004571864A Pending JPWO2004102528A1 (ja) 2003-05-16 2003-05-16 オーディオ電子透かし装置

Country Status (5)

Country Link
US (1) US20060052887A1 (ja)
JP (1) JPWO2004102528A1 (ja)
AU (1) AU2003231518A1 (ja)
FI (1) FI20050021A (ja)
WO (1) WO2004102528A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4197307B2 (ja) * 2004-03-30 2008-12-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 電子透かし検出装置、その検出方法及びプログラム
GB2409956B (en) * 2004-09-01 2005-12-07 Ace Records Ltd Audio watermarking
JP4770194B2 (ja) * 2005-02-18 2011-09-14 大日本印刷株式会社 音響信号に対する情報の埋め込み装置および方法
JP4713180B2 (ja) * 2005-02-25 2011-06-29 大日本印刷株式会社 音響信号からの情報の抽出装置
CN103137134B (zh) * 2011-11-28 2015-03-11 鸿富锦精密工业(深圳)有限公司 音频设备及音频信号的水印信息加载方法
US11244692B2 (en) * 2018-10-04 2022-02-08 Digital Voice Systems, Inc. Audio watermarking via correlation modification using an amplitude and a magnitude modification based on watermark data and to reduce distortion
CN112153482B (zh) * 2020-09-16 2022-02-22 山东科技大学 一种音视频匹配零水印生成方法及音视频防篡改检测方法
DE102024001192A1 (de) 2024-04-13 2024-06-06 Mercedes-Benz Group AG Computerimplementiertes Verfahren zum Markieren von Daten mit einem digitalen Wasserzeichen, Computerprogrammprodukt und Recheneinheit

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001188549A (ja) * 1999-12-29 2001-07-10 Sony Corp 情報処理装置及びその方法並びにプログラム格納媒体
JP3623936B2 (ja) * 2001-11-28 2005-02-23 株式会社シーフォーテクノロジー 音声情報に透かし情報を埋め込む方法及び透かし情報を埋め込んだ音声情報から透かし情報を検出する方法

Also Published As

Publication number Publication date
FI20050021A (fi) 2005-01-10
AU2003231518A1 (en) 2004-12-03
US20060052887A1 (en) 2006-03-09
WO2004102528A1 (ja) 2004-11-25

Similar Documents

Publication Publication Date Title
KR101271825B1 (ko) 디지털 워터마크를 유용 신호에 임베딩하는 방법
Wu et al. Robust and efficient digital audio watermarking using audio content analysis
KR100492021B1 (ko) 전자무늬의 매립 방법과 매립 장치, 추출 방법과 추출 장치, 및 컴퓨터 판독 가능한 기록매체
Kirovski et al. Spread-spectrum watermarking of audio signals
Yeo et al. Modified patchwork algorithm: A novel audio watermarking scheme
JP2008529046A5 (ja)
US20040059581A1 (en) Audio watermarking with dual watermarks
JPWO2004102528A1 (ja) オーディオ電子透かし装置
Kirovski et al. Audio watermark robustness to desynchronization via beat detection
Singh et al. Enhancement of LSB based steganography for hiding image in audio
EP3391372B1 (en) Improved method, apparatus and system for embedding data within a data stream
Cichowski et al. Analysis of impact of audio modifications on the robustness of watermark for non-blind architecture
Loytynoja et al. Audio protection with removable watermarking
Kaabneh et al. Muteness-based audio watermarking technique
Erçelebi et al. Robust multi bit and high quality audio watermarking using pseudo-random sequences
Aboelezz Watermarking audio files with copyrights
Kirbiz et al. Decode-time forensic watermarking of AAC bitstreams
JP5486839B2 (ja) 小型検出窓を利用した電子透かし埋め込み検出方法
Steinebach et al. Evaluation of robustness and transparency of multiple audio watermark embedding
De Li et al. Research on Copyright Protection Technology Based on MIDI Music Structural Features
Salah et al. Survey of imperceptible and robust digital audio watermarking systems
Lai et al. Android Audio Recorder Mobile Application with Digital Watermarking
WO2006030498A1 (ja) 電子透かしシステム
Ghorbani et al. Audio content security: attack analysis on audio watermarking
Gurijala et al. Digital Watermarking Techniques for Audio and Speech Signals