JP4310145B2 - オーディオデータの透かし情報埋め込み方法、埋め込みプログラム及び検出方法 - Google Patents

オーディオデータの透かし情報埋め込み方法、埋め込みプログラム及び検出方法 Download PDF

Info

Publication number
JP4310145B2
JP4310145B2 JP2003203210A JP2003203210A JP4310145B2 JP 4310145 B2 JP4310145 B2 JP 4310145B2 JP 2003203210 A JP2003203210 A JP 2003203210A JP 2003203210 A JP2003203210 A JP 2003203210A JP 4310145 B2 JP4310145 B2 JP 4310145B2
Authority
JP
Japan
Prior art keywords
frequency
watermark
frequency spectrum
audio data
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003203210A
Other languages
English (en)
Other versions
JP2005049409A (ja
Inventor
薫 荒川
厳 村松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MEIJI UNIVERSITY LEGAL PERSON
Original Assignee
MEIJI UNIVERSITY LEGAL PERSON
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MEIJI UNIVERSITY LEGAL PERSON filed Critical MEIJI UNIVERSITY LEGAL PERSON
Priority to JP2003203210A priority Critical patent/JP4310145B2/ja
Publication of JP2005049409A publication Critical patent/JP2005049409A/ja
Application granted granted Critical
Publication of JP4310145B2 publication Critical patent/JP4310145B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、オーディオデータに対して著作権情報等の透かし情報を埋め込むオーディオデータの透かし情報埋め込み方法、埋め込みプログラム及び検出方法に関する。
【0002】
【従来の技術】
ディジタル・オーディオデータのようなディジタル・コンテンツの違法コピーを防止するため、従来より、ディジタル・コンテンツに、著作者情報、購入者情報、コンテンツ情報等を含む透かし情報を埋め込み、違法コピーの流出経路の追跡を可能にすることがなされている。この種の目的で用いられる透かし情報は、▲1▼コンテンツに直接埋め込まれること、▲2▼埋め込み後もコンテンツを劣化させないこと(音質)、▲3▼編集、加工、圧縮処理後も残ること(耐性)が必要とされている。
【0003】
オーディオデータへの透かし情報の埋め込み方式としては、良く知られた方式としては、スペクトル拡散法、位相操作法等が挙げられる。スペクトル拡散法は、ディジタル・コンテンツをPN(Pseudo-random Noise)系列と呼ばれる雑音信号を用いて変調する方式である。この方式では、振幅スペクトル全体に透かし信号を拡散して埋め込むが、透かし信号は本来ノイズ成分であるから音質が劣化する。また、位相スペクトルに透かし情報を埋め込む位相スペクトル法も、残響音(エコー)が発生するという問題がある。更に、これらの方式では、フィルタ処理に弱いという問題もある。
【0004】
一方、大きな振幅の前後の周波数成分が人間の耳に検知し難いという、いわゆる聴覚マスキング効果を利用して透かし情報を埋め込もうとする試みもなされている(特許文献1)。この方式では、オーディオ信号をフレームに分割し、各フレームでの周波数変換で得られた周波数スペクトルの分布から、各周波数の差異が検知できない変更範囲を決定し、付加情報埋め込み用のマスクを生成する。そして、このマスクを用いて付加情報(透かし情報)を埋め込み、時系列データに逆変換する。
【0005】
また、オーディオ信号の可聴周波数帯域を分析し、可聴限界を聴覚心理パラメータとして算出し、この聴覚心理パラメータに基づいて、オーディオ信号中の人間の耳には聞こえない音の周波数帯域に透かし情報を挿入する方式も知られている(特許文献2)。透かし情報が挿入されたオーディオ信号は、聴覚心理パラメータに基づいて復号され、オーディオ信号と透かし情報とを抽出する。ここで、可聴限界の音としては、人間の可聴周波数帯域を超えた低周波数帯域や高周波数帯域の音の他、前述したようなマスキング効果による聞き取りにくい音などが例示されている。
【0006】
【特許文献1】
特開2000−172282、第7〜9頁、段落0018〜0023
【特許文献2】
特開2001−94434、第3頁、段落0013
【0007】
【発明が解決しようとする課題】
しかしながら、上述した従来の透かし情報埋め込み方式のうち、前者は、周波数分布に基づいて人間の可聴帯域特性から各周波数成分毎に最大の変更範囲を決定したり、マスクをフレーム毎に作成する必要があり、処理が複雑でリアルタイムでの処理が難しく、また、マスクが適切で無いとフレーム間での連続性が崩れてコンテンツが劣化し易いという問題がある。また、後者の場合、符号化過程において、聴覚特性上知覚しにくい周波数帯域を決定し、その周波数帯域のデータを別の情報に置き換えて符号化し、これを復号する際には、別の情報を先に抽出してからオーディオ信号を復号するので、コンテンツの劣化は少ないものの、フィルタリング等の攻撃に対する耐性が無いと言う問題がある。
【0008】
この発明は、このような問題点に鑑みなされたもので、極めて簡単な処理で、コンテンツの劣化がなく、しかも耐性に優れたオーディオデータの透かし情報埋め込み方法、埋め込みプログラム及び検出方法を提供することを目的とする。
【0009】
【課題を解決するための手段】
この発明に係るオーディオデータの透かし情報埋め込み方法は、オーディオデータを所定の長さのセグメントに分割するステップと、このステップで分割された各セグメントの少なくとも一部のサンプルデータに対して直交変換を施して周波数スペクトルを求めるステップと、このステップで求められた周波数スペクトルから特徴的な周波数成分を選出するステップと、このステップで求められた周波数スペクトルの特徴的な周波数成分に対してオクターブ隔てた周波数成分を透かしビットの値に応じて前記周波数スペクトルから消去することにより前記周波数スペクトルに前記透かしビットを埋め込むステップと、このステップで前記透かしビットが埋め込まれた周波数スペクトルに対して直交逆変換を施して前記透かしビットが埋め込まれたサンプルデータを生成するステップと、このステップで生成されたサンプルデータをセグメントの状態で結合して前記透かしビットが埋め込まれたオーディオデータを生成するステップとを備えたことを特徴とする。
【0010】
また、この発明に係るオーディオデータの透かし情報埋め込みプログラムは、上述した各ステップをコンピュータに実行させるものであることを特徴とする。
【0011】
また、この発明に係るオーディオデータの透かし情報検出方法は、上述した透かし情報埋め込み方法により透かしビットが埋め込まれたオーディオデータを所定の長さのセグメントに分割するステップと、このステップで分割された各セグメントの少なくとも一部のサンプルデータに対して直交変換を施して周波数スペクトルを求めるステップと、このステップで求められた周波数スペクトルから特徴的な周波数成分を選出するステップと、このステップで求められた周波数スペクトルの特徴的な周波数成分に対してオクターブ隔てた周波数成分を評価して透かしビットを抽出するステップとを備えたことを特徴とする。
【0012】
即ち、一般に人間の聴覚構造は、周波数が高くなるに従い、主観的な音も同様に高くなる音色的な高さに加え、周波数が2:1の関係にある音(オクターブ)が聴覚上同類のものとして知覚される、調性的な高さ(tone chroma)を判別する構造を持つ。従来法による透かし情報を特定の周波数成分に埋め込む方式や、スペクトル拡散を用いた方式では、信号内の特徴とは無関係に透かし情報を埋め込むため、埋め込み強度に比例して、音質が低下する。
【0013】
本発明によれば、オーディオデータを所定の長さでセグメントに分割して得られた各セグメントの少なくとも一部のサンプルデータの周波数スペクトルから特徴的な周波数成分を選出し、この特徴的な周波数成分に対してオクターブ隔てた周波数成分を透かしビットの値に応じて前記周波数スペクトルから消去することにより透かしビットを埋め込むようにしている。このため、透かしビットとして周波数スペクトルから消去された周波数成分は、基準音によって覆われることにより、埋め込み後の音質劣化の低下が極めて少なく、しかも特定の周波数成分を消去することにより透かしビットが埋め込まれるため、フィルタ等の攻撃に対しても高い耐性が得られるという効果がある。
【0014】
【発明の実施の形態】
以下、図面を参照して、この発明の実施の形態について説明する。
図1は、本発明の一実施形態に係るオーディオデータの透かし情報埋め込み処理のフローチャート、図2は、同処理を説明するための図である。この処理は、図示のフローチャートの各ステップを実行するプログラムをコンピュータで実行することにより実現される。
【0015】
まず、透かし情報が埋め込まれる前のオーディオデータ(原信号)をセグメント分割する(S1)。即ち、図2(a)に示すように、対象となる原信号x(n)をLサンプル毎にセグメントに分けたものをxi(n)とする。次に、各セグメントxi(n),xi+1(n),…の例えば先頭のL´(但し、L≧L´)サンプルのデータxi(n´)(図2(b)参照)に対し、DFT(離散フーリエ変換)を施す(S2)。これにより周波数スペクトルの振幅成分(振幅スペクトル)が図2(c)のXi(k)のように得られる。なお、周波数スペクトルは、振幅スペクトルXi(k)と位相スペクトルθi(k)を用いて、Xi(k)exp[jθi(k)}と表わされる。ここにjは虚数である。この振幅スペクトルXi(k)の特定の周波数区間(a≦k≦b)で特徴的な周波数成分、例えば図2(c)で示す最大値Xi(k0)に対応する周波数k0を選出する(S3)。次に、透かしビットの値m(i)に応じてk0/2又は2・k0の周波数成分を範囲rにわたり消去する(S4)。例えば、図2(d)に示すように、
【0016】
▲1▼m(i)=0のとき、
0/2−r/2≦k≦k0/2+r/2
の範囲のXi(k)=0とし、
▲2▼m(i)=1のとき、
2・k0−r/2≦k≦2・k0+r/2
の範囲のXi(k)=0とする。
【0017】
このようにして透かしビットが埋め込まれた新たな振幅スペクトルXi´(k)に元の位相スペクトルを合わせて新たな周波数スペクトルとし、これに対して、図2(e)に示すように、IDFT(逆離散フーリエ変換)を施し、L´サンプルのデータxi´(n´)を求める(S5)。以上のステップS2〜S5をセグメント毎に繰り返し実行する。そして、最後に、図2(f)に示すように、得られたデータxi´(n´),xi+1´(n´),…を元の位置に組み込んだLサンプルのセグメントxi´(n),xi+1´(n),…を結合して透かし情報が埋め込まれたオーディオデータx´(n)(透かし入り信号)が求められる。
【0018】
なお、以上の処理において、セグメントサイズL、DFTサイズL´、特徴的周波数の選出範囲(a,b)及びk0/2又は2・k0の周波数成分を消去する範囲rは、鍵情報とすることができる。そして、透かし情報を検出する際には、この鍵情報に基づいて、例えば図3に示すような透かし情報検出処理を実行する。鍵情報は、どれか1つでも欠ければ、透かし情報を検出することができないものとなっている。
まず、透かし情報セグメントサイズL毎に分割し(S11)、先頭のL´サンプルのデータに対してDFTを行う(S12)。次に、周波数区間(a≦k≦b)で振幅スペクトルが最大値を示す周波数k0を選出する(S13)。そして、Xi(2・k0)とXi(k0/2)とを比較して、前者が後者に比べて大きい場合には、透かしビットの値m(i)=0、前者が後者に比べて小さい場合には、透かしビットの値m(i)=1と決定する(S14)。これにより、極めて簡単に透かし情報の抽出が可能になる。
【0019】
このように、本実施形態による透かし情報埋め込み方法及び検出方法は、音信号の振幅スペクトルの特定の周波数成分を範囲rに亘って除去する方式であるため、フィルタリング等の外乱に対し強い。また、除去する周波数も、特徴的な周波数成分に対してオクターブの関係にあるため、除去された成分は、基準音に覆われて劣化が殆ど目立たない。
【0020】
図4は、本発明の他の実施形態に係る透かし情報埋め込み方法を説明するためのフローチャートである。
セグメント分割(S1)、DFT(S2)及び特徴的な周波数k0の選出(S3)までの処理と、最後のセグメント結合(S6)は、先の実施形態と同様であるため説明は割愛する。
この実施形態では、振幅スペクトルXi(k)の特定の周波数区間(a≦k≦b)で特徴的な周波数k0を選出したのち、次の▲1▼▲2▼の処理を並列的に実行する。
▲1▼k0/2の周波数成分を範囲rにわたり消去した振幅スペクトルを作成するステップ(S21)及びそれに対応する周波数スペクトルをIDFTするステップ(S22)、
▲2▼2・k0の周波数成分を範囲rにわたり消去した振幅スペクトルを作成するステップ(S23)及びそれをIDFTするステップ(S24)。
そして、透かしビットm(i)=0のときには、▲1▼のステップS22でIDFTされたL´サンプルのデータxi´(n´)を選択し、透かしビットm(i)=1のときには、▲2▼のステップS24でIDFTされたL´サンプルのデータxi´(n´)を選択する(S25)。これにより、選択されたサンプルのデータを用いてセグメント結合を行い(S6)、透かし入り信号を生成する。
【0021】
この実施形態によれば、セグメント毎に特徴的な周波数と1/2倍及び2倍の関係(オクターブの関係)にある周波数成分を除去してIDFT処理を施した情報を予め準備しておき、透かしビットが与えられたときに、いずれか一方を選択するようにしているので、透かしビットが決定された後に、周波数成分を操作する方式に比べて高速処理が可能になるという利点がある。
【0022】
なお、以上の実施形態では、直交変換処理としてDFT、直交逆変換としてIDFTを例示したが、離散コサイン変換等、他の直交変換方式を用いても良いことは言うまでも無い。
また、周波数k0に加えて、振幅スペクトルの区間(a,b)における第2ピーク、第3ピークの周波数k1,k2を求め、これら周波数k1,k2を基準にしてオクターブの関係にある周波数成分を同様に操作することで、攻撃に対する耐性を更に向上させることができる。
【0023】
【発明の効果】
以上述べたように、この発明によれば、オーディオデータを所定の長さでセグメントに分割して得られた各セグメントの少なくとも一部のサンプルデータの周波数スペクトルから特徴的な周波数成分を選出し、この特徴的な周波数成分に対してオクターブ隔てた周波数成分を透かしビットの値に応じて前記周波数スペクトルから消去することにより透かしビットを埋め込むようにしているので、透かしビットとして周波数スペクトルから消去された周波数成分は、基準音によって覆われることにより、埋め込み後の音質劣化の低下が極めて少なく、しかも特定の周波数成分を消去することにより透かしビットが埋め込まれるため、フィルタ等の攻撃に対しても高い耐性が得られるという効果を奏する。
【図面の簡単な説明】
【図1】 本発明の一実施形態に係る透かし情報埋め込み処理のフローチャートである。
【図2】 同処理の各ステップにおけるデータを模式的に示す図である。
【図3】 本発明の一実施形態に係る透かし情報検出処理を示すフローチャートである。
【図4】 本発明の他の実施形態に係る透かし情報埋め込み処理のフローチャートである。

Claims (5)

  1. オーディオデータを所定の長さのセグメントに分割するステップと、
    このステップで分割された各セグメントの少なくとも一部のサンプルデータに対して直交変換を施して周波数スペクトルを求めるステップと、
    このステップで求められた周波数スペクトルから特徴的な周波数成分を選出するステップと、
    このステップで求められた周波数スペクトルの特徴的な周波数成分に対してオクターブ隔てた周波数成分を透かしビットの値に応じて前記周波数スペクトルから消去することにより前記周波数スペクトルに前記透かしビットを埋め込むステップと、
    このステップで前記透かしビットが埋め込まれた周波数スペクトルに対して直交逆変換を施して前記透かしビットが埋め込まれたサンプルデータを生成するステップと、
    このステップで生成されたサンプルデータをセグメントの状態で結合して前記透かしビットが埋め込まれたオーディオデータを生成するステップと
    を備えたことを特徴とするオーディオデータの透かし情報埋め込み方法。
  2. 前記周波数スペクトルから特徴的な周波数成分を選出するステップは、前記周波数スペクトルの特定の周波数範囲から前記特徴的な周波数成分を選出するステップであることを特徴とする請求項1記載のオーディオデータの透かし情報埋め込み方法。
  3. 前記周波数スペクトルに透かしビットを埋め込むステップは、前記特徴的な周波数成分に対応する周波数の2倍の周波数における周波数成分と1/倍の周波数における周波数成分のいずれか一方を前記透かしビットの値に応じて消去するステップであることを特徴とする請求項1記載のオーディオデータの透かし情報埋め込み方法。
  4. 請求項1記載の透かし情報埋め込み方法により透かしビットが埋め込まれたオーディオデータを所定の長さのセグメントに分割するステップと、
    このステップで分割された各セグメントの少なくとも一部のサンプルデータに対して直交変換を施して周波数スペクトルを求めるステップと、
    このステップで求められた周波数スペクトルから特徴的な周波数成分を選出するステップと、
    このステップで求められた周波数スペクトルの特徴的な周波数成分に対してオクターブ隔てた周波数成分を評価して透かしビットを抽出するステップと
    を備えたことを特徴とするオーディオデータの透かし情報検出方法。
  5. オーディオデータを所定の長さのセグメントに分割するステップと、
    このステップで分割された各セグメントの少なくとも一部のサンプルデータに対して直交変換を施して周波数スペクトルを求めるステップと、
    このステップで求められた周波数スペクトルから特徴的な周波数成分を選出するステップと、
    このステップで求められた周波数スペクトルの特徴的な周波数成分に対してオクターブ隔てた周波数成分を透かしビットの値に応じて前記周波数スペクトルから消去することにより前記周波数スペクトルに前記透かしビットを埋め込むステップと、
    このステップで前記透かしビットが埋め込まれた周波数スペクトルに対して直交逆変換を施して前記透かしビットが埋め込まれたサンプルデータを生成するステップと、
    このステップで生成されたサンプルデータをセグメントの状態で結合して前記透かしビットが埋め込まれたオーディオデータを生成するステップと
    をコンピュータに実行させることを特徴とするオーディオデータの透かし情報埋め込みプログラム。
JP2003203210A 2003-07-29 2003-07-29 オーディオデータの透かし情報埋め込み方法、埋め込みプログラム及び検出方法 Expired - Fee Related JP4310145B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003203210A JP4310145B2 (ja) 2003-07-29 2003-07-29 オーディオデータの透かし情報埋め込み方法、埋め込みプログラム及び検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003203210A JP4310145B2 (ja) 2003-07-29 2003-07-29 オーディオデータの透かし情報埋め込み方法、埋め込みプログラム及び検出方法

Publications (2)

Publication Number Publication Date
JP2005049409A JP2005049409A (ja) 2005-02-24
JP4310145B2 true JP4310145B2 (ja) 2009-08-05

Family

ID=34262663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003203210A Expired - Fee Related JP4310145B2 (ja) 2003-07-29 2003-07-29 オーディオデータの透かし情報埋め込み方法、埋め込みプログラム及び検出方法

Country Status (1)

Country Link
JP (1) JP4310145B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602005008185D1 (de) * 2005-01-21 2008-08-28 Unltd Media Gmbh Verfahren zur Einbettung eines digitalen Wasserzeichens in ein Nutzsignal
JP4702042B2 (ja) * 2005-12-26 2011-06-15 株式会社ケンウッド 電子透かしエンコード装置、電子透かしデコード装置、電子透かしエンコード方法、電子透かしデコード方法及びプログラム
JP4736794B2 (ja) * 2005-12-26 2011-07-27 株式会社ケンウッド 電子透かしエンコード装置、電子透かしデコード装置、電子透かしエンコード方法、電子透かしデコード方法及びプログラム
JP4702043B2 (ja) * 2005-12-26 2011-06-15 株式会社ケンウッド 電子透かしエンコード装置、電子透かしデコード装置、電子透かしエンコード方法、電子透かしデコード方法及びプログラム
ITMI20061405A1 (it) * 2006-07-19 2008-01-20 Technicolor S P A Tecnica di marcatura con filigrana digitale audio per presentazioni
KR101201076B1 (ko) 2009-08-06 2012-11-20 울산대학교 산학협력단 오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법
CN103548079B (zh) 2011-08-03 2015-09-30 Nds有限公司 音频水印

Also Published As

Publication number Publication date
JP2005049409A (ja) 2005-02-24

Similar Documents

Publication Publication Date Title
Kirovski et al. Spread-spectrum watermarking of audio signals
US6952774B1 (en) Audio watermarking with dual watermarks
EP1814105B1 (en) Audio processing
US7206649B2 (en) Audio watermarking with dual watermarks
Bhat K et al. An audio watermarking scheme using singular value decomposition and dither-modulation quantization
Xiang et al. Histogram-based audio watermarking against time-scale modification and cropping attacks
Kirovski et al. Robust covert communication over a public audio channel using spread spectrum
US8032361B2 (en) Audio processing apparatus and method for processing two sampled audio signals to detect a temporal position
JP2001119555A (ja) 時系列化された一次元のデータにおける電子透かし
Kirovski et al. Spread-spectrum audio watermarking: requirements, applications, and limitations
JP4310145B2 (ja) オーディオデータの透かし情報埋め込み方法、埋め込みプログラム及び検出方法
US20080273707A1 (en) Audio Processing
Kirovski et al. Audio watermark robustness to desynchronization via beat detection
KR100355033B1 (ko) 선형예측 분석을 이용한 워터마크 삽입/추출 장치 및 그방법
Petrovic et al. Data hiding within audio signals
Zong et al. Non-linear-echo based anti-collusion mechanism for audio signals
JP5879075B2 (ja) 電子透かし検出装置及び電子透かし検出方法
WO2014199449A1 (ja) 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム
JP2002244685A (ja) 電子透かしの埋め込みおよび検出
Singh et al. Multiplicative watermarking of audio in DFT magnitude
JP2007047223A (ja) 音響信号に対する情報の埋め込み装置
KR100430566B1 (ko) 반향을 이용한 오디오 워터마킹에서의 반향 삽입 장치 및그 방법
Wang et al. Data hiding in digital audio by frequency domain dithering
KR20060112667A (ko) 워터마크 임베딩
Lin et al. Audio watermarking for copyright protection

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090402

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090428

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090511

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees