JP5103479B2 - メディアデータに電子透かしを付与する方法 - Google Patents

メディアデータに電子透かしを付与する方法 Download PDF

Info

Publication number
JP5103479B2
JP5103479B2 JP2009532655A JP2009532655A JP5103479B2 JP 5103479 B2 JP5103479 B2 JP 5103479B2 JP 2009532655 A JP2009532655 A JP 2009532655A JP 2009532655 A JP2009532655 A JP 2009532655A JP 5103479 B2 JP5103479 B2 JP 5103479B2
Authority
JP
Japan
Prior art keywords
group
value
energy
sections
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009532655A
Other languages
English (en)
Other versions
JP2010507109A (ja
Inventor
エリック ベスタガード、スティーブン
ツーイ、チェ−ワイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Destiny Software Productions Inc
Original Assignee
Destiny Software Productions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Destiny Software Productions Inc filed Critical Destiny Software Productions Inc
Publication of JP2010507109A publication Critical patent/JP2010507109A/ja
Application granted granted Critical
Publication of JP5103479B2 publication Critical patent/JP5103479B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/005Robust watermarking, e.g. average attack or collusion attack resistant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/0085Time domain based watermarking, e.g. watermarks spread over several images
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32203Spatial or amplitude domain methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32203Spatial or amplitude domain methods
    • H04N1/32208Spatial or amplitude domain methods involving changing the magnitude of selected pixels, e.g. overlay of information or super-imposition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32203Spatial or amplitude domain methods
    • H04N1/32229Spatial or amplitude domain methods with selective or adaptive application of the additional information, e.g. in selected regions of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0051Embedding of the watermark in the spatial domain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0052Embedding of the watermark in the frequency domain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0053Embedding of the watermark in the coding stream, possibly without decoding; Embedding of the watermark in the compressed domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3233Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of authentication information, e.g. digital signature, watermark
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3269Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs
    • H04N2201/327Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs which are undetectable to the naked eye, e.g. embedded codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/328Processing of the additional information
    • H04N2201/3284Processing of the additional information for error correction

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、メディアデータへの電子透かし(watermark)の付与に関する。本発明の特定の実施形態では、メディアデータへ電子透かしを埋め込むこと、メディアデータから電子透かしを抽出すること、またはその両方のための方法が提供される。
メディアデータ(例えば、メディアファイル、メディア信号またはその両方)への電子透かしの付与には、一般に、メディアデータへ情報を埋め込むことその他、付加すること(すなわち、メディアデータに「マークをつける」こと)が伴う。多くの用途では、メディアデータに埋め込まれた情報がメディアコンテンツを再生した場合の人間の認識を実質的に変更しないことが好適である。電子透かしは、一般に、暗号鍵、認証情報、所有権のインジケーション、ユーザIDのインジケーションなど、任意の情報を含む場合がある。
オーディオメディアデータの例では、電子透かし付与の処理は、通常、人間の音声認知では検出できない、オーディオコンテンツの再生におけるわずかな変化を利用する。電子透かしが音声データへ埋め込まれる場合、一般に、オーディオデータが再生されるとき、電子透かしを付与されたオーディオコンテンツの再生と電子透かしを付与されていない元のコンテンツの再生との間の差を人間が知覚することが困難であることが望ましい。
一般に、電子透かしは、埋め込まれると、その結果生じる電子透かし付きメディアデータの操作に比較的堅牢であることが望ましい。非限定的な例として、電子透かしは、電子透かし付きデータの圧縮、電子透かし付きデータに対するノイズの付加、電子透かし付きデータのD/AおよびA/D変換、電子透かし付きデータのリサンプリング、電子透かし付きデータのフィルタリング、電子透かし付きデータの量の変化、その他電子透かし付きデータの操作などの後に回復可能であることが望ましい。
また、一般に、電子透かしを付与されたメディアデータから、メディアコンテンツの再生品質を著しく低下させることなく電子透かしをフィルタリングすることその他、除去することは、比較的困難であることが望ましい。
電子透かしを付与する従来技術は、上述の所望の特性のうちの一部または全部について、広範な商業的な承認を得るのに充分なレベルには至っていない。
本発明の第1の態様では、サンプル領域に一連のデジタルサンプルを含むメディアデータへ電子透かし情報を符号化する方法を提供する。この方法は、サンプル領域において一連のデジタルサンプルを複数のセクションに分割することと、各セクションは対応する複数のサンプルを含むことと、各セクションにおける対応する複数のサンプルを処理し、各セクションに関連した1つのエネルギー値を取得することと、セクションをグループへグループ化することと、各グループは3つ以上のセクションを含むことと、ビット割当規則によって各グループに公称ビット値を割り当てることと、ビット割当規則はグループにおけるセクションのエネルギー値に基づくことと、各グループに電子透かしビット値を割り当てることと、各グループについて、電子透かしビット値を公称ビット値と比較し、電子透かし情報ビットの公称ビット値および電子透かしビット値が一致しない場合、ビット割当規則の再適用によってグループに電子透かしビット値が割り当てられるように、グルー
プに含まれる1つ以上の対応するセクションの1つ以上のエネルギー値を変更することと、からなる。
ビット割当規則によって各グループに公称ビット値を割り当てることは、分類規則によって各グループを複数のカテゴリのうちの1つへ分類することと、各カテゴリについて、カテゴリに関連したユニークなカテゴリビット割当規則によって各グループに公称ビット値0または公称ビット値1を割り当てることと、を含み得る。
本発明の別の態様では、サンプル領域に一連のデジタルサンプルを含むメディアデータから電子透かし情報を抽出する方法を提供する。この方法は、サンプル領域において一連のデジタルサンプルを複数のセクションに分割することと、各セクションは対応する複数のサンプルを含むことと、各セクションにおける対応する複数のサンプルを処理し、各セクションに関連した1つのエネルギー値を取得することと、セクションをグループへグループ化することと、各グループは3つ以上のセクションを含むことと、ビット割当規則によって各グループに公称ビット値を割り当てることと、ビット割当規則はグループにおけるセクションのエネルギー値に基づくことと、からなる。ビット割当規則によって各グループに公称ビット値を割り当てることは、分類規則によって各グループを複数のカテゴリのうちの1つへ分類することと、各カテゴリについて、カテゴリに関連したユニークなカテゴリビット割当規則によって各グループに公称ビット値0または公称ビット値1を割り当てることと、を含み得る。
本発明の他の態様および特定の実施形態の特徴については、より詳細に以下に記載する。
本発明により電子透かしを付与され得るデジタルオーディオデータの概略図。 本発明の特定の一実施形態による、メディアファイルへ電子透かしデータを埋め込むための方法を示す図。 どのようにして複数のサンプルを含むセクション/タイムスライスへメディアデータを分割するか、および、どのようにセクション/タイムスライスをグループ化するかを示す図。 本発明の特定の一実施形態によってグループGが分類され得る複数の形状カテゴリを示す図。 グループGの1つ以上のエネルギー値を変更して、ビット割当規則の再適用時にグループGへ割り当てられるビット値を変化させるために用いられ得る数々の方法の概略図。 グループGの1つ以上のエネルギー値を変更して、ビット割当規則の再適用時にグループGへ割り当てられるビット値を変化させるために用いられ得る数々の方法の概略図。 グループGの1つ以上のエネルギー値を変更して、ビット割当規則の再適用時にグループGへ割り当てられるビット値を変化させるために用いられ得る数々の方法の概略図。 本発明の特定の一実施形態による電子透かしを付与されたメディアデータから電子透かしを抽出する方法を示す図。 本発明によって電子透かしを付与され得るデジタル画像データの概略図。 本発明の特定の一実施形態によるエネルギー値変更のための方法の概略図。
本発明の特定の実施形態では、メディアデータサンプルの相対エネルギーの微小な変更
を伴う、メディアデータに電子透かしを付与する方法が提供される。本発明の電子透かし付与技術は、一般に、非限定的な例として、オーディオデータ、画像データおよび映像データを含む、様々な種類のメディアデータに適用され得る。本発明の特定の代表的な実施形態を示す目的のため、続いてオーディオデータに電子透かしを付与する方法について記載し、その後、他の種類のメディアデータへの電子透かしを付与するために、それらの技術をどのように変更可能であるかについて説明する。
[オーディオデータ]
図1には、代表的なデジタルオーディオデータ10のセグメントを概略的に示す。デジタルオーディオデータ10は、時間領域tに複数のサンプル14からなる一連のサンプル12を含む。サンプル14は、例えば、パルス符号変調(PCM)サンプルを含む。しかしながら、これは必須ではなく、他のサンプリング方式を用いて本発明を実施することも可能である。サンプル14は、サンプリング周期Tsだけ互いに離間している。サンプリング周期Tsによって、対応するサンプリング周波数fsが規定される。CDオーディオの特定の場合では、サンプリング周波数fsは、通常、44.1kHzであるが、本発明
には任意の適切なサンプリング周波数fsを有するデジタルオーディオデータ10が組み込まれてよいことが理解される。サンプル14は、二値方式によりデジタル量子化されてよい。非限定的な例として、CDオーディオでは、現在、各サンプル14について16ビットの分解度が用いられている。
オーディオデータ10は、オーディオデータ10の記憶、伝送、処理などを容易にする適切なファイル(図示せず)において保全されてもよい。オーディオ技術をよく知る者には、図1のデジタルオーディオデータ10が1つのオーディオチャネルを表現してもよいことや、複数のチャネルが組み合わせられ多チャネルオーディオデータ10を形成してもよいこと(例えば、時分割多重(TDM)その他、適切な技術によって)が認識される。そのような場合、以下の説明の目的では、サンプリング周期Tおよびサンプリング周波数fは多チャネルオーディオデータ10の特性であると仮定する。そのような場合、下述の電子透かし付与方法は、多チャネルオーディオデータ10上で実行されてよい。他の実施形態では、下述の電子透かし付与方法が各チャネルに対し個別に適用され、次いでそれらのチャネルが多重化されてよい。
[電子透かしの埋込]
図2には、本発明の特定の一実施形態による、メディアデータ102へ電子透かし108を埋め込むための方法100を概略的に示す。図2の代表的な実施形態では、メディアデータ102はオーディオデータ104を含む。オーディオデータ104は、オーディオファイル106の形態で提供されてもよい。オーディオデータ104は、サンプリング周期Tおよびサンプリング周波数fを含む、上述の特性を有し得る。オーディオデータ104は、多チャネルオーディオデータを含んでもよく、単チャネルオーディオデータを含んでもよい。一部の実施形態では、オーディオファイル106は、オーディオデータ104に加え、追加のデータ(例えば、メタデータ)を含んでもよい。
方法100はブロック110にて開始する。ブロック110は、所望の電子透かしデータ108を取得することを含む。特定の一実施形態では電子透かしデータ108は32ビットの情報を含むが、電子透かしデータ108は一般に異なる数のビットを含んでよい。電子透かしデータ108は、一般に、任意のデータを含んでよい。非限定的な例として、電子透かしデータ108は、ユーザID情報、暗号鍵、メディアデータ102の所有権を示す認証情報などを含んでよい。一部の実施形態では、電子透かしデータ108は暗号化されてよい(例えば、1つ以上の暗号鍵、擬似ランダム化処理またはその両方を用いて)。様々な適切な暗号化技術が当技術分野において知られている。
方法100は、次にブロック120へ進む。ブロック120では、電子透かしデータ108は1つ以上の前方誤り訂正(FEC)符号化方式を用いて拡張され、FEC電子透かしデータ108’を提供する。一部の実施形態では、ブロック120の前方誤り訂正符号化方式は低密度パリティ検査(LDPC)符号に基づくが、他の誤り訂正符号化技術がこれに加えてまたはこれに代えて用いられてもよい。本発明の特定の一実施形態では、ブロック120には、600ビットのFEC電子透かしデータ108’に対する前方LDPC誤り訂正を用いて、32ビットの電子透かしデータ108を拡張すること(すなわち、15倍を超える冗長性係数)が含まれる。さらに以下に説明するように、この大きさの冗長性係数によって、FEC電子透かしデータ108’のビットの1/3までが破損する場合にも、電子透かしデータ108が回復されることが可能となる。
方法100は、次にブロック130へ進む。ブロック130では、FEC電子透かしデータ108’がオーディオデータ104へ埋め込まれる。
例示の実施形態では、ブロック130の電子透かし埋込手続は、ブロック140より開始する。ブロック140にて、時間領域デジタルオーディオデータ104は複数のセクション142へとパースされる。ブロック140のセクション化処理をオーディオデータ104の一部について図3に概略的に示す。図3では、セクション142同士は線144によって仕切られている。メディアデータ102がオーディオデータ104を含み、オーディオデータ104が時間領域の一連のサンプルを含む代表的な実施形態(図1を参照)では、ブロック140のセクション142は、タイムスライス142と呼ばれる場合がある。各タイムスライス142は、オーディオデータ104の複数のサンプルを含んでよい。図3に示すように、セクション142は等しい数のサンプルを有してもよく、例えば、タイムスライス142は等しい持続時間を有してもよい。例えば、一部の実施形態では、各タイムスライス142は、〜5乃至100msの持続時間tsectionを有してよく、〜10乃至1000個のサンプルを含んでもよい。タイムスライス142の持続時間、各タイムスライス142におけるサンプルの数またはその両方は、方法100の実行毎に異なってよい。例えば、オーディオデータ104が短いオーディオクリップを含む場合、充分なビット数のFEC電子透かし108’がオーディオデータ104へ埋め込まれることを保証するように、比較的小さなタイムスライス142を有することが望ましい。反対に、オーディオデータ104の長さが2時間である場合、依然として充分な数のタイムスライス142によって所望のビット数のFEC電子透かし108’が符号化されるように、タイムスライス142は比較的大きくてもよい。
ブロック150では、各タイムスライス142に対して1つの値152を取得するように、各タイムスライス142のサンプルが統合される。特定の一実施形態では、ブロック150の統合には、各対応するタイムスライス142におけるオーディオデータ104のサンプルの値を加算することが含まれる。ブロック150の統合から取得される値152は、各関連するタイムスライス142に対するオーディオデータ104に関連したエネルギーを表すことができ、本明細書では、関連するタイムスライス142のエネルギー値152と呼ぶことがある。タイムスライス142の長さが同じであるため、各タイムスライス142は同数のサンプルを有し、各エネルギー値152は、その対応するタイムスライス142におけるサンプルの大きさの合計を表す。
ブロック160は、タイムスライス142とタイムスライス142に対応するエネルギー値152とを、グループへとアセンブルすることを含む。このブロック150のグループ化処理についても、図3に概略的に示す。図3には、グループGおよびGを示す。オーディオデータ104の長さに応じて、ブロック150のグループは、グループG,G,...G(個別にまた集合的にグループGと呼ぶ)を含んでよい。特定の一実施形態では、タイムスライス142の各グループGは、3つのタイムスライスの142と3つの対応するエネルギー値152を含む。
方法100は、次にブロック170へ進む。ブロック170は、タイムスライス142の各グループGに関連したエネルギー値152の形状を分類することを含む。例示の実施形態では、タイムスライス142の各グループGは、3つのエネルギー値152の順序付きのトリプレットを含む。エネルギー値152の順序付きのトリプレットは次を含む。
・第1のタイムスライス142Aに関連した第1のエネルギー値152A。
・第2のタイムスライス142Bに関連した第2のエネルギー値152B(第2のタイムスライス142Bは第1のタイムスライス142Aに隣接している)。
・第3のタイムスライス142Cに関連した第3のエネルギー値152C(第3のタイムスライス142Cは第2のタイムスライス142Bに隣接しており、第1のタイムスライス142Aからは離間している)。
ブロック170は、タイムスライス142(およびそれに対応するエネルギー値152)の各グループGを図4に示す形状カテゴリのうちの1つへと分類することを含んでよい。
図4には、数々の形状カテゴリと、各カテゴリに当てはまる数々のグループGの例を示す。図4の形状カテゴリは次を含む。
・形状1:第2のエネルギー値152Bが第1のエネルギー値152Aより大きく、第3のエネルギー値152Cが第2のエネルギー値152Bより大きい場合。
・形状2:第2のエネルギー値152Bが第1のエネルギー値152A未満であり、第3のエネルギー値152Cが第2のエネルギー値152B未満である場合。
・形状3:第2のエネルギー値152Bが第1のエネルギー値152Aより大きく、第3のエネルギー値152Cが第1、第2のエネルギー値152A,152Bの間にある場合。
・形状4:第2のエネルギー値152Bが第1のエネルギー値152Aより大きく、第3のエネルギー値152Cが第1のエネルギー値152A未満である場合。
・形状5:第2のエネルギー152B値が第1のエネルギー値152A未満であり、第3のエネルギー値152Cが第1、第2のエネルギー値152A,152Bの間にある場合。
・形状6:第2のエネルギー値152Bが第1のエネルギー値152A未満であり、第3のエネルギー値152Cが第1のエネルギー値152Aより大きい場合。
・形状7:第1、第2、第3のエネルギー値152A,152B,152Cが同じであるという、まれな場合。
図4に示す7つの形状カテゴリは1つの範囲の可能な形状カテゴリを表しており、タイムスライス142の各グループGには、3つのタイムスライス142と3つの対応するエネルギー値152とが存在する。一部の実施形態では、各グループGのタイムスライス142の数は異なることがある。各グループGのタイムスライス142の数が異なる場合、可能な形状カテゴリの範囲および形状カテゴリを割り当てるための規則も異なってよい。しかしながら、当業者には、各グループGのタイムスライス142の数が異なる場合であっても、タイムスライス142の相対エネルギー値152に基づき形状カテゴリを生成可能であることが認識される。
図2に戻ると、方法100はブロック180へ進む。ブロック180は、タイムスライス142の各グループGに対する公称ビット値182を決定することが含まれる。公称ビット値182は、ビット割当規則によってブロック170の形状カテゴリの各々に割り当てられる。ビット割当規則はその形状カテゴリに特有であってもよい。ビット割当規則は、例えば、エネルギー値152、連続したエネルギー値152A,152B,152Cの間の勾配、もしくはエネルギー値152および連続したエネルギー値152A,152B,152Cの間の勾配の関数、またはそれらのうちの1つ以上に基づいてもよい。
図4には、特定の一実施形態による図4の形状カテゴリに対するビット割当規則の集合を概略的に示す。図4に示す7つの形状に関連したビット割当規則の集合は次のとおりである。
・形状1:第1、第2のエネルギー値152A,152Bの間の勾配の大きさが第2、第3のエネルギー値152B,152Cの間の傾斜の大きさ以上である場合、公称ビット値182に0を割り当てる;そうでなく、第1、第2のエネルギー値152A,152Bの間の勾配の大きさが第2、第3のエネルギー値152B,152Cの間の傾斜の大きさ未満である場合、公称ビット値182に1を割り当てる。
・形状2:第1、第2のエネルギー値152A,152Bの間の勾配の大きさが第2、第3のエネルギー値152B,152Cの間の傾斜の大きさ未満である場合、公称ビット値182に0を割り当てる;そうでなく、第1、第2のエネルギー値152A,152Bの間の勾配の大きさが第2、第3のエネルギー値152B,152Cの間の傾斜の大きさより大きい場合、公称ビット値182に1を割り当てる。
・形状3:第2、第3のエネルギー値152B,152Cの間の勾配の大きさが第1、第2のエネルギー値152A,152Bの間の傾斜の大きさの1/2以下である場合、公称ビット値182に0を割り当てる;そうでなく、第2、第3のエネルギー値152B,152Cの間の勾配の大きさが第1、第2のエネルギー値152A,152Bの間の傾斜の大きさの1/2より大きい場合、公称ビット値182に1を割り当てる。
・形状4:第2、第3のエネルギー値152B,152Cの間の勾配の大きさが第1、第2のエネルギー値152A,152Bの間の傾斜の大きさの2倍以下である場合、公称ビット値182に0を割り当てる;そうでなく、第2、第3のエネルギー値152B,152Cの間の勾配の大きさが第1、第2のエネルギー値152A,152Bの間の傾斜の大きさの2倍より大きい場合、公称ビット値182に1を割り当てる。
・形状5:第2、第3のエネルギー値152B,152Cの間の勾配の大きさが第1、第2のエネルギー値152A,152Bの間の傾斜の大きさの1/2以下である場合、公称ビット値182に1を割り当てる;そうでなく、第2、第3のエネルギー値152B,152Cの間の勾配の大きさが第1、第2のエネルギー値152A,152Bの間の傾斜の大きさの1/2より大きい場合、ビット値182に0を割り当てる。
・形状6:第2、第3のエネルギー値152B,152Cの間の勾配の大きさが第1、第2のエネルギー値152A,152Bの間の傾斜の大きさの2倍以下である場合、公称ビット値182に1を割り当てる;そうでなく、第2、第3のエネルギー値152B,152Cの間の勾配の大きさが第1、第2のエネルギー値152A,152Bの間の傾斜の大きさの2倍より大きい場合、公称ビット値182に0を割り当てる。
・形状7:公称ビット値182に割り当てを行わない。
例示の実施形態では、第1、第2のエネルギー値152A,152Bの間の差は第2、第3のエネルギー値152B,152Cの間の差と同じであり、ブロック180の公称ビット割当規則における勾配は、第1、第2のエネルギー値152A,152Bの間の差異および第2、第3のエネルギー値152B,152Cの間の差異に比例する。このことは必須でない。一部の実施形態では、ビット割当規則において用いられるエネルギー値152間の差は等しくない(例えば、各グループGが3より多くのタイムスライス142を含む場合)。そのような場合、勾配計算は、エネルギー値152間の相対距離による除法を含んでよい。
図4に示す7つの形状カテゴリに対し割り当てられた上述の規則は、単に公称ビット割当規則の1つの可能な集合を表すものでしかない。他の適切な公称ビット割当規則の集合が本発明の他の実施形態において用いられ得る。そのような追加または代替の公称ビット割当規則の集合は、例えば、各グループGのタイムスライス142の数に応じて異なってよい。そのような追加または代替の公称ビット割当規則の集合は、例えば、異なるパラメータ、異なる関数またはその両方を用いて公称ビット値182を割り当ててもよい。好適
には、公称ビット割当規則には、少なくとも3つ以上の形状カテゴリに1の公称ビット値182および0の公称ビット値182を割当可能であることが含まれる。
図2に戻って、ブロック190は、ブロック180の次のグループGに対する公称ビット値182がFEC電子透かし108’に対する次のビット値と一致するか否かの照会を含む。ブロック190が各グループGについて連続的に実行されてもよい。特定のグループGがFEC電子透かし108’のビット値に対応する公称ビット値182を有する場合(ブロック190のNO出力)、この特定のグループGのエネルギー値152を変化させる必要はなく、方法100はブロック196へ進む。一方、1のビット値でグループにマークを付けることが望ましい(すなわち、FEC電子透かし108’の対応するビットが1である)場合に、この特定のグループGが0の公称ビット値182を有するとき、または0のビット値でグループにマークを付けることが望ましい(すなわち、FEC電子透かし108’の対応するビットが0である)場合に、この特定のグループGが1の公称ビット値182を有するとき、方法100は公称ビット値182を変更する。この後者の状況はブロック190のYES出力に対応しており、その場合、方法100はブロック194へ進む。ブロック194は、ブロック180のビット割当規則の再適用によってグループGを新たなビット値195に割り当てるようにそのエネルギー値152のうちの1つ以上を調節することによって、特定のグループGの公称ビット値182を変化させることを含む。すなわち、グループGに割り当てられる新たなビット値195は、グループGに割り当てられた公称ビット値182と異なる。新たなビット値195は、グループGにおける符号化に望ましいFEC電子透かし108’のビット値に対応する。
ブロック194における1つ以上のタイムスライス142のエネルギー値152の調節は、様々な技術を用いて行われてよい。ビット値の変更およびそれらに対応するエネルギー値152の変更の数々の例を、図5A〜5Cに示す。図5A〜5Cに示す例は、形状1の形状カテゴリを有すると決定され(ブロック170)、0の公称ビット値を有すると決定された(ブロック180)データから開始する。図5A〜5Cの例については、FEC電子透かし108’の0の公称ビット値182ではなく1のビット値を符号化するように1つ以上のエネルギー値152を調節することが望ましい。すなわち、図5A〜5Cの例では、ブロック194のエネルギー値の調節の後、ブロック180のビット割当規則の再適用によってグループGに1の新たなビット値195が割り当てられることが望ましい。
一部の実施形態では、ブロック194における1つ以上のタイムスライス142のエネルギー値152の調節には、ブロック170の形状カテゴリのうちの特定の1つの内で、0の公称ビット値182を1の新たなビット値に調節すること、または1の公称ビット値182を0の新たなビット値に調節することが含まれる。この技術の例を、図5Aおよび5Bに示す。図5Aは、グループG内で1つのエネルギー値152(第2のエネルギー値152B)を変更することを含む。図5Aの特定の例では、第2のエネルギー値152Bはその元の値152Bから修正値152B’まで減少される。図5Aおよび上述のブロック180のビット割当規則から、第2のエネルギー値152Bを修正値152B’まで減少させた後、ブロック180のビット割当規則の再適用によって、グループGに割り当てられるビット値は、その元の公称ビット値182(0)から新たなビット値195(1)に変更されることが分かる。すなわち、図5Aに示したブロック194のエネルギー値変更によって、ブロック180のビット割当規則によって割り当てられるビット値が変更される。
図5Bには、複数のエネルギー値152(例えば、図5Bに示した例では第1、第2のエネルギー値152A,152B)を変更することを含む、ブロック194のエネルギー値152の調節用の別の技術を示す。図5Bの特定の例では、第1のエネルギー値152Aはその元の値152Aから修正値152A’まで増大され、第2のエネルギー値152
Bはその元の値152Bから修正値152B’まで減少される。この場合も、図5Bおよび上述のブロック180のビット割当規則から、第1のエネルギー値152Aを修正値152A’まで増大させ、第2のエネルギー値152Bを修正値152B’まで減少させた後、ブロック180のビット割当規則の再適用によって、グループGに割り当てられるビット値は、その元の公称ビット値182(0)から新たなビット値195(1)に変更されることが分かる。すなわち、図5Bに示したブロック194のエネルギー値変更によって、ブロック180のビット割当規則によって割り当てられるビット値が変更される。
ブロック194におけるエネルギー値152の調節には、これに加えて、またはこれに代えて、グループGのブロック170の形状カテゴリにおける対応する変更と共に、グループGの0の公称ビット値182を1の新たなビット値195に調節すること、またはグループGの1の公称ビット値182を0の新たなビット値195に調節することが含まれる。この技術の一例を、図5Cに概略的に示す。図5Cの例では、グループGは0のブロック170形状カテゴリ1により、0の公称ビット値182で始まる。ブロック194には、第2のエネルギー値152Bを修正された第2のエネルギー値152B’まで増大させることと、第3のエネルギー値152Cを修正された第3のエネルギー値152C’まで減少させることが含まれる。このようにして、グループGは、ブロック170の形状分類処理の再適用によってグループGが新たな形状カテゴリへ割り当てられ、ブロック180のビット割当規則の再適用によってグループGに新たなビット値195が割り当てられるように変更される。図5Cに示す特定の例では、第2、第3のエネルギー値152B,152Cを修正値152B’,152C’に調節した後、ブロック170の形状分類処理の再適用によってグループGが形状カテゴリ3へ割り当てられ、ブロック180のビット割当規則の再適用によってグループGに1の新たなビット値195が割り当てられる。
図8には、本発明の特定の一実施形態による、ブロック194のエネルギー値変更のための方法400を概略的に示す。方法400は、グループGのタイムスライス142の各々に関連したエネルギー値152A,152B,152Cを変更することを含み得る。方法400は、ブロック170(図4)の形状カテゴリのうちのいずれについても、また、1のビットを符号化するようにエネルギー値152を変更することが望ましい、あるいは0のビットを符号化するようにエネルギー値152を変更することが望ましい状況についても汎用される。
方法400について、ブロック170の形状カテゴリが形状1であり、ブロック180の公称ビット値182がビット0であり、ビット1を符号化することが望ましい環境に関して最初に説明する。方法400は、終了の条件の評価を含むブロック410にて開始する。ブロック410の終了の条件は、許容誤差δに関して表現されてもよい。許容誤差δは、グループGのエネルギー値152の合計の割合x%であってもよい。すなわち、δ=x(e+e+e)/100。ここで、eは第1のエネルギー値152Aであり、eは第2のエネルギー値152Bであり、eは152C第3のエネルギー値である。一部の実施形態では、許容誤差δは、例えば、エネルギー値e+e+eの合計の0.2%〜10%程度であってよい。許容誤差の大きさは、電子透かしの頑健性とオーディオ品質の低下との間のトレードオフを反映し得る。
ブロック410の終了の条件は、ブロック170の形状分類規則と同様であってよい。形状カテゴリ1の特定の場合、ビット0の公称ビット値182をビット1に変更することが望ましく、ブロック410の終了の条件は、次のとおりであり得る:(e+e)/2〉=e+δ。通常、方法100(図2)がブロック194に至る場合、方法400の第1の反復においてはブロック410の終了の条件は満たされない。この結果、方法400はブロック410のNO出力を経てブロック420へ進む。
ブロック420では、方法400は第1のエネルギー値152を変更することを含む。形状カテゴリ1の特定の場合、ビット0の公称ビット値182を1のビット値に変更することが望ましく、ブロック420は、第3のエネルギー値152C(e)を増大させることを含み得る。ブロック420は、その以前の値の割合y%だけ対応するエネルギー値152を変更することを含み得る。一部の実施形態では、yは2%未満である。特定の一実施形態では、yは1%である。
方法400は次にブロック430へ進む。ブロック430は、第1の中間条件を評価することを含む。この例示の実施形態では、ブロック430の第1の中間条件は、続くエネルギー値変更によって、ブロック170のグループGの形状カテゴリの変更が行われないことを保証する。形状カテゴリ1の特定の場合、0の公称ビット値182を1のビット値に変更することが望ましく、ブロック430の第1の中間条件は、e>eであってよい。ブロック430の第1の中間条件が肯定的である場合、方法400はブロック440へ進む。ブロック440は、別のエネルギー値を変更することを含む。形状カテゴリ1の特定の場合、ビット0の公称ビット値182を1のビット値に変更することが望ましく、ブロック440は、第2のエネルギー値152B(e)を減少させることを含み得る。ブロック440は、その以前の値の割合k%だけエネルギー値152を変更することを含み得る。一部の実施形態では、kは2%未満である。特定の一実施形態では、kは1%である。
ブロック440(またはブロック430の照会が否定的な場合)の後、方法400はブロック450の第2の中間照会へ進む。示した実施形態では、ブロック450の第2の中間条件は、続くエネルギー値変更によって、ブロック170のグループGの形状カテゴリの変更が行われないことを保証する。形状カテゴリ1の特定の場合、0の公称ビット値182を1のビット値に変更することが望ましく、ブロック450の第2の中間条件は、e<eであってよい。ブロック450の第2の中間条件が肯定的な場合、方法400はブロック460へ進む。ブロック460は、別のエネルギー値を変更することを含む。形状カテゴリ1の特定の場合、ビット0の公称ビット値182を1のビット値に変更することが望ましく、ブロック460は、第1のエネルギー値152A(e)を増大させることを含み得る。ブロック460は、その以前の値の割合l%だけエネルギー値152を変更することを含み得る。一部の実施形態では、lは2%未満である。特定の一実施形態では、lは1%である。
ブロック460(またはブロック450の照会が否定的な場合)の後、方法400はブロック470へ進む。ブロック470では、方法400はブロック410へ戻り、終了の条件を再評価する。方法400は、ブロック410の終了の条件が満たされるまで、このようにループを継続する。ブロック410の終了の条件が満たされると、方法400はブロック480へ進み、終了する。グループGの3つのエネルギー値152のすべてを変更可能であることによって、方法400は、ビット値の所望の変更を比較的迅速に(すなわち、より少ない反復で)達成することができ、したがって、比較的少量の処理リソースしか消費しないでよい。
また、方法400は、他のブロック170の形状カテゴリおよびビット値変更についても用いられてよい。方法400の特定の一実施形態における様々なブロックに関し、他のブロック170の形状カテゴリの変更の各々や、他のビット値の変更の各々について以下に示す。
形状カテゴリ1:1の公称ビット値を0のビット値に変更
ブロック410の終了の条件:(e+e)/2≦e−δ
ブロック420:eをy%だけ減少
ブロック430の第1の中間条件:e<e
ブロック440:eをk%だけ増大
ブロック450の第2の中間条件:e>e
ブロック460:eをl%だけ減少。
形状カテゴリ2:0の公称ビット値を1のビット値に変更
ブロック410の終了の条件:(e+e)/2≧e+δ
ブロック420:eをy%だけ増大
ブロック430の第1の中間条件:e>e
ブロック440:eをk%だけ減少
ブロック450の第2の中間条件:e<e
ブロック460:eをl%だけ増大。
形状カテゴリ2:1の公称ビット値を0のビット値に変更
ブロック410の終了の条件:(e+e)/2≦e−δ
ブロック420:eをy%だけ減少
ブロック430の第1の中間条件:e>e
ブロック440:eをk%だけ増大
ブロック450の第2の中間条件:e>e
ブロック460:eをl%だけ減少。
形状カテゴリ3:0の公称ビット値を1のビット値に変更
ブロック410の終了の条件:(e+e)/2≧e+δ
ブロック420:eをy%だけ増大
ブロック430の第1の中間条件:e>e
ブロック440:eをk%だけ減少
ブロック450の第2の中間条件:e<e
ブロック460:eをl%だけ増大。
形状カテゴリ3:1の公称ビット値を0のビット値に変更
ブロック410の終了の条件:(e+e)/2≦e−δ
ブロック420:eをy%だけ減少
ブロック430の第1の中間条件:e<e
ブロック440:eをk%だけ増大
ブロック450の第2の中間条件:e>e
ブロック460:eをl%だけ減少。
形状カテゴリ4:0の公称ビット値を1のビット値に変更
ブロック410の終了の条件:(e+e)/2≦e−δ
ブロック420:eをy%だけ減少
ブロック430の第1の中間条件:e<e
ブロック440:eをk%だけ増大
ブロック450の第2の中間条件:e>e
ブロック460:eをl%だけ減少。
形状カテゴリ4:1の公称ビット値を0のビット値に変更
ブロック410の終了の条件:(e+e)/2≧e+δ
ブロック420:eをy%だけ増大
ブロック430の第1の中間条件:e>e
ブロック440:eをk%だけ減少
ブロック450の第2の中間条件:e<e
ブロック460:eをl%だけ増大。
形状カテゴリ5:0の公称ビット値を1のビット値に変更
ブロック410の終了の条件:(e+e)/2≧e+δ
ブロック420:eをy%だけ増大
ブロック430の第1の中間条件:e>e
ブロック440:eをk%だけ減少
ブロック450の第2の中間条件:e<e
ブロック460:eをl%だけ増大。
形状カテゴリ5:1の公称ビット値を0のビット値に変更
ブロック410の終了の条件:(e+e)/2≦e−δ
ブロック420:eをy%だけ減少
ブロック430の第1の中間条件:e<e
ブロック440:eをk%だけ増大
ブロック450の第2の中間条件:e>e
ブロック460:eをl%だけ減少。
形状カテゴリ6:0の公称ビット値を1のビット値に変更
ブロック410の終了の条件:(e+e)/2≦e−δ
ブロック420:eをy%だけ減少
ブロック430の第1の中間条件:e<e
ブロック440:eをk%だけ増大
ブロック450の第2の中間条件:e>e
ブロック460:eをl%だけ減少。
形状カテゴリ6:1の公称ビット値を0のビット値に変更
ブロック410の終了の条件:(e+e)/2≧e+δ
ブロック420:eをy%だけ増大
ブロック430の第1の中間条件:e>e
ブロック440:eをk%だけ減少
ブロック450の第2の中間条件:e<e
ブロック460:eをl%だけ増大。
当業者には、上述の技術が本発明の特定の実施形態を表すものであること、また、ブロック194のエネルギー値変更を実行するための他の技術が可能であることが認識される。
ブロック194には、FEC電子透かしデータ108’の所望のビットを符号化するために、特定のグループGの公称ビット値182(0)を新たなビット値195(1)に変更するため、または特定のグループGの公称ビット値182(1)から新たなビット値195(0)に変更するためのエネルギー値152に対する様々な変更が含まれてよい。しかしながら、ブロック194におけるエネルギー値152の変更には、オーディオデータ104の対応する変更が必要であることが認識される。すなわち、ブロック194におけるエネルギー値152の変更には、ブロック250の積算処理の再適用によって修正されたエネルギー値152が得られるような、オーディオデータ104における個々のサンプルの値に対する対応する調節が含まれる。例えば、特定のタイムスライス142のエネルギー値152の増大には、対応するタイムスライス142内の個々のサンプルの値の増大が含まれてよく、特定のタイムスライス142のエネルギー値152の減少には、対応するタイムスライス142内の個々のサンプルの値の減少が含まれてよい。
オーディオデータ104における個々のサンプルの調節は、例えば、オーディオデータ104のオリジナルのサンプル値に対応するオフセットを加算/減算することによって、または、オーディオデータ104のオリジナルのサンプルに適切なスケーリング係数を乗算することによって行われてよい。ブロック194の変更は、オーディオデータ104によって表現されるオーディオコンテンツの再生に対するそれらの変更の影響によって拘束される場合がある。ブロック194におけるエネルギー値152に対する変更が充分すぎる場合、埋め込まれたFEC電子透かしデータ180’は、オーディオデータ104によって表現されるオーディオコンテンツの再生に、人間の耳に検出可能であるような影響を与える。
上述のように、また図5A〜5Cおよび図8の例に示したように、公称ビット値182(1)を新たなビット値195(0)に変更する、または公称ビット値182(0)を新たなビット値195(1)に変更するという影響を有し得る、ブロック194におけるエネルギー値152に対する様々な変更が存在する。一部の実施形態では、ブロック194の変更処理には、エネルギー値152に対する最小の変更を用いて、0の公称ビット値182を1の新たなビット値195に変更すること、または1の公称ビット値182を0の新たなビット値195に変更することのため、オーディオデータ104によって表現されるオーディオコンテンツの再生への影響を最小化するため、エネルギー値152に対する様々な適切な調節の間で選択を行うための技術が含まれる。グループGのタイムスライス142の数が3である(例示の実施形態の場合のように)場合、エネルギー値152に対する変更を最小化するためのそのような技術には、ブロック170の形状カテゴリ内の公称ビット値182を変更することによって、または新たなブロック170の形状カテゴリを変更することによって、公称ビット値182が新たなビット値195に変更されるという拘束を受ける関数f=ΔE+ΔE+ΔEを最小化することが含まれてよい(ここで、ΔEは第i番目のエネルギー値152の変化を表す)。
ブロック194は閾値処理を含んでもよい。すなわち、ブロック194は、任意の個々のエネルギー値152の変更の量、特定のグループGの内のエネルギー値152の総変更またはその両方に対する制限を有してもよい。この閾値処理は、例えば、エネルギー値152の変化割合に関係してもよい。1つの特定の例では、グループGの内の任意の特定の1つのエネルギー値152に対する最大変更は10%であり、最大の総変更(すなわち、グループG内のエネルギー値152の合計に対する)は25%である。少数の場合では、ブロック194の閾値処理に準拠しつつ、グループGの公称ビット値182を変更することが可能ではない。そのような場合には、グループGのエネルギー値152が調節される必要はなく、より詳細には以下に説明するように、得られるグループGの破損したビットは前方誤り訂正復号を用いて収容することが可能である。
上述のように、ブロック194における特定のタイムスライス142に対応するエネルギー値152の変更には、対応するタイムスライス142内のオーディオデータ104の個々のサンプル(図1のサンプル14を参照)の振幅の対応する調節が含まれる。すなわち、タイムスライス142に対するブロック150の積算の再適用によって、修正されたエネルギー値152が生じる。特定のタイムスライス142における各サンプルが変更される量は、タイムスライス142のエネルギー値152が変更される量の逆数によって表されてよい。エネルギー値152の変化は、タイムスライス142のサンプル間で均等に分割されてもよい。
一部の実施形態では、個々のサンプルの調節は、タイムスライス142の開始部および終了部(またはその近傍)においてサンプルに対する変更が存在しない(または最小限の変更しか存在しない)ように実行されてよい。これによって、隣接したタイムスライス142間の境界におけるクリッピング効果を回避することが補助される。一部の実施形態で
は、特定のタイムスライス142のエネルギー値152の調節は、エネルギー値152の総変更が提供されるものの、タイムスライス142における個々サンプルに対する変更は、タイムスライス142の中央近くのサンプルに対しては比較的大きく、タイムスライス142の端部のサンプルに対しては比較的小さい関数にしたがって実行される(例えば、重み付けが行われる)。非限定的な例として、個々のサンプルの調節は、タイムスライス142に対する中央のサンプルまたはそのサンプル近くに頂点を有する放物線の関数にしたがって実行されてよい。タイムスライス142の個々のサンプルの調節を実行するために用いられる関数は、タイムスライス142の端部に対応するサンプルにおいて0であってもよく(ブロック194の変更が加法のオフセットを介して適用される場合)、タイムスライス142の端部に対応するサンプルにおいて値1であってもよい(ブロック194の変更が乗法スケーリング係数を介して適用される場合)。この場合も、そのような関数によって、タイムスライス142の境界において聴き手に可聴なクリッピング効果を回避することが補助される。
個々のサンプルに対する調節の閾値処理または均等でない分布に加えて、または代えて、ブロック194は、オーディオデータ104に対応するオーディオコンテンツの再生の品質に対するブロック194の電子透かし付与の変更の影響を限定するための他の規則および処理を含んでよい。
ブロック194の後、方法100はブロック196へ進む。ブロック196は、タイムスライス142の各グループGについて所望のFEC電子透かし108’がオーディオデータ104へ埋め込まれるまで、ブロック170,180,190、また必要な場合にはブロック194の手続の反復を含む。方法100は、FEC電子透かし108’がオーディオデータ104に完全に埋め込まれたとき、終了してもよい。一部の実施形態では、ブロック196は、FEC電子透かし108’が完全に埋め込まれる毎に、FEC電子透かし108’の開始部にループすることによって、利用可能なオーディオデータ104の終わりまでブロック170〜194を反復することを含む。複数の連続したFEC電子透かし108’を埋め込むことによって、所望のときに電子透かしが成功裡に抽出されることを可能とすると同時に、電子透かしを付与されたメディアデータのより充分な圧縮、操作またはその両方が可能となる。
[電子透かしの抽出]
図6には、本発明の特定の一実施形態による、電子透かしを付与されたメディアデータ204’から電子透かしを抽出するための方法200を概略的に示す。方法200は、ブロック233において、電子透かしを付与された電子透かし付きオーディオデータ204’を取得することによって開始する。ブロック233において取得された、電子透かし付きオーディオデータ204’は、方法100によって生成される電子透かし付きオーディオデータ204と同一であってよい。これは必須ではないが、電子透かし付きオーディオデータ204’は、方法100の適用後、かつ、ブロック233において受信される前に変更されてもよい。非限定的な例として、オーディオデータ204’は、圧縮され(例えば、MP3フォーマットに変換され)てもよく、増幅され(例えば、個々のサンプルの大きさが増減され)てもよく、再サンプリングされてもよく、アナログ形式に変換されてもよく、周波数領域が操作(例えば、一定の周波数成分の非均一増幅)されてもよく、チャネル混合が行われてもよく、チャネル減少が行われてもよく、ノイズが追加されてもよい。
方法200は次に随意のブロック235へ進む。ブロック235では、電子透かし付きオーディオデータ204’は、電子透かしを抽出するのに適切なフォーマットである、再フォーマットされたオーディオデータ204”へと再フォーマットされる。ブロック235の再フォーマットは、電子透かし付きオーディオデータ204’が既に電子透かしを抽
出するのに適切なフォーマットである場合には必要とされなくてよい。方法200の例示の実施形態では、オーディオデータ204’(または再フォーマットされたオーディオデータ204”)のフォーマットは、そのオーディオデータが方法100によって電子透かしの挿入されたオーディオデータ104と同じレートでデジタルサンプリングされている場合、電子透かしを抽出するのに適切なフォーマットである。したがって、ブロック235の再フォーマットは、非限定的な例として、オーディオデータ204’のサンプリング(例えば、オーディオデータ204’がアナログ形式である場合)、オーディオデータ204’のリサンプリング(例えば、オーディオデータ204’がダウンサンプリングされている場合)、伸張(例えば、オーディオデータ204’が圧縮されている場合)、などを含む。電子透かし抽出方法200は、増幅、周波数領域操作およびチャネル混合/減少に対して堅牢である。したがって、ブロック235の再フォーマットには、一般に、これらの種類の操作に対処するように再フォーマットすることは必要でない。
方法200は次にブロック237へ進む。ブロック237は、随意には、電子透かし付きオーディオデータ204’(または再フォーマットされた電子透かし付きオーディオデータ204”)を整合させて、整合された再フォーマットされた電子透かし付きオーディオデータ204’’’を生成することを含む。方法200がオリジナルのオーディオデータ104またはオリジナルの電子透かし付きオーディオデータ204にアクセスする場合、ブロック237は、電子透かし付きオーディオデータ204’(または再フォーマットされた電子透かし付きオーディオデータ204”)を、オリジナルのオーディオデータ104またはオリジナルの電子透かし付きオーディオデータ204に整合させることを含んでよい。ブロック237における、電子透かし付きオーディオデータ204’(または再フォーマットされた電子透かし付きオーディオデータ204”)とオリジナルのオーディオデータ104(またはオリジナルの電子透かし付きオーディオデータ204)との間の整合は、波形を視覚的に比較すること(例えば、人間のユーザによる)によって行われてもよい。これに加えてまたはこれに代えて、ブロック237の整合は、個々のサンプル(例えば、最小二乗比較法または他の何らかの適切なメトリックにより)間の適切なメトリックを用いて2つのデータ集合を比較することを含んでよい。電子透かし付きオーディオデータ204’(または再フォーマットされた電子透かし付きオーディオデータ204”)は、電子透かし付きオーディオデータ204’(または再フォーマットされた電子透かし付きオーディオデータ204”)をオリジナルのオーディオデータ104(またはオリジナルの電子透かし付きオーディオデータ204)のより近くに整合させるため、0を追加することによって、またはデータストリームの開始部もしくは終わりにおいてサンプルを除去することによって、時間領域において翻訳され得る。最小二乗法の比較(または他の適切なメトリック)が最小化されるまで、あるいは視覚的な波形比較によって波形が整合することが示されるまで、0の追加、データの除去またはその両方が反復されてよい。ブロック237の整合処理の結果は、整合された再フォーマットされた電子透かし付きオーディオデータ204’’’である。電子透かし付きオーディオデータ204’(または再フォーマットされた電子透かし付きオーディオデータ204”)をオリジナルのオーディオデータ104(またはオリジナルの電子透かし付きオーディオデータ204)に整合させるのに適切な他の技術が存在し得る。
一部の場合、電子透かし付きオーディオデータ204’(または再フォーマットされたオーディオデータ204”)は、既にオリジナルの電子透かし付きオーディオデータ204のオリジナルのオーディオデータ104に整合されている。この場合、ブロック237の整合手続は不要である。一部の場合、オリジナルのオーディオデータ104もオリジナルの電子透かし付きオーディオデータ204も利用不可能である。この場合、方法200はブロック237の整合手続を回避してよい。オリジナルのオーディオデータ104もオリジナルの電子透かし付きオーディオデータ204も利用不可能な状況について、より詳細に以下に説明する。
簡単のため、以降、本明細書においては、電子透かし付きオーディオデータ204’、再フォーマットされた電子透かし付きオーディオデータ204”および整合された再フォーマットされたオーディオデータ204’’’を、電子透かし付きオーディオデータ204と呼ぶが、電子透かし付きオーディオデータ204が、電子透かし付きオーディオデータ204’、再フォーマットされた電子透かし付きオーディオデータ204”および整合された再フォーマットされたオーディオデータ204’’’のうちのいずれかを含むことが理解される。
方法200は、ブロック240,250,260,270,280において、電子透かし付きオーディオデータ204を処理する。ブロック240,250,260,270,280は、それぞれ方法100のブロック140,150,160,170,180とほぼ同様であってよい。ブロック240,250,260,270,280は、電子透かし付きオーディオデータ204をセクション/タイムスライス242へ分割することと、各タイムスライス242のサンプルを積算し、各タイムスライス242についてのエネルギー値252を取得することと、タイムスライス242をグループGへグループ化することと、各タイムスライス242を形状カテゴリへ分類することと、各グループGにビット割当規則を適用し、各グループGの公称ビット値282を決定することと、を含む。埋め込まれた電子透かしのため(すなわち、ブロック194におけるエネルギー値152の変更のため)、ブロック250において各グループGに割り当てられるエネルギー値252は、ブロック150において各グループGに割り当てられるエネルギー値152と異なる場合がある。同様に、ブロック280におけるビット割当規則の適用によって生じる公称ビット値282は、通常、ブロック180においてビット割当規則が適用されるときに取得される公称ビット値182と異なる。
ブロック280におけるビット割当規則の適用により抽出される公称ビット値282は、方法200における特定のグループGに対応するFEC電子透かしビットの推定値を表す。推定されるFEC電子透かし推定値を、図6ではFEC電子透かし推定値286として参照する。ブロック285は、タイムスライス242の各グループGについてブロック270,280の処理を反復し、各グループGについてFEC電子透かし推定値286を取得することを含む。
一部の実施形態では、ブロック285は、単一のFEC電子透かし推定値286が抽出されるまで、ブロック270,280を反復することを含む。他の実施形態(複数の連続した電子透かしが電子透かし付きメディアデータ204’へと符号化される)では、ブロック285は、電子透かし付きメディアデータ204’の終わりまでブロック270,280を反復することを含む。そのような場合、FEC電子透かし推定値286は、FEC電子透かし108’の1より多くの単一の推定値を含んでよく、方法200は、FEC電子透かし推定286において、複数のFEC電子透かし推定値を続けて処理し、単一のFEC電子透かし推定値に対するビット値を取得することを含んでよい。非限定的な例として、そのような続けての処理は、複数のFEC電子透かし推定値からのデータの平均化、フィルタリングまたはその両方を行い、単一のFEC電子透かし推定値に対するビット値を取得することを含んでよい。複数の連続するFEC電子透かし108’の反復をオーディオデータ104へ符号化し、抽出することによって、所望のときに電子透かし付きメディアデータ204’から電子透かし108が成功裡に抽出されることを可能とすると同時に、電子透かし付きメディアデータ204のより充分な圧縮、操作またはその両方が可能となる。
ブロック287は、FEC電子透かし推定値286に前方誤り訂正復号方式を適用することを含む。ブロック287における前方誤り訂正復号は、方法100のブロック120
における前方訂正符号化に相補的である。上述のように、特定の一実施形態では、ブロック120,287は、LDPC前方誤り訂正技術を利用する。ブロック287の出力は、方法200における電子透かしデータ108の推定値を表す、電子透かし推定値289である。好適には、電子透かし推定値289は、電子透かしデータ108と同一である。有利には、ブロック120,287の前方誤り訂正によって、電子透かし推定値289を依然として電子透かし108と同一としつつ、ブロック270,280において決定される公称ビット値が比較的多数の誤りを有することが可能となる。すなわち、ブロック285において取得されるFEC電子透かし推定値286は、FEC電子透かし108’と同一である必要はない。好適な実施形態では、電子透かし推定値286のデータビットのうちの1/3以上が誤りを含むとともに、依然として電子透かしデータ108と同一の電子透かし推定値289を与えることができる。
電子透かし推定値289は、取得されると、限定ではなく、電子透かしデータ108によってインデックス化され得る適切なデータベースにおいて追加のデータを検索することを含む、様々な目的に用いられてよい。
既に簡単に述べたように、一部の場合、オリジナルのオーディオデータ104もオリジナルの電子透かし付きオーディオデータ204も利用不可能である。そのような場合、方法200に類似する方法を用いて電子透かし推定値289を抽出することが依然として可能である。電子透かし推定値289は、次いで、例えば、電子透かしデータ108と比較される。オリジナルのオーディオデータ104もオリジナルの電子透かし付きオーディオデータ204も利用不可能である場合、上述のブロック237の整合手続を実行することは不可能である。代わりに、方法200の関連部分は、電子透かし付きオーディオデータ204の異なる時間領域の翻訳により、数回実行されてよく、各反復から得られる電子透かし推定値289は、電子透かしデータ108と比較されてよい。
オリジナルのオーディオデータ104もオリジナルの電子透かし付きオーディオデータ204も利用不可能である一実施形態では、方法200(ブロック237なし)が第1の時間に実行され、得られた電子透かし推定値289が電子透かしデータ108と比較される。電子透かし推定値289が電子透かしデータ108に一致する(または一致に充分近い)場合、電子透かし付きオーディオデータ204が実際に電子透かしデータ108によって電子透かしを付与されていた、と結論付けられる。電子透かし推定値289が電子透かしデータ108と一致しない場合、電子透かし付きオーディオデータ204は時間領域においてnサンプルだけシフトされる(例えば、電子透かし付きオーディオデータ204の開始部または終わりにnサンプルを追加することによって、または電子透かし付きオーディオデータ204の開始部または終わりからnサンプルを除去することによって)。一部の実施形態では、nは、例えば、100,000サンプルより大きく、これは44.1kHzのオーディオサンプリングレートにおける〜2.5秒の時間シフトに相当する。特定の一実施形態では、nは3,000サンプルである。
電子透かし付きオーディオデータ204がシフトされた後、方法200のブロック240〜287は、第2の電子透かし推定値289を取得するために反復される。この第2の電子透かし推定値289は、一致の有無を確認するために電子透かしデータ108と再び比較される。一致が存在しない場合、電子透かし付きオーディオデータ204は、時間領域においてnサンプルのうちの適切な部分だけシフトされてよい。例えば、電子透かし付きオーディオデータ204は、n/2サンプルだけシフトされる。再び、方法200のブロック240〜287は、第3の電子透かし推定値289を取得するために反復され、第3の電子透かし推定値289が電子透かしデータ108と比較される。一致が存在しない場合、電子透かし付きオーディオデータ204は、時間領域においてnサンプルのうちのより小さな部分だけシフトされてよい。例えば、電子透かし付きオーディオデータ204
は、n/4サンプルだけシフトされる。再び、方法200のブロック240〜287は、第3の電子透かし推定値289を取得するために反復され、第4の電子透かし推定値289が電子透かしデータ108と比較される。一致が存在しない場合、電子透かしオーディオデータ204は、上記より小さな部分の倍数だけシフトされてよい(このシフトがまだ評価されていない場合)。例えば、電子透かし付きオーディオデータ204は、3n/4サンプルだけシフトされる。同様に、分数n/8について、電子透かし付きオーディオデータ204は、3n/8,5n/8,7n/8だけシフトされ得る。
この処理は、電子透かしデータ108が電子透かし付きオーディオデータ204へ埋め込まれていると結論付けられるまで、あるいは、電子透かし付きオーディオデータ204のシフトが充分に小さな数に達し、オーディオデータ204が実際に電子透かしを付与されていないと結論付けられるまで反復されてよい。一部の実施形態では、電子透かし読出処理を中止するためのこの条件は、200サンプル未満のシフトである。
方法100の電子透かし付与処理、方法200の電子透かし抽出処理またはその両方は、他の形態のデジタルメディアの対する適用のために容易に変更可能である。例えば、図7には、空間領域(図7の概略図にはxで示す)における複数のサンプル314からなる一連のサンプル312として表現され得る、モノクロ(またはグレイスケール)デジタル画像データ310を概略的に示す。複数のサンプル314の各々は、画像データ310のピクセル314として参照される。通常、画像データ310は二次元である。画像データ310は、二次元画像の一部に対応するピクセル314を含み得る。非限定的な例として、画像データ310は、例えば、画像の1つの行からのピクセル、画像の1つの列からのピクセル、または画像の1つの矩形部分を含む。画像データ310は、二次元画像に対応する複数のピクセルを1列に連結したものを含んでよい。非限定的な例として、画像データ310は、二次元画像の2以上の行に対応する複数のピクセルを連結したものを含んでよい。図7に示す例では、画像データ310のサンプリング周期は空間領域xにおけるXである。
デジタル画像データ310に方法100,200を適用するとき、ブロック140,240のタイムスライス142,242は実際に空間スライスを表現し得る(図7の概略図の空間寸法xにおいて)。したがって、上述における「タイムスライス」への参照は、任意の適切なサンプリング領域に存在し得る「セクション」を含むその他、参照することが理解される。各セクションは、サンプリング領域において互いに隣接している複数のサンプルを含む。
色画像データは、各ピクセルについて複数のサンプル値を含み得る。例えば、RGB表現の場合、各ピクセルは赤のサンプル値、緑のサンプル値および青のサンプル値を含み得る。そのような場合、電子透かしデータは、サンプル値(例えば、緑のサンプル値)の1つの集合へ、サンプル値の各集合へ、またはサンプル値の集合間で変化する何らかのパターンへと符号化されてよい。
他の点においては、画像データ310に対する方法100,200またはその両方の適用は、オーディオデータについて上記したものと同様である。
方法100の電子透かし付与処理、方法200の電子透かし抽出処理またはその両方は、映像メディアデータに対する適用のためにも容易に変更可能である。方法100,200を映像メディアデータに適用するとき、映像メディアデータの各フレーム(または各フレームの特定部分)は、上述の種類の二次元画像として処理できるので、映像データは静止画像について上記したように処理できる。これに加えて、またはこれに代えて、方法100,200またはその両方を映像メディアデータに適用するとき、各フレーム(または各フレームの特定部分)はタイムスライス/セクションとして処理できる。
本発明の一定の実装は、プロセッサに本発明の1つ以上の方法を実行させるソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、方法100,200またはその両方は、それらの方法をプロセッサに実行させるソフトウェア命令を実行する、1つ以上のプロセッサによって実装できる。そのようなソフトウェア命令は、プロセッサにアクセス可能なプログラムメモリから読み出され得る。本発明は、プログラムの形態で提供されることもできる。このプログラムは、データプロセッサによって実行されたときデータプロセッサに本発明の方法を実行させる、コンピュータ可読命令の集合を有する任意の媒体に含まれる。本発明によるプログラムは、様々な形態のうちのいずれであってもよい。プログラムは、例えば、フロッピー(登録商標)ディスク、ハードディスクドライブを含む時期的データ記憶媒体、CD ROM、DVDを含む光学的データ記憶メディア、ROM、フラッシュRAMを含む電子的データ記憶メディアなど、物理的なメディアを含んでよい。命令は、暗号化、圧縮またはその両方の行われたフォーマットにより、プログラムに存在してもよい。
上述の開示から当業者には明らかであるように、本発明の精神及び範囲から逸脱することなく、本発明の実施において多くの変更および修正が可能である。例えば、
・タイムスライス142をグループG(ブロック160,260)へグループ化するとき、グループGは、グループGの端部における1つ以上のタイムスライス/セクション142が隣接したグループGと重なるように選択されてよい。例えば、第1のグループGの最後のタイムスライス/セクション142は、第2のグループGの最初のタイムスライス/セクション142であってもよい。この種の重なり合いは、重なられたタイムスライス/セクション142のエネルギー値152がブロック194において変化しない限り、許容可能である。したがって、ブロック194は、重なったタイムスライス/セクション142に対応するエネルギー値152が、変更用に選択されることを防止する処理を含み得る。これに代えて、重なったタイムスライス/セクション152のエネルギー値152をブロック194において変更させるとともに、隣接したグループGの形状カテゴリ、公称ビット値182またはその両方に対するそのようなエネルギー値の変化の影響に基づき、重なったタイムスライス152のエネルギー値152の変化に制限を課すことが可能である。例えば、重なったタイムスライス/セクション142のエネルギー値152をブロック194において変更させるとともに、隣接したグループGの形状カテゴリを変化させないという望みに基づき、重なったタイムスライス142のエネルギー値152の変化に制限を課すことが可能である。隣接したグループGのタイムスライス142が重なることによって、所与のメディアデータの集合内により多数のグループGを提供し、したがって、それに対応してメディアデータへ符号化される電子透かし付与ビットの数をより多くすることが可能となる。
・記載の方法は概略図に示した特定の順序で実行される必要はなく、概略ブロック図に記載の演算の順序を変えても同じ効果が達成され得る。例えば、当業者には、ブロック140,150,160,170,180,190(および、必要ならばブロック194)がタイムスライス/セクション142の1つのグループGについて実行され、次いで、次のスライス/セクション142に対し、処理ループがブロック140へ戻るような、他のループ構造が想到される。
・上述において説明し、図4に示した形状は、各グループGが3つのタイムスライス/セクション142を含む場合の1つの可能な形状の分類を表す。グループGは、異なる数のタイムスライス/セクション142を有するように規定されてよく、その場合、利用可能な形状カテゴリは異なってよい。例えば、グループGが4つのタイムスライス/セクション142を含むように規定される場合、多数の形状カテゴリが存在し得る。
・上述の方法400は、その以前の値のある割合だけ漸増するようにエネルギー値を反復的に変更することを含む。このように、より大きなエネルギー値を有するセクションは、より小さなエネルギー値を有するセクションよりも比較的多く変更される。このことは必須でない。一部の実施形態では、方法400は、絶対量だけ漸増するようにエネルギー値を反復的に変更することによって実行される。

Claims (25)

  1. サンプル領域に一連のデジタルサンプルを含むメディアデータへ電子透かし情報を符号化する方法であって、
    サンプル領域において一連のデジタルサンプルを複数のセクションに分割することと、各セクションは対応する複数のサンプルを含むことと、
    各セクションにおける対応する複数のサンプルを処理し、各セクションに関連した1つのエネルギー値を取得することと、
    セクションをグループへグループ化することと、各グループは3つ以上のセクションを含むことと、
    ビット割当規則によって各グループに公称ビット値を割り当てることと、ビット割当規則はグループに含まれるセクションのエネルギー値に基づくことと、
    各グループに電子透かしビット値を割り当てることと、
    各グループについて、電子透かしビット値を公称ビット値と比較し、電子透かし情報ビットの公称ビット値および電子透かしビット値が一致しない場合、ビット割当規則の再適用によってグループに電子透かしビット値が割り当てられるように、グループに含まれる1つ以上の対応するセクションの1つ以上のエネルギー値を変更することと、からなり、
    ビット割当規則によって各グループに公称ビット値を割り当てることは、
    分類規則によって各グループを複数のカテゴリのうちの1つへ分類することと、
    各カテゴリについて、カテゴリに関連したユニークなカテゴリビット割当規則によって各グループに公称ビット値0または公称ビット値1を割り当てることとを含む、方法。
  2. 各グループは順序付きの3つ以上のセクションを複数含み、第1、第2のセクションはサンプル領域において互いに隣接しており、第3のセクションはサンプル領域において第2のセクションに隣接し、かつ、サンプル領域において第1のセクションから離間している請求項1に記載の方法。
  3. 分類規則は、第2のセクションのエネルギー値に対する第1のセクションのエネルギー値と、第1、第2のセクションのエネルギー値に対する第3のセクションのエネルギー値とに基づく請求項2に記載の方法。
  4. 次のうちの1つ以上、すなわち、
    メディアデータはオーディオデータを含み、サンプル領域は時間領域を含むことと、
    メディアデータは画像データを含み、サンプル領域は空間領域を含むことと、
    メディアデータは映像データを含み、サンプル領域は空間領域と時間領域とのうちの1つ以上を含むことと、のうちの1つ以上を含む請求項3に記載の方法。
  5. 特定のグループについて、分類規則は、
    第2のセクションのエネルギー値が第1のセクションのエネルギー値より大きく、第3のセクションのエネルギー値が第1、第2のセクションのエネルギー値より大きい場合、前記特定のグループを第1の形状カテゴリへ分類することと、
    第2のセクションのエネルギー値が第1のセクションのエネルギー値未満であり、第3のセクションのエネルギー値が第1、第2のセクションのエネルギー値未満である場合、前記特定のグループを第2の形状カテゴリへ分類することと、
    第2のセクションのエネルギー値が第1のセクションのエネルギー値より大きく、第3のセクションのエネルギー値が第1、第2のセクションのエネルギー値の間にある場合、前記特定のグループを第3の形状カテゴリへ分類することと、
    第2のセクションのエネルギー値が第1のセクションのエネルギー値より大きく、第3のセクションのエネルギー値が第1、第2のセクションのエネルギー値未満である場合、前記特定のグループを第4の形状カテゴリへ分類することと、
    第2のセクションのエネルギー値が第1のセクションのエネルギー値未満であり、第3のセクションのエネルギー値が第1、第2のセクションのエネルギー値の間にある場合、前記特定のグループを第5の形状カテゴリへ分類することと、
    第2のセクションのエネルギー値が第1のセクションのエネルギー値未満であり、第3のセクションのエネルギー値が第1、第2のセクションのエネルギー値より大きい場合、前記特定のグループを第6の形状カテゴリへ分類することと、を含む請求項3に記載の方法。
  6. 各カテゴリについて、対応するカテゴリビット割当規則は、サンプル領域において互いに隣接しているセクションのエネルギー値の間の相対差に基づく請求項3に記載の方法。
  7. 各カテゴリについて、対応するカテゴリビット割当規則は、第2、第3のセクションのエネルギー値の間の差に対する第1、第2のセクションのエネルギー値の間の差に基づく請求項6に記載の方法。
  8. 各カテゴリについて、カテゴリビット割当規則は、第2、第3のセクションのエネルギー値の間の勾配に対する第1、第2のセクションのエネルギー値の間の勾配に基づく請求項6に記載の方法。
  9. 各カテゴリについて、カテゴリビット割当規則は、第2、第3のセクションのエネルギー値の間の差に対する第1、第2のセクションのエネルギー値の間の差に基づいており、
    第1、第2の形状カテゴリについて、カテゴリビット割当規則は、第1、第2のセクションのエネルギー値の間の第1の勾配の大きさが第2、第3のセクションのエネルギー値の間の第2の勾配の大きさより大きい場合、第1のビット値を割り当て、第1の勾配の大きさが第2の勾配の大きさ未満である場合、第2のビット値を割り当て、
    第3、第5の形状カテゴリについて、カテゴリビット割当規則は、第2、第3のセクションのエネルギー値の間の第2の勾配の大きさが第1、第2のセクションのエネルギー値の間の第1の勾配の大きさの半分より大きい場合、第1のビット値を割り当て、第2の勾配の大きさが第1の勾配の大きさの半分未満である場合、第2のビット値を割り当て、
    第4、第6の形状カテゴリについて、カテゴリビット割当規則は、第2、第3のセクションのエネルギー値の間の第2の勾配の大きさが第1、第2のセクションのエネルギー値の間の第1の勾配の大きさの2倍より大きい場合、第1のビット値を割り当て、第2の勾配の大きさが第1の勾配の大きさの2倍未満である場合、第2のビット値を割り当てる、請求項5に記載の方法。
  10. グループに含まれる1つ以上の対応するセクションの1つ以上のエネルギー値を変更することは、グループに含まれる1つのセクションに対応する1つのエネルギー値を変更することを含む請求項1に記載の方法。
  11. グループに含まれる1つ以上の対応するセクションの1つ以上のエネルギー値を変更することは、グループに対する分類規則の再適用によって異なるカテゴリへグループが分類されるようにグループにおける1つ以上のエネルギー値を変更することを含む請求項1に記載の方法。
  12. グループに含まれる1つ以上の対応するセクションの1つ以上のエネルギー値を変更することは、グループに対する分類ビット割当規則の再適用によってグループに異なるビット値が割り当てられ、かつ、グループに対する分類規則の再適用によってグループが同じカテゴリへ分類されるようにグループにおける1つ以上のエネルギー値を変更することを含む請求項1に記載の方法。
  13. グループに含まれる1つ以上の対応するセクションの1つ以上のエネルギー値を変更することは、グループに含まれる3つ以上のセクションに対応する3つ以上のエネルギー値を変更することを含む請求項1に記載の方法。
  14. グループに含まれる3つ以上のセクションに対応する3つ以上のエネルギー値を変更することは、前記3つ以上のエネルギー値に基づく終了条件を満たすまで、前記3つ以上のエネルギー値のうちの1つ以上を漸増するように反復的に変更することを含む請求項13に記載の方法。
  15. 前記3つ以上のエネルギー値のうちの1つ以上を漸増するように反復的に変更することは、前記3つ以上のエネルギー値のうちの2つに基づく1つ以上の中間条件を満たすまで、複数のエネルギー値を漸増するように反復的に変更することを含む請求項14に記載の方法。
  16. 前記3つ以上のエネルギー値のうちの1つ以上を漸増するように反復的に変更することは、各反復について、以前の値の固定割合だけ前記3つ以上のエネルギー値のうちの前記1つ以上を漸増するように変更することを含む請求項14に記載の方法。
  17. 終了条件は、ビット割当規則の再適用によって、許容誤差δにより修正されるグループに電子透かしビット値が割り当てられる条件を含む請求項14に記載の方法。
  18. グループに含まれる3つ以上のセクションに対応する3つ以上のエネルギー値を変更することは、終了条件を満たしつつ前記3つ以上のエネルギー値に対する変更の合計を最小化することを含む請求項17に記載の方法。
  19. セクションをグループへグループ化することは、サンプリング領域における隣接したグループが1つ以上のセクションを共通して含むよう、互いに重なるようにグループを規定することを含む請求項1に記載の方法。
  20. 各セクションにおけるサンプルの個数は等しく、各セクションにおける対応する複数の
    サンプルを処理することは、各セクションについて、セクションにおける対応する複数のサンプルの値を積算し、除法演算を実行せずにエネルギー値を取得することを含む請求項1に記載の方法。
  21. プロセッサによって実行されたとき、請求項1に記載の方法をプロセッサに実行させる命令を含むコンピュータプログラム。
  22. サンプル領域に一連のデジタルサンプルを含むメディアデータから電子透かし情報に対応する公称ビット値を抽出する方法であって、
    サンプル領域において一連のデジタルサンプルを複数のセクションに分割することと、各セクションは対応する複数のサンプルを含むことと、
    各セクションにおける対応する複数のサンプルを処理し、各セクションに関連した1つのエネルギー値を取得することと、
    セクションをグループへグループ化することと、各グループは3つ以上のセクションを含むことと、
    ビット割当規則によって各グループから公称ビット値を抽出することと、ビット割当規則はグループにおけるセクションのエネルギー値に基づくことと、からなり、
    ビット割当規則によって各グループから公称ビット値を抽出することは、
    分類規則によって各グループを複数のカテゴリのうちの1つへ分類することと、
    各カテゴリについて、カテゴリに関連したユニークなカテゴリビット割当規則によって各グループから公称ビット値0または公称ビット値1を抽出することと、を含む、方法。
  23. オリジナル版のメディアデータに前記一連のサンプルを整合させることを含み、前記一連のサンプルを整合させることは、前記一連のサンプルに0のサンプルを追加して、または、前記一連のサンプルからサンプルを除去して、サンプル領域の一連のサンプルを翻訳することを含む請求項1に記載の方法。
  24. オリジナル版のメディアデータに前記一連のサンプルを整合させることは、一連のサンプルの各サンプルをオリジナル版のメディアデータの対応するサンプルと比較し、0のサンプルを追加して、または、前記一連のサンプルからサンプルを除去して、前記一連のデータとオリジナル版のメディアデータとの間の差異に関連したメトリックを最小化することを含む請求項23に記載の方法。
  25. プロセッサによって実行されたとき、請求項22に記載の方法をプロセッサに実行させる命令を含むコンピュータプログラム。
JP2009532655A 2006-10-18 2007-10-18 メディアデータに電子透かしを付与する方法 Expired - Fee Related JP5103479B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US86202906P 2006-10-18 2006-10-18
US60/862,029 2006-10-18
PCT/CA2007/001821 WO2008046203A1 (en) 2006-10-18 2007-10-18 Methods for watermarking media data

Publications (2)

Publication Number Publication Date
JP2010507109A JP2010507109A (ja) 2010-03-04
JP5103479B2 true JP5103479B2 (ja) 2012-12-19

Family

ID=39313552

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009532655A Expired - Fee Related JP5103479B2 (ja) 2006-10-18 2007-10-18 メディアデータに電子透かしを付与する方法

Country Status (6)

Country Link
US (4) US7983441B2 (ja)
EP (1) EP2082527B1 (ja)
JP (1) JP5103479B2 (ja)
CA (1) CA2682926C (ja)
DK (1) DK2082527T3 (ja)
WO (1) WO2008046203A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008014409A1 (de) * 2008-03-14 2009-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Einbetter zum Einbetten eines Wasserzeichens in eine Informationsdarstellung, Detektor zum Detektieren eines Wasserzeichens in einer Informationsdarstellung, Verfahren und Computerprogramm
US8805689B2 (en) * 2008-04-11 2014-08-12 The Nielsen Company (Us), Llc Methods and apparatus to generate and use content-aware watermarks
JP2010078728A (ja) * 2008-09-24 2010-04-08 Dainippon Printing Co Ltd 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
JP5157863B2 (ja) * 2008-12-08 2013-03-06 大日本印刷株式会社 音響信号に対する情報の埋め込み装置および音響信号を利用した位置検出装置
WO2010143026A1 (en) 2009-06-08 2010-12-16 Nds Limited Robust watermark
US8880527B2 (en) * 2012-10-31 2014-11-04 Nokia Corporation Method and apparatus for generating a media compilation based on criteria based sampling
US9099080B2 (en) 2013-02-06 2015-08-04 Muzak Llc System for targeting location-based communications
US9928561B2 (en) 2015-05-29 2018-03-27 Digimarc Corporation Serialized digital watermarking for variable data printing
US10382484B2 (en) 2015-06-08 2019-08-13 Illusive Networks Ltd. Detecting attackers who target containerized clusters
US9553885B2 (en) 2015-06-08 2017-01-24 Illusive Networks Ltd. System and method for creation, deployment and management of augmented attacker map
US10242680B2 (en) 2017-06-02 2019-03-26 The Nielsen Company (Us), Llc Methods and apparatus to inspect characteristics of multichannel audio
AU2018333668B2 (en) * 2017-09-15 2023-12-21 Sony Corporation Information processing device and information processing method
US10333976B1 (en) 2018-07-23 2019-06-25 Illusive Networks Ltd. Open source intelligence deceptions
US10404747B1 (en) 2018-07-24 2019-09-03 Illusive Networks Ltd. Detecting malicious activity by using endemic network hosts as decoys
US10382483B1 (en) 2018-08-02 2019-08-13 Illusive Networks Ltd. User-customized deceptions and their deployment in networks
US10333977B1 (en) 2018-08-23 2019-06-25 Illusive Networks Ltd. Deceiving an attacker who is harvesting credentials
US10432665B1 (en) 2018-09-03 2019-10-01 Illusive Networks Ltd. Creating, managing and deploying deceptions on mobile devices
CN110012296B (zh) * 2018-11-21 2021-08-17 杭州基尔区块链科技有限公司 一种针对mp4视频码流的快速信息嵌入方法
US11537690B2 (en) * 2019-05-07 2022-12-27 The Nielsen Company (Us), Llc End-point media watermarking
WO2022066662A1 (en) * 2020-09-22 2022-03-31 Qsc, Llc Transparent data encryption
WO2023089731A1 (ja) * 2021-11-18 2023-05-25 エヴィクサー株式会社 判定システム、情報処理装置、方法、及びプログラム
WO2023182982A1 (en) * 2022-03-22 2023-09-28 Verance Corporation Psycho-visual-model based video watermark luma level adaptation

Family Cites Families (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6614914B1 (en) * 1995-05-08 2003-09-02 Digimarc Corporation Watermark embedder and reader
US7171016B1 (en) * 1993-11-18 2007-01-30 Digimarc Corporation Method for monitoring internet dissemination of image, video and/or audio files
US5613004A (en) * 1995-06-07 1997-03-18 The Dice Company Steganographic method and device
US6078664A (en) * 1996-12-20 2000-06-20 Moskowitz; Scott A. Z-transform implementation of digital watermarks
US5889868A (en) 1996-07-02 1999-03-30 The Dice Company Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US7107451B2 (en) * 1996-07-02 2006-09-12 Wistaria Trading, Inc. Optimization methods for the insertion, protection, and detection of digital watermarks in digital data
US7095874B2 (en) * 1996-07-02 2006-08-22 Wistaria Trading, Inc. Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US6061793A (en) * 1996-08-30 2000-05-09 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible sounds
TW312770B (en) * 1996-10-15 1997-08-11 Japen Ibm Kk The hiding and taking out method of data
AUPO521897A0 (en) * 1997-02-20 1997-04-11 Telstra R & D Management Pty Ltd Invisible digital watermarks
JPH11177924A (ja) * 1997-12-10 1999-07-02 Sony Corp 信号再生装置、信号記録装置、信号記録システム、信号再生方法、並びに、信号記録方法
JP3022462B2 (ja) * 1998-01-13 2000-03-21 興和株式会社 振動波の符号化方法及び復号化方法
US6850626B2 (en) * 1998-01-20 2005-02-01 Digimarc Corporation Methods employing multiple watermarks
JP3321767B2 (ja) * 1998-04-08 2002-09-09 株式会社エム研 音声データに透かし情報を埋め込む装置とその方法及び音声データから透かし情報を検出する装置とその方法及びその記録媒体
WO1999063443A1 (en) * 1998-06-01 1999-12-09 Datamark Technologies Pte Ltd. Methods for embedding image, audio and video watermarks in digital data
US6778678B1 (en) * 1998-10-02 2004-08-17 Lucent Technologies, Inc. High-capacity digital image watermarking based on waveform modulation of image components
DE69904141T2 (de) * 1998-10-08 2003-09-11 Matsushita Electric Industrial Co., Ltd. Datenaufzeichnungs- und wiedergabegerät
ID25532A (id) * 1998-10-29 2000-10-12 Koninkline Philips Electronics Penanaman data tambahan dalam sinyal informasi
WO2000039955A1 (en) * 1998-12-29 2000-07-06 Kent Ridge Digital Labs Digital audio watermarking using content-adaptive, multiple echo hopping
JP2000216981A (ja) * 1999-01-25 2000-08-04 Sony Corp 電子透かし埋め込み方法および電子透かし埋め込み装置
GB2363302B (en) * 1999-01-28 2003-11-05 Kent Ridge Digital Labs Method and apparatus for watermarking wavetable synthesis architectures
KR100632723B1 (ko) * 1999-03-19 2006-10-16 소니 가부시끼 가이샤 부가 정보 매립 방법 및 그 장치 및 부가 정보의 복조방법 및 그 복조장치
KR100333163B1 (ko) * 1999-03-29 2002-04-18 최종욱 디지털 워터마킹 방법 및 장치
US6952774B1 (en) * 1999-05-22 2005-10-04 Microsoft Corporation Audio watermarking with dual watermarks
US7020285B1 (en) * 1999-07-13 2006-03-28 Microsoft Corporation Stealthy audio watermarking
US7543148B1 (en) * 1999-07-13 2009-06-02 Microsoft Corporation Audio watermarking with covert channel and permutations
JP3373811B2 (ja) * 1999-08-06 2003-02-04 インターナショナル・ビジネス・マシーンズ・コーポレーション 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置
JP2001094434A (ja) * 1999-09-22 2001-04-06 Victor Co Of Japan Ltd オーディオ信号符号化装置及びオーディオ信号復号化装置
US6571144B1 (en) * 1999-10-20 2003-05-27 Intel Corporation System for providing a digital watermark in an audio signal
JP2001186326A (ja) * 1999-12-27 2001-07-06 Ricoh Co Ltd 画像の改ざん検証データ埋め込み方法、画像の改ざん検証方法、画像の改ざん検証装置および記録媒体
US6385329B1 (en) * 2000-02-14 2002-05-07 Digimarc Corporation Wavelet domain watermarks
US6737957B1 (en) * 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
GB0029855D0 (en) * 2000-04-05 2001-01-24 Sony Uk Ltd Embedding data in material and removing the embedded data
JP2003534579A (ja) * 2000-05-22 2003-11-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ウォーターマークの挿入および抽出
JP2001339700A (ja) * 2000-05-26 2001-12-07 Nec Corp 電子透かし処理装置並びに電子透かし挿入方法および電子透かし検出方法
EP1297492B1 (en) * 2000-06-23 2007-03-28 Koninklijke Philips Electronics N.V. Watermark embedding method and arrangement
DE60110086T2 (de) * 2000-07-27 2006-04-06 Activated Content Corp., Inc., Burlingame Stegotextkodierer und -dekodierer
JP2004506947A (ja) * 2000-08-16 2004-03-04 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 補足情報に応答するオーディオ又はビデオ知覚符号化システムのパラメータ変調
US6430301B1 (en) * 2000-08-30 2002-08-06 Verance Corporation Formation and analysis of signals with common and transaction watermarks
US6674876B1 (en) * 2000-09-14 2004-01-06 Digimarc Corporation Watermarking in the time-frequency domain
WO2002039739A1 (en) * 2000-11-08 2002-05-16 Koninklijke Philips Electronics N.V. Method and device for communicating a command
EP1220152A3 (en) * 2000-12-07 2004-11-24 Sony United Kingdom Limited Embedding data in material
US6738744B2 (en) * 2000-12-08 2004-05-18 Microsoft Corporation Watermark detection via cardinality-scaled correlation
US6891958B2 (en) * 2001-02-27 2005-05-10 Microsoft Corporation Asymmetric spread-spectrum watermarking systems and methods of use
DE10129239C1 (de) * 2001-06-18 2002-10-31 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal
GB2378370B (en) * 2001-07-31 2005-01-26 Hewlett Packard Co Method of watermarking data
JP2005502920A (ja) * 2001-09-05 2005-01-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Dsd信号のための堅牢なウォーターマーク
US7392392B2 (en) 2001-12-13 2008-06-24 Digimarc Corporation Forensic digital watermarking with variable orientation and protocols
JP3554825B2 (ja) * 2002-03-11 2004-08-18 東北大学長 電子透かしシステム
DE10216261A1 (de) * 2002-04-12 2003-11-06 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbetten von Wasserzeicheninformationen und Verfahren und Vorrichtung zum Extrahieren von eingebetteten Wasserzeicheninformationen
US7366909B2 (en) * 2002-04-29 2008-04-29 The Boeing Company Dynamic wavelet feature-based watermark
US7106862B1 (en) * 2002-06-13 2006-09-12 Applied Micro Circuits Corporation Digital information hiding techniques for use with data streams carried over a data communication network
US20060075239A1 (en) 2003-01-23 2006-04-06 Koninklijke Philips Electronics, N.V. Embedding multiple watermarks
KR100492743B1 (ko) * 2003-04-08 2005-06-10 주식회사 마크애니 신호의 특성값의 양자화에 의한 워터마크 삽입 및 검출방법
US7006630B2 (en) * 2003-06-03 2006-02-28 Matsushita Electric Industrial Co., Ltd. Methods and apparatus for digital content protection
US7206649B2 (en) * 2003-07-15 2007-04-17 Microsoft Corporation Audio watermarking with dual watermarks
KR20070032674A (ko) * 2004-06-08 2007-03-22 코닌클리케 필립스 일렉트로닉스 엔.브이. 이동된 물체에 의해 생긴 워터마크 불규칙성의 보상
WO2006004554A1 (en) * 2004-07-06 2006-01-12 Matsushita Electric Industrial Co., Ltd. Method and system for identification of audio input

Also Published As

Publication number Publication date
CA2682926C (en) 2015-10-13
EP2082527A4 (en) 2013-10-16
EP2082527A1 (en) 2009-07-29
EP2082527B1 (en) 2014-09-24
US20160042741A1 (en) 2016-02-11
CA2682926A1 (en) 2008-04-24
WO2008046203A1 (en) 2008-04-24
US7983441B2 (en) 2011-07-19
US20130096705A1 (en) 2013-04-18
US9679574B2 (en) 2017-06-13
US20080098022A1 (en) 2008-04-24
US9165560B2 (en) 2015-10-20
JP2010507109A (ja) 2010-03-04
US20110258705A1 (en) 2011-10-20
US8300885B2 (en) 2012-10-30
DK2082527T3 (en) 2015-07-20

Similar Documents

Publication Publication Date Title
JP5103479B2 (ja) メディアデータに電子透かしを付与する方法
US9396733B2 (en) Reversible audio data hiding
JP3707556B2 (ja) 所望の電子透かしをカバーワークの中に埋め込む方法、符号化する方法、埋め込む装置および記録媒体
Miller et al. Applying informed coding and embedding to design a robust high-capacity watermark
Bhat K et al. A new audio watermarking scheme based on singular value decomposition and quantization
JP2002325170A (ja) 画像処理装置及びその方法並びにプログラムコード、記憶媒体
JP2001119555A (ja) 時系列化された一次元のデータにおける電子透かし
JP6700506B2 (ja) 透明な無損失オーディオ電子透かし
CN101105857A (zh) 一种基于预测和压扩技术的高容量可逆水印方法
US5822458A (en) Precomputing and encoding compressed image enhancement instructions
CN104700840B (zh) 用于音频编码/解码/转码的频率域中水印***
EP1634275A2 (en) Bit-stream watermarking
Wei et al. A blind audio watermarking scheme using peak point extraction
El Hamdouni et al. A blind digital audio watermarking scheme based on EMD and UISA techniques
Chen et al. Reversible data hiding for JPEG images based on improved mapping and frequency ordering
CN101151637A (zh) 量化水印的方法
JP2005521909A (ja) マルチメディア信号の透かしに関するウィンドウ・シェーピング関数
EP1695337B1 (en) Method and apparatus for detecting a watermark in a signal
Wei et al. Controlling bitrate steganography on AAC audio
JP2006262310A (ja) 復号化装置、逆量子化方法及びこれらのプログラム
KR20060112667A (ko) 워터마크 임베딩
Kostadinov et al. On digital watermarking for audio signals
US7388524B2 (en) Enhancing signal to noise ratio of an interpolated signal
JP3692959B2 (ja) 電子透かし情報埋め込み装置
JP2005210584A (ja) データファイルの符号化方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120104

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120404

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120515

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120814

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120911

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121001

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5103479

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S631 Written request for registration of reclamation of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313631

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees