JP2004515799A - ステゴテキスト・エンコーダおよびデコーダ - Google Patents
ステゴテキスト・エンコーダおよびデコーダ Download PDFInfo
- Publication number
- JP2004515799A JP2004515799A JP2002515737A JP2002515737A JP2004515799A JP 2004515799 A JP2004515799 A JP 2004515799A JP 2002515737 A JP2002515737 A JP 2002515737A JP 2002515737 A JP2002515737 A JP 2002515737A JP 2004515799 A JP2004515799 A JP 2004515799A
- Authority
- JP
- Japan
- Prior art keywords
- key
- matrix
- stegotext
- spectrogram
- log
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013179 statistical model Methods 0.000 claims abstract description 14
- 238000006243 chemical reaction Methods 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 113
- 238000000034 method Methods 0.000 claims description 81
- 238000009826 distribution Methods 0.000 claims description 80
- 239000000872 buffer Substances 0.000 claims description 52
- 230000006870 function Effects 0.000 claims description 28
- 238000001914 filtration Methods 0.000 claims description 13
- 230000001131 transforming effect Effects 0.000 claims description 13
- 238000012937 correction Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000012952 Resampling Methods 0.000 claims description 2
- 230000001419 dependent effect Effects 0.000 claims 6
- 238000009827 uniform distribution Methods 0.000 claims 1
- 230000009466 transformation Effects 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 239000013598 vector Substances 0.000 description 14
- 230000000694 effects Effects 0.000 description 12
- 238000013459 approach Methods 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 238000005311 autocorrelation function Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 6
- 238000005314 correlation function Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 4
- 230000000717 retained effect Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 101150118463 argG gene Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000009448 modified atmosphere packaging Methods 0.000 description 1
- 235000019837 monoammonium phosphate Nutrition 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/28—Arrangements for simultaneous broadcast of plural pieces of information
- H04H20/30—Arrangements for simultaneous broadcast of plural pieces of information by a single channel
- H04H20/31—Arrangements for simultaneous broadcast of plural pieces of information by a single channel using in-band signals, e.g. subsonic or cue signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
- G06T1/0028—Adaptive watermarking, e.g. Human Visual System [HVS]-based watermarking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
- G06T1/005—Robust watermarking, e.g. average attack or collusion attack resistant
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/28—Indexing scheme for image data processing or generation, in general involving image processing hardware
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2201/00—General purpose image data processing
- G06T2201/005—Image watermarking
- G06T2201/0052—Embedding of the watermark in the frequency domain
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2201/00—General purpose image data processing
- G06T2201/005—Image watermarking
- G06T2201/0065—Extraction of an embedded watermark; Reliable detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
- Error Detection And Correction (AREA)
- Editing Of Facsimile Originals (AREA)
- Vending Machines For Individual Products (AREA)
- Television Systems (AREA)
Abstract
Description
本発明は、アナログ信号またはデジタル信号の電子透かし処理(watermarking:ウォーターマーキング)に関する。信号はビデオ信号またはデータ信号でもよいが、本発明は、それに限られるものではないが、特にオーディオ信号の電子透かし処理に関するものであることを理解されたい。
【0002】
「電子透かし」という用語は、加算されたデータが主信号の主目的に影響を及ぼさないように、主信号にデータを加算する手順を対象として含むことを意味する。主信号は「カバーテキスト」と呼ばれることが多く、加算された電子透かしデータを含む信号は「ステゴテキスト」と呼ばれることが多い。このようにオーディオ信号の場合は、ステゴテキストが再生される際に、ステゴテキストに加算データが存在することは聴き手には事実上知覚できないように意図されている。しかし、ステゴテキストに加算データが存在することによって、ユーザが適宜のデコード装置を持っている場合は、カバーテキストの基点を識別できる。ユーザの装置に適宜の回路が備えられていれば、復元された電子透かしデータがその装置と適合しない場合は、ユーザが元のカバーテキスト信号に含まれている主データを再生できないようにし得る。加えて、ユーザがカバーテキストを再生できなければならない。
【0003】
このような技術は明らかに音楽のレコーディングに関して大きな可能性を有している。その結果、ステゴテキストを聴く権利がある者が、加算されたコード化データにより生じたスプリアス・サウンドによって楽しみを損なわれないように、オーディオ信号に電子透かし処理を施すという課題に相当な努力が払われてきた。
【0004】
一方では、記録され、伝送されたオーディオ素材に施されることができる様々な種類の従来の信号処理の後に有効であり、かつ加算されたコード化データを除去または無効にする直接的な試みに対して抗することができるほど充分に、電子透かしが頑強であることが重要である。
【0005】
アナログ信号に電子透かし処理を行う装置と方法は国際特許明細書WO98/53565号に記載されており、この明細書は電子透かし信号に使用されてきたいくつかの技術を開示している。
【0006】
先行して公刊されたこの明細書で提案されている1つの電子透かし処理方法には、オーディオ信号の短期の自己相関関数を算定し、その後、聴きにくく、ある特定の遅延(単数または複数)を経て短期の自己相関関数の値を変更する加算信号を付加し、それによって低速度でデータを伝える特定の波長を生成することが含まれている。この波長へのデータの実際の変調は、いくつかの適宜の変調技術のいずれかを用いて行うことができる。装置の受信端末で電子透かし読み取り器(すなわちデコーダ)がステゴテキストの短期の自己相関関数を算定し、用いた変調技術に適した復調を施す。読み取り器が自己相関関数を変調するために最初に用いられたデータを利用できれば、加算されたコード化データをステゴテキストから除去することができる。
【0007】
しかし、多くのオーディオ信号の短期の自己相関関数は、基本音声のサウンドを変更することなく任意の長さを遅延を経てゼロに任意に近づくように容易に変更することができる。したがって、比較的簡単に電子透かし処理された信号を侵害して、電子透かし処理の効果が無効になるようにすることができる。
【0008】
本発明は上記の欠点がない電子透かし処理システムを提供し、かつ電子透かし処理された信号をデコードするデコーダを提供することに関するものである。
【0009】
本発明の第1の態様では、カバーテキスト信号をエンコードしてステゴテキストを生成するためのエンコーダであって、
カバーテキスト信号の高速フーリエ変換および方形極変換を実行するための第1の変換手段であって、それによりカバーテキスト信号を対数パワー・スペクトログラムへと変換する、第1の変換手段と、
一つのキーまたは各キーが所定サイズの二次元パターンの形式である少なくとも1つのキーを供給する手段と、
対数パワー・スペクトログラム領域内でキーの倍数を、または複数のキーがある場合には1つまたは複数のキーの倍数を、変換されたカバーテキスト信号のブロックに加算または減算するマルチプライアと、
所望のコードを表すデータに従ってマルチプライアによるキー(単数または複数)の加算または減算を制御する手段と、
変調されたカバーテキスト信号の極方形変換および逆高速フーリエ変換を実行するための第2の変換手段であって、それによりステゴテキストを生成する、第2の変換手段と、を備えたエンコーダが提供される。
【0010】
本発明の第2の態様では、カバーテキスト信号をエンコードしてステゴテキストを生成する方法であって、
カバーテキスト信号の高速フーリエ変換および方形極変換を実行することであって、それによりカバーテキスト信号をパワー・スペクトログラム領域へと変換する、実行することと
一つのキーまたは各キーが所定サイズの二次元パターンの形式である少なくとも1つのキーを供給することと、
対数パワー・スペクトログラム領域内でキーの倍数を、または複数のキーがある場合には1つまたは複数のキーの倍数を、変換されたカバーテキスト信号のセグメントに加算または減算することと、
所望のコードを表すデータに従って加算/乗算ステップでキー(単数または複数)の倍数の加算または減算を制御することと、
変調されたカバーテキスト信号の極方形変換および逆高速フーリエ変換を実行することであって、それによりステゴテキストを生成する、実行することと、を含む方法が提供される。
【0011】
本発明の第3の態様では、カバーテキスト信号の対数パワー・スペクトログラムを、1つのキーまたは各キーの倍数が、それによってステゴテキストが生成された電子透かしコードに従って対数領域でカバーテキスト・パワー・スペクトログラムに加算または減算された少なくとも1つのキー(K)で変調し、かつ変調されたパワー・スペクトログラムをカバーテキストの元の領域に戻すことによって生成されたステゴテキストをデコードするデコーダであって、ステゴテキスト信号の高速フーリエ変換および方形極変換を実行する変換手段であって、それによりステゴテキスト信号を対数パワー・スペクトログラム領域に変換する、変換手段と、元のカバーテキスト信号の対数パワー・スペクトログラムがそれによってエンコードされたキー(単数または複数を)を供給する手段と、対数パワー領域で対数パワー・スペクトログラムのブロックからキー(単数または複数)の正と負の倍数を減算し、かつ所定の統計モデルに従ってカバーテキストの未修正ブロックを表す上記減算の結果の確率を評価するための計算手段と、計算手段の出力からエンコードされたデータを復元する抽出手段と、を備えたデコーダが提供される。
【0012】
本発明の第4の態様では、カバーテキスト信号の対数パワー・スペクトログラムを、1つのキーまたは各キーの倍数が、それによってステゴテキストが生成された電子透かしコードのデータに従って対数領域でカバーテキスト・パワー・スペクトログラムに加算または減算された少なくとも1つのキー(K)で変調し、かつ変調されたパワー・スペクトログラムをカバーテキストの元の領域に戻すことによって生成されたステゴテキストをデコードする方法であって、ステゴテキスト信号の高速フーリエ変換および方形極変換を実行することであって、それによりステゴテキスト信号を対数パワー・スペクトログラム領域に変換する、実行することと、元のカバーテキスト信号の対数パワー・スペクトログラムがそれによってエンコードされたキー(単数または複数を)を供給することと、対数パワー領域で対数パワー・スペクトログラムのブロックからキー(単数または複数)の正と負の倍数を減算し、かつ所定の統計モデルに従ってカバーテキストの未修正ブロックを表す上記減算の結果の確率を評価することと、計算手段の出力からエンコードされたデータを復元することと、を含む方法が提供される。
【0013】
本発明の第4の態様では、請求項45に記載の電子透かしキー・ジェネレータが提供される。
【0014】
本発明をより良く理解できるように、ここで添付図面を参照するとともに本発明の実施形態を例をあげて説明する。
【0015】
ここで図1を参照すると、基本システムはキー・ジェネレータ(1)と、エンコーダ(2)と、デコーダ(3)とから構成されている。キー・ジェネレータ(1)は(1’)で入力された整数シード値に基づいて疑似ランダム・キーを生成する。デコーダ(2)はステゴテキストを生成するためにキーを用いて、データを有するカバーテキストとして(4)で入力された音楽ファイルをマーキング(mark:電子透かし処理)する。データは(2’)でエンコーダ(2)へと入力される。伝送線(5)を経てステゴテキストを受信したデコーダ(3)は、この場合もキーを用いてマーキングされたファイルからデータをリードバックし、復元されたデータを(6)で出力する。データが適正にリードバックされたことを確実にするために、エンコード動作とデコード動作には同じキーを用いなければならない。このキーは勿論、必要な場合にシードから再生可能なので、シード値はマーキングされたファイルをデコードするのに必要な全ての値である。伝送線(5)は勿論、広範の多様な形式をとることができる。したがって、ステゴテキストは任意の適宜の媒体に記録し、または無線、ファイバー・ケーブル等によって伝送することができよう。以下ではマーキングされないファイルはどれもカバーテキストと呼び、電子透かし処理されたファイルはステゴテキストと呼ぶ。この実施形態は音楽で使用することに関連して説明するが、記載される技術および装置は音声またはビデオ・データのような音楽ではない場合にも利用できることが理解されよう。
【0016】
添付図面の図2は本発明によるより詳細な実施形態のブロック図を示している。この図ではカバーテキストは(10)で示されたマーキングされていないオーディオ・ファイルである。このオーディオ・ファイルの音源は10’で示されている。これはライブ・イベントをピックアップする、テープまたはディスクのようなレコーディング媒体、またはラジオまたはインターネットで伝送された信号であってよい。このオーディオ・ファイルはエンコーダ(2)に入力され、回路(11)においてパワー・スペクトログラムへと変換される。この変換の理由は以下のようである。情報をステゴテキストの位相成分で伝えることは不可能である。人間の耳は基本的に位相には敏感ではなく、これはある圧縮アルゴリズムによって引き出されたものである。したがって、位相に依存する電子透かし処理技術は圧縮に対し頑強であるとは考えられない。その上、オーディオ・ファイルにランダムな「グループ遅延」を加えることによって、その周波数成分の位相にスクランブルをかけ、オーディオ・ファイルを処理することができる。計算上集約的ではないこのような処理は一般に、オーディオ・ファイル内にある何らかの特定の波形を破壊する。したがって、時間領域形式の信号上の波形に依存する電子透かしは、この処理によって読み取り不能にすることができる。
【0017】
したがって本発明では、カバーテキストのパワー・スペクトログラムを利用してカバーテキストの電子透かし処理を行うことが提案される。このようにして、カバーテキスト内の各々の周波数成分の大きさだけが修正され、各周波数成分の位相はマーキング処理を通して保存される。位相情報はデコーダで廃棄される。ここでこの手順を詳細に説明する。
【0018】
カバーテキストのパワー・スペクトログラムを計算するために、カバーテキストは長さの半分だけ重複するブロック2Yサンプルの長さに分割される。このようにして、Yのサンプルごとに新たなブロックが始まる。記載のようにサンプル率fs=44100Hzのオーディオ・ファイル用に設計されているこの実施形態では、Yは1024に設定される。
【0019】
各ブロックは分析ウインドウとして知られているウインドウ関数で乗算され、ウインドウモードにされた(windowed)ブロックのフーリエ変換が計算される。ウインドゥ関数の目的は、サンプル値がブロックのいずれかの終端でゼロの方向に漸減し、不連続性の回避を確実にすることである。フーリエ変換はブロックを周期的な関数の反復ユニットとして処理する。ウインドウモードにされたブロックは実際のサンプルから構成されているので、そのフーリエ変換は正と負の周波数に対して共役対称である。負の周波数成分は付加的な情報を伝えず、したがって廃棄することができる。
【0020】
各フーリエ係数は、その大きさが対応する周波数成分の振幅を表し、その引き数が位相を表す複素数である。位相情報が廃棄されると、残るのは信号のパワー・スペクトルである。厳密な意味では、パワー・スペクトルは各フーリエ係数の大きさを二乗することによって得られる。
【0021】
いくつかの連続するパワー・スペクトルが互いに横並びに配列されると、数値の格子が形成される。一般には垂直である一方の軸は周波数を表し、一般には水平であるもう一方の軸は時間を表す。この格子がオーディオ・サンプルのパワー・スペクトログラムである。図3は音楽の一節から取り出されたパワー・スペクトログラムの例を示している。この図では、格子内の数値は様々な濃淡として示されている。−8から3までの右側の列は、スペククトログラムを評価できるようにするため、スペクトログラムの輝度レベルを突き合わせる(match)ことができるスケールである。
【0022】
Yを選択することでスペクトログラムの分解能が決まる。周波数方向では分解能はfs/2Yであり、時間方向では分解能はY/fsである。この実施形態では、これらの値はそれぞれ21.5ヘルツと23.2msである。図3の軸はこれらの単位で測定される。
【0023】
そのパワー・スペクトログラムからオーディオ波形を充分良好に再構成することは困難であるように思われるが、位相情報が保持されていれば可能である。スペクトログラム・データは逆フーリエ変換で時間領域に戻され、以前と同じようにして重複され、互いに加算されることができる。
【0024】
そこからスペクトログラムが得られるカバーテキストを電子透かし処理するために、スペクトログラムへの修正が少なく、かつ元の位相情報が保持されている限りは、前述の方法によって満足できるオーディオ波形を再現できることが判明している。再構成された時間−領域セグメントは何れかの端部でゼロまで漸減することはもはや保証されず、したがって、合成ウインドウが前述のように互いに加算されて、セグメントがウインドウモードにされると、最終的な波形の主観的なクオリティが高まることに注目するべきである。分析および合成ウインドウは、システムを通して全体的な振幅変調がないよう確実にするように選択されなければならない。この実施形態では、これらのウインドウはそれぞれ二乗余弦関数の平方根である。
【0025】
図2では、スペクトログラムの変調はエンコードされる予定のビット・ストリームに応答して、全体的に(12)で示された回路で行われる。
【0026】
最後にブロック(2)で、回路(13)は変調されたパワー・スペクトログラムを時間領域に戻し、これらをステゴテキストに変換するために合成する。図2では、ステゴテキストは15で示されている。
【0027】
デコーダ(3)はステゴテキストを対数スペクトログラムに変換するための回路(16)と、キーを用いて対数スペクトログラムを相関することで、回路(18)で電子透かしコードを表し、(19)で出力されるビット・ストリームを抽出するようにする回路(17)とを備えている。
【0028】
可聴効果を伴わずにオーディオ信号のパワー・スペクトログラムの要素が変調される範囲は、その元のレベルとほぼ比例することが判明している。したがって、デシベル・タームで一定量までパワー・スペクトログラムへの加算または減算を行ってもよい。知覚できる変調の量は聴く環境に左右されるが、標準的には約1dBである。したがって、この実施形態では、電子透かし処理プロセスは「対数パワー・スペクトログラム領域」で実行され、キー・ジェネレータ1によって生成されたキー、および電子透かしとしてエンコードすべきデータに従ってパワー・スペクトログラムに加算または減算を行うことからなっている。
【0029】
より大きいスペクトログラム要素に、より大幅に変調を加えることができるので、これらの要素によって伝えられる情報は、振幅がより小さい要素の場合よりもノイズに対する感度が低くなる。しかし、これらの要素が何であるかを予め知ることは不可能である。したがって、記載している電子透かし処理は、カバーテキストが情報を伝えるために利用できるどのような要素をも引き出せるように備えられている。このように、この実施形態では回路12内の各スペクトログラム要素は、電子透かしの情報伝達能力を最大限にするように変調される。したがって、電子透かし内の各データ・ビットはスペクトログラムの領域で変調パターンを誘発する。変調パターンは一面では「1」ビットをエンコードするために適用され、他面では「ゼロ」ビットをエンコードするために適用される。ビットは規則的な間隔で、すなわちスペクトログラム内の規則的な水平間隔Tでエンコードされる。
【0030】
オーディオ・ファイルのサイレント部分のように電子透かしを隠すことができない短いセグメントがカバーテキストにあることもある。したがって、各データ・ビットができるだけ長くステゴテキストの部分に作用することが必須である。この実施形態では、この課題に対して2つのアプローチを用いている。
【0031】
添付図面の図4はこれらのアプローチの1つをグラフで示している。このアプローチでは、スペクトログラム変調パターンは隣接するビットについて重複している。図4では各方形Kは変調パターンのコピーを表している。各スペクトログラム変調パターンKは幅がXの時間単位であり、高さがYの周波数単位である。Yはスペクトログラムの全高である。この実施形態ではXは32であり、T=5である。したがって、カバーテキストのパワー・スペクトログラムの最初の32列幅のブロックが同じサイズのキーによって変調され、次にキーがT(5列)だけステップされると、カバーテキストの最初の5列は、対応する5列のキーによって変調されるに留まる。変調の次の繰り返しでは、カバーテキストの6列〜37列までがキーによって変調されるので、6列〜32列は二回変調されたことになる。三回目の繰り返しでは、最初のブロックの6列〜10列までが二重の変調だけに留まるが、11列〜32列は3回変調され、一方、33列〜37列までは2回目の変調がなされ、38列〜42列までは最初の変調がなされる。このシーケンスがカバーテキストの長さ全体にわたって繰り返される。勿論、XとTの値は広い範囲にわたって異なる。例えばXは256でよく、Tは10であってよい。
【0032】
第2のアプローチは、依然として適時に各ビットの効果を広げるためにメッセージ・ビットにエラー補正コードを適用するものである。
【0033】
図5に示した畳込みエンコーダは、より長いキーを用いた場合と比較してデコーダ内でのメモリの必要性を減らすように、音楽の長い部分にわたって各入力ビットの効果を広げるために用いられる。エンコードすべきデータ・ストリームは線(30)上でシフトレジスタに入力され、このレジスタはこの実施形態では3個のD形フリップフロップ(31、32、および33)から構成されている。クロック(clk/2)は線(34)上で供給される。クロック速度(clk)でフリップされる出力スイッチ(35)は、3個のフリップフロップによって形成されたシフトレジスタ内でビットの1つまたは2つの排他的OR結合のいずれかを選択するように、一対の排他的ORゲート(36、37)の出力に接続される。この実施例では、上部の排他的ORゲート(36)がシフトレジスタの3つのビットの全てに接続され、下部のゲート(37)がビット0とビット2に接続される。このエンコーダは二次元マトリクス〔111;101〕によって規定され、ただしマトリクスの最初の行は上部の排他的ORゲートに対するシフトレジスタの接続に対応し、第2の行は下部の排他的ORゲート(37)に対する接続に対応する。接続のパターンはセット{0,1}からの係数を有する多項式の形式で表すことができる。この場合は、多項式はX2 +X+1(ゲート36)とX2 +1(ゲート37)である。
【0034】
このエンコーダでは、各入力ビットは連続する6つの出力ビット(マトリクス内のエントリの総数)に作用し、出力ビット速度は入力ビット速度の2倍である(マトリクス内の行数)。このようなコードは「速度1/2 コード」と呼ばれる。マトリクスの各行内のエントリ「ジェネレータ多項式」は伸張にに選択されなければならない。この実施形態では、速度が整数の逆数であるコードだけを用いることができる。この制約の理由は、この実施形態で用いられるエンコーダの種類によるだけであり、他の関連性はないことを理解されたい。したがって、他の形式のエラー補正コーディングを用いる必要があった場合は、上記の制約は必ずしも該当しない。出力に不変のままに送られる識別コードはマトリクス〔1〕によって指定される。
【0035】
コードが「畳み込み」と呼ばれる理由は、以下のような畳み込み関数を用いて実施できるからである。入力されたデータ・ビットにはまずコード速度に従ってゼロが挿入される。例えば、元のデータが(1011)であるものと想定する。(1000101)を得るためにこのデータにはゼロが挿入されるので、このデータはその時点で元の速度の半分である。単一の行として書き込まれた上記のエンコーダ・マトリクスである(111011)をこれらのデータに畳み込むと、(111022212111)となる。(111000010111)であるモジュロ−2を採用する。モジュロ−2演算はエンコーダ内で排他的ORゲート(36および37)の機能を果たす。このように、4ビットのシーケンスが12ビット・コード語にエンコードされたことになる。一般に、nビットのシーケンスは(2n+4)−ビット・コード語へとエンコードされる。
【0036】
畳み込みコードについて説明してきたが、その他の多くの種類の適宜のエラー補正コードを利用できることが理解されよう。このようなコードにはReed−Solomonコード、BCHコード、G0lay コード、Fireコード、Turbo コード、Gallagher コード、およびMackay−Neal コードが含まれる。
【0037】
畳み込みエンコードの前に同期化エンコードが実行される。したがって、エンコードされたデータ・ビットのストリームに同期化フラグが挿入される。このようにして、エンコードされたビット・ストリームの同期化はこれに開始フラグを挿入することによって達成される。フラグ・パターンは5つの「1」が後に続く「0」である。それ以外ではデータ・ストリーム内にこのパターンが発生しないことを確実にするため、4つの「1」のどのシーケンスの後にも追加のゼロ・ビットが挿入される。これは、「ゼロ詰め込み(zero stuffing)」として知られている。詰め込まれたゼロはデコーダによって除去される。この手順によって、開始フラグあたり6ビット+ちょうど3%を超えるデータ速度の全体的な低下というペナルティが生ずる。これの代わりに多くの代替方法が可能であることが当業者には理解されよう。
【0038】
ここで図6に戻ると、この図は、説明したばかりの2つのプロセスをどのようにエンコーダに組込むかを示している。したがって、この場合も(10)はエンコードすべきカバーテキストを示し、Kは現在処理中の電流ウインドウを示し、K−1は以前のウインドウを示している。マルチプライヤ(41)で、抽出されたウインドウKは分析フインドウ関数(42)で乗算されるので、抽出されたウインドウはその各々の端部で漸減する。回路(43)では、分析ウインドウ関数によって修正された抽出済みのウインドウの高速フーリエ変換が達成される。必要なパワー・スペクトログラムを生成するために、回路(44)で方形極変換が行われる。このパワー・スペクトログラムは、既に述べたように回路(45)で修正され、この回路はスペクトログラムの位相成分が不変のままである、図2の回路12に対応している。
【0039】
ステゴテキストの生成を完了するために、極方形変換が回路(46)で行われる。逆高速フータエ変換が回路(47)で行われ、かつ合成ウインドウ関数(48)を用いて、(49)で逆高速フーリエ変換回路(47)の出力を乗算する。最後に、重複したウインドウが(50)で加算されて、(15)に示したステゴテキストが作成される。
【0040】
いくつかの異なる電子透かしを利用できるようにすることが望ましいことが理解されよう。基本的に、いくつかの異なる電子透かしを使用することが可能であることによって、どの透かしを使用すべきかの知識がなければ、侵害者が隠されたメッセージをデコード、除去、または偽造することは著しく困難になる。
【0041】
この実施形態では、「キー」という用語は特定数の同系統の電子透かしを表すために用いられている。この実施形態の場合も、キーは疑似ランダムに生成され、いずれか1つのキーはシードとして用いられる単一の整数によって定められる。これは図1に示したシード入力である。
【0042】
この実施形態では、キーはスペクトログラム変調値のアレイK(t,f)であり、tとfは整数指数であり、−1≦K(t,f)≦+1である。K(t,f)は、H−x/2≦t<x/2および0≦f<Yの範囲外ではゼロになるように定義されている。カバーテキストのスペクトログラムをG(t,f)とし、ステゴテキストのスペクトログラムをH(t,f)とする。diはエンコードすべきデータ・ビットを表すものとする。ただし、diは(0または1ではなく)±1である。簡略にするため、エラー補正コーディングは無視するものとする。したがってエンコーディング・アルゴリズムは下記によって得られる:
【0043】
【数3】
【0044】
したがって、分岐切断の適切な選択が得られる。
【0045】
【数4】
【0046】
ただし、sはエンコーディング強度を定める実定数である。方程式(1)および(2)では、GとHは複素数であるが、Kは実数である。したがって、方程式(1)では、argH=argGとなる。したがって電子透かしはパワー・スペクトル内でエンコードされ、元のスペクトル成分の位相が保存される。
【0047】
キーの設計は侵害に対して頑強なステゴテキストの生成の際に最も重要であることが理解されよう。ここで、キーを設計するための考慮事項を詳細に説明する。
【0048】
ホワイト・ノイズ・パターンだけから構成され、キー内の各々のセルが独立し、かつ全く同一に分布しているキーは、多くの理由から魅力あるものである。これは計算上生成し易く、最大可能な情報伝達能力を有している。一般に、これはカバーテキストとの相関性は低く、単一の狭い自己相関ピークを有している。実験により、これはオーディオ・ファイルの多岐にわたる改ざん(manipulation)に対して頑強であり、しかも聴こえないような充分に低い強度でエンコードされることが判明している。しかし、個々の行がランダムに左右シフトされる、スペクトログラムへのグループ遅延侵害を用いてステゴテキストを改ざんすることによって、既に得られたスペクトログラム分解能により、行を1列以上シフトするようにグループ遅延パラメータを配列することができる。これによってステゴテキストとキーとの間にある何らかの相関性が破壊される。ステゴテキストの知覚的に満足できる構造と、あらゆる形式の上記のグループ遅延侵害に対して頑強であることが同時に得られるスペクトログラム分解能を選択することは不可能であるように思われる。
【0049】
更に、全ての周波数が例えば5%(1半音未満)だけ上昇し、テキストが同じ係数だけ時間的に短縮されるようにステゴテキストをリサンプルすることが可能である。スペクトログラムに及ぼすこの作用は、スペクトログラムを垂直方向に拡大し、水平方向に縮小することである。この手順は図7にグラフで示されており、ただし15Aは元のステゴテキストを表し、15Bは変更されたステゴテキストである。セルのうちで依然として符合するのは極めて少ないことが分かる。周波数軸に沿って、f≧20であるセルはセルの以前の位置とは全く重複しない。この場合も相関関数は破壊される。
【0050】
これらの2つの問題のうちの第1の点、すなわち1つの次元での拡大は、反復する列を含むようにキーを修正することによって解消できる。実験により、各スペクトログラム列を12回反復すれば、相関関数を破壊するのに必要なグループ遅延が、知覚的に受け入れられない影響をステゴテキストに確実に及ぼすのに充分であることが分かっている。そのための代償は情報伝達能力の低下である。すなわち、キーの自己相関ピークはより広く、かつ低くなり、したがって所定の頑強性を得るのにより高いエンコード強度が必要になる。
【0051】
第2の問題点は徹底的な探索によって解消できる。相関関数は異なるリサンプリング速度の範囲で評価されることができ、また、最強の相関性を与える相関関数を発見することによって、どのような係数(factor:因子)でファイルがリサンプルされたかを判定することができる。残念なことに、ピッチは変化するが、全体的な時間は一定に留まるように、またはピッチは一定に留まるが全体の時間が変化するようにステゴテキストをリサンプルすることが可能である。この後者のプロセスは、例えば一作品の音楽を所定のスロットに正確にフィットさせることが望ましい放送の用途では一般的なものである。したがって、探索するための二次元空間の可能性がある。すなわち、ステゴテキストが周波数および/または時間で任意に拡張された可能性がある。キーが上記のように反復する列を含むように修正されている場合は、自己相関関数は広く、したがって可能性がある時間拡大の範囲は散在的にサンプリングするだけでよいが、それにも関わらず、計算上の負担は大きい。
【0052】
しかし、本発明はこの問題の解決方法を提供するものである。ある固定的な基点に対する拡張がキーに及ぼす影響を慎重に検討すると、拡張の相対効果はキー全体にわたって一定であることが分かる。これは、変化し、かつ上記の問題点を誘発する絶対的な効果である。この実施形態では、より高い空間周波数が更にフィルタリングされ、基点から除去されるようにキー・パターンが修正される。
【0053】
以下の説明目的のため、カバーテキスト、ステゴテキスト、およびキーを対数スペクトログラム領域内の画像と見なすことにする。「周波数」とは、これらの画像内の平均空間周波数を意味し、背後にあるオーディオの周波数のことではない。
【0054】
まず、一次元での問題点を検討する。f(t)を正弦波とし、f(t)=sin ωtとする。係数αを押し込むと、g(t)=sin αωtとなる。これらの位相角φ=αωt−ωt=ωt(α−1)で得られる。適宜に選択されたtの周囲の間隔で計算された、f(t)とg(t)の相関が、ある閾値を超えるものと断言することは位相角φを制約することと等価であるので、|φ|<φ0である。したがって、t:|ω|<φ/(α−1)tの項でωは拘束され、もしくは、αが抵抗が必要なほどの最大の拡張であるものと選択される場合は、ある正の定数Cについて1/ω>C|t|である。この関係に照らして、正弦波のタイムスケールτに関して述べる方が簡明である。ただしτ=1/ωである。
【0055】
ここで、拡張した場合にそれ自体と相関する関数の周波数内容を指定することが可能である。これはタイムスケールの閾値よりも短いタイムスケールを有する周波数成分を含んでいてはならず(τ=C|t|)、ただし定数Cは所望の拡張抵抗の程度を設定する。このような関数はホワイト・ノイズ信号を適宜にフィルタリングして除去することによって得ることができる。遮断周波数がtと反比例して変化する低域フィルタが必要である。このようなフィルタを以下では「掃引」フィルタと呼ぶ。
【0056】
この実施形態で既に説明したように、連続的なデータ・ビットに対応するキーは重複される。キーの1回のコピーによって特定の時点に存在する周波数成分と、以前または後続のコピーによって存在する周波数成分との重複を最小限にするため、キーには高域フィルタも適用される。したがって、全体的な効果は帯域フィルタの効果となる。高域フィルタの遮断周波数は、隣接するキーの低域特性と適合するように掃引される。このことは図8のグラフに示されている。タイムスケールに関して一定である「帯域幅」△は△=CTで得られ、Tはカバーテキストに対するキーの連続的な適用間の間隔である。図9は4つの連続するビットd0、d1、d2、およびd3のためのキーのコピーがどのように重複するかを示している。
【0057】
このような上記の種類の掃引帯域フィルタを、ホワイト・ノイズ信号に適用した結果の例が図10に示されている。
【0058】
同様にして、二次元キーも二次元のホワイト・ノイズ・パターンから生成することができる。前述のように変化する特性を有するフィルタは各次元に別個に適用される。フィルタリングの後、−1≦K(t,f)≦+1の条件を実現するために、データ値は非線形関数を通過するようにされる。この実施形態では正弦(sine)が用いられる。
【0059】
その結果として生ずるパターンの例が、図11のパワー・スペクトログラムに示されている。ここでは、軸は「時間」と「周波数」(ここではオーディオ周波数の意である)である。これらは、キーが適用される図3のスペクトログラムの軸と適合している。時間方向での基点はキーの中心にあり、一方、周波数方向での基点は最上部にある。図11の右側の列は図3のスケール列と同様の機能を有している。
【0060】
この実施形態はX軸に沿ってだけではなく、Y軸に沿っても帯域フィルタによるフィルタリングを適用しているが、キーのコピーはその方向には重複しないので、低域フィルタによるフィルタリングでも充分であろう。帯域フィルタではなく低域フィルタを使用することによってキーの情報伝達能力を高めることができる。
【0061】
上記の方程式中の定数Cの値が増大すると、生成されるキーはより大幅な拡張に耐えるようになる。高域フィルタおよび低域フィルタの特性は互いに類似するようになり、したがってフィルタの帯域幅はより狭くなる。これによってキーの情報伝達能力は低下する。したがって、拡張に対する抵抗と情報伝達能力との間で調整(trade off)がなされる。この実施形態では、ピクセル当たりC=0.15(サイクルごとのピクセル)であり、このように生成されたキーは、時間方向にも周波数方向にも約±6%まで拡張があっても充分良好に作用する。Cの上記の定義はピクセルに関していることが分かる。この文脈では、ピクセルという用語は、スペクトログラムの水平方向でのフィルタリングと、垂直方向でのフィルタリングを検討する場合には意味が異なる。
【0062】
水平方向ではピクセルという用語はスペクトログラムの列間での時間間隔を意味するものとして用いられる。垂直方向でのフィルタリングを考える場合は、ピクセルという用語はスペクトログラムの2つの隣接する行の周波数差を意味するものとして用いられる。
【0063】
したがって、図11では水平ピクセルは約23ミリ秒であり、垂直方向のピクセルは約22Hzである。
【0064】
したがって、低域フィルタの帯域幅にτ>C|t|を用いる際には、τはサイクルごとのピクセルで計測され、tは基準点、すなわち基点からの前述で定義されたように、ピクセル内で測定された当該のスペクトログラムのポイントのXまたはY座標を表す。図11では基準点は画像の上縁の中心にある。この基準点はゼロ周波数に対応するように選択されたものである。他の基準点を選択することもできるが、ゼロ周波数の条件が好適である。
【0065】
周波数と時間の双方におけるある範囲での拡張後の標準的なキー自体の相関性のピークが図12に示されている。数値はキーのピーク自己相関が1になるように正規化されている。
【0066】
キーとステゴテキストとの間の二次元相関を計算すると、ステゴテキストが周波数範囲で拡張した場合、相関のピークは線y=0からわずかに移動することがあることが判明する。このような理由から、この実施形態は二次元相関を用いている。すなわち、y方向にわずかにずれた関数の値が互いに加算されて、ビット・シンクロナイザを通過する一次元関数が形成される。
【0067】
ここで図23を参照すると、この図はキーKの生成の流れ図を示している。
【0068】
ステップK1では、シード整数が入力され、ステップK2でこの数値が、均一に分布する乱数を生成するTauswortheジェネレータに供給される。Tauswortheジェネレータ出力は、ボックス−コックス方式によって一次元ガスウ分布乱数へと変換されるようにステップK3で供給される。X=32、およびY=1024であるキーでは、このような乱数は32768になる。Tauswortheジェネレータおよびボックス−コックス方式によって実行されるプロセスは、1988年にClarendon 出版によってオックスフォード科学出版叢書で刊行されたJohn Dagpunar 著の書籍「ランダム変数生成の原理(Principle of Random Variate Generation)」に詳細に記載されている。
【0069】
ステップK4で、32768の乱数が32×1024の乱数の二次元アレイへと再構成される。
【0070】
ステップK5で、前述の二次元掃引フィルタリングが実行される。
【0071】
ステップK6で、データ値は−1≦K(t,f)≦+1の条件を実現するために、データ値は非線形正弦関数を通過するようにされる。
【0072】
最後に、ステップK9で、キーをエンコーダまたはデコーダで直接使用するか、または適宜の読み出し可能メモリに記憶しておくことができる。
【0073】
上記のプロセスは全て、300に示すように適宜にプログラムされたコンピュータによって実行され、CD、ROM、DVD、ディスク、テープ、またはその他の任意の適宜の記憶媒体とすることができる記録媒体301に記憶されることができる。
【0074】
これまで本発明に基づくカバーテキストのエンコーディングの基本ステップおよび原理を説明してきたが、図13はエンコーダのブロック図を示している。
【0075】
上述の各図と同様に、(10)はこの実施形態ではエンコードすべき音楽であるカバーテキストを表し、(15)は最終的なステゴテキストを表す。
【0076】
回路(51)において、カバーテキストは対数絶対値スペクトログラムへと変換される。
【0077】
このようにして生成されたスペクトログラムはFFT回路(51)に供給され、そこで受信されたスペクトログラムはクロック(52)によってスペクトログラム・バッファへとクロックされる。FFT回路(51)は、入力されたスペクトログラムの重複分割と、図6で説明したウインドウ機能とを実行する。クロック(52)によって、スペクトログラム・バッファ(53)のコンテンツがスペクトログラム形式で、この実施形態では256または32列であるキーの長さに等しい音楽量を表すことが確実にされる。
【0078】
エンコードすべきデータは、(55)で、前述のように同期化フラグを加算し、かつゼロ詰め込みを実行するために回路(54)に供給される。
【0079】
回路(54)の出力は、図5を参照して説明したエンコーダに対応し、かつ(57)で必要な多項式が供給される畳み込みエンコーダ(56)に供給される。
【0080】
キー・マトリクスは、(58)で回路(59)へのエンコーダに供給され、そこではキー・マトリクスはスペクトログラム・パッファ(53)内に保持されているスペクトログラムへと直接乗算できる数値のセットへと変換される。これらの値は2つのマトリクスの形式をとり、一方はゼロ・ビットをエンコードするためであり、他方は1ビットをエンコードするためのものである。これらのマトリクスはキーの真数、およびキーの真数の逆数である。これらのマトリクスを、保持されたスペクトログラムへと乗算する動作は、対数スペクトログラム領域内で加算または減算する動作と等価である。
【0081】
キーがバッファ(53)のコンテンツを変調する強度は、入力(60)によって決定される。この入力は方程式2の実定数sに相当する。
【0082】
2つのマトリクスは、(61)で示すようにスペクトログラム・バッファ(53)のコンテンツと選択的に乗算され、この選択は、バッファ(53)内に記憶された音楽が単一のデータ・ビットでエンコードされるように畳み込みエンコーダ(56)の出力に従って行われる。バッファ(53)のコンテンツは、IFFT回路(62)へと書き込まれた各ビットごとに1クロックの周期だけシフトされるので、主エンコード・ループは書き込まれた各ビットごとに一度実行される。
【0083】
IFFT回路(62)の出力はクリップ防止バッファ(63)に印加される。これは、データが音楽ファイルとして読み出される時に、回路(62)から読み出されたデータが確実にクリッピングしないようにするためである。クリッピングが起こりそうな場合は、出力のボリュームを漸減させて、クリッピングがかろうじて回避されるように、振幅変調曲線が生成される。そうすることが安全ならば、ボリュームはこの場合も漸次に規準まで増加させる。
【0084】
最後に、クリップ防止バッファ回路(63)から出力がステゴテキスト(15)として出力される。
【0085】
図13はスクランブラ65をも含んでいる。可能な多くのスクランブラを使用できるが、標準的なものはCCITTのV32規格に記載されている。スクランブラを含めることは、畳み込みエンコーダと同様にオプションである。
【0086】
上記の説明は、簡潔にするために単一のキーを使用するものとして記載した。勿論、各キーが異なるシード整数によって生成された1つ以上のキーを使用してもよいことが理解されよう。付加的に、ステゴテキストを電子透かし処理するためにキー(単数または複数)の倍数を用いることが可能である。上記の実施形態では倍数は「1」であるので、キーの倍数に言及される場合は常に、倍数が「1」であってよいこと、すなわちキーはその符号は別にしても不変のままに留まることが示唆される。
【0087】
ステゴテキストを電子透かし処理するために、または電子透かしコードを検索するために、2つ以上の異なるキーを使用する実際の方法は、本明細書に記載された実施形態と全く同類である。したがって、1つ以上のキーがある場合は、いずれかの時点でどのキーが(61)でスペクトログラムへと乗算されるかはエンコードすべきデータに従って定まる。スペクトログラムを変調するために±1以外の倍数が用いられる場合は、その都度、1ビット以上をエンコードすることが可能である。勿論、デコーディングには同じ倍数のセットが使用される。
【0088】
本発明によるエンコーダの実施形態を説明してきたが、ここで、コード化されたデータを復元するために圧縮または拡張されることがあるステゴテキストのデコーディングの問題に焦点を当てることにする。
【0089】
カバーテキストのパワー・スペクトルを変調するために、図13のエンコーダで用いられるキーの特性を説明してきたが、電子透かしデータを抽出するためにステゴテキストをデコードする場合、キーとステゴテキストのパワー・スペクトログラムとを相関させることによってデータ・ビットを特定できることが理解されよう。ステゴテキストが侵害にさらされておらず、またはそれ以外の理由で拡張または圧縮されていない場合には、データに従って補正されたこれらの対数要素でステゴテキストとキーとに明確な相関がある。
【0090】
前述のキーは、垂直または水平のいずれかの方向でステゴテキストの±6%の拡張を含むステゴテキストの歪みに対処することができる。
【0091】
ステゴテキストがキーによって許容される±6%以上の拡張を受けた場合に対処するために、いくつかのアプローチが可能である。
【0092】
しかし、本発明の実施形態は直接的な相関を含まない別のアプローチを採用しており、次にそれを詳細に説明する。デコーダの実際の回路を説明する前に、まず、それに含まれる原理を基本的に説明する。
【0093】
世界中のほどんどのデモジュレータおよびデコーダは、望ましい信号は加算ノイズ、ホワイト・ノイズ、固定ノイズ、およびガウス・ノイズであるノイズによって損なわれるということを前提にして最適であるように設計されてきた。そのほとんどが、任意の個々の時間で1つの実際値だけが受信されるという意味で一次元であり、いくつかは二次元である。この実施形態では、任意の時点でスペクトログラム列全体の形式の多くの実際値が受信される場合に信号が発生される(encountered)。
【0094】
任意の個々のサンプルについて、そのサンプル内のノイズ値の周辺確率分布(すなわち他のサンプルの値が何であるか不明である場合に認められる分布)がガウス分布、正規分布、または平均ゼロ分布である場合に、そのノイズはガウス・ノイズと呼ばれる。
【0095】
ノイズのフーリエ・スペクトルが検討された場合に、そのスペクトルの任意の個々の要素の周辺確率分布が他の任意の要素の周辺確率分布と同一である場合は、そのノイズはホワイト・ノイズと呼ばれる。
【0096】
任意の時間領域サンプルの周辺確率分布が他の任意のサンプルの周辺確率分布と同一であり、所定の長さのノイズの任意の1つの抜粋の結合確率分布が他の任意のこのような抜粋の結合確率分布と同一である場合、そのノイズは固定ノイズと呼ばれる。
【0097】
ほとんど全ての場合、これらの前提の全てはある程度まで破られる。一般にこのことは重要ではない。しかし、本発明では、上記の前提からの例外は極めて重要であり、したがって詳細に説明する。
【0098】
例えば、スチューデント・ノイズは非ガウス一次元ノイズの例であると見なすことができる。スチューデント分布は、各サンプルごとに標準偏差が異なること以外はガウス分布と同様である。特に、逆変数はガンマ分布からのサンプルごとに新たに引き出される。
【0099】
図14および15は、変数1の一次元ホワイト・ガウス・ノイズの抜粋と、(1に等しい関連するガンマ分布の形状パラメータmを有し、変数1をも有するようにスケーリングされた)一次元ホワイト・スチューデント・ノイズの抜粋をそれぞれ示している。双方とも同じ変数を有しているが、見かけは全く異なる。スチューデント分布ノイズはある種の大きなスパイク(spike:ピーク)を有しているが、これはガウス分布ノイズでは極めて稀にしか発生しないであろう。
【0100】
このことは、ノイズが衝撃ノイズである場合、および異常値が(ガウスの前提の下で)適正とは程遠い結論を余儀なくさせるような状況では問題である。
【0101】
発生の頻度が低い非ガウス・ノイズの別の例は、各々がガンマ分布されている2つの数量の比率の対数として分布されているノイズである。このようなノイズは下方へのスパイクを多く有しているが、上方へのスパイクはない(または逆である)。このようなノイズはオーディオの電子透かし処理の問題に関連があることが判明している。
【0102】
非ホワイト性は直ちに分かる程度以上に乱されることがある。その例がカラー・ノイズである。これはある周波数が他の周波数以上に存在するが、ノイズが固定的であるようなノイズである。典型的には、低周波数が最も多くを占めるピンク・ノイズ、他の周波数がフィルタリングされて除去される帯域制限ノイズ、およびパワー・スペクトル密度が、ゼロよりも高いある限度まで低下した周波数と反比例する「1/f」ノイズがある。
【0103】
しかし、一般に、他の種類の非ホワイト・ノイズがある。
【0104】
その一例が一次元非固定ノイズである。1つの次元だけが考慮される場合は、このノイズは非固定ノイズであり得る。例えば、断続的な熱源に近づきすぎるレジスタからのノイズである。または、(「カラー」の変化ならびに時間と共に振幅の変化を引き起こす)可変キャパシタンスを含むフィルタの後に記録されたノイズである。
【0105】
一方、信号が多次元である場合は、異なる次元でのノイズは、信号(単数または複数)が時間に対して固定的であるとしても、そのノイズに相関性があることがある。あるいは、あるチャネル/次元でのノイズが他のチャネル/次元でのノイズよりも大きい振幅を有することがある。勿論、音楽の対数絶対値のスペクトログラムを除外することがまさに不合理であるように、これも時間に対して非固定的である多次元ノイズを止めるものはない。
【0106】
一般に、これらの前提のいずれかを破ることは、ステゴテキストから電子透かしをデコードすることの試みに際して重要であるだろう。しかし、関心点が本発明に関わる種類の電子透かしをデコードする際の、特に音楽での強靱さにあるならば、非ガウス性はそれほど重要ではなく、一方、信号間の相関と、異なる周波数成分と異なる周波数での振幅変化との相関の、双方の相関の形式の一般的な非ホワイト性は極めて重要であることが実験により明らかに判明している。非ガウス性を考慮に入れたデコーダは、計算に際して様々な中間変数にとってより検知可能な数値を生成する上で利点があり、一方、非ホワイト性を考慮に入れないデコーダは性能が低下し、メモリおよびフロップを浪費する。
【0107】
従うべき基本は多次元ガウス分布の概念である。xを実数のNベクトル(すなわちNの要素を有する列ベクトル)であるものと仮定する。μがx(同じくNベクトル)の分布の平均であるものとする。
【0108】
ここで、一次元の場合に標準偏差を表す変数σ(あるいは1/σ2 を表すs)があるのと全く同様に、N次元の場合は、実数のNxNマトリクスsがあり、これは一次元の場合と同様であるが、より複雑なsの役割に対し、より単純な役割を果たす。
【0109】
まず、Xの分布がμを中心として球対称(すなわち円対称)である二次元の場合を検討する。この場合は、μを通過する分布を横切るどのスライスも標準偏差が例えばσである一次元ガウス分布と類似して見える。この場合は、SはI/σ2 であり、ただしIは単位マトリクスを表す。分布が円対称ではなく、座標軸の1つと位置合わせされた楕円の長軸と楕円対称である場合は、Sは2つの対角要素が異なり、かつ正である対角マトリクスとなる。楕円が座標軸と位置合わせされていない場合は、Sは全てのエントリが非ゼロであり、対角要素が正である2x2の対称マトリクスになる。Sの逆数Vは分布の共分散マトリクスとして知られており、Sはicovマトリクス(icov:逆共分散の略語)と呼ばれる。
【0110】
Sは更に他の重要な特性を有している。これは任意の非ゼロベクトルYについてy’syが正のスカラになることを意味する正定(positiv definite) である(ここで’は移項を表す。y’syは常にスカラであるが、Sが正定であり、yがゼロではない場合に常に正であることだけが保証される。)
【0111】
N次元の場合は、「円」の代わりに「N次元の球」に、および「楕円」の代わりに「N次元の楕円面」になることを除いては、同じ画像が保持される。
【0112】
この場合は、このような密度の確率分布の公式は下記になる:
【0113】
【数5】
【0114】
ここでゼロ平均の「ランダム」N次元のガウス分布を考慮する必要があるものと仮定する。「ランダム」は勿論、どの分布から引き出されるかが言明されない限りは実際の意味を持つものではない。必要なことは、ゼロ平均を伴うN次元ガウス分布上の分布である。それが意味するのはicovマトリクス上の分布の必要性である。または、正定の対称的なNxNマトリクスS上の分布の必要性である。
【0115】
これらの要求基準を満たす分布の1つがウィシャート分布である。
【0116】
ウィシャート分布は(N以外に)2つのパラメータを有している。すなわち、「緊密度」または「形状」パラメータであるkと、「スケール・マトリクス」であるVである。kはN−1より大きくなければならない。これが大きい程、その平均を中心とした分布は緊密になる。Vは正定で、かつ対称でなければならない。平均はkV −1 である。密度は下記となる:
【0117】
【数6】
【0118】
Nが1である場合は、これはガンマ分布にまで劣化する。しかし、mおよびrがガンマ分布の形状およびスケール・パラメータである場合は、Vは2rであり、kは2mである。
【0119】
一次元のスチューデント・ノイズを以前説明した際に、各サンプルごとにガンマ分布からs=1/σ2 の新たな値が引き出されることに言及したが、その場合、実際のサンプルはゼロ平均と逆共分散sとを伴う一次元ガウスから引き出される。
【0120】
その場合、多次元スチューデント・ノイズを生成する1つの方法は、新たに各サンプルごとに新たなicovマトリクスSを引き出すことであり、その後で、ゼロ平均およびicovマトリクスSを伴う多次元ガウス分布からサンプル自体が引き出される。各新たなicovマトリクスは、ある適宜のパラメータkおよびVを伴うウィシャート分布から引き出されるものとする。
【0121】
上記のウィシャート分布のスケール・マトリクスVが何らかの正の実数rのための形式rIのスケール・マトリクスである特殊な場合は、このスチューデント分布は球対称であり、下記によって得られる:
【0122】
【数7】
【0123】
したがって、基点からのxの距離Rの確率密度は下記のように表すことができる:
【0124】
【数8】
【0125】
ここで音楽の対数絶対値スペクトログラムが実際にどのように見えるかが分かる。これは多次元スチューデント・ノイズとしてモデリングすることができるが、やや異なるモデリングがなされればより良好な適合が得られる。全てのサンプルについて新たなicovマトリクスを引き出す代わりに、ビット周期ごとに1回、またはより少ない頻度で、新たなicovマトリクスが引き出される。次に、結果として生じた準スチューデント分布からの各サンプルが、スペクトログラムの1列と見なされる。これは、以下に明らかにされる理由から「detV」分布と呼ばれる。
【0126】
関連するウィシャート分布のパラメータがいかなるものであるべきかの問題については、本明細書で後に扱う。しかし、理想的にはこれらのパラメータはある種の広範な音楽の集成に関して決定されるものであるが、実際には、出会う可能性がある種類の音楽の代表的なものを含んでいれば、少数の作品だけを用いたとしても恐らくは大きな相違にはならないであろう。「残存する不確実性」は、Nよりも大幅に大きくないkを有するウィシャート分布によって処理することができる。
【0127】
ウィシャート・スケール・マトリクスVが極めて小さい単位倍数(multiple of the identity)(実際にはe−12 I)であるような特殊な場合は、「detZ」分布と呼ばれる。この場合「Z」はゼロを意味する。
【0128】
上記のように背景を説明をしてきたが、ここで、本発明に従って生成されるステゴテキストをデコードするために使用できるデコーダの特性を定義することができる。各デコーダは、特定のノイズのモデル(すなわちカバーテキストまたは音楽)用の最適なビット・バイ・ビット式メモリレス・デコーダとして設計されている。したがって、各デコーダは何が受信されたかに鑑みて、当該のデータ・ビットでのベイズ事後分布を計算し、次に最高の事後確率を有する値(0または1)を選別する。ここで「最適」という用語は極めて特殊な意味を持つことに留意されたい。すなわち、デコーダは、それが実装コストが最も安価なデコーダであるか、あるいは最も高価なデコーダであるかに関わらず、最良の出力を生成するデコーダである。
【0129】
このようなデコーダは明らかに、モデルが正確である場合に限って実際に最適なものになる。そうでなければ、チャネルの有効キャパシティが低減する。
【0130】
このように、相関関数を用いてデコーダを実施することができ、一方、「ノイズ」が固定ノイズ、ホワイト・ノイズおよびガウス・ノイズであるという前提で、ビット・バイ・ビット式メモリレス・デコーダを生成するためにFFTを用いて実施することができる。実際には、信号強度が0.005にまで低減された場合にキャパシティは大幅に損失する結果になる。この損失は、キーの低周波成分を全て放棄することで、ある程度までは緩和されるが、それでも相当な損失である。
【0131】
したがって、説明しようとするデコーダの実施形態には、時間が固定であるように、また周知のicovマトリクスを有するように限定される非ホワイト多次元ガウス・ノイズとしてノイズを定義するノイズ・モデルへの変更が含まれる。
【0132】
デコーダはこのノイズ・モデル用に極めて簡単に実施することができる。周知のicovマトリクスSが採用され、Cholesky分解がなされ(すなわちC’C=Sであるようなその三角正定移項平方根C)、受信された信号の対数絶対値スペクトログラムとキーの双方にCが事前乗算される。Cを事前乗算するプロセスは前提とされている非ホワイト・ノイズをホワイト・ノイズに変換するので、このデコーダを「ホワイト化されたガウス」デコーダと呼ぶことができる。
【0133】
このデコーダはicovマトリクスSがまさにノイズをモデリングするマトリクスS(すなわち音楽の対数絶対値スペクトログラム)である場合に良好に動作する。その理由を理解するため、ノイズをN空間内の極めて細長い楕円面であるとみなしてもよい。このデコーダは楕円面を球面に拡張することによる一方で、伝えられた信号を同時に各方向に同じ量だけ拡張することによって動作する。その結果、楕円面の最短軸と平行な信号部分がノイズを越えて著しく拡張され、したがって容易に復元可能である。
【0134】
しかし、使用しているSが、電子透かしがデコードされている音楽のSではない場合は、このデコーダに問題が生じる。このことが生じる理由は直観的には、ノイズを球面に拡張する代わりに、別の細長い楕円面に拡張し、したがってノイズの絶対的な大きさが、課意宇町された信号の大きさと比較して大きいままであるからである。したがって、この方法は非常に少なく見積もっても、電子透かしを読み取る時点で各々の音楽作品ごとに適正なicovマトリクスを利用できることが必要となり、既にこれだけでも相当に不利である。
【0135】
しかし、動作が対数絶対値領域で行われることから、状況は上記よりもさらにいっそう悪い。時間領域の音楽信号にホワイト・ガウス・ノイズが加わることによる歪みを検討してみる。動作が時間領域で行われる場合、それは単に楕円面の狭い寸法の全てをわずかに広げるだけであろう。しかし、これが対数絶対値スペクトログラム領域において当てはまる場合、加算された歪みノイズは、音楽のスペクトル内容に厳密に比例したままであるように、スペクトル内容を常に変更しなければならないであろう。これは事実とは異なるので、より複雑な挙動が予測される。この挙動は楕円面を1つまたは複数の異なる方向に回転させることを含み、デコーダは、異なる音楽作品のicovマトリクスを使用した場合とまったく同様に失敗することが判明する。
【0136】
これらの問題点を解消するため、これから説明するデコーダは「detV」分布、すなわちウィシャート分布から引き出され、1ビットの周期にわたって局所的に一定である未知のicovマトリクスを有する多次元ガウス・ノイズ分布を使用する。これは、デコードしている音楽の元のicovマトリクスも、分布内に発生した歪みがそれに及ぼす正確な影響も判明していないが、このようなマトリクスが存在することは分かっているという事実を考慮するものである。
【0137】
したがって、説明されるデコーダはこのノイズ・モデル用の最適なデコーダになるように設計されている。したがって、以下に説明されるデコーダの実施形態は、所定の受信信号で各データ・ビットの事後分布を計算する確率的なアプローチを採用する。そのために、説明されるデコーダはベイズの理論を用いる。
【0138】
このように、各々がNの要素のベクトルである対数絶対値スペクトログラムのM列である信号が1ビット周期中に受信されたものと考えてみる。
【0139】
ノイズ分布の平均値はゼロであるものと想定される。スペクトログラム全体の実際に観測された平均値が差し引かれるものと想定すれば、これは平均値が不明であり、かつそれがどのような値をも等しくとることができるとア・プリオリに信じられるということに極めて等しい。
【0140】
ここでKを、実際に使用された場合の対数絶対値スペクトログラム内のキーの値であるものとする。すなわち、これが使用された強度で既に乗算されたものとし、(かつ、対数の底としてeの代わりに10をどのように使用することも許容されたものとする)。キーが各々の高さがNであるMの列から構成されていれば、KはNxMマトリクスとなる。bを問題のビット値であるとする。簡潔にするために、重複するビットはないものと想定できるが、それがあってもなくてもデコーダにはほとんど相違がないことが判明しているので、重複するビットはないものと仮定する。完結にするため、bを1または0ではなく+1または−1であるものとする。Xを、bが電子透かし処理された音楽のM列の対数絶対値スペクトログラムからなるマトリクスであるとする。Yを、ステゴテキスト内のXに対応する受信された対数絶対値スペクトログラム列であるものとする。ここでタイミングが判明しているものと仮定する。
【0141】
ここで判明させるべきはP(b|y)である。勿論、P(b=+1|Y)/P(b=−1|Y)(またはその対数)を知ることも同様に望ましく、デコードするためにこれが1(それぞれが正)より大きい場合は、b=1となり、それ以外の場合はb=−1となる。
【0142】
起点となる情報は何であろうか? これは以下の方程式に要約することができる:
【0143】
【数9】
【0144】
【数10】
【0145】
【数11】
【0146】
【数12】
【0147】
ただし、XmはXのm番目の列であり、kとVは関連するウィシャート分布のパラメータである。
【0148】
次にデコーダは、連続的に受信されたデータ・ビットの必要な事後確率を発見するために以下の方程式で示すようなベイズの定理を適用する。
【0149】
【数13】
【0150】
【数14】
【0151】
【数15】
【0152】
【数16】
【0153】
【数17】
【0154】
【数18】
【0155】
【数19】
【0156】
【数20】
【0157】
上記で方程式13は、方程式7を呼び出すことによって方程式12から成り立つ。方程式14は方程式8を呼び出すことによって成り立つ。
【0158】
方程式15は、P(A)=∫P(A、B)dB、すなわち排反事象が結合する確率は個々の確率の合計または積分であるという基本確率理論を用いた上記の方程式から、また、P(A|B)=P(A、B)/P(B)であることを示す条件確率の定義によって導出される。
【0159】
方程式16は方程式9を用いて方程式15から成り立つ。方程式17は方程式10を用いて方程式16から成り立つ。最後に方程式18は収集係数(collecting factor)によって簡略化することによって得られる。
【0160】
方程式18の積分は例外的に複雑であるが、方程式19を生じ、そこから方程式20が成り立つ。このように、方程式20は方程式19の変形を除算することによって方程式19から得られ、ただしb=−1である変形を伴って、b=1である。
【0161】
【数21】
【0162】
【数22】
【0163】
detVデコーディグは最良のアルゴリズムの中核をなすので、ここでこの最後の方程式の右辺を評価する最良の方法を論考する。
【0164】
WをVのCholesky分解とすると、W’W=Vとなる。U=W−1とすると、U’VU=Iである。したがって、
【0165】
【数23】
【0166】
【数24】
【0167】
【数25】
【0168】
最も内側の括弧の内容に特異値分解(SVD)を適用する。SVDによってどのマトリクスも直交マトリクス、対角マトリクス、およびその他の直交マトリクスの積として書き込むことができる。SVDは、1回は分子内の括弧用に、もう1回は分母内の括弧用に2回用いられなければならない。この手順は分子だけを考慮して示されている。
【0169】
このようにU’Y−U’Kはマトリクスであり、SVDによって、LDR=U’Y−U’K(方程式24)になるように、L、D、およびRの計算が可能である。ただし、LおよびRは直交マトリクスであり、Dは対角マトリクスである。次の7つの方程式は方程式(24)から順次成り立つ。
【0170】
【数26】
【0171】
これらの方程式中、Rの直交性によって必然的にR’R=Iとなり(Lについても同様)、Lは直交かつ実数であるので、det(L)=det(L’)=±1であることから最後の行が成り立つ。
【0172】
しかし、I+DD’は対角マトリクスから計算された対角マトリクスであり、したがってその行列式は、各々を簡単に評価できる対角上の要素の積である。したがって、Dだけを知ればよく、LまたはRを知る必要はない。
【0173】
これまでデコード手順の基本原理を論考してきたが、ここで図16を参照してデコーダの実施形態を説明する。
【0174】
図16の実際のデコーダを論考する前に、デコーダ内の様々な段階を前述の理論的論考と関連付けることが可能であることが不可欠である。
【0175】
このように、Yがデコーダによって受信されたスペクトログラム・ブロックを表し、X+bKに等しいことが理解されよう。ただし、bはコードであり、Kはキーである。したがって、bとKの値が判明していれば、受信されるYが特定の値をとる確率は、Y−bKが元ののカバーテキストを表す確率と全く同じである。これが方程式(8)で表されていることである。
【0176】
ここで方程式(9)に転ずると、これはXが電子透かし処理されていない音楽のスペクトログラムである確率を表現している。この方程式で、Sは未知のicovマトリクスである。音楽がホワイト・ガウス・ノイズとして表されるべきものであるならば、方程式(9)のSは常に単位行列の倍数であるはずである。しかし、前述のように、これは実際の音楽を正確に表すものではない。このことが、本発明でicovマトリクスを使用する理由である。
【0177】
したがって、音楽作品全体ではないものの、Xの各列がこの未知のicovマトリクススSによって定義される同じ多次元ガウス分布から別個にもたらさえるものと想定される。したがって、デコーダは、音楽の異なる部分ではSが異なることを前提として動作する。方程式9はこのことを数学的に表している。
【0178】
しかし、電子透かし処理されたスペクトログラムをデコードするためには、Xがどの値をとる可能性があるかを知ることが不可欠である。方程式9は、Sの値が判明している場合だけこの情報を提供することができる。
【0179】
したがって、方程式10の機能はSがどの値をとる可能性があるかを判定することである。この方程式では、SはパラメータVとKを有するウィシャート分布に従って分布されているものと想定されている。これらのパラメータが選択される方法は本明細書で後に説明する。
【0180】
関連する基本原理を論考してきたが、ここで添付図面のうち図16を参照してデコーダの第1の実施形態を説明する。
【0181】
図16では音楽をベースにしたステゴテキストが再び(15)によって表されている。以下の説明は簡略にするために音楽だけに言及するが、勿論、他の形式のカバーテキストも同様に処理することができる。
【0182】
(100)において、カバーテキストは図6の(51、52)で開示されているウインドウ関数に匹敵するウインドウ関数でポイントごとに乗算され、(101)において、ウインドウ処理されたステゴテキストの高速フーリエ変換が行われ、これが(102)において対数領域に変換される。
【0183】
(103)において、方程式22〜25で示したマトリクスU’を表すように、既に生成されているマトリクスU’で(102)の出力が事前乗算される。U’の生成については後述する。(102)の出力をFと定義すると、(103)の出力はU’*Fとなり、これはDCオフセットがあればそれを除去するように高域フィルタ(104)に印加される。(104)の出力U’*Fは初期ステゴテキストに応じた長さの対数絶対値スペクトログラムである。
【0184】
このスペクトログラムを処理するために、これは各々がKに対応する幅を有するブロックに区分される。本実施形態および第2の実施形態では、各ブロックは時間次元で32列幅であり、周波数次元で1024行幅であるが、これらの値は勿論変更できる。区分された各ブロックは方程式23、24、および25の設定と同様にU’Yを表す。
【0185】
この区分化は、各区分ブロックが添付図面の図4に示された状況に対応してブロックの幅よりも1行だけ狭い先行ブロックと重複するように、(105)で行われる。
【0186】
上記のようにして得られた各ブロックは(106)でU’Kに加算され、(107)でU’Kから減算されるので、(108)と(109)で2つの異なる結果が得られる。すなわち、(1)左辺:X−1=U’Y+U’K、および(2)右辺:X+1=U’Y−U’Kである。
【0187】
ここで、これらの値が方程式23および24で見いだされる値に対応することが理解されよう。
【0188】
デコーダの次の段階には、方程式23の分母と分子それぞれの対数を計算することが含まれる。これは24で示された方程式を用いて達成される。段階(110、111)では、方程式23の分母と分子の対数行列式が決定され、段階(112、113)で出力された対数行列式が−((k+M)/2)でそれぞれスケーリングされる。この因数は勿論上記の方程式にもある。この因数の導出については後述する。
【0189】
段階(114)において、(112)および(113)において得られたスケリーング済みの値によって表される加算決定子の対数から分母の対数を減算することによって、方程式23の数量が計算される。
【0190】
このようにして得られた値は、1または−1のデータ・ビットが存在する場合は、当該データ・ビットの確率の対数比としてバッファ(115)に記憶される。したがって、バッファ(115)はコード・ビットのシーケンスの事後確率を保持するものと見なすことができ、シーケンスの長さはバッファのサイズによって決まる。
【0191】
バッファ(115)への個々のエントリのシーケンスを検討すると、これらのエントリは、前述したように個々の値がマトリクス処理の結果を表す、ゼロ軸を中心に分布している値からなるものである。バッファ(115)は256の計数値を保持することができるが、勿論、この数も可変である。図17はバッファ(115)に記憶された値のシーケンスを示すグラフである。
【0192】
バッファ(115)内の値は黒い曲線(150)によって表される。縦の実線151はビットがエンコードされた時間を表す。これらの時間は後述する様式でクロック抽出回路(116)によって決定される。
【0193】
ここでバッファ(115)からオリジナル・コードを表す値を抽出することが必要である。この場合も、元のステゴテキストは拡張または圧縮されることがあるので、コードのビット速度の抽出はこのことに考慮しなければならないことを理解しなければならない。
【0194】
これはクロック抽出回路(116)で実行される手順である。ここでは可能性があるスライス・ポイントのあらゆるシーケンスが考慮され、ゼロからの総合偏差が最大であるポイントのシーケンスが、埋め込まれたコードのためのクロックとして選択される。
【0195】
ネストされた一対のループが、可能性があるビットのクロック周波数、および位相のオフセットにわたって効果的に反復される。各々の反復で、スライスされた値の二乗和が計算される。この和が最大になるような周波数と位相の値が、クロックを表す標識の集合として段階(117)に戻される。
【0196】
段階(117)において、バッファ(115)内で最初と最後の値が発見されると予期される場所を指示するために2つのポインタが使用される。これらは、データがブロックからブロックへとスライスされて、ギャップや繰り返しなく抽出されたビットを共に結合できるように処理される。事後確率ベクトルはスペクトログラム・バッファ(105)内のデータと同じ速度でシフトされる。
【0197】
クロック抽出回路(116)によって生成されたクロックは(117)で、読み取られるべきデータをバッファ(115)からバッファ段(118)へとスライスするために使用される。オリジナル・キーは5列間隔でカバーテキストの対数絶対値スペクトログラムの32列に加算されたことが理解されよう。したがって、デコーディングの前にステゴテキストが圧縮または拡張された場合でも、コード・ビットはバッファ内に記憶された値のシーケンスのほぼ5列目ごとに予期される。しかし、抽出されたクロックに応答して緩衝記憶されたデータをスライスした結果は、音楽がdetV分布を有していることをデコーダが想定している限りは、依然として充分に正確なオリジナル・コードの表現ではない。前述したように、これは完全な真実ではない。したがって、5列間隔のポイントのあるものは誤っている場合がある。したがって、元の音楽がdetV分布ではないことが許容される必要がある。
【0198】
まず段階(118)への出力を検討する。これは、log(P(bn=1|Yn)/P(bn=0|Yn))
であることを意味する値のシーケンスからなっている。
【0199】
これは音楽が実際にdetV分布を有していれば必要なシーケンスであろう。しかし、既に説明したようにそうではない。
【0200】
C1,C2,...Cnを段階(117)から出力された値のシーケンスであると定義すると、音楽がdetV分布を有していれば、Cn=log(P(bn=1|Yn)/P(bn=0|Yn))
となる。
【0201】
音楽はdetV分布を有していないので、f(Cn)がCnよりもその対数により近似しており、したがって、より適正なシーケンスをデコーダのエラー補正デコード段(120)に入力できるような関数fを発見することが必要であり、その際に、エンコーダで電子透かしコードが付加的にエラー補正コードでエンコードされたことが理解されよう。
【0202】
データ・スライス段階(117)の出力は正の値の可能性「+1」と負の値の可能性「−1」とを有するゼロのいずれかの側の一連の値である。
【0203】
各々の「+1」の値はαといわれる値から偏差している。同様に各々の「−1」の値は−αから偏差し、αはCnの絶対値平均に等しい、すなわちα−平均|Cn|であるものと推定される。
【0204】
正のCnがαと異なり、負のCnが−αと異なる数量も推定される必要がある。この値はσであると定義されるので、σ=std(|Cn|−α)
となる。
【0205】
ここでσが得られたので、元のの値C1,C2,...Cnが段階(118)でスケーリングされ、その結果、これらの値は+または−α/σに対して標準偏差1を有する。これは方程式an=Cn/σおよびβ=α/σによって要約される。
【0206】
したがって、hn=|an|−βである場合、hn は平均値ゼロ、および1の標準偏差を有するが、必ずしもガウス分布されているわけではない。
【0207】
本実施形態では、hnが既に論考した種類の一次元スチューデント分布であるものと想定されている。したがって、
【0208】
【数27】
となり、
【0209】
その結果、
【数28】
となる。
【0210】
方程式26から、必要な
【数29】
が成り立つ。
【0211】
ここで値rとmの導出について説明する。これは実際に典型的に見られるhnの値の大サンプルを収集し、かつ方程式(25)を用いて、hnの個々の値と、mおよびlog(r)での不適切な均一な事前分布の尤度としてMAP推定を実行することによって行われる。
【0212】
したがって、段階(118)において方程式28を用いて、計算された対数尤度比のベクトルを含む「尤度」マップと呼ばれるものを得るためにデコードされた加算された、エラー補正エンコーディングを最終的に有している必要がある補正されたシーケンスが計算される。
【0213】
図18は前述したばかりの手順によってバッファ(115)の内容から導出される対数尤度マップを示している。参照番号150、151は図18では図17と同じ意味で用いられている。
【0214】
図16のデコーダの最終段は従来のものである。
【0215】
図5に示した畳み込みエンコーダは各入力コード・ビットごとに2つの出力ビットを生成する。
【0216】
したがって、回路(118)の出力に存在する2ビットごとに、どのビットが所望のコードの一部であるかについて判定を行わなければならない。
【0217】
この機能を実行するため、最も簡単な形式の畳み込みデコーダ(120)は可能性がある各出力ビットを吟味し、このような各ビットについて固定ウインドウ内の周囲のビットの考え得る値を全て検討する。この手順は位相探索回路(119)で行われる。ウインドウのサイズは性能と計算量との調整によって定められる。例えば、バッファ内に10の値を含むウインドウの場合は、全部で1024のシーケンスが評価されなければならない。
【0218】
1024のシーケンスの各々について、関連するビットが+1であるか−1であるかに応じてバッファ内の関連値を加算または減算することによって、そのウインドウにわたるバッファ内の値の確率が計算される。
【0219】
検討中の位置に+1を有する512の全シーケンスの確率が加算され、また、関連位置にゼロを有する他の512のシーケンスが加算される。それによって検討中のビットが1であるか0であるかの確率が得られる。
【0220】
この手順は図19に示されている。この図では(250)は回路(118)からスライスされた値の概略的な表現である。win1は10値ウインドウを表し、7は当該ピクセルを表している。wini+2はこのシーケンス内の次のウインドウを表し、8は当該値の次のピクセルを表している。最後にViは当該ピクセル7について実行されたばかりの評価の結果を表し、Vi+2は次の評価の結果を表している。
【0221】
図19に示すように、図5の畳み込みエンコーダの出力は各コード・ビットにつき2つの出力ビットを供給するので、ウインドウはバッファの内容に沿って2ビット間隔で段階付けされる。この手順は、バッファ内のそれぞれの偶数値および奇数値にわたって2回実行されなければならない。このようにして、各々が関連する確率を有する2つのシーケンスが生成され、最後により確率が高いシーケンスに基づいて選択がなされる。
【0222】
これまで説明してきたのは最も簡単な形式のエンコーダ/デコーダである。
【0223】
しかし、2対1以外の他の何らかの比率を有することが有利であろう。
【0224】
例えば比率が4対1である場合は、ウインドウがバッファ内の4つの値について均一かつ連続的に段階付けされた4つのシーケンスを用い、かつこれらのシーケンスから最も確率が高い出力ビットを選択することが必要であろう。
【0225】
同様に、ビタビデコーダのように、コードをデコードできる他の方法もあることが当業者には明らかであろう。
【0226】
エンコード段階で用いられるデコーダ多項式に対応する多項式が120’において最大尤度デコーダ120に供給され、最終的に加算された同期化ビット、およびゼロ詰め込み中に加算されたゼロは(120)において除去されて、デコードされたデータが残される。図13の任意のスクランブラ(65)がエンコード・プロセスで使用された場合にのみ、デスクランブラ(122)が必要である。
【0227】
添付図面の図20はデコーダの別の実施形態を示している。図20のデコーダは図16のデコーダと共通の整数の大部分を有していることが分かるであろう。したがって、これらの共通の整数が出現する場所には同じ参照番号が用いられている。
【0228】
図21のデコーダの動作の基本はベクトル空間内での投影マップの概念である。
【0229】
図面中、図21は二次元ベクトル空間から一次元部分空間への直交投影マップfを示している。
【0230】
この図ではランダムなポイントの集合v1、v2、v3、v4、およびv5が関数fによって単一の線、すなわちLが付された直交線へとマッピングされている。
【0231】
概略的に、vをv1・v2と書かれたドット積を有する実N次元ベクトル空間とする。Vへの投影マップは以下の方程式を満たすf・V→Vである。
任意のv1、v2、v3∈vおよび任意の実数rについて、
rf(v)=f(rv)
f(v1+v2)=f(v1)+f(v2)
f(f(v))=f(v)
である。加えて、任意のv1、v2∈vについて、
f(v1)=0→v1・f(v2)=0
であるならば、直交投影マップといわれる。
【0232】
Vの部分空間Wは、任意のw1、w2∈w、および任意の実数rについてrw1+w2∈WであるようなVの部分集合である。Vの各々の部分空間Wごとに、fwのWへの正確に1つの直交投影マップが存在する。
【0233】
例えば、Nは2であってよく、vは全ての実2−ベクトルの集合でよく、wはその最初の要素が第2の要素の2倍である全ての2−ベクトルの集合でよい。図19ではWは線Lで表され、ランダム・ポイントは点線で、fwの下のW内の画像へと結合されている。
【0234】
図13のエンコーダ、および図16のデコーダのような、説明してきた本発明の実施形態は全て、計算の要件は低減するが、特にステゴテキストからコードを抽出する場合に必要な情報は保持するいかなるマトリクスの操作も相当な価値があるように、対数絶対値スペクトログラム内の値のマトリクスが操作されていることに基づいて動作することが理解されよう。ベクトル空間における前述の投影マップの概念がこのようなツールを提供する。したがって、Aを列間隔がWであるマトリクスとすると、fw(v)=BvであるようなマトリクスBが存在する。
【0235】
以下はMatlab(RTM)プログラミング言語を用いた、必要な投影マトリクスの計算方法の一例である。
【0236】
Aを列間隔がWであるマトリクスとすると、fw(v)=Bvであるように以下のMatlabステートメントによって計算できるマトリクスBが存在する。
【0237】
%ここでDの対角上の比ゼロ要素を1に置き換え
%DをLと同じサイズになるようにゼロで埋める
d=diagfrom(D);
dnnz=sum(dkey>1e−10*dkey(1));
D1=diagsz(ones(dnnz、1)size(L));
%Bは基底L内のV内の任意のvの成分を計算することによって動作し、
%Vと直交する成分をゼロにし、
%次に直交座標系に戻る
B=L*D1*L’;
これらのステートメントの最後の行をB0で置き換えると
=L(:、1:dnnz)’;
【0238】
このように、B0は投影マップfwを実行するだけではなく、勿論W=Vであるという些細な例外を伴って、V用の直交座標系よりも次元が少ないW用の直交座標への切換えも行う。
【0239】
図16のデコーダ、およびこのデコーダの動作に関連する方程式を論考する際に、U’Yは以前計算されたカバーテキストと同様のサンプルの統計によって補正されたステゴテキストのセグメントの対数絶対値スペクトログラムを表したものであることが想起されよう。WがU’Yの列によって埋められた部分空間を表し、この受信データが図21の簡単な例で論考したようにWへと直交投影されると、電子透かしコードを抽出するために必要な計算は、新たな部分空間へのYの投影によって情報の過剰な損失が生じない限りは大幅に簡略化することができる。
【0240】
このような投影を実行することは攻撃に対するステゴテキストの頑強性をほとんど損なわないことが判明している。
【0241】
このように、方程式25を再び検討すると、投影B0を実行することによって今度はdet(I+B0U’Y−B0U’K)(B0U’Y−B0U’K)’)を評価することが必要であり、ただし、B0は図20を参照して既に論考したようにfwに関連するマトリクスである。
【0242】
この評価を実行するためにB0U’をB0U’Kと共に事前計算し、ROMに記憶しておくことができる。
【0243】
実行されるべき次の段階は、det(I+(B0U’Y−B0U’K)(B0U’Y−B0U’K)’)=det(C)2であることに留意しながら、T=(B0U’)Y−(B0U’K)を評価し、I+TT’を評価し、かつC’C=TT’となるようにCholesky分解を行うことである。Cは三角形であるのでdet(C)2は評価し易い。
【0244】
上記が認識されれば、ここで図20のエンコーダと図16のエンコーダの相違について論考することができる。
【0245】
図20では、点線のボックス(124)は、後述する実施形態の1つの変形だけに存在する制御可能なリサンプラ回路を表している。加えて、ボックス(124)と回路(116)とを結ぶ点線の接続線も以下に説明する変形だけに存在する。Kは以前と同様に、カバーテキストをエンコードするために当初から使用されたキーを表す。前述したように、このキーは次にランダムな整数のシード数によって生成されるランダムなホワイト・ノイズを用い、次に二次元掃引帯域フィルタによってフィルタリングされて生成されたものである。
【0246】
マトリクス・マルチプライア(201)は前述の事前定義された統計データU’と共にROM(202)に保持されたキーKをマトリクス乗算してU’Kを生成する。このデータU’はROM(203)に記憶される。マルチプライア(201)の出力は投影マトリクスB0を生成するボックス(204)に供給され、この投影マトリクスはマルチプライア(205)によってマルチプライア(201)の出力で乗算されてB0U’Kが生成される。加えて、(204)によって出力されたB0もマトリクス・マルチプライア(206)の一方の入力に供給される。他方の入力にはU’が供給されるので、マルチプライア(206)の出力はB0U’となる。
【0247】
ここで図20のデコーダは図16のデコーダと同様に動作し、図16のエンコーダの素子と同様に動作する図20のエンコーダの素子には同じ参照番号が付されている。
【0248】
このように、マルチプライア(103)において、既に定義されたYの各ブロックはB0U’で乗算される。同様に(106、107)において、U’Kではなく値B0U’Kがそれぞれ加算および減算される。
【0249】
デコーダの第2の実施形態のその他の素子は第1の実施形態の素子と全く同様に動作する。
【0250】
ここで、上記で説明したエンコーダの2つの実施形態のベイズ・プロセスに必要な先の統計値の生成手順を説明する必要がある。これは図22の流れ図に関連して説明する。
【0251】
この図のステップS1で、複数の音楽サンプルが連結される。音楽サンプルは広範囲の音楽から選択することができ、例えば適当な数のCDからの抜粋を再生することによって作成することができる。CDの抜粋はテープ、ライブ、または放送された音楽とミキシングするか、または置き換えることができる。
【0252】
この抜粋の最終結果が広範囲の音楽をカバーできる長さの音楽の抜粋となる。勿論、ユーザがデコード目的で適切なデータ・セットを選択できるように、統計データが異なる種類の音楽をベースにできるようにするため、選択された音楽の抜粋をスキューすることもできる。このようにして、統計データのいくつかの異なるセットをROM(203)内に記憶しておいて、ユーザが適宜に選択することができる。
【0253】
ステップS2で、連結された音楽サンプルの対数パワー・スペクトログラムが生成される。ステップS3で、このようにして得られたパワー・スペクトログラムの列の平均値が計算され、ステップS4でこの平均値が個々の列から減算されてAが算出される。
【0254】
後者の2つのステップは、スペクトログラムの行が適切な特性を備えた高域フィルタを通過するようにさせることによって概算することができる。
【0255】
ステップS5において、ステップS4で得られた値の共分散マトリクスが生成され、したがってE=AA’/Nとなる。
【0256】
ステップS6において、スケール・マトリクスの場合はウィシャート・パラメータがr*Eであり、形状パラメータがKである前述の種類のdetV分布から各列が別個に引き出されるものと想定される。更に、対数rが不適切に均一な事前分布を有し、Kが不適切に均一な事前分布を有することも想定される。ステップS6で、ベイズの定理を用いてγおよびkのMAP(最大事後確率)が計算される。
【0257】
ステップS7でVがrEに等しく、またk=kに設定され、これらの値を用いてU’が計算される。したがってU’はサンプルの対数パワー・スペクトログラムの平均局所共分散マトリクスを単位マトリクスに変換するマトリクスである。最後にステップS8でU’が記憶される。
【0258】
図20に示したいくつかの変形をここで説明する。
【0259】
バッファ(115)から タイミング周波数および位相のMAP値を抽出した結果、最も正確な性能を生じない可能性がある。したがって、説明した2つのデコーダの変形では、考え得るタイミング周波数ωと位相φの全ての範囲が考慮される。ωとφの各々について、ωおよびφに基づいてスライスが行われるバッファ(115)からスライスされた値の絶対値を加算し、その結果を累乗することによって、データをDとすると事後確率P(ω、φ|D)が推定される。
【0260】
前述のデコーダの場合、その後でP(ω、φ|D)が最大値になるωとφの値を用いて、バッファ(115)内の値がスライスされる。
【0261】
説明している変形の代わりに、最初にリサンプラ回路(123)によって自動入力をリサンプリングして、ステゴテキストを拡張または圧縮する。次に、ランダムなサンプルを、クロック抽出回路(116)の代わりとなるランダムサンプラによってp(ω、φ|D)から引き出す。この手順は、実際に真の値が、より低いもののより高い確率を含む広範囲のピークに属している場合に、MAPが分布内の狭く高いスパイクとして出現することがあるということを考慮に入れる。
【0262】
そこで、前述した回路(116)内のバッファ(115)のランダムなサンプリングがリサンプラ(123)と連係して行われる様式を検討する。
【0263】
最初に、ステゴテキストが6%未満だけ拡張(圧縮)されている場合は、回路(116)がキー(K)の性質によってデータ・スライス回路(117)用の適宜のタイミングを即座に選択し、同様に回路(123)に適正な補正値を出力して、検知された拡張(圧縮)を解除するようにする可能性が高い。
【0264】
これに対して、拡張(圧縮)が6%以上である場合は、バッファ(115)内の値、ひいては計算されたP(ω、φ|D)の値は不適正であり、全て同じ大きさを有する。その結果、乱数値がリサンプラ回路に送られる。ここでは2つの場合を検討する必要がある。第1に、フィードバックされた値が偶然に適正値の±6%内にある場合である。可能な拡張の全範囲が±10%である場合は、これが生ずる可能性は少なくとも1/2である。新たにリサンプルされたステゴテキストがバッファ(115)に到達すると、回路(116)は現在必要な適正な補正を決定することができる。そこから、適正な値が回路(123)にフィードバックされ、回路(117)に送られる。
【0265】
第2に、回路(123)にフィードバックされた値が適正値の±6%に含まれない場合である。これが再び不適正である場合は、フィードバックされる次の値はランダムに選択され、前述の手順が継続される。それぞれの反復ごとに適正な値を選択する確率は1/2であるので、適正なタイミングと位相が評価されるまで反復は数回しか必要ない。勿論、リサンプラ回路は入力されたステゴテキストを不変のままに止めることによって始動できる。
【0266】
最後に、正確に再現可能な入力を処理する全てのデコーダの共通の問題点は、ある環境では特定の入力が適正にデコードされず、入力にいずれかの不規則性がない場合は、入力が繰り返されるごとに同じ問題が再び生ずることである。したがって、例えば図16および図21に関連して前述したデコーダ、およびその変形がこの問題を回避する手段を有するようなデコーダを提供することが提案される。その1つは、デコーダへの入力に真にランダムなノイズを単に加算することである。これにはデコーダの性能を劣化させるという欠点がある。
【0267】
別の代替形態は、所定の範囲内で真にランダムな長さを有しているゼロ信号、またはランダム・ノイズの周期で実際の入力がデコードされるように処理することである。
【0268】
前述の明細書ではエンコーダおよびデコーダの様々な実施形態が「フィルタ」、「マルチプライア」、「バッファ」および「回路」等のような回路素子に関して定義されてきたことが理解されよう。しかし、信号の実際のレコーディング、または再生とは別個に、これらの回路素子は全て、適宜のソフトウェア操作で代用することができる。したがって、特に図13を参照して説明したエンコーダはその全ての機能的な様相で、適宜のコードを受信する汎用コンピュータにより代用することができる。このようなコードの例は、図20のデコーダで使用されるマトリクスB0のジェネレータに関連して得られる。したがって、図13、16、および20に示した全てのステップとブロックの機能はソフトウェア・ステップとして実行されることができる。
【0269】
デコーダの実施形態の場合、それらがステゴテキストをデコードするだけではなく、例えば音楽のような出力としてステゴテキストを生成する個々のシステムで使用される場合は、デコーダは、場合によっては超大規模集積回路を使用する集積マイクロプロセッサ(単数または複数)の形態でもよい。
【図面の簡単な説明】
【図1】
ステゴテキストを生成するように付加的なデータを伴うカバーテキスト信号をエンコードし、かつデコードするためのシステムのブロック図である。
【図2】
ステゴテキストを生成し、かつデコードするために図1の実施形態で使用できるエンコーダおよびデコーダのブロック図である。
【図3】
音楽の一節のパワー・スペクトルのグラフである。
【図4】
パワー・スペクトログラムが補正された場合の変調パターンの重複を示したグラフである。
【図5】
畳み込みエンコーダのブロック図である。
【図6】
図2の実施形態よりも詳細に示したエンコーダ/デコーダのブロック図である。
【図7】
ステゴテキストへの時間−拡張による侵害を示したグラフである。
【図8】
図1のシステムの本発明の実施形態に従って使用されるフィルタのパラメータを示したグラフである。
【図9】
連続するキーのフィルタ特性を示したグラフである。
【図10】
掃引帯域フィルタを使用した一次元のホワイト・ノイズ信号を示したグラフである。
【図11】
各方向に掃引フィルタを使用した二次元のホワイト・ノイズ信号の結果を示したグラフである。
【図12】
相関に対する拡張の影響を示したグラフである。
【図13】
本発明に基づくエンコーダの一実施形態のブロック図である。
【図14】
異なる種類のノイズを示したグラフである。
【図15】
異なる種類のノイズを示したグラフである。
【図16】
図16は、図16A及び図16Bの合体した状態を示す図である。
【図16A】
図16Aは図1に示したシステムのデコーダの一実施形態の前半を示す図である。
【図16B】
図16Bは図1に示したシステムのデコーダの一実施形態の後半を示す図である。
【図17】
図16のデコーダのバッファの内容を示したグラフである。
【図18】
図17に示した値の処理結果を示したグラフである。
【図19】
図16および20のデコーダの一部を形成する最大尤度畳み込みコード・デコーダの動作を示したグラフである。
【図20】
図20は、図20A及び図20Bの合体した状態を示す図である。
【図20A】
図20Aは、デコーダの第2の実施形態の前半を示す図である。
【図20B】
図20Bは、デコーダの第2の実施形態の後半を示す図である。
【図21】
ベクトル空間での投影マップを示したグラフである。
【図22】
図16および20のデコーダで使用される音楽に関するパラメータの生成を示した図である。
【図23】
キーの生成を示したグラフである。
Claims (52)
- カバーテキスト信号をエンコードしてステゴテキストを生成するためのエンコーダであって、
カバーテキスト信号の高速フーリエ変換および方形極変換を実行する第1の変換手段であって、それによって、カバーテキスト信号を対数パワー・スペクトログラムへと変換する、第1の変換手段と、
一つのキーまたは各キーが所定サイズの二次元パターンの形式である少なくとも1つのキーを供給する手段と、
対数パワー・スペクトログラム領域内でキーの倍数を、または複数のキーがある場合には1つまたは複数のキーの倍数を、変換されたカバーテキスト信号のブロックに加算または減算するマルチプライアと、
所望のコードを表すデータに従ってマルチプライアによる前記キー(単数または複数)の加算または減算を制御する手段と、
変調されたカバーテキスト信号の極方形変換および逆高速フーリエ変換を実行する第2の変換手段であって、それによりステゴテキストを生成する、第2の変換手段と、を備えたエンコーダ。 - 前記第1の変換手段は、高速フーリエ変換および方形極変換を実行する前に前記カバーテキストを重複セグメントに分割するようにされており、各セグメントが両端で漸減するような関数で前記カバーテキストの各セグメントを乗算するためのマルチプライアを含む請求項1に記載のエンコーダ。
- 前記第1の変換手段は各セグメントを対数パワー・スペクトログラム領域へと変換して、前記キーと同じ長さと同じ列数を有するブロックを生成するようにされている請求項1または2に記載のエンコーダ。
- 前記カバーテキスト信号の対数パワー・スペクトログラムの各ブロックはX列幅であると共に、マルチプライアは、キーが少なくとも部分的に、約2x/T回だけ各スペクトログラム・ブロックに適用されるように、前記キーをTステップでブロックに適用するようにされており、ただしTは整数のキー列数である請求項3に記載のエンコーダ。
- 前記第2の変換手段は、前記カバーテキスト信号の各変調済みブロックで極方形変換および逆高速フーリエ変換を実行し、かつその結果生じたセグメントを合成してステゴテキストを生成するようにされている先行の請求項のいずれか一項に記載のエンコーダ。
- 電子透かしコード・データを使用して、前記カバーテキストの電子透かしを制御する前に前記電子透かしコード・データをエラー補正エンコードするためのエラー補正畳み込みエンコーダを含む先行の請求項のいずれか一項に記載のエンコーダ。
- カバーテキスト信号をエンコードしてステゴテキストを生成する方法であって、
カバーテキスト信号の高速フーリエ変換および方形極変換を実行することであって、それにより前記カバーテキスト信号をパワー・スペクトログラム領域へと変換する、実行することと、
一つのキーまたは各キーが所定サイズの二次元パターンの形式である少なくとも1つのキーを供給することと、
対数パワー・スペクトログラム領域内でキーの倍数を、または複数のキーがある場合には1つまたは複数のキーの倍数を、変換されたカバーテキスト信号のセグメントに加算または減算することと、
所望のコードを表すデータに従って加算/乗算ステップで前記キー(単数または複数)の倍数の加算または減算を制御することと、
変調されたカバーテキスト信号の極方形変換および逆高速フーリエ変換を実行することであって、それによりステゴテキストを生成する、実行することと、を含む方法。 - 高速フーリエ変換および方形極変換を実行する前に前記カバーテキストを重複セグメントに分割し、かつ各セグメントが両端で漸減するような関数で前記カバーテキストの各セグメントを乗算することを含む請求項7に記載の方法。
- 前記カバーテキストの各セグメントは、対数パワー領域へと変換されて、前記キーと同じ高さ、および同じ列数を有するブロックが生成されると共に、前記カバーテキスト信号の対数パワー・スペクトログラムの各ブロックはX列幅であり、マルチプライアは前記キーが少なくとも部分的に、2x/T回だけ各スペクトログラム・ブロックに適用されるように、前記キーをTステップでブロックに適用するようにされており、ただしTは整数のキー列数である請求項7または8のいずれかに記載の方法。
- 変調済みのカバーテキスト信号のステゴテキストへの変換は、カバーテキスト信号の各変調済みブロックで極方形変換および逆高速フーリエ変換を実行し、かつその結果生じたセグメントを合成することによって行われると共に、極方形変換および逆高速フーリエ変換の結果生じた各セグメントは、合成してステゴテキストを生成する前に各セグメントが両端で漸減するような関数で乗算される請求項7、8、または9のいずれか一項に記載の方法。
- プロセッサを制御して、請求項7ないし9のいずれか一項に記載の方法を実行するためのプロセッサ実行可能命令、または、プロセッサを制御して、請求項7ないし9のいずれか一項に記載の方法を実行するためのプロセッサ実行可能命令を伝える電気信号を記憶する記憶媒体。
- 請求項7ないし9のいずれか一項に記載の方法によってエンコードされたステゴテキストを読み取り可能なフォーマットで、または請求項7から9のいずれか一項に記載の方法によってエンコードされたステゴテキストを伝える信号を記憶する記憶媒体。
- カバーテキスト信号の対数パワー・スペクトログラムを、1つのキーまたは各キーの倍数が、それによってステゴテキストが生成された電子透かしコードのデータに従って前記対数領域でカバーテキスト・パワー・スペクトログラムに加算または減算された少なくとも1つのキー(K)で変調し、かつ変調されたパワー・スペクトログラムをカバーテキストの元の領域に戻すことによって生成されたステゴテキストをデコードするデコーダであって、
ステゴテキスト信号の高速フーリエ変換および方形極変換を実行する変換手段であって、それによりステゴテキスト信号を対数パワー・スペクトログラム領域に変換する、変換手段と、
前記元のカバーテキスト信号の対数パワー・スペクトログラムがそれによってエンコードされた前記キー(単数または複数を)を供給する手段と、
前記対数パワー領域で前記対数パワー・スペクトログラムのブロックから前記キー(単数または複数)の正と負の倍数を減算し、かつ所定の統計モデルに従ってカバーテキストの未修正ブロックを表す前記減算の結果の確率を評価するための計算手段と、
計算手段の出力からエンコードされたデータを復元する抽出手段と、を備えたデコーダ。 - 評価された確率を対数比の値として記憶する手段、および記憶された値から個々のタイムスライスを抽出する手段を含むと共に、前記所定の統計モデルは、平均および共分散マトリクス・パラメータがタイムスライス毎に変化しても変化なくてもよい多次元ガウス分布に従ってスペクトログラムの個々のタイムスライスが分布されるものとして想定される請求項13に記載のデコーダ。
- 前記所定の統計モデルは、平均値が一定であり、予め定まっているものとして、あるいは平均パラメータがタイムスライスごとに一定であるが、予め定まっておらず、別の分布から引き出されるものとして、あるいは平均値がキーの幅を超えない分だけ離れたタイムスライス間で異なっておらず、ある別の分布から引き出されるものとして想定される請求項14に記載のデコーダ。
- 前記所定の統計モデルは、共分散マトリクス・パラメータが一定であり、かつ予め定まっているものとして、または共分散マトリクス・パラメータがタイムスライスごとに一定であるが、予め定まっておらず、別の分布から引き出されるものとして想定され、あるいは共分散マトリクス・パラメータが、前記キーの幅を超えない分だけ離れたタイムスライス間で異なっておらず、ある別の分布から引き出されるものとして想定される請求項14または15のいずれかに記載のデコーダ。
- 前記別の分布は不適切な一様分布である請求項14、15、または16のいずれか一項に記載のデコーダ。
- 前記別の分布はパラメータk、vを有するウィシャート分布である請求項16に記載のデコーダ。
- 前記先行の統計モデルは、カバーテキストの複数のサンプル・セクションを結合し、結合されたサンプルの対数パワー・スペクトログラムを生成し、かつ前記対数パワー・スペクトログラムから共分散マトリクス(U’)を生成することによって生成されたものであり、該マトリクス(U’)はサンプルの対数パワー・スペクトログラムの平均局所共分散マトリクスを単位行列へと変換する請求項12に記載のデコーダ。
- 先行のサンプル・マトリクス(U’)を供給する手段と、カバーテキストのパワー・スペクトログラムがそれを用いて先行のサンプル・マトリクス(U’)でエンコードして、少なくとも1つのマトリクス(U’K)を生成するキー(単数または複数)(K)のマトリクス乗算の結果を供給する手段と、
前記カバーテキストのパワー・スペクトログラムの連続セグメント(Y)を供給する手段と、
各セグメント(Y)を前記マトリクス(U’)で乗算してマトリクス(U’Y)を生成する手段と、
ベイズの定理を用いてそれぞれのマトリクス(U’Y)および(U’K)から、データ・ビットがある場合にはその確率の対数比が「+1」、または「−1」であることをそれぞれ示す一連の値を導出する手段と、を備えた請求項19に記載のデコーダ。 - 対数領域でステゴテキストのパワー・スペクトログラムを前記先行サンプル・マトリクス(U’)で乗算する第1のマトリクス乗算手段であって、それによりマトリクス(U’F)を生成する、第1のマトリクス乗算手段と、
前記マトリクス(U’F)を、長さと高さが前記キー(単数または複数)(K)に対応するブロック(Y)へと分割するための手段と、
マトリクス(U’K)を各ブロック(Y)にそれぞれ加算および減算する手段であって、それにより(U’Y+U’K)および(U’Y−U’K)を生成する、加算および減算する手段と、
前記マトリクス(U’Y+U’K)および(U’Y−U’K)の各々のスケーリングされた対数行列式を生成する手段と、
(U’Y+U’K)のスケーリングされた対数行列式を(U’Y−U’K)から減算する手段であって、それにより当該の各データ・ビットの確率の対数比が「−1」または「+1」のいずれであるかを表す前記一連の値を生成する、減算する手段と、を備えた請求項20に記載のデコーダ。 - 前記スケーリングされた対数行列式を生成する手段は、(U’Y+U’K)および(U’Y−U’K)を生成する手段と、それぞれの対数行列式を−〔k+M〕/2でスケーリングする手段とを備え、ただし、kはウィシャート分布の形状パラメータを表し、Mはキー内の列数を表し、各キーKはx列幅、yビット高を有し、かつ、ステゴテキストは各キーKをTステップでステゴテキストのブロック(Y)に加算または減算することによって生成されたものであり、ただしTは各キーを各スペクトログラム・ブロックに複数回適用できるように整数のキー列数である、請求項18に記載の、および請求項18に従属する場合の請求項19ないし21のいずれか一項に記載のデコーダ。
- 前記対数比の値を記憶するバッファと、該バッファ内の値からクロックを抽出するためのクロック抽出手段とを含むと共に、該クロック抽出手段は、入力されたステゴテキストの正規クロックを利用して前記バッファ内の値の一連のスライス・ポイントを生成し、かつ前記バッファ内のデータに埋め込まれたコード用のクロックとしてゼロからの総合偏差が最大である一連のポイントを選択する請求項13に記載の、および請求項13に従属する場合の請求項14から22のいずれか一項に記載のデコーダ。
- 前記クロック抽出手段は、前記カバーテキストを拡張または圧縮できるようにステゴテキストをリサンプルするようにされた制御可能なリサンプラと、
前記バッファのコンテンツから無作為サンプルを引き出す手段と、
前記リサンプラの出力が前記コードの抽出を可能にする周波数になるまで、前記バッファから無作為に抽出されたサンプルに応答して前記リサンプラを制御する手段と、を備えた請求項23に記載のデコーダ。 - 前記クロック抽出手段の動作に応答して前記バッファから出力された一連の出力値をスケーリングする手段であって、それにより前記値が1+または1−約α/σの標準偏差を有するようにする、スケーリングする手段を備え、ただしαは前記バッファから抽出された一連の値(Cn)の絶対値の平均値であり、σ=std(|Cn |−α)である請求項23または24に記載のデコーダ。
- マトリクス(U’)はマトリクス(B0 U’)を表し、ただし(B0)はマトリクス(U’)を(U’)の元の座標系よりも次元が少ない直交座標へと変換するマトリクスである、請求項19に記載の、または請求項19に従属する場合の請求項20ないし26のいずれか一項に記載のデコーダ。
- カバーテキスト信号の対数パワー・スペクトログラムを、1つのキーまたは各キーの倍数が、それによってステゴテキストが生成された電子透かしコードのデータに従って前記対数領域でカバーテキスト・パワー・スペクトログラムに加算または減算された少なくとも1つのキー(K)で変調し、かつ変調されたパワー・スペクトログラムをカバーテキストの元の領域に戻すことによって生成されたステゴテキストをデコードする方法であって、
ステゴテキスト信号の高速フーリエ変換および方形極変換を実行することであって、それにより前記ステゴテキスト信号を対数パワー・スペクトログラム領域に変換する、実行することと、
前記元のカバーテキスト信号の対数パワー・スペクトログラムがそれによってエンコードされたキー(単数または複数を)を供給することと、
対数パワー領域で対数パワー・スペクトログラムのブロックからキー(単数または複数)の正と負の倍数を減算し、かつ所定の統計モデルに従ってカバーテキストの未修正ブロックを表す前記減算の結果の確率を評価することと、
計算手段の出力からエンコードされたデータを復元することと、を含む方法。 - 評価された確率を対数比の値として記憶すること、および記憶された値から個々のタイムスライスを抽出することを含むと共に、前記所定の統計モデルは、多次元ガウス分布に従ってスペクトログラムの個々のタイムスライスが分布されるものとして想定される請求項28に記載の方法。
- 前記所定の統計モデルは、共分散マトリクス・パラメータがタイムスライスごとに一定であるが、予め定まっておらず、別の分布から引き出されるものとして想定され、または前記キーの幅を超えない分だけ離れたタイムスライス間で異なっておらず、ある別の分布から引き出されるものとして想定される請求項29に記載の方法。
- 別の分布はパラメータk,vを有するウィシャート 分布である請求項30に記載の方法。
- 前記所定の統計モデルはカバーテキストの複数のサンプル・セクションを結合し、該結合されたサンプルの対数パワー・スペクトログラムを生成し、かつ前記対数パワー・スペクトログラムから共分散マトリクス(U’)を生成することによって生成されたものであり、該マトリクス(U’)は前記サンプルの対数パワー・スペクトログラムの平均局所共分散マトリクスを単位行列へと変換する請求項28ないし31のいずれか一項に記載の方法。
- 先行のサンプル・マトリクス(U’)を供給することと、
カバーテキストのパワー・スペクトログラムがそれを用いて先行のサンプル・マトリクス(U’)でエンコードされたキー(単数または複数)(K)のマトリクス乗算の結果を供給し、それによって少なくとも1つのマトリクス(U’K)を生成することと、
前記カバーテキストのパワー・スペクトログラムの連続セグメント(Y)を供給することと、
各セグメント(Y)を前記マトリクス(U’)で乗算し、それによりマトリクス(U’Y)を生成することと、
ベイズの定理を用いてそれぞれのマトリクス(U’Y)および(U’K)から、データ・ビットがある場合はその確率の対数比が「+1」、または「−1」であることをそれぞれ示す一連の値を導出することと、を含む請求項32に記載の方法。 - 対数領域でステゴテキストのパワー・スペクトログラムを前記先行サンプル・マトリクス(U’)で乗算する第1のマトリクス乗算手段を使用し、それによりマトリクス(U’F)を生成することと、
前記マトリクス(U’F)を長さと高さがキー(単数または複数)(K)に対応するブロック(Y)へと分割することと、
前記マトリクス(U’K)を各ブロック(Y)にそれぞれ加算および減算し、それにより(U’Y+U’K)および(U’Y−U’K)を生成加算および減算することと、
前記マトリクス(U’Y+U’K)および(U’Y−U’K)のそれぞれのスケーリングされた対数行列式を生成することと、
前記(U’Y+U’K)のスケーリングされた対数行列式を前記(U’Y−U’K)から減算し、それにより当該の各データ・ビットの確率の対数比が「−1」または「+1」のいずれであるかを表す前記一連の値を生成することと、を含む請求項33に記載の方法。 - (U’Y+U’K)および(U’Y−U’K)の対数行列式が生成され、次にそれぞれの対数行列式が−〔k+M〕/2でスケーリングされ、ただし、kはウィシャート分布の形状パラメータを表し、Mはキー内の列数を表す請求項31に記載の、および請求項31に従属する場合の請求項32ないし34のいずれか一項に記載の方法。
- 各キー(K)はx列幅、yビット高を有し、ステゴテキストは各キー(K)をTステップでステゴテキストのブロック(Y)に加算または減算することによって生成されたものであり、ただしTは各キーを各スペクトログラム・ブロックに複数回適用できるように整数のキー列数である請求項28ないし35のいずれか一項に記載の方法。
- 前記対数比の値をバッファに記憶し、かつ該バッファ内の値から個々のタイムスライスを抽出するために使用されるクロックを抽出することと、入力されたステゴテキストの正規クロックを利用して前記バッファ内の値の一連のスライス・ポイントを生成することと、前記バッファ内のデータに埋め込まれたコード用のクロックとしてゼロからの総合偏差が最大である一連のポイントを選択することとを含む、請求項29に記載の、および請求項29に従属する場合の請求項30ないし36のいずれか一項に記載の方法。
- 前記カバーテキストを拡張または圧縮できるようにステゴテキストを制御可能にリサンプルすることと、
前記バッファのコンテンツから無作為サンプルを引き出すことと、
前記リサンプラの出力が前記コードの抽出を可能にする周波数になるまで、前記バッファから無作為に抽出されたサンプルに応答して前記リサンプラを制御することと、を備えた請求項37に記載の方法。 - 前記クロック抽出手段の動作に応答して前記バッファから出力された一連の出力値Cnをスケーリングすることであって、それにより、前記値が1+または1−約α/σの標準偏差を有するようにする、スケーリングすることを備え、ただしαは抽出された一連の値(Cn)の絶対値の平均値であり、σ=std(|Cn |−α)である請求項37または38に記載の方法。
- 前記所定の統計モデルから得られた統計データに従って、スケーリングされた値を補正する請求項39に記載の方法。
- 前記マトリクス(U’)はマトリクス(B0 U’)を表し、ただし(B0)はマトリクス(U’)を(U’)の元の座標系よりも次元が少ない直交座標へと変換するマトリクスである、請求項32に記載の、または請求項32に従属する場合の請求項33ないし41のいずれか一項に記載の方法。
- 請求項28ないし42のいずれか一項に記載の方法を実行するためにプロセッサを制御するためのプロセッサ実行可能命令を記憶する記憶媒体。
- 請求項28ないし42のいずれか一項に記載の方法を実行するためにプロセッサを制御するためのプロセッサ実行可能命令を伝える電気信号。
- カバーテキストを電子透かし処理するためのキーを生成するための電子透かしキー・ジェネレータであって、所定の高さと幅の二次元ノイズ・パターンを生成するための手段と、一次元のノイズ信号をパターン内の位置によって変化する遮断周波数でフィルタリングするための手段とを備えた電子透かしキー・ジェネレータ。
- 位置による変化は、パターン内の基準ポイントに対する位置の前記次元内の座標係数にほぼ反比例する請求項45に記載のキー・ジェネレータ。
- 前記基準ポイントは前記次元の中心、または他の次元の一端にある、請求項46に記載のキー・ジェネレータ。
- 前記フィルタリング手段は低域フィルタとして機能し、タイムスケールの閾値τよりも短いタイムスケールを伴う周波数成分を有さないようにノイズ・パターンをフィルタリングし、ただしτ=C|t|であり、Cはピクセル毎のサイクル当たり0.05〜0.4ピクセルの範囲の正の定数であり、tは基準ポイントに対する前記次元内の座標であり、かつ前記一次元に対して横方向のホワイトノイズ信号をフィルタリングするための第2の手段を含む、請求項43ないし47のいずれか一項に記載のキー・ジェネレータ。
- 第2のフィルタリング手段は、ノイズ・パターンがτ=C|t|よりも短いタイムスケールを伴う周波数成分を有さないように、第2の次元内の座標係数と反比例して変化する遮断周波数を有しており、ただし、tは基準ポイントに対する第2の次元内の座標であり、さらに、一様に分布された乱数を生成するために数値シード入力に応答する乱数ジェネレータを含み、
上記のように生成された乱数を1−dガウス分布された乱数へと変換するための変換手段と、
前記ガウス分布された乱数を二次元のノイズ・パターンへと再構成するための手段とを含むと共に、乱数を生成するための前記乱数ジェネレータはTausworthジェネレータであり、変換手段はボックス・コックス変換方式を用いる、請求項48に記載のキー・ジェネレータ。 - カバーテキストを電子透かし処理するためのキーを生成する方法であって、所定の高さと幅の二次元ノイズ・パターンを生成することと、一次元のノイズ信号をパターン内の位置によって変化する遮断周波数でフィルタリングすることとを含み、位置による変化は、パターン内の基準ポイントに対する位置の前記次元内の座標係数とほぼ反比例し、前記フィルタリングはタイムスケールの閾値τよりも短いタイムスケールを伴う周波数成分を有さないようにノイズ・パターンをフィルタリングする低域フィルタとして機能し、ただしτ=C|t|であり、Cはピクセル毎のサイクル当たり0.05〜0.4ピクセルの範囲の正の定数であり、tは基準ポイントに対する前記次元内の座標である方法。
- 請求項50に記載の方法によって生成されるキーを記憶する記憶媒体、または請求項50に記載の方法によって生成されるキーを伝える電気信号。
- カバーテキスト信号をエンコードしてステゴテキストを生成するためのエンコーダであって、
前記カバーテキスト信号の高速フーリエ変換および方形極変換を実行する変換手段であって、それにより前記カバーテキスト信号を対数パワー・スペクトログラムへと変換する、変換手段と、請求項50に記載の方法によって生成された二次元ノイズ・パターンの形式のキーを供給する手段と、
電子透かしコードに従って前記対数パワー・スペクトログラムをキーで変調する手段と、を備えたエンコーダ。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB0018489.5 | 2000-07-27 | ||
GB0018487A GB2365285A (en) | 2000-07-27 | 2000-07-27 | Decoding watermarked data using keys and FFT |
GB0018489A GB2365295A (en) | 2000-07-27 | 2000-07-27 | Watermarking key |
GB0018491A GB2365296A (en) | 2000-07-27 | 2000-07-27 | Encoder/decoder for watermarking a covertext signal |
GB0018487.9 | 2000-07-27 | ||
GB0018491.1 | 2000-07-27 | ||
PCT/GB2001/003391 WO2002011326A2 (en) | 2000-07-27 | 2001-07-27 | Stegotext encoder and decoder |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004515799A true JP2004515799A (ja) | 2004-05-27 |
JP5105686B2 JP5105686B2 (ja) | 2012-12-26 |
Family
ID=27255820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002515737A Expired - Fee Related JP5105686B2 (ja) | 2000-07-27 | 2001-07-27 | ステゴテキスト・エンコーダおよびデコーダ |
Country Status (8)
Country | Link |
---|---|
US (3) | US7298841B2 (ja) |
EP (1) | EP1305901B1 (ja) |
JP (1) | JP5105686B2 (ja) |
AT (1) | ATE293316T1 (ja) |
AU (1) | AU2001275712A1 (ja) |
CA (1) | CA2417499A1 (ja) |
DE (1) | DE60110086T2 (ja) |
WO (1) | WO2002011326A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008529046A (ja) * | 2005-01-21 | 2008-07-31 | アンリミテッド メディア ゲーエムベーハー | 電子透かしを有用信号に埋め込む方法 |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7362775B1 (en) * | 1996-07-02 | 2008-04-22 | Wistaria Trading, Inc. | Exchange mechanisms for digital information packages with bandwidth securitization, multichannel digital watermarks, and key management |
US5613004A (en) * | 1995-06-07 | 1997-03-18 | The Dice Company | Steganographic method and device |
US9630443B2 (en) | 1995-07-27 | 2017-04-25 | Digimarc Corporation | Printer driver separately applying watermark and information |
US7664263B2 (en) * | 1998-03-24 | 2010-02-16 | Moskowitz Scott A | Method for combining transfer functions with predetermined key creation |
US6205249B1 (en) | 1998-04-02 | 2001-03-20 | Scott A. Moskowitz | Multiple transform utilization and applications for secure digital watermarking |
US7346472B1 (en) * | 2000-09-07 | 2008-03-18 | Blue Spike, Inc. | Method and device for monitoring and analyzing signals |
US7177429B2 (en) | 2000-12-07 | 2007-02-13 | Blue Spike, Inc. | System and methods for permitting open access to data objects and for securing data within the data objects |
US7095874B2 (en) * | 1996-07-02 | 2006-08-22 | Wistaria Trading, Inc. | Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data |
US7159116B2 (en) | 1999-12-07 | 2007-01-02 | Blue Spike, Inc. | Systems, methods and devices for trusted transactions |
US5889868A (en) * | 1996-07-02 | 1999-03-30 | The Dice Company | Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data |
US7457962B2 (en) * | 1996-07-02 | 2008-11-25 | Wistaria Trading, Inc | Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data |
US7730317B2 (en) * | 1996-12-20 | 2010-06-01 | Wistaria Trading, Inc. | Linear predictive coding implementation of digital watermarks |
US7664264B2 (en) | 1999-03-24 | 2010-02-16 | Blue Spike, Inc. | Utilizing data reduction in steganographic and cryptographic systems |
US7475246B1 (en) | 1999-08-04 | 2009-01-06 | Blue Spike, Inc. | Secure personal content server |
DE60110086T2 (de) | 2000-07-27 | 2006-04-06 | Activated Content Corp., Inc., Burlingame | Stegotextkodierer und -dekodierer |
US6674876B1 (en) * | 2000-09-14 | 2004-01-06 | Digimarc Corporation | Watermarking in the time-frequency domain |
US7127615B2 (en) | 2000-09-20 | 2006-10-24 | Blue Spike, Inc. | Security based on subliminal and supraliminal channels for data objects |
US7131007B1 (en) * | 2001-06-04 | 2006-10-31 | At & T Corp. | System and method of retrieving a watermark within a signal |
US6899475B2 (en) | 2002-01-30 | 2005-05-31 | Digimarc Corporation | Watermarking a page description language file |
US7287275B2 (en) | 2002-04-17 | 2007-10-23 | Moskowitz Scott A | Methods, systems and devices for packet watermarking and efficient provisioning of bandwidth |
US7152021B2 (en) | 2002-08-15 | 2006-12-19 | Digimarc Corporation | Computing distortion of media signals embedded data with repetitive structure and log-polar mapping |
US8014557B2 (en) | 2003-06-23 | 2011-09-06 | Digimarc Corporation | Watermarking electronic text documents |
DE102004021404B4 (de) * | 2004-04-30 | 2007-05-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Wasserzeicheneinbettung |
US8156548B2 (en) * | 2004-05-20 | 2012-04-10 | Future Internet Security Ip Pty Ltd. | Identification and authentication system and method |
US8140848B2 (en) * | 2004-07-01 | 2012-03-20 | Digimarc Corporation | Digital watermark key generation |
CA2508428A1 (fr) * | 2005-05-20 | 2006-11-20 | Hydro-Quebec | Detection, localisation et interpretation de decharge partielle |
US7549111B2 (en) * | 2005-09-21 | 2009-06-16 | International Business Machines Corporation | Apparatus, system, and method for converting between serial data and encoded holographic data |
US8826442B2 (en) * | 2006-07-28 | 2014-09-02 | Nxp B.V. | Media playback decoder tracing |
DK2082527T3 (en) * | 2006-10-18 | 2015-07-20 | Destiny Software Productions Inc | Methods for watermarking media data |
US8494903B2 (en) * | 2007-03-16 | 2013-07-23 | Activated Content Corporation | Universal advertising model utilizing digital linkage technology “U AD” |
WO2008122918A2 (en) * | 2007-04-06 | 2008-10-16 | Koninklijke Philips Electronics N.V. | Secure client-side embedding using multiple one-time-pads |
US9466307B1 (en) * | 2007-05-22 | 2016-10-11 | Digimarc Corporation | Robust spectral encoding and decoding methods |
US9245529B2 (en) * | 2009-06-18 | 2016-01-26 | Texas Instruments Incorporated | Adaptive encoding of a digital signal with one or more missing values |
US8934663B2 (en) * | 2009-10-29 | 2015-01-13 | Optimark, L.L.C. | Digital watermarking |
BR122021019877B1 (pt) * | 2011-06-30 | 2022-07-19 | Samsung Electronics Co., Ltd | Aparelho para gerar um sinal estendido de largura de banda |
CN102750956B (zh) * | 2012-06-18 | 2014-07-16 | 歌尔声学股份有限公司 | 一种单通道语音去混响的方法和装置 |
US9391654B2 (en) * | 2014-04-25 | 2016-07-12 | The Aerospace Corporation | Systems and methods for reducing a relatively high power, approximately constant envelope interference signal that spectrally overlaps a relatively low power desired signal |
US9197360B2 (en) * | 2014-04-25 | 2015-11-24 | The Aerospace Corporation | Systems and methods for reducing a relatively high power, approximately constant envelope interference signal that spectrally overlaps a relatively low power desired signal |
KR102189730B1 (ko) * | 2015-09-03 | 2020-12-14 | 주식회사 쏠리드 | 디지털 데이터 압축 및 복원 장치 |
US9654158B2 (en) | 2015-10-20 | 2017-05-16 | The Aerospace Corporation | Circuits and methods for reducing an interference signal that spectrally overlaps a desired signal |
US10340962B2 (en) | 2016-05-06 | 2019-07-02 | The Aerospace Corporation | Amplitude domain circuits and methods for reducing an interference signal that spectrally overlaps a desired signal |
US10206080B2 (en) * | 2016-09-08 | 2019-02-12 | Lg Electronics Inc. | Method for transmitting or receiving signal in wireless communication system and apparatus therefor |
US10650621B1 (en) | 2016-09-13 | 2020-05-12 | Iocurrents, Inc. | Interfacing with a vehicular controller area network |
CN108256807B (zh) * | 2018-02-10 | 2023-10-03 | 西安科技大学 | 基于二维码识别的快递员收发件***及方法 |
US10965315B2 (en) * | 2018-08-09 | 2021-03-30 | Andrew Kamal | Data compression method |
US11212015B2 (en) | 2020-05-19 | 2021-12-28 | The Aerospace Corporation | Interference suppression using machine learning |
DE102020206723A1 (de) | 2020-05-28 | 2021-12-02 | Andreas Schubert | Zufallszahlengenerator |
CN115103080B (zh) * | 2022-05-07 | 2023-04-21 | 华南理工大学 | 一种基于dna三倍体变异的图像加密方法和*** |
CN115048682B (zh) * | 2022-08-15 | 2022-11-01 | 河北省农林科学院农业信息与经济研究所 | 一种土地流转信息的安全存储方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57147695A (en) * | 1981-03-06 | 1982-09-11 | Fujitsu Ltd | Voice analysis system |
JPS57185090A (en) * | 1981-05-08 | 1982-11-15 | Kyosan Electric Mfg | Recognition pattern checking system |
JPH03167600A (ja) * | 1989-11-28 | 1991-07-19 | Toshiba Corp | 音声認識装置 |
JPH09191394A (ja) * | 1995-09-28 | 1997-07-22 | Nec Corp | 電子的すかし挿入方法 |
WO1997033391A1 (de) * | 1996-03-07 | 1997-09-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer udn decodierer |
JPH10164349A (ja) * | 1996-11-27 | 1998-06-19 | Ibm Japan Ltd | データハイディング方法及びデータ抽出方法 |
WO1999017536A1 (en) * | 1997-09-26 | 1999-04-08 | Digital Copyright Technologies Ag | Method for generating and verifying degital watermarks and for exchanging data containing digital watermarks |
JPH11212463A (ja) * | 1998-01-27 | 1999-08-06 | Kowa Co | 一次元データへの電子透かし |
JPH11284836A (ja) * | 1998-03-27 | 1999-10-15 | Hitachi Ltd | 電子透かし画像処理方法 |
JP2002521702A (ja) * | 1998-07-16 | 2002-07-16 | ニールセン メディア リサーチ インコーポレイテッド | 放送番組特定システムに於いて使用するための、音声信号に不可聴コードを付加することにより可聴信号をエンコードするシステム及び装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5613004A (en) | 1995-06-07 | 1997-03-18 | The Dice Company | Steganographic method and device |
US5848155A (en) | 1996-09-04 | 1998-12-08 | Nec Research Institute, Inc. | Spread spectrum watermark for embedded signalling |
ES2270516T3 (es) | 1997-05-19 | 2007-04-01 | Verance Corporation | Aparato y metodo para incorporar y extraer informacion en señales analogicas utilizando caracteristicas distribuidas de señales. |
JPH1132200A (ja) | 1997-07-09 | 1999-02-02 | Matsushita Electric Ind Co Ltd | 透かしデータ挿入方法及び透かしデータ検出方法 |
GB9801131D0 (en) | 1998-01-20 | 1998-03-18 | Nds Ltd | Improvements in or relating to watermarks |
US6145081A (en) * | 1998-02-02 | 2000-11-07 | Verance Corporation | Method and apparatus for preventing removal of embedded information in cover signals |
KR100341197B1 (ko) | 1998-09-29 | 2002-06-20 | 포만 제프리 엘 | 오디오 데이터로 부가 정보를 매립하는 방법 및 시스템 |
US6373970B1 (en) * | 1998-12-29 | 2002-04-16 | General Electric Company | Image registration using fourier phase matching |
JP2000269919A (ja) * | 1999-03-16 | 2000-09-29 | Matsushita Electric Ind Co Ltd | Ofdm通信装置 |
FR2794600B1 (fr) | 1999-06-01 | 2001-08-17 | Thomson Multimedia Sa | Systeme de tatouage de donnees utilisant de nouvelles methodes d'insertion et de detection de tatouage |
US6766062B1 (en) * | 2000-02-16 | 2004-07-20 | The Board Of Trustees Of The Leland Stanford Junior University - Office Of Technology | Digital ridgelet transform via digital polar coordinate transform |
US6529927B1 (en) * | 2000-03-31 | 2003-03-04 | The Regents Of The University Of California | Logarithmic compression methods for spectral data |
DE60110086T2 (de) | 2000-07-27 | 2006-04-06 | Activated Content Corp., Inc., Burlingame | Stegotextkodierer und -dekodierer |
-
2001
- 2001-07-27 DE DE60110086T patent/DE60110086T2/de not_active Expired - Fee Related
- 2001-07-27 AU AU2001275712A patent/AU2001275712A1/en not_active Abandoned
- 2001-07-27 US US10/343,145 patent/US7298841B2/en not_active Expired - Fee Related
- 2001-07-27 WO PCT/GB2001/003391 patent/WO2002011326A2/en active IP Right Grant
- 2001-07-27 CA CA002417499A patent/CA2417499A1/en not_active Abandoned
- 2001-07-27 EP EP01953219A patent/EP1305901B1/en not_active Expired - Lifetime
- 2001-07-27 AT AT01953219T patent/ATE293316T1/de not_active IP Right Cessation
- 2001-07-27 JP JP2002515737A patent/JP5105686B2/ja not_active Expired - Fee Related
-
2007
- 2007-10-09 US US11/869,539 patent/US7916862B2/en not_active Expired - Fee Related
- 2007-10-09 US US11/869,507 patent/US7917766B2/en not_active Expired - Fee Related
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57147695A (en) * | 1981-03-06 | 1982-09-11 | Fujitsu Ltd | Voice analysis system |
JPS57185090A (en) * | 1981-05-08 | 1982-11-15 | Kyosan Electric Mfg | Recognition pattern checking system |
JPH03167600A (ja) * | 1989-11-28 | 1991-07-19 | Toshiba Corp | 音声認識装置 |
JPH09191394A (ja) * | 1995-09-28 | 1997-07-22 | Nec Corp | 電子的すかし挿入方法 |
WO1997033391A1 (de) * | 1996-03-07 | 1997-09-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer udn decodierer |
JPH10164349A (ja) * | 1996-11-27 | 1998-06-19 | Ibm Japan Ltd | データハイディング方法及びデータ抽出方法 |
WO1999017536A1 (en) * | 1997-09-26 | 1999-04-08 | Digital Copyright Technologies Ag | Method for generating and verifying degital watermarks and for exchanging data containing digital watermarks |
JP2001518650A (ja) * | 1997-09-26 | 2001-10-16 | デジタル・コピーライト・テクノロジーズ・アクチェンゲゼルシャフト | デジタルウォータマークを発生して証明するためおよびデジタルウォータマークを含むデータを交換するための方法 |
JPH11212463A (ja) * | 1998-01-27 | 1999-08-06 | Kowa Co | 一次元データへの電子透かし |
JPH11284836A (ja) * | 1998-03-27 | 1999-10-15 | Hitachi Ltd | 電子透かし画像処理方法 |
JP2002521702A (ja) * | 1998-07-16 | 2002-07-16 | ニールセン メディア リサーチ インコーポレイテッド | 放送番組特定システムに於いて使用するための、音声信号に不可聴コードを付加することにより可聴信号をエンコードするシステム及び装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008529046A (ja) * | 2005-01-21 | 2008-07-31 | アンリミテッド メディア ゲーエムベーハー | 電子透かしを有用信号に埋め込む方法 |
Also Published As
Publication number | Publication date |
---|---|
US20090190755A1 (en) | 2009-07-30 |
US20080152128A1 (en) | 2008-06-26 |
AU2001275712A1 (en) | 2002-02-13 |
WO2002011326A3 (en) | 2003-01-23 |
US7298841B2 (en) | 2007-11-20 |
JP5105686B2 (ja) | 2012-12-26 |
US7916862B2 (en) | 2011-03-29 |
CA2417499A1 (en) | 2002-02-07 |
ATE293316T1 (de) | 2005-04-15 |
US20040028222A1 (en) | 2004-02-12 |
EP1305901B1 (en) | 2005-04-13 |
US7917766B2 (en) | 2011-03-29 |
WO2002011326A2 (en) | 2002-02-07 |
DE60110086T2 (de) | 2006-04-06 |
DE60110086D1 (de) | 2005-05-19 |
EP1305901A2 (en) | 2003-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5105686B2 (ja) | ステゴテキスト・エンコーダおよびデコーダ | |
US6345100B1 (en) | Robust watermark method and apparatus for digital signals | |
US6209094B1 (en) | Robust watermark method and apparatus for digital signals | |
US6219634B1 (en) | Efficient watermark method and apparatus for digital signals | |
US6425082B1 (en) | Watermark applied to one-dimensional data | |
US8103051B2 (en) | Multimedia data embedding and decoding | |
US6683958B2 (en) | Apparatus and method for embedding and extracting information in analog signals using distributed signal features and replica modulation | |
US6330673B1 (en) | Determination of a best offset to detect an embedded pattern | |
US6320965B1 (en) | Secure watermark method and apparatus for digital signals | |
US8225099B2 (en) | Linear predictive coding implementation of digital watermarks | |
Chen et al. | Highly robust, secure, and perceptual-quality echo hiding scheme | |
Wang et al. | A robust digital audio watermarking based on statistics characteristics | |
JP2008058953A (ja) | 音声透かしをベースとするメディア・プログラムの識別方法及び装置 | |
Wang et al. | A pseudo-Zernike moment based audio watermarking scheme robust against desynchronization attacks | |
Erkucuk et al. | A robust audio watermark representation based on linear chirps | |
GB2365295A (en) | Watermarking key | |
Dhar et al. | A blind LWT-based audio watermarking using fast Walsh Hadamard transform and singular value decomposition | |
Mushgil et al. | An efficient selective method for audio watermarking against de-synchronization attacks | |
GB2365296A (en) | Encoder/decoder for watermarking a covertext signal | |
GB2365285A (en) | Decoding watermarked data using keys and FFT | |
Yahya et al. | An Enhanced Robust and Protected Image Steganographic System | |
Garlapati et al. | A symbol based watermarking approach for spread spectrum audio watermarking methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080724 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110425 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110725 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120123 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120423 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120501 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120723 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120814 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120815 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120904 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121002 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151012 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |