JP4702043B2 - 電子透かしエンコード装置、電子透かしデコード装置、電子透かしエンコード方法、電子透かしデコード方法及びプログラム - Google Patents

電子透かしエンコード装置、電子透かしデコード装置、電子透かしエンコード方法、電子透かしデコード方法及びプログラム Download PDF

Info

Publication number
JP4702043B2
JP4702043B2 JP2005372651A JP2005372651A JP4702043B2 JP 4702043 B2 JP4702043 B2 JP 4702043B2 JP 2005372651 A JP2005372651 A JP 2005372651A JP 2005372651 A JP2005372651 A JP 2005372651A JP 4702043 B2 JP4702043 B2 JP 4702043B2
Authority
JP
Japan
Prior art keywords
pitch component
audio signal
signal
digital watermark
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005372651A
Other languages
English (en)
Other versions
JP2007171833A (ja
Inventor
邦博 須賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kenwood KK
Original Assignee
Kenwood KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kenwood KK filed Critical Kenwood KK
Priority to JP2005372651A priority Critical patent/JP4702043B2/ja
Publication of JP2007171833A publication Critical patent/JP2007171833A/ja
Application granted granted Critical
Publication of JP4702043B2 publication Critical patent/JP4702043B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

この発明は、電子透かしエンコード装置、電子透かしデコード装置、電子透かしエンコード方法、電子透かしデコード方法及びプログラムに関する。
音声を合成する手法として、録音編集方式と呼ばれる手法がある。録音編集方式は、駅の音声案内システムや、車載用のナビゲーション装置などに用いられている。
録音編集方式は、単語と、この単語を読み上げる音声を表す音声データとを対応付けておき、音声合成する対象の文章を単語に区切ってから、これらの単語に対応付けられた音声データを取得してつなぎ合わせる、という手法である(例えば、特許文献1参照)。
特開平10−49193号公報
録音編集方式により得られる合成音声の話者の変更を可能としたり、あるいはその他、得られる合成音声を多様にするための手法としては、音声データをリムーバブルメディア(可搬な記録媒体)に記録して用いるものとして、互いに異なる音声データを記録した複数のリムーバブルメディアを必要に応じて差し替える、というものが考えられる。しかし、リムーバブルメディアに記録された音声データは、不正な複製や改竄、あるいはその他の不正利用をされやすいという問題がある。
この発明は、上記実状に鑑みてなされたものであり、音声を表すデータの自由な供給を図りながら、音声データの有効な保護を図るための電子透かしエンコード装置、電子透かしデコード装置、電子透かしエンコード方法、電子透かしデコード方法及びプログラムを提供することを目的とする。
上記目的を達成するため、この発明の第1の観点に係る電子透かしエンコード装置は、
音声を表す音声信号を取得する音声信号取得手段と、
取得された前記音声信号を、当該音声信号が表す音声のピッチ成分の周波数のシフトの時間軸上におけるパターンが、電子透かしとして埋め込む対象のデータの値を表すものとなるように加工する音声信号加工手段と、を備える、
ことを特徴とする。
前記音声信号加工手段は、例えば、
取得された前記音声信号より、当該音声信号が表す音声のピッチ成分を表すピッチ成分信号を抽出するピッチ成分抽出手段と、
取得された前記音声信号より、当該音声信号が表す音声のピッチ成分以外の成分を表す非ピッチ成分信号を抽出する非ピッチ成分抽出手段と、
前記ピッチ成分信号を取得し、当該ピッチ成分信号の周波数を、電子透かしとして埋め込む対象のデータの値を表すようなパターンを時間軸上において有するようにシフトするピッチ成分周波数シフト手段と、
前記周波数のシフトを施されたピッチ成分信号、及び前記非ピッチ成分信号を取得して互いに加算することにより、電子透かしを施された音声信号を生成する加算手段と、を備えるものであればよい。
前記ピッチ成分抽出手段は、例えば、
前記音声信号が表す音声のピッチ成分の周波数を特定するピッチ周波数特定手段と、
前記音声信号のうち、特定された前記周波数近傍の成分を前記ピッチ成分として抽出するバンドパスフィルタと、を備えるものであればよく、
前記非ピッチ成分抽出手段は、例えば、前記音声信号から、特定された前記周波数近傍の成分を除去することによって、残余の成分を前記非ピッチ成分として抽出するバンドリジェクションフィルタにより構成されるものであればよい。
また、この発明の第2の観点に係る電子透かしデコード装置は、
音声を表す、電子透かしを施された音声信号を取得する音声信号取得手段と、
取得された前記音声信号より、当該音声信号が表す音声のピッチ成分を表すピッチ成分信号を抽出するピッチ成分抽出手段と、
抽出された前記ピッチ成分信号が有する、時間軸上における周波数のシフトのパターンを特定し、特定されたパターンに基づいて、前記音声信号に電子透かしとして埋め込まれたデータを特定する手段と、を備える、
ことを特徴とする。
また、この発明の第3の観点に係る電子透かしエンコード方法は、音声信号取得部と音声信号加工部を有する装置において実行される電子透かしエンコード方法であって、
前記音声信号取得部が、音声を表す音声信号を取得する音声信号取得ステップと、
前記音声信号加工部が、前記取得された音声信号を、当該音声信号が表す音声のピッチ成分の周波数のシフトの時間軸上におけるパターンが、電子透かしとして埋め込む対象のデータの値を表すものとなるように加工する音声信号加工ステップと
を備えることを特徴とする。
また、この発明の第4の観点に係る電子透かしデコード方法は、音声信号取得部とピッチ成分抽出部と特定部とを有する装置において実行される電子透かしデコード方法であって、
前記音声信号取得部が、音声を表す、電子透かしを施された音声信号を取得する音声信号取得ステップと、
前記ピッチ成分抽出部が、前記取得された音声信号から、当該音声信号が表す音声のピッチ成分を表すピッチ成分信号を抽出するピッチ成分抽出ステップと、
前記特定部が、前記抽出されたピッチ成分信号が有する、時間軸上における周波数のシフトのパターンを特定し、当該特定されたパターンに基づいて、前記音声信号に電子透かしとして埋め込まれたデータを特定する特定ステップと
を備えることを特徴とする。
また、この発明の第5の観点に係るプログラムは、
コンピュータを、
音声を表す音声信号を取得する音声信号取得手段と、
取得された前記音声信号を、当該音声信号が表す音声のピッチ成分の周波数のシフトの時間軸上におけるパターンが、電子透かしとして埋め込む対象のデータの値を表すものとなるように加工する音声信号加工手段と、
して機能させるためのものであることを特徴とする。
また、この発明の第6の観点に係るプログラムは、
コンピュータを、
音声を表す、電子透かしを施された音声信号を取得する音声信号取得手段と、
取得された前記音声信号より、当該音声信号が表す音声のピッチ成分を表すピッチ成分信号を抽出するピッチ成分抽出手段と、
抽出された前記ピッチ成分信号が有する、時間軸上における周波数のシフトのパターンを特定し、特定されたパターンに基づいて、前記音声信号に電子透かしとして埋め込まれたデータを特定する手段と、
して機能させるためのものであることを特徴とする。
この発明によれば、音声を表すデータの自由な供給を図りながら、音声データの有効な保護を図るための電子透かしエンコード装置、電子透かしデコード装置、電子透かしエンコード方法、電子透かしデコード方法及びプログラムが実現される。
以下、この発明の実施の形態を、電子透かしエンコード装置及び電子透かしデコード装置を例とし、図面を参照して説明する。
(電子透かしエンコード装置)
図1は、この発明の実施の形態に係る電子透かしエンコード装置Eの構成を示す図である。図示するように、電子透かしエンコード装置Eは、音声データ入力部E1と、ピッチ特定部E2と、BRF(バンドリジェクションフィルタ)E3と、BPF(バンドパスフィルタ)E4と、ピッチシフト部E5と、加算部E6とにより構成されている。
音声データ入力部E1、ピッチ特定部E2、BRFE3、BPFE4、ピッチシフト部E5及び加算部E6は、例えば、CPU(中央処理ユニット)等のプロセッサや、このプロセッサが実行するためのプログラムを記憶するメモリなどより構成されている。
なお、音声データ入力部E1、ピッチ特定部E2、BRFE3、BPFE4、ピッチシフト部E5及び加算部E6の一部又は全部の機能を単一のプロセッサが行うようにしてもよい。
音声データ入力部E1は、外部より、音声の波形を表すディジタル形式(例えば、PCM(パルス符号変調)形式)の入力音声データを取得して、ピッチ特定部E2、BRFE3及びBPFE4に供給する。
なお、音声データ入力部E1が入力音声データを取得する手法は任意であり、例えば、図示しないインターフェース回路を介して外部の装置(例えば、ハードディスク装置など)やネットワークから取得してもよいし、図示しない記録媒体ドライブ装置にセットされた記録媒体(例えば、フレキシブルディスクやCD−ROMなど)から、この記録媒体ドライブ装置を介して読み取ってもよい。
ピッチ特定部E2は、音声データ入力部E1より供給された入力音声データが表す音声のピッチ成分の周波数の時間変化を特定し、特定した当該時間変化を表すデータ(以下、ピッチ周波数データと呼ぶ)を、BRFE3及びBPFE4へと、同時に、連続的に供給する。
ピッチ特定部E2は、具体的には、例えばこの入力音声データにケプストラム解析を施すことにより、ピッチ成分の周波数の時間変化を特定すればよい。すなわち、例えば入力音声データが表す波形を時間軸上で多数の小部分へと区切り、得られたそれぞれの小部分の強度を、元の値の対数(対数の底は任意)に実質的に等しい値へと変換し、値が変換されたこの小部分のスペクトル(すなわち、ケプストラム)を、高速フーリエ変換の手法(あるいは、離散的変数をフーリエ変換した結果を表すデータを生成する他の任意の手法)により求める。そして、このケプストラムの極大値を与える周波数のうちの最小値を、この小部分におけるピッチ成分の周波数として特定する。
なお、ピッチ成分の周波数の時間変化は、例えば、特開2003−108172号公報に開示された手法に従って入力音声データをピッチ波形データへと変換してから、このピッチ波形データに基づいて特定するようにすると良好な結果が期待できる。具体的には、入力音声データをフィルタリングしてピッチ信号を抽出し、抽出されたピッチ信号に基づいて、入力音声データが表す波形を単位ピッチ長の区間へと区切り、各区間について、ピッチ信号との相関関係に基づいて位相のずれを特定して各区間の位相を揃えることにより、入力音声データをピッチ波形信号へと変換すればよい。そして、得られたピッチ波形信号を入力音声データとして扱い、ケプストラム解析を行う等することにより、ピッチ成分の周波数の時間変化を特定すればよい。
BRFE3は、自己に入力された信号のうち、自己の中心周波数及びその近傍の周波数の成分を実質的に遮断し、その他の成分を通過させるようなフィルタリングを行う。
具体的には、自己の中心周波数を、ピッチ特定部E2より供給されるピッチ周波数データが示す値(つまり、入力音声データのピッチ成分の周波数の現在の値)に実質的に等しくなるよう設定する。そして、音声データ入力部E1より供給される入力音声データをフィルタリングして、フィルタリングされた入力音声データ(以下、非ピッチ成分と呼ぶ)を、加算部E6へと供給する。
BPFE4は、自己に入力された信号のうち、自己の中心周波数及びその近傍の周波数の成分を通過させ、その他の成分を実質的に遮断するようなフィルタリングを行う。
具体的には、自己の中心周波数を、ピッチ特定部E2より供給されるピッチ周波数データが示す値に実質的に等しくなるよう設定する。そして、音声データ入力部E1より供給される入力音声データをフィルタリングして、フィルタリングされた入力音声データ(以下、ピッチ成分と呼ぶ)を、ピッチシフト部E5へと供給する。
なお、非ピッチ成分及びピッチ成分は、両者を互いに加算すると入力音声データと実質的に同一の音声データが得られる、という関係になるように、BRFE3及びBPFE4はそれぞれフィルタリングを行うものとする。
また、非ピッチ成分及びピッチ成分は、いずれも同一の形式のデータからなるものとし、例えば、BRFE3及びBPFE4に供給された入力音声データのサンプリング間隔と実質的に同一のサンプリング間隔を有するディジタル形式のデータからなるものとする。
ピッチシフト部E5は、BPFE4よりピッチ成分を取得する一方、外部より、電子透かしの形で埋め込む対象の2値のビット列(例えば、入力音声データの作成者名を2値のビット列として表すデータなど)を取得する。そして、取得したピッチ成分の周波数を、このビット列内の各ビット値に従ってシフトさせることにより、このビット列が表す情報を含むようピッチ成分をエンコードする。エンコードしたピッチ成分は、加算部E6へと供給する。
具体的には、ピッチシフト部E5は、例えば図2に示すように、当該ビット列の先頭から順に各々のビットの値を判別し、当該ビットの値が“1”であれば一定時間(図2において“ΔT”として示す時間)だけピッチ成分の周波数を一定幅(図2において“Δf”として示す周波数)だけシフトし、値が“0”であれば当該時間ΔTの間はピッチ成分の周波数のシフトを行わない、という動作を、当該ビット列の末尾のビットに至るまで続ければよい。
なお、ピッチ成分の周波数のシフトは、例えば、上述の値Δfに等しい周波数を有する局部発振信号を生成して、この局部発振信号とピッチ成分とを混合し、得られた信号をフィルタリングして、局部発振信号の周波数とピッチ信号の周波数との和又は差に当たる周波数を有する成分を抽出することにより行えばよい。
また、上述の値Δfは、ピッチシフト部E5によるピッチ成分の周波数のシフトの結果、ピッチ成分のうち周波数のシフトが行われた区間と行われていない区間との境界に、必ず一定量(後述する図4において“ΔF”として示す量)以上の周波数の差を生じさせるような十分大きな値であるものとする。この条件を満たす周波数Δfは、例えば実験などに基づいて経験的に定められればよい。
また、ピッチシフト部E5がビット列を取得する手法は任意であり、例えば、音声データ入力部E1が入力音声データを取得する手法と実質的に同一の手法によりビット列を取得すればよい。また、ピッチシフト部E5の機能を実現する処理を行うプロセッサが、自己の実行する他の処理により生成されたビット列を、電子透かしの形で埋め込むビット列として、ピッチシフト部E5の機能を実現する処理へと引き渡すようにしてもよい。
加算部E6は、BRFE3より供給される非ピッチ成分を取得し、また、BPFE4よりピッチ成分が供給されている間は、このピッチ成分も取得する。そして、同時に取得した非ピッチ成分及びピッチ成分の各値の和(ただし、ピッチ成分が供給されていない間は、ピッチ成分の値は0であるものとする)に相当する値を有する出力音声データを生成し、出力する。この出力音声データは、音声データ入力部E1が取得した入力音声データと同一の形式のデータからなるものとする。
出力音声データは、音声データ入力部E1が取得した入力音声データに電子透かしが施されたものに相当するものであって、ピッチシフト部E5が取得したビット列が表す情報が埋め込まれているものであるといえる。
なお、加算部E6が出力音声データを出力する手法は任意であり、例えば、図示しないインターフェース回路を介して外部の装置(例えば、ハードディスク装置など)の記憶領域に格納してもよいし、ネットワークへと送出してもよい。また、図示しない記録媒体ドライブ装置にセットされた記録媒体へ、この記録媒体ドライブ装置を介して書き込んでもよい。
(電子透かしデコード装置)
図3は、この発明の実施の形態に係る電子透かしデコード装置Dの構成を示す図である。図示するように、電子透かしデコード装置Dは、音声データ入力部D1と、ピッチ特定部D2と、BPFD3と、ビット列抽出部D4とにより構成されている。
音声データ入力部D1、ピッチ特定部D2、BPFD3及びビット列抽出部D4は、例えばCPU等のプロセッサや、このプロセッサが実行するためのプログラムを記憶するメモリなどより構成されている。なお、音声データ入力部D1、ピッチ特定部D2、BPFD3及びビット列抽出部D4の一部又は全部の機能を単一のプロセッサが行うようにしてもよい。
音声データ入力部D1は、外部より、上述の出力音声データに相当する、電子透かしが施されたディジタル形式の音声データ(以下、デコード対象音声データと呼ぶ)を取得して、ピッチ特定部D2及びBPFD3に供給する。音声データ入力部D1がデコード対象音声データを取得する手法は任意であり、例えば、上述の電子透かしエンコード装置Eの音声データ入力部E1が入力音声データを取得する手法と実質的に同一の手法により取得すればよい。
ピッチ特定部D2は、音声データ入力部D1より供給されたデコード対象音声データが表す音声のピッチ成分の周波数の時間変化を、例えば電子透かしエンコード装置Eのピッチ特定部E2が行う手法と実質的に同一の手法により特定する。そして、特定した当該時間変化を表すピッチ周波数データを、BPFD3へと連続的に供給する。
なお、ピッチ特定部D2は、ピッチ周波数データのうち、ピッチ成分が含まれていないデコード対象音声データの区間に相当する部分については、例えばラグランジェ補間あるいは直線補間などの手法により補間を行うものとすればよい。
BPFD3は、例えば電子透かしエンコード装置EのBPFE4と実質的に同一の機能を行うものであり、自己に入力された信号のうち、自己の中心周波数及びその近傍の周波数の成分を通過させ、その他の成分を実質的に遮断するようなフィルタリングを行う。
そして、フィルタリングされたデコード対象音声データ(以下、デコード用ピッチ成分と呼ぶ)をビット列抽出部D4へと供給する。
ビット列抽出部D4は、BPFD3から供給されるデコード用ピッチ成分を取得し、このデコード用ピッチ成分の周波数のシフトのパターンに基づいて、デコード対象音声データに埋め込まれているビット列を抽出する。そして、抽出されたビット列を外部に出力する。
具体的には、例えばデコード対象音声データが、ピッチ成分について図2を参照して上述した態様による電子透かしを施されたものである場合、ビット列抽出部D4は、例えば図4に示すように、デコード用ピッチ成分の先頭から時間ΔTおきに到来する時点を経過するたびに、当該時点直後のピッチ成分の周波数が、当該時点又はその直前のピッチ成分の周波数よりΔF以上高いか、ΔF以上低いかを判別すればよい(なお、図4に示す例は、ΔFが正の値である場合を表している)。そして、ΔF以上高いと判別したときは、当該時点以降の時間ΔT分の区間が値“1”のビットを表しているものと判断して、値が“1”のビットを生成し、また、ΔF以上低いと判別したときは、当該時点以降の時間ΔT分の区間が値“0”のビットを表しているものと判断して、値が“0”のビットを生成する、という処理を順次行うことにより、ビット列の抽出を行えばよい。
なお、ビット列抽出部D4がビット列を出力する手法は任意であり、例えば、図示しないインターフェース回路を介して外部の装置の記憶領域に格納してもよいし、ネットワークへと送出してもよい。また、図示しない記録媒体ドライブ装置にセットされた記録媒体へ、この記録媒体ドライブ装置を介して書き込んでもよい。
以上説明した電子透かしエンコード装置Eは、音声データを、ピッチ成分と非ピッチ成分とに分離し、埋め込むべきビット列の値に従ってピッチ成分の周波数をシフトした上、当該ピッチ成分と非ピッチ成分とを加算することにより、当該ビット列が表す情報を当該音声データに埋め込む(すなわち、当該音声データに電子透かしを施す)。そして電子透かしデコード装置Dは、電子透かしエンコード装置Eによって音声データに埋め込まれたビット列を、当該音声データから抽出する。
一般的に、人間が発する音声のピッチ成分の周波数は200[Hz]前後であり、一方、人間の可聴域はほぼ20〜20000[Hz]の範囲にあるものの、200[Hz]前後の周波数の成分については感度が低く、このような成分に変化を生じさせてもこの変化を聞き分けることは困難である。従って、電子透かしエンコード装置Eによって電子透かしを施された音声データを用いて再生された音声と、電子透かしを施される前の当該音声データを用いて再生された音声との差異は、人間には識別が困難である。すなわち、電子透かしエンコード装置Eによる電子透かしが音声に与える影響は無視できる程度に抑えられる。
また、電子透かしエンコード装置Eは音声データのピッチ成分の周波数を一部シフトすることにより電子透かしを施すものである。従って、このシフトの幅を知らない者は、電子透かしエンコード装置Eにより電子透かしを施された音声データから、電子透かしを施される前の音声データを完全に復元することができない。
また、電子透かしエンコード装置Eによって電子透かしを施された音声データをアナログコピーして得られたデータからも、埋め込まれたビット列の抽出が可能である。
なお、電子透かしエンコード装置E及び電子透かしデコード装置Dの構成は上述のものに限られない。
例えば、音声データ入力部E1は、マイクロフォン、増幅器、サンプリング回路、A/D(Analog-to-Digital)コンバータ及びPCMエンコーダなどを備えていてもよい。この場合、音声データ入力部E1は、自己のマイクロフォンが集音した音声を表す音声信号を増幅し、サンプリングしてA/D変換した後、サンプリングされた音声信号にPCM変調を施すことにより、音声データを作成してもよい。
また、ピッチシフト部E5がピッチ成分の周波数をシフトする規則も図2に示すものに限られない。従って、例えば図5に示すように、埋め込む対象のビット列の先頭から順に各々のビットの値を判別し、当該ビットの値が“1”であれば一定時間ΔTだけピッチ成分の周波数を一定幅だけ前回シフトした方向と逆方向にシフトし(すなわち、例えば前回Δfだけシフトしたのであれば(−Δf)だけシフトし、前回(−Δf)だけシフトしたのであればΔfだけシフトし)、値が“0”であれば当該時間ΔTの間は前回シフトした方向と同方向で上述の一定幅のシフトを継続する、という動作を、当該ビット列の末尾のビットに至るまで続けるようにしてもよい。
この場合、ビット列抽出部D4は、例えば図6に示すように、デコード用ピッチ成分の先頭から時間ΔTおきに到来する時点を経過するたびに、当該時点前後のピッチ成分の周波数に±ΔF以上の差があるか否かを判別すればよい。そして、±ΔF以上の差があると判別したときは、当該時点におけるピッチ成分の周波数の変化が値“1”のビットを表しているものと判断して、値が“1”のビットを生成し、また、±ΔF以上の差がないと判別したときは、当該時点におけるピッチ成分の周波数の変化が値“0”のビットを表しているものと判断して、値が“0”のビットを生成する、という処理を順次行うことにより、ビット列の抽出を行えばよい。
以上、この発明の実施の形態を説明したが、この発明にかかる電子透かしエンコード装置及び電子透かしデコード装置は、専用のシステムによらず、通常のコンピュータシステムを用いて実現可能である。
例えば、パーソナルコンピュータに上述の音声データ入力部E1、ピッチ特定部E2、BRFE3、BPFE4、ピッチシフト部E5及び加算部E6の動作を実行させるためのプログラムを格納した記録媒体(CD−ROM、フレキシブルディスク等)から該プログラムをインストールすることにより、上述の処理を実行する電子透かしエンコード装置Eを構成することができる。
また、パーソナルコンピュータに上述の音声データ入力部D1、ピッチ特定部D2、BPFD3及びビット列抽出部D4の動作を実行させるためのプログラムを格納した記録媒体(CD−ROM、フレキシブルディスク等)から該プログラムをインストールすることにより、上述の処理を実行する電子透かしデコード装置Dを構成することができる。
なお、パーソナルコンピュータに電子透かしエンコード装置E又は電子透かしデコード装置Dの機能を行わせるプログラムは、例えば、通信回線の掲示板(BBS)にアップロードし、これを通信回線を介して配信してもよく、また、これらのプログラムを表す信号により搬送波を変調し、得られた変調波を伝送し、この変調波を受信した装置が変調波を復調してこれらのプログラムを復元するようにしてもよい。
そして、これらのプログラムを起動し、OSの制御下に、他のアプリケーションプログラムと同様に実行することにより、上述の処理を実行することができる。
なお、OSが処理の一部を分担する場合、あるいは、OSが本願発明の1つの構成要素の一部を構成するような場合には、記録媒体には、その部分を除いたプログラムを格納してもよい。この場合も、この発明では、その記録媒体には、コンピュータが実行する各機能又はステップを実行するためのプログラムが格納されているものとする。
この発明の実施の形態に係る電子透かしエンコード装置の構成を示すブロック図である。 ピッチ成分が加工される態様を示すグラフである。 この発明の実施の形態に係る電子透かしデコード装置の構成を示すブロック図である。 ビット列が抽出される態様を説明するグラフである。 ピッチ成分が加工される他の態様を示すグラフである。 ビット列が抽出される他の態様を説明するグラフである。
符号の説明
E 電子透かしエンコード装置
E1 音声データ入力部
E2 ピッチ特定部
E3 BRF
E4 BPF
E5 ピッチシフト部
E6 加算部
D 電子透かしデコード装置
D1 音声データ入力部
D2 ピッチ特定部
D3 BPF
D4 ビット列抽出部

Claims (8)

  1. 音声を表す音声信号を取得する音声信号取得手段と、
    取得された前記音声信号を、当該音声信号が表す音声のピッチ成分の周波数のシフトの時間軸上におけるパターンが、電子透かしとして埋め込む対象のデータの値を表すものとなるように加工する音声信号加工手段と、を備える、
    ことを特徴とする電子透かしエンコード装置。
  2. 前記音声信号加工手段は、
    取得された前記音声信号より、当該音声信号が表す音声のピッチ成分を表すピッチ成分信号を抽出するピッチ成分抽出手段と、
    取得された前記音声信号より、当該音声信号が表す音声のピッチ成分以外の成分を表す非ピッチ成分信号を抽出する非ピッチ成分抽出手段と、
    前記ピッチ成分信号を取得し、当該ピッチ成分信号の周波数を、電子透かしとして埋め込む対象のデータの値を表すようなパターンを時間軸上において有するようにシフトするピッチ成分周波数シフト手段と、
    前記周波数のシフトを施されたピッチ成分信号、及び前記非ピッチ成分信号を取得して互いに加算することにより、電子透かしを施された音声信号を生成する加算手段と、を備える、
    ことを特徴とする請求項1に記載の電子透かしエンコード装置。
  3. 前記ピッチ成分抽出手段は、
    前記音声信号が表す音声のピッチ成分の周波数を特定するピッチ周波数特定手段と、
    前記音声信号のうち、特定された前記周波数近傍の成分を前記ピッチ成分として抽出するバンドパスフィルタと、を備え、
    前記非ピッチ成分抽出手段は、前記音声信号から、特定された前記周波数近傍の成分を除去することによって、残余の成分を前記非ピッチ成分として抽出するバンドリジェクションフィルタにより構成される、
    ことを特徴とする請求項2に記載の電子透かしエンコード装置。
  4. 音声を表す、電子透かしを施された音声信号を取得する音声信号取得手段と、
    取得された前記音声信号より、当該音声信号が表す音声のピッチ成分を表すピッチ成分信号を抽出するピッチ成分抽出手段と、
    抽出された前記ピッチ成分信号が有する、時間軸上における周波数のシフトのパターンを特定し、特定されたパターンに基づいて、前記音声信号に電子透かしとして埋め込まれたデータを特定する手段と、を備える、
    ことを特徴とする電子透かしデコード装置。
  5. 音声信号取得部と音声信号加工部を有する装置において実行される電子透かしエンコード方法であって、
    前記音声信号取得部が、音声を表す音声信号を取得する音声信号取得ステップと、
    前記音声信号加工部が、前記取得された音声信号を、当該音声信号が表す音声のピッチ成分の周波数のシフトの時間軸上におけるパターンが、電子透かしとして埋め込む対象のデータの値を表すものとなるように加工する音声信号加工ステップと
    を備えることを特徴とする電子透かしエンコード方法。
  6. 音声信号取得部とピッチ成分抽出部と特定部とを有する装置において実行される電子透かしデコード方法であって、
    前記音声信号取得部が、音声を表す、電子透かしを施された音声信号を取得する音声信号取得ステップと、
    前記ピッチ成分抽出部が、前記取得された音声信号から、当該音声信号が表す音声のピッチ成分を表すピッチ成分信号を抽出するピッチ成分抽出ステップと、
    前記特定部が、前記抽出されたピッチ成分信号が有する、時間軸上における周波数のシフトのパターンを特定し、当該特定されたパターンに基づいて、前記音声信号に電子透かしとして埋め込まれたデータを特定する特定ステップと
    を備えることを特徴とする電子透かしデコード方法。
  7. コンピュータを、
    音声を表す音声信号を取得する音声信号取得手段と、
    取得された前記音声信号を、当該音声信号が表す音声のピッチ成分の周波数のシフトの時間軸上におけるパターンが、電子透かしとして埋め込む対象のデータの値を表すものとなるように加工する音声信号加工手段と、
    して機能させるためのプログラム。
  8. コンピュータを、
    音声を表す、電子透かしを施された音声信号を取得する音声信号取得手段と、
    取得された前記音声信号より、当該音声信号が表す音声のピッチ成分を表すピッチ成分信号を抽出するピッチ成分抽出手段と、
    抽出された前記ピッチ成分信号が有する、時間軸上における周波数のシフトのパターンを特定し、特定されたパターンに基づいて、前記音声信号に電子透かしとして埋め込まれたデータを特定する手段と、
    して機能させるためのプログラム。
JP2005372651A 2005-12-26 2005-12-26 電子透かしエンコード装置、電子透かしデコード装置、電子透かしエンコード方法、電子透かしデコード方法及びプログラム Expired - Fee Related JP4702043B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005372651A JP4702043B2 (ja) 2005-12-26 2005-12-26 電子透かしエンコード装置、電子透かしデコード装置、電子透かしエンコード方法、電子透かしデコード方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005372651A JP4702043B2 (ja) 2005-12-26 2005-12-26 電子透かしエンコード装置、電子透かしデコード装置、電子透かしエンコード方法、電子透かしデコード方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2007171833A JP2007171833A (ja) 2007-07-05
JP4702043B2 true JP4702043B2 (ja) 2011-06-15

Family

ID=38298439

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005372651A Expired - Fee Related JP4702043B2 (ja) 2005-12-26 2005-12-26 電子透かしエンコード装置、電子透かしデコード装置、電子透かしエンコード方法、電子透かしデコード方法及びプログラム

Country Status (1)

Country Link
JP (1) JP4702043B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113466552B (zh) * 2021-07-14 2024-02-02 南京海兴电网技术有限公司 一种定间隔采样下频率跟踪方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005049409A (ja) * 2003-07-29 2005-02-24 Meiji Univ オーディオデータの透かし情報埋め込み方法、埋め込みプログラム及び検出方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005049409A (ja) * 2003-07-29 2005-02-24 Meiji Univ オーディオデータの透かし情報埋め込み方法、埋め込みプログラム及び検出方法

Also Published As

Publication number Publication date
JP2007171833A (ja) 2007-07-05

Similar Documents

Publication Publication Date Title
US7606711B2 (en) Audio signal processing device, signal recovering device, audio signal processing method and signal recovering method
JP4186531B2 (ja) データ埋め込み方法、データ抽出方法、データ埋め込み抽出方法、及びシステム
JP2011145541A (ja) 再生装置、楽音信号出力装置、再生システム及びプログラム
JP2006323246A (ja) 音響信号に対する情報の埋め込み装置、音響信号からの情報の抽出装置、および音響信号再生装置
CN106531202B (zh) 一种音频处理方法及装置
EP1953751A2 (en) Reproduction device, reproduction method and computer usable medium having computer readable reproduction embodied therein
EP1512952B1 (en) Speech signal interpolation device, speech signal interpolation method, and program
JP4702043B2 (ja) 電子透かしエンコード装置、電子透かしデコード装置、電子透かしエンコード方法、電子透かしデコード方法及びプログラム
JP6193395B2 (ja) 電子透かし検出装置、方法及びプログラム
JP2006323182A (ja) 音響信号に対する情報の埋め込み装置、音響信号からの情報の抽出装置、および音響信号再生装置
JP2012523579A (ja) 混合信号を形成する方法及び装置、信号を分離する方法及び装置、並びに対応する信号
JP4702042B2 (ja) 電子透かしエンコード装置、電子透かしデコード装置、電子透かしエンコード方法、電子透かしデコード方法及びプログラム
JP4736794B2 (ja) 電子透かしエンコード装置、電子透かしデコード装置、電子透かしエンコード方法、電子透かしデコード方法及びプログラム
JP3955967B2 (ja) 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム
JP4533234B2 (ja) 記録再生装置及び記録再生方法
JP2004126214A (ja) オーディオ処理装置及びその方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP2004334160A (ja) 特徴量抽出装置
JP3875890B2 (ja) 音声信号加工装置、音声信号加工方法及びプログラム
JPH11175096A (ja) 音声信号処理装置
JP2004361766A (ja) 話速変換装置、話速変換方法及びプログラム
JP2004294969A (ja) 音声信号圧縮装置、音声信号圧縮方法及びプログラム
JP4713180B2 (ja) 音響信号からの情報の抽出装置
JP3994332B2 (ja) 音声信号圧縮装置、音声信号圧縮方法、及び、プログラム
KR102150639B1 (ko) 디지털 데이터의 무결성을 검증할 수 있는 장치 및 디지털 데이터의 무결성을 검증할 수 있는 방법
JP4362775B2 (ja) 放送録音装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110221

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140318

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140318

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees