JP2004069963A - 音声符号変換装置及び音声符号化装置 - Google Patents
音声符号変換装置及び音声符号化装置 Download PDFInfo
- Publication number
- JP2004069963A JP2004069963A JP2002228492A JP2002228492A JP2004069963A JP 2004069963 A JP2004069963 A JP 2004069963A JP 2002228492 A JP2002228492 A JP 2002228492A JP 2002228492 A JP2002228492 A JP 2002228492A JP 2004069963 A JP2004069963 A JP 2004069963A
- Authority
- JP
- Japan
- Prior art keywords
- code
- speech
- conversion
- algebraic
- embedded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 253
- 238000000034 method Methods 0.000 claims description 131
- 238000013139 quantization Methods 0.000 claims description 74
- 230000005236 sound signal Effects 0.000 claims description 22
- 238000010586 diagram Methods 0.000 description 40
- 238000004891 communication Methods 0.000 description 31
- 238000013075 data extraction Methods 0.000 description 21
- 239000000284 extract Substances 0.000 description 16
- 230000006866 deterioration Effects 0.000 description 13
- 230000014509 gene expression Effects 0.000 description 10
- 238000000926 separation method Methods 0.000 description 9
- 230000003044 adaptive effect Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 101150018516 BST1 gene Proteins 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】第1の符号化方式の音声符号を、任意のデータが埋め込まれた状態の第2の符号化方式の音声符号に変換できる音声符号変換装置を提供する。
【解決手段】音声符号変換装置は、第1の音声符号を構成する代数符号の変換候補となる、第2の符号化方式に従った複数の代数符号を格納した符号帳15と、代数符号帳に格納された複数の代数符号を第2の音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の代数符号に限定することにより、変換候補を限定する限定部13と、限定された変換候補から変換先に相当する要素符号を決定する決定部26と、を含む。
【選択図】図1
【解決手段】音声符号変換装置は、第1の音声符号を構成する代数符号の変換候補となる、第2の符号化方式に従った複数の代数符号を格納した符号帳15と、代数符号帳に格納された複数の代数符号を第2の音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の代数符号に限定することにより、変換候補を限定する限定部13と、限定された変換候補から変換先に相当する要素符号を決定する決定部26と、を含む。
【選択図】図1
Description
【0001】
【発明が属する技術分野】
本発明は、インターネット等のネットワーク,携帯電話・自動車電話システム等で使用される音声符号化装置,及び音声符号化装置によって符号化された音声符号を別の音声符号に変換する際、任意のデータを埋め込む音声符号変換装置に関する。
【0002】
【従来の技術】
近年、コンピュータやインターネットが普及する中で、マルチメディアコンテンツ(静止画、動画、オーディオ、音声など)に任意のデータを埋め込む「電子透かし技術」が注目を集めている。電子透かし技術とは、人間の知覚の特性を利用し、画像、動画、音声などのマルチメディアコンテンツ自体に、品質に影響を与えることなく別の任意の情報を埋め込む技術である。「電子透かし技術」は、コンテンツに作成者や販売者などの名前を埋め込んで、不正コピーやデータ改ざんなどを防止するといった著作権保護を目的として使用されることが多い。また、「電子透かし技術」は、コンテンツに関する関連情報や付属情報を埋め込んで、利用者がコンテンツを利用する時の利便性を高める場合にも用いられている。
【0003】
音声通信の分野でも、音声に対してこのような任意の情報を埋め込んで伝送する試みが行われている。図11は、データ埋め込み技術を適用した音声通信システムの概念を示す図である。音声通信システムでは、通信回線の有効利用の観点から、音声が符号化される。符号器で音声を符号化する際に任意のデータ系列が音声符号に埋め込まれ、復号器へ伝送される。復号器は音声符号から埋め込まれたデータを抽出すると共に、通常の復号処理により音声を再生する。この技術では、音声符号自体にデータが埋め込まれるため、データの伝送量は増加することがない。また、再生音声の品質に影響がない状態でデータの埋め込みが行われる。このため、再生される音声の品質について、埋め込みを行う場合と行わない場合とでほとんど差が生じない。このようなデータ埋め込み技術により、伝送量の増加や品質に対する影響がなく、音声とは異なる任意のデータを伝送することができる。また、データの埋め込みが行われていることを知らない第三者は、通常の音声通信として認識し、埋め込まれたデータを認識することはない。
【0004】
データの埋め込み方法には様々な方法がある。近年では、インターネットを利用した音声通信としてのVoIP(Voice over IP)や、携帯電話システムで広く利用されているCELP(Code−Excited Linear Prediction;符号駆動線形予測符号化)と呼ばれる基本アルゴリズムをベースとした音声符号化方式(例えば、AMR(Adaptive Multi−Rate;適応マルチレート)、G.729A)について、符号化された音声符号に任意の情報を埋め込む方法がいくつか提案されている。
【0005】
例えば、CELP方式における固定符号帳の符号「代数符号」や適応符号帳の符号「ピッチラグ符号」に任意のデータを埋め込む技術が提案されている。この技術では、ある閾値に従って、代数符号やピッチラグ符号に任意のデータ系列が埋め込まれる。ここで、CELP方式の原理を簡単に説明する。CELPの特徴は、人間の声道特性を表す線形予測係数(LPC係数)、音声のピッチ成分と雑音成分とからなる音源信号を表すパラメータを効率良く伝送することである。CELPは、人間の声道をLPC合成フィルタH(z)で近似し、H(z)の入力(音源信号)が音声の周期性を表すピッチ周期成分と、ランダム性を表す雑音成分とに分離できると仮定する。CELPは、入力音声信号をそのまま復号器側へ伝送するのではなく、LPC合成フィルタのフィルタ係数、並びに励起信号のピッチ周期成分と雑音成分とを抽出し、これらを量子化して得られる量子化インデックスを伝送する。これによって、高い情報圧縮が実現されている。上記した「代数符号」は、雑音成分を量子化して得られる量子化インデックスに相当し、「ピッチラグ符号」は、ピッチ周期成分を量子化して得られる量子化インデックスに相当する。
【0006】
ところで、携帯電話の利用者の急増やVoIPの普及に伴い、今後異なる音声通信システム間の通信が増加することが予想される。現状では、音声通信システム毎に異なる音声符号化方式が用いられていることが多い。例えば、世界共通の音声符号化方式であるAMR方式は、W−CDMAに採用されている。一方、VoIPでは、ITU−T勧告G.729A方式が広く用いられている。このため、異なる音声通信システム間の音声通信では、一方の音声通信システムで使用されている音声符号化方式で符号化された音声符号を、他方の音声通信システムで使用されている音声符号化方式の音声符号に変換する必要がある。
【0007】
図12は、音声通信システム間で音声符号を変換する音声符号変換装置を含む音声符号変換システムの概念を示す図である。音声符号を変換する技術としては、次の方式が提案されている。
(1)各々の音声通信システムの音声符号化方式で復号・符号を繰り返すタンデム接続方式;
(2)音声符号を、音声符号を構成する各要素符号に分解し、各要素符号を個別に別の音声符号化方式の符号に変換する方式(特願2001−75427)。
【0008】
図13は、上記(2)の方式による音声符号変換方式を示す図である。図13に示すように、第1の符号化方式の音声符号は、音声符号分離部において、LSP(線スペクトル対)符号(LSP符号1),ピッチラグ符号(ピッチラグ符号1),ピッチゲイン符号(ピッチゲイン符号1),代数ゲイン符号(代数ゲイン符号1),及び代数符号(代数符号1)からなる複数の要素符号に分離され、夫々対応する変換部(LSP符号変換部,ピッチラグ符号変換部,ピッチゲイン符号変換部,代数ゲイン符号変換部,及び代数符号変換部の何れか)に入力される。各符号変換部は、入力された対応する要素符号を第2の符号化形式に応じた要素符号に変換して出力する。出力された複数の要素符号(LSP符号2,ピッチラグ符号2,ピッチゲイン符号2,代数ゲイン符号2,及び代数符号2)は、音声符号多重部に入力され、多重化されて第2の符号化形式の音声符号として出力される。
【0009】
図14に、図13で示した音声符号変換方式において、個々の要素符号を変換する場合の概念図を示す。図14は、第1の符号化方式の符号化データCode1を第2の符号化方式の符号化データCode2に変換する符号変換部を示す。図14において、符号変換部は第1の符号化方式において使用される第1量子化テーブルと、第2の符号化方式において使用される第2量子化テーブルを備えている。量子化テーブルのテーブルサイズやテーブル値は、符号化方式毎に異なっている。図14では、説明を簡単にするため、第1量子化テーブルのテーブルサイズが2ビットに設定され、第2量子化テーブルのテーブルサイズが3ビットに設定されている。符号変換部に入力される第1の符号化方式の音声符号Code1(図14では“10”)は、第1量子化テーブルのインデックス番号を表している。符号変換部は、入力された音声符号Code1に対応する第1量子化テーブルのテーブル値(図14では“1.5”)に対して最も誤差の小さいテーブル値(図14では“1.6”)を第2量子化テーブルから選択し、選択したテーブル値に対応する第2量子化テーブルのインデックス番号(図14では“011”)を第2の符号化方式の音声符号Code2として出力する。このように、符号変換部は、変換元の量子化テーブルと変換先の量子化テーブルとを比較してテーブル値の誤差が最も小さくなるようにインデックス番号の対応付けを行い、誤差が最も小さいテーブル値に対応するインデックス番号を出力する。
【0010】
ところが、変換元の音声符号Code1に任意のデータが埋め込まれていた場合には、音声品質のみを考慮して音声符号の変換を行うと、埋め込まれたデータが損なわれる場合がある。例えば、音声符号Code1のデータ系列“10”が前述した埋め込み方法によって埋め込まれた任意のデータであった場合において、上述した符号変換処理が行われると、入力されたデータ系列“10”は“011”に変換される。従って、埋め込まれたデータ系列“10”が維持されない。このため、受信側の第2の符号化方式の復号器は、埋め込まれたデータ系列を正常に受信することができない。
【0011】
上記した問題を解決する手段として、変換元の音声符号に埋め込まれた任意のデータを一旦抽出し、符号変換処理の後に変換先の符号に再び埋め込む方式が提案されている。図15は、変換元の埋め込みデータを損なわない音声符号変換器の原理図である。図15に示す音声符号変換器は、埋め込みデータ抽出部と、音声符号変換部と、データ埋め込み部とを有する。埋め込みデータ抽出部は、第1の符号化方式の音声符号から埋め込みデータScodeを抽出する。データ埋め込み部は、音声符号変換部で第2の符号化形式に変換された音声符号に埋め込みデータScodeを埋め込む。これによって、変換処理後の音声符号が埋め込みデータを保持する状態になる。
【0012】
図16は、図15に示した音声符号変換器の詳細を説明する図である。図16は、第1の符号化方式の音声符号Code1を第2の符号化方式の音声符号Code2に変換する場合を示している。図16に示す符号変換部は、図14に示した符号変換部と同様の構成及び機能を持つ。図16において、符号変換部に入力される第1の符号化方式の音声符号Code1(図16では“10”)は、第1量子化テーブルのインデックス番号を表している。また、音声符号Code1を構成するデータ系列の下位nビットは、埋め込まれた任意のデータ系列を表している(ここでは、説明を簡略化するため、n=2と仮定して説明する)。また、符号変換部から出力される音声符号Code2’は、第2量子化テーブルのインデックス番号を表している。一方、データ埋め込み部から出力される音声符号Code2は、第2量子化テーブルのインデックス番号を表している。また、音声符号Code2を構成するデータ系列の下位nビットは、埋め込みデータ系列を表している。以下に、図16に示す音声符号変換器の動作を説明する。まず、音声符号Code1(図16では“10”)は、符号変換部及び埋め込みデータ抽出部に夫々入力される。埋め込みデータ抽出部は、音声符号Code1に埋め込まれている埋め込みデータ系列SCode(図16では“10”)を抽出し、データ埋め込み部へ出力する。データ埋め込み部では、符号変換部でCode1を符号変換したCode2’(図16では“011”)に埋め込みデータ系列SCodeを下位nビットに埋め込み、第2の符号化方式の符号化データCode2(図16では“010”)として出力する。
【0013】
今後、第3世代携帯電話システムに代表されるように、音声通信に加えてデータ通信等のマルチメディア情報を対象とした通信システムの普及が予想される。このため、従来の音声回線のみを持つ通信システムと、音声回線及びその他のデータ回線を持つ通信システムとの間で通信が発生する。この場合、従来の音声符号変換装置が通信システム間で音声符号の相互変換を行えば、ユーザ間で音声通信を行うことができる。しかしながら、一方の通信システムがデータ回線を持たないため、ユーザ間でデータ通信を行うことができない。この問題に対し、図17に示される解決策が提案されている。図17は、第1の符号化方式の音声符号(音声符号1)を第2の符号化方式の音声符号(音声符号2)に変換する際に、変換先の音声符号2に任意のデータを埋め込む音声符号変換器の概念図を示している。図17において、音声符号変換器は、音声符号変換部と、データ埋め込み部とを有している。音声符号変換部は、第1の符号化方式の音声符号を第2の符号化方式の音声符号に変換する符号変換処理を行う。データ埋め込み部は、符号変換処理が行われた後の音声符号(変換先の音声符号2)に任意のデータを埋め込む。このように、送信対象のデータが、変換先の音声符号2に埋め込まれ、受信先に転送される。このような方式が適用されれば、音声回線のみを持つ通信システムのユーザと音声回線及びその他のデータ回線を持つ通信システムとの間で、データ通信を実行することができる。
【0014】
図18は、図17に示した方式を用い、任意のデータを変換先の音声符号に埋め込む音声符号変換器(音声符号変換部(符号変換部)及びデータ埋め込み部)の概念図である。図18には、第1の符号化方式の音声符号Code1を第2の符号化方式の音声符号Code2に変換する符号変換部を含む音声符号変換器が示されている。図18に示す符号変換部は、図14に示した符号変換部と同一の構成及び機能を持つ。図18において、符号変換部に入力される第1の符号化方式の音声符号Code1(図18では“10”)は、第1量子化テーブルのインデックス番号を表している。また、符号変換部から出力される音声符号Code2’は、第2量子化テーブルのインデックス番号を表している。また、データ埋め込み部から出力される音声符号Code2は、第2量子化テーブルのインデックス番号を表す。さらに、音声符号Code2を構成するデータ系列の下位mビットは、埋め込みデータ系列を表している。ここでは、説明を簡略化するため、m=1であるものと仮定する。図18において、符号変換部は、図14に示した符号変換部と同様の処理,即ち、第1の符号化方式の音声符号Code1(“10”)を第2の符号化方式の音声符号Code2’(“011”)に変換し、データ埋め込み部に入力する。データ埋め込み部は、データ回線から入力されるデータ系列SCode(埋め込みデータ(図18では“0”)を音声符号Code2’の下位mビットに埋め込む。データ埋め込み部は、データの埋め込みによって生成されたデータ系列“010”を第2の符号化方式の音声符号Code2として出力する。
【0015】
【発明が解決しようとする課題】
図16に示した従来技術1では、音声符号Code1に含まれる埋め込みデータScodeを埋め込みデータ抽出部が一旦抽出し、データ埋め込み部が符号変換部によって符号変換処理が実行された後の音声符号Code2’ に、抽出された埋め込みデータScodeを埋め込む。これによって、埋め込みデータが損なわれることなく符号変換が実現される。しかしながら、従来技術1では、データの埋め込みによって音声符号の値が変わる。このため、音声符号Code1に対応する第1量子化テーブルの値(図16では“10”に対応するテーブル値“1.5”)と、音声符号変換器から出力される音声符号Code2に対応する第2量子化テーブルの値(図16では“010”に対応するテーブル値“3.1”)との誤差が大きくなることがあった。これによって、Code2が音声に復号された際の音声歪みが大きくなり、音声品質が劣化する虞があった。
【0016】
一方、図18に示した従来技術2では、音声符号Code1が符号変換された音声符号Code2’ に任意のデータを埋め込む。しかしながら、従来技術2による方式でも、データの埋め込みによって音声符号の値が変わる。このため、音声符号Code1に対応する第1量子化テーブルの値(図18では“10”に対応するテーブル値“1.5”)と、音声符号Code2に対応する第2量子化テーブルの値(図18では’010’に対応するテーブル値“3.1”)との誤差が大きくなることがあった。これによって、Code2が音声に復号された際の音声歪みが大きくなり、音声品質が劣化する虞があった。以上のように、従来技術1及び2では、データの埋め込みと音声品質の保持の両立ができないという問題があった。
【0017】
本発明の目的は、第1の符号化方式の音声符号を第2の符号化方式の音声符号に変換するときに、第1の符号化方式の音声符号を、任意のデータが埋め込まれた状態の第2の符号化方式の音声符号に変換することができる音声符号変換装置を提供することである。
【0018】
また、本発明の他の目的は、第1の符号化方式の音声符号を第2の符号化方式の音声符号に変換するときに、音質の劣化を抑えつつ、任意のデータを第2の符号化方式の音声符号に埋め込むことができる音声符号変換装置を提供することである。
【0019】
また、本発明の他の目的は、音声信号を音声符号に符号化するときに、音声信号を任意のデータが埋め込まれた音声符号に符号化することができる音声符号化装置を提供することである。
【0020】
【課題を解決するための手段】
本発明は、上記した課題を解決するために以下の構成を持つ。
【0021】
すなわち、本発明は、第1の符号化方式により符号化された第1の音声符号を第2の符号化方式により符号化された第2の音声符号に変換する音声符号変換装置であって、
第1の音声符号を構成する要素符号に埋め込まれた埋め込みデータを抽出する抽出手段と、
前記第1の音声符号の要素符号の変換候補となる、第2の符号化方式に従った複数の要素符号を格納した符号帳と、
前記符号帳に格納された複数の要素符号を前記抽出手段によって抽出された埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、変換候補を限定する限定手段と、
前記限定手段によって限定された変換候補から変換先に相当する要素符号を決定する決定手段と、
を含む音声符号変換装置である。
【0022】
本発明は、第1の符号化方式で符号化される要素符号の全部又は一部は、第2の符号化方式で符号化される要素符号と同一の構成を有し、この同一の構成部分に前記埋め込みデータが埋め込まれており、
前記限定手段は、変換候補を、第1の符号化方式で符号化される要素符号に対する埋め込みデータの埋め込み位置と同じ位置の値が埋め込みデータの値と等しい要素符号に限定する、ように構成するのが好ましい。
【0023】
また、本発明は、第1の符号化方式により符号化された第1の音声符号を第2の符号化方式により符号化された第2の音声符号に変換する音声符号変換装置であって、
第1の音声符号を構成する要素符号の変換候補となる、第2の符号化方式に従った複数の要素符号を格納した符号帳と、
前記符号帳に格納された複数の要素符号を第2の音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、変換候補を限定する限定手段と、
前記限定手段によって限定された変換候補から変換先に相当する要素符号を決定する決定手段と、
を含む音声符号変換装置である。
【0024】
また、本発明における決定手段は、第1の音声符号を構成する要素符号の逆量子化値との誤差が最小となる逆量子化値が第2の符号化方式に従って符号化された要素符号を、変換先に相当する要素符号に決定する、ように構成するのが好ましい。
【0025】
また、本発明は、音声信号を音声符号に符号化する音声符号化装置であって、
音声信号の特定成分が符号化された複数の要素符号を格納した符号帳と、
前記符号帳に格納された複数の要素符号を音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、特定成分の符号化候補を限定する限定手段と、
前記限定手段によって限定された符号化候補から、特定成分の符号化先に相当する要素符号を決定する決定手段と、
を含む音声符号化装置である。
【0026】
また、本発明は、上記した音声符号変換装置、又は音声符号化装置と同様の特徴を持つ音声符号変換方法、又は音声符号化方法として特定することも可能である。
【0027】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。実施の形態の構成は例示であり、本発明は、実施の形態の構成に限定されない。
【0028】
〔第1実施形態〕
最初に、本発明の第1実施形態として、本発明の第1の発明に対応する実施形態について説明する。
【0029】
〈第1実施形態の概要〉
図1は、本発明の第1実施形態(音声符号変換器10)のシステム原理を示す概要図である。図1は、データが埋め込まれている第1の符号化方式の音声符号(音声符号Code1)が入力され、データが埋め込まれている第2の符号化方式の音声符号(音声符号Code2)を出力する音声符号変換器10を示している。
【0030】
音声符号変換器10は、音声符号変換部(符号変換部)11と、埋め込みデータ抽出部12と、変換符号限定部13とを備えている。音声符号変換部11及び埋め込みデータ抽出部12は、音声符号Code1を受け取る。音声符号Code1には、任意の埋め込みデータが埋め込まれている。音声符号変換部11は、音声符号Code1を第2の符号化方式に従った音声符号Code2に変換する。埋め込みデータ抽出部12は、音声符号Code1から埋め込みデータを抽出し、変換符号限定部13に入力する。変換符号限定部13は、埋め込みデータ抽出部12から入力された埋め込みデータを符号限定情報として用い、音声符号Code1の変換先の音声符号(音声符号Code2)の候補を限定する。
【0031】
図2は、図1に示した音声符号変換器10をさらに詳細に示す図である。図2は、データが埋め込まれている音声符号を、埋め込みデータを損なわずに変換する符号変換部11の概念を示している。図2において、符号変換部11は、第1量子化テーブル14と、第2量子化テーブル15とを含んでいる。
【0032】
第1量子化テーブル14は、1以上のテーブル値を持ち、テーブル値毎にインデックス番号(量子化インデックス)が割り当てられている。各テーブル値は、音声符号の逆量子化値(復号値)を示し、インデックス番号はテーブル値を符号化して得られる音声符号を構成する。第1量子化テーブル14のインデックス番号は、第1の符号化方式に従って設定されている。図2に示す例では、第1量子化テーブル14のインデックス番号は2ビットで表現されている。
【0033】
第2量子化テーブル15は、第1量子化テーブル14と同様に、1以上のテーブル値を持ち、インデックス番号(量子化インデックス)がテーブル値毎に割り当てられている。各テーブル値は音声符号の逆量子化値(復号値)を示し、インデックス番号は対応するテーブル値を符号化して得られる音声符号を構成する。第2量子化テーブル14のインデックス番号は、第2の符号化方式に従って設定されている。図2に示す例では、第1量子化テーブル14のインデックス番号は3ビットで表現されている。
【0034】
音声符号変換部11には、第1の符号化方式に従って符号化された音声符号Code1(図2ではCode1=“10”)が入力される。音声符号Code1は、第1量子化テーブル14のインデックス番号を表す。また、音声符号Code1を構成するデータ系列の下位nビットは、音声符号Code1に埋め込まれた任意のデータ系列を表す。一方、音声符号変換部11は、音声符号Code2を出力する。音声符号Code2は、音声符号Code1が第2の符号化方式に従って変換された音声符号である。音声符号Code2は、第2量子化テーブル15のインデックス番号を表す。また、音声符号Code2を構成するデータ系列の下位nビットは、音声符号Code2に埋め込まれた埋め込みデータ系列を表している。
【0035】
図2を用いて音声符号変換器10の動作を説明する。音声符号Code1(“10”)は、音声符号変換部11及び埋め込みデータ抽出部12にそれぞれ入力される。埋め込みデータ抽出部12は、音声符号Code1に埋め込まれている埋め込みデータSCode(図2ではSCode=“10”)を抽出し、変換符号限定部13に入力する。
【0036】
変換符号限定部13は、符号限定情報を音声符号変換部11に入力する。符号限定情報は、音声符号Code1の変換候補を、第2量子化テーブル15に格納された全てのインデックス番号から、埋め込みデータSCodeを所定位置で含むインデックス番号に限定するための情報である。
【0037】
図2に示す例では、符号限定情報は、変換候補のインデックス番号を、下位nビットの値が埋め込みデータScodeの値(“10”)と等しい値を持つ1以上のインデックス番号に限定することを示す情報を含む。従って、第2量子化テーブル15における変換候補のインデックス番号は、下位nビットの値が埋め込みデータScodeと同じ値(“10”)を持つインデックス番号、すなわちインデックス番号“010”と、インデックス番号“110”とに限定される。
【0038】
音声符号変換部11は、以下の手順で第1の符号化方式の音声符号を第2の符号化方式の音声符号に変換する。即ち、音声符号化変換部11は、音声符号Code1が入力されると、第1量子化テーブル14から、その音声符号と同じ値のインデックス番号に対応するテーブル値を読み出す。次に、音声符号化変換部11は、第2量子化テーブル14を参照し、第1量子化テーブル14から読み出されたテーブル値と最も誤差が小さいテーブル値を決定(選択)し、決定したテーブル値のインデックス番号を音声符号Code2として出力する。このとき、音声符号変換部11が選択可能なテーブル値は、変換符号限定部13によって限定されたインデックス番号に対応するテーブル値に限られている。従って、音声符号変換部11は、限定されたテーブル値の中から、誤差が最も小さいテーブル値を選択し、選択したテーブル値のインデックス番号を音声符号Code2として外部に出力する。図2に示す例では、音声符号変換部11は、音声符号Code1(“10”)に対応する第1量子化テーブル14のテーブル値(“1.5”)と最も誤差が小さいテーブル値として、第2量子化テーブル15のテーブル値“1.3”を選択し、テーブル値“1.3”のインデックス番号“110”を音声符号Code2として出力する。音声符号Code2は、埋め込みデータ系列“10”を下位nビットに含んでいる。
【0039】
このように、第1の発明では、第1の符号化方式の音声符号Code1が、この音声符号Code1に含まれた埋め込みデータScodeを所定位置で含む第2の符号化方式の音声符号Code2に変換される。これによって、音声符号Code1から変換された音声符号Code2において、音声符号Code1に埋め込まれた埋め込みデータ系列Scodeが維持される。
【0040】
言い換えると、変換符号限定部13は、音声符号変換部11による符号変換処理において使用される符号変換の候補を、埋め込みデータに応じて限定する。具体的には、変換符号限定部13は、変換候補を第2量子化テーブル15に格納された複数のインデックス番号のうち、インデックス番号の下位nビットのデータ系列が埋め込みデータSCodeと同じ値を持つインデックス番号のみに限定する。このため、何れのインデックス番号が選択されても、選択結果に相当するインデックス番号、すなわち変換先の音声符号(変換結果に相当する音声符号)は、所定位置に埋め込みデータScodeを含む。従って、第1の符号化方式の音声符号を、これに埋め込まれた埋め込みデータを損なうことなく、第2の符号化方式の音声符号に変換することができる。
【0041】
さらに、音声符号変換部11は、音声符号Code1に対応する第1量子化テーブル14のテーブル値との間の誤差が最小になるテーブル値のインデックス番号を変換候補に相当する1以上のインデックス番号の中から決定し、決定したインデックスス番号(図2では“110”)を第2の符号化方式の符号化データ(音声符号Code2)として出力する。従って、第2の符号化方式の音声符号が埋め込みデータ系列を維持することによる音質の劣化を最小限に抑えることができる。
【0042】
以上によって、第1の符号化方式によって符号化された音声符号に任意のデータが埋め込まれている場合でも、埋め込みデータを損なわず、かつ音声品質の劣化を抑えて、第1の符号化方式の音声符号を第2の符号化方式の音声符号に変換することができる。
【0043】
なお、図2を用いた説明では、説明を簡略化するため、埋め込みデータ系列が音声符号の下位nビットに含まれていることを仮定した。しかしながら、本発明において、埋め込みデータ系列が音声符号に埋め込まれる位置,及び埋め込みデータを構成するビットの数は任意に設定することができる。
【0044】
〈第1実施形態の具体例〉
次に、上記した第1実施形態(第1の発明)の具体例を説明する。図3は、第1実施形態の具体例に相当する音声符号変換器(音声符号変換装置)20の構成図である。図3において、音声符号変換器20は、第1の符号化方式に相当するG.729Aの音声符号を、第2の符号化方式に相当するAMR(12.2kbpsモード)の音声符号に変換する。また、音声符号変換器20は、任意のデータが埋め込まれているG.729Aの音声符号を、埋め込みデータを損なうことなくAMRの音声符号に変換する。埋め込みデータは、変換元のG.729Aの音声符号の代数符号(SCB符号)に埋め込まれているものとする。埋め込みデータは、変換先のAMRの音声符号の代数符号に埋め込まれる。
【0045】
なお、G.729Aの標本化周波数は8kHzであり、フレーム長は10msecであり、サブフレーム長は5msecであり、サブフレーム数は2であり、原理遅延は15msecであり、線形予測次数は10次である。一方、AMRの標本化周波数は8kHzであり、フレーム長は20msecであり、サブフレーム長は5msecであり、サブフレーム数は4であり、原理遅延は25msecであり、線形予測次数は10次である。
【0046】
音声符号変換器20は、音声符号分離部21と、LSP符号変換部22と、ピッチラグ符号変換部23と、ピッチゲイン符号変換部24と、代数ゲイン符号変換部25と、代数符号変換部26と、埋め込みデータ抽出部28と、変換符号限定部29とを備えている。
【0047】
G.729Aの符号器出力である第m(mは整数)フレームの回線データbst1(m)が、第1の符号化方式の音声符号bst1(m)として、端子1を介して符号分離部21に入力される。符号分離部は、回線データbst1(m)を、G.729Aの要素符号(LSP符号、ピッチラグ符号、ピッチゲイン符号、代数符号、及び代数ゲイン符号)に分離し、各符号変換部22〜26(LSP符号変換部22、ピッチラグ符号変換部23、ピッチゲイン符号変換部24、代数ゲイン符号変換部25、及び代数変換部26)に入力する。このとき、音声符号分離部21から出力された代数符号は、埋め込みデータ抽出部28にも入力される。
【0048】
ここに、LSP符号は、フレーム毎の線形予測分析により得られる線形予測係数(LPC係数)又はこのLPC係数から求まるLSP(線スペクトル対)パラメータを量子化することにより得られる。ピッチラグ符号は、周期性音源信号を出力するための適応符号帳の出力信号を特定するための符号である。代数符号(雑音符号)は、雑音性音源信号を出力するための代数符号帳(雑音符号帳)の出力信号を特定するための符号である。ピッチゲイン符号は、適応符号帳の出力信号の振幅を表すピッチゲイン(適応符号帳ゲイン)を量子化して得られる符号である。代数ゲイン符号は、代数符号帳の出力信号の振幅を表す代数ゲイン(雑音ゲイン)を量子化して得られる符号である。音声信号を符号化して得られる音声符号は、これらの要素符号からなる。
【0049】
埋め込みデータ抽出部28は、代数符号に含まれる埋め込みデータSCodeを抽出し、変換符号限定部29に出力する。変換符号限定部29は、埋め込みデータSCodeに応じて変換対象(変換候補)であるAMRの代数符号を限定する。
【0050】
各符号変換部22〜26は、音声符号分離部21から入力されるG.729Aの対応する要素符号をAMRに従った要素符号に変換し音声符号多重部27に入力する。音声符号多重部27は、各符号変換部22〜26から入力されるAMRの要素符号を多重化し、AMRの第n(nは整数)フレームの回線データbst2(n),すなわち第2の符号化方式の音声符号として端子2から出力する。
【0051】
LSP符号変換部22は、音声符号分離部21から入力されるG.729A方式のLSP符号(LSP符号1)を逆量子化するLSP逆量子化器と、LSP逆量子化器によって得られる逆量子化値をAMR方式に従って量子化するLSP量子化器とを持つ。LSP量子化器によって得られるAMR方式のLSP符号(LSP符号2)は、音声符号多重部27へ向けて出力される。
【0052】
ピッチラグ符号変換部23は、音声符号分離部21から入力されるG.729A方式のピッチラグ符号(ピッチラグ符号1)を逆量子化するピッチラグ逆量子化器と、ピッチラグ逆量子化器によって得られる逆量子化値をAMR方式に従って量子化するピッチラグ量子化器とを持つ。ピッチラグ量子化器によって得られるAMR方式のピッチラグ符号(ピッチラグ符号2)は、音声符号多重部27へ向けて出力される。
【0053】
ピッチゲイン符号変換部24は、音声符号分離部21から入力されるG.729A方式のピッチゲイン符号(ピッチゲイン符号1)を逆量子化するピッチゲイン逆量子化器と、ピッチゲイン逆量子化器によって得られる逆量子化値をAMR方式に従って量子化するピッチゲイン量子化器とを持つ。ピッチゲイン量子化器によって得られるAMR方式のピッチゲイン符号(ピッチゲイン符号2)は、音声符号多重部27へ向けて出力される。
【0054】
代数ゲイン符号変換部25は、音声符号分離部21から入力されるG.729A方式の代数ゲイン符号(代数ゲイン符号1)を逆量子化する代数ゲイン逆量子化器と、代数ゲイン逆量子化器によって得られる逆量子化値をAMR方式に従って量子化する代数ゲイン量子化器とを持つ。代数ゲイン量子化器によって得られるAMR方式の代数ゲイン符号(代数ゲイン符号2)は、音声符号多重部27へ向けて出力される。なお、実際には、AMR方式では、ピッチゲイン符号の逆量子化値と代数ゲイン符号の逆量子化値とはまとめてゲイン符号として量子化される。
【0055】
図4は、G.729Aの代数符号帳30の構造を示す図であり、図5は、G.729Aに従って生成される代数符号の構成を示す図である。代数符号帳30は、上記した第1の量子化テーブル14に相当する。
【0056】
G.729Aでは、1つのサブフレームに対して40個のサンプル点が規定され、各サンプル点はパルスの位置で示される。代数符号帳30は、1つのサブフレームを構成するサンプル点(N=40)を4つのパルス系統グループi0,i1,i2,i3に分割し、各パルス系統グループから1つのサンプル点を取り出し、取り出された各サンプル点が正又は負の振幅をそれぞれ持つパルス性信号(テーブル値に相当する)を出力する。
【0057】
各パルス系統グループi0,i1,i2,i3に対するサンプル点の割り当ては、図4に示す通りである。即ち、(1)パルス系統グループi0には、8個のサンプル点0,10,15,20,25,30,35が割り当てられ、(2)パルス系統グループi1には、8個のサンプル点1,6,11,16,21,26,31,36が割り当てられ、(3)パルス系統グループi2には、8個のサンプル点2,7,12,17,22,27,32,37が割り当てられ、(4)パルス系統グループi3には、16個のサンプル点3,4,8,9,13,14,18,19,23,24が割り当てられている。
【0058】
代数符号帳30は、図4に示すように、各パルス系統グループi0,i1,i2,i3から取り出されるパルスの位置(m0,m1,m2,m3)と、その振幅(s0,s1,s2,s3:符号±1)で表現される。代数符号帳30は、4つのパルス系統グループからそれぞれ取り出される4つのパルス及び各パルスの振幅の全ての組み合わせがそれぞれ符号化された複数の代数符号(量子化インデックス)を格納しており、代数符号に応じたパルス性信号を出力することができる。
【0059】
G.729Aでは、パルス位置m0,m1,m2が3ビット、パルス位置m3が4ビット、各パルス位置m0,m1,m2,m3におけるパルスの振幅が1ビットで表現される。従って、G.729Aで生成される代数符号は、図5に示すように、4つのパルス位置情報と4つの振幅情報とからなる17ビットで構成される。従って、代数符号帳30は、217通りの代数符号(量子化インデックス)を持つ。
【0060】
埋め込みデータ抽出部28は、音声符号分離部21から入力されるG.729Aの代数符号(代数符号1)から埋め込みデータを抽出する。埋め込みデータ抽出部28は、音声符号bst1(m)の送信側(G.729A側)で行われたデータの埋め込み方法(埋め込みデータ系列のビット数,埋め込み位置等)を予め知っており、この埋め込み方法に従って埋め込みデータを抽出する。ここでは、埋め込みデータは、G.729Aの代数符号(図5)のパルス系統グループi0,i1,i2に対応する各情報フィールドに埋め込まれているものと仮定する。埋め込みデータ抽出部28は、代数符号のパルス系統グループi0,i1,i2に係る情報(m0,m1,m2,s0,s1,及びs2)を切り出し、12ビットの埋め込みデータScodeとして抽出する。
【0061】
なお、埋め込みデータのビット数や埋め込み位置は任意に設定可能である。但し、代数符号の構成に従い、パルス位置情報単位,振幅情報単位,またはパルス系統グループ単位でデータを埋め込む方法が適用されれば、データの埋め込み又は切り出しの処理が容易になる。埋め込みデータは、パルス系統グループ単位で埋め込まれるのが好ましい。特に、i0〜i2のうちの少なくとも1つを含む組み合わせに対して埋め込みデータを埋め込むことが好ましい。また、埋め込みデータScodeは、音声符号bst1(m)が生成されてから音声符号変換器20に入力されるまでの時点において、どの時点で埋め込まれても良い。
【0062】
次に、変換符号限定部29について説明する。図6(A)は、変換先であるAMR(12.2kbpsモード)の代数符号帳31の構造を示す図であり、図6(B)は、AMR(12.2kbpsモード)の代数符号の構成を示す図である。代数符号帳31は、第2量子化テーブル15に相当する。
【0063】
AMR(12.2kbpsモード)は、G.729Aと同様に、1つのサブフレーム(5msec)に対して40個のサンプル点を持ち、各サンプル点は、パルス系統グループi0〜i9に対して図6(A)に示すように割り当てられている。
【0064】
代数符号帳31は、10本のパルス系統グループ(i0〜i9)のそれぞれから1つずつ取り出されるパルス、及びこれらのパルスの振幅(正又は負)の組み合わせから構成されるパルス性信号を、全ての組み合わせについて出力することができる。図6(A)に示すように、代数符号帳31は、10個のパルス系統グループi0〜i9からそれぞれ取り出されるパルスの位置(m0〜m9)と、これらのパルスの振幅(s0〜s9;1(正)又は−1(負))で表現される。パルスの位置は3ビットで表現され、パルスの振幅は1ビットで表現される。従って、AMR(12.2kbpsモード)の代数符号は、図6(B)に示すように、パルスの位置情報m0〜m9と、各パルスの振幅を示す振幅情報s0〜s9とからなる40ビットで構成される。また、代数符号帳31は、パルスの位置及び振幅の全ての組み合わせに相当する240通りのパルス性信号(テーブル値に相当する)の量子化インデックス,すなわち代数符号を格納しており、代数符号が復号されたパルス性信号を出力する。代数符号帳31に格納された複数の代数符号は、G.729Aの代数符号の変換候補となることができる。
【0065】
ここで、代数符号帳31と代数符号帳30と比較すると、G.729Aのパルス系統グループi0〜i2に係る構成は、AMR(12.2kbps)のパルス系統グループi0〜i2に係る構成と等しい。従って、埋め込みデータScodeは、上記したように、G.729Aの代数符号のパルス系統グループi0〜i2に係る部分(情報フィールド)に埋め込むのが好ましい。なぜなら、当該パルス系統グループの値を、代数符号の変換元と変換先とで等しくすることができるからである。これによって、変換先の音声符号による音声の品質を、変換元の音声符号の品質に近づけることができる。
【0066】
変換符号限定部29は、埋め込みデータScodeが入力されると、この埋め込みデータScodeと、予め認識している代数符号2に対する埋め込みデータScodeの埋め込み位置に係る情報とで、代数符号帳31の代数符号(量子化インデックス)を限定するための符号限定情報を代数符号変換部26に入力する。
【0067】
この例における符号限定情報は、代数符号帳31に格納された複数の代数符号をi0,i1,i2の値が埋め込みデータScodeと同じ値を持つ代数符号に限定することを示す情報を含む。符号限定情報によって限定された代数符号は必ず埋め込みデータを含む。この限定された代数符号は、代数符号変換部26における代数符号帳探索において、代数符号1の変換候補として使用される。
【0068】
また、代数符号がi0,i1,i2の値が埋め込みデータScodeと同じ値を持つ代数符号に限定されることにより、変換先の代数符号は、i0,i1,i2の値が固定された状態になる。代数符号2のi0,i1,i2の値が固定されると、代数符号帳31から選択可能な変換先の代数符号(量子化インデックス)が240通りから228通りに減少する。
【0069】
図3に戻って、代数符号変換部26について説明する。代数符号変換部26は、G.729Aの代数符号(代数符号1)を逆量子化する代数符号逆量子器33と、代数符号逆量子化器33によって得られる逆量子化値(代数符号帳31の代数符号帳出力)を量子化する代数符号量子化器34とを含んでいる。
【0070】
代数符号逆量子化器33は、G.729Aの代数符号の復号方法とほぼ同様の方法で、代数符号を逆量子化(復号)する。即ち、代数符号逆量子化器33は、上述した代数符号帳30を有し、自身に入力される代数符号1に対応するパルス性信号(代数符号帳30の代数符号帳出力)を、代数符号量子化器34に入力する。
【0071】
代数符号量子化器34は、代数符号逆量子化器33からのパルス性信号(代数符号帳30の代数符号帳出力)をAMRに従って符号化(量子化)する。即ち、代数符号量子化器34は、上述した代数符号帳31を有し、代数符号1の変換先に相当する代数符号2を、代数符号帳31に格納された複数の代数符号の中から決定する。このとき、変換先に相当する代数符号2は、変換符号限定部29によって限定された埋め込みデータScodeを含む代数符号の中から決定される。
【0072】
言い換えれば、代数符号量子化器34は、変換符号限定部29によって量子化インデックスが限定されたAMRの代数符号帳31の中から、符号変換による音声品質の劣化が最小限に抑えられる最適な10本のパルスの組み合わせ(代数符号帳出力)を選択する。このとき、代数符号量子化器34は、変換符号限定部28により限定されたパルス系統グループi0,i1,i2の値を固定した条件で、残りのi3〜i9に対するパルス位置と振幅を決定する。
【0073】
以下、残りのパルス系統グループの決定方法を説明する。代数符号量子化器34は、変換符号限定部29で限定されたAMRの代数符号帳の中からG.729Aの再生信号との間で再生領域の誤差電力が最小となるパルスの組み合わせを決定する。
【0074】
最初に、代数符号量子化器34は、まず、各符号変換部22〜26で対応する要素符号が逆量子化されることによって生成されるG.729Aの要素パラメータ(LSP、ピッチラグ、ピッチゲイン、代数符号帳出力、代数ゲイン)から、再生信号Xを求める。
【0075】
次に、代数符号量子化器34は、再生信号Xから、ピッチラグ符号変換部23で生成されるAMRの適応符号帳出力PLと、ピッチゲイン符号変換部24で生成されるAMRのピッチゲインβoptと、及びLSP符号変換部22で生成されるAMRのLSP係数から求めたLPC係数とを求める。
【0076】
次に、代数符号量子化器34は、適応符号帳出力PLと、ピッチゲインβoptと、LPC係数とで構成されるLPC合成フィルタのインパルス応答Aから、下記の式(1)で表される、代数符号帳31の代数符号帳探索のためのターゲットベクトル(ターゲット信号)X′を生成する。
【0077】
【数1】
次に、代数符号量子化器34は、代数符号帳探索として、式(2)中の評価関数誤差電力Dが最小になる代数符号帳出力Cを出力する符号ベクトルを求める。
【0078】
【数2】
式(2)において、γは代数ゲイン符号変換部26で生成されるAMRの代数ゲインである。式(2)の誤差電力Dを最小化する代数符号帳出力Cを出力する符号ベクトルを探索することは、下記の式(3)における誤差電力D′を最大化する代数符号帳出力Cを探索することと等価である。
【0079】
【数3】
ここで、Φ=ATA,d=X′TAとおくと、式(3)は下記の式(4)で表すことができる。
【0080】
【数4】
ここで、LPC合成フィルタのインパルス応答A=[a(0),…,a(N−1)]とし、ターゲットベクトルX′=[x′(0),…, x′(N−1)]とすると、式(4)中のdは式(5)で、また、Φの要素Φ(i,j)は式(6)で表すことができる。式(5)及び(6)中のNはサブフレーム長(5msec)である。なお、d(n), 及びΦ(i,j)は、代数符号帳探索の前に計算される。
【0081】
【数5】
【0082】
【数6】
ここで、代数符号帳出力Cを出力する符号ベクトルに含まれるパルス本数をNPとすると、ターゲットベクトルX′と代数符号帳出力Cとの相互相関Qは、下記の式(7)で表すことができる。
【0083】
【数7】
式(7)において、s(i)は代数符号帳出力Cのi本目のパルスの振幅であり、m(i)はそのパルス位置である。また、代数符号出力Cの自己相関Eは、式(8)で表すことができる。
【0084】
【数8】
従って、埋め込みデータが埋め込まれるパルス系統グループにおける値を埋め込みデータScodeと同じ値で固定した状態(すなわち、本実施例においてはi0〜i2の値を埋め込みデータで固定した状態、つまり式(7),(8)のm(0),...,m(2),s(0),...,s(2)を埋め込みデータで固定した状態)で、残りのパルスの位置m3〜m9と振幅s3〜s9を変えながらQ及びEを計算し、式(4)のD′が最大になるパルス位置及び振幅を決定する。
【0085】
このようにして、代数符号量子化器34は、再生信号Xとの間の誤差電力Dが最小になるターゲットベクトルX′を得ることができるAMRの代数符号帳出力Cを限定された変換候補の中から求め、求めた代数符号帳出力Cの量子化インデックスを、変換先の代数符号(代数符号2)として決定し、出力する。
【0086】
以上のように、代数符号変換部26は、G.729Aの代数符号に含まれる埋め込みデータに応じて、変換対象のAMRの代数符号を限定して、その中から最適な代数符号を決定する。
【0087】
〈作用〉
上述した第1実施形態の具体例(音声符号変換器20)の作用を説明する。
【0088】
音声符号変換器20では、埋め込みデータ抽出部28が代数符号1のi0〜i2に対応する情報フィールドに埋め込まれた埋め込みデータScodeを抽出し、変換符号限定部29に与える。変換符号限定部29は、代数符号帳31に格納された複数の代数符号を、i0〜i2の値が埋め込みデータScodeと同じ値を持つ代数符号に限定する。これによって、代数符号1の変換候補が限定される。従って、代数符号帳31から変換先の代数符号,即ち代数符号2として決定される代数符号は、埋め込みデータScodeがi0〜i2の情報フィールドに常に埋め込まれた状態となる。
【0089】
このように、音声符号変換器20によれば、代数符号1を、この代数符号1に含まれた埋め込みデータScodeが埋め込まれた代数符号2に変換することができる。このようにして、代数符号1に埋め込まれた埋め込みデータScodeを代数符号2において維持することができる。
【0090】
従って、音声符号bst2(m)の伝送先のノードは、予め判っている埋め込みデータの埋め込み位置に従ってAMRの代数符号のi0,i1,i2の情報を抽出することにより、G.729Aの代数符号に埋め込まれたデータを正常に受信することができる。
【0091】
また、変換候補が限定されることによって、代数符号帳探索に要する時間を短縮することが可能になる。
【0092】
また、音声符号変換器20では、代数符号変換部26が、限定された変換候補の中から、代数符号1の復号値との誤差が最も小さい復号値の量子化インデックスを、変換先の代数符号(代数符号2)として決定する。このように、限定された変換候補の中から最適な変換先の代数符号が選択されるので、音声符号の変換による音声の品質劣化を抑えることができる。
【0093】
これによって、G.729Aの代数符号に埋め込まれている埋め込みデータを代数符号変換によって損なうことなく、且つ音声品質の劣化を最小限に抑えてAMRの音声符号へ変換することが可能となる。
【0094】
さらに、埋め込みデータの埋め込み位置が、G.729AとAMRとで等しい構造を持つ部分(共通部分),即ちパルス系統グループi0〜i2の情報フィールドに規定され、代数符号1のi0〜i2の示す値がそのまま代数符号2の共通部分(i0〜i2)の内容を構成する。従って、変換先の代数符号2の内容を代数符号1の内容に近づけることができる。これによって、符号変換による音声品質の劣化を可能な限り抑えることができる。
【0095】
〔第2実施形態〕
次に、本発明の第2実施形態として、本発明の第2の発明に相当する実施形態について説明する。第2実施形態は、第1の符号化形式の音声符号に埋め込まれている埋め込みデータではなく、他の手法により得られた埋め込みデータ(例えば、データ回線を通じて受信したデータ)を、第1の符号化形式の音声符号の変換先に相当する第2の符号化形式の音声符号に埋め込む音声符号変換装置の実施形態である。第2実施形態は、第1実施形態と共通する部分を含むので、主に相違点について説明する。
【0096】
〈第2実施形態の概要〉
図7は、本発明の第2実施形態(音声符号変換器40)の原理を示す概要図であり、図8は、図7に示した音声符号変換器40をさらに詳細に示す図である。音声符号変換装置40は、以下の点を除き、第1実施形態の音声符号変換装置10と同じ構成を持つ。
(1)音声符号変換装置40に入力される第1の符号化方式の音声符号(音声符号Code1)から埋め込みデータを抽出する埋め込みデータ抽出部を持たない。
(2)変換符号限定部13には、音声符号Code1の変換先の音声符号(音声符号Code2)に埋め込まれる任意の埋め込みデータScodeが入力される。埋め込みデータScodeは、音声符号の回線とは別の回線を通じて変換符号限定部13に入力される。
【0097】
図8において、音声符号変換部11に入力される音声符号Code1(図8では“10”)は、第1量子化テーブル14のインデックス番号を表している。また、音声符号Code2は、第2量子化テーブル15のインデックス番号を表す。また、音声符号Code2を構成するデータ系列の下位mビットは、埋め込みデータ系列を表す。
【0098】
音声符号変換器40の動作は次の通りである。最初に、音声符号回線と別の回線(データ回線)から受信した埋め込みデータSCode(図8では“0”)を変換符号限定部13に入力する。
【0099】
変換符号限定部13は、変換対象(変換候補)を、第2量子化テーブル15の全てのテーブル(インデックス番号)にするのではなく、インデックス番号の下位mビットのデータ系列が埋め込みデータ系列SCodeと等しいテーブルのみに限定する。
【0100】
その後、音声符号変換部11は、音声符号変換部11に入力された音声符号Code1に対応する第1量子化テーブル14のテーブル値との誤差が最小になるテーブル値を、限定された第2量子化テーブル15の変換候補の中から選択(決定)し、選択されたテーブル値に対応するインデックス番号(図8では“110”)を、第2の符号化方式の音声符号(符号化データ)Code2として、出力する。
【0101】
第2の発明による音声符号変換器40によると、音声符号の変換に際し、埋め込みデータSCodeが入力されると、音声符号変換部11が、音声符号Code1を埋め込みデータScodeが埋め込まれた音声符号Code2に変換する。このように、音声符号変換器40によれば、第2の音声符号化方式の音声符号に任意のデータ系列を埋め込むことができる。
【0102】
さらに、音声符号変換器40によると、音声符号変換部11が、変換候補が限定された第2量子化テーブル15から、音声符号Code2に対応する第1量子化テーブル14のテーブル値との間の誤差が最小になるテーブル値(に対応するインデックス)を選択する。これによって、埋め込みデータ系列が音声符号に挿入されることを原因とする音声の品質の劣化を最小限に抑えることができる。
これにより、音声符号変換部において、第1の符号化方式の音声符号1を第2の音声符号2に変換すると共に、第2の符号化方式の音声符号2に任意のデータ系列を音質劣化を抑えて埋め込むことが可能になる。
【0103】
なお、図8の説明では、説明を簡略化するため、埋め込みデータ系列が下位mビットに含まれるものとしたが、埋め込みデータ系列が含まれる位置やビット数は任意である。また、変換符号限定部13に入力される埋め込みデータの取得経路も任意である。
【0104】
〈具体例〉
次に、上記した第2実施形態(第2の発明)の具体例を説明する。図9は、第2実施形態の具体例に相当する音声符号変換器(音声符号変換装置)50の構成図である。この具体例では、第1の符号化方式としてG.729Aが適用され、第2の符号化方式としてAMR(12.2kbpsモード)が適用されている。音声符号変換器50は、G.729Aの代数符号をAMRの代数符号に変換するときに、任意のデータをAMRの代数符号に埋め込む。すなわち、G.729Aの代数符号を任意のデータが埋め込まれたAMRの代数符号に変換する。
【0105】
図9において、音声符号変換器50は、第1実施形態における音声符号変換器20と次の点で異なる。
(1)埋め込みデータ抽出部がない。
(2)任意の埋め込みデータSCodeが変換符号限定部29に入力される。
【0106】
すなわち、第mフレームのG.729Aの符号器出力である回線データbst1(m)が端子1を通じて音声符号分離部21に入力される。音声符号分離部21は、回線データbst1(m)をG.729Aの要素符号(LSP符号、ピッチラグ符号、ピッチゲイン符号、代数符号、及び代数ゲイン符号)に分離し、各符号変換部22〜26(LSP符号変換部22、ピッチラグ符号変換部23、ピッチゲイン符号変換部24、代数符号変換部26、代数ゲイン変換部25)に入力する。また、任意の埋め込みデータSCodeが変換符号限定部29に入力される。埋め込みデータScodeは、例えば、他のデータ回線を通じて音声符号変換器50に入力される。
【0107】
変換符号限定部29は、埋め込みデータSCodeに応じて変換対象(変換候補)であるAMRの代数符号を限定する。各符号変換部では、入力されたG.729Aの各要素符号をAMRの各要素符号へと変換し符号多重部へと出力する。符号多重部では、変換されたAMRの要素符号を多重化して、AMRの第nフレームの回線データbst2(n)として出力する。
【0108】
ここで、各符号変換部22〜26の構成及び動作は、第1実施形態(音声符号変換器20)と同じである。また、変換符号限定部29については、入力がG.729Aの代数符号から抽出された埋め込みデータではなく、任意の埋め込みデータである点のみが第1実施形態と異なる。
【0109】
なお、変換符号限定部29に入力される任意の埋め込みデータのデータ量及び入力頻度は任意であり、固定量でも、適応的に制御(例えば、G.729Aのパラメータの性質などに応じて制御するなど)してもよい。ただし、埋め込みデータのデータ長は、AMRの代数符号帳のパルス情報(位置情報及び振幅情報)に対応するデータ長にすることが望ましい。例えば、パルスi0,i1に埋め込むのであれば、データ長を8ビット,すなわち(4+4)ビットに設定する。
【0110】
〈作用〉
第2実施形態の具体例によれば、G.729Aの代数符号データが埋め込まれていない場合に、変換符号限定部に直接埋め込みデータを入力して、変換対象のAMRの代数符号を限定し、その中から最適な代数符号を決定することにより、音声品質の劣化を最小限に抑えて、任意のデータをAMRの音声符号へ埋め込むことが可能となる。
【0111】
また、実際に音声符号にデータを埋め込む際、埋め込みに適したフレーム、すなわち任意のデータで符号を置換しても音声の品質に対する影響が小さいフレームが選定される。これによって、さらに音声の品質の劣化を抑えることが可能となる。この選定方法には、例えば、特願2002−26958で開示されているように、代数符号の寄与度を表すファクタとして代数ゲインを用い、代数ゲインが所定の閾値以下の場合にのみデータの埋め込みを行う方法、等がある。
【0112】
なお、本発明の実施形態1及び2では、図12及び図13に示す音声符号変換方式に適合する例を示したが、本発明は、タンデム接続方式の符号変換方式に適用することもできる。
【0113】
今後、第3世代携帯電話やVoIPの普及に伴い、従来の音声回線のみの携帯電話と音声回線とデータ回線を持つ第3世代携帯電話、あるいは第3世代携帯電話とVoIPなど、多様な通信システム間の通信において、データ埋め込み技術と音声符号変換技術を併用した技術の必要性は高い。その際、
(1)埋め込まれたデータを損なわない、あるいは新たに埋め込む。
(2)音声品質の劣化を抑える。
という2点を両立する音声符号変換を行う本発明の必要性は高い。
【0114】
また、本発明による音声符号変換装置によれば、任意のデータが埋め込まれていない第1の符号化方式の音声符号でも音声の品質の劣化を抑えることができる。
【0115】
〔第3実施形態〕
次に、本発明の第3実施形態について説明する。第3実施形態は、第2実施形態と同様の原理で任意の埋め込みデータを音声符号に埋め込む音声符号化器(音声符号化装置)について説明する。
【0116】
図10は、音声符号化器60の構成例を示す図である。音声符号化器60は、所定の音声符号化方式(G.729A,AMR等)に従って音声信号を音声符号に符号化する。この例では、音声符号化器60は、音声信号をAMR(12.2kbps)に従って符号化する。
【0117】
音声符号化器60には、音声信号と、埋め込みデータScodeとが入力される。音声符号化器60は、AMRの符号化器とほぼ同様の構成を持ち、入力された音声信号を、入力信号Xとして、この入力信号Xに対応するLSP符号,ピッチラグ符号,ゲイン符号(ピッチゲイン符号,代数ゲイン符号),代数符号を生成し、多重化し、音声符号として出力する。
【0118】
音声符号化器60は、第2実施形態と同様の構成を持つ変換符号限定部29を備えている。変換符号限定部29には、埋め込みデータScodeが入力される。変換符号限定部29は、第2実施形態と同様に、符号限定情報を生成し、出力する。符号限定情報によって、代数符号帳31の代数符号(変換候補(符号化候補))が、所定位置(例えば、パルス情報i0〜i3の位置)に埋め込みデータ系列Scodeと同じ値を持つ代数符号に限定される。
【0119】
その後、音声符号化器60は、代数符号帳探索を行い、入力信号Xの雑音成分を符号化した代数符号を求める。すなわち、入力信号Xとの間の誤差電力が最小となるターゲットベクトルX′が得られるときの代数符号帳出力の量子化インデックスを、変換先(符号化先)の代数符号として決定する。このとき、代数符号探索で変換候補として使用される代数符号は、埋め込みデータと同じ値を持つので、決定(選択)される代数符号は、必ず埋め込みデータを含んでいる。
【0120】
〈作用〉
第3実施形態によれば、音声信号を、埋め込みデータが埋め込まれた音声符号に符号化することができる。このとき、変換符号限定部13によって限定された代数符号の中から、入力信号Xの雑音成分として最適な代数符号が選択される。従って、音声信号の符号化に際して埋め込みデータを埋め込むことによる音声の品質の劣化を最小限に抑えることができる。
【0121】
更に、第1・第2実施形態と同様に、代数ゲインなどを用いて、音声品質への影響が小さいフレームを選定してデータの埋め込みを行うことにより、さらに音声の劣化を抑えることが可能となる。
【0122】
〔その他〕
上述した発明の実施の形態は、以下の発明を開示する。
【0123】
(付記1)第1の符号化方式により符号化された第1の音声符号を第2の符号化方式により符号化された第2の音声符号に変換する音声符号変換装置であって、
第1の音声符号を構成する要素符号に埋め込まれた埋め込みデータを抽出する抽出手段と、
前記第1の音声符号の要素符号の変換候補となる、第2の符号化方式に従った複数の要素符号を格納した符号帳と、
前記符号帳に格納された複数の要素符号を前記抽出手段によって抽出された埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、変換候補を限定する限定手段と、
前記限定手段によって限定された変換候補から変換先に相当する要素符号を決定する決定手段と、
を含む音声符号変換装置。(1)
(付記2)第1の符号化方式で符号化される要素符号の全部又は一部は、第2の符号化方式で符号化される要素符号と同一の構成を有し、この同一の構成部分に前記埋め込みデータが埋め込まれており、
前記限定手段は、変換候補を、第1の符号化方式で符号化される要素符号に対する埋め込みデータの埋め込み位置と同じ位置の値が埋め込みデータの値と等しい要素符号に限定する、
付記1記載の音声符号変換装置。(2)
(付記3)前記決定手段は、第1の音声符号を構成する要素符号の逆量子化値との誤差が最小となる逆量子化値が第2の符号化方式に従って符号化された要素符号を、変換先に相当する要素符号に決定する、
付記1記載の音声符号変換装置。
【0124】
(付記4)前記決定手段は、第1の音声符号を復号して得られる再生信号との間の誤差電力が最小となる音声信号を得ることができる要素符号を、変換先に相当する要素符号に決定する、
付記1記載の音声符号変換装置。
【0125】
(付記5)第1の符号化方式により符号化された第1の音声符号を第2の符号化方式により符号化された第2の音声符号に変換する音声符号変換装置であって、
第1の音声符号を構成する要素符号の変換候補となる、第2の符号化方式に従った複数の要素符号を格納した符号帳と、
前記符号帳に格納された複数の要素符号を第2の音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、変換候補を限定する限定手段と、
前記限定手段によって限定された変換候補から変換先に相当する要素符号を決定する決定手段と、
を含む音声符号変換装置。(3)
(付記6)第1の音声符号を構成する要素符号に埋め込まれた埋め込みデータを抽出し、前記限定手段に与える埋め込みデータ抽出手段をさらに含む、
付記5記載の音声符号変換装置。
【0126】
(付記7)前記決定手段は、第1の音声符号を構成する要素符号の逆量子化値との誤差が最小となる逆量子化値が第2の符号化方式に従って符号化された要素符号を、変換先に相当する要素符号に決定する、
付記5記載の音声符号変換装置。(4)
(付記8)前記決定手段は、第1の音声符号を復号して得られる再生信号との間の誤差電力が最小となる音声信号を得ることができる要素符号を、変換先に相当する要素符号として決定する、
付記5記載の音声符号変換装置。
【0127】
(付記9)音声信号を音声符号に符号化する音声符号化装置であって、
音声信号の特定成分が符号化された複数の要素符号を格納した符号帳と、
前記符号帳に格納された複数の要素符号を音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、特定成分の符号化候補を限定する限定手段と、
前記限定手段によって限定された符号化候補から、特定成分の符号化先に相当する要素符号を決定する決定手段と、
を含む音声符号化装置。(5)
(付記10)前記決定手段は、符号化対象の音声信号との間の誤差電力が最小となる音声信号を得ることができる要素符号を、特定成分の符号化先に相当する要素符号として決定する、
付記9記載の音声符号化装置。
【0128】
(付記11)第1の符号化方式により符号化された第1の音声符号を第2の符号化方式により符号化された第2の音声符号に変換する音声符号変換方法において、
第1の音声符号を構成する要素符号に埋め込まれた埋め込みデータを抽出するステップと、
符号帳に格納された第1の音声符号の要素符号の変換候補となる第2の符号化方式に従って符号化された複数の要素符号を、抽出された埋め込みデータの値と同じ値を所定位置で持つ要素符号に限定することにより、第1の音声符号の要素符号の変換候補を限定するステップと、
限定された変換候補の中から、変換先に相当する要素符号を決定するステップと、
を含む音声符号変換方法。
【0129】
(付記12)第1の符号化方式で符号化される要素符号の全部又は一部は、第2の符号化方式で符号化される要素符号と同一の構成を有し、この同一の構成部分に前記埋め込みデータが埋め込まれており、
前記変換候補を限定するステップは、変換候補を、第1の符号化方式で符号化される要素符号に対する埋め込みデータの埋め込み位置と同じ位置の値が埋め込みデータの値と等しい要素符号に限定する、
付記11記載の音声符号変換方法。
【0130】
(付記13)前記変換先に相当する要素符号を決定するステップは、第1の音声符号を構成する要素符号の逆量子化値との誤差が最小となる逆量子化値が第2の符号化方式に従って符号化された要素符号を、変換先に相当する要素符号に決定する、
付記10記載の音声符号変換方法。
【0131】
(付記14)前記変換先に相当する要素符号を決定するステップは、第1の音声符号を復号して得られる再生信号との間の誤差電力が最小となる音声信号を得ることができる要素符号を、変換先に相当する要素符号に決定する、
付記10記載の音声符号変換方法。
【0132】
(付記15)第1の符号化方式により符号化された第1の音声符号を第2の符号化方式により符号化された第2の音声符号に変換する音声符号変換方法であって、
符号帳に格納された第1の音声符号を構成する要素符号の変換候補となる第2の符号化方式に従って符号化された複数の要素符号を第2の音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、変換候補を限定するステップと、
前記限定手段によって限定された変換候補から変換先に相当する要素符号を決定する決定ステップと、
を含む音声符号変換方法。
【0133】
(付記16)第1の音声符号を構成する要素符号に埋め込まれた埋め込みデータを抽出するステップをさらに含み、
前記変換候補を限定するステップは、抽出された埋め込みデータに従って変換候補を限定する、
付記15記載の音声符号変換方法。
【0134】
(付記17)前記変換先に相当する要素符号を決定するステップは、第1の音声符号を構成する要素符号の逆量子化値との誤差が最小となる逆量子化値が第2の符号化方式に従って符号化された要素符号を、変換先に相当する要素符号に決定する、
付記15記載の音声符号変換方法。
【0135】
(付記18)前記変換先に相当する要素符号を決定するステップは、第1の音声符号を復号して得られる再生信号との間の誤差電力が最小となる音声信号を得ることができる要素符号を、変換先に相当する要素符号として決定する、
付記15記載の音声符号変換方法。
【0136】
(付記19)音声信号を音声符号に符号化する音声符号化方法であって、
符号帳に格納された、音声信号の特定成分が符号化された複数の要素符号を音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、特定成分の符号化候補を限定するステップと、
限定された符号化候補から、特定成分の符号化先に相当する要素符号を決定するステップと、
を含む音声符号化方法。
【0137】
(付記20)前記特定成分の符号化先に相当する要素符号を決定するステップは、符号化対象の音声信号との間の誤差電力が最小となる音声信号を得ることができる要素符号を、特定成分の符号化先に相当する要素符号として決定する、
付記19記載の音声符号化方法。
【0138】
【発明の効果】
本発明による音声符号変換装置によれば、第1の符号化方式の音声符号を第2の符号化方式の音声符号に変換するときに、第1の符号化方式の音声符号を、任意のデータが埋め込まれた状態の第2の符号化方式の音声符号に変換することができる。
【0139】
また、本発明による音声符号変換装置によれば、第1の符号化方式の音声符号を第2の符号化方式の音声符号に変換するときに、音質の劣化を抑えつつ、任意のデータを第2の符号化方式の音声符号に埋め込むことができる。
【0140】
また、本発明による音声符号化装置によれば、音声信号を音声符号に符号化するときに、音声信号を任意のデータが埋め込まれた音声符号に符号化することができる。
【図面の簡単な説明】
【図1】図1は、第1の発明の原理図である。
【図2】図2は、第1の発明の音声符号変換部の概念図である。
【図3】図3は、第1の発明の音声符号変換器の構成図である。
【図4】図4は、ITU−T G.729Aの代数符号帳の構造を示す図である。
【図5】図5は、ITU−T G.729Aの代数符号の構成図である。
【図6】図6(A)は、AMR(12.2kbpsモード)の代数符号帳の構造を示す図であり、図6(B)は、AMR(12.2kbpsモード)の代数符号の構成図である。
【図7】図7は、第2の発明の原理図である。
【図8】図8は、第2の発明の音声符号変換部の概念図である。
【図9】図9は、第2の発明の音声符号変換器の構成図である。
【図10】図10は、音声符号化装置の実施形態の説明図である。
【図11】図11は、データ埋め込み技術が適用される音声通信システムの概念図である。
【図12】図12は、音声符号変換装置の概念図である。
【図13】図13は、音声符号変換装置の構成図である。
【図14】図14は、音声符号変換部の概念図である。
【図15】図15は、従来技術1(変換元の埋め込みデータを損なわない音声符号変換器)の原理図である。
【図16】図16は、従来技術1(変換元の埋め込みデータを損なわない音声符号変換部)の概念図である。
【図17】図17は、従来技術2(符号変換時に任意のデータを埋め込む音声符号変換器)の原理図である。
【図18】図18は、従来技術2(符号変換時に任意のデータを埋め込む音声符号変換部)の概念図である。
【符号の説明】
10,20,40,50 音声符号変換器(音声符号変換装置)
11 音声符号変換部(決定手段)
12,28 埋め込みデータ抽出部(抽出手段)
13,29 変換符号限定部(限定手段)
14 第1量子化テーブル
15 第2量子化テーブル
26 代数符号変換部(決定手段,限定手段)
30 代数符号帳
31 代数符号帳(符号帳)
60 音声符号化装置
【発明が属する技術分野】
本発明は、インターネット等のネットワーク,携帯電話・自動車電話システム等で使用される音声符号化装置,及び音声符号化装置によって符号化された音声符号を別の音声符号に変換する際、任意のデータを埋め込む音声符号変換装置に関する。
【0002】
【従来の技術】
近年、コンピュータやインターネットが普及する中で、マルチメディアコンテンツ(静止画、動画、オーディオ、音声など)に任意のデータを埋め込む「電子透かし技術」が注目を集めている。電子透かし技術とは、人間の知覚の特性を利用し、画像、動画、音声などのマルチメディアコンテンツ自体に、品質に影響を与えることなく別の任意の情報を埋め込む技術である。「電子透かし技術」は、コンテンツに作成者や販売者などの名前を埋め込んで、不正コピーやデータ改ざんなどを防止するといった著作権保護を目的として使用されることが多い。また、「電子透かし技術」は、コンテンツに関する関連情報や付属情報を埋め込んで、利用者がコンテンツを利用する時の利便性を高める場合にも用いられている。
【0003】
音声通信の分野でも、音声に対してこのような任意の情報を埋め込んで伝送する試みが行われている。図11は、データ埋め込み技術を適用した音声通信システムの概念を示す図である。音声通信システムでは、通信回線の有効利用の観点から、音声が符号化される。符号器で音声を符号化する際に任意のデータ系列が音声符号に埋め込まれ、復号器へ伝送される。復号器は音声符号から埋め込まれたデータを抽出すると共に、通常の復号処理により音声を再生する。この技術では、音声符号自体にデータが埋め込まれるため、データの伝送量は増加することがない。また、再生音声の品質に影響がない状態でデータの埋め込みが行われる。このため、再生される音声の品質について、埋め込みを行う場合と行わない場合とでほとんど差が生じない。このようなデータ埋め込み技術により、伝送量の増加や品質に対する影響がなく、音声とは異なる任意のデータを伝送することができる。また、データの埋め込みが行われていることを知らない第三者は、通常の音声通信として認識し、埋め込まれたデータを認識することはない。
【0004】
データの埋め込み方法には様々な方法がある。近年では、インターネットを利用した音声通信としてのVoIP(Voice over IP)や、携帯電話システムで広く利用されているCELP(Code−Excited Linear Prediction;符号駆動線形予測符号化)と呼ばれる基本アルゴリズムをベースとした音声符号化方式(例えば、AMR(Adaptive Multi−Rate;適応マルチレート)、G.729A)について、符号化された音声符号に任意の情報を埋め込む方法がいくつか提案されている。
【0005】
例えば、CELP方式における固定符号帳の符号「代数符号」や適応符号帳の符号「ピッチラグ符号」に任意のデータを埋め込む技術が提案されている。この技術では、ある閾値に従って、代数符号やピッチラグ符号に任意のデータ系列が埋め込まれる。ここで、CELP方式の原理を簡単に説明する。CELPの特徴は、人間の声道特性を表す線形予測係数(LPC係数)、音声のピッチ成分と雑音成分とからなる音源信号を表すパラメータを効率良く伝送することである。CELPは、人間の声道をLPC合成フィルタH(z)で近似し、H(z)の入力(音源信号)が音声の周期性を表すピッチ周期成分と、ランダム性を表す雑音成分とに分離できると仮定する。CELPは、入力音声信号をそのまま復号器側へ伝送するのではなく、LPC合成フィルタのフィルタ係数、並びに励起信号のピッチ周期成分と雑音成分とを抽出し、これらを量子化して得られる量子化インデックスを伝送する。これによって、高い情報圧縮が実現されている。上記した「代数符号」は、雑音成分を量子化して得られる量子化インデックスに相当し、「ピッチラグ符号」は、ピッチ周期成分を量子化して得られる量子化インデックスに相当する。
【0006】
ところで、携帯電話の利用者の急増やVoIPの普及に伴い、今後異なる音声通信システム間の通信が増加することが予想される。現状では、音声通信システム毎に異なる音声符号化方式が用いられていることが多い。例えば、世界共通の音声符号化方式であるAMR方式は、W−CDMAに採用されている。一方、VoIPでは、ITU−T勧告G.729A方式が広く用いられている。このため、異なる音声通信システム間の音声通信では、一方の音声通信システムで使用されている音声符号化方式で符号化された音声符号を、他方の音声通信システムで使用されている音声符号化方式の音声符号に変換する必要がある。
【0007】
図12は、音声通信システム間で音声符号を変換する音声符号変換装置を含む音声符号変換システムの概念を示す図である。音声符号を変換する技術としては、次の方式が提案されている。
(1)各々の音声通信システムの音声符号化方式で復号・符号を繰り返すタンデム接続方式;
(2)音声符号を、音声符号を構成する各要素符号に分解し、各要素符号を個別に別の音声符号化方式の符号に変換する方式(特願2001−75427)。
【0008】
図13は、上記(2)の方式による音声符号変換方式を示す図である。図13に示すように、第1の符号化方式の音声符号は、音声符号分離部において、LSP(線スペクトル対)符号(LSP符号1),ピッチラグ符号(ピッチラグ符号1),ピッチゲイン符号(ピッチゲイン符号1),代数ゲイン符号(代数ゲイン符号1),及び代数符号(代数符号1)からなる複数の要素符号に分離され、夫々対応する変換部(LSP符号変換部,ピッチラグ符号変換部,ピッチゲイン符号変換部,代数ゲイン符号変換部,及び代数符号変換部の何れか)に入力される。各符号変換部は、入力された対応する要素符号を第2の符号化形式に応じた要素符号に変換して出力する。出力された複数の要素符号(LSP符号2,ピッチラグ符号2,ピッチゲイン符号2,代数ゲイン符号2,及び代数符号2)は、音声符号多重部に入力され、多重化されて第2の符号化形式の音声符号として出力される。
【0009】
図14に、図13で示した音声符号変換方式において、個々の要素符号を変換する場合の概念図を示す。図14は、第1の符号化方式の符号化データCode1を第2の符号化方式の符号化データCode2に変換する符号変換部を示す。図14において、符号変換部は第1の符号化方式において使用される第1量子化テーブルと、第2の符号化方式において使用される第2量子化テーブルを備えている。量子化テーブルのテーブルサイズやテーブル値は、符号化方式毎に異なっている。図14では、説明を簡単にするため、第1量子化テーブルのテーブルサイズが2ビットに設定され、第2量子化テーブルのテーブルサイズが3ビットに設定されている。符号変換部に入力される第1の符号化方式の音声符号Code1(図14では“10”)は、第1量子化テーブルのインデックス番号を表している。符号変換部は、入力された音声符号Code1に対応する第1量子化テーブルのテーブル値(図14では“1.5”)に対して最も誤差の小さいテーブル値(図14では“1.6”)を第2量子化テーブルから選択し、選択したテーブル値に対応する第2量子化テーブルのインデックス番号(図14では“011”)を第2の符号化方式の音声符号Code2として出力する。このように、符号変換部は、変換元の量子化テーブルと変換先の量子化テーブルとを比較してテーブル値の誤差が最も小さくなるようにインデックス番号の対応付けを行い、誤差が最も小さいテーブル値に対応するインデックス番号を出力する。
【0010】
ところが、変換元の音声符号Code1に任意のデータが埋め込まれていた場合には、音声品質のみを考慮して音声符号の変換を行うと、埋め込まれたデータが損なわれる場合がある。例えば、音声符号Code1のデータ系列“10”が前述した埋め込み方法によって埋め込まれた任意のデータであった場合において、上述した符号変換処理が行われると、入力されたデータ系列“10”は“011”に変換される。従って、埋め込まれたデータ系列“10”が維持されない。このため、受信側の第2の符号化方式の復号器は、埋め込まれたデータ系列を正常に受信することができない。
【0011】
上記した問題を解決する手段として、変換元の音声符号に埋め込まれた任意のデータを一旦抽出し、符号変換処理の後に変換先の符号に再び埋め込む方式が提案されている。図15は、変換元の埋め込みデータを損なわない音声符号変換器の原理図である。図15に示す音声符号変換器は、埋め込みデータ抽出部と、音声符号変換部と、データ埋め込み部とを有する。埋め込みデータ抽出部は、第1の符号化方式の音声符号から埋め込みデータScodeを抽出する。データ埋め込み部は、音声符号変換部で第2の符号化形式に変換された音声符号に埋め込みデータScodeを埋め込む。これによって、変換処理後の音声符号が埋め込みデータを保持する状態になる。
【0012】
図16は、図15に示した音声符号変換器の詳細を説明する図である。図16は、第1の符号化方式の音声符号Code1を第2の符号化方式の音声符号Code2に変換する場合を示している。図16に示す符号変換部は、図14に示した符号変換部と同様の構成及び機能を持つ。図16において、符号変換部に入力される第1の符号化方式の音声符号Code1(図16では“10”)は、第1量子化テーブルのインデックス番号を表している。また、音声符号Code1を構成するデータ系列の下位nビットは、埋め込まれた任意のデータ系列を表している(ここでは、説明を簡略化するため、n=2と仮定して説明する)。また、符号変換部から出力される音声符号Code2’は、第2量子化テーブルのインデックス番号を表している。一方、データ埋め込み部から出力される音声符号Code2は、第2量子化テーブルのインデックス番号を表している。また、音声符号Code2を構成するデータ系列の下位nビットは、埋め込みデータ系列を表している。以下に、図16に示す音声符号変換器の動作を説明する。まず、音声符号Code1(図16では“10”)は、符号変換部及び埋め込みデータ抽出部に夫々入力される。埋め込みデータ抽出部は、音声符号Code1に埋め込まれている埋め込みデータ系列SCode(図16では“10”)を抽出し、データ埋め込み部へ出力する。データ埋め込み部では、符号変換部でCode1を符号変換したCode2’(図16では“011”)に埋め込みデータ系列SCodeを下位nビットに埋め込み、第2の符号化方式の符号化データCode2(図16では“010”)として出力する。
【0013】
今後、第3世代携帯電話システムに代表されるように、音声通信に加えてデータ通信等のマルチメディア情報を対象とした通信システムの普及が予想される。このため、従来の音声回線のみを持つ通信システムと、音声回線及びその他のデータ回線を持つ通信システムとの間で通信が発生する。この場合、従来の音声符号変換装置が通信システム間で音声符号の相互変換を行えば、ユーザ間で音声通信を行うことができる。しかしながら、一方の通信システムがデータ回線を持たないため、ユーザ間でデータ通信を行うことができない。この問題に対し、図17に示される解決策が提案されている。図17は、第1の符号化方式の音声符号(音声符号1)を第2の符号化方式の音声符号(音声符号2)に変換する際に、変換先の音声符号2に任意のデータを埋め込む音声符号変換器の概念図を示している。図17において、音声符号変換器は、音声符号変換部と、データ埋め込み部とを有している。音声符号変換部は、第1の符号化方式の音声符号を第2の符号化方式の音声符号に変換する符号変換処理を行う。データ埋め込み部は、符号変換処理が行われた後の音声符号(変換先の音声符号2)に任意のデータを埋め込む。このように、送信対象のデータが、変換先の音声符号2に埋め込まれ、受信先に転送される。このような方式が適用されれば、音声回線のみを持つ通信システムのユーザと音声回線及びその他のデータ回線を持つ通信システムとの間で、データ通信を実行することができる。
【0014】
図18は、図17に示した方式を用い、任意のデータを変換先の音声符号に埋め込む音声符号変換器(音声符号変換部(符号変換部)及びデータ埋め込み部)の概念図である。図18には、第1の符号化方式の音声符号Code1を第2の符号化方式の音声符号Code2に変換する符号変換部を含む音声符号変換器が示されている。図18に示す符号変換部は、図14に示した符号変換部と同一の構成及び機能を持つ。図18において、符号変換部に入力される第1の符号化方式の音声符号Code1(図18では“10”)は、第1量子化テーブルのインデックス番号を表している。また、符号変換部から出力される音声符号Code2’は、第2量子化テーブルのインデックス番号を表している。また、データ埋め込み部から出力される音声符号Code2は、第2量子化テーブルのインデックス番号を表す。さらに、音声符号Code2を構成するデータ系列の下位mビットは、埋め込みデータ系列を表している。ここでは、説明を簡略化するため、m=1であるものと仮定する。図18において、符号変換部は、図14に示した符号変換部と同様の処理,即ち、第1の符号化方式の音声符号Code1(“10”)を第2の符号化方式の音声符号Code2’(“011”)に変換し、データ埋め込み部に入力する。データ埋め込み部は、データ回線から入力されるデータ系列SCode(埋め込みデータ(図18では“0”)を音声符号Code2’の下位mビットに埋め込む。データ埋め込み部は、データの埋め込みによって生成されたデータ系列“010”を第2の符号化方式の音声符号Code2として出力する。
【0015】
【発明が解決しようとする課題】
図16に示した従来技術1では、音声符号Code1に含まれる埋め込みデータScodeを埋め込みデータ抽出部が一旦抽出し、データ埋め込み部が符号変換部によって符号変換処理が実行された後の音声符号Code2’ に、抽出された埋め込みデータScodeを埋め込む。これによって、埋め込みデータが損なわれることなく符号変換が実現される。しかしながら、従来技術1では、データの埋め込みによって音声符号の値が変わる。このため、音声符号Code1に対応する第1量子化テーブルの値(図16では“10”に対応するテーブル値“1.5”)と、音声符号変換器から出力される音声符号Code2に対応する第2量子化テーブルの値(図16では“010”に対応するテーブル値“3.1”)との誤差が大きくなることがあった。これによって、Code2が音声に復号された際の音声歪みが大きくなり、音声品質が劣化する虞があった。
【0016】
一方、図18に示した従来技術2では、音声符号Code1が符号変換された音声符号Code2’ に任意のデータを埋め込む。しかしながら、従来技術2による方式でも、データの埋め込みによって音声符号の値が変わる。このため、音声符号Code1に対応する第1量子化テーブルの値(図18では“10”に対応するテーブル値“1.5”)と、音声符号Code2に対応する第2量子化テーブルの値(図18では’010’に対応するテーブル値“3.1”)との誤差が大きくなることがあった。これによって、Code2が音声に復号された際の音声歪みが大きくなり、音声品質が劣化する虞があった。以上のように、従来技術1及び2では、データの埋め込みと音声品質の保持の両立ができないという問題があった。
【0017】
本発明の目的は、第1の符号化方式の音声符号を第2の符号化方式の音声符号に変換するときに、第1の符号化方式の音声符号を、任意のデータが埋め込まれた状態の第2の符号化方式の音声符号に変換することができる音声符号変換装置を提供することである。
【0018】
また、本発明の他の目的は、第1の符号化方式の音声符号を第2の符号化方式の音声符号に変換するときに、音質の劣化を抑えつつ、任意のデータを第2の符号化方式の音声符号に埋め込むことができる音声符号変換装置を提供することである。
【0019】
また、本発明の他の目的は、音声信号を音声符号に符号化するときに、音声信号を任意のデータが埋め込まれた音声符号に符号化することができる音声符号化装置を提供することである。
【0020】
【課題を解決するための手段】
本発明は、上記した課題を解決するために以下の構成を持つ。
【0021】
すなわち、本発明は、第1の符号化方式により符号化された第1の音声符号を第2の符号化方式により符号化された第2の音声符号に変換する音声符号変換装置であって、
第1の音声符号を構成する要素符号に埋め込まれた埋め込みデータを抽出する抽出手段と、
前記第1の音声符号の要素符号の変換候補となる、第2の符号化方式に従った複数の要素符号を格納した符号帳と、
前記符号帳に格納された複数の要素符号を前記抽出手段によって抽出された埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、変換候補を限定する限定手段と、
前記限定手段によって限定された変換候補から変換先に相当する要素符号を決定する決定手段と、
を含む音声符号変換装置である。
【0022】
本発明は、第1の符号化方式で符号化される要素符号の全部又は一部は、第2の符号化方式で符号化される要素符号と同一の構成を有し、この同一の構成部分に前記埋め込みデータが埋め込まれており、
前記限定手段は、変換候補を、第1の符号化方式で符号化される要素符号に対する埋め込みデータの埋め込み位置と同じ位置の値が埋め込みデータの値と等しい要素符号に限定する、ように構成するのが好ましい。
【0023】
また、本発明は、第1の符号化方式により符号化された第1の音声符号を第2の符号化方式により符号化された第2の音声符号に変換する音声符号変換装置であって、
第1の音声符号を構成する要素符号の変換候補となる、第2の符号化方式に従った複数の要素符号を格納した符号帳と、
前記符号帳に格納された複数の要素符号を第2の音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、変換候補を限定する限定手段と、
前記限定手段によって限定された変換候補から変換先に相当する要素符号を決定する決定手段と、
を含む音声符号変換装置である。
【0024】
また、本発明における決定手段は、第1の音声符号を構成する要素符号の逆量子化値との誤差が最小となる逆量子化値が第2の符号化方式に従って符号化された要素符号を、変換先に相当する要素符号に決定する、ように構成するのが好ましい。
【0025】
また、本発明は、音声信号を音声符号に符号化する音声符号化装置であって、
音声信号の特定成分が符号化された複数の要素符号を格納した符号帳と、
前記符号帳に格納された複数の要素符号を音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、特定成分の符号化候補を限定する限定手段と、
前記限定手段によって限定された符号化候補から、特定成分の符号化先に相当する要素符号を決定する決定手段と、
を含む音声符号化装置である。
【0026】
また、本発明は、上記した音声符号変換装置、又は音声符号化装置と同様の特徴を持つ音声符号変換方法、又は音声符号化方法として特定することも可能である。
【0027】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。実施の形態の構成は例示であり、本発明は、実施の形態の構成に限定されない。
【0028】
〔第1実施形態〕
最初に、本発明の第1実施形態として、本発明の第1の発明に対応する実施形態について説明する。
【0029】
〈第1実施形態の概要〉
図1は、本発明の第1実施形態(音声符号変換器10)のシステム原理を示す概要図である。図1は、データが埋め込まれている第1の符号化方式の音声符号(音声符号Code1)が入力され、データが埋め込まれている第2の符号化方式の音声符号(音声符号Code2)を出力する音声符号変換器10を示している。
【0030】
音声符号変換器10は、音声符号変換部(符号変換部)11と、埋め込みデータ抽出部12と、変換符号限定部13とを備えている。音声符号変換部11及び埋め込みデータ抽出部12は、音声符号Code1を受け取る。音声符号Code1には、任意の埋め込みデータが埋め込まれている。音声符号変換部11は、音声符号Code1を第2の符号化方式に従った音声符号Code2に変換する。埋め込みデータ抽出部12は、音声符号Code1から埋め込みデータを抽出し、変換符号限定部13に入力する。変換符号限定部13は、埋め込みデータ抽出部12から入力された埋め込みデータを符号限定情報として用い、音声符号Code1の変換先の音声符号(音声符号Code2)の候補を限定する。
【0031】
図2は、図1に示した音声符号変換器10をさらに詳細に示す図である。図2は、データが埋め込まれている音声符号を、埋め込みデータを損なわずに変換する符号変換部11の概念を示している。図2において、符号変換部11は、第1量子化テーブル14と、第2量子化テーブル15とを含んでいる。
【0032】
第1量子化テーブル14は、1以上のテーブル値を持ち、テーブル値毎にインデックス番号(量子化インデックス)が割り当てられている。各テーブル値は、音声符号の逆量子化値(復号値)を示し、インデックス番号はテーブル値を符号化して得られる音声符号を構成する。第1量子化テーブル14のインデックス番号は、第1の符号化方式に従って設定されている。図2に示す例では、第1量子化テーブル14のインデックス番号は2ビットで表現されている。
【0033】
第2量子化テーブル15は、第1量子化テーブル14と同様に、1以上のテーブル値を持ち、インデックス番号(量子化インデックス)がテーブル値毎に割り当てられている。各テーブル値は音声符号の逆量子化値(復号値)を示し、インデックス番号は対応するテーブル値を符号化して得られる音声符号を構成する。第2量子化テーブル14のインデックス番号は、第2の符号化方式に従って設定されている。図2に示す例では、第1量子化テーブル14のインデックス番号は3ビットで表現されている。
【0034】
音声符号変換部11には、第1の符号化方式に従って符号化された音声符号Code1(図2ではCode1=“10”)が入力される。音声符号Code1は、第1量子化テーブル14のインデックス番号を表す。また、音声符号Code1を構成するデータ系列の下位nビットは、音声符号Code1に埋め込まれた任意のデータ系列を表す。一方、音声符号変換部11は、音声符号Code2を出力する。音声符号Code2は、音声符号Code1が第2の符号化方式に従って変換された音声符号である。音声符号Code2は、第2量子化テーブル15のインデックス番号を表す。また、音声符号Code2を構成するデータ系列の下位nビットは、音声符号Code2に埋め込まれた埋め込みデータ系列を表している。
【0035】
図2を用いて音声符号変換器10の動作を説明する。音声符号Code1(“10”)は、音声符号変換部11及び埋め込みデータ抽出部12にそれぞれ入力される。埋め込みデータ抽出部12は、音声符号Code1に埋め込まれている埋め込みデータSCode(図2ではSCode=“10”)を抽出し、変換符号限定部13に入力する。
【0036】
変換符号限定部13は、符号限定情報を音声符号変換部11に入力する。符号限定情報は、音声符号Code1の変換候補を、第2量子化テーブル15に格納された全てのインデックス番号から、埋め込みデータSCodeを所定位置で含むインデックス番号に限定するための情報である。
【0037】
図2に示す例では、符号限定情報は、変換候補のインデックス番号を、下位nビットの値が埋め込みデータScodeの値(“10”)と等しい値を持つ1以上のインデックス番号に限定することを示す情報を含む。従って、第2量子化テーブル15における変換候補のインデックス番号は、下位nビットの値が埋め込みデータScodeと同じ値(“10”)を持つインデックス番号、すなわちインデックス番号“010”と、インデックス番号“110”とに限定される。
【0038】
音声符号変換部11は、以下の手順で第1の符号化方式の音声符号を第2の符号化方式の音声符号に変換する。即ち、音声符号化変換部11は、音声符号Code1が入力されると、第1量子化テーブル14から、その音声符号と同じ値のインデックス番号に対応するテーブル値を読み出す。次に、音声符号化変換部11は、第2量子化テーブル14を参照し、第1量子化テーブル14から読み出されたテーブル値と最も誤差が小さいテーブル値を決定(選択)し、決定したテーブル値のインデックス番号を音声符号Code2として出力する。このとき、音声符号変換部11が選択可能なテーブル値は、変換符号限定部13によって限定されたインデックス番号に対応するテーブル値に限られている。従って、音声符号変換部11は、限定されたテーブル値の中から、誤差が最も小さいテーブル値を選択し、選択したテーブル値のインデックス番号を音声符号Code2として外部に出力する。図2に示す例では、音声符号変換部11は、音声符号Code1(“10”)に対応する第1量子化テーブル14のテーブル値(“1.5”)と最も誤差が小さいテーブル値として、第2量子化テーブル15のテーブル値“1.3”を選択し、テーブル値“1.3”のインデックス番号“110”を音声符号Code2として出力する。音声符号Code2は、埋め込みデータ系列“10”を下位nビットに含んでいる。
【0039】
このように、第1の発明では、第1の符号化方式の音声符号Code1が、この音声符号Code1に含まれた埋め込みデータScodeを所定位置で含む第2の符号化方式の音声符号Code2に変換される。これによって、音声符号Code1から変換された音声符号Code2において、音声符号Code1に埋め込まれた埋め込みデータ系列Scodeが維持される。
【0040】
言い換えると、変換符号限定部13は、音声符号変換部11による符号変換処理において使用される符号変換の候補を、埋め込みデータに応じて限定する。具体的には、変換符号限定部13は、変換候補を第2量子化テーブル15に格納された複数のインデックス番号のうち、インデックス番号の下位nビットのデータ系列が埋め込みデータSCodeと同じ値を持つインデックス番号のみに限定する。このため、何れのインデックス番号が選択されても、選択結果に相当するインデックス番号、すなわち変換先の音声符号(変換結果に相当する音声符号)は、所定位置に埋め込みデータScodeを含む。従って、第1の符号化方式の音声符号を、これに埋め込まれた埋め込みデータを損なうことなく、第2の符号化方式の音声符号に変換することができる。
【0041】
さらに、音声符号変換部11は、音声符号Code1に対応する第1量子化テーブル14のテーブル値との間の誤差が最小になるテーブル値のインデックス番号を変換候補に相当する1以上のインデックス番号の中から決定し、決定したインデックスス番号(図2では“110”)を第2の符号化方式の符号化データ(音声符号Code2)として出力する。従って、第2の符号化方式の音声符号が埋め込みデータ系列を維持することによる音質の劣化を最小限に抑えることができる。
【0042】
以上によって、第1の符号化方式によって符号化された音声符号に任意のデータが埋め込まれている場合でも、埋め込みデータを損なわず、かつ音声品質の劣化を抑えて、第1の符号化方式の音声符号を第2の符号化方式の音声符号に変換することができる。
【0043】
なお、図2を用いた説明では、説明を簡略化するため、埋め込みデータ系列が音声符号の下位nビットに含まれていることを仮定した。しかしながら、本発明において、埋め込みデータ系列が音声符号に埋め込まれる位置,及び埋め込みデータを構成するビットの数は任意に設定することができる。
【0044】
〈第1実施形態の具体例〉
次に、上記した第1実施形態(第1の発明)の具体例を説明する。図3は、第1実施形態の具体例に相当する音声符号変換器(音声符号変換装置)20の構成図である。図3において、音声符号変換器20は、第1の符号化方式に相当するG.729Aの音声符号を、第2の符号化方式に相当するAMR(12.2kbpsモード)の音声符号に変換する。また、音声符号変換器20は、任意のデータが埋め込まれているG.729Aの音声符号を、埋め込みデータを損なうことなくAMRの音声符号に変換する。埋め込みデータは、変換元のG.729Aの音声符号の代数符号(SCB符号)に埋め込まれているものとする。埋め込みデータは、変換先のAMRの音声符号の代数符号に埋め込まれる。
【0045】
なお、G.729Aの標本化周波数は8kHzであり、フレーム長は10msecであり、サブフレーム長は5msecであり、サブフレーム数は2であり、原理遅延は15msecであり、線形予測次数は10次である。一方、AMRの標本化周波数は8kHzであり、フレーム長は20msecであり、サブフレーム長は5msecであり、サブフレーム数は4であり、原理遅延は25msecであり、線形予測次数は10次である。
【0046】
音声符号変換器20は、音声符号分離部21と、LSP符号変換部22と、ピッチラグ符号変換部23と、ピッチゲイン符号変換部24と、代数ゲイン符号変換部25と、代数符号変換部26と、埋め込みデータ抽出部28と、変換符号限定部29とを備えている。
【0047】
G.729Aの符号器出力である第m(mは整数)フレームの回線データbst1(m)が、第1の符号化方式の音声符号bst1(m)として、端子1を介して符号分離部21に入力される。符号分離部は、回線データbst1(m)を、G.729Aの要素符号(LSP符号、ピッチラグ符号、ピッチゲイン符号、代数符号、及び代数ゲイン符号)に分離し、各符号変換部22〜26(LSP符号変換部22、ピッチラグ符号変換部23、ピッチゲイン符号変換部24、代数ゲイン符号変換部25、及び代数変換部26)に入力する。このとき、音声符号分離部21から出力された代数符号は、埋め込みデータ抽出部28にも入力される。
【0048】
ここに、LSP符号は、フレーム毎の線形予測分析により得られる線形予測係数(LPC係数)又はこのLPC係数から求まるLSP(線スペクトル対)パラメータを量子化することにより得られる。ピッチラグ符号は、周期性音源信号を出力するための適応符号帳の出力信号を特定するための符号である。代数符号(雑音符号)は、雑音性音源信号を出力するための代数符号帳(雑音符号帳)の出力信号を特定するための符号である。ピッチゲイン符号は、適応符号帳の出力信号の振幅を表すピッチゲイン(適応符号帳ゲイン)を量子化して得られる符号である。代数ゲイン符号は、代数符号帳の出力信号の振幅を表す代数ゲイン(雑音ゲイン)を量子化して得られる符号である。音声信号を符号化して得られる音声符号は、これらの要素符号からなる。
【0049】
埋め込みデータ抽出部28は、代数符号に含まれる埋め込みデータSCodeを抽出し、変換符号限定部29に出力する。変換符号限定部29は、埋め込みデータSCodeに応じて変換対象(変換候補)であるAMRの代数符号を限定する。
【0050】
各符号変換部22〜26は、音声符号分離部21から入力されるG.729Aの対応する要素符号をAMRに従った要素符号に変換し音声符号多重部27に入力する。音声符号多重部27は、各符号変換部22〜26から入力されるAMRの要素符号を多重化し、AMRの第n(nは整数)フレームの回線データbst2(n),すなわち第2の符号化方式の音声符号として端子2から出力する。
【0051】
LSP符号変換部22は、音声符号分離部21から入力されるG.729A方式のLSP符号(LSP符号1)を逆量子化するLSP逆量子化器と、LSP逆量子化器によって得られる逆量子化値をAMR方式に従って量子化するLSP量子化器とを持つ。LSP量子化器によって得られるAMR方式のLSP符号(LSP符号2)は、音声符号多重部27へ向けて出力される。
【0052】
ピッチラグ符号変換部23は、音声符号分離部21から入力されるG.729A方式のピッチラグ符号(ピッチラグ符号1)を逆量子化するピッチラグ逆量子化器と、ピッチラグ逆量子化器によって得られる逆量子化値をAMR方式に従って量子化するピッチラグ量子化器とを持つ。ピッチラグ量子化器によって得られるAMR方式のピッチラグ符号(ピッチラグ符号2)は、音声符号多重部27へ向けて出力される。
【0053】
ピッチゲイン符号変換部24は、音声符号分離部21から入力されるG.729A方式のピッチゲイン符号(ピッチゲイン符号1)を逆量子化するピッチゲイン逆量子化器と、ピッチゲイン逆量子化器によって得られる逆量子化値をAMR方式に従って量子化するピッチゲイン量子化器とを持つ。ピッチゲイン量子化器によって得られるAMR方式のピッチゲイン符号(ピッチゲイン符号2)は、音声符号多重部27へ向けて出力される。
【0054】
代数ゲイン符号変換部25は、音声符号分離部21から入力されるG.729A方式の代数ゲイン符号(代数ゲイン符号1)を逆量子化する代数ゲイン逆量子化器と、代数ゲイン逆量子化器によって得られる逆量子化値をAMR方式に従って量子化する代数ゲイン量子化器とを持つ。代数ゲイン量子化器によって得られるAMR方式の代数ゲイン符号(代数ゲイン符号2)は、音声符号多重部27へ向けて出力される。なお、実際には、AMR方式では、ピッチゲイン符号の逆量子化値と代数ゲイン符号の逆量子化値とはまとめてゲイン符号として量子化される。
【0055】
図4は、G.729Aの代数符号帳30の構造を示す図であり、図5は、G.729Aに従って生成される代数符号の構成を示す図である。代数符号帳30は、上記した第1の量子化テーブル14に相当する。
【0056】
G.729Aでは、1つのサブフレームに対して40個のサンプル点が規定され、各サンプル点はパルスの位置で示される。代数符号帳30は、1つのサブフレームを構成するサンプル点(N=40)を4つのパルス系統グループi0,i1,i2,i3に分割し、各パルス系統グループから1つのサンプル点を取り出し、取り出された各サンプル点が正又は負の振幅をそれぞれ持つパルス性信号(テーブル値に相当する)を出力する。
【0057】
各パルス系統グループi0,i1,i2,i3に対するサンプル点の割り当ては、図4に示す通りである。即ち、(1)パルス系統グループi0には、8個のサンプル点0,10,15,20,25,30,35が割り当てられ、(2)パルス系統グループi1には、8個のサンプル点1,6,11,16,21,26,31,36が割り当てられ、(3)パルス系統グループi2には、8個のサンプル点2,7,12,17,22,27,32,37が割り当てられ、(4)パルス系統グループi3には、16個のサンプル点3,4,8,9,13,14,18,19,23,24が割り当てられている。
【0058】
代数符号帳30は、図4に示すように、各パルス系統グループi0,i1,i2,i3から取り出されるパルスの位置(m0,m1,m2,m3)と、その振幅(s0,s1,s2,s3:符号±1)で表現される。代数符号帳30は、4つのパルス系統グループからそれぞれ取り出される4つのパルス及び各パルスの振幅の全ての組み合わせがそれぞれ符号化された複数の代数符号(量子化インデックス)を格納しており、代数符号に応じたパルス性信号を出力することができる。
【0059】
G.729Aでは、パルス位置m0,m1,m2が3ビット、パルス位置m3が4ビット、各パルス位置m0,m1,m2,m3におけるパルスの振幅が1ビットで表現される。従って、G.729Aで生成される代数符号は、図5に示すように、4つのパルス位置情報と4つの振幅情報とからなる17ビットで構成される。従って、代数符号帳30は、217通りの代数符号(量子化インデックス)を持つ。
【0060】
埋め込みデータ抽出部28は、音声符号分離部21から入力されるG.729Aの代数符号(代数符号1)から埋め込みデータを抽出する。埋め込みデータ抽出部28は、音声符号bst1(m)の送信側(G.729A側)で行われたデータの埋め込み方法(埋め込みデータ系列のビット数,埋め込み位置等)を予め知っており、この埋め込み方法に従って埋め込みデータを抽出する。ここでは、埋め込みデータは、G.729Aの代数符号(図5)のパルス系統グループi0,i1,i2に対応する各情報フィールドに埋め込まれているものと仮定する。埋め込みデータ抽出部28は、代数符号のパルス系統グループi0,i1,i2に係る情報(m0,m1,m2,s0,s1,及びs2)を切り出し、12ビットの埋め込みデータScodeとして抽出する。
【0061】
なお、埋め込みデータのビット数や埋め込み位置は任意に設定可能である。但し、代数符号の構成に従い、パルス位置情報単位,振幅情報単位,またはパルス系統グループ単位でデータを埋め込む方法が適用されれば、データの埋め込み又は切り出しの処理が容易になる。埋め込みデータは、パルス系統グループ単位で埋め込まれるのが好ましい。特に、i0〜i2のうちの少なくとも1つを含む組み合わせに対して埋め込みデータを埋め込むことが好ましい。また、埋め込みデータScodeは、音声符号bst1(m)が生成されてから音声符号変換器20に入力されるまでの時点において、どの時点で埋め込まれても良い。
【0062】
次に、変換符号限定部29について説明する。図6(A)は、変換先であるAMR(12.2kbpsモード)の代数符号帳31の構造を示す図であり、図6(B)は、AMR(12.2kbpsモード)の代数符号の構成を示す図である。代数符号帳31は、第2量子化テーブル15に相当する。
【0063】
AMR(12.2kbpsモード)は、G.729Aと同様に、1つのサブフレーム(5msec)に対して40個のサンプル点を持ち、各サンプル点は、パルス系統グループi0〜i9に対して図6(A)に示すように割り当てられている。
【0064】
代数符号帳31は、10本のパルス系統グループ(i0〜i9)のそれぞれから1つずつ取り出されるパルス、及びこれらのパルスの振幅(正又は負)の組み合わせから構成されるパルス性信号を、全ての組み合わせについて出力することができる。図6(A)に示すように、代数符号帳31は、10個のパルス系統グループi0〜i9からそれぞれ取り出されるパルスの位置(m0〜m9)と、これらのパルスの振幅(s0〜s9;1(正)又は−1(負))で表現される。パルスの位置は3ビットで表現され、パルスの振幅は1ビットで表現される。従って、AMR(12.2kbpsモード)の代数符号は、図6(B)に示すように、パルスの位置情報m0〜m9と、各パルスの振幅を示す振幅情報s0〜s9とからなる40ビットで構成される。また、代数符号帳31は、パルスの位置及び振幅の全ての組み合わせに相当する240通りのパルス性信号(テーブル値に相当する)の量子化インデックス,すなわち代数符号を格納しており、代数符号が復号されたパルス性信号を出力する。代数符号帳31に格納された複数の代数符号は、G.729Aの代数符号の変換候補となることができる。
【0065】
ここで、代数符号帳31と代数符号帳30と比較すると、G.729Aのパルス系統グループi0〜i2に係る構成は、AMR(12.2kbps)のパルス系統グループi0〜i2に係る構成と等しい。従って、埋め込みデータScodeは、上記したように、G.729Aの代数符号のパルス系統グループi0〜i2に係る部分(情報フィールド)に埋め込むのが好ましい。なぜなら、当該パルス系統グループの値を、代数符号の変換元と変換先とで等しくすることができるからである。これによって、変換先の音声符号による音声の品質を、変換元の音声符号の品質に近づけることができる。
【0066】
変換符号限定部29は、埋め込みデータScodeが入力されると、この埋め込みデータScodeと、予め認識している代数符号2に対する埋め込みデータScodeの埋め込み位置に係る情報とで、代数符号帳31の代数符号(量子化インデックス)を限定するための符号限定情報を代数符号変換部26に入力する。
【0067】
この例における符号限定情報は、代数符号帳31に格納された複数の代数符号をi0,i1,i2の値が埋め込みデータScodeと同じ値を持つ代数符号に限定することを示す情報を含む。符号限定情報によって限定された代数符号は必ず埋め込みデータを含む。この限定された代数符号は、代数符号変換部26における代数符号帳探索において、代数符号1の変換候補として使用される。
【0068】
また、代数符号がi0,i1,i2の値が埋め込みデータScodeと同じ値を持つ代数符号に限定されることにより、変換先の代数符号は、i0,i1,i2の値が固定された状態になる。代数符号2のi0,i1,i2の値が固定されると、代数符号帳31から選択可能な変換先の代数符号(量子化インデックス)が240通りから228通りに減少する。
【0069】
図3に戻って、代数符号変換部26について説明する。代数符号変換部26は、G.729Aの代数符号(代数符号1)を逆量子化する代数符号逆量子器33と、代数符号逆量子化器33によって得られる逆量子化値(代数符号帳31の代数符号帳出力)を量子化する代数符号量子化器34とを含んでいる。
【0070】
代数符号逆量子化器33は、G.729Aの代数符号の復号方法とほぼ同様の方法で、代数符号を逆量子化(復号)する。即ち、代数符号逆量子化器33は、上述した代数符号帳30を有し、自身に入力される代数符号1に対応するパルス性信号(代数符号帳30の代数符号帳出力)を、代数符号量子化器34に入力する。
【0071】
代数符号量子化器34は、代数符号逆量子化器33からのパルス性信号(代数符号帳30の代数符号帳出力)をAMRに従って符号化(量子化)する。即ち、代数符号量子化器34は、上述した代数符号帳31を有し、代数符号1の変換先に相当する代数符号2を、代数符号帳31に格納された複数の代数符号の中から決定する。このとき、変換先に相当する代数符号2は、変換符号限定部29によって限定された埋め込みデータScodeを含む代数符号の中から決定される。
【0072】
言い換えれば、代数符号量子化器34は、変換符号限定部29によって量子化インデックスが限定されたAMRの代数符号帳31の中から、符号変換による音声品質の劣化が最小限に抑えられる最適な10本のパルスの組み合わせ(代数符号帳出力)を選択する。このとき、代数符号量子化器34は、変換符号限定部28により限定されたパルス系統グループi0,i1,i2の値を固定した条件で、残りのi3〜i9に対するパルス位置と振幅を決定する。
【0073】
以下、残りのパルス系統グループの決定方法を説明する。代数符号量子化器34は、変換符号限定部29で限定されたAMRの代数符号帳の中からG.729Aの再生信号との間で再生領域の誤差電力が最小となるパルスの組み合わせを決定する。
【0074】
最初に、代数符号量子化器34は、まず、各符号変換部22〜26で対応する要素符号が逆量子化されることによって生成されるG.729Aの要素パラメータ(LSP、ピッチラグ、ピッチゲイン、代数符号帳出力、代数ゲイン)から、再生信号Xを求める。
【0075】
次に、代数符号量子化器34は、再生信号Xから、ピッチラグ符号変換部23で生成されるAMRの適応符号帳出力PLと、ピッチゲイン符号変換部24で生成されるAMRのピッチゲインβoptと、及びLSP符号変換部22で生成されるAMRのLSP係数から求めたLPC係数とを求める。
【0076】
次に、代数符号量子化器34は、適応符号帳出力PLと、ピッチゲインβoptと、LPC係数とで構成されるLPC合成フィルタのインパルス応答Aから、下記の式(1)で表される、代数符号帳31の代数符号帳探索のためのターゲットベクトル(ターゲット信号)X′を生成する。
【0077】
【数1】
次に、代数符号量子化器34は、代数符号帳探索として、式(2)中の評価関数誤差電力Dが最小になる代数符号帳出力Cを出力する符号ベクトルを求める。
【0078】
【数2】
式(2)において、γは代数ゲイン符号変換部26で生成されるAMRの代数ゲインである。式(2)の誤差電力Dを最小化する代数符号帳出力Cを出力する符号ベクトルを探索することは、下記の式(3)における誤差電力D′を最大化する代数符号帳出力Cを探索することと等価である。
【0079】
【数3】
ここで、Φ=ATA,d=X′TAとおくと、式(3)は下記の式(4)で表すことができる。
【0080】
【数4】
ここで、LPC合成フィルタのインパルス応答A=[a(0),…,a(N−1)]とし、ターゲットベクトルX′=[x′(0),…, x′(N−1)]とすると、式(4)中のdは式(5)で、また、Φの要素Φ(i,j)は式(6)で表すことができる。式(5)及び(6)中のNはサブフレーム長(5msec)である。なお、d(n), 及びΦ(i,j)は、代数符号帳探索の前に計算される。
【0081】
【数5】
【0082】
【数6】
ここで、代数符号帳出力Cを出力する符号ベクトルに含まれるパルス本数をNPとすると、ターゲットベクトルX′と代数符号帳出力Cとの相互相関Qは、下記の式(7)で表すことができる。
【0083】
【数7】
式(7)において、s(i)は代数符号帳出力Cのi本目のパルスの振幅であり、m(i)はそのパルス位置である。また、代数符号出力Cの自己相関Eは、式(8)で表すことができる。
【0084】
【数8】
従って、埋め込みデータが埋め込まれるパルス系統グループにおける値を埋め込みデータScodeと同じ値で固定した状態(すなわち、本実施例においてはi0〜i2の値を埋め込みデータで固定した状態、つまり式(7),(8)のm(0),...,m(2),s(0),...,s(2)を埋め込みデータで固定した状態)で、残りのパルスの位置m3〜m9と振幅s3〜s9を変えながらQ及びEを計算し、式(4)のD′が最大になるパルス位置及び振幅を決定する。
【0085】
このようにして、代数符号量子化器34は、再生信号Xとの間の誤差電力Dが最小になるターゲットベクトルX′を得ることができるAMRの代数符号帳出力Cを限定された変換候補の中から求め、求めた代数符号帳出力Cの量子化インデックスを、変換先の代数符号(代数符号2)として決定し、出力する。
【0086】
以上のように、代数符号変換部26は、G.729Aの代数符号に含まれる埋め込みデータに応じて、変換対象のAMRの代数符号を限定して、その中から最適な代数符号を決定する。
【0087】
〈作用〉
上述した第1実施形態の具体例(音声符号変換器20)の作用を説明する。
【0088】
音声符号変換器20では、埋め込みデータ抽出部28が代数符号1のi0〜i2に対応する情報フィールドに埋め込まれた埋め込みデータScodeを抽出し、変換符号限定部29に与える。変換符号限定部29は、代数符号帳31に格納された複数の代数符号を、i0〜i2の値が埋め込みデータScodeと同じ値を持つ代数符号に限定する。これによって、代数符号1の変換候補が限定される。従って、代数符号帳31から変換先の代数符号,即ち代数符号2として決定される代数符号は、埋め込みデータScodeがi0〜i2の情報フィールドに常に埋め込まれた状態となる。
【0089】
このように、音声符号変換器20によれば、代数符号1を、この代数符号1に含まれた埋め込みデータScodeが埋め込まれた代数符号2に変換することができる。このようにして、代数符号1に埋め込まれた埋め込みデータScodeを代数符号2において維持することができる。
【0090】
従って、音声符号bst2(m)の伝送先のノードは、予め判っている埋め込みデータの埋め込み位置に従ってAMRの代数符号のi0,i1,i2の情報を抽出することにより、G.729Aの代数符号に埋め込まれたデータを正常に受信することができる。
【0091】
また、変換候補が限定されることによって、代数符号帳探索に要する時間を短縮することが可能になる。
【0092】
また、音声符号変換器20では、代数符号変換部26が、限定された変換候補の中から、代数符号1の復号値との誤差が最も小さい復号値の量子化インデックスを、変換先の代数符号(代数符号2)として決定する。このように、限定された変換候補の中から最適な変換先の代数符号が選択されるので、音声符号の変換による音声の品質劣化を抑えることができる。
【0093】
これによって、G.729Aの代数符号に埋め込まれている埋め込みデータを代数符号変換によって損なうことなく、且つ音声品質の劣化を最小限に抑えてAMRの音声符号へ変換することが可能となる。
【0094】
さらに、埋め込みデータの埋め込み位置が、G.729AとAMRとで等しい構造を持つ部分(共通部分),即ちパルス系統グループi0〜i2の情報フィールドに規定され、代数符号1のi0〜i2の示す値がそのまま代数符号2の共通部分(i0〜i2)の内容を構成する。従って、変換先の代数符号2の内容を代数符号1の内容に近づけることができる。これによって、符号変換による音声品質の劣化を可能な限り抑えることができる。
【0095】
〔第2実施形態〕
次に、本発明の第2実施形態として、本発明の第2の発明に相当する実施形態について説明する。第2実施形態は、第1の符号化形式の音声符号に埋め込まれている埋め込みデータではなく、他の手法により得られた埋め込みデータ(例えば、データ回線を通じて受信したデータ)を、第1の符号化形式の音声符号の変換先に相当する第2の符号化形式の音声符号に埋め込む音声符号変換装置の実施形態である。第2実施形態は、第1実施形態と共通する部分を含むので、主に相違点について説明する。
【0096】
〈第2実施形態の概要〉
図7は、本発明の第2実施形態(音声符号変換器40)の原理を示す概要図であり、図8は、図7に示した音声符号変換器40をさらに詳細に示す図である。音声符号変換装置40は、以下の点を除き、第1実施形態の音声符号変換装置10と同じ構成を持つ。
(1)音声符号変換装置40に入力される第1の符号化方式の音声符号(音声符号Code1)から埋め込みデータを抽出する埋め込みデータ抽出部を持たない。
(2)変換符号限定部13には、音声符号Code1の変換先の音声符号(音声符号Code2)に埋め込まれる任意の埋め込みデータScodeが入力される。埋め込みデータScodeは、音声符号の回線とは別の回線を通じて変換符号限定部13に入力される。
【0097】
図8において、音声符号変換部11に入力される音声符号Code1(図8では“10”)は、第1量子化テーブル14のインデックス番号を表している。また、音声符号Code2は、第2量子化テーブル15のインデックス番号を表す。また、音声符号Code2を構成するデータ系列の下位mビットは、埋め込みデータ系列を表す。
【0098】
音声符号変換器40の動作は次の通りである。最初に、音声符号回線と別の回線(データ回線)から受信した埋め込みデータSCode(図8では“0”)を変換符号限定部13に入力する。
【0099】
変換符号限定部13は、変換対象(変換候補)を、第2量子化テーブル15の全てのテーブル(インデックス番号)にするのではなく、インデックス番号の下位mビットのデータ系列が埋め込みデータ系列SCodeと等しいテーブルのみに限定する。
【0100】
その後、音声符号変換部11は、音声符号変換部11に入力された音声符号Code1に対応する第1量子化テーブル14のテーブル値との誤差が最小になるテーブル値を、限定された第2量子化テーブル15の変換候補の中から選択(決定)し、選択されたテーブル値に対応するインデックス番号(図8では“110”)を、第2の符号化方式の音声符号(符号化データ)Code2として、出力する。
【0101】
第2の発明による音声符号変換器40によると、音声符号の変換に際し、埋め込みデータSCodeが入力されると、音声符号変換部11が、音声符号Code1を埋め込みデータScodeが埋め込まれた音声符号Code2に変換する。このように、音声符号変換器40によれば、第2の音声符号化方式の音声符号に任意のデータ系列を埋め込むことができる。
【0102】
さらに、音声符号変換器40によると、音声符号変換部11が、変換候補が限定された第2量子化テーブル15から、音声符号Code2に対応する第1量子化テーブル14のテーブル値との間の誤差が最小になるテーブル値(に対応するインデックス)を選択する。これによって、埋め込みデータ系列が音声符号に挿入されることを原因とする音声の品質の劣化を最小限に抑えることができる。
これにより、音声符号変換部において、第1の符号化方式の音声符号1を第2の音声符号2に変換すると共に、第2の符号化方式の音声符号2に任意のデータ系列を音質劣化を抑えて埋め込むことが可能になる。
【0103】
なお、図8の説明では、説明を簡略化するため、埋め込みデータ系列が下位mビットに含まれるものとしたが、埋め込みデータ系列が含まれる位置やビット数は任意である。また、変換符号限定部13に入力される埋め込みデータの取得経路も任意である。
【0104】
〈具体例〉
次に、上記した第2実施形態(第2の発明)の具体例を説明する。図9は、第2実施形態の具体例に相当する音声符号変換器(音声符号変換装置)50の構成図である。この具体例では、第1の符号化方式としてG.729Aが適用され、第2の符号化方式としてAMR(12.2kbpsモード)が適用されている。音声符号変換器50は、G.729Aの代数符号をAMRの代数符号に変換するときに、任意のデータをAMRの代数符号に埋め込む。すなわち、G.729Aの代数符号を任意のデータが埋め込まれたAMRの代数符号に変換する。
【0105】
図9において、音声符号変換器50は、第1実施形態における音声符号変換器20と次の点で異なる。
(1)埋め込みデータ抽出部がない。
(2)任意の埋め込みデータSCodeが変換符号限定部29に入力される。
【0106】
すなわち、第mフレームのG.729Aの符号器出力である回線データbst1(m)が端子1を通じて音声符号分離部21に入力される。音声符号分離部21は、回線データbst1(m)をG.729Aの要素符号(LSP符号、ピッチラグ符号、ピッチゲイン符号、代数符号、及び代数ゲイン符号)に分離し、各符号変換部22〜26(LSP符号変換部22、ピッチラグ符号変換部23、ピッチゲイン符号変換部24、代数符号変換部26、代数ゲイン変換部25)に入力する。また、任意の埋め込みデータSCodeが変換符号限定部29に入力される。埋め込みデータScodeは、例えば、他のデータ回線を通じて音声符号変換器50に入力される。
【0107】
変換符号限定部29は、埋め込みデータSCodeに応じて変換対象(変換候補)であるAMRの代数符号を限定する。各符号変換部では、入力されたG.729Aの各要素符号をAMRの各要素符号へと変換し符号多重部へと出力する。符号多重部では、変換されたAMRの要素符号を多重化して、AMRの第nフレームの回線データbst2(n)として出力する。
【0108】
ここで、各符号変換部22〜26の構成及び動作は、第1実施形態(音声符号変換器20)と同じである。また、変換符号限定部29については、入力がG.729Aの代数符号から抽出された埋め込みデータではなく、任意の埋め込みデータである点のみが第1実施形態と異なる。
【0109】
なお、変換符号限定部29に入力される任意の埋め込みデータのデータ量及び入力頻度は任意であり、固定量でも、適応的に制御(例えば、G.729Aのパラメータの性質などに応じて制御するなど)してもよい。ただし、埋め込みデータのデータ長は、AMRの代数符号帳のパルス情報(位置情報及び振幅情報)に対応するデータ長にすることが望ましい。例えば、パルスi0,i1に埋め込むのであれば、データ長を8ビット,すなわち(4+4)ビットに設定する。
【0110】
〈作用〉
第2実施形態の具体例によれば、G.729Aの代数符号データが埋め込まれていない場合に、変換符号限定部に直接埋め込みデータを入力して、変換対象のAMRの代数符号を限定し、その中から最適な代数符号を決定することにより、音声品質の劣化を最小限に抑えて、任意のデータをAMRの音声符号へ埋め込むことが可能となる。
【0111】
また、実際に音声符号にデータを埋め込む際、埋め込みに適したフレーム、すなわち任意のデータで符号を置換しても音声の品質に対する影響が小さいフレームが選定される。これによって、さらに音声の品質の劣化を抑えることが可能となる。この選定方法には、例えば、特願2002−26958で開示されているように、代数符号の寄与度を表すファクタとして代数ゲインを用い、代数ゲインが所定の閾値以下の場合にのみデータの埋め込みを行う方法、等がある。
【0112】
なお、本発明の実施形態1及び2では、図12及び図13に示す音声符号変換方式に適合する例を示したが、本発明は、タンデム接続方式の符号変換方式に適用することもできる。
【0113】
今後、第3世代携帯電話やVoIPの普及に伴い、従来の音声回線のみの携帯電話と音声回線とデータ回線を持つ第3世代携帯電話、あるいは第3世代携帯電話とVoIPなど、多様な通信システム間の通信において、データ埋め込み技術と音声符号変換技術を併用した技術の必要性は高い。その際、
(1)埋め込まれたデータを損なわない、あるいは新たに埋め込む。
(2)音声品質の劣化を抑える。
という2点を両立する音声符号変換を行う本発明の必要性は高い。
【0114】
また、本発明による音声符号変換装置によれば、任意のデータが埋め込まれていない第1の符号化方式の音声符号でも音声の品質の劣化を抑えることができる。
【0115】
〔第3実施形態〕
次に、本発明の第3実施形態について説明する。第3実施形態は、第2実施形態と同様の原理で任意の埋め込みデータを音声符号に埋め込む音声符号化器(音声符号化装置)について説明する。
【0116】
図10は、音声符号化器60の構成例を示す図である。音声符号化器60は、所定の音声符号化方式(G.729A,AMR等)に従って音声信号を音声符号に符号化する。この例では、音声符号化器60は、音声信号をAMR(12.2kbps)に従って符号化する。
【0117】
音声符号化器60には、音声信号と、埋め込みデータScodeとが入力される。音声符号化器60は、AMRの符号化器とほぼ同様の構成を持ち、入力された音声信号を、入力信号Xとして、この入力信号Xに対応するLSP符号,ピッチラグ符号,ゲイン符号(ピッチゲイン符号,代数ゲイン符号),代数符号を生成し、多重化し、音声符号として出力する。
【0118】
音声符号化器60は、第2実施形態と同様の構成を持つ変換符号限定部29を備えている。変換符号限定部29には、埋め込みデータScodeが入力される。変換符号限定部29は、第2実施形態と同様に、符号限定情報を生成し、出力する。符号限定情報によって、代数符号帳31の代数符号(変換候補(符号化候補))が、所定位置(例えば、パルス情報i0〜i3の位置)に埋め込みデータ系列Scodeと同じ値を持つ代数符号に限定される。
【0119】
その後、音声符号化器60は、代数符号帳探索を行い、入力信号Xの雑音成分を符号化した代数符号を求める。すなわち、入力信号Xとの間の誤差電力が最小となるターゲットベクトルX′が得られるときの代数符号帳出力の量子化インデックスを、変換先(符号化先)の代数符号として決定する。このとき、代数符号探索で変換候補として使用される代数符号は、埋め込みデータと同じ値を持つので、決定(選択)される代数符号は、必ず埋め込みデータを含んでいる。
【0120】
〈作用〉
第3実施形態によれば、音声信号を、埋め込みデータが埋め込まれた音声符号に符号化することができる。このとき、変換符号限定部13によって限定された代数符号の中から、入力信号Xの雑音成分として最適な代数符号が選択される。従って、音声信号の符号化に際して埋め込みデータを埋め込むことによる音声の品質の劣化を最小限に抑えることができる。
【0121】
更に、第1・第2実施形態と同様に、代数ゲインなどを用いて、音声品質への影響が小さいフレームを選定してデータの埋め込みを行うことにより、さらに音声の劣化を抑えることが可能となる。
【0122】
〔その他〕
上述した発明の実施の形態は、以下の発明を開示する。
【0123】
(付記1)第1の符号化方式により符号化された第1の音声符号を第2の符号化方式により符号化された第2の音声符号に変換する音声符号変換装置であって、
第1の音声符号を構成する要素符号に埋め込まれた埋め込みデータを抽出する抽出手段と、
前記第1の音声符号の要素符号の変換候補となる、第2の符号化方式に従った複数の要素符号を格納した符号帳と、
前記符号帳に格納された複数の要素符号を前記抽出手段によって抽出された埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、変換候補を限定する限定手段と、
前記限定手段によって限定された変換候補から変換先に相当する要素符号を決定する決定手段と、
を含む音声符号変換装置。(1)
(付記2)第1の符号化方式で符号化される要素符号の全部又は一部は、第2の符号化方式で符号化される要素符号と同一の構成を有し、この同一の構成部分に前記埋め込みデータが埋め込まれており、
前記限定手段は、変換候補を、第1の符号化方式で符号化される要素符号に対する埋め込みデータの埋め込み位置と同じ位置の値が埋め込みデータの値と等しい要素符号に限定する、
付記1記載の音声符号変換装置。(2)
(付記3)前記決定手段は、第1の音声符号を構成する要素符号の逆量子化値との誤差が最小となる逆量子化値が第2の符号化方式に従って符号化された要素符号を、変換先に相当する要素符号に決定する、
付記1記載の音声符号変換装置。
【0124】
(付記4)前記決定手段は、第1の音声符号を復号して得られる再生信号との間の誤差電力が最小となる音声信号を得ることができる要素符号を、変換先に相当する要素符号に決定する、
付記1記載の音声符号変換装置。
【0125】
(付記5)第1の符号化方式により符号化された第1の音声符号を第2の符号化方式により符号化された第2の音声符号に変換する音声符号変換装置であって、
第1の音声符号を構成する要素符号の変換候補となる、第2の符号化方式に従った複数の要素符号を格納した符号帳と、
前記符号帳に格納された複数の要素符号を第2の音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、変換候補を限定する限定手段と、
前記限定手段によって限定された変換候補から変換先に相当する要素符号を決定する決定手段と、
を含む音声符号変換装置。(3)
(付記6)第1の音声符号を構成する要素符号に埋め込まれた埋め込みデータを抽出し、前記限定手段に与える埋め込みデータ抽出手段をさらに含む、
付記5記載の音声符号変換装置。
【0126】
(付記7)前記決定手段は、第1の音声符号を構成する要素符号の逆量子化値との誤差が最小となる逆量子化値が第2の符号化方式に従って符号化された要素符号を、変換先に相当する要素符号に決定する、
付記5記載の音声符号変換装置。(4)
(付記8)前記決定手段は、第1の音声符号を復号して得られる再生信号との間の誤差電力が最小となる音声信号を得ることができる要素符号を、変換先に相当する要素符号として決定する、
付記5記載の音声符号変換装置。
【0127】
(付記9)音声信号を音声符号に符号化する音声符号化装置であって、
音声信号の特定成分が符号化された複数の要素符号を格納した符号帳と、
前記符号帳に格納された複数の要素符号を音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、特定成分の符号化候補を限定する限定手段と、
前記限定手段によって限定された符号化候補から、特定成分の符号化先に相当する要素符号を決定する決定手段と、
を含む音声符号化装置。(5)
(付記10)前記決定手段は、符号化対象の音声信号との間の誤差電力が最小となる音声信号を得ることができる要素符号を、特定成分の符号化先に相当する要素符号として決定する、
付記9記載の音声符号化装置。
【0128】
(付記11)第1の符号化方式により符号化された第1の音声符号を第2の符号化方式により符号化された第2の音声符号に変換する音声符号変換方法において、
第1の音声符号を構成する要素符号に埋め込まれた埋め込みデータを抽出するステップと、
符号帳に格納された第1の音声符号の要素符号の変換候補となる第2の符号化方式に従って符号化された複数の要素符号を、抽出された埋め込みデータの値と同じ値を所定位置で持つ要素符号に限定することにより、第1の音声符号の要素符号の変換候補を限定するステップと、
限定された変換候補の中から、変換先に相当する要素符号を決定するステップと、
を含む音声符号変換方法。
【0129】
(付記12)第1の符号化方式で符号化される要素符号の全部又は一部は、第2の符号化方式で符号化される要素符号と同一の構成を有し、この同一の構成部分に前記埋め込みデータが埋め込まれており、
前記変換候補を限定するステップは、変換候補を、第1の符号化方式で符号化される要素符号に対する埋め込みデータの埋め込み位置と同じ位置の値が埋め込みデータの値と等しい要素符号に限定する、
付記11記載の音声符号変換方法。
【0130】
(付記13)前記変換先に相当する要素符号を決定するステップは、第1の音声符号を構成する要素符号の逆量子化値との誤差が最小となる逆量子化値が第2の符号化方式に従って符号化された要素符号を、変換先に相当する要素符号に決定する、
付記10記載の音声符号変換方法。
【0131】
(付記14)前記変換先に相当する要素符号を決定するステップは、第1の音声符号を復号して得られる再生信号との間の誤差電力が最小となる音声信号を得ることができる要素符号を、変換先に相当する要素符号に決定する、
付記10記載の音声符号変換方法。
【0132】
(付記15)第1の符号化方式により符号化された第1の音声符号を第2の符号化方式により符号化された第2の音声符号に変換する音声符号変換方法であって、
符号帳に格納された第1の音声符号を構成する要素符号の変換候補となる第2の符号化方式に従って符号化された複数の要素符号を第2の音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、変換候補を限定するステップと、
前記限定手段によって限定された変換候補から変換先に相当する要素符号を決定する決定ステップと、
を含む音声符号変換方法。
【0133】
(付記16)第1の音声符号を構成する要素符号に埋め込まれた埋め込みデータを抽出するステップをさらに含み、
前記変換候補を限定するステップは、抽出された埋め込みデータに従って変換候補を限定する、
付記15記載の音声符号変換方法。
【0134】
(付記17)前記変換先に相当する要素符号を決定するステップは、第1の音声符号を構成する要素符号の逆量子化値との誤差が最小となる逆量子化値が第2の符号化方式に従って符号化された要素符号を、変換先に相当する要素符号に決定する、
付記15記載の音声符号変換方法。
【0135】
(付記18)前記変換先に相当する要素符号を決定するステップは、第1の音声符号を復号して得られる再生信号との間の誤差電力が最小となる音声信号を得ることができる要素符号を、変換先に相当する要素符号として決定する、
付記15記載の音声符号変換方法。
【0136】
(付記19)音声信号を音声符号に符号化する音声符号化方法であって、
符号帳に格納された、音声信号の特定成分が符号化された複数の要素符号を音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、特定成分の符号化候補を限定するステップと、
限定された符号化候補から、特定成分の符号化先に相当する要素符号を決定するステップと、
を含む音声符号化方法。
【0137】
(付記20)前記特定成分の符号化先に相当する要素符号を決定するステップは、符号化対象の音声信号との間の誤差電力が最小となる音声信号を得ることができる要素符号を、特定成分の符号化先に相当する要素符号として決定する、
付記19記載の音声符号化方法。
【0138】
【発明の効果】
本発明による音声符号変換装置によれば、第1の符号化方式の音声符号を第2の符号化方式の音声符号に変換するときに、第1の符号化方式の音声符号を、任意のデータが埋め込まれた状態の第2の符号化方式の音声符号に変換することができる。
【0139】
また、本発明による音声符号変換装置によれば、第1の符号化方式の音声符号を第2の符号化方式の音声符号に変換するときに、音質の劣化を抑えつつ、任意のデータを第2の符号化方式の音声符号に埋め込むことができる。
【0140】
また、本発明による音声符号化装置によれば、音声信号を音声符号に符号化するときに、音声信号を任意のデータが埋め込まれた音声符号に符号化することができる。
【図面の簡単な説明】
【図1】図1は、第1の発明の原理図である。
【図2】図2は、第1の発明の音声符号変換部の概念図である。
【図3】図3は、第1の発明の音声符号変換器の構成図である。
【図4】図4は、ITU−T G.729Aの代数符号帳の構造を示す図である。
【図5】図5は、ITU−T G.729Aの代数符号の構成図である。
【図6】図6(A)は、AMR(12.2kbpsモード)の代数符号帳の構造を示す図であり、図6(B)は、AMR(12.2kbpsモード)の代数符号の構成図である。
【図7】図7は、第2の発明の原理図である。
【図8】図8は、第2の発明の音声符号変換部の概念図である。
【図9】図9は、第2の発明の音声符号変換器の構成図である。
【図10】図10は、音声符号化装置の実施形態の説明図である。
【図11】図11は、データ埋め込み技術が適用される音声通信システムの概念図である。
【図12】図12は、音声符号変換装置の概念図である。
【図13】図13は、音声符号変換装置の構成図である。
【図14】図14は、音声符号変換部の概念図である。
【図15】図15は、従来技術1(変換元の埋め込みデータを損なわない音声符号変換器)の原理図である。
【図16】図16は、従来技術1(変換元の埋め込みデータを損なわない音声符号変換部)の概念図である。
【図17】図17は、従来技術2(符号変換時に任意のデータを埋め込む音声符号変換器)の原理図である。
【図18】図18は、従来技術2(符号変換時に任意のデータを埋め込む音声符号変換部)の概念図である。
【符号の説明】
10,20,40,50 音声符号変換器(音声符号変換装置)
11 音声符号変換部(決定手段)
12,28 埋め込みデータ抽出部(抽出手段)
13,29 変換符号限定部(限定手段)
14 第1量子化テーブル
15 第2量子化テーブル
26 代数符号変換部(決定手段,限定手段)
30 代数符号帳
31 代数符号帳(符号帳)
60 音声符号化装置
Claims (5)
- 第1の符号化方式により符号化された第1の音声符号を第2の符号化方式により符号化された第2の音声符号に変換する音声符号変換装置であって、
第1の音声符号を構成する要素符号に埋め込まれた埋め込みデータを抽出する抽出手段と、
前記第1の音声符号の要素符号の変換候補となる、第2の符号化方式に従った複数の要素符号を格納した符号帳と、
前記符号帳に格納された複数の要素符号を前記抽出手段によって抽出された埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、変換候補を限定する限定手段と、
前記限定手段によって限定された変換候補から変換先に相当する要素符号を決定する決定手段と、
を含む音声符号変換装置。 - 第1の符号化方式で符号化される要素符号の全部又は一部は、第2の符号化方式で符号化される要素符号と同一の構成を有し、この同一の構成部分に前記埋め込みデータが埋め込まれており、
前記限定手段は、変換候補を、第1の符号化方式で符号化される要素符号に対する埋め込みデータの埋め込み位置と同じ位置の値が埋め込みデータの値と等しい要素符号に限定する、
請求項1記載の音声符号変換装置。 - 第1の符号化方式により符号化された第1の音声符号を第2の符号化方式により符号化された第2の音声符号に変換する音声符号変換装置であって、
第1の音声符号を構成する要素符号の変換候補となる、第2の符号化方式に従った複数の要素符号を格納した符号帳と、
前記符号帳に格納された複数の要素符号を第2の音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、変換候補を限定する限定手段と、
前記限定手段によって限定された変換候補から変換先に相当する要素符号を決定する決定手段と、
を含む音声符号変換装置。 - 前記決定手段は、第1の音声符号を構成する要素符号の逆量子化値との誤差が最小となる逆量子化値が第2の符号化方式に従って符号化された要素符号を、変換先に相当する要素符号に決定する、
請求項3記載の音声符号変換装置。 - 音声信号を音声符号に符号化する音声符号化装置であって、
音声信号の特定成分が符号化された複数の要素符号を格納した符号帳と、
前記符号帳に格納された複数の要素符号を音声符号に埋め込まれる埋め込みデータの値と同じ値を所定位置で持つ1以上の要素符号に限定することにより、特定成分の符号化候補を限定する限定手段と、
前記限定手段によって限定された符号化候補から、特定成分の符号化先に相当する要素符号を決定する決定手段と、
を含む音声符号化装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002228492A JP2004069963A (ja) | 2002-08-06 | 2002-08-06 | 音声符号変換装置及び音声符号化装置 |
EP03254875A EP1388845A1 (en) | 2002-08-06 | 2003-08-05 | Transcoder and encoder for speech signals having embedded data |
US10/635,235 US20040068404A1 (en) | 2002-08-06 | 2003-08-06 | Speech transcoder and speech encoder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002228492A JP2004069963A (ja) | 2002-08-06 | 2002-08-06 | 音声符号変換装置及び音声符号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004069963A true JP2004069963A (ja) | 2004-03-04 |
Family
ID=30437736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002228492A Pending JP2004069963A (ja) | 2002-08-06 | 2002-08-06 | 音声符号変換装置及び音声符号化装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20040068404A1 (ja) |
EP (1) | EP1388845A1 (ja) |
JP (1) | JP2004069963A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014510299A (ja) * | 2011-02-07 | 2014-04-24 | クゥアルコム・インコーポレイテッド | ウォーターマーク入り信号を符号化し復号するためのデバイス |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
KR100703325B1 (ko) * | 2005-01-14 | 2007-04-03 | 삼성전자주식회사 | 음성패킷 전송율 변환 장치 및 방법 |
US20060262851A1 (en) * | 2005-05-19 | 2006-11-23 | Celtro Ltd. | Method and system for efficient transmission of communication traffic |
US8335684B2 (en) * | 2006-07-12 | 2012-12-18 | Broadcom Corporation | Interchangeable noise feedback coding and code excited linear prediction encoders |
US8953800B2 (en) * | 2009-12-14 | 2015-02-10 | Avaya Inc. | Method for transporting low-bit rate information |
CN107452391B (zh) | 2014-04-29 | 2020-08-25 | 华为技术有限公司 | 音频编码方法及相关装置 |
CN107545899B (zh) * | 2017-09-06 | 2021-02-19 | 武汉大学 | 一种基于清音基音延迟抖动特性的amr隐写方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI101439B (fi) * | 1995-04-13 | 1998-06-15 | Nokia Telecommunications Oy | Transkooderi, jossa on tandem-koodauksen esto |
JP3022462B2 (ja) * | 1998-01-13 | 2000-03-21 | 興和株式会社 | 振動波の符号化方法及び復号化方法 |
US6260009B1 (en) * | 1999-02-12 | 2001-07-10 | Qualcomm Incorporated | CELP-based to CELP-based vocoder packet translation |
JP3507743B2 (ja) * | 1999-12-22 | 2004-03-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 圧縮オーディオデータへの電子透かし方法およびそのシステム |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
US6829579B2 (en) * | 2002-01-08 | 2004-12-07 | Dilithium Networks, Inc. | Transcoding method and system between CELP-based speech codes |
JP4330346B2 (ja) * | 2002-02-04 | 2009-09-16 | 富士通株式会社 | 音声符号に対するデータ埋め込み/抽出方法および装置並びにシステム |
-
2002
- 2002-08-06 JP JP2002228492A patent/JP2004069963A/ja active Pending
-
2003
- 2003-08-05 EP EP03254875A patent/EP1388845A1/en not_active Withdrawn
- 2003-08-06 US US10/635,235 patent/US20040068404A1/en not_active Abandoned
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014510299A (ja) * | 2011-02-07 | 2014-04-24 | クゥアルコム・インコーポレイテッド | ウォーターマーク入り信号を符号化し復号するためのデバイス |
US9767822B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
Also Published As
Publication number | Publication date |
---|---|
US20040068404A1 (en) | 2004-04-08 |
EP1388845A1 (en) | 2004-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7310596B2 (en) | Method and system for embedding and extracting data from encoded voice code | |
JP6789365B2 (ja) | 音声符号化装置および方法 | |
JP4518714B2 (ja) | 音声符号変換方法 | |
KR101162275B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
US20110208514A1 (en) | Data embedding device and data extraction device | |
JP2008102520A (ja) | オーディオ信号の2重変換符号化 | |
KR20070028373A (ko) | 음성음악 복호화 장치 및 음성음악 복호화 방법 | |
KR101350285B1 (ko) | 신호를 부호화 및 복호화하는 방법, 장치 및 시스템 | |
JP4330346B2 (ja) | 音声符号に対するデータ埋め込み/抽出方法および装置並びにシステム | |
US20080162124A1 (en) | Transmitter and receiver for speech coding and decoding by using additional bit allocation method | |
JPH09152896A (ja) | 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置 | |
JP2004069963A (ja) | 音声符号変換装置及び音声符号化装置 | |
JP5544370B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
Ding | Wideband audio over narrowband low-resolution media | |
US20030158730A1 (en) | Method and apparatus for embedding data in and extracting data from voice code | |
JP6713424B2 (ja) | 音声復号装置、音声復号方法、プログラム、および記録媒体 | |
JP2006350373A (ja) | 音声符号変換方法および装置 | |
JP2006293405A (ja) | 音声符号変換方法及び装置 | |
JP4330303B2 (ja) | 音声符号変換方法及び装置 | |
JPH028900A (ja) | 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置 | |
JP4900402B2 (ja) | 音声符号変換方法及び装置 | |
Tosun et al. | Dynamically adding redundancy for improved error concealment in packet voice coding | |
JP2615862B2 (ja) | 音声符号化復号化方法とその装置 | |
KR100221186B1 (ko) | 음성 부호화 및 복호화 장치와 그 방법 | |
JPH0969000A (ja) | 音声パラメータ量子化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041026 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070227 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070626 |