JP2004053676A

JP2004053676A - 音声符号化装置および復号装置

Info

Publication number: JP2004053676A
Application number: JP2002207312A
Authority: JP
Inventors: Hisashi Yajima; 矢島　久
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2002-07-16
Filing date: 2002-07-16
Publication date: 2004-02-19

Abstract

【課題】モデム信号など音声帯域データ信号の高速伝送が可能で、音声信号伝送モードとの間でシームレスなモード切替が可能な、音声符号化装置および復号装置を得る。
【解決手段】ＣＥＬＰ方式を用いた符号器において、信号識別部１１により出力される入力信号の識別結果に基づいて、音声信号伝送時には第１の代数符号帳１６を、音声帯域データ信号伝送時には第２の代数符号帳１８を選択する。第２の代数符号帳１８の出力はダウンサンプリング部１９により第１の代数符号帳１６と同じサンプリング周波数に変換し、合成信号の生成を行う。
【選択図】　　　　図１

Description

【０００１】
【発明の属する技術分野】
この発明は、音声のデジタル有線通信および無線通信において用いられる音声符号化・復号装置において、特にＦＡＸ信号、モデム信号などの音声周波数帯域を用いたデータ信号の伝送を目的とする、音声符号化装置および復号装置に関するものである。
【０００２】
【従来の技術】
国際長距離通信を実現するためには、人工衛星打ち上げ、海底ケーブルの敷設等が必須であり、初期投資が膨大である。通信コストの低減を果たすためには、回線の有効利用が最も重要な課題となっており、このような課題を解決するため、ＤＣＭＥ（Ｄｉｇｉｔａｌ　Ｃｉｒｃｕｉｔ　ＭｕｌｔｉｐｌｉｃａｔｉｏｎＥｑｕｉｐｍｅｎｔ）のような回線多重化装置が適用される事が多い。図２０は、従来のＤＣＭＥを適用した国際長距離通信網の構成を示す図である。ＤＣＭＥは、主に国際回線と国内公衆網との中間に設置され、高能率音声伝送技術を利用し、また、音声およびＦＡＸ信号、モデム信号等の音声帯域データ信号の統計多重効果を利用する事により、国際回線を有効利用し通信コストの削減を実現する装置である。
【０００３】
図２１はＤＣＭＥの基本構成を示す図である。図において、５０１は信号識別部、５０２は音声検出部、５０３は割当制御部、５０４は符号器、５０５，５２３はＦＡＸ復調伝送部、５０６は多重化部、５０８はメッセージ生成部、５０９，５２６は切替スイッチ、５２０はメッセージ解読部、５２１は多重分離部、５２２は擬似背景雑音生成部、５２５は復号器である。
【０００４】
次に、ＤＣＭＥの動作について説明する。
公衆網側のトランク回線より伝送されてきた信号は、信号識別部５０１において音声信号であるかデータ信号であるか判定される。「音声信号」と判定されたら、音声検出部５０２において、有音／無音判定を行う。音声検出部５０２において有音と判定された場合は、割当制御部５０３において伝送チャネルを割り当てる。その後、各伝送チャネルごとに設置された符号器５０４において高能率符号化処理を行い、多重化部５０６を通してベアラ回線に送出する。音声検出部５０２において無音と判定された場合は、割当制御部５０３による伝送チャネルの割り当ては行われず、トランク回線からの信号を遮断する。即ち、音声信号については通話における無音時間帯の信号伝送を抑圧し、さらに有音時間帯は高能率音声符号化を行う事によって、高い伝送効率を実現する事が出来る。また、ＦＡＸ復調伝送部５０５は、ＦＡＸ信号を識別して伝送プロトコルを解析する事により、変調されたＦＡＸ画像信号を元のデジタル画像信号に復調して伝送する。多重化部５０６は、音声信号とデータ信号を多重化して伝送路に送出する。
【０００５】
符号器５０４に用いられる高能率音声符号化アルゴリズムには、伝送速度が３２ｋｂｉｔ／ｓのＡＤＰＣＭ（Ａｄａｐｔｉｖｅ　Ｄｉｆｆｅｒｅｎｔｉａｌ　Ｐｕｌｓｅ　Ｃｏｄｅ　Ｍｏｄｕｌａｔｉｏｎ：ＩＴＵ−Ｔ勧告Ｇ．７２６準拠方式）、同じく１６ｋｂｉｔ／ｓのＬＤ−ＣＥＬＰ（Ｌｏｗ−Ｄｅｌａｙ　Ｃｏｄｅ−Ｅｘｃｉｔｅｄ　Ｌｉｎｅａｒ　Ｐｒｅｄｉｃｔｉｏｎ：同勧告Ｇ．７２８準拠方式）などがある。さらに近年では、より一層の高能率化を実現するために、伝送速度が８ｋｂｉｔ／ｓのＣＳ−ＡＣＥＬＰ（Ｃｏｎｊｕｇａｔｅ−Ｓｔｒｕｃｔｕｒｅ　Ａｌｇｅｂｒａｉｃ−Ｃｏｄｅ−Ｅｘｃｉｔｅｄ　Ｌｉｎｅａｒ　Ｐｒｅｄｉｃｔｉｏｎ：同勧告Ｇ．７２９準拠方式）が用いられるケースも増えつつある。
【０００６】
伝送速度が８ｋｂｉｔ／ｓ〜１６ｋｂｉｔ／ｓ付近の音声符号化アルゴリズムは、少ない情報量で高品質な音声を得る事を目的としているため、例えば人間の発声機構をモデル化し、その特徴パラメータを抽出して符号化処理に用いる構成となっている。以下に事例を挙げて説明する。
【０００７】
まず、１６ｋｂｉｔ／ｓのＬＤ−ＣＥＬＰ方式について説明する。
図２２は、１６ｋｂｉｔ／ｓのＬＤ−ＣＥＬＰ方式を用いた音声符号化装置および復号装置の構成を示すブロック図である。図において、５５０は音声サンプルを一定時間分蓄積するベクトルバッファ、５５１，５５９は、励振信号のベクトル量子化時に参照される符号帳、５５２，５６０は乗算器、５５３，５６１はそれぞれ５５２，５６０に出力する利得値の適応動作を行うバックワード型利得適応処理部、５５４，５６２は合成フィルタ、５５５，５６３は入力信号に応じて合成フィルタ係数の適応動作を行うバックワード型合成フィルタ適応処理部、５５６は加算器、５５７は聴覚重み付けフィルタ、５５８は符号帳探索部であり、ベクトルバッファ５５０の出力信号と合成フィルタ５５４の出力信号との誤差パワーを最小とするサンプルを、符号帳５５１の中から探索する。
【０００８】
次に、８ｋｂｉｔ／ｓのＣＳ−ＡＣＥＬＰ方式について説明する。
図２４および図２５は、それぞれ８ｋｂｉｔ／ｓのＣＳ−ＡＣＥＬＰ方式を用いた音声符号化装置および復号装置の構成を示すブロック図である。
図２４を用いて符号化処理について説明する。６０１は線形予測分析部、６０２は線形予測係数（ＬＰＣ）を線スペクトル対（ＬＳＰ）に変換する、ＬＰＣ／ＬＳＰ変換部、６０３は変換されたＬＳＰを元にベクトル量子化を行い、量子化ベクトルに対応するインデックスを出力する、ＬＳＰ量子化部、６０４はＬＳＰ量子化部６０３にて、ベクトル量子化を実行する際に参照する、ＬＳＰ量子化符号帳、６０５はＬＳＰ量子化部６０３より出力されたＬＳＰ符号帳インデックスを元にＬＳＰを復号する、ＬＳＰ逆量子化部、６０６は、ＬＳＰをＬＰＣに変換する、ＬＳＰ／ＬＰＣ変換部である。また、６０７は、過去の励振信号を蓄積し、励振信号の周期成分、すなわちピッチ周期の探索に用いられる、適応符号帳、６０８は励振信号の更新成分（雑音成分）の生成に用いられる、代数符号帳である。ＣＳ−ＡＣＥＬＰ方式では、励振信号の雑音成分の生成には、代数符号帳という、振幅１のパルスを複数本組み合わせて構成されたものが用いられる。６０９は、励振信号のピッチ周期成分を強調する、ピッチプレフィルタ、６１０，６１１は、それぞれ励振信号の周期成分である適応符号帳と、雑音成分である代数符号帳に、量子化された利得を乗ずる乗算器、６１２は、乗算器６１０で乗ずる適応符号帳利得、および乗算器６１１で乗ずる雑音符号帳利得の量子化を行う際に参照する、利得量子化符号帳である。利得の量子化についてもベクトル量子化の手法を用いている。６１３は、適応符号帳利得のフレーム間予測（移動平均予測：Ｍｏｖｉｎｇ　Ａｖｅｒａｇｅ）を行うＭＡ予測部、６１４は、励振信号の周期成分と雑音成分とを加算する加算器、６１５は、ＬＳＰ／ＬＰＣ変換部６０６で得られた線形予測係数を用いて、励振信号にスペクトル包絡情報をたたみ込み、合成音声信号を出力する合成フィルタ、６１６は、合成フィルタ６１５の出力である合成音声信号と、入力音声信号との差を計算する減算部である。全ての代数符号帳、適応符号帳、利得量子化符号帳の組み合わせについて、６０７〜６１５を用いて合成音声信号を生成し、減算部６１６にて逐一入力音声信号との誤差信号を計算する。６１８は、その誤差信号のパワーを計算し、全合成信号の中から、誤差パワーが最小となる代数符号帳、適応符号帳、利得量子化符号帳の組み合わせを探索し、それぞれのインデックスを出力する、最小自乗誤差探索部である。また、６１７は、最小自乗誤差の探索を行うに当たり、誤差信号に聴覚的な重み付けを行う聴覚重み付けフィルタである。上記のようにして得られたＬＳＰ符号帳インデックス、利得符号帳インデックス、代数符号帳インデックス、適応符号帳インデックスは、多重化部５０６で多重化され伝送路に出力される。
【０００９】
次に図２５を用いて復号処理について説明する。多重化部５０６で多重化され、送信されてきた信号列は、多重分離部５２１においてＬＳＰ符号帳インデックス、利得符号帳インデックス、代数符号帳インデックス、適応符号帳インデックスに分離される。６２１はＬＳＰ量子化符号帳であり、受信したＬＳＰ符号帳インデックスを用いてＬＳＰを得るのに用いられる。６２２は適応符号帳であり、受信した適応符号帳インデックスを用いて、励振信号の周期成分である適応符号帳を得るのに用いられる。６２３は代数符号帳であり、受信した代数符号帳インデックスを用いて、励振信号の更新成分である雑音符号帳を得るのに用いられる。６２４はピッチプレフィルタ、６２７は利得量子化符号帳であり、受信した利得符号帳インデックスを用いて、励振信号の各成分の利得を得る。６２８はＭＡ予測部、６２５，６２６は乗算器、６２９は励振信号の周期成分と更新成分とを加算する加算器である。６３０はＬＳＰ逆量子化部、６３１はＬＳＰ／ＬＰＣ変換部、６３２は合成フィルタ、６３３は合成フィルタから出力された合成音声信号の特徴周波数成分を強調するポストフィルタである。
【００１０】
これらの符号化方式は、人間の声道情報をモデル化した合成フィルタ、すなわち音声のスペクトル包絡に対応する線形フィルタを構成し、人間の声帯音源に相当する符号帳に蓄えられた時系列の信号で駆動する事によって音声を再生するＣＥＬＰ方式に基づいている。図２２では、符号帳５５１について総当りで音声信号を合成し、符号帳探索部５５８でベクトルバッファ５５０の出力信号と合成フィルタ５５４の出力信号との誤差パワーを最小とするサンプルを探索する。音声復号装置へは、この誤差パワーを最小とするサンプルに振られたインデックスを符号化パラメータとして送信する。これらの詳細なアルゴリズムの説明は、ＩＴＵ−Ｔ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｇ．７２８，　”Ｃｏｄｉｎｇ　ｏｆ　Ｓｐｅｅｃｈ　ａｔ　１６ｋｂｉｔ／ｓ　ｕｓｉｎｇ　Ｌｏｗ−Ｄｅｌａｙ　Ｃｏｄｅ　Ｅｘｃｉｔｅｄ　Ｌｉｎｅａｒ　Ｐｒｅｄｉｃｔｉｏｎ”、及びＩＴＵ−Ｔ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｇ．７２９，　”Ｃｏｄｉｎｇ　ｏｆ　Ｓｐｅｅｃｈ　ａｔ　８　ｋｂｉｔ／ｓ　ｕｓｉｎｇ　Ｃｏｎｊｕｇａｔｅ−Ｓｔｒｕｃｔｕｒｅ　Ａｌｇｅｂｒａｉｃ−Ｃｏｄｅ−Ｅｘｃｉｔｅｄ　Ｌｉｎｅａｒ　Ｐｒｅｄｉｃｔｉｏｎ（ＣＳ−ＡＣＥＬＰ）”に記載されている。
【００１１】
一般的に、ＦＡＸ信号やモデム信号に代表される音声帯域データ信号（ｖｏｉｃｅ−ｂａｎｄ　ｄａｔａ：ＶＢＤ信号）は、通常の音声には無い特有な周波数特性を持つ信号成分を持っている。そのため、ＶＢＤ信号を音声の高能率伝送に特化された音声符号化方式を用いて伝送する事は通常困難である。
これらＶＢＤ信号の高能率伝送を実現するためには、例えば、国際標準に準拠した伝送プロトコルが用いられることの多いＦＡＸ信号などの伝送については、図２１のＦＡＸ復調伝送部５０５のような、ＤＣＭＥ側にＦＡＸ通信プロトコルを解析する機能を持たせ、ＶＢＤ信号を一旦元のデジタル画像データに復調して伝送し、受信側ＤＣＭＥで再度ＶＢＤ信号に変調して伝送する復調伝送方式を採用するという方法がある。
【００１２】
ところが、ＦＡＸ信号の伝送の場合、国際標準に準拠していないＦＡＸ端末メーカ独自仕様の伝送プロトコルを用いて高能率画像伝送を実現する場合がある。通常、これらメーカ独自仕様の伝送プロトコルは、一般的に開示されていないケースがほとんどであり、ＤＣＭＥ等の伝送装置側で伝送プロトコルを解析して復調伝送する手段がなく、独自仕様に対応する復調伝送方式の実装は事実上不可能となっている。また、実装上全てのプロトコルをサポートする事はきわめて難しく、たとえＤＣＭＥ側で実装が可能だったとしても製品コストが高騰し、リーズナブルな価格でユーザに提供する事が出来なくなる。モデム信号によるデータ伝送についても、同様の理由により復調伝送が困難となっている。
【００１３】
そこでＤＣＭＥでは、復調伝送方式がとれない場合の対策として、モデム信号のようなＶＢＤ信号に対しては高ビットレートのチャネル（通常は４０ｋｂｉｔ／ｓ程度）を適応的に割当て、そのチャネルでＶＢＤ信号の伝送を実現する方式をとっている。このＶＢＤ信号の高ビットレート伝送を実現するため、ＤＣＭＥに実装する音声符号化機能も「ＶＢＤ伝送モード」として高ビットレート動作をサポートしており、伝送する信号の特性に応じて符号化方式をシームレスに切り替えられる構成となっている。例えば、ＩＴＵ−Ｔ標準Ｇ．７６３（３２ｋｂｉｔ／ｓ　ＤＣＭＥ）では音声伝送時（以下、「音声伝送モード」と称する）には３２ｋｂｉｔ／ｓ　ＡＤＰＣＭを、ＶＢＤ信号伝送時には４０ｋｂｉｔ／ｓ　ＡＤＰＣＭを使用するよう勧告されている。また、ＩＴＵ−Ｔ勧告Ｇ．７６７（１６ｋｂｉｔ／ｓ　ＤＣＭＥ）では、音声伝送時には１６ｋｂｉｔ／ｓ　ＬＤ−ＣＥＬＰを、ＶＢＤ伝送時には４０ｋｂｉｔ／ｓ　ＬＤ−ＣＥＬＰ（同勧告Ｇ．７２８　Ａｎｎｅｘ　Ｊ）を使用するよう勧告されている。
【００１４】
ところが、これらの符号化方式では、音声伝送モードとＶＢＤ伝送モードの切り替え時にシームレスな符号化速度の変更を実現するために、さらには実装上の観点からもＶＢＤ伝送モードにおける符号化アルゴリズムを音声伝送モードにおける音声に特化した基本的な符号化アルゴリズムから変えてない。このため、ＶＢＤ信号を高能率に符号化し伝送するという観点では必ずしも最適な符号化方式であるとはいえない。
【００１５】
ここで、ＩＴＵ−Ｔ勧告Ｇ．７６７（１６ｋｂｉｔ／ｓ　ＤＣＭＥ）による、音声伝送時には１６ｋｂｉｔ／ｓ　ＬＤ−ＣＥＬＰを、ＶＢＤ伝送時には４０ｋｂｉｔ／ｓ　ＬＤ−ＣＥＬＰ（同勧告Ｇ．７２８　Ａｎｎｅｘ　Ｊ）を用いた場合を例として説明する。
図２３は、４０ｋｂｉｔ／ｓ　ＬＤ−ＣＥＬＰ方式を用いた音声符号化装置および復号装置の構成を示すブロック図である。図において、５７０は、合成フィルタ５５４とちょうど逆の周波数特性を持つ逆合成フィルタ、５７１はトレリス符号量子化（ＴＣＱ：Ｔｒｅｌｌｉｓ　Ｃｏｄｅｄ　Ｑｕａｎｔｉｚａｔｉｏｎ）に基づく差分信号量子化部、５７２は、差分信号量子化部５７１が量子化時に参照する符号帳、５７３は、符号化データからもとの残差信号を再生する、逆量子化部である。その他、図２２と同一の番号を記した構成要素は、同一の機能を持つ構成要素である。
【００１６】
４０ｋｂｉｔ／ｓＬＤ−ＣＥＬＰ方式の音声符号化装置、復号装置の、図２２で示した１６ｋｂｉｔ／ｓ　ＬＤ−ＣＥＬＰ方式のそれとの主な違いは、符号帳探索の手法にトレリス符号量子化（ＴＣＱ）に基づく差分信号量子化部５７１を適用していることにある。ＴＣＱ手法は、ＶＢＤモードの時に限り、合成による分析（Ａ−ｂ−Ｓ）法に代わって４０ｋｂｉｔ／ｓＬＤ−ＣＥＬＰの符号帳探索に用いられる。一方、符号化速度の変更をシームレスに実現するため、ＶＢＤモードにおいて用いられるバックワード型合成フィルタ適応処理部５５５およびバックワード型利得適応処理部５５３は、音声モードにおいて用いられるものと同一のものを用いている。さらに、適応周期についても、音声モードとＶＢＤモードの両方に用いられる。なお、詳細なアルゴリズムの説明は、ＩＴＵ−Ｔ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｇ．７２８　Ａｎｎｅｘ　Ｊ，　”Ｖａｒｉａｂｌｅ　ｂｉｔ−ｒａｔｅ　ｏｐｅｒａｔｉｏｎ　ｏｆ　ＬＤ−ＣＥＬＰ　ｍａｉｎｌｙ　ｆｏｒ　ｖｏｉｃｅｂａｎｄ−ｄａｔａ　ａｐｐｌｉｃａｔｉｏｎｓ　ｉｎ　ＤＣＭＥ”に記載されている。このように、４０ｋｂｉｔ／ｓ　ＬＤ−ＣＥＬＰでは、音声のスペクトル概形を形成するバックワード形合成フィルタの枠組みは残している。
【００１７】
従って、高ビットレート符号化アルゴリズムを用いたとしても、その伝送効率は決して高いとはいえない。例えば、４０ｋｂｉｔ／ｓ　ＡＤＰＣＭ（ＩＴＵ−Ｔ勧告Ｇ．７２６準拠方式）のＶＢＤ信号伝送能力は、９６００ｂｉｔ／ｓが限界であるし、また、４０ｋｂｉｔ／ｓ　ＬＤ−ＣＥＬＰ（同勧告Ｇ．７２８　Ａｎｎｅｘ　Ｊ準拠方式）については、１９２００ｂｉｔ／ｓのＶＢＤ信号伝送が可能であるものの、通信回線の外乱による伝送品質の劣化などを考慮すると、その伝送速度は保証されるものではなく、一般的には９６００〜１４４００ｋｂｉｔ／ｓ程度が限界と言われている。即ち、ＶＢＤ伝送モードについては、４０ｋｂｉｔ／ｓの伝送路に対し、高々１０ｋｂｉｔ／ｓ程度のデータ信号しか伝送できる能力がなくきわめて効率が悪い。
【００１８】
一方、近年、高速データ伝送への需要が爆発的に高まってきており、例えばデータ伝送速度が２８．８ｋｂｉｔ／ｓの速度を持つ、同勧告Ｖ．３４準拠方式などの高速モデム信号を用いる割合が増加してきている。しかしながら、ＤＣＭＥのＶＢＤ伝送モードには上記で示したように高速ＶＢＤ信号の伝送能力がないため、フォールバックなどの手段を用いて低速でデータ転送を行わざるを得なかった。このため、本来通信端末が持っている高速データ伝送の能力を発揮できず、通信料金がかさむ結果となり、ユーザに金銭的負担を掛けてしまうなどの問題点があった。
【００１９】
このような問題を解決するひとつの手段として、例えば、特開平１１−２０５４８５号公報で示されているような方法が検討されている。これは、ＶＢＤ信号をクリアチャネル（６４ｋｂｉｔ／ｓ　ＰＣＭ方式）を用いて伝送するものである。この方式を用いる事により、例えば、ＩＴＵ−Ｔ勧告Ｖ．９０のような高速モデム信号（伝送速度は最高５６ｋｂｉｔ／ｓ）に対しても伝送が可能となるという利点があるが、中速度のＶＢＤ信号伝送を考えた場合、６４ｋｂｉｔ／ｓのチャネルに高々２０〜３０ｋｂｉｔ／ｓ程度のデータ信号しか伝送していない事となる。２８．８ｋｂｉｔ／ｓ以下の中速度モデムも減りつつあるとは言え依然として広く普及しており、ＤＣＭＥにおいてはそれらのデータ通信チャネルも収容する必要があることから、高能率伝送という観点で望ましくない。
【００２０】
【発明が解決しようとする課題】
従来の音声符号化装置および復号装置は以上のように構成されているので、ＦＡＸ／モデム信号などのＶＢＤ信号の伝送において復調伝送が出来ない場合には、ＶＢＤ信号に高ビットレートのチャネルを割り当てて伝送する方式をとっているが、符号化速度をシームレスに切り替えるために、符号化アルゴリズムの基本部分を音声信号に用いているものと同一にしているため、必ずしもＶＢＤ信号の高能率符号化に適した方法ではないという課題があった。
【００２１】
この発明は上記のような課題を解決するためになされたもので、ＦＡＸ／モデム信号などＶＢＤ信号の高速伝送が可能で、かつ、音声信号伝送モードとＶＢＤ信号伝送モードとの間でシームレスなモード切替が可能な、音声符号化装置および復号装置を得ることを目的とする。
【００２２】
【課題を解決するための手段】
この発明に係る音声符号化装置は、出力のサンプリング周波数が第１の雑音符号帳よりも高い第２の雑音符号帳と、第２の雑音符号帳の出力を第１の雑音符号帳の出力と同じサンプリング周波数に変換する第１のサンプリング周波数変換部とを備え、入力信号が音声帯域データ信号である場合には、第１の雑音符号帳の出力に代えて第１のサンプリング周波数変換部により変換された第２の雑音符号帳の出力をパラメータとして用いるものである。
【００２３】
この発明に係る音声符号化装置は、音声帯域データ信号伝送に対応したＬＳＰ固定パターンを備え、音声帯域データ信号伝送時には、ＬＳＰ量子化符号帳の出力に代えてＬＳＰ固定パターンを用いて生成した出力をパラメータとして用い、さらに送信信号中にＬＳＰ量子化符号帳の情報を含めず、その分のビット数を第２の雑音符号帳の情報に割り当てるものである。
【００２４】
この発明に係る音声符号化装置は、音声帯域データ信号伝送時には、聴覚重み付けフィルタを無効にするものである。
【００２５】
この発明に係る音声符号化装置は、音声帯域データ信号伝送時には、送信信号中に適応符号帳の情報を含めずその分のビット数を第２の雑音符号帳の情報に割り当てるものである。
【００２６】
この発明に係る音声符号化装置は、音声帯域データ信号伝送時には、利得量子化符号帳の更新周期を短くするものである。
【００２７】
この発明に係る音声符号化装置は、音声帯域データ信号伝送に対応した第２の利得量子化符号帳を備え、音声帯域データ信号伝送時には、利得量子化符号帳に代えて第２の利得量子化符号帳の出力をパラメータとして用いるものである。
【００２８】
この発明に係る音声符号化装置は、合成音声信号と入力音声信号との誤差が最小となる最適なパラメータの組み合わせを探索する最小自乗誤差探索部により出力される誤差の最小値に基づいて、入力信号が音声信号であるか音声帯域データ信号であるかを判断する信号識別部を備えたものである。
【００２９】
この発明に係る音声符号化装置は、出力のサンプリング周波数が第１の雑音符号帳よりも高く、それぞれが第２の雑音符号帳とは異なった値を持つ複数の音声帯域データ信号対応雑音符号帳と、複数の音声帯域データ信号対応雑音符号帳の出力を第１の雑音符号帳の出力と同じサンプリング周波数に変換する複数のサンプリング周波数変換部を備え、音声帯域データ伝送時には、入力信号の特性に応じて複数の音声帯域データ信号対応雑音符号帳または第２の雑音符号帳から１つを選択し、その出力を複数のサンプリング周波数変換部または第１のサンプリング周波数変換部により変換してパラメータとして用いるものである。
【００３０】
この発明に係る音声符号化装置は、入力信号のサンプリング周波数を第２の雑音符号帳のサンプリング周波数に変換する第１のサンプリング周波数上昇部と、第１の雑音符号帳の出力を第２の雑音符号帳の出力と同じサンプリング周波数に変換する第２のサンプリング周波数上昇部とを備えたものである。
【００３１】
この発明に係る音声符号化装置は、音声帯域データ信号伝送時には、入力信号の量子化ビット数を代数符号帳の量子化ビット数に合わせて落とす、量子化ビット縮退部を備えたものである。
【００３２】
この発明に係る音声復号装置は、出力のサンプリング周波数が第１の雑音符号帳よりも高い第２の雑音符号帳と、第２の雑音符号帳の出力を第１の雑音符号帳の出力と同じサンプリング周波数に変換する第１のサンプリング周波数変換部とを備え、入力信号が音声帯域データ信号である場合には、第１の雑音符号帳の出力に代えて第１のサンプリング周波数変換部により変換された第２の雑音符号帳の出力をパラメータとして用いるものである。
【００３３】
この発明に係る音声復号装置は、音声帯域データ信号伝送に対応したＬＳＰ固定パターンを備え、音声帯域データ信号伝送時には、ＬＳＰ量子化符号帳の情報が含まれない受信信号を受信し、ＬＳＰ固定パターンを用いて生成した出力をＬＳＰ量子化符号帳の出力に代えてパラメータとして用いるものである。
【００３４】
この発明に係る音声復号装置は、音声帯域データ信号伝送時には、ポストフィルタを無効にするものである。
【００３５】
この発明に係る音声復号装置は、音声帯域データ信号伝送時には、適応符号帳の情報が含まれない受信信号を受信し、復号処理を行うものである。
【００３６】
この発明に係る音声復号装置は、音声帯域データ信号伝送時には、利得量子化符号帳の更新周期を短くするものである。
【００３７】
この発明に係る音声復号装置は、音声帯域データ信号伝送に対応した第２の利得量子化符号帳を備え、音声帯域データ信号伝送時には、利得量子化符号帳に代えて第２の利得量子化符号帳の出力をパラメータとして用いるものである。
【００３８】
この発明に係る音声復号装置は、出力のサンプリング周波数が第１の雑音符号帳よりも高く、それぞれが第２の雑音符号帳とは異なった値を持つ複数の音声帯域データ信号対応雑音符号帳と、複数の音声帯域データ信号対応雑音符号帳の出力を第１の雑音符号帳の出力と同じサンプリング周波数に変換する複数のサンプリング周波数変換部を備え、音声帯域データ伝送時には、入力信号の特性に応じて複数の音声帯域データ信号対応雑音符号帳または第２の雑音符号帳から１つを選択し、その出力を複数のサンプリング周波数変換部または第１のサンプリング周波数変換部により変換してパラメータとして用いるものである。
【００３９】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態１．
実施の形態１では、音声符号化装置および復号装置に用いる低ビットレート音声符号化方式として、ＩＴＵ−Ｔ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｇ．７２９，　”Ｃｏｄｉｎｇ　ｏｆ　Ｓｐｅｅｃｈ　ａｔ　８ｋｂｉｔ／ｓ　Ｕｓｉｎｇ　Ｃｏｎｊｕｇａｔｅ−Ｓｔｒｕｃｔｕｒｅ　Ａｌｇｅｂｒａｉｃ−Ｃｏｄｅ−Ｅｘｃｉｔｅｄ　Ｌｉｎｅａｒ−Ｐｒｅｄｉｃｔｉｏｎ（ＣＳ−ＡＣＥＬＰ）”を用いている。ＣＳ−ＡＣＥＬＰ方式においては、雑音符号帳には代数符号帳が用いられ、ここでも雑音符号帳には代数符号帳が用いられることを前提とする。
【００４０】
図１は、この発明の実施の形態１による音声符号化装置の構成を示すブロック図である。２は多重化部、３は割当制御部、７は伝送路、８は線形予測分析部、９はＬＰＣ／ＬＳＰ変換部、１０はＬＳＰ量子化部、１１は信号識別部、１２はＬＳＰ量子化符号帳、１３はＬＳＰ逆量子化部、１４はＬＳＰ／ＬＰＣ変換部、１５は適応符号帳、１６は第１の代数符号帳（第１の雑音符号帳）、１７はピッチプレフィルタ、１８は第２の代数符号帳（第２の雑音符号帳）、１９はダウンサンプリング部（第１のサンプリング周波数変換部）、２０は切替スイッチ、２１，２２は乗算器、２３は利得量子化符号帳、２４はＭＡ予測部、２５は加算器、２６は合成フィルタ、２７は減算器、２８は聴覚重み付けフィルタ、２９は最小自乗誤差探索部である。
【００４１】
また図２は、この発明の実施の形態１による音声復号装置の構成を示すブロック図である。図において、５は多重分離部、６はメッセージ解読部、３０はＬＳＰ量子化符号帳、３１は適応符号帳、３２は第１の代数符号帳（第１の雑音符号帳）、３３はピッチプレフィルタ、３４は第２の代数符号帳（第２の雑音符号帳）、３５はダウンサンプリング部（第１のサンプリング周波数変換部）、３６，３７は切替スイッチ、３８，３９は乗算器、４０は利得量子化符号帳、４１はＭＡ予測部、４２は加算器、４３はＬＳＰ逆量子化部、４４はＬＳＰ／ＬＰＣ変換部、４５は合成フィルタ、４６はポストフィルタである。
【００４２】
次に動作について説明する。
実施の形態１によるデータ信号の伝送は、ＩＴＵ−Ｔ勧告Ｖ．８に準拠したデータ通信開始手順に従って始められる。なお、この手順の詳細はＩＴＵ−Ｔ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｖ．８，”Ｐｒｏｃｅｄｕｒｅｓ　ｆｏｒ　ｓｔａｒｔｉｎｇ　ｓｅｓｓｉｏｎｓ　ｏｆ　ｄａｔａ　ｔｒａｎｓｍｉｓｓｉｏｎ　ｏｖｅｒ　ｔｈｅ　ｐｕｂｌｉｃ　ｓｗｉｔｃｈｅｄ　ｔｅｌｅｐｈｏｎｅ　ｎｅｔｗｏｒｋ”に述べられている。
【００４３】
まず、音声符号化装置による音声符号化処理について図１を用いて説明する。実施の形態１による音声符号化装置の基本的な動作は、従来例の図２４で示した音声符号化装置と同様である。ここでは、構成および動作が異なる部分について説明する。
第２の代数符号帳１８の出力は、第１の代数符号帳１６の出力よりもサンプリング周波数が高くなっている。ダウンサンプリング部１９は、第２の代数符号帳１８の出力を第１の代数符号帳１６の出力と同じサンプリング周波数に変換する。切替スイッチ２０は、信号識別部１１より出力された識別結果に基づき、第１の代数符号帳１６、第２の代数符号帳１８どちらかに接続される。
信号識別部１１は、例えば、データ通信開始手順において必須である受信側モデムのアンサートーンである２１００Ｈｚのトーン信号（振幅変調を受けている）を識別する機能を備えている。信号識別部１１は、音声符号化装置に入力される信号の中に２１００Ｈｚのトーン信号の有無を常に監視し、２１００Ｈｚトーン信号を検出したら、ＤＣＭＥ本体または割当制御部３に信号識別結果を送信し、４０ｋｂｉｔ／ｓチャネルへのアサイメント要求を出すとともに、切替スイッチ２０へも信号識別結果を送出する。この信号識別結果によって切替スイッチ２０が２０Ｂ側に接続され、音声符号化装置はＶＢＤ伝送モードへ遷移する。
【００４４】
次に、音声復号装置による音声復号処理について図２を用いて説明する。
復号装置の基本的な動作についても、従来例の図２５で示した音声復号装置と同様であるので、構成および動作が異なる部分について説明する。
第２の代数符号帳３４は、第２の代数符号帳１８と同一の符号帳であり、受信した代数符号帳インデックスを用いて、励振信号の更新成分すなわち雑音成分を得るのに用いられる。切替スイッチ３６，３７は、受信した信号識別結果に基づき第１の代数符号帳３２または第２の代数符号帳３４の選択を行う。
ダウンサンプリング部３５は、ダウンサンプリング部１９と同様に、第２の代数符号帳３４の出力を第１の代数符号帳３２の出力と同じサンプリング周波数に変換する。
【００４５】
なお、データ通信中は、送信側から常にデータ信号が送出されており無音になる事は無いが、データ送信手順終了後、しばらく無音区間が続くことがある。信号識別部１１は、この無音区間を検出する機能も備えており、送信信号で、少なくともアンサートーン検出待ちのポーズ時間よりも長い所定の時間継続する無音区間を検出したら、ＤＣＭＥ本体または割当制御部３に信号識別結果を送信し、８ｋｂｉｔ／ｓチャネルへのアサイメント要求を出すとともに、切替スイッチ２０へも信号識別結果を送出する。この信号識別結果によって切替スイッチ２０が２０Ａ側に接続され、音声符号化装置を音声伝送モードへ遷移させる事が出来る。
【００４６】
次に、各伝送モードにおける動作を説明する。
まず、音声伝送モードにおいては切替スイッチ２０を２０Ａ側に接続し、第１の代数符号帳１６が選択される。音声符号化装置へ入力された音声信号は、この第１の代数符号帳１６を用いて高能率符号化処理される。音声伝送モードで用いられる第１の代数符号帳１６は、例えば、ＩＴＵ−Ｔ勧告Ｇ．７２９で規定された代数符号帳を用いることができる。第１の代数符号帳１６のサンプリング周波数は８ｋＨｚであり、このときの符号化処理は、ＩＴＵ−Ｔ勧告Ｇ．７２９にて規定された処理と全く同一である。
【００４７】
また、ＶＢＤ伝送モードにおいては、切替スイッチ２０を２０Ｂ側に接続し、第２の代数符号帳１８が選択される。ＶＢＤ伝送モードで用いられる第２の代数符号帳１８は、８ｋＨｚよりも高いサンプリング周波数であることが必要であり、ここではサンプリング周波数を４８ｋＨｚとする。モデム信号の伝送帯域は３００Ｈｚ〜３４００Ｈｚであるためサンプリング周波数は８ｋＨｚで十分であるが、代数符号帳は単一の振幅しか持たず、量子化ビット数が１ビットのパルスの組み合わせであるので、代数符号帳を用いて位相変調および振幅変調を受けているモデム信号をあえて表現しようとすると、量子化ステップが少ないことによりＳＮ比が著しく低下する。一方、周波数帯域が３００Ｈｚ〜３４００Ｈｚであるモデム信号をディジタル信号で表現するためには、１サンプル当たりの量子化ステップ数が充分与えられていれば、通常、サンプリング周波数は８ｋＨｚで充分である。ところが、第２の代数符号帳１８は、８ｋＨｚよりも高いサンプリング周波数で表現されているため、量子化ノイズのパワーを広い帯域に拡散させる効果が得られ、必要な帯域（モデム信号の場合は前出の３００Ｈｚ〜３４００Ｈｚ）のＳＮ比を相対的に低減させることが出来る。このため各サンプルを表現するためのビット数が少なく量子化ステップが粗くても、高いＳＮ比でモデム信号を表現することが可能である。
【００４８】
第２の代数符号帳１８から出力されるオーバサンプリングされたパルス列は、ダウンサンプリング部１９によりサンプリング周波数８ｋＨｚの信号に変換される。この信号が切替スイッチ２０を経由して、乗算器２２にて量子化利得を乗ずる。さらに、加算器２５にて励振信号の周期成分を加え、合成フィルタ２６にてスペクトル包絡情報を畳み込んで合成信号を生成する。ここで生成された合成信号を入力されたＶＢＤ信号と比較し、最小自乗誤差探索部２９において誤差パワーを計算する。
この動作を、第２の代数符号帳１８で許容されているパルス列の全組み合わせ、および利得符号帳、適応符号帳との組み合わせ全てについて繰り返し、その中で誤差パワーを最小とする第２の代数符号帳１８、利得符号帳、適応符号帳の組み合わせを探索する。誤差パワー最小とする組み合わせのインデックスを最小自乗誤差探索部２９より出力し、多重化部２にてＬＳＰ符号帳インデックスと併せて多重化し、伝送路（ベアラ回線）に出力する。また、信号識別部１１の出力である信号識別結果は、符号化モード情報として割当制御部３に送られる。
【００４９】
一方、音声復号装置では、伝送路７より受信した符号化列が多重分離部５で各符号化パラメータに分離されると、ＤＣＭＥ本体またはメッセージ解読部６からアサイメント情報を貰って切替スイッチ３６および切替スイッチ３７を動作させる。音声伝送用の低速チャネルがアサインされている音声伝送モードでは、切替スイッチ３６を３６Ａ側に、切替スイッチ３７を３７Ａ側にそれぞれ接続し、第１の代数符号帳３２を選択する。ここでは、第１の代数符号帳３２はＩＴＵ−Ｔ勧告Ｇ．７２９で規定されたものと同一であり、このモードでの復号処理は同勧告で規定された処理と全く同一である。
【００５０】
また、ＶＢＤ伝送モードにおいては、切替スイッチ３６を３６Ｂ側に、切替スイッチ３７を３７Ｂ側にそれぞれ接続し、第２の代数符号帳３４が選択される。多重分離部５にて分離された代数符号帳インデックスに基づき第２の代数符号帳３４を参照することにより、４８ｋｂｉｔ／ｓにオーバサンプリングされた振幅１のパルス列が出力される。ダウンサンプリング部３５で４８ｋｂｉｔ／ｓから８ｋｂｉｔ／ｓにサンプリング周波数が変換され、励振信号の更新成分が得られる。同時に多重分離部５で得られた利得符号帳インデックスに基づいて、利得量子化符号帳４０を参照することにより、励振信号の更新成分、および周期成分に乗ずる利得値を得る。乗算器３９にて、励振信号の更新成分に利得を乗じる。一方、励振信号の周期成分は、多重分離部５で得られた適応符号帳インデックスを元に適応符号帳３１を参照して得られ、乗算器３８で利得が乗じられる。加算器４２にて更新成分と周期成分とを加算し、合成フィルタの励振信号を得る。また、多重分離部５で得られたＬＳＰ符号帳インデックスを元に、ＬＳＰ量子化符号帳３０を参照し、ＬＳＰ逆量子化部４３にてＬＳＰパラメータを得る。ＬＳＰパラメータはＬＳＰ／ＬＰＣ変換部４４にてＬＰＣに変換する。これは合成フィルタ４５の係数として用いる。加算器４２で得られた励振信号は、合成フィルタ４５においてスペクトル包絡情報を畳み込み、復号音声が得られる。
【００５１】
以上のように、この実施の形態１によれば、信号識別部１１により出力される信号識別結果に基づいて第１の代数符号帳１６または第２の代数符号帳１８を選択し、第２の代数符号帳１８の出力はダウンサンプリング部１９により第１の代数符号帳と同じサンプリング周波数に変換するようにしたので、全体の符号化および復号アルゴリズムの枠組みを変えずにモード切替を行っているため、モード切替時に音声の瞬断やクリック音の発生をなくすことができ、シームレスな切替が可能な音声符号化装置および復号装置を得ることが出来る。
【００５２】
また、この実施の形態１によれば、ブロック構成上は２種類の代数符号帳を持っているように見えるが、例えば本符号化方式をＤＳＰを用いてソフトウェアで実現してもよい。この場合は、サンプリングレートが異なること、サンプリング変換器を追加すること以外はほぼ同じプログラムフローで実現することも可能であるため、実装上有利であるという利点もある。
【００５３】
実施の形態２．
実施の形態２では、実施の形態１と同様に、音声符号化方式として、ＩＴＵ−Ｔ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｇ．７２９，　”Ｃｏｄｉｎｇ　ｏｆ　Ｓｐｅｅｃｈ　ａｔ　８ｋｂｉｔ／ｓ　Ｕｓｉｎｇ　Ｃｏｎｊｕｇａｔｅ−Ｓｔｒｕｃｔｕｒｅ　Ａｌｇｅｂｒａｉｃ−Ｃｏｄｅ−Ｅｘｃｉｔｅｄ　Ｌｉｎｅａｒ−Ｐｒｅｄｉｃｔｉｏｎ（ＣＳ−ＡＣＥＬＰ）”が用いられる。
図３は、この発明の実施の形態２による音声符号化装置の構成を示すブロック図である。図１と同一の符号は、同一の機能を持つ構成要素を示している。図において、１２０，１２２は切替スイッチ、１２１はＬＳＰ固定パターンである。切替スイッチ１２０，１２２は、信号識別部１１の出力である信号識別結果に基づき端子の切り替えを行う。ＬＳＰ固定パターン１２１は、特定のＬＳＰパターンを記憶保持するメモリである。
【００５４】
また、図４は、この発明の実施の形態２による音声復号装置の構成を示すブロック図である。図２と同一の符号は、同一の機能を持つ構成要素を示している。図において、１２３は、信号識別結果に基づき端子の切替を行う切替スイッチ、１２４は、ＬＳＰ固定パターン１２１と同一の内容を保持するメモリである。
【００５５】
実施の形態２では、信号識別部１１の出力である信号識別結果から伝送モードを判定することにより、ＬＳＰ符号帳インデックスの送信の有無を切り替えられるようにしている。
【００５６】
各伝送モードにおける動作を説明する。
音声伝送モードにおいては、切替スイッチ１２０を１２０Ａ側に、切替スイッチ１２２を１２２Ａ側に接続し、実施の形態１による音声伝送モードにおいての符号化処理と同様の処理を行う。
【００５７】
また、ＶＢＤ伝送モードにおいては、切替スイッチ１２０を１２０Ｂ側に、切替スイッチ１２２を１２２Ｂ側に接続する。切替スイッチ１２２を１２２Ｂ側に接続したことにより、線形予測分析及びＬＳＰ量子化処理は実行されず、ＬＳＰ符号帳インデックスは多重化部２に出力されない。また、切替スイッチ１２０を１２０Ｂ側に接続したことにより、ＬＳＰ逆量子化部１３は、ＬＳＰ固定パターン１２１より予め用意されたＬＳＰ固定パターンを抽出し、ＬＳＰ／ＬＰＣ変換部１４にてＬＰＣに変換する。得られたＬＰＣは、合成フィルタ２６のフィルタ係数として用いられる。なお、その他の音声符号化装置の各部の動作は、実施の形態１でのＶＢＤ伝送モードにおける動作と同一である。
【００５８】
ＬＳＰ固定パターンには、例えば、モデム信号の特徴であるフラットなスペクトル包絡特性を表現するようなものが含まれている。ＬＳＰは、各次数の値の間隔の疎密でスペクトル包絡の山と谷をそれぞれ表現しているため、フラットなスペクトル包絡特性を示すＬＳＰのパターンは、各次数の値の間隔を等間隔にすることによって容易に実現できる。
【００５９】
そこで、ＶＢＤ伝送モードにおいては、モデム信号のスペクトル包絡特性が常にフラットと見なして、先に述べたＬＳＰ固定パターンを用いることとする。これによりＬＳＰは一意に決まるため、ＬＳＰ符号帳インデックスは送信する必要がない。図５は、多重化部２から出力される符号化ビット列を示す図である。音声伝送モードには、ＩＴＵ−Ｔ勧告Ｇ．７２９に準拠した符号化方式を用いるものとすると、多重化部２から出力される符号化ビット列は、図中（ａ）で示されるフォーマットとなる。図中（ｂ）は、実施の形態１においてＶＢＤ伝送モードの時に多重化部２から出力される符号化ビット列のフォーマットである。通常、モデム信号は自己相関の小さな信号であるため、ＶＢＤ伝送モードにおいては、更新成分を表現する代数符号帳インデックスにより多くのビットを割り当てることで伝送特性をよくすることが出来る。図中（ｃ）は、実施の形態２においてＶＢＤ伝送モードの時に多重化部２から出力される符号化ビット列のフォーマットである。実施の形態２では、ＬＳＰ符号帳インデックスを送らないようにしたため、その分のビットを代数符号帳インデックスに割り当てることが出来るので、同じ伝送ビットレートで、実施の形態１よりもＶＢＤの伝送特性をさらに向上させることが出来る。
【００６０】
次に、音声復号装置の動作について説明する。受信した信号識別結果に基づき伝送モードを判定する。音声伝送モードにおいては、切替スイッチ１２３は１２３Ａ側に接続し、実施の形態１における音声伝送モードと全く同様の復号処理を行う。実施の形態２では、ＶＢＤ伝送モードにおいてはＬＳＰ符号帳インデックスは受信した符号ビット列中には含まれていない。切替スイッチ１２３は１２３Ｂ側に接続され、ＬＳＰ逆量子化部４３は、ＬＳＰ固定パターン１２４から予め用意されたＬＳＰ固定パターンを抽出し、ＬＳＰ／ＬＰＣ変換部４４にてＬＰＣに変換する。こうして得られたＬＰＣは、合成フィルタ４５のフィルタ係数として用いられる。それ以外の音声復号装置の動作は、実施の形態１におけるＶＢＤ伝送モードでの音声復号装置の動作と同一である。
【００６１】
以上のように、この実施の形態２によれば、スペクトル包絡情報がほぼ一意に決まるＶＢＤ伝送モードでは、ＬＳＰ固定パターンを用いてＬＰＣを取得し、また、ＬＳＰ符号帳インデックスは、送信する符号化ビット列に含めないようにし、その分の情報量を代数符号帳インデックスに割り当てるようにしたので、ＶＢＤ伝送モードでの伝送特性がさらに向上するという効果が得られる。
【００６２】
実施の形態３．
実施の形態３では、実施の形態１と同様に、音声符号化方式として、ＩＴＵ−Ｔ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｇ．７２９，　”Ｃｏｄｉｎｇ　ｏｆ　Ｓｐｅｅｃｈ　ａｔ　８ｋｂｉｔ／ｓ　Ｕｓｉｎｇ　Ｃｏｎｊｕｇａｔｅ−Ｓｔｒｕｃｔｕｒｅ　Ａｌｇｅｂｒａｉｃ−Ｃｏｄｅ−Ｅｘｃｉｔｅｄ　Ｌｉｎｅａｒ−Ｐｒｅｄｉｃｔｉｏｎ（ＣＳ−ＡＣＥＬＰ）”が用いられる。
図６は、この発明の実施の形態３による音声符号化装置の構成を示すブロック図である。図１と同一の符号は、同一の機能を持つ構成要素を示している。図において、１３０，１３１は、信号識別部１１の判定結果に基づき端子の切替を行う切替スイッチである。
【００６３】
また、図７は、この発明の実施の形態３による音声復号装置の構成を示すブロック図である。図２と同一の符号は、同一の機能を持つ構成要素を示している。図において、１３２，１３３は、それぞれ信号識別結果に基づき端子の切替を行う切替スイッチである。
【００６４】
次に動作について説明する。
実施の形態３では、信号識別部１１の判定結果に応じて、音声符号化装置の聴覚重み付けフィルタ２８、および音声復号装置のポストフィルタ４６をバイパス出来るようになっている。音声伝送モードにおいては、音声符号化装置では切替スイッチ１３０を１３０Ａ側に、切替スイッチ１３１を１３１Ａ側に接続し、実施の形態１による音声伝送モードにおける音声符号化と全く同様の処理を行う。また、ＶＢＤ伝送モードにおいては、切替スイッチ１３０を１３０Ｂ側に、切替スイッチ１３１を１３１Ｂ側に接続する。すなわち、聴覚重み付けフィルタ処理をバイパスする。それ以外の音声符号化装置の各部の動作は、実施の形態１によるＶＢＤ伝送モードにおける動作と同一である。
【００６５】
音声復号装置については、音声伝送モードにおいては、切替スイッチ１３２を１３２Ａ側に、切替スイッチ１３３を１３３Ａ側に接続し、実施の形態１による音声伝送モードの時の復号処理と同様の処理を行う。ＶＢＤ伝送モードにおいては、切替スイッチ１３２を１３２Ｂ側に、切替スイッチ１３３を１３３Ｂ側にそれぞれ接続し、ポストフィルタをバイパスする。それ以外の音声復号装置の各部の動作は、実施の形態１によるＶＢＤ伝送モードにおける動作と同一である。
【００６６】
ＶＢＤ伝送モードでは、スペクトル包絡特性がほぼフラットとなるため、スペクトル包絡特性に応じて誤差パワーの重み付けを行う聴覚重み付けフィルタ２８の効果は小さい。同様の理由で、スペクトルピークの強調を行うポストフィルタ４６の効果も小さい。逆に、入力信号との誤差パワーを最小とする信号を合成フィルタ４５で合成したにもかかわらず、ポストフィルタ４６でさらにその信号を加工してしまうことになるため、ＳＮ比が劣化する恐れがある。
【００６７】
以上のように、この実施の形態３によれば、音声符号化装置において聴覚重み付けフィルタ２８をバイパスし、音声復号装置においてポストフィルタ４６をバイパスすることによりフィルタ処理およびそのフィルタ係数の適応処理を省略することができるため、処理が簡略化されるという効果が得られる。また、ポストフィルタ４６をバイパスすることで、より良好なＶＢＤ伝送を実現出来るという効果がある。
【００６８】
実施の形態４．
実施の形態４では、実施の形態１と同様に、音声符号化方式として、ＩＴＵ−Ｔ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｇ．７２９，　”Ｃｏｄｉｎｇ　ｏｆ　Ｓｐｅｅｃｈ　ａｔ　８ｋｂｉｔ／ｓ　Ｕｓｉｎｇ　Ｃｏｎｊｕｇａｔｅ−Ｓｔｒｕｃｔｕｒｅ　Ａｌｇｅｂｒａｉｃ−Ｃｏｄｅ−Ｅｘｃｉｔｅｄ　Ｌｉｎｅａｒ−Ｐｒｅｄｉｃｔｉｏｎ（ＣＳ−ＡＣＥＬＰ）”が用いられる。
図８は、この発明の実施の形態４による音声符号化装置の構成を示すブロック図である。図１または図３と同一の符号は、同一の機能を持つ構成要素を示している。図において、１４０，１４２は、信号識別部１１の判定結果に基づき端子の切替を行う切替スイッチである。
【００６９】
また、図９は、この発明の実施の形態４による音声復号装置の構成を示すブロック図である。図２または図４と同一の符号は、同一の機能を持つ構成要素を示している。図において、１４１は受信した信号識別結果に基づき端子の切替を行う切替スイッチである。
【００７０】
次に動作について説明する。
実施の形態４においては、音声符号化装置は、信号識別部１１が出力する信号識別結果に応じて適応符号帳インデックスの送信の有無を切り替える。音声伝送モードにおいては、切替スイッチ１４０を１４０Ａ側に、切替スイッチ１４２を１４２Ａ側に接続し、実施の形態２による音声伝送モードでの符号化処理と同様の処理を行う。
【００７１】
また、ＶＢＤ伝送モードにおいては、切替スイッチ１４０を１４０Ｂ側に、切替スイッチ１４２を１４２Ｂ側に接続する。これにより、適応符号帳の探索処理は実行されず、励振信号の周期成分は０になる。ＶＢＤは繰り返し成分の少ない信号であるため、励振信号を更新成分のみで表現することも可能である。但し、ＶＢＤ伝送モードから音声伝送モードへ復帰する時に備えて、ＶＢＤ伝送モードにおいても、適応符号帳の更新動作は継続する。それ以外の音声符号化装置の各部の動作は、実施の形態２によるＶＢＤ伝送モードにおける音声符号化装置の符号化処理と同一である。
【００７２】
また、このような構成とすることで、ＶＢＤ伝送モードにおいては適応符号帳インデックスを送信する必要がなくなる。実施の形態４によるＶＢＤ伝送モードにおいて多重化部２から出力される符号化ビット列を図５（ｄ）に示す。実施の形態２で説明したように、通常、モデム信号は自己相関の小さな信号であるため、ＶＢＤ伝送モードにおいては、更新成分を表現する代数符号帳インデックスにより多くのビットを割り当てると伝送特性がよくなる。さらに実施の形態４では、適応符号帳インデックスを送信しないようにしたため、その分を代数符号帳インデックスで補完することにより、ＶＢＤの伝送特性をさらに向上させることが出来る。
【００７３】
また、音声復号装置は、音声伝送モードにおいては、切替スイッチ１４１を１４１Ａ側に接続し、実施の形態２による音声伝送モードでの動作と同様の復号処理を行う。受信した信号識別結果によりＶＢＤ伝送モードと判定された時は、切替スイッチ１４１を１４１Ｂ側に接続する。この場合、適応符号帳インデックスは受信した符号化ビット列中に含まれないので、励振信号の周期成分は０とし、更新成分のみで励振信号を構成し、合成フィルタ４５に入力する。但し、音声符号化装置と同様、励振信号のフィードバックによる適応符号帳の更新動作はＶＢＤ伝送モードにおいても継続する。それ以外の音声復号装置の動作は、実施の形態２によるＶＢＤ伝送モードにおける復号処理と同一である。
【００７４】
以上のように、この実施の形態４によれば、繰り返し成分の寄与が少ないＶＢＤ伝送モードで適応符号帳情報を送らない構成としたので、その分の情報量を代数符号帳インデックスに割り当てることが可能となるため、ＶＢＤの伝送特性を向上出来るという効果が得られる。また、処理負荷の大きい適応符号帳探索処理を省略できるため、より少ない処理負荷で実施の形態１と同様の効果を得ることができる。
【００７５】
実施の形態５．
実施の形態５による音声符号化装置および復号装置の構成は、図１および図２で示された実施の形態１によるものと同様であるが、実施の形態５ではＶＢＤ伝送モードにおいて、サブフレームの周期を短くしている。
【００７６】
図１０は、実施の形態５における符号化処理単位を時系列で表現したものであり、図１１は符号化フレーム構成を示したものである。それぞれ、図中（ａ）は音声伝送モード、（ｂ）はＶＢＤ伝送モードにおけるものである。
【００７７】
ＩＴＵ−Ｔ勧告Ｇ．７２９の符号化フレーム長は１０ｍｓｅｃであるが、信号の微妙な変化を表現するためにサブフレームを設けて、適応符号帳インデックス、代数符号帳インデックス、利得符号帳インデックスの３つについては、サブフレーム単位で符号化を行っている。音声信号の場合、時間的な変化は緩やかなので、サブフレーム（５ｍｓｅｃ）区間内ではほぼ定常的と見なせるのに対し、ＶＢＤでは、伝送しようとするデジタル信号に応じて振幅変調を掛けているため、利得変化が音声信号に比べて激しい。そこで、サブフレーム周期を短くして、激しい利得変化に追従させることでＳＮ比の向上を実現することができる。
【００７８】
以上のように、この実施の形態５によれば、ＶＢＤ伝送モードにおいては、利得符号帳のサブフレーム周期を短くしたことにより、ＶＢＤのＳＮ比を向上出来るという効果が得られる。
【００７９】
また、実施の形態５による音声符号化装置および復号装置は、実施の形態２から実施の形態４で示したものと同様の構成であってもよい。
【００８０】
実施の形態６．
実施の形態６では、実施の形態１と同様に、音声符号化方式としてＩＴＵ−Ｔ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｇ．７２９，　”Ｃｏｄｉｎｇ　ｏｆ　Ｓｐｅｅｃｈ　ａｔ　８ｋｂｉｔ／ｓ　Ｕｓｉｎｇ　Ｃｏｎｊｕｇａｔｅ−ＳｔｒｕｃｔｕｒｅＡｌｇｅｂｒａｉｃ−Ｃｏｄｅ−Ｅｘｃｉｔｅｄ　Ｌｉｎｅａｒ−Ｐｒｅｄｉｃｔｉｏｎ（ＣＳ−ＡＣＥＬＰ）”が用いられる。
図１２は、この発明の実施の形態６による音声符号化装置の構成を示すブロック図である。図１または図８と同一の符号は、同一の機能を持つ構成要素を示している。図において、１５０は、信号識別部１１の出力の信号識別結果に基づき端子の切替を行う切替スイッチ、１５１はＶＢＤ伝送モードにおいて使用することを目的とした第２の利得量子化符号帳である。
【００８１】
また、図１３は実施の形態６による音声復号装置の構成を示すブロック図である。図２または図９と同一の符号は、同一の機能を持つ構成要素を示している。図において１５２は、受信した信号識別結果に基づいて端子の切替を行う切替スイッチ、１５３は、第２の利得量子化符号帳１５１と同一の、第２の利得量子化符号帳である。
【００８２】
実施の形態６では、信号識別部１１が出力する信号識別結果に基づいて、使用する利得量子化符号帳を切り替えられるようになっている。音声伝送モードにおいては、音声符号化装置では切替スイッチ１５０を１５０Ａ側に接続し、第１の利得量子化符号帳２３を選択することにより実施の形態４による音声伝送モードでの符号化処理と同様の動作を行う。また、ＶＢＤ伝送モードにおいては、切替スイッチ１５０を１５０Ｂ側に接続し、第２の利得量子化符号帳１５１を使用する。それ以外の音声符号化装置の各部の動作は、実施の形態４によるＶＢＤ伝送モードでの動作と同一である。
【００８３】
図１４は、ＶＢＤであるモデム信号の波形と音声信号波形の一例を示したものである。図のように、モデム信号は音声信号に比べ、ダイナミックレンジが狭くなっている。音声伝送モードにおいて使用する第１の利得量子化符号帳２３は、音声信号のもつ広いダイナミックレンジをカバーするためにその分量子化ステップを粗くしている。一方、ＶＢＤ伝送モードにおいては広いダイナミックレンジをカバーする必要がないため、第２の利得量子化符号帳１５１は第１の利得量子化符号帳２３よりも量子化ステップを細かくし、ＳＮ比の向上を図れるような作りになっている。
【００８４】
また、音声復号装置については、音声伝送モードにおいては、切替スイッチ１５２を１５２Ａ側に接続し、第１の利得量子化符号帳４０を選択することで、実施の形態４による音声伝送モードでの復号処理と同様の動作を行う。ＶＢＤ伝送モードにおいては、切替スイッチ１５２を１５２Ｂ側に接続し、受信した利得符号帳インデックスを元に利得値を抽出する動作においては、第２の利得量子化符号帳１５３を参照するようにする。それ以外の音声復号装置の各部の動作は、実施の形態４によるＶＢＤ伝送モードにおける動作と同一である。
【００８５】
以上のように、この実施の形態６によれば、ダイナミックレンジの狭いＶＢＤ伝送モードにおいて利得量子化符号帳をＶＢＤに適したものに切り替える構成としたので、ＳＮ比が向上し、ＶＢＤの伝送特性を向上させるという効果が得られる。
【００８６】
実施の形態７．
図１５は、この発明の実施の形態７による音声符号化装置の構成を示すブロック図である。図１と同一の符号は、同一の機能を持つ構成要素を示している。１６０は、信号識別部（信号特性識別部）であり、最小自乗誤差探索部２９の計算結果を用いて、信号識別結果を出力する。
実施の形態７による音声符号化装置、音声復号装置の各モードでの動作は、信号識別部がモードの判定のために用いる信号が信号識別部１１と異なる以外は、実施の形態１に示した音声符号化装置、音声復号装置と同一である。
【００８７】
音声符号化装置の動作について説明する。
まず、音声伝送モードにて符号化処理を仮実行する。符号化処理を実行することで、最小自乗誤差探索部２９において最小の誤差パワーが得られる。信号識別部では、この最小誤差パワーの値を受け取る。音声信号入力時は、ＶＢＤ信号入力時に比べ誤差パワーが比較的小さくなることを利用して、最小誤差パワーがある閾値を下回った場合は信号識別部の判定結果を「音声モード」とする。仮実行した結果を得られた符号化データはそのまま伝送路７に出力する。最小誤差パワーがある閾値を上回る場合、信号識別部の判定結果を「ＶＢＤモード」とする。その場合は、さらにＶＢＤ伝送モードでの符号化処理を実行し、その結果得られた符号化データを伝送路７に出力する。
【００８８】
以上のように、この実施の形態７によれば、信号識別部を、符号化処理の過程で得られた最小自乗誤差パラメータを流用する構成としたので、信号識別部の構成を簡略化することが出来るという効果が得られる。また、実施の形態１による信号識別部１１と併用することで、信号識別の精度の向上も可能となる。
【００８９】
実施の形態８．
実施の形態８では、実施の形態１と同様に、音声符号化方式として、ＩＴＵ−Ｔ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｇ．７２９，　”Ｃｏｄｉｎｇ　ｏｆ　Ｓｐｅｅｃｈ　ａｔ　８ｋｂｉｔ／ｓ　Ｕｓｉｎｇ　Ｃｏｎｊｕｇａｔｅ−Ｓｔｒｕｃｔｕｒｅ　Ａｌｇｅｂｒａｉｃ−Ｃｏｄｅ−Ｅｘｃｉｔｅｄ　Ｌｉｎｅａｒ−Ｐｒｅｄｉｃｔｉｏｎ（ＣＳ−ＡＣＥＬＰ）”が用いられる。
図１６は、この発明の実施の形態８による音声符号化装置の構成を示すブロック図である。図１または図１５と同一の符号は、同一の機能を持つ構成要素を示している。図において、１７０は第３の代数符号帳（音声帯域データ信号対応雑音符号帳）、１７２は第４の代数符号帳（音声帯域データ信号対応雑音符号帳）である。第３の代数符号帳１７０および第４の代数符号帳１７２は、第１の代数符号帳１６より、出力のサンプリング周波数が高くなっている。また、１７１は、第３の代数符号帳１７０の出力を、第１の代数符号帳１６の出力と同じサンプリング周波数に変換する第３のダウンサンプリング部（サンプリング周波数変換部）、１７３は、第４の代数符号帳１７２の出力を、第１の代数符号帳１６の出力と同じサンプリング周波数に変換する、第４のダウンサンプリング部（サンプリング周波数変換部）である。１７８は、信号識別部より出力された識別結果に基づき、第１の代数符号帳１６、第２の代数符号帳１８、第３の代数符号帳１７０、第４の代数符号帳１７２の選択を行う切替スイッチである。
【００９０】
また、図１７は、この発明の実施の形態８による音声復号装置の構成を示すブロック図である。図２と同一の符号は、同一の機能を持つ構成要素を示している。図において、１７４は、第３の代数符号帳１７０と同一の第３の代数符号帳（音声帯域データ信号対応雑音符号帳）、１７５は、第３のダウンサンプリング部１７１と同一の機能を有する第３のダウンサンプリング部（サンプリング周波数変換部）、１７６は、第４の代数符号帳１７２と同一の第４の代数符号帳（音声帯域データ信号対応雑音符号帳）、１７７は、第４のダウンサンプリング部１７３と同一の機能を有する第４のダウンサンプリング部（サンプリング周波数変換部）である。
【００９１】
実施の形態８では、サンプリング周波数の異なる代数符号帳を複数備え、信号識別部の出力する信号識別結果に応じて、適応的に符号帳を切り替えられるようにしたことである。例えば、第２の代数符号帳１８は、サンプリング周波数＝４８ｋＨｚとする。第３の代数符号帳１７０は、サンプリング周波数＝３２ｋＨｚとする。第４の代数符号帳１７２は、サンプリング周波数＝２４ｋＨｚとする。また、信号識別部において、判定閾値を３つ（すなわち、モード設定を４段階）持つようにし、それぞれ誤差パワーの小さい順に第１の閾値、第２の閾値、第３の閾値とする。
【００９２】
信号識別部において、最小誤差パワーが第１の閾値を下回る場合を、「音声伝送モード」とし、この場合は、切替スイッチ１７８を１７８Ａに接続し、実施の形態１による音声伝送モードでの動作と同様の符号化処理を行う。
【００９３】
信号識別部において、最小誤差パワーが、第１の閾値を上回り、第２の閾値を下回る場合を、「第１のＶＢＤ伝送モード」とする。この場合は、切替スイッチ１７８を１７８Ｄに接続し、第４の代数符号帳１７２を選択し、実施の形態１によるＶＢＤ伝送モードでの動作と同様の符号化処理を行う。
【００９４】
信号識別部において、最小誤差パワーが、第２の閾値を上回り、第３の閾値を下回る場合を「第２のＶＢＤ伝送モード」とする。この場合は、切替スイッチ１７８を１７８Ｃに接続し、第３の代数符号帳１７０を選択し、実施の形態１によるＶＢＤ伝送モードでの動作と同様の符号化処理を行う。
【００９５】
信号識別部において、最小誤差パワーが、第３の閾値を上回る場合を、「第３のＶＢＤ伝送モード」とする。この場合は、切替スイッチ１７８を１７８Ｂに接続し、第２の代数符号帳１８を選択し、実施の形態１によるＶＢＤ伝送モードでの動作と同様の符号化処理を行う。
【００９６】
以上のように、この実施の形態８によれば、ＶＢＤ伝送モードを複数持たせたことにより、代数符号帳のビットレートを適応的に変えることが出来るため、代数符号帳インデックスに割り当てるビット数を適応的に変えることが出来る。そのためＶＢＤの伝送特性を維持しつつ、より効率的な伝送が可能となるという効果が得られる。
【００９７】
実施の形態９．
図１８は、この発明の実施の形態９による音声符号化装置の構成を示すブロック図である。図１から図１６までの各図と同一の符号は、同一の機能を持つ構成要素を示している。図において、１８１は、音声符号化装置における符号化動作を、第２の代数符号帳の持つサンプリング周波数に合わせるための第１のアップサンプリング部（第１のサンプリング周波数上昇部）である。また、１８２は、第１の代数符号帳１６の持つサンプリング周波数を第２の代数符号帳１８のサンプリング周波数に変換する第２のアップサンプリング部（第２のサンプリング周波数上昇部）である。例えば、第１の代数符号帳１６のサンプリング周波数を８ｋＨｚ、第２の代数符号帳１８のサンプリング周波数を４８ｋＨｚとすると、第１のアップサンプリング部１８１および第２のアップサンプリング部１８２は、８ｋＨｚ→４８ｋＨｚにアップサンプリングを行う。これにより、ここでは、符号化動作は全て４８ｋＨｚのサンプリング周波数で実行される。サンプリング周波数が異なる点を除いては、実施の形態１による符号化処理の動作と同一である。
【００９８】
上記のような構成としても、実施の形態１で示した効果と同等の効果を得ることが出来る。
【００９９】
実施の形態１０．
図１９は、この発明の実施の形態１０による音声符号化装置の構成を示すブロック図である。図１８と同一の符号は、同一の機能を持つ構成要素を示している。図において、１９０は、アップサンプリングされた音声信号の各サンプルの量子化ビット数の縮退動作を行う量子化ビット縮退部である。
【０１００】
実施の形態１０では、量子化ビット縮退部１９０により、例えば、アップサンプリングされた音声信号を１ビットで量子化する。代数符号帳も１ビットで表現されていることから、減算器２７での誤差信号の計算、最小自乗誤差探索部２９での誤差パワーの計算を大幅に簡略化できるといった効果がある。
【０１０１】
【発明の効果】
以上のように、この発明によれば、音声帯域データ伝送時には、雑音符号帳のサンプリングレートを音声帯域データ信号伝送に適した高さに切り替えるようにしたので、ＦＡＸ／モデム信号など音声帯域データ信号の高速伝送が可能で、かつ、音声信号伝送モードと音声帯域データ信号伝送モードとの間でシームレスなモード切替が可能な、音声符号化装置および復号装置を得られるという効果がある。
【０１０２】
この発明によれば、音声帯域データ信号伝送時には、送信する符号化ビット列にＬＳＰ量子化符号帳の情報を含めないようにし、その分のビット列を雑音符号帳に割り当てるようにしたので、音声帯域データ伝送モードでの伝送特性がさらに向上するという効果がある。
【０１０３】
この発明によれば、音声帯域データ信号伝送時には、聴覚重み付けフィルタとポストフィルタを無効にしたので、符号化処理を簡略化し、かつＳＮ比の高い音声帯域データ伝送モードでの伝送を実現出来るという効果がある。
【０１０４】
この発明によれば、音声帯域データ信号伝送時には、送信する符号化ビット列に適応符号帳の情報を含めないようにし、その分のビット列を雑音符号帳に割り当てるようにしたので、音声帯域データ伝送モードでの伝送特性がさらに向上するという効果がある。
【０１０５】
この発明によれば、音声帯域データ信号伝送時には、利得符号帳のサブフレーム周期を短くしたことにより、音声帯域データのＳＮ比を向上出来るという効果がある。
【０１０６】
この発明によれば、音声帯域データ信号伝送時には、利得量子化符号帳を音声帯域データ信号に適したものに切り替える構成としたので、音声帯域データのＳＮ比を向上出来るという効果がある。
【０１０７】
この発明によれば、符号化モードを決定するための信号識別に、合成信号の誤差パワー値を用いるようにしたので、信号識別処理が簡略化出来るとともに、判定制度を上げることが出来るという効果がある。
【図面の簡単な説明】
【図１】この発明の実施の形態１による音声符号化装置の構成を示すブロック図である。
【図２】この発明の実施の形態１による音声復号装置の構成を示すブロック図である。
【図３】この発明の実施の形態２による音声符号化装置の構成を示すブロック図である。
【図４】この発明の実施の形態２による音声復号装置の構成を示すブロック図である。
【図５】多重化部から出力される符号化ビット列を示す図である。
【図６】この発明の実施の形態３による音声符号化装置の構成を示すブロック図である。
【図７】この発明の実施の形態３による音声復号装置の構成を示すブロック図である。
【図８】この発明の実施の形態４による音声符号化装置の構成を示すブロック図である。
【図９】この発明の実施の形態４による音声復号装置の構成を示すブロック図である。
【図１０】この発明の実施の形態５における符号化処理単位を時系列で表現したものである。
【図１１】この発明の実施の形態５における符号化フレーム構成を示したものである。
【図１２】この発明の実施の形態６による音声符号化装置の構成を示すブロック図である。
【図１３】この発明の実施の形態６による音声復号装置の構成を示すブロック図である。
【図１４】モデム信号の波形と音声信号波形の一例を示した図である。
【図１５】この発明の実施の形態７による音声符号化装置の構成を示すブロック図である。
【図１６】この発明の実施の形態８による音声符号化装置の構成を示すブロック図である。
【図１７】この発明の実施の形態８による音声復号装置の構成を示すブロック図である。
【図１８】この発明の実施の形態９による音声符号化装置の構成を示すブロック図である。
【図１９】この発明の実施の形態１０による音声符号化装置の構成を示すブロック図である。
【図２０】ＤＣＭＥを適用した国際長距離通信網の構成を示す図である。
【図２１】ＤＣＭＥの基本構成を示す図である
【図２２】１６ｋｂｉｔ／ｓのＬＤ−ＣＥＬＰ方式を用いた音声符号化装置および復号装置の構成を示すブロック図である。
【図２３】４０ｋｂｉｔ／ｓ　ＬＤ−ＣＥＬＰ方式を用いた音声符号化装置および復号装置の構成を示すブロック図である。
【図２４】８ｋｂｉｔ／ｓ　ＣＳ−ＡＣＥＬＰ方式を用いた音声符号化装置の構成を示すブロック図である。
【図２５】８ｋｂｉｔ／ｓ　ＣＳ−ＡＣＥＬＰ方式を用いた音声復号装置の構成を示すブロック図である。
【符号の説明】
２　多重化部、３　割当制御部、５　多重分離部、６　メッセージ解読部、７伝送路、８　線形予測分析部、９　ＬＰＣ／ＬＳＰ変換部、１０　ＬＳＰ量子化部、１１　信号識別部、１２，３０　ＬＳＰ量子化符号帳、１３，４３　ＬＳＰ逆量子化部、１４，４４　ＬＳＰ／ＬＰＣ変換部、１５，３１　適応符号帳、１６，３２　第１の代数符号帳（第１の雑音符号帳）、１７，３３　ピッチプレフィルタ、１８，３４　第２の代数符号帳（第２の雑音符号帳）、１９，３５　ダウンサンプリング部（第１のサンプリング周波数変換部）、２０　切替スイッチ、２１，２２　乗算器、２３，４０　利得量子化符号帳、２４，４１　ＭＡ予測部、２５　加算器、２６，４５　合成フィルタ、２７　減算器、２８　聴覚重み付けフィルタ、２９　最小自乗誤差探索部、３６，３７　切替スイッチ、３８，３９　乗算器、４２　加算器、４６　ポストフィルタ、１２０，１２２，１２３　切替スイッチ、１２１　ＬＳＰ固定パターン、１３０，１３１，１３２，１３３　切替スイッチ、１４０，１４１，１４２　切替スイッチ、１５０，１５２切替スイッチ、１５１，１５３　第２の利得量子化符号帳、１６０　信号識別部（信号特性識別部）、１７０，１７４　第３の代数符号帳（音声帯域データ信号対応雑音符号帳）、１７１，１７５　第３のダウンサンプリング部（サンプリング周波数変換部）、１７２，１７６　第４の代数符号帳（音声帯域データ信号対応雑音符号帳）、１７３，１７７　第４のダウンサンプリング部（サンプリング周波数変換部）、１７８，１７９，１８０　切替スイッチ、１８１　第１のアップサンプリング部（第１のサンプリング周波数上昇部）、１８２　第２のアップサンプリング部（第１のサンプリング周波数上昇部）、１９０　量子化ビット縮退部。

Claims

適応符号帳と、第１の雑音符号帳と、利得量子化符号帳と、ＬＳＰ量子化符号帳による出力をパラメータとして合成音声信号を生成し、上記合成音声信号と入力音声信号との誤差に対して聴覚重み付けフィルタにより聴覚的な重み付けを行い、出力信号の情報として上記誤差が最小となる最適なパラメータの組み合わせを探索する音声符号化装置において、
出力のサンプリング周波数が上記第１の雑音符号帳よりも高い第２の雑音符号帳と、
上記第２の雑音符号帳の出力を上記第１の雑音符号帳の出力と同じサンプリング周波数に変換する第１のサンプリング周波数変換部とを備え、
入力信号が音声帯域データ信号である場合には、上記第１の雑音符号帳の出力に代えて上記第１のサンプリング周波数変換部により変換された上記第２の雑音符号帳の出力をパラメータとして用いることを特徴とする音声符号化装置。
音声帯域データ信号伝送に対応したＬＳＰ固定パターンを備え、
音声帯域データ信号伝送時には、ＬＳＰ量子化符号帳の出力に代えて上記ＬＳＰ固定パターンを用いて生成した出力をパラメータとして用い、さらに送信信号中にＬＳＰ量子化符号帳の情報を含めず、その分のビット数を第２の雑音符号帳の情報に割り当てることを特徴とする請求項１記載の音声符号化装置。
音声帯域データ信号伝送時には、聴覚重み付けフィルタを無効にすることを特徴とする請求項１記載の音声符号化装置。
音声帯域データ信号伝送時には、送信信号中に適応符号帳の情報を含めずその分のビット数を第２の雑音符号帳の情報に割り当てることを特徴とする請求項１記載の音声符号化装置。
音声帯域データ信号伝送時には、利得量子化符号帳の更新周期を短くすることを特徴とする請求項１記載の音声符号化装置。
音声帯域データ信号伝送に対応した第２の利得量子化符号帳を備え、
音声帯域データ信号伝送時には、利得量子化符号帳に代えて上記第２の利得量子化符号帳の出力をパラメータとして用いることを特徴とする請求項１記載の音声符号化装置。
合成音声信号と入力音声信号との誤差が最小となる最適なパラメータの組み合わせを探索する最小自乗誤差探索部により出力される上記誤差の最小値に基づいて、入力信号が音声信号であるか音声帯域データ信号であるかを判断する信号特性識別部を備えた請求項１記載の音声符号化装置。
出力のサンプリング周波数が第１の雑音符号帳よりも高く、それぞれが第２の雑音符号帳とは異なった値を持つ複数の音声帯域データ信号対応雑音符号帳と、
上記複数の音声帯域データ信号対応雑音符号帳の出力を上記第１の雑音符号帳の出力と同じサンプリング周波数に変換する複数のサンプリング周波数変換部を備え、
音声帯域データ伝送時には、入力信号の特性に応じて上記複数の音声帯域データ信号対応雑音符号帳または上記第２の雑音符号帳から１つを選択し、その出力を上記複数のサンプリング周波数変換部または第１のサンプリング周波数変換部により変換してパラメータとして用いることを特徴とする請求項１記載の音声符号化装置。
入力信号のサンプリング周波数を第２の雑音符号帳のサンプリング周波数に変換する第１のサンプリング周波数上昇部と、第１の雑音符号帳の出力を上記第２の雑音符号帳の出力と同じサンプリング周波数に変換する第２のサンプリング周波数上昇部とを備えた請求項１記載の音声符号化装置。
音声帯域データ信号伝送時には、入力信号の量子化ビット数を代数符号帳の量子化ビット数に合わせて落とす、量子化ビット縮退部を備えたことを特徴とする請求項９記載の音声符号化装置。
音声信号を合成するための、適応符号帳、第１の雑音符号帳、利得量子化符号帳およびＬＳＰ量子化符号帳の情報を含む入力信号を受信し、ポストフィルタにおいて出力音声信号の特徴周波数成分を強調する音声復号装置において、
出力のサンプリング周波数が上記第１の雑音符号帳よりも高い第２の雑音符号帳と、
上記第２の雑音符号帳の出力を上記第１の雑音符号帳の出力と同じサンプリング周波数に変換する第１のサンプリング周波数変換部とを備え、
入力信号が音声帯域データ信号である場合には、上記第１の雑音符号帳の出力に代えて上記第１のサンプリング周波数変換部により変換された上記第２の雑音符号帳の出力をパラメータとして用いることを特徴とする音声復号装置。
音声帯域データ信号伝送に対応したＬＳＰ固定パターンを備え、
音声帯域データ信号伝送時には、ＬＳＰ量子化符号帳の情報が含まれない受信信号を受信し、上記ＬＳＰ固定パターンを用いて生成した出力をＬＳＰ量子化符号帳の出力に代えてパラメータとして用いることを特徴とする請求項１１記載の音声復号装置。
音声帯域データ信号伝送時には、ポストフィルタを無効にすることを特徴とする請求項１１記載の音声復号装置。
音声帯域データ信号伝送時には、適応符号帳の情報が含まれない受信信号を受信し、復号処理を行うことを特徴とする請求項１１記載の音声復号装置。
音声帯域データ信号伝送時には、利得量子化符号帳の更新周期を短くすることを特徴とする請求項１１記載の音声復号装置。
音声帯域データ信号伝送に対応した第２の利得量子化符号帳を備え、
音声帯域データ信号伝送時には、利得量子化符号帳に代えて上記第２の利得量子化符号帳の出力をパラメータとして用いることを特徴とする請求項１１記載の音声復号装置。
出力のサンプリング周波数が第１の雑音符号帳よりも高く、それぞれが第２の雑音符号帳とは異なった値を持つ複数の音声帯域データ信号対応雑音符号帳と、
上記複数の音声帯域データ信号対応雑音符号帳の出力を上記第１の雑音符号帳の出力と同じサンプリング周波数に変換する複数のサンプリング周波数変換部を備え、
音声帯域データ伝送時には、入力信号の特性に応じて上記複数の音声帯域データ信号対応雑音符号帳または上記第２の雑音符号帳から１つを選択し、その出力を上記複数のサンプリング周波数変換部または第１のサンプリング周波数変換部により変換してパラメータとして用いることを特徴とする請求項１１記載の音声復号装置。