JP2004053676A - 音声符号化装置および復号装置 - Google Patents
音声符号化装置および復号装置 Download PDFInfo
- Publication number
- JP2004053676A JP2004053676A JP2002207312A JP2002207312A JP2004053676A JP 2004053676 A JP2004053676 A JP 2004053676A JP 2002207312 A JP2002207312 A JP 2002207312A JP 2002207312 A JP2002207312 A JP 2002207312A JP 2004053676 A JP2004053676 A JP 2004053676A
- Authority
- JP
- Japan
- Prior art keywords
- codebook
- signal
- speech
- output
- sampling frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephonic Communication Services (AREA)
Abstract
【課題】モデム信号など音声帯域データ信号の高速伝送が可能で、音声信号伝送モードとの間でシームレスなモード切替が可能な、音声符号化装置および復号装置を得る。
【解決手段】CELP方式を用いた符号器において、信号識別部11により出力される入力信号の識別結果に基づいて、音声信号伝送時には第1の代数符号帳16を、音声帯域データ信号伝送時には第2の代数符号帳18を選択する。第2の代数符号帳18の出力はダウンサンプリング部19により第1の代数符号帳16と同じサンプリング周波数に変換し、合成信号の生成を行う。
【選択図】 図1
【解決手段】CELP方式を用いた符号器において、信号識別部11により出力される入力信号の識別結果に基づいて、音声信号伝送時には第1の代数符号帳16を、音声帯域データ信号伝送時には第2の代数符号帳18を選択する。第2の代数符号帳18の出力はダウンサンプリング部19により第1の代数符号帳16と同じサンプリング周波数に変換し、合成信号の生成を行う。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
この発明は、音声のデジタル有線通信および無線通信において用いられる音声符号化・復号装置において、特にFAX信号、モデム信号などの音声周波数帯域を用いたデータ信号の伝送を目的とする、音声符号化装置および復号装置に関するものである。
【0002】
【従来の技術】
国際長距離通信を実現するためには、人工衛星打ち上げ、海底ケーブルの敷設等が必須であり、初期投資が膨大である。通信コストの低減を果たすためには、回線の有効利用が最も重要な課題となっており、このような課題を解決するため、DCME(Digital Circuit MultiplicationEquipment)のような回線多重化装置が適用される事が多い。図20は、従来のDCMEを適用した国際長距離通信網の構成を示す図である。DCMEは、主に国際回線と国内公衆網との中間に設置され、高能率音声伝送技術を利用し、また、音声およびFAX信号、モデム信号等の音声帯域データ信号の統計多重効果を利用する事により、国際回線を有効利用し通信コストの削減を実現する装置である。
【0003】
図21はDCMEの基本構成を示す図である。図において、501は信号識別部、502は音声検出部、503は割当制御部、504は符号器、505,523はFAX復調伝送部、506は多重化部、508はメッセージ生成部、509,526は切替スイッチ、520はメッセージ解読部、521は多重分離部、522は擬似背景雑音生成部、525は復号器である。
【0004】
次に、DCMEの動作について説明する。
公衆網側のトランク回線より伝送されてきた信号は、信号識別部501において音声信号であるかデータ信号であるか判定される。「音声信号」と判定されたら、音声検出部502において、有音/無音判定を行う。音声検出部502において有音と判定された場合は、割当制御部503において伝送チャネルを割り当てる。その後、各伝送チャネルごとに設置された符号器504において高能率符号化処理を行い、多重化部506を通してベアラ回線に送出する。音声検出部502において無音と判定された場合は、割当制御部503による伝送チャネルの割り当ては行われず、トランク回線からの信号を遮断する。即ち、音声信号については通話における無音時間帯の信号伝送を抑圧し、さらに有音時間帯は高能率音声符号化を行う事によって、高い伝送効率を実現する事が出来る。また、FAX復調伝送部505は、FAX信号を識別して伝送プロトコルを解析する事により、変調されたFAX画像信号を元のデジタル画像信号に復調して伝送する。多重化部506は、音声信号とデータ信号を多重化して伝送路に送出する。
【0005】
符号器504に用いられる高能率音声符号化アルゴリズムには、伝送速度が32kbit/sのADPCM(Adaptive Differential Pulse Code Modulation:ITU−T勧告G.726準拠方式)、同じく16kbit/sのLD−CELP(Low−Delay Code−Excited Linear Prediction:同勧告G.728準拠方式)などがある。さらに近年では、より一層の高能率化を実現するために、伝送速度が8kbit/sのCS−ACELP(Conjugate−Structure Algebraic−Code−Excited Linear Prediction:同勧告G.729準拠方式)が用いられるケースも増えつつある。
【0006】
伝送速度が8kbit/s〜16kbit/s付近の音声符号化アルゴリズムは、少ない情報量で高品質な音声を得る事を目的としているため、例えば人間の発声機構をモデル化し、その特徴パラメータを抽出して符号化処理に用いる構成となっている。以下に事例を挙げて説明する。
【0007】
まず、16kbit/sのLD−CELP方式について説明する。
図22は、16kbit/sのLD−CELP方式を用いた音声符号化装置および復号装置の構成を示すブロック図である。図において、550は音声サンプルを一定時間分蓄積するベクトルバッファ、551,559は、励振信号のベクトル量子化時に参照される符号帳、552,560は乗算器、553,561はそれぞれ552,560に出力する利得値の適応動作を行うバックワード型利得適応処理部、554,562は合成フィルタ、555,563は入力信号に応じて合成フィルタ係数の適応動作を行うバックワード型合成フィルタ適応処理部、556は加算器、557は聴覚重み付けフィルタ、558は符号帳探索部であり、ベクトルバッファ550の出力信号と合成フィルタ554の出力信号との誤差パワーを最小とするサンプルを、符号帳551の中から探索する。
【0008】
次に、8kbit/sのCS−ACELP方式について説明する。
図24および図25は、それぞれ8kbit/sのCS−ACELP方式を用いた音声符号化装置および復号装置の構成を示すブロック図である。
図24を用いて符号化処理について説明する。601は線形予測分析部、602は線形予測係数(LPC)を線スペクトル対(LSP)に変換する、LPC/LSP変換部、603は変換されたLSPを元にベクトル量子化を行い、量子化ベクトルに対応するインデックスを出力する、LSP量子化部、604はLSP量子化部603にて、ベクトル量子化を実行する際に参照する、LSP量子化符号帳、605はLSP量子化部603より出力されたLSP符号帳インデックスを元にLSPを復号する、LSP逆量子化部、606は、LSPをLPCに変換する、LSP/LPC変換部である。また、607は、過去の励振信号を蓄積し、励振信号の周期成分、すなわちピッチ周期の探索に用いられる、適応符号帳、608は励振信号の更新成分(雑音成分)の生成に用いられる、代数符号帳である。CS−ACELP方式では、励振信号の雑音成分の生成には、代数符号帳という、振幅1のパルスを複数本組み合わせて構成されたものが用いられる。609は、励振信号のピッチ周期成分を強調する、ピッチプレフィルタ、610,611は、それぞれ励振信号の周期成分である適応符号帳と、雑音成分である代数符号帳に、量子化された利得を乗ずる乗算器、612は、乗算器610で乗ずる適応符号帳利得、および乗算器611で乗ずる雑音符号帳利得の量子化を行う際に参照する、利得量子化符号帳である。利得の量子化についてもベクトル量子化の手法を用いている。613は、適応符号帳利得のフレーム間予測(移動平均予測:Moving Average)を行うMA予測部、614は、励振信号の周期成分と雑音成分とを加算する加算器、615は、LSP/LPC変換部606で得られた線形予測係数を用いて、励振信号にスペクトル包絡情報をたたみ込み、合成音声信号を出力する合成フィルタ、616は、合成フィルタ615の出力である合成音声信号と、入力音声信号との差を計算する減算部である。全ての代数符号帳、適応符号帳、利得量子化符号帳の組み合わせについて、607〜615を用いて合成音声信号を生成し、減算部616にて逐一入力音声信号との誤差信号を計算する。618は、その誤差信号のパワーを計算し、全合成信号の中から、誤差パワーが最小となる代数符号帳、適応符号帳、利得量子化符号帳の組み合わせを探索し、それぞれのインデックスを出力する、最小自乗誤差探索部である。また、617は、最小自乗誤差の探索を行うに当たり、誤差信号に聴覚的な重み付けを行う聴覚重み付けフィルタである。上記のようにして得られたLSP符号帳インデックス、利得符号帳インデックス、代数符号帳インデックス、適応符号帳インデックスは、多重化部506で多重化され伝送路に出力される。
【0009】
次に図25を用いて復号処理について説明する。多重化部506で多重化され、送信されてきた信号列は、多重分離部521においてLSP符号帳インデックス、利得符号帳インデックス、代数符号帳インデックス、適応符号帳インデックスに分離される。621はLSP量子化符号帳であり、受信したLSP符号帳インデックスを用いてLSPを得るのに用いられる。622は適応符号帳であり、受信した適応符号帳インデックスを用いて、励振信号の周期成分である適応符号帳を得るのに用いられる。623は代数符号帳であり、受信した代数符号帳インデックスを用いて、励振信号の更新成分である雑音符号帳を得るのに用いられる。624はピッチプレフィルタ、627は利得量子化符号帳であり、受信した利得符号帳インデックスを用いて、励振信号の各成分の利得を得る。628はMA予測部、625,626は乗算器、629は励振信号の周期成分と更新成分とを加算する加算器である。630はLSP逆量子化部、631はLSP/LPC変換部、632は合成フィルタ、633は合成フィルタから出力された合成音声信号の特徴周波数成分を強調するポストフィルタである。
【0010】
これらの符号化方式は、人間の声道情報をモデル化した合成フィルタ、すなわち音声のスペクトル包絡に対応する線形フィルタを構成し、人間の声帯音源に相当する符号帳に蓄えられた時系列の信号で駆動する事によって音声を再生するCELP方式に基づいている。図22では、符号帳551について総当りで音声信号を合成し、符号帳探索部558でベクトルバッファ550の出力信号と合成フィルタ554の出力信号との誤差パワーを最小とするサンプルを探索する。音声復号装置へは、この誤差パワーを最小とするサンプルに振られたインデックスを符号化パラメータとして送信する。これらの詳細なアルゴリズムの説明は、ITU−T Recommendation G.728, ”Coding of Speech at 16kbit/s using Low−Delay Code Excited Linear Prediction”、及びITU−T Recommendation G.729, ”Coding of Speech at 8 kbit/s using Conjugate−Structure Algebraic−Code−Excited Linear Prediction(CS−ACELP)”に記載されている。
【0011】
一般的に、FAX信号やモデム信号に代表される音声帯域データ信号(voice−band data:VBD信号)は、通常の音声には無い特有な周波数特性を持つ信号成分を持っている。そのため、VBD信号を音声の高能率伝送に特化された音声符号化方式を用いて伝送する事は通常困難である。
これらVBD信号の高能率伝送を実現するためには、例えば、国際標準に準拠した伝送プロトコルが用いられることの多いFAX信号などの伝送については、図21のFAX復調伝送部505のような、DCME側にFAX通信プロトコルを解析する機能を持たせ、VBD信号を一旦元のデジタル画像データに復調して伝送し、受信側DCMEで再度VBD信号に変調して伝送する復調伝送方式を採用するという方法がある。
【0012】
ところが、FAX信号の伝送の場合、国際標準に準拠していないFAX端末メーカ独自仕様の伝送プロトコルを用いて高能率画像伝送を実現する場合がある。通常、これらメーカ独自仕様の伝送プロトコルは、一般的に開示されていないケースがほとんどであり、DCME等の伝送装置側で伝送プロトコルを解析して復調伝送する手段がなく、独自仕様に対応する復調伝送方式の実装は事実上不可能となっている。また、実装上全てのプロトコルをサポートする事はきわめて難しく、たとえDCME側で実装が可能だったとしても製品コストが高騰し、リーズナブルな価格でユーザに提供する事が出来なくなる。モデム信号によるデータ伝送についても、同様の理由により復調伝送が困難となっている。
【0013】
そこでDCMEでは、復調伝送方式がとれない場合の対策として、モデム信号のようなVBD信号に対しては高ビットレートのチャネル(通常は40kbit/s程度)を適応的に割当て、そのチャネルでVBD信号の伝送を実現する方式をとっている。このVBD信号の高ビットレート伝送を実現するため、DCMEに実装する音声符号化機能も「VBD伝送モード」として高ビットレート動作をサポートしており、伝送する信号の特性に応じて符号化方式をシームレスに切り替えられる構成となっている。例えば、ITU−T標準G.763(32kbit/s DCME)では音声伝送時(以下、「音声伝送モード」と称する)には32kbit/s ADPCMを、VBD信号伝送時には40kbit/s ADPCMを使用するよう勧告されている。また、ITU−T勧告G.767(16kbit/s DCME)では、音声伝送時には16kbit/s LD−CELPを、VBD伝送時には40kbit/s LD−CELP(同勧告G.728 Annex J)を使用するよう勧告されている。
【0014】
ところが、これらの符号化方式では、音声伝送モードとVBD伝送モードの切り替え時にシームレスな符号化速度の変更を実現するために、さらには実装上の観点からもVBD伝送モードにおける符号化アルゴリズムを音声伝送モードにおける音声に特化した基本的な符号化アルゴリズムから変えてない。このため、VBD信号を高能率に符号化し伝送するという観点では必ずしも最適な符号化方式であるとはいえない。
【0015】
ここで、ITU−T勧告G.767(16kbit/s DCME)による、音声伝送時には16kbit/s LD−CELPを、VBD伝送時には40kbit/s LD−CELP(同勧告G.728 Annex J)を用いた場合を例として説明する。
図23は、40kbit/s LD−CELP方式を用いた音声符号化装置および復号装置の構成を示すブロック図である。図において、570は、合成フィルタ554とちょうど逆の周波数特性を持つ逆合成フィルタ、571はトレリス符号量子化(TCQ:Trellis Coded Quantization)に基づく差分信号量子化部、572は、差分信号量子化部571が量子化時に参照する符号帳、573は、符号化データからもとの残差信号を再生する、逆量子化部である。その他、図22と同一の番号を記した構成要素は、同一の機能を持つ構成要素である。
【0016】
40kbit/sLD−CELP方式の音声符号化装置、復号装置の、図22で示した16kbit/s LD−CELP方式のそれとの主な違いは、符号帳探索の手法にトレリス符号量子化(TCQ)に基づく差分信号量子化部571を適用していることにある。TCQ手法は、VBDモードの時に限り、合成による分析(A−b−S)法に代わって40kbit/sLD−CELPの符号帳探索に用いられる。一方、符号化速度の変更をシームレスに実現するため、VBDモードにおいて用いられるバックワード型合成フィルタ適応処理部555およびバックワード型利得適応処理部553は、音声モードにおいて用いられるものと同一のものを用いている。さらに、適応周期についても、音声モードとVBDモードの両方に用いられる。なお、詳細なアルゴリズムの説明は、ITU−T Recommendation G.728 Annex J, ”Variable bit−rate operation of LD−CELP mainly for voiceband−data applications in DCME”に記載されている。このように、40kbit/s LD−CELPでは、音声のスペクトル概形を形成するバックワード形合成フィルタの枠組みは残している。
【0017】
従って、高ビットレート符号化アルゴリズムを用いたとしても、その伝送効率は決して高いとはいえない。例えば、40kbit/s ADPCM(ITU−T勧告G.726準拠方式)のVBD信号伝送能力は、9600bit/sが限界であるし、また、40kbit/s LD−CELP(同勧告G.728 Annex J準拠方式)については、19200bit/sのVBD信号伝送が可能であるものの、通信回線の外乱による伝送品質の劣化などを考慮すると、その伝送速度は保証されるものではなく、一般的には9600〜14400kbit/s程度が限界と言われている。即ち、VBD伝送モードについては、40kbit/sの伝送路に対し、高々10kbit/s程度のデータ信号しか伝送できる能力がなくきわめて効率が悪い。
【0018】
一方、近年、高速データ伝送への需要が爆発的に高まってきており、例えばデータ伝送速度が28.8kbit/sの速度を持つ、同勧告V.34準拠方式などの高速モデム信号を用いる割合が増加してきている。しかしながら、DCMEのVBD伝送モードには上記で示したように高速VBD信号の伝送能力がないため、フォールバックなどの手段を用いて低速でデータ転送を行わざるを得なかった。このため、本来通信端末が持っている高速データ伝送の能力を発揮できず、通信料金がかさむ結果となり、ユーザに金銭的負担を掛けてしまうなどの問題点があった。
【0019】
このような問題を解決するひとつの手段として、例えば、特開平11−205485号公報で示されているような方法が検討されている。これは、VBD信号をクリアチャネル(64kbit/s PCM方式)を用いて伝送するものである。この方式を用いる事により、例えば、ITU−T勧告V.90のような高速モデム信号(伝送速度は最高56kbit/s)に対しても伝送が可能となるという利点があるが、中速度のVBD信号伝送を考えた場合、64kbit/sのチャネルに高々20〜30kbit/s程度のデータ信号しか伝送していない事となる。28.8kbit/s以下の中速度モデムも減りつつあるとは言え依然として広く普及しており、DCMEにおいてはそれらのデータ通信チャネルも収容する必要があることから、高能率伝送という観点で望ましくない。
【0020】
【発明が解決しようとする課題】
従来の音声符号化装置および復号装置は以上のように構成されているので、FAX/モデム信号などのVBD信号の伝送において復調伝送が出来ない場合には、VBD信号に高ビットレートのチャネルを割り当てて伝送する方式をとっているが、符号化速度をシームレスに切り替えるために、符号化アルゴリズムの基本部分を音声信号に用いているものと同一にしているため、必ずしもVBD信号の高能率符号化に適した方法ではないという課題があった。
【0021】
この発明は上記のような課題を解決するためになされたもので、FAX/モデム信号などVBD信号の高速伝送が可能で、かつ、音声信号伝送モードとVBD信号伝送モードとの間でシームレスなモード切替が可能な、音声符号化装置および復号装置を得ることを目的とする。
【0022】
【課題を解決するための手段】
この発明に係る音声符号化装置は、出力のサンプリング周波数が第1の雑音符号帳よりも高い第2の雑音符号帳と、第2の雑音符号帳の出力を第1の雑音符号帳の出力と同じサンプリング周波数に変換する第1のサンプリング周波数変換部とを備え、入力信号が音声帯域データ信号である場合には、第1の雑音符号帳の出力に代えて第1のサンプリング周波数変換部により変換された第2の雑音符号帳の出力をパラメータとして用いるものである。
【0023】
この発明に係る音声符号化装置は、音声帯域データ信号伝送に対応したLSP固定パターンを備え、音声帯域データ信号伝送時には、LSP量子化符号帳の出力に代えてLSP固定パターンを用いて生成した出力をパラメータとして用い、さらに送信信号中にLSP量子化符号帳の情報を含めず、その分のビット数を第2の雑音符号帳の情報に割り当てるものである。
【0024】
この発明に係る音声符号化装置は、音声帯域データ信号伝送時には、聴覚重み付けフィルタを無効にするものである。
【0025】
この発明に係る音声符号化装置は、音声帯域データ信号伝送時には、送信信号中に適応符号帳の情報を含めずその分のビット数を第2の雑音符号帳の情報に割り当てるものである。
【0026】
この発明に係る音声符号化装置は、音声帯域データ信号伝送時には、利得量子化符号帳の更新周期を短くするものである。
【0027】
この発明に係る音声符号化装置は、音声帯域データ信号伝送に対応した第2の利得量子化符号帳を備え、音声帯域データ信号伝送時には、利得量子化符号帳に代えて第2の利得量子化符号帳の出力をパラメータとして用いるものである。
【0028】
この発明に係る音声符号化装置は、合成音声信号と入力音声信号との誤差が最小となる最適なパラメータの組み合わせを探索する最小自乗誤差探索部により出力される誤差の最小値に基づいて、入力信号が音声信号であるか音声帯域データ信号であるかを判断する信号識別部を備えたものである。
【0029】
この発明に係る音声符号化装置は、出力のサンプリング周波数が第1の雑音符号帳よりも高く、それぞれが第2の雑音符号帳とは異なった値を持つ複数の音声帯域データ信号対応雑音符号帳と、複数の音声帯域データ信号対応雑音符号帳の出力を第1の雑音符号帳の出力と同じサンプリング周波数に変換する複数のサンプリング周波数変換部を備え、音声帯域データ伝送時には、入力信号の特性に応じて複数の音声帯域データ信号対応雑音符号帳または第2の雑音符号帳から1つを選択し、その出力を複数のサンプリング周波数変換部または第1のサンプリング周波数変換部により変換してパラメータとして用いるものである。
【0030】
この発明に係る音声符号化装置は、入力信号のサンプリング周波数を第2の雑音符号帳のサンプリング周波数に変換する第1のサンプリング周波数上昇部と、第1の雑音符号帳の出力を第2の雑音符号帳の出力と同じサンプリング周波数に変換する第2のサンプリング周波数上昇部とを備えたものである。
【0031】
この発明に係る音声符号化装置は、音声帯域データ信号伝送時には、入力信号の量子化ビット数を代数符号帳の量子化ビット数に合わせて落とす、量子化ビット縮退部を備えたものである。
【0032】
この発明に係る音声復号装置は、出力のサンプリング周波数が第1の雑音符号帳よりも高い第2の雑音符号帳と、第2の雑音符号帳の出力を第1の雑音符号帳の出力と同じサンプリング周波数に変換する第1のサンプリング周波数変換部とを備え、入力信号が音声帯域データ信号である場合には、第1の雑音符号帳の出力に代えて第1のサンプリング周波数変換部により変換された第2の雑音符号帳の出力をパラメータとして用いるものである。
【0033】
この発明に係る音声復号装置は、音声帯域データ信号伝送に対応したLSP固定パターンを備え、音声帯域データ信号伝送時には、LSP量子化符号帳の情報が含まれない受信信号を受信し、LSP固定パターンを用いて生成した出力をLSP量子化符号帳の出力に代えてパラメータとして用いるものである。
【0034】
この発明に係る音声復号装置は、音声帯域データ信号伝送時には、ポストフィルタを無効にするものである。
【0035】
この発明に係る音声復号装置は、音声帯域データ信号伝送時には、適応符号帳の情報が含まれない受信信号を受信し、復号処理を行うものである。
【0036】
この発明に係る音声復号装置は、音声帯域データ信号伝送時には、利得量子化符号帳の更新周期を短くするものである。
【0037】
この発明に係る音声復号装置は、音声帯域データ信号伝送に対応した第2の利得量子化符号帳を備え、音声帯域データ信号伝送時には、利得量子化符号帳に代えて第2の利得量子化符号帳の出力をパラメータとして用いるものである。
【0038】
この発明に係る音声復号装置は、出力のサンプリング周波数が第1の雑音符号帳よりも高く、それぞれが第2の雑音符号帳とは異なった値を持つ複数の音声帯域データ信号対応雑音符号帳と、複数の音声帯域データ信号対応雑音符号帳の出力を第1の雑音符号帳の出力と同じサンプリング周波数に変換する複数のサンプリング周波数変換部を備え、音声帯域データ伝送時には、入力信号の特性に応じて複数の音声帯域データ信号対応雑音符号帳または第2の雑音符号帳から1つを選択し、その出力を複数のサンプリング周波数変換部または第1のサンプリング周波数変換部により変換してパラメータとして用いるものである。
【0039】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態1.
実施の形態1では、音声符号化装置および復号装置に用いる低ビットレート音声符号化方式として、ITU−T Recommendation G.729, ”Coding of Speech at 8kbit/s Using Conjugate−Structure Algebraic−Code−Excited Linear−Prediction(CS−ACELP)”を用いている。CS−ACELP方式においては、雑音符号帳には代数符号帳が用いられ、ここでも雑音符号帳には代数符号帳が用いられることを前提とする。
【0040】
図1は、この発明の実施の形態1による音声符号化装置の構成を示すブロック図である。2は多重化部、3は割当制御部、7は伝送路、8は線形予測分析部、9はLPC/LSP変換部、10はLSP量子化部、11は信号識別部、12はLSP量子化符号帳、13はLSP逆量子化部、14はLSP/LPC変換部、15は適応符号帳、16は第1の代数符号帳(第1の雑音符号帳)、17はピッチプレフィルタ、18は第2の代数符号帳(第2の雑音符号帳)、19はダウンサンプリング部(第1のサンプリング周波数変換部)、20は切替スイッチ、21,22は乗算器、23は利得量子化符号帳、24はMA予測部、25は加算器、26は合成フィルタ、27は減算器、28は聴覚重み付けフィルタ、29は最小自乗誤差探索部である。
【0041】
また図2は、この発明の実施の形態1による音声復号装置の構成を示すブロック図である。図において、5は多重分離部、6はメッセージ解読部、30はLSP量子化符号帳、31は適応符号帳、32は第1の代数符号帳(第1の雑音符号帳)、33はピッチプレフィルタ、34は第2の代数符号帳(第2の雑音符号帳)、35はダウンサンプリング部(第1のサンプリング周波数変換部)、36,37は切替スイッチ、38,39は乗算器、40は利得量子化符号帳、41はMA予測部、42は加算器、43はLSP逆量子化部、44はLSP/LPC変換部、45は合成フィルタ、46はポストフィルタである。
【0042】
次に動作について説明する。
実施の形態1によるデータ信号の伝送は、ITU−T勧告V.8に準拠したデータ通信開始手順に従って始められる。なお、この手順の詳細はITU−T Recommendation V.8,”Procedures for starting sessions of data transmission over the public switched telephone network”に述べられている。
【0043】
まず、音声符号化装置による音声符号化処理について図1を用いて説明する。実施の形態1による音声符号化装置の基本的な動作は、従来例の図24で示した音声符号化装置と同様である。ここでは、構成および動作が異なる部分について説明する。
第2の代数符号帳18の出力は、第1の代数符号帳16の出力よりもサンプリング周波数が高くなっている。ダウンサンプリング部19は、第2の代数符号帳18の出力を第1の代数符号帳16の出力と同じサンプリング周波数に変換する。切替スイッチ20は、信号識別部11より出力された識別結果に基づき、第1の代数符号帳16、第2の代数符号帳18どちらかに接続される。
信号識別部11は、例えば、データ通信開始手順において必須である受信側モデムのアンサートーンである2100Hzのトーン信号(振幅変調を受けている)を識別する機能を備えている。信号識別部11は、音声符号化装置に入力される信号の中に2100Hzのトーン信号の有無を常に監視し、2100Hzトーン信号を検出したら、DCME本体または割当制御部3に信号識別結果を送信し、40kbit/sチャネルへのアサイメント要求を出すとともに、切替スイッチ20へも信号識別結果を送出する。この信号識別結果によって切替スイッチ20が20B側に接続され、音声符号化装置はVBD伝送モードへ遷移する。
【0044】
次に、音声復号装置による音声復号処理について図2を用いて説明する。
復号装置の基本的な動作についても、従来例の図25で示した音声復号装置と同様であるので、構成および動作が異なる部分について説明する。
第2の代数符号帳34は、第2の代数符号帳18と同一の符号帳であり、受信した代数符号帳インデックスを用いて、励振信号の更新成分すなわち雑音成分を得るのに用いられる。切替スイッチ36,37は、受信した信号識別結果に基づき第1の代数符号帳32または第2の代数符号帳34の選択を行う。
ダウンサンプリング部35は、ダウンサンプリング部19と同様に、第2の代数符号帳34の出力を第1の代数符号帳32の出力と同じサンプリング周波数に変換する。
【0045】
なお、データ通信中は、送信側から常にデータ信号が送出されており無音になる事は無いが、データ送信手順終了後、しばらく無音区間が続くことがある。信号識別部11は、この無音区間を検出する機能も備えており、送信信号で、少なくともアンサートーン検出待ちのポーズ時間よりも長い所定の時間継続する無音区間を検出したら、DCME本体または割当制御部3に信号識別結果を送信し、8kbit/sチャネルへのアサイメント要求を出すとともに、切替スイッチ20へも信号識別結果を送出する。この信号識別結果によって切替スイッチ20が20A側に接続され、音声符号化装置を音声伝送モードへ遷移させる事が出来る。
【0046】
次に、各伝送モードにおける動作を説明する。
まず、音声伝送モードにおいては切替スイッチ20を20A側に接続し、第1の代数符号帳16が選択される。音声符号化装置へ入力された音声信号は、この第1の代数符号帳16を用いて高能率符号化処理される。音声伝送モードで用いられる第1の代数符号帳16は、例えば、ITU−T勧告G.729で規定された代数符号帳を用いることができる。第1の代数符号帳16のサンプリング周波数は8kHzであり、このときの符号化処理は、ITU−T勧告G.729にて規定された処理と全く同一である。
【0047】
また、VBD伝送モードにおいては、切替スイッチ20を20B側に接続し、第2の代数符号帳18が選択される。VBD伝送モードで用いられる第2の代数符号帳18は、8kHzよりも高いサンプリング周波数であることが必要であり、ここではサンプリング周波数を48kHzとする。モデム信号の伝送帯域は300Hz〜3400Hzであるためサンプリング周波数は8kHzで十分であるが、代数符号帳は単一の振幅しか持たず、量子化ビット数が1ビットのパルスの組み合わせであるので、代数符号帳を用いて位相変調および振幅変調を受けているモデム信号をあえて表現しようとすると、量子化ステップが少ないことによりSN比が著しく低下する。一方、周波数帯域が300Hz〜3400Hzであるモデム信号をディジタル信号で表現するためには、1サンプル当たりの量子化ステップ数が充分与えられていれば、通常、サンプリング周波数は8kHzで充分である。ところが、第2の代数符号帳18は、8kHzよりも高いサンプリング周波数で表現されているため、量子化ノイズのパワーを広い帯域に拡散させる効果が得られ、必要な帯域(モデム信号の場合は前出の300Hz〜3400Hz)のSN比を相対的に低減させることが出来る。このため各サンプルを表現するためのビット数が少なく量子化ステップが粗くても、高いSN比でモデム信号を表現することが可能である。
【0048】
第2の代数符号帳18から出力されるオーバサンプリングされたパルス列は、ダウンサンプリング部19によりサンプリング周波数8kHzの信号に変換される。この信号が切替スイッチ20を経由して、乗算器22にて量子化利得を乗ずる。さらに、加算器25にて励振信号の周期成分を加え、合成フィルタ26にてスペクトル包絡情報を畳み込んで合成信号を生成する。ここで生成された合成信号を入力されたVBD信号と比較し、最小自乗誤差探索部29において誤差パワーを計算する。
この動作を、第2の代数符号帳18で許容されているパルス列の全組み合わせ、および利得符号帳、適応符号帳との組み合わせ全てについて繰り返し、その中で誤差パワーを最小とする第2の代数符号帳18、利得符号帳、適応符号帳の組み合わせを探索する。誤差パワー最小とする組み合わせのインデックスを最小自乗誤差探索部29より出力し、多重化部2にてLSP符号帳インデックスと併せて多重化し、伝送路(ベアラ回線)に出力する。また、信号識別部11の出力である信号識別結果は、符号化モード情報として割当制御部3に送られる。
【0049】
一方、音声復号装置では、伝送路7より受信した符号化列が多重分離部5で各符号化パラメータに分離されると、DCME本体またはメッセージ解読部6からアサイメント情報を貰って切替スイッチ36および切替スイッチ37を動作させる。音声伝送用の低速チャネルがアサインされている音声伝送モードでは、切替スイッチ36を36A側に、切替スイッチ37を37A側にそれぞれ接続し、第1の代数符号帳32を選択する。ここでは、第1の代数符号帳32はITU−T勧告G.729で規定されたものと同一であり、このモードでの復号処理は同勧告で規定された処理と全く同一である。
【0050】
また、VBD伝送モードにおいては、切替スイッチ36を36B側に、切替スイッチ37を37B側にそれぞれ接続し、第2の代数符号帳34が選択される。多重分離部5にて分離された代数符号帳インデックスに基づき第2の代数符号帳34を参照することにより、48kbit/sにオーバサンプリングされた振幅1のパルス列が出力される。ダウンサンプリング部35で48kbit/sから8kbit/sにサンプリング周波数が変換され、励振信号の更新成分が得られる。同時に多重分離部5で得られた利得符号帳インデックスに基づいて、利得量子化符号帳40を参照することにより、励振信号の更新成分、および周期成分に乗ずる利得値を得る。乗算器39にて、励振信号の更新成分に利得を乗じる。一方、励振信号の周期成分は、多重分離部5で得られた適応符号帳インデックスを元に適応符号帳31を参照して得られ、乗算器38で利得が乗じられる。加算器42にて更新成分と周期成分とを加算し、合成フィルタの励振信号を得る。また、多重分離部5で得られたLSP符号帳インデックスを元に、LSP量子化符号帳30を参照し、LSP逆量子化部43にてLSPパラメータを得る。LSPパラメータはLSP/LPC変換部44にてLPCに変換する。これは合成フィルタ45の係数として用いる。加算器42で得られた励振信号は、合成フィルタ45においてスペクトル包絡情報を畳み込み、復号音声が得られる。
【0051】
以上のように、この実施の形態1によれば、信号識別部11により出力される信号識別結果に基づいて第1の代数符号帳16または第2の代数符号帳18を選択し、第2の代数符号帳18の出力はダウンサンプリング部19により第1の代数符号帳と同じサンプリング周波数に変換するようにしたので、全体の符号化および復号アルゴリズムの枠組みを変えずにモード切替を行っているため、モード切替時に音声の瞬断やクリック音の発生をなくすことができ、シームレスな切替が可能な音声符号化装置および復号装置を得ることが出来る。
【0052】
また、この実施の形態1によれば、ブロック構成上は2種類の代数符号帳を持っているように見えるが、例えば本符号化方式をDSPを用いてソフトウェアで実現してもよい。この場合は、サンプリングレートが異なること、サンプリング変換器を追加すること以外はほぼ同じプログラムフローで実現することも可能であるため、実装上有利であるという利点もある。
【0053】
実施の形態2.
実施の形態2では、実施の形態1と同様に、音声符号化方式として、ITU−T Recommendation G.729, ”Coding of Speech at 8kbit/s Using Conjugate−Structure Algebraic−Code−Excited Linear−Prediction(CS−ACELP)”が用いられる。
図3は、この発明の実施の形態2による音声符号化装置の構成を示すブロック図である。図1と同一の符号は、同一の機能を持つ構成要素を示している。図において、120,122は切替スイッチ、121はLSP固定パターンである。切替スイッチ120,122は、信号識別部11の出力である信号識別結果に基づき端子の切り替えを行う。LSP固定パターン121は、特定のLSPパターンを記憶保持するメモリである。
【0054】
また、図4は、この発明の実施の形態2による音声復号装置の構成を示すブロック図である。図2と同一の符号は、同一の機能を持つ構成要素を示している。図において、123は、信号識別結果に基づき端子の切替を行う切替スイッチ、124は、LSP固定パターン121と同一の内容を保持するメモリである。
【0055】
実施の形態2では、信号識別部11の出力である信号識別結果から伝送モードを判定することにより、LSP符号帳インデックスの送信の有無を切り替えられるようにしている。
【0056】
各伝送モードにおける動作を説明する。
音声伝送モードにおいては、切替スイッチ120を120A側に、切替スイッチ122を122A側に接続し、実施の形態1による音声伝送モードにおいての符号化処理と同様の処理を行う。
【0057】
また、VBD伝送モードにおいては、切替スイッチ120を120B側に、切替スイッチ122を122B側に接続する。切替スイッチ122を122B側に接続したことにより、線形予測分析及びLSP量子化処理は実行されず、LSP符号帳インデックスは多重化部2に出力されない。また、切替スイッチ120を120B側に接続したことにより、LSP逆量子化部13は、LSP固定パターン121より予め用意されたLSP固定パターンを抽出し、LSP/LPC変換部14にてLPCに変換する。得られたLPCは、合成フィルタ26のフィルタ係数として用いられる。なお、その他の音声符号化装置の各部の動作は、実施の形態1でのVBD伝送モードにおける動作と同一である。
【0058】
LSP固定パターンには、例えば、モデム信号の特徴であるフラットなスペクトル包絡特性を表現するようなものが含まれている。LSPは、各次数の値の間隔の疎密でスペクトル包絡の山と谷をそれぞれ表現しているため、フラットなスペクトル包絡特性を示すLSPのパターンは、各次数の値の間隔を等間隔にすることによって容易に実現できる。
【0059】
そこで、VBD伝送モードにおいては、モデム信号のスペクトル包絡特性が常にフラットと見なして、先に述べたLSP固定パターンを用いることとする。これによりLSPは一意に決まるため、LSP符号帳インデックスは送信する必要がない。図5は、多重化部2から出力される符号化ビット列を示す図である。音声伝送モードには、ITU−T勧告G.729に準拠した符号化方式を用いるものとすると、多重化部2から出力される符号化ビット列は、図中(a)で示されるフォーマットとなる。図中(b)は、実施の形態1においてVBD伝送モードの時に多重化部2から出力される符号化ビット列のフォーマットである。通常、モデム信号は自己相関の小さな信号であるため、VBD伝送モードにおいては、更新成分を表現する代数符号帳インデックスにより多くのビットを割り当てることで伝送特性をよくすることが出来る。図中(c)は、実施の形態2においてVBD伝送モードの時に多重化部2から出力される符号化ビット列のフォーマットである。実施の形態2では、LSP符号帳インデックスを送らないようにしたため、その分のビットを代数符号帳インデックスに割り当てることが出来るので、同じ伝送ビットレートで、実施の形態1よりもVBDの伝送特性をさらに向上させることが出来る。
【0060】
次に、音声復号装置の動作について説明する。受信した信号識別結果に基づき伝送モードを判定する。音声伝送モードにおいては、切替スイッチ123は123A側に接続し、実施の形態1における音声伝送モードと全く同様の復号処理を行う。実施の形態2では、VBD伝送モードにおいてはLSP符号帳インデックスは受信した符号ビット列中には含まれていない。切替スイッチ123は123B側に接続され、LSP逆量子化部43は、LSP固定パターン124から予め用意されたLSP固定パターンを抽出し、LSP/LPC変換部44にてLPCに変換する。こうして得られたLPCは、合成フィルタ45のフィルタ係数として用いられる。それ以外の音声復号装置の動作は、実施の形態1におけるVBD伝送モードでの音声復号装置の動作と同一である。
【0061】
以上のように、この実施の形態2によれば、スペクトル包絡情報がほぼ一意に決まるVBD伝送モードでは、LSP固定パターンを用いてLPCを取得し、また、LSP符号帳インデックスは、送信する符号化ビット列に含めないようにし、その分の情報量を代数符号帳インデックスに割り当てるようにしたので、VBD伝送モードでの伝送特性がさらに向上するという効果が得られる。
【0062】
実施の形態3.
実施の形態3では、実施の形態1と同様に、音声符号化方式として、ITU−T Recommendation G.729, ”Coding of Speech at 8kbit/s Using Conjugate−Structure Algebraic−Code−Excited Linear−Prediction(CS−ACELP)”が用いられる。
図6は、この発明の実施の形態3による音声符号化装置の構成を示すブロック図である。図1と同一の符号は、同一の機能を持つ構成要素を示している。図において、130,131は、信号識別部11の判定結果に基づき端子の切替を行う切替スイッチである。
【0063】
また、図7は、この発明の実施の形態3による音声復号装置の構成を示すブロック図である。図2と同一の符号は、同一の機能を持つ構成要素を示している。図において、132,133は、それぞれ信号識別結果に基づき端子の切替を行う切替スイッチである。
【0064】
次に動作について説明する。
実施の形態3では、信号識別部11の判定結果に応じて、音声符号化装置の聴覚重み付けフィルタ28、および音声復号装置のポストフィルタ46をバイパス出来るようになっている。音声伝送モードにおいては、音声符号化装置では切替スイッチ130を130A側に、切替スイッチ131を131A側に接続し、実施の形態1による音声伝送モードにおける音声符号化と全く同様の処理を行う。また、VBD伝送モードにおいては、切替スイッチ130を130B側に、切替スイッチ131を131B側に接続する。すなわち、聴覚重み付けフィルタ処理をバイパスする。それ以外の音声符号化装置の各部の動作は、実施の形態1によるVBD伝送モードにおける動作と同一である。
【0065】
音声復号装置については、音声伝送モードにおいては、切替スイッチ132を132A側に、切替スイッチ133を133A側に接続し、実施の形態1による音声伝送モードの時の復号処理と同様の処理を行う。VBD伝送モードにおいては、切替スイッチ132を132B側に、切替スイッチ133を133B側にそれぞれ接続し、ポストフィルタをバイパスする。それ以外の音声復号装置の各部の動作は、実施の形態1によるVBD伝送モードにおける動作と同一である。
【0066】
VBD伝送モードでは、スペクトル包絡特性がほぼフラットとなるため、スペクトル包絡特性に応じて誤差パワーの重み付けを行う聴覚重み付けフィルタ28の効果は小さい。同様の理由で、スペクトルピークの強調を行うポストフィルタ46の効果も小さい。逆に、入力信号との誤差パワーを最小とする信号を合成フィルタ45で合成したにもかかわらず、ポストフィルタ46でさらにその信号を加工してしまうことになるため、SN比が劣化する恐れがある。
【0067】
以上のように、この実施の形態3によれば、音声符号化装置において聴覚重み付けフィルタ28をバイパスし、音声復号装置においてポストフィルタ46をバイパスすることによりフィルタ処理およびそのフィルタ係数の適応処理を省略することができるため、処理が簡略化されるという効果が得られる。また、ポストフィルタ46をバイパスすることで、より良好なVBD伝送を実現出来るという効果がある。
【0068】
実施の形態4.
実施の形態4では、実施の形態1と同様に、音声符号化方式として、ITU−T Recommendation G.729, ”Coding of Speech at 8kbit/s Using Conjugate−Structure Algebraic−Code−Excited Linear−Prediction(CS−ACELP)”が用いられる。
図8は、この発明の実施の形態4による音声符号化装置の構成を示すブロック図である。図1または図3と同一の符号は、同一の機能を持つ構成要素を示している。図において、140,142は、信号識別部11の判定結果に基づき端子の切替を行う切替スイッチである。
【0069】
また、図9は、この発明の実施の形態4による音声復号装置の構成を示すブロック図である。図2または図4と同一の符号は、同一の機能を持つ構成要素を示している。図において、141は受信した信号識別結果に基づき端子の切替を行う切替スイッチである。
【0070】
次に動作について説明する。
実施の形態4においては、音声符号化装置は、信号識別部11が出力する信号識別結果に応じて適応符号帳インデックスの送信の有無を切り替える。音声伝送モードにおいては、切替スイッチ140を140A側に、切替スイッチ142を142A側に接続し、実施の形態2による音声伝送モードでの符号化処理と同様の処理を行う。
【0071】
また、VBD伝送モードにおいては、切替スイッチ140を140B側に、切替スイッチ142を142B側に接続する。これにより、適応符号帳の探索処理は実行されず、励振信号の周期成分は0になる。VBDは繰り返し成分の少ない信号であるため、励振信号を更新成分のみで表現することも可能である。但し、VBD伝送モードから音声伝送モードへ復帰する時に備えて、VBD伝送モードにおいても、適応符号帳の更新動作は継続する。それ以外の音声符号化装置の各部の動作は、実施の形態2によるVBD伝送モードにおける音声符号化装置の符号化処理と同一である。
【0072】
また、このような構成とすることで、VBD伝送モードにおいては適応符号帳インデックスを送信する必要がなくなる。実施の形態4によるVBD伝送モードにおいて多重化部2から出力される符号化ビット列を図5(d)に示す。実施の形態2で説明したように、通常、モデム信号は自己相関の小さな信号であるため、VBD伝送モードにおいては、更新成分を表現する代数符号帳インデックスにより多くのビットを割り当てると伝送特性がよくなる。さらに実施の形態4では、適応符号帳インデックスを送信しないようにしたため、その分を代数符号帳インデックスで補完することにより、VBDの伝送特性をさらに向上させることが出来る。
【0073】
また、音声復号装置は、音声伝送モードにおいては、切替スイッチ141を141A側に接続し、実施の形態2による音声伝送モードでの動作と同様の復号処理を行う。受信した信号識別結果によりVBD伝送モードと判定された時は、切替スイッチ141を141B側に接続する。この場合、適応符号帳インデックスは受信した符号化ビット列中に含まれないので、励振信号の周期成分は0とし、更新成分のみで励振信号を構成し、合成フィルタ45に入力する。但し、音声符号化装置と同様、励振信号のフィードバックによる適応符号帳の更新動作はVBD伝送モードにおいても継続する。それ以外の音声復号装置の動作は、実施の形態2によるVBD伝送モードにおける復号処理と同一である。
【0074】
以上のように、この実施の形態4によれば、繰り返し成分の寄与が少ないVBD伝送モードで適応符号帳情報を送らない構成としたので、その分の情報量を代数符号帳インデックスに割り当てることが可能となるため、VBDの伝送特性を向上出来るという効果が得られる。また、処理負荷の大きい適応符号帳探索処理を省略できるため、より少ない処理負荷で実施の形態1と同様の効果を得ることができる。
【0075】
実施の形態5.
実施の形態5による音声符号化装置および復号装置の構成は、図1および図2で示された実施の形態1によるものと同様であるが、実施の形態5ではVBD伝送モードにおいて、サブフレームの周期を短くしている。
【0076】
図10は、実施の形態5における符号化処理単位を時系列で表現したものであり、図11は符号化フレーム構成を示したものである。それぞれ、図中(a)は音声伝送モード、(b)はVBD伝送モードにおけるものである。
【0077】
ITU−T勧告G.729の符号化フレーム長は10msecであるが、信号の微妙な変化を表現するためにサブフレームを設けて、適応符号帳インデックス、代数符号帳インデックス、利得符号帳インデックスの3つについては、サブフレーム単位で符号化を行っている。音声信号の場合、時間的な変化は緩やかなので、サブフレーム(5msec)区間内ではほぼ定常的と見なせるのに対し、VBDでは、伝送しようとするデジタル信号に応じて振幅変調を掛けているため、利得変化が音声信号に比べて激しい。そこで、サブフレーム周期を短くして、激しい利得変化に追従させることでSN比の向上を実現することができる。
【0078】
以上のように、この実施の形態5によれば、VBD伝送モードにおいては、利得符号帳のサブフレーム周期を短くしたことにより、VBDのSN比を向上出来るという効果が得られる。
【0079】
また、実施の形態5による音声符号化装置および復号装置は、実施の形態2から実施の形態4で示したものと同様の構成であってもよい。
【0080】
実施の形態6.
実施の形態6では、実施の形態1と同様に、音声符号化方式としてITU−T Recommendation G.729, ”Coding of Speech at 8kbit/s Using Conjugate−StructureAlgebraic−Code−Excited Linear−Prediction(CS−ACELP)”が用いられる。
図12は、この発明の実施の形態6による音声符号化装置の構成を示すブロック図である。図1または図8と同一の符号は、同一の機能を持つ構成要素を示している。図において、150は、信号識別部11の出力の信号識別結果に基づき端子の切替を行う切替スイッチ、151はVBD伝送モードにおいて使用することを目的とした第2の利得量子化符号帳である。
【0081】
また、図13は実施の形態6による音声復号装置の構成を示すブロック図である。図2または図9と同一の符号は、同一の機能を持つ構成要素を示している。図において152は、受信した信号識別結果に基づいて端子の切替を行う切替スイッチ、153は、第2の利得量子化符号帳151と同一の、第2の利得量子化符号帳である。
【0082】
実施の形態6では、信号識別部11が出力する信号識別結果に基づいて、使用する利得量子化符号帳を切り替えられるようになっている。音声伝送モードにおいては、音声符号化装置では切替スイッチ150を150A側に接続し、第1の利得量子化符号帳23を選択することにより実施の形態4による音声伝送モードでの符号化処理と同様の動作を行う。また、VBD伝送モードにおいては、切替スイッチ150を150B側に接続し、第2の利得量子化符号帳151を使用する。それ以外の音声符号化装置の各部の動作は、実施の形態4によるVBD伝送モードでの動作と同一である。
【0083】
図14は、VBDであるモデム信号の波形と音声信号波形の一例を示したものである。図のように、モデム信号は音声信号に比べ、ダイナミックレンジが狭くなっている。音声伝送モードにおいて使用する第1の利得量子化符号帳23は、音声信号のもつ広いダイナミックレンジをカバーするためにその分量子化ステップを粗くしている。一方、VBD伝送モードにおいては広いダイナミックレンジをカバーする必要がないため、第2の利得量子化符号帳151は第1の利得量子化符号帳23よりも量子化ステップを細かくし、SN比の向上を図れるような作りになっている。
【0084】
また、音声復号装置については、音声伝送モードにおいては、切替スイッチ152を152A側に接続し、第1の利得量子化符号帳40を選択することで、実施の形態4による音声伝送モードでの復号処理と同様の動作を行う。VBD伝送モードにおいては、切替スイッチ152を152B側に接続し、受信した利得符号帳インデックスを元に利得値を抽出する動作においては、第2の利得量子化符号帳153を参照するようにする。それ以外の音声復号装置の各部の動作は、実施の形態4によるVBD伝送モードにおける動作と同一である。
【0085】
以上のように、この実施の形態6によれば、ダイナミックレンジの狭いVBD伝送モードにおいて利得量子化符号帳をVBDに適したものに切り替える構成としたので、SN比が向上し、VBDの伝送特性を向上させるという効果が得られる。
【0086】
実施の形態7.
図15は、この発明の実施の形態7による音声符号化装置の構成を示すブロック図である。図1と同一の符号は、同一の機能を持つ構成要素を示している。160は、信号識別部(信号特性識別部)であり、最小自乗誤差探索部29の計算結果を用いて、信号識別結果を出力する。
実施の形態7による音声符号化装置、音声復号装置の各モードでの動作は、信号識別部がモードの判定のために用いる信号が信号識別部11と異なる以外は、実施の形態1に示した音声符号化装置、音声復号装置と同一である。
【0087】
音声符号化装置の動作について説明する。
まず、音声伝送モードにて符号化処理を仮実行する。符号化処理を実行することで、最小自乗誤差探索部29において最小の誤差パワーが得られる。信号識別部では、この最小誤差パワーの値を受け取る。音声信号入力時は、VBD信号入力時に比べ誤差パワーが比較的小さくなることを利用して、最小誤差パワーがある閾値を下回った場合は信号識別部の判定結果を「音声モード」とする。仮実行した結果を得られた符号化データはそのまま伝送路7に出力する。最小誤差パワーがある閾値を上回る場合、信号識別部の判定結果を「VBDモード」とする。その場合は、さらにVBD伝送モードでの符号化処理を実行し、その結果得られた符号化データを伝送路7に出力する。
【0088】
以上のように、この実施の形態7によれば、信号識別部を、符号化処理の過程で得られた最小自乗誤差パラメータを流用する構成としたので、信号識別部の構成を簡略化することが出来るという効果が得られる。また、実施の形態1による信号識別部11と併用することで、信号識別の精度の向上も可能となる。
【0089】
実施の形態8.
実施の形態8では、実施の形態1と同様に、音声符号化方式として、ITU−T Recommendation G.729, ”Coding of Speech at 8kbit/s Using Conjugate−Structure Algebraic−Code−Excited Linear−Prediction(CS−ACELP)”が用いられる。
図16は、この発明の実施の形態8による音声符号化装置の構成を示すブロック図である。図1または図15と同一の符号は、同一の機能を持つ構成要素を示している。図において、170は第3の代数符号帳(音声帯域データ信号対応雑音符号帳)、172は第4の代数符号帳(音声帯域データ信号対応雑音符号帳)である。第3の代数符号帳170および第4の代数符号帳172は、第1の代数符号帳16より、出力のサンプリング周波数が高くなっている。また、171は、第3の代数符号帳170の出力を、第1の代数符号帳16の出力と同じサンプリング周波数に変換する第3のダウンサンプリング部(サンプリング周波数変換部)、173は、第4の代数符号帳172の出力を、第1の代数符号帳16の出力と同じサンプリング周波数に変換する、第4のダウンサンプリング部(サンプリング周波数変換部)である。178は、信号識別部より出力された識別結果に基づき、第1の代数符号帳16、第2の代数符号帳18、第3の代数符号帳170、第4の代数符号帳172の選択を行う切替スイッチである。
【0090】
また、図17は、この発明の実施の形態8による音声復号装置の構成を示すブロック図である。図2と同一の符号は、同一の機能を持つ構成要素を示している。図において、174は、第3の代数符号帳170と同一の第3の代数符号帳(音声帯域データ信号対応雑音符号帳)、175は、第3のダウンサンプリング部171と同一の機能を有する第3のダウンサンプリング部(サンプリング周波数変換部)、176は、第4の代数符号帳172と同一の第4の代数符号帳(音声帯域データ信号対応雑音符号帳)、177は、第4のダウンサンプリング部173と同一の機能を有する第4のダウンサンプリング部(サンプリング周波数変換部)である。
【0091】
実施の形態8では、サンプリング周波数の異なる代数符号帳を複数備え、信号識別部の出力する信号識別結果に応じて、適応的に符号帳を切り替えられるようにしたことである。例えば、第2の代数符号帳18は、サンプリング周波数=48kHzとする。第3の代数符号帳170は、サンプリング周波数=32kHzとする。第4の代数符号帳172は、サンプリング周波数=24kHzとする。また、信号識別部において、判定閾値を3つ(すなわち、モード設定を4段階)持つようにし、それぞれ誤差パワーの小さい順に第1の閾値、第2の閾値、第3の閾値とする。
【0092】
信号識別部において、最小誤差パワーが第1の閾値を下回る場合を、「音声伝送モード」とし、この場合は、切替スイッチ178を178Aに接続し、実施の形態1による音声伝送モードでの動作と同様の符号化処理を行う。
【0093】
信号識別部において、最小誤差パワーが、第1の閾値を上回り、第2の閾値を下回る場合を、「第1のVBD伝送モード」とする。この場合は、切替スイッチ178を178Dに接続し、第4の代数符号帳172を選択し、実施の形態1によるVBD伝送モードでの動作と同様の符号化処理を行う。
【0094】
信号識別部において、最小誤差パワーが、第2の閾値を上回り、第3の閾値を下回る場合を「第2のVBD伝送モード」とする。この場合は、切替スイッチ178を178Cに接続し、第3の代数符号帳170を選択し、実施の形態1によるVBD伝送モードでの動作と同様の符号化処理を行う。
【0095】
信号識別部において、最小誤差パワーが、第3の閾値を上回る場合を、「第3のVBD伝送モード」とする。この場合は、切替スイッチ178を178Bに接続し、第2の代数符号帳18を選択し、実施の形態1によるVBD伝送モードでの動作と同様の符号化処理を行う。
【0096】
以上のように、この実施の形態8によれば、VBD伝送モードを複数持たせたことにより、代数符号帳のビットレートを適応的に変えることが出来るため、代数符号帳インデックスに割り当てるビット数を適応的に変えることが出来る。そのためVBDの伝送特性を維持しつつ、より効率的な伝送が可能となるという効果が得られる。
【0097】
実施の形態9.
図18は、この発明の実施の形態9による音声符号化装置の構成を示すブロック図である。図1から図16までの各図と同一の符号は、同一の機能を持つ構成要素を示している。図において、181は、音声符号化装置における符号化動作を、第2の代数符号帳の持つサンプリング周波数に合わせるための第1のアップサンプリング部(第1のサンプリング周波数上昇部)である。また、182は、第1の代数符号帳16の持つサンプリング周波数を第2の代数符号帳18のサンプリング周波数に変換する第2のアップサンプリング部(第2のサンプリング周波数上昇部)である。例えば、第1の代数符号帳16のサンプリング周波数を8kHz、第2の代数符号帳18のサンプリング周波数を48kHzとすると、第1のアップサンプリング部181および第2のアップサンプリング部182は、8kHz→48kHzにアップサンプリングを行う。これにより、ここでは、符号化動作は全て48kHzのサンプリング周波数で実行される。サンプリング周波数が異なる点を除いては、実施の形態1による符号化処理の動作と同一である。
【0098】
上記のような構成としても、実施の形態1で示した効果と同等の効果を得ることが出来る。
【0099】
実施の形態10.
図19は、この発明の実施の形態10による音声符号化装置の構成を示すブロック図である。図18と同一の符号は、同一の機能を持つ構成要素を示している。図において、190は、アップサンプリングされた音声信号の各サンプルの量子化ビット数の縮退動作を行う量子化ビット縮退部である。
【0100】
実施の形態10では、量子化ビット縮退部190により、例えば、アップサンプリングされた音声信号を1ビットで量子化する。代数符号帳も1ビットで表現されていることから、減算器27での誤差信号の計算、最小自乗誤差探索部29での誤差パワーの計算を大幅に簡略化できるといった効果がある。
【0101】
【発明の効果】
以上のように、この発明によれば、音声帯域データ伝送時には、雑音符号帳のサンプリングレートを音声帯域データ信号伝送に適した高さに切り替えるようにしたので、FAX/モデム信号など音声帯域データ信号の高速伝送が可能で、かつ、音声信号伝送モードと音声帯域データ信号伝送モードとの間でシームレスなモード切替が可能な、音声符号化装置および復号装置を得られるという効果がある。
【0102】
この発明によれば、音声帯域データ信号伝送時には、送信する符号化ビット列にLSP量子化符号帳の情報を含めないようにし、その分のビット列を雑音符号帳に割り当てるようにしたので、音声帯域データ伝送モードでの伝送特性がさらに向上するという効果がある。
【0103】
この発明によれば、音声帯域データ信号伝送時には、聴覚重み付けフィルタとポストフィルタを無効にしたので、符号化処理を簡略化し、かつSN比の高い音声帯域データ伝送モードでの伝送を実現出来るという効果がある。
【0104】
この発明によれば、音声帯域データ信号伝送時には、送信する符号化ビット列に適応符号帳の情報を含めないようにし、その分のビット列を雑音符号帳に割り当てるようにしたので、音声帯域データ伝送モードでの伝送特性がさらに向上するという効果がある。
【0105】
この発明によれば、音声帯域データ信号伝送時には、利得符号帳のサブフレーム周期を短くしたことにより、音声帯域データのSN比を向上出来るという効果がある。
【0106】
この発明によれば、音声帯域データ信号伝送時には、利得量子化符号帳を音声帯域データ信号に適したものに切り替える構成としたので、音声帯域データのSN比を向上出来るという効果がある。
【0107】
この発明によれば、符号化モードを決定するための信号識別に、合成信号の誤差パワー値を用いるようにしたので、信号識別処理が簡略化出来るとともに、判定制度を上げることが出来るという効果がある。
【図面の簡単な説明】
【図1】この発明の実施の形態1による音声符号化装置の構成を示すブロック図である。
【図2】この発明の実施の形態1による音声復号装置の構成を示すブロック図である。
【図3】この発明の実施の形態2による音声符号化装置の構成を示すブロック図である。
【図4】この発明の実施の形態2による音声復号装置の構成を示すブロック図である。
【図5】多重化部から出力される符号化ビット列を示す図である。
【図6】この発明の実施の形態3による音声符号化装置の構成を示すブロック図である。
【図7】この発明の実施の形態3による音声復号装置の構成を示すブロック図である。
【図8】この発明の実施の形態4による音声符号化装置の構成を示すブロック図である。
【図9】この発明の実施の形態4による音声復号装置の構成を示すブロック図である。
【図10】この発明の実施の形態5における符号化処理単位を時系列で表現したものである。
【図11】この発明の実施の形態5における符号化フレーム構成を示したものである。
【図12】この発明の実施の形態6による音声符号化装置の構成を示すブロック図である。
【図13】この発明の実施の形態6による音声復号装置の構成を示すブロック図である。
【図14】モデム信号の波形と音声信号波形の一例を示した図である。
【図15】この発明の実施の形態7による音声符号化装置の構成を示すブロック図である。
【図16】この発明の実施の形態8による音声符号化装置の構成を示すブロック図である。
【図17】この発明の実施の形態8による音声復号装置の構成を示すブロック図である。
【図18】この発明の実施の形態9による音声符号化装置の構成を示すブロック図である。
【図19】この発明の実施の形態10による音声符号化装置の構成を示すブロック図である。
【図20】DCMEを適用した国際長距離通信網の構成を示す図である。
【図21】DCMEの基本構成を示す図である
【図22】16kbit/sのLD−CELP方式を用いた音声符号化装置および復号装置の構成を示すブロック図である。
【図23】40kbit/s LD−CELP方式を用いた音声符号化装置および復号装置の構成を示すブロック図である。
【図24】8kbit/s CS−ACELP方式を用いた音声符号化装置の構成を示すブロック図である。
【図25】8kbit/s CS−ACELP方式を用いた音声復号装置の構成を示すブロック図である。
【符号の説明】
2 多重化部、3 割当制御部、5 多重分離部、6 メッセージ解読部、7伝送路、8 線形予測分析部、9 LPC/LSP変換部、10 LSP量子化部、11 信号識別部、12,30 LSP量子化符号帳、13,43 LSP逆量子化部、14,44 LSP/LPC変換部、15,31 適応符号帳、16,32 第1の代数符号帳(第1の雑音符号帳)、17,33 ピッチプレフィルタ、18,34 第2の代数符号帳(第2の雑音符号帳)、19,35 ダウンサンプリング部(第1のサンプリング周波数変換部)、20 切替スイッチ、21,22 乗算器、23,40 利得量子化符号帳、24,41 MA予測部、25 加算器、26,45 合成フィルタ、27 減算器、28 聴覚重み付けフィルタ、29 最小自乗誤差探索部、36,37 切替スイッチ、38,39 乗算器、42 加算器、46 ポストフィルタ、120,122,123 切替スイッチ、121 LSP固定パターン、130,131,132,133 切替スイッチ、140,141,142 切替スイッチ、150,152切替スイッチ、151,153 第2の利得量子化符号帳、160 信号識別部(信号特性識別部)、170,174 第3の代数符号帳(音声帯域データ信号対応雑音符号帳)、171,175 第3のダウンサンプリング部(サンプリング周波数変換部)、172,176 第4の代数符号帳(音声帯域データ信号対応雑音符号帳)、173,177 第4のダウンサンプリング部(サンプリング周波数変換部)、178,179,180 切替スイッチ、181 第1のアップサンプリング部(第1のサンプリング周波数上昇部)、182 第2のアップサンプリング部(第1のサンプリング周波数上昇部)、190 量子化ビット縮退部。
【発明の属する技術分野】
この発明は、音声のデジタル有線通信および無線通信において用いられる音声符号化・復号装置において、特にFAX信号、モデム信号などの音声周波数帯域を用いたデータ信号の伝送を目的とする、音声符号化装置および復号装置に関するものである。
【0002】
【従来の技術】
国際長距離通信を実現するためには、人工衛星打ち上げ、海底ケーブルの敷設等が必須であり、初期投資が膨大である。通信コストの低減を果たすためには、回線の有効利用が最も重要な課題となっており、このような課題を解決するため、DCME(Digital Circuit MultiplicationEquipment)のような回線多重化装置が適用される事が多い。図20は、従来のDCMEを適用した国際長距離通信網の構成を示す図である。DCMEは、主に国際回線と国内公衆網との中間に設置され、高能率音声伝送技術を利用し、また、音声およびFAX信号、モデム信号等の音声帯域データ信号の統計多重効果を利用する事により、国際回線を有効利用し通信コストの削減を実現する装置である。
【0003】
図21はDCMEの基本構成を示す図である。図において、501は信号識別部、502は音声検出部、503は割当制御部、504は符号器、505,523はFAX復調伝送部、506は多重化部、508はメッセージ生成部、509,526は切替スイッチ、520はメッセージ解読部、521は多重分離部、522は擬似背景雑音生成部、525は復号器である。
【0004】
次に、DCMEの動作について説明する。
公衆網側のトランク回線より伝送されてきた信号は、信号識別部501において音声信号であるかデータ信号であるか判定される。「音声信号」と判定されたら、音声検出部502において、有音/無音判定を行う。音声検出部502において有音と判定された場合は、割当制御部503において伝送チャネルを割り当てる。その後、各伝送チャネルごとに設置された符号器504において高能率符号化処理を行い、多重化部506を通してベアラ回線に送出する。音声検出部502において無音と判定された場合は、割当制御部503による伝送チャネルの割り当ては行われず、トランク回線からの信号を遮断する。即ち、音声信号については通話における無音時間帯の信号伝送を抑圧し、さらに有音時間帯は高能率音声符号化を行う事によって、高い伝送効率を実現する事が出来る。また、FAX復調伝送部505は、FAX信号を識別して伝送プロトコルを解析する事により、変調されたFAX画像信号を元のデジタル画像信号に復調して伝送する。多重化部506は、音声信号とデータ信号を多重化して伝送路に送出する。
【0005】
符号器504に用いられる高能率音声符号化アルゴリズムには、伝送速度が32kbit/sのADPCM(Adaptive Differential Pulse Code Modulation:ITU−T勧告G.726準拠方式)、同じく16kbit/sのLD−CELP(Low−Delay Code−Excited Linear Prediction:同勧告G.728準拠方式)などがある。さらに近年では、より一層の高能率化を実現するために、伝送速度が8kbit/sのCS−ACELP(Conjugate−Structure Algebraic−Code−Excited Linear Prediction:同勧告G.729準拠方式)が用いられるケースも増えつつある。
【0006】
伝送速度が8kbit/s〜16kbit/s付近の音声符号化アルゴリズムは、少ない情報量で高品質な音声を得る事を目的としているため、例えば人間の発声機構をモデル化し、その特徴パラメータを抽出して符号化処理に用いる構成となっている。以下に事例を挙げて説明する。
【0007】
まず、16kbit/sのLD−CELP方式について説明する。
図22は、16kbit/sのLD−CELP方式を用いた音声符号化装置および復号装置の構成を示すブロック図である。図において、550は音声サンプルを一定時間分蓄積するベクトルバッファ、551,559は、励振信号のベクトル量子化時に参照される符号帳、552,560は乗算器、553,561はそれぞれ552,560に出力する利得値の適応動作を行うバックワード型利得適応処理部、554,562は合成フィルタ、555,563は入力信号に応じて合成フィルタ係数の適応動作を行うバックワード型合成フィルタ適応処理部、556は加算器、557は聴覚重み付けフィルタ、558は符号帳探索部であり、ベクトルバッファ550の出力信号と合成フィルタ554の出力信号との誤差パワーを最小とするサンプルを、符号帳551の中から探索する。
【0008】
次に、8kbit/sのCS−ACELP方式について説明する。
図24および図25は、それぞれ8kbit/sのCS−ACELP方式を用いた音声符号化装置および復号装置の構成を示すブロック図である。
図24を用いて符号化処理について説明する。601は線形予測分析部、602は線形予測係数(LPC)を線スペクトル対(LSP)に変換する、LPC/LSP変換部、603は変換されたLSPを元にベクトル量子化を行い、量子化ベクトルに対応するインデックスを出力する、LSP量子化部、604はLSP量子化部603にて、ベクトル量子化を実行する際に参照する、LSP量子化符号帳、605はLSP量子化部603より出力されたLSP符号帳インデックスを元にLSPを復号する、LSP逆量子化部、606は、LSPをLPCに変換する、LSP/LPC変換部である。また、607は、過去の励振信号を蓄積し、励振信号の周期成分、すなわちピッチ周期の探索に用いられる、適応符号帳、608は励振信号の更新成分(雑音成分)の生成に用いられる、代数符号帳である。CS−ACELP方式では、励振信号の雑音成分の生成には、代数符号帳という、振幅1のパルスを複数本組み合わせて構成されたものが用いられる。609は、励振信号のピッチ周期成分を強調する、ピッチプレフィルタ、610,611は、それぞれ励振信号の周期成分である適応符号帳と、雑音成分である代数符号帳に、量子化された利得を乗ずる乗算器、612は、乗算器610で乗ずる適応符号帳利得、および乗算器611で乗ずる雑音符号帳利得の量子化を行う際に参照する、利得量子化符号帳である。利得の量子化についてもベクトル量子化の手法を用いている。613は、適応符号帳利得のフレーム間予測(移動平均予測:Moving Average)を行うMA予測部、614は、励振信号の周期成分と雑音成分とを加算する加算器、615は、LSP/LPC変換部606で得られた線形予測係数を用いて、励振信号にスペクトル包絡情報をたたみ込み、合成音声信号を出力する合成フィルタ、616は、合成フィルタ615の出力である合成音声信号と、入力音声信号との差を計算する減算部である。全ての代数符号帳、適応符号帳、利得量子化符号帳の組み合わせについて、607〜615を用いて合成音声信号を生成し、減算部616にて逐一入力音声信号との誤差信号を計算する。618は、その誤差信号のパワーを計算し、全合成信号の中から、誤差パワーが最小となる代数符号帳、適応符号帳、利得量子化符号帳の組み合わせを探索し、それぞれのインデックスを出力する、最小自乗誤差探索部である。また、617は、最小自乗誤差の探索を行うに当たり、誤差信号に聴覚的な重み付けを行う聴覚重み付けフィルタである。上記のようにして得られたLSP符号帳インデックス、利得符号帳インデックス、代数符号帳インデックス、適応符号帳インデックスは、多重化部506で多重化され伝送路に出力される。
【0009】
次に図25を用いて復号処理について説明する。多重化部506で多重化され、送信されてきた信号列は、多重分離部521においてLSP符号帳インデックス、利得符号帳インデックス、代数符号帳インデックス、適応符号帳インデックスに分離される。621はLSP量子化符号帳であり、受信したLSP符号帳インデックスを用いてLSPを得るのに用いられる。622は適応符号帳であり、受信した適応符号帳インデックスを用いて、励振信号の周期成分である適応符号帳を得るのに用いられる。623は代数符号帳であり、受信した代数符号帳インデックスを用いて、励振信号の更新成分である雑音符号帳を得るのに用いられる。624はピッチプレフィルタ、627は利得量子化符号帳であり、受信した利得符号帳インデックスを用いて、励振信号の各成分の利得を得る。628はMA予測部、625,626は乗算器、629は励振信号の周期成分と更新成分とを加算する加算器である。630はLSP逆量子化部、631はLSP/LPC変換部、632は合成フィルタ、633は合成フィルタから出力された合成音声信号の特徴周波数成分を強調するポストフィルタである。
【0010】
これらの符号化方式は、人間の声道情報をモデル化した合成フィルタ、すなわち音声のスペクトル包絡に対応する線形フィルタを構成し、人間の声帯音源に相当する符号帳に蓄えられた時系列の信号で駆動する事によって音声を再生するCELP方式に基づいている。図22では、符号帳551について総当りで音声信号を合成し、符号帳探索部558でベクトルバッファ550の出力信号と合成フィルタ554の出力信号との誤差パワーを最小とするサンプルを探索する。音声復号装置へは、この誤差パワーを最小とするサンプルに振られたインデックスを符号化パラメータとして送信する。これらの詳細なアルゴリズムの説明は、ITU−T Recommendation G.728, ”Coding of Speech at 16kbit/s using Low−Delay Code Excited Linear Prediction”、及びITU−T Recommendation G.729, ”Coding of Speech at 8 kbit/s using Conjugate−Structure Algebraic−Code−Excited Linear Prediction(CS−ACELP)”に記載されている。
【0011】
一般的に、FAX信号やモデム信号に代表される音声帯域データ信号(voice−band data:VBD信号)は、通常の音声には無い特有な周波数特性を持つ信号成分を持っている。そのため、VBD信号を音声の高能率伝送に特化された音声符号化方式を用いて伝送する事は通常困難である。
これらVBD信号の高能率伝送を実現するためには、例えば、国際標準に準拠した伝送プロトコルが用いられることの多いFAX信号などの伝送については、図21のFAX復調伝送部505のような、DCME側にFAX通信プロトコルを解析する機能を持たせ、VBD信号を一旦元のデジタル画像データに復調して伝送し、受信側DCMEで再度VBD信号に変調して伝送する復調伝送方式を採用するという方法がある。
【0012】
ところが、FAX信号の伝送の場合、国際標準に準拠していないFAX端末メーカ独自仕様の伝送プロトコルを用いて高能率画像伝送を実現する場合がある。通常、これらメーカ独自仕様の伝送プロトコルは、一般的に開示されていないケースがほとんどであり、DCME等の伝送装置側で伝送プロトコルを解析して復調伝送する手段がなく、独自仕様に対応する復調伝送方式の実装は事実上不可能となっている。また、実装上全てのプロトコルをサポートする事はきわめて難しく、たとえDCME側で実装が可能だったとしても製品コストが高騰し、リーズナブルな価格でユーザに提供する事が出来なくなる。モデム信号によるデータ伝送についても、同様の理由により復調伝送が困難となっている。
【0013】
そこでDCMEでは、復調伝送方式がとれない場合の対策として、モデム信号のようなVBD信号に対しては高ビットレートのチャネル(通常は40kbit/s程度)を適応的に割当て、そのチャネルでVBD信号の伝送を実現する方式をとっている。このVBD信号の高ビットレート伝送を実現するため、DCMEに実装する音声符号化機能も「VBD伝送モード」として高ビットレート動作をサポートしており、伝送する信号の特性に応じて符号化方式をシームレスに切り替えられる構成となっている。例えば、ITU−T標準G.763(32kbit/s DCME)では音声伝送時(以下、「音声伝送モード」と称する)には32kbit/s ADPCMを、VBD信号伝送時には40kbit/s ADPCMを使用するよう勧告されている。また、ITU−T勧告G.767(16kbit/s DCME)では、音声伝送時には16kbit/s LD−CELPを、VBD伝送時には40kbit/s LD−CELP(同勧告G.728 Annex J)を使用するよう勧告されている。
【0014】
ところが、これらの符号化方式では、音声伝送モードとVBD伝送モードの切り替え時にシームレスな符号化速度の変更を実現するために、さらには実装上の観点からもVBD伝送モードにおける符号化アルゴリズムを音声伝送モードにおける音声に特化した基本的な符号化アルゴリズムから変えてない。このため、VBD信号を高能率に符号化し伝送するという観点では必ずしも最適な符号化方式であるとはいえない。
【0015】
ここで、ITU−T勧告G.767(16kbit/s DCME)による、音声伝送時には16kbit/s LD−CELPを、VBD伝送時には40kbit/s LD−CELP(同勧告G.728 Annex J)を用いた場合を例として説明する。
図23は、40kbit/s LD−CELP方式を用いた音声符号化装置および復号装置の構成を示すブロック図である。図において、570は、合成フィルタ554とちょうど逆の周波数特性を持つ逆合成フィルタ、571はトレリス符号量子化(TCQ:Trellis Coded Quantization)に基づく差分信号量子化部、572は、差分信号量子化部571が量子化時に参照する符号帳、573は、符号化データからもとの残差信号を再生する、逆量子化部である。その他、図22と同一の番号を記した構成要素は、同一の機能を持つ構成要素である。
【0016】
40kbit/sLD−CELP方式の音声符号化装置、復号装置の、図22で示した16kbit/s LD−CELP方式のそれとの主な違いは、符号帳探索の手法にトレリス符号量子化(TCQ)に基づく差分信号量子化部571を適用していることにある。TCQ手法は、VBDモードの時に限り、合成による分析(A−b−S)法に代わって40kbit/sLD−CELPの符号帳探索に用いられる。一方、符号化速度の変更をシームレスに実現するため、VBDモードにおいて用いられるバックワード型合成フィルタ適応処理部555およびバックワード型利得適応処理部553は、音声モードにおいて用いられるものと同一のものを用いている。さらに、適応周期についても、音声モードとVBDモードの両方に用いられる。なお、詳細なアルゴリズムの説明は、ITU−T Recommendation G.728 Annex J, ”Variable bit−rate operation of LD−CELP mainly for voiceband−data applications in DCME”に記載されている。このように、40kbit/s LD−CELPでは、音声のスペクトル概形を形成するバックワード形合成フィルタの枠組みは残している。
【0017】
従って、高ビットレート符号化アルゴリズムを用いたとしても、その伝送効率は決して高いとはいえない。例えば、40kbit/s ADPCM(ITU−T勧告G.726準拠方式)のVBD信号伝送能力は、9600bit/sが限界であるし、また、40kbit/s LD−CELP(同勧告G.728 Annex J準拠方式)については、19200bit/sのVBD信号伝送が可能であるものの、通信回線の外乱による伝送品質の劣化などを考慮すると、その伝送速度は保証されるものではなく、一般的には9600〜14400kbit/s程度が限界と言われている。即ち、VBD伝送モードについては、40kbit/sの伝送路に対し、高々10kbit/s程度のデータ信号しか伝送できる能力がなくきわめて効率が悪い。
【0018】
一方、近年、高速データ伝送への需要が爆発的に高まってきており、例えばデータ伝送速度が28.8kbit/sの速度を持つ、同勧告V.34準拠方式などの高速モデム信号を用いる割合が増加してきている。しかしながら、DCMEのVBD伝送モードには上記で示したように高速VBD信号の伝送能力がないため、フォールバックなどの手段を用いて低速でデータ転送を行わざるを得なかった。このため、本来通信端末が持っている高速データ伝送の能力を発揮できず、通信料金がかさむ結果となり、ユーザに金銭的負担を掛けてしまうなどの問題点があった。
【0019】
このような問題を解決するひとつの手段として、例えば、特開平11−205485号公報で示されているような方法が検討されている。これは、VBD信号をクリアチャネル(64kbit/s PCM方式)を用いて伝送するものである。この方式を用いる事により、例えば、ITU−T勧告V.90のような高速モデム信号(伝送速度は最高56kbit/s)に対しても伝送が可能となるという利点があるが、中速度のVBD信号伝送を考えた場合、64kbit/sのチャネルに高々20〜30kbit/s程度のデータ信号しか伝送していない事となる。28.8kbit/s以下の中速度モデムも減りつつあるとは言え依然として広く普及しており、DCMEにおいてはそれらのデータ通信チャネルも収容する必要があることから、高能率伝送という観点で望ましくない。
【0020】
【発明が解決しようとする課題】
従来の音声符号化装置および復号装置は以上のように構成されているので、FAX/モデム信号などのVBD信号の伝送において復調伝送が出来ない場合には、VBD信号に高ビットレートのチャネルを割り当てて伝送する方式をとっているが、符号化速度をシームレスに切り替えるために、符号化アルゴリズムの基本部分を音声信号に用いているものと同一にしているため、必ずしもVBD信号の高能率符号化に適した方法ではないという課題があった。
【0021】
この発明は上記のような課題を解決するためになされたもので、FAX/モデム信号などVBD信号の高速伝送が可能で、かつ、音声信号伝送モードとVBD信号伝送モードとの間でシームレスなモード切替が可能な、音声符号化装置および復号装置を得ることを目的とする。
【0022】
【課題を解決するための手段】
この発明に係る音声符号化装置は、出力のサンプリング周波数が第1の雑音符号帳よりも高い第2の雑音符号帳と、第2の雑音符号帳の出力を第1の雑音符号帳の出力と同じサンプリング周波数に変換する第1のサンプリング周波数変換部とを備え、入力信号が音声帯域データ信号である場合には、第1の雑音符号帳の出力に代えて第1のサンプリング周波数変換部により変換された第2の雑音符号帳の出力をパラメータとして用いるものである。
【0023】
この発明に係る音声符号化装置は、音声帯域データ信号伝送に対応したLSP固定パターンを備え、音声帯域データ信号伝送時には、LSP量子化符号帳の出力に代えてLSP固定パターンを用いて生成した出力をパラメータとして用い、さらに送信信号中にLSP量子化符号帳の情報を含めず、その分のビット数を第2の雑音符号帳の情報に割り当てるものである。
【0024】
この発明に係る音声符号化装置は、音声帯域データ信号伝送時には、聴覚重み付けフィルタを無効にするものである。
【0025】
この発明に係る音声符号化装置は、音声帯域データ信号伝送時には、送信信号中に適応符号帳の情報を含めずその分のビット数を第2の雑音符号帳の情報に割り当てるものである。
【0026】
この発明に係る音声符号化装置は、音声帯域データ信号伝送時には、利得量子化符号帳の更新周期を短くするものである。
【0027】
この発明に係る音声符号化装置は、音声帯域データ信号伝送に対応した第2の利得量子化符号帳を備え、音声帯域データ信号伝送時には、利得量子化符号帳に代えて第2の利得量子化符号帳の出力をパラメータとして用いるものである。
【0028】
この発明に係る音声符号化装置は、合成音声信号と入力音声信号との誤差が最小となる最適なパラメータの組み合わせを探索する最小自乗誤差探索部により出力される誤差の最小値に基づいて、入力信号が音声信号であるか音声帯域データ信号であるかを判断する信号識別部を備えたものである。
【0029】
この発明に係る音声符号化装置は、出力のサンプリング周波数が第1の雑音符号帳よりも高く、それぞれが第2の雑音符号帳とは異なった値を持つ複数の音声帯域データ信号対応雑音符号帳と、複数の音声帯域データ信号対応雑音符号帳の出力を第1の雑音符号帳の出力と同じサンプリング周波数に変換する複数のサンプリング周波数変換部を備え、音声帯域データ伝送時には、入力信号の特性に応じて複数の音声帯域データ信号対応雑音符号帳または第2の雑音符号帳から1つを選択し、その出力を複数のサンプリング周波数変換部または第1のサンプリング周波数変換部により変換してパラメータとして用いるものである。
【0030】
この発明に係る音声符号化装置は、入力信号のサンプリング周波数を第2の雑音符号帳のサンプリング周波数に変換する第1のサンプリング周波数上昇部と、第1の雑音符号帳の出力を第2の雑音符号帳の出力と同じサンプリング周波数に変換する第2のサンプリング周波数上昇部とを備えたものである。
【0031】
この発明に係る音声符号化装置は、音声帯域データ信号伝送時には、入力信号の量子化ビット数を代数符号帳の量子化ビット数に合わせて落とす、量子化ビット縮退部を備えたものである。
【0032】
この発明に係る音声復号装置は、出力のサンプリング周波数が第1の雑音符号帳よりも高い第2の雑音符号帳と、第2の雑音符号帳の出力を第1の雑音符号帳の出力と同じサンプリング周波数に変換する第1のサンプリング周波数変換部とを備え、入力信号が音声帯域データ信号である場合には、第1の雑音符号帳の出力に代えて第1のサンプリング周波数変換部により変換された第2の雑音符号帳の出力をパラメータとして用いるものである。
【0033】
この発明に係る音声復号装置は、音声帯域データ信号伝送に対応したLSP固定パターンを備え、音声帯域データ信号伝送時には、LSP量子化符号帳の情報が含まれない受信信号を受信し、LSP固定パターンを用いて生成した出力をLSP量子化符号帳の出力に代えてパラメータとして用いるものである。
【0034】
この発明に係る音声復号装置は、音声帯域データ信号伝送時には、ポストフィルタを無効にするものである。
【0035】
この発明に係る音声復号装置は、音声帯域データ信号伝送時には、適応符号帳の情報が含まれない受信信号を受信し、復号処理を行うものである。
【0036】
この発明に係る音声復号装置は、音声帯域データ信号伝送時には、利得量子化符号帳の更新周期を短くするものである。
【0037】
この発明に係る音声復号装置は、音声帯域データ信号伝送に対応した第2の利得量子化符号帳を備え、音声帯域データ信号伝送時には、利得量子化符号帳に代えて第2の利得量子化符号帳の出力をパラメータとして用いるものである。
【0038】
この発明に係る音声復号装置は、出力のサンプリング周波数が第1の雑音符号帳よりも高く、それぞれが第2の雑音符号帳とは異なった値を持つ複数の音声帯域データ信号対応雑音符号帳と、複数の音声帯域データ信号対応雑音符号帳の出力を第1の雑音符号帳の出力と同じサンプリング周波数に変換する複数のサンプリング周波数変換部を備え、音声帯域データ伝送時には、入力信号の特性に応じて複数の音声帯域データ信号対応雑音符号帳または第2の雑音符号帳から1つを選択し、その出力を複数のサンプリング周波数変換部または第1のサンプリング周波数変換部により変換してパラメータとして用いるものである。
【0039】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態1.
実施の形態1では、音声符号化装置および復号装置に用いる低ビットレート音声符号化方式として、ITU−T Recommendation G.729, ”Coding of Speech at 8kbit/s Using Conjugate−Structure Algebraic−Code−Excited Linear−Prediction(CS−ACELP)”を用いている。CS−ACELP方式においては、雑音符号帳には代数符号帳が用いられ、ここでも雑音符号帳には代数符号帳が用いられることを前提とする。
【0040】
図1は、この発明の実施の形態1による音声符号化装置の構成を示すブロック図である。2は多重化部、3は割当制御部、7は伝送路、8は線形予測分析部、9はLPC/LSP変換部、10はLSP量子化部、11は信号識別部、12はLSP量子化符号帳、13はLSP逆量子化部、14はLSP/LPC変換部、15は適応符号帳、16は第1の代数符号帳(第1の雑音符号帳)、17はピッチプレフィルタ、18は第2の代数符号帳(第2の雑音符号帳)、19はダウンサンプリング部(第1のサンプリング周波数変換部)、20は切替スイッチ、21,22は乗算器、23は利得量子化符号帳、24はMA予測部、25は加算器、26は合成フィルタ、27は減算器、28は聴覚重み付けフィルタ、29は最小自乗誤差探索部である。
【0041】
また図2は、この発明の実施の形態1による音声復号装置の構成を示すブロック図である。図において、5は多重分離部、6はメッセージ解読部、30はLSP量子化符号帳、31は適応符号帳、32は第1の代数符号帳(第1の雑音符号帳)、33はピッチプレフィルタ、34は第2の代数符号帳(第2の雑音符号帳)、35はダウンサンプリング部(第1のサンプリング周波数変換部)、36,37は切替スイッチ、38,39は乗算器、40は利得量子化符号帳、41はMA予測部、42は加算器、43はLSP逆量子化部、44はLSP/LPC変換部、45は合成フィルタ、46はポストフィルタである。
【0042】
次に動作について説明する。
実施の形態1によるデータ信号の伝送は、ITU−T勧告V.8に準拠したデータ通信開始手順に従って始められる。なお、この手順の詳細はITU−T Recommendation V.8,”Procedures for starting sessions of data transmission over the public switched telephone network”に述べられている。
【0043】
まず、音声符号化装置による音声符号化処理について図1を用いて説明する。実施の形態1による音声符号化装置の基本的な動作は、従来例の図24で示した音声符号化装置と同様である。ここでは、構成および動作が異なる部分について説明する。
第2の代数符号帳18の出力は、第1の代数符号帳16の出力よりもサンプリング周波数が高くなっている。ダウンサンプリング部19は、第2の代数符号帳18の出力を第1の代数符号帳16の出力と同じサンプリング周波数に変換する。切替スイッチ20は、信号識別部11より出力された識別結果に基づき、第1の代数符号帳16、第2の代数符号帳18どちらかに接続される。
信号識別部11は、例えば、データ通信開始手順において必須である受信側モデムのアンサートーンである2100Hzのトーン信号(振幅変調を受けている)を識別する機能を備えている。信号識別部11は、音声符号化装置に入力される信号の中に2100Hzのトーン信号の有無を常に監視し、2100Hzトーン信号を検出したら、DCME本体または割当制御部3に信号識別結果を送信し、40kbit/sチャネルへのアサイメント要求を出すとともに、切替スイッチ20へも信号識別結果を送出する。この信号識別結果によって切替スイッチ20が20B側に接続され、音声符号化装置はVBD伝送モードへ遷移する。
【0044】
次に、音声復号装置による音声復号処理について図2を用いて説明する。
復号装置の基本的な動作についても、従来例の図25で示した音声復号装置と同様であるので、構成および動作が異なる部分について説明する。
第2の代数符号帳34は、第2の代数符号帳18と同一の符号帳であり、受信した代数符号帳インデックスを用いて、励振信号の更新成分すなわち雑音成分を得るのに用いられる。切替スイッチ36,37は、受信した信号識別結果に基づき第1の代数符号帳32または第2の代数符号帳34の選択を行う。
ダウンサンプリング部35は、ダウンサンプリング部19と同様に、第2の代数符号帳34の出力を第1の代数符号帳32の出力と同じサンプリング周波数に変換する。
【0045】
なお、データ通信中は、送信側から常にデータ信号が送出されており無音になる事は無いが、データ送信手順終了後、しばらく無音区間が続くことがある。信号識別部11は、この無音区間を検出する機能も備えており、送信信号で、少なくともアンサートーン検出待ちのポーズ時間よりも長い所定の時間継続する無音区間を検出したら、DCME本体または割当制御部3に信号識別結果を送信し、8kbit/sチャネルへのアサイメント要求を出すとともに、切替スイッチ20へも信号識別結果を送出する。この信号識別結果によって切替スイッチ20が20A側に接続され、音声符号化装置を音声伝送モードへ遷移させる事が出来る。
【0046】
次に、各伝送モードにおける動作を説明する。
まず、音声伝送モードにおいては切替スイッチ20を20A側に接続し、第1の代数符号帳16が選択される。音声符号化装置へ入力された音声信号は、この第1の代数符号帳16を用いて高能率符号化処理される。音声伝送モードで用いられる第1の代数符号帳16は、例えば、ITU−T勧告G.729で規定された代数符号帳を用いることができる。第1の代数符号帳16のサンプリング周波数は8kHzであり、このときの符号化処理は、ITU−T勧告G.729にて規定された処理と全く同一である。
【0047】
また、VBD伝送モードにおいては、切替スイッチ20を20B側に接続し、第2の代数符号帳18が選択される。VBD伝送モードで用いられる第2の代数符号帳18は、8kHzよりも高いサンプリング周波数であることが必要であり、ここではサンプリング周波数を48kHzとする。モデム信号の伝送帯域は300Hz〜3400Hzであるためサンプリング周波数は8kHzで十分であるが、代数符号帳は単一の振幅しか持たず、量子化ビット数が1ビットのパルスの組み合わせであるので、代数符号帳を用いて位相変調および振幅変調を受けているモデム信号をあえて表現しようとすると、量子化ステップが少ないことによりSN比が著しく低下する。一方、周波数帯域が300Hz〜3400Hzであるモデム信号をディジタル信号で表現するためには、1サンプル当たりの量子化ステップ数が充分与えられていれば、通常、サンプリング周波数は8kHzで充分である。ところが、第2の代数符号帳18は、8kHzよりも高いサンプリング周波数で表現されているため、量子化ノイズのパワーを広い帯域に拡散させる効果が得られ、必要な帯域(モデム信号の場合は前出の300Hz〜3400Hz)のSN比を相対的に低減させることが出来る。このため各サンプルを表現するためのビット数が少なく量子化ステップが粗くても、高いSN比でモデム信号を表現することが可能である。
【0048】
第2の代数符号帳18から出力されるオーバサンプリングされたパルス列は、ダウンサンプリング部19によりサンプリング周波数8kHzの信号に変換される。この信号が切替スイッチ20を経由して、乗算器22にて量子化利得を乗ずる。さらに、加算器25にて励振信号の周期成分を加え、合成フィルタ26にてスペクトル包絡情報を畳み込んで合成信号を生成する。ここで生成された合成信号を入力されたVBD信号と比較し、最小自乗誤差探索部29において誤差パワーを計算する。
この動作を、第2の代数符号帳18で許容されているパルス列の全組み合わせ、および利得符号帳、適応符号帳との組み合わせ全てについて繰り返し、その中で誤差パワーを最小とする第2の代数符号帳18、利得符号帳、適応符号帳の組み合わせを探索する。誤差パワー最小とする組み合わせのインデックスを最小自乗誤差探索部29より出力し、多重化部2にてLSP符号帳インデックスと併せて多重化し、伝送路(ベアラ回線)に出力する。また、信号識別部11の出力である信号識別結果は、符号化モード情報として割当制御部3に送られる。
【0049】
一方、音声復号装置では、伝送路7より受信した符号化列が多重分離部5で各符号化パラメータに分離されると、DCME本体またはメッセージ解読部6からアサイメント情報を貰って切替スイッチ36および切替スイッチ37を動作させる。音声伝送用の低速チャネルがアサインされている音声伝送モードでは、切替スイッチ36を36A側に、切替スイッチ37を37A側にそれぞれ接続し、第1の代数符号帳32を選択する。ここでは、第1の代数符号帳32はITU−T勧告G.729で規定されたものと同一であり、このモードでの復号処理は同勧告で規定された処理と全く同一である。
【0050】
また、VBD伝送モードにおいては、切替スイッチ36を36B側に、切替スイッチ37を37B側にそれぞれ接続し、第2の代数符号帳34が選択される。多重分離部5にて分離された代数符号帳インデックスに基づき第2の代数符号帳34を参照することにより、48kbit/sにオーバサンプリングされた振幅1のパルス列が出力される。ダウンサンプリング部35で48kbit/sから8kbit/sにサンプリング周波数が変換され、励振信号の更新成分が得られる。同時に多重分離部5で得られた利得符号帳インデックスに基づいて、利得量子化符号帳40を参照することにより、励振信号の更新成分、および周期成分に乗ずる利得値を得る。乗算器39にて、励振信号の更新成分に利得を乗じる。一方、励振信号の周期成分は、多重分離部5で得られた適応符号帳インデックスを元に適応符号帳31を参照して得られ、乗算器38で利得が乗じられる。加算器42にて更新成分と周期成分とを加算し、合成フィルタの励振信号を得る。また、多重分離部5で得られたLSP符号帳インデックスを元に、LSP量子化符号帳30を参照し、LSP逆量子化部43にてLSPパラメータを得る。LSPパラメータはLSP/LPC変換部44にてLPCに変換する。これは合成フィルタ45の係数として用いる。加算器42で得られた励振信号は、合成フィルタ45においてスペクトル包絡情報を畳み込み、復号音声が得られる。
【0051】
以上のように、この実施の形態1によれば、信号識別部11により出力される信号識別結果に基づいて第1の代数符号帳16または第2の代数符号帳18を選択し、第2の代数符号帳18の出力はダウンサンプリング部19により第1の代数符号帳と同じサンプリング周波数に変換するようにしたので、全体の符号化および復号アルゴリズムの枠組みを変えずにモード切替を行っているため、モード切替時に音声の瞬断やクリック音の発生をなくすことができ、シームレスな切替が可能な音声符号化装置および復号装置を得ることが出来る。
【0052】
また、この実施の形態1によれば、ブロック構成上は2種類の代数符号帳を持っているように見えるが、例えば本符号化方式をDSPを用いてソフトウェアで実現してもよい。この場合は、サンプリングレートが異なること、サンプリング変換器を追加すること以外はほぼ同じプログラムフローで実現することも可能であるため、実装上有利であるという利点もある。
【0053】
実施の形態2.
実施の形態2では、実施の形態1と同様に、音声符号化方式として、ITU−T Recommendation G.729, ”Coding of Speech at 8kbit/s Using Conjugate−Structure Algebraic−Code−Excited Linear−Prediction(CS−ACELP)”が用いられる。
図3は、この発明の実施の形態2による音声符号化装置の構成を示すブロック図である。図1と同一の符号は、同一の機能を持つ構成要素を示している。図において、120,122は切替スイッチ、121はLSP固定パターンである。切替スイッチ120,122は、信号識別部11の出力である信号識別結果に基づき端子の切り替えを行う。LSP固定パターン121は、特定のLSPパターンを記憶保持するメモリである。
【0054】
また、図4は、この発明の実施の形態2による音声復号装置の構成を示すブロック図である。図2と同一の符号は、同一の機能を持つ構成要素を示している。図において、123は、信号識別結果に基づき端子の切替を行う切替スイッチ、124は、LSP固定パターン121と同一の内容を保持するメモリである。
【0055】
実施の形態2では、信号識別部11の出力である信号識別結果から伝送モードを判定することにより、LSP符号帳インデックスの送信の有無を切り替えられるようにしている。
【0056】
各伝送モードにおける動作を説明する。
音声伝送モードにおいては、切替スイッチ120を120A側に、切替スイッチ122を122A側に接続し、実施の形態1による音声伝送モードにおいての符号化処理と同様の処理を行う。
【0057】
また、VBD伝送モードにおいては、切替スイッチ120を120B側に、切替スイッチ122を122B側に接続する。切替スイッチ122を122B側に接続したことにより、線形予測分析及びLSP量子化処理は実行されず、LSP符号帳インデックスは多重化部2に出力されない。また、切替スイッチ120を120B側に接続したことにより、LSP逆量子化部13は、LSP固定パターン121より予め用意されたLSP固定パターンを抽出し、LSP/LPC変換部14にてLPCに変換する。得られたLPCは、合成フィルタ26のフィルタ係数として用いられる。なお、その他の音声符号化装置の各部の動作は、実施の形態1でのVBD伝送モードにおける動作と同一である。
【0058】
LSP固定パターンには、例えば、モデム信号の特徴であるフラットなスペクトル包絡特性を表現するようなものが含まれている。LSPは、各次数の値の間隔の疎密でスペクトル包絡の山と谷をそれぞれ表現しているため、フラットなスペクトル包絡特性を示すLSPのパターンは、各次数の値の間隔を等間隔にすることによって容易に実現できる。
【0059】
そこで、VBD伝送モードにおいては、モデム信号のスペクトル包絡特性が常にフラットと見なして、先に述べたLSP固定パターンを用いることとする。これによりLSPは一意に決まるため、LSP符号帳インデックスは送信する必要がない。図5は、多重化部2から出力される符号化ビット列を示す図である。音声伝送モードには、ITU−T勧告G.729に準拠した符号化方式を用いるものとすると、多重化部2から出力される符号化ビット列は、図中(a)で示されるフォーマットとなる。図中(b)は、実施の形態1においてVBD伝送モードの時に多重化部2から出力される符号化ビット列のフォーマットである。通常、モデム信号は自己相関の小さな信号であるため、VBD伝送モードにおいては、更新成分を表現する代数符号帳インデックスにより多くのビットを割り当てることで伝送特性をよくすることが出来る。図中(c)は、実施の形態2においてVBD伝送モードの時に多重化部2から出力される符号化ビット列のフォーマットである。実施の形態2では、LSP符号帳インデックスを送らないようにしたため、その分のビットを代数符号帳インデックスに割り当てることが出来るので、同じ伝送ビットレートで、実施の形態1よりもVBDの伝送特性をさらに向上させることが出来る。
【0060】
次に、音声復号装置の動作について説明する。受信した信号識別結果に基づき伝送モードを判定する。音声伝送モードにおいては、切替スイッチ123は123A側に接続し、実施の形態1における音声伝送モードと全く同様の復号処理を行う。実施の形態2では、VBD伝送モードにおいてはLSP符号帳インデックスは受信した符号ビット列中には含まれていない。切替スイッチ123は123B側に接続され、LSP逆量子化部43は、LSP固定パターン124から予め用意されたLSP固定パターンを抽出し、LSP/LPC変換部44にてLPCに変換する。こうして得られたLPCは、合成フィルタ45のフィルタ係数として用いられる。それ以外の音声復号装置の動作は、実施の形態1におけるVBD伝送モードでの音声復号装置の動作と同一である。
【0061】
以上のように、この実施の形態2によれば、スペクトル包絡情報がほぼ一意に決まるVBD伝送モードでは、LSP固定パターンを用いてLPCを取得し、また、LSP符号帳インデックスは、送信する符号化ビット列に含めないようにし、その分の情報量を代数符号帳インデックスに割り当てるようにしたので、VBD伝送モードでの伝送特性がさらに向上するという効果が得られる。
【0062】
実施の形態3.
実施の形態3では、実施の形態1と同様に、音声符号化方式として、ITU−T Recommendation G.729, ”Coding of Speech at 8kbit/s Using Conjugate−Structure Algebraic−Code−Excited Linear−Prediction(CS−ACELP)”が用いられる。
図6は、この発明の実施の形態3による音声符号化装置の構成を示すブロック図である。図1と同一の符号は、同一の機能を持つ構成要素を示している。図において、130,131は、信号識別部11の判定結果に基づき端子の切替を行う切替スイッチである。
【0063】
また、図7は、この発明の実施の形態3による音声復号装置の構成を示すブロック図である。図2と同一の符号は、同一の機能を持つ構成要素を示している。図において、132,133は、それぞれ信号識別結果に基づき端子の切替を行う切替スイッチである。
【0064】
次に動作について説明する。
実施の形態3では、信号識別部11の判定結果に応じて、音声符号化装置の聴覚重み付けフィルタ28、および音声復号装置のポストフィルタ46をバイパス出来るようになっている。音声伝送モードにおいては、音声符号化装置では切替スイッチ130を130A側に、切替スイッチ131を131A側に接続し、実施の形態1による音声伝送モードにおける音声符号化と全く同様の処理を行う。また、VBD伝送モードにおいては、切替スイッチ130を130B側に、切替スイッチ131を131B側に接続する。すなわち、聴覚重み付けフィルタ処理をバイパスする。それ以外の音声符号化装置の各部の動作は、実施の形態1によるVBD伝送モードにおける動作と同一である。
【0065】
音声復号装置については、音声伝送モードにおいては、切替スイッチ132を132A側に、切替スイッチ133を133A側に接続し、実施の形態1による音声伝送モードの時の復号処理と同様の処理を行う。VBD伝送モードにおいては、切替スイッチ132を132B側に、切替スイッチ133を133B側にそれぞれ接続し、ポストフィルタをバイパスする。それ以外の音声復号装置の各部の動作は、実施の形態1によるVBD伝送モードにおける動作と同一である。
【0066】
VBD伝送モードでは、スペクトル包絡特性がほぼフラットとなるため、スペクトル包絡特性に応じて誤差パワーの重み付けを行う聴覚重み付けフィルタ28の効果は小さい。同様の理由で、スペクトルピークの強調を行うポストフィルタ46の効果も小さい。逆に、入力信号との誤差パワーを最小とする信号を合成フィルタ45で合成したにもかかわらず、ポストフィルタ46でさらにその信号を加工してしまうことになるため、SN比が劣化する恐れがある。
【0067】
以上のように、この実施の形態3によれば、音声符号化装置において聴覚重み付けフィルタ28をバイパスし、音声復号装置においてポストフィルタ46をバイパスすることによりフィルタ処理およびそのフィルタ係数の適応処理を省略することができるため、処理が簡略化されるという効果が得られる。また、ポストフィルタ46をバイパスすることで、より良好なVBD伝送を実現出来るという効果がある。
【0068】
実施の形態4.
実施の形態4では、実施の形態1と同様に、音声符号化方式として、ITU−T Recommendation G.729, ”Coding of Speech at 8kbit/s Using Conjugate−Structure Algebraic−Code−Excited Linear−Prediction(CS−ACELP)”が用いられる。
図8は、この発明の実施の形態4による音声符号化装置の構成を示すブロック図である。図1または図3と同一の符号は、同一の機能を持つ構成要素を示している。図において、140,142は、信号識別部11の判定結果に基づき端子の切替を行う切替スイッチである。
【0069】
また、図9は、この発明の実施の形態4による音声復号装置の構成を示すブロック図である。図2または図4と同一の符号は、同一の機能を持つ構成要素を示している。図において、141は受信した信号識別結果に基づき端子の切替を行う切替スイッチである。
【0070】
次に動作について説明する。
実施の形態4においては、音声符号化装置は、信号識別部11が出力する信号識別結果に応じて適応符号帳インデックスの送信の有無を切り替える。音声伝送モードにおいては、切替スイッチ140を140A側に、切替スイッチ142を142A側に接続し、実施の形態2による音声伝送モードでの符号化処理と同様の処理を行う。
【0071】
また、VBD伝送モードにおいては、切替スイッチ140を140B側に、切替スイッチ142を142B側に接続する。これにより、適応符号帳の探索処理は実行されず、励振信号の周期成分は0になる。VBDは繰り返し成分の少ない信号であるため、励振信号を更新成分のみで表現することも可能である。但し、VBD伝送モードから音声伝送モードへ復帰する時に備えて、VBD伝送モードにおいても、適応符号帳の更新動作は継続する。それ以外の音声符号化装置の各部の動作は、実施の形態2によるVBD伝送モードにおける音声符号化装置の符号化処理と同一である。
【0072】
また、このような構成とすることで、VBD伝送モードにおいては適応符号帳インデックスを送信する必要がなくなる。実施の形態4によるVBD伝送モードにおいて多重化部2から出力される符号化ビット列を図5(d)に示す。実施の形態2で説明したように、通常、モデム信号は自己相関の小さな信号であるため、VBD伝送モードにおいては、更新成分を表現する代数符号帳インデックスにより多くのビットを割り当てると伝送特性がよくなる。さらに実施の形態4では、適応符号帳インデックスを送信しないようにしたため、その分を代数符号帳インデックスで補完することにより、VBDの伝送特性をさらに向上させることが出来る。
【0073】
また、音声復号装置は、音声伝送モードにおいては、切替スイッチ141を141A側に接続し、実施の形態2による音声伝送モードでの動作と同様の復号処理を行う。受信した信号識別結果によりVBD伝送モードと判定された時は、切替スイッチ141を141B側に接続する。この場合、適応符号帳インデックスは受信した符号化ビット列中に含まれないので、励振信号の周期成分は0とし、更新成分のみで励振信号を構成し、合成フィルタ45に入力する。但し、音声符号化装置と同様、励振信号のフィードバックによる適応符号帳の更新動作はVBD伝送モードにおいても継続する。それ以外の音声復号装置の動作は、実施の形態2によるVBD伝送モードにおける復号処理と同一である。
【0074】
以上のように、この実施の形態4によれば、繰り返し成分の寄与が少ないVBD伝送モードで適応符号帳情報を送らない構成としたので、その分の情報量を代数符号帳インデックスに割り当てることが可能となるため、VBDの伝送特性を向上出来るという効果が得られる。また、処理負荷の大きい適応符号帳探索処理を省略できるため、より少ない処理負荷で実施の形態1と同様の効果を得ることができる。
【0075】
実施の形態5.
実施の形態5による音声符号化装置および復号装置の構成は、図1および図2で示された実施の形態1によるものと同様であるが、実施の形態5ではVBD伝送モードにおいて、サブフレームの周期を短くしている。
【0076】
図10は、実施の形態5における符号化処理単位を時系列で表現したものであり、図11は符号化フレーム構成を示したものである。それぞれ、図中(a)は音声伝送モード、(b)はVBD伝送モードにおけるものである。
【0077】
ITU−T勧告G.729の符号化フレーム長は10msecであるが、信号の微妙な変化を表現するためにサブフレームを設けて、適応符号帳インデックス、代数符号帳インデックス、利得符号帳インデックスの3つについては、サブフレーム単位で符号化を行っている。音声信号の場合、時間的な変化は緩やかなので、サブフレーム(5msec)区間内ではほぼ定常的と見なせるのに対し、VBDでは、伝送しようとするデジタル信号に応じて振幅変調を掛けているため、利得変化が音声信号に比べて激しい。そこで、サブフレーム周期を短くして、激しい利得変化に追従させることでSN比の向上を実現することができる。
【0078】
以上のように、この実施の形態5によれば、VBD伝送モードにおいては、利得符号帳のサブフレーム周期を短くしたことにより、VBDのSN比を向上出来るという効果が得られる。
【0079】
また、実施の形態5による音声符号化装置および復号装置は、実施の形態2から実施の形態4で示したものと同様の構成であってもよい。
【0080】
実施の形態6.
実施の形態6では、実施の形態1と同様に、音声符号化方式としてITU−T Recommendation G.729, ”Coding of Speech at 8kbit/s Using Conjugate−StructureAlgebraic−Code−Excited Linear−Prediction(CS−ACELP)”が用いられる。
図12は、この発明の実施の形態6による音声符号化装置の構成を示すブロック図である。図1または図8と同一の符号は、同一の機能を持つ構成要素を示している。図において、150は、信号識別部11の出力の信号識別結果に基づき端子の切替を行う切替スイッチ、151はVBD伝送モードにおいて使用することを目的とした第2の利得量子化符号帳である。
【0081】
また、図13は実施の形態6による音声復号装置の構成を示すブロック図である。図2または図9と同一の符号は、同一の機能を持つ構成要素を示している。図において152は、受信した信号識別結果に基づいて端子の切替を行う切替スイッチ、153は、第2の利得量子化符号帳151と同一の、第2の利得量子化符号帳である。
【0082】
実施の形態6では、信号識別部11が出力する信号識別結果に基づいて、使用する利得量子化符号帳を切り替えられるようになっている。音声伝送モードにおいては、音声符号化装置では切替スイッチ150を150A側に接続し、第1の利得量子化符号帳23を選択することにより実施の形態4による音声伝送モードでの符号化処理と同様の動作を行う。また、VBD伝送モードにおいては、切替スイッチ150を150B側に接続し、第2の利得量子化符号帳151を使用する。それ以外の音声符号化装置の各部の動作は、実施の形態4によるVBD伝送モードでの動作と同一である。
【0083】
図14は、VBDであるモデム信号の波形と音声信号波形の一例を示したものである。図のように、モデム信号は音声信号に比べ、ダイナミックレンジが狭くなっている。音声伝送モードにおいて使用する第1の利得量子化符号帳23は、音声信号のもつ広いダイナミックレンジをカバーするためにその分量子化ステップを粗くしている。一方、VBD伝送モードにおいては広いダイナミックレンジをカバーする必要がないため、第2の利得量子化符号帳151は第1の利得量子化符号帳23よりも量子化ステップを細かくし、SN比の向上を図れるような作りになっている。
【0084】
また、音声復号装置については、音声伝送モードにおいては、切替スイッチ152を152A側に接続し、第1の利得量子化符号帳40を選択することで、実施の形態4による音声伝送モードでの復号処理と同様の動作を行う。VBD伝送モードにおいては、切替スイッチ152を152B側に接続し、受信した利得符号帳インデックスを元に利得値を抽出する動作においては、第2の利得量子化符号帳153を参照するようにする。それ以外の音声復号装置の各部の動作は、実施の形態4によるVBD伝送モードにおける動作と同一である。
【0085】
以上のように、この実施の形態6によれば、ダイナミックレンジの狭いVBD伝送モードにおいて利得量子化符号帳をVBDに適したものに切り替える構成としたので、SN比が向上し、VBDの伝送特性を向上させるという効果が得られる。
【0086】
実施の形態7.
図15は、この発明の実施の形態7による音声符号化装置の構成を示すブロック図である。図1と同一の符号は、同一の機能を持つ構成要素を示している。160は、信号識別部(信号特性識別部)であり、最小自乗誤差探索部29の計算結果を用いて、信号識別結果を出力する。
実施の形態7による音声符号化装置、音声復号装置の各モードでの動作は、信号識別部がモードの判定のために用いる信号が信号識別部11と異なる以外は、実施の形態1に示した音声符号化装置、音声復号装置と同一である。
【0087】
音声符号化装置の動作について説明する。
まず、音声伝送モードにて符号化処理を仮実行する。符号化処理を実行することで、最小自乗誤差探索部29において最小の誤差パワーが得られる。信号識別部では、この最小誤差パワーの値を受け取る。音声信号入力時は、VBD信号入力時に比べ誤差パワーが比較的小さくなることを利用して、最小誤差パワーがある閾値を下回った場合は信号識別部の判定結果を「音声モード」とする。仮実行した結果を得られた符号化データはそのまま伝送路7に出力する。最小誤差パワーがある閾値を上回る場合、信号識別部の判定結果を「VBDモード」とする。その場合は、さらにVBD伝送モードでの符号化処理を実行し、その結果得られた符号化データを伝送路7に出力する。
【0088】
以上のように、この実施の形態7によれば、信号識別部を、符号化処理の過程で得られた最小自乗誤差パラメータを流用する構成としたので、信号識別部の構成を簡略化することが出来るという効果が得られる。また、実施の形態1による信号識別部11と併用することで、信号識別の精度の向上も可能となる。
【0089】
実施の形態8.
実施の形態8では、実施の形態1と同様に、音声符号化方式として、ITU−T Recommendation G.729, ”Coding of Speech at 8kbit/s Using Conjugate−Structure Algebraic−Code−Excited Linear−Prediction(CS−ACELP)”が用いられる。
図16は、この発明の実施の形態8による音声符号化装置の構成を示すブロック図である。図1または図15と同一の符号は、同一の機能を持つ構成要素を示している。図において、170は第3の代数符号帳(音声帯域データ信号対応雑音符号帳)、172は第4の代数符号帳(音声帯域データ信号対応雑音符号帳)である。第3の代数符号帳170および第4の代数符号帳172は、第1の代数符号帳16より、出力のサンプリング周波数が高くなっている。また、171は、第3の代数符号帳170の出力を、第1の代数符号帳16の出力と同じサンプリング周波数に変換する第3のダウンサンプリング部(サンプリング周波数変換部)、173は、第4の代数符号帳172の出力を、第1の代数符号帳16の出力と同じサンプリング周波数に変換する、第4のダウンサンプリング部(サンプリング周波数変換部)である。178は、信号識別部より出力された識別結果に基づき、第1の代数符号帳16、第2の代数符号帳18、第3の代数符号帳170、第4の代数符号帳172の選択を行う切替スイッチである。
【0090】
また、図17は、この発明の実施の形態8による音声復号装置の構成を示すブロック図である。図2と同一の符号は、同一の機能を持つ構成要素を示している。図において、174は、第3の代数符号帳170と同一の第3の代数符号帳(音声帯域データ信号対応雑音符号帳)、175は、第3のダウンサンプリング部171と同一の機能を有する第3のダウンサンプリング部(サンプリング周波数変換部)、176は、第4の代数符号帳172と同一の第4の代数符号帳(音声帯域データ信号対応雑音符号帳)、177は、第4のダウンサンプリング部173と同一の機能を有する第4のダウンサンプリング部(サンプリング周波数変換部)である。
【0091】
実施の形態8では、サンプリング周波数の異なる代数符号帳を複数備え、信号識別部の出力する信号識別結果に応じて、適応的に符号帳を切り替えられるようにしたことである。例えば、第2の代数符号帳18は、サンプリング周波数=48kHzとする。第3の代数符号帳170は、サンプリング周波数=32kHzとする。第4の代数符号帳172は、サンプリング周波数=24kHzとする。また、信号識別部において、判定閾値を3つ(すなわち、モード設定を4段階)持つようにし、それぞれ誤差パワーの小さい順に第1の閾値、第2の閾値、第3の閾値とする。
【0092】
信号識別部において、最小誤差パワーが第1の閾値を下回る場合を、「音声伝送モード」とし、この場合は、切替スイッチ178を178Aに接続し、実施の形態1による音声伝送モードでの動作と同様の符号化処理を行う。
【0093】
信号識別部において、最小誤差パワーが、第1の閾値を上回り、第2の閾値を下回る場合を、「第1のVBD伝送モード」とする。この場合は、切替スイッチ178を178Dに接続し、第4の代数符号帳172を選択し、実施の形態1によるVBD伝送モードでの動作と同様の符号化処理を行う。
【0094】
信号識別部において、最小誤差パワーが、第2の閾値を上回り、第3の閾値を下回る場合を「第2のVBD伝送モード」とする。この場合は、切替スイッチ178を178Cに接続し、第3の代数符号帳170を選択し、実施の形態1によるVBD伝送モードでの動作と同様の符号化処理を行う。
【0095】
信号識別部において、最小誤差パワーが、第3の閾値を上回る場合を、「第3のVBD伝送モード」とする。この場合は、切替スイッチ178を178Bに接続し、第2の代数符号帳18を選択し、実施の形態1によるVBD伝送モードでの動作と同様の符号化処理を行う。
【0096】
以上のように、この実施の形態8によれば、VBD伝送モードを複数持たせたことにより、代数符号帳のビットレートを適応的に変えることが出来るため、代数符号帳インデックスに割り当てるビット数を適応的に変えることが出来る。そのためVBDの伝送特性を維持しつつ、より効率的な伝送が可能となるという効果が得られる。
【0097】
実施の形態9.
図18は、この発明の実施の形態9による音声符号化装置の構成を示すブロック図である。図1から図16までの各図と同一の符号は、同一の機能を持つ構成要素を示している。図において、181は、音声符号化装置における符号化動作を、第2の代数符号帳の持つサンプリング周波数に合わせるための第1のアップサンプリング部(第1のサンプリング周波数上昇部)である。また、182は、第1の代数符号帳16の持つサンプリング周波数を第2の代数符号帳18のサンプリング周波数に変換する第2のアップサンプリング部(第2のサンプリング周波数上昇部)である。例えば、第1の代数符号帳16のサンプリング周波数を8kHz、第2の代数符号帳18のサンプリング周波数を48kHzとすると、第1のアップサンプリング部181および第2のアップサンプリング部182は、8kHz→48kHzにアップサンプリングを行う。これにより、ここでは、符号化動作は全て48kHzのサンプリング周波数で実行される。サンプリング周波数が異なる点を除いては、実施の形態1による符号化処理の動作と同一である。
【0098】
上記のような構成としても、実施の形態1で示した効果と同等の効果を得ることが出来る。
【0099】
実施の形態10.
図19は、この発明の実施の形態10による音声符号化装置の構成を示すブロック図である。図18と同一の符号は、同一の機能を持つ構成要素を示している。図において、190は、アップサンプリングされた音声信号の各サンプルの量子化ビット数の縮退動作を行う量子化ビット縮退部である。
【0100】
実施の形態10では、量子化ビット縮退部190により、例えば、アップサンプリングされた音声信号を1ビットで量子化する。代数符号帳も1ビットで表現されていることから、減算器27での誤差信号の計算、最小自乗誤差探索部29での誤差パワーの計算を大幅に簡略化できるといった効果がある。
【0101】
【発明の効果】
以上のように、この発明によれば、音声帯域データ伝送時には、雑音符号帳のサンプリングレートを音声帯域データ信号伝送に適した高さに切り替えるようにしたので、FAX/モデム信号など音声帯域データ信号の高速伝送が可能で、かつ、音声信号伝送モードと音声帯域データ信号伝送モードとの間でシームレスなモード切替が可能な、音声符号化装置および復号装置を得られるという効果がある。
【0102】
この発明によれば、音声帯域データ信号伝送時には、送信する符号化ビット列にLSP量子化符号帳の情報を含めないようにし、その分のビット列を雑音符号帳に割り当てるようにしたので、音声帯域データ伝送モードでの伝送特性がさらに向上するという効果がある。
【0103】
この発明によれば、音声帯域データ信号伝送時には、聴覚重み付けフィルタとポストフィルタを無効にしたので、符号化処理を簡略化し、かつSN比の高い音声帯域データ伝送モードでの伝送を実現出来るという効果がある。
【0104】
この発明によれば、音声帯域データ信号伝送時には、送信する符号化ビット列に適応符号帳の情報を含めないようにし、その分のビット列を雑音符号帳に割り当てるようにしたので、音声帯域データ伝送モードでの伝送特性がさらに向上するという効果がある。
【0105】
この発明によれば、音声帯域データ信号伝送時には、利得符号帳のサブフレーム周期を短くしたことにより、音声帯域データのSN比を向上出来るという効果がある。
【0106】
この発明によれば、音声帯域データ信号伝送時には、利得量子化符号帳を音声帯域データ信号に適したものに切り替える構成としたので、音声帯域データのSN比を向上出来るという効果がある。
【0107】
この発明によれば、符号化モードを決定するための信号識別に、合成信号の誤差パワー値を用いるようにしたので、信号識別処理が簡略化出来るとともに、判定制度を上げることが出来るという効果がある。
【図面の簡単な説明】
【図1】この発明の実施の形態1による音声符号化装置の構成を示すブロック図である。
【図2】この発明の実施の形態1による音声復号装置の構成を示すブロック図である。
【図3】この発明の実施の形態2による音声符号化装置の構成を示すブロック図である。
【図4】この発明の実施の形態2による音声復号装置の構成を示すブロック図である。
【図5】多重化部から出力される符号化ビット列を示す図である。
【図6】この発明の実施の形態3による音声符号化装置の構成を示すブロック図である。
【図7】この発明の実施の形態3による音声復号装置の構成を示すブロック図である。
【図8】この発明の実施の形態4による音声符号化装置の構成を示すブロック図である。
【図9】この発明の実施の形態4による音声復号装置の構成を示すブロック図である。
【図10】この発明の実施の形態5における符号化処理単位を時系列で表現したものである。
【図11】この発明の実施の形態5における符号化フレーム構成を示したものである。
【図12】この発明の実施の形態6による音声符号化装置の構成を示すブロック図である。
【図13】この発明の実施の形態6による音声復号装置の構成を示すブロック図である。
【図14】モデム信号の波形と音声信号波形の一例を示した図である。
【図15】この発明の実施の形態7による音声符号化装置の構成を示すブロック図である。
【図16】この発明の実施の形態8による音声符号化装置の構成を示すブロック図である。
【図17】この発明の実施の形態8による音声復号装置の構成を示すブロック図である。
【図18】この発明の実施の形態9による音声符号化装置の構成を示すブロック図である。
【図19】この発明の実施の形態10による音声符号化装置の構成を示すブロック図である。
【図20】DCMEを適用した国際長距離通信網の構成を示す図である。
【図21】DCMEの基本構成を示す図である
【図22】16kbit/sのLD−CELP方式を用いた音声符号化装置および復号装置の構成を示すブロック図である。
【図23】40kbit/s LD−CELP方式を用いた音声符号化装置および復号装置の構成を示すブロック図である。
【図24】8kbit/s CS−ACELP方式を用いた音声符号化装置の構成を示すブロック図である。
【図25】8kbit/s CS−ACELP方式を用いた音声復号装置の構成を示すブロック図である。
【符号の説明】
2 多重化部、3 割当制御部、5 多重分離部、6 メッセージ解読部、7伝送路、8 線形予測分析部、9 LPC/LSP変換部、10 LSP量子化部、11 信号識別部、12,30 LSP量子化符号帳、13,43 LSP逆量子化部、14,44 LSP/LPC変換部、15,31 適応符号帳、16,32 第1の代数符号帳(第1の雑音符号帳)、17,33 ピッチプレフィルタ、18,34 第2の代数符号帳(第2の雑音符号帳)、19,35 ダウンサンプリング部(第1のサンプリング周波数変換部)、20 切替スイッチ、21,22 乗算器、23,40 利得量子化符号帳、24,41 MA予測部、25 加算器、26,45 合成フィルタ、27 減算器、28 聴覚重み付けフィルタ、29 最小自乗誤差探索部、36,37 切替スイッチ、38,39 乗算器、42 加算器、46 ポストフィルタ、120,122,123 切替スイッチ、121 LSP固定パターン、130,131,132,133 切替スイッチ、140,141,142 切替スイッチ、150,152切替スイッチ、151,153 第2の利得量子化符号帳、160 信号識別部(信号特性識別部)、170,174 第3の代数符号帳(音声帯域データ信号対応雑音符号帳)、171,175 第3のダウンサンプリング部(サンプリング周波数変換部)、172,176 第4の代数符号帳(音声帯域データ信号対応雑音符号帳)、173,177 第4のダウンサンプリング部(サンプリング周波数変換部)、178,179,180 切替スイッチ、181 第1のアップサンプリング部(第1のサンプリング周波数上昇部)、182 第2のアップサンプリング部(第1のサンプリング周波数上昇部)、190 量子化ビット縮退部。
Claims (17)
- 適応符号帳と、第1の雑音符号帳と、利得量子化符号帳と、LSP量子化符号帳による出力をパラメータとして合成音声信号を生成し、上記合成音声信号と入力音声信号との誤差に対して聴覚重み付けフィルタにより聴覚的な重み付けを行い、出力信号の情報として上記誤差が最小となる最適なパラメータの組み合わせを探索する音声符号化装置において、
出力のサンプリング周波数が上記第1の雑音符号帳よりも高い第2の雑音符号帳と、
上記第2の雑音符号帳の出力を上記第1の雑音符号帳の出力と同じサンプリング周波数に変換する第1のサンプリング周波数変換部とを備え、
入力信号が音声帯域データ信号である場合には、上記第1の雑音符号帳の出力に代えて上記第1のサンプリング周波数変換部により変換された上記第2の雑音符号帳の出力をパラメータとして用いることを特徴とする音声符号化装置。 - 音声帯域データ信号伝送に対応したLSP固定パターンを備え、
音声帯域データ信号伝送時には、LSP量子化符号帳の出力に代えて上記LSP固定パターンを用いて生成した出力をパラメータとして用い、さらに送信信号中にLSP量子化符号帳の情報を含めず、その分のビット数を第2の雑音符号帳の情報に割り当てることを特徴とする請求項1記載の音声符号化装置。 - 音声帯域データ信号伝送時には、聴覚重み付けフィルタを無効にすることを特徴とする請求項1記載の音声符号化装置。
- 音声帯域データ信号伝送時には、送信信号中に適応符号帳の情報を含めずその分のビット数を第2の雑音符号帳の情報に割り当てることを特徴とする請求項1記載の音声符号化装置。
- 音声帯域データ信号伝送時には、利得量子化符号帳の更新周期を短くすることを特徴とする請求項1記載の音声符号化装置。
- 音声帯域データ信号伝送に対応した第2の利得量子化符号帳を備え、
音声帯域データ信号伝送時には、利得量子化符号帳に代えて上記第2の利得量子化符号帳の出力をパラメータとして用いることを特徴とする請求項1記載の音声符号化装置。 - 合成音声信号と入力音声信号との誤差が最小となる最適なパラメータの組み合わせを探索する最小自乗誤差探索部により出力される上記誤差の最小値に基づいて、入力信号が音声信号であるか音声帯域データ信号であるかを判断する信号特性識別部を備えた請求項1記載の音声符号化装置。
- 出力のサンプリング周波数が第1の雑音符号帳よりも高く、それぞれが第2の雑音符号帳とは異なった値を持つ複数の音声帯域データ信号対応雑音符号帳と、
上記複数の音声帯域データ信号対応雑音符号帳の出力を上記第1の雑音符号帳の出力と同じサンプリング周波数に変換する複数のサンプリング周波数変換部を備え、
音声帯域データ伝送時には、入力信号の特性に応じて上記複数の音声帯域データ信号対応雑音符号帳または上記第2の雑音符号帳から1つを選択し、その出力を上記複数のサンプリング周波数変換部または第1のサンプリング周波数変換部により変換してパラメータとして用いることを特徴とする請求項1記載の音声符号化装置。 - 入力信号のサンプリング周波数を第2の雑音符号帳のサンプリング周波数に変換する第1のサンプリング周波数上昇部と、第1の雑音符号帳の出力を上記第2の雑音符号帳の出力と同じサンプリング周波数に変換する第2のサンプリング周波数上昇部とを備えた請求項1記載の音声符号化装置。
- 音声帯域データ信号伝送時には、入力信号の量子化ビット数を代数符号帳の量子化ビット数に合わせて落とす、量子化ビット縮退部を備えたことを特徴とする請求項9記載の音声符号化装置。
- 音声信号を合成するための、適応符号帳、第1の雑音符号帳、利得量子化符号帳およびLSP量子化符号帳の情報を含む入力信号を受信し、ポストフィルタにおいて出力音声信号の特徴周波数成分を強調する音声復号装置において、
出力のサンプリング周波数が上記第1の雑音符号帳よりも高い第2の雑音符号帳と、
上記第2の雑音符号帳の出力を上記第1の雑音符号帳の出力と同じサンプリング周波数に変換する第1のサンプリング周波数変換部とを備え、
入力信号が音声帯域データ信号である場合には、上記第1の雑音符号帳の出力に代えて上記第1のサンプリング周波数変換部により変換された上記第2の雑音符号帳の出力をパラメータとして用いることを特徴とする音声復号装置。 - 音声帯域データ信号伝送に対応したLSP固定パターンを備え、
音声帯域データ信号伝送時には、LSP量子化符号帳の情報が含まれない受信信号を受信し、上記LSP固定パターンを用いて生成した出力をLSP量子化符号帳の出力に代えてパラメータとして用いることを特徴とする請求項11記載の音声復号装置。 - 音声帯域データ信号伝送時には、ポストフィルタを無効にすることを特徴とする請求項11記載の音声復号装置。
- 音声帯域データ信号伝送時には、適応符号帳の情報が含まれない受信信号を受信し、復号処理を行うことを特徴とする請求項11記載の音声復号装置。
- 音声帯域データ信号伝送時には、利得量子化符号帳の更新周期を短くすることを特徴とする請求項11記載の音声復号装置。
- 音声帯域データ信号伝送に対応した第2の利得量子化符号帳を備え、
音声帯域データ信号伝送時には、利得量子化符号帳に代えて上記第2の利得量子化符号帳の出力をパラメータとして用いることを特徴とする請求項11記載の音声復号装置。 - 出力のサンプリング周波数が第1の雑音符号帳よりも高く、それぞれが第2の雑音符号帳とは異なった値を持つ複数の音声帯域データ信号対応雑音符号帳と、
上記複数の音声帯域データ信号対応雑音符号帳の出力を上記第1の雑音符号帳の出力と同じサンプリング周波数に変換する複数のサンプリング周波数変換部を備え、
音声帯域データ伝送時には、入力信号の特性に応じて上記複数の音声帯域データ信号対応雑音符号帳または上記第2の雑音符号帳から1つを選択し、その出力を上記複数のサンプリング周波数変換部または第1のサンプリング周波数変換部により変換してパラメータとして用いることを特徴とする請求項11記載の音声復号装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002207312A JP2004053676A (ja) | 2002-07-16 | 2002-07-16 | 音声符号化装置および復号装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002207312A JP2004053676A (ja) | 2002-07-16 | 2002-07-16 | 音声符号化装置および復号装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004053676A true JP2004053676A (ja) | 2004-02-19 |
Family
ID=31931811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002207312A Pending JP2004053676A (ja) | 2002-07-16 | 2002-07-16 | 音声符号化装置および復号装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004053676A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010210680A (ja) * | 2009-03-06 | 2010-09-24 | Ntt Docomo Inc | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
JP2012088729A (ja) * | 2011-12-06 | 2012-05-10 | Ntt Docomo Inc | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
US20220415341A1 (en) * | 2018-05-10 | 2022-12-29 | Nippon Telegraph And Telephone Corporation | Pitch emphasis apparatus, method and program for the same |
-
2002
- 2002-07-16 JP JP2002207312A patent/JP2004053676A/ja active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010210680A (ja) * | 2009-03-06 | 2010-09-24 | Ntt Docomo Inc | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
KR101175555B1 (ko) | 2009-03-06 | 2012-08-21 | 가부시키가이샤 엔.티.티.도코모 | 소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 소리 신호 부호화 프로그램, 및 소리 신호 복호 프로그램 |
KR101175553B1 (ko) | 2009-03-06 | 2012-08-23 | 가부시키가이샤 엔.티.티.도코모 | 소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 소리 신호 부호화 프로그램, 및 소리 신호 복호 프로그램 |
TWI385648B (zh) * | 2009-03-06 | 2013-02-11 | Ntt Docomo Inc | An audio signal coding method, an audio signal decoding method, an encoding apparatus, a decoding apparatus, an audio signal processing system, an audio signal coding program recording medium, and an audio signal decoding program recording medium |
KR101256542B1 (ko) | 2009-03-06 | 2013-04-19 | 가부시키가이샤 엔.티.티.도코모 | 소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 및 소리 신호 부호화 프로그램 및 소리 신호 복호 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체 |
US8666754B2 (en) | 2009-03-06 | 2014-03-04 | Ntt Docomo, Inc. | Audio signal encoding method, audio signal decoding method, encoding device, decoding device, audio signal processing system, audio signal encoding program, and audio signal decoding program |
US8751245B2 (en) | 2009-03-06 | 2014-06-10 | Ntt Docomo, Inc | Audio signal encoding method, audio signal decoding method, encoding device, decoding device, audio signal processing system, audio signal encoding program, and audio signal decoding program |
US9214161B2 (en) | 2009-03-06 | 2015-12-15 | Ntt Docomo, Inc. | Audio signal encoding method, audio signal decoding method, encoding device, decoding device, audio signal processing system, audio signal encoding program, and audio signal decoding program |
JP2012088729A (ja) * | 2011-12-06 | 2012-05-10 | Ntt Docomo Inc | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
US20220415341A1 (en) * | 2018-05-10 | 2022-12-29 | Nippon Telegraph And Telephone Corporation | Pitch emphasis apparatus, method and program for the same |
US11749295B2 (en) * | 2018-05-10 | 2023-09-05 | Nippon Telegraph And Telephone Corporation | Pitch emphasis apparatus, method and program for the same |
US20230386498A1 (en) * | 2018-05-10 | 2023-11-30 | Nippon Telegraph And Telephone Corporation | Pitch emphasis apparatus, method and program for the same |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4731775B2 (ja) | スーパーフレーム構造のlpcハーモニックボコーダ | |
KR101000345B1 (ko) | 음성 부호화 장치, 음성 복호화 장치 및 그 방법 | |
CA2347667C (en) | Periodicity enhancement in decoding wideband signals | |
US7596492B2 (en) | Apparatus and method for concealing highband error in split-band wideband voice codec and decoding | |
JP4583093B2 (ja) | ビット率拡張音声符号化及び復号化装置とその方法 | |
KR101061404B1 (ko) | 가변 레이트로 오디오를 인코딩 및 디코딩하는 방법 | |
JP2002055699A (ja) | 音声符号化装置および音声符号化方法 | |
CN101006495A (zh) | 语音编码装置、语音解码装置、通信装置以及语音编码方法 | |
WO2004023457A1 (ja) | 音響符号化装置及び音響符号化方法 | |
WO2005081232A1 (ja) | 通信装置及び信号符号化/復号化方法 | |
JPH11126098A (ja) | 音声合成方法及び装置、並びに帯域幅拡張方法及び装置 | |
KR20030041169A (ko) | 무성 음성의 코딩 방법 및 장치 | |
US20040111257A1 (en) | Transcoding apparatus and method between CELP-based codecs using bandwidth extension | |
JP5313967B2 (ja) | ビット率拡張音声符号化及び復号化装置とその方法 | |
US20040102966A1 (en) | Apparatus and method for transcoding between CELP type codecs having different bandwidths | |
JP5255575B2 (ja) | レイヤード・コーデックのためのポストフィルタ | |
JP3237178B2 (ja) | 符号化方法及び復号化方法 | |
JP2004053676A (ja) | 音声符号化装置および復号装置 | |
JP2008139447A (ja) | 音声符号化装置及び音声復号装置 | |
JP4578145B2 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
JP6713424B2 (ja) | 音声復号装置、音声復号方法、プログラム、および記録媒体 | |
JP3475772B2 (ja) | 音声符号化装置および音声復号装置 | |
JP4347323B2 (ja) | 音声符号変換方法及び装置 | |
JP3576485B2 (ja) | 固定音源ベクトル生成装置及び音声符号化/復号化装置 | |
JP2002073097A (ja) | Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法 |