JPH09152896A

JPH09152896A - 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置

Info

Publication number: JPH09152896A
Application number: JP7312548A
Authority: JP
Inventors: Hiromi Aoyanagi; 弘美青柳
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1995-11-30
Filing date: 1995-11-30
Publication date: 1997-06-10
Also published as: US5826221A

Abstract

(57)【要約】【課題】声道予測係数が大きく変動しても、平均的な
符号化レートを余り増加させることなく高い品質で忠実
に再生音声を出力すること。【解決手段】声道予測係数変換・量子化部２０２は、
声道予測係数ａ１〜ａ４をＬＳＰ係数に変換したのち量
子化し、ＬＳＰ係数量子化値ＬｓｐＱ１〜ＬｓｐＱ４
と、インデックスＩ１〜Ｉ４を同時に出力して符号化モ
ード判定部２１０に与える。符号化モード判定部２１０
は、ＬＳＰ係数量子化値ＬｓｐＱ１〜ＬｓｐＱ４と、前
フレームの第４サブフレームのＬＳＰ係数量子化値Ｌｓ
ｐＱ４ｐと、各量子化値のインデックスＩ１〜Ｉ４とか
ら、三つのモードを仮定し、現フレームをどのモードで
符号化するかを判定して、モード符号情報と量子化符号
情報Ｌとを出力する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、声道予測係数符号
化・復号化回路、声道予測係数符号化回路、声道予測係
数復号化回路、音声符号化装置及び音声復号化装置に関
し、特に声道予測係数の変動に対処するものである。

【０００２】

【従来の技術】近年、４ｋｂｉｔ／ｓ以下の低ビットレ
ート音声符号化方式は、次世代のデジタル自動車電話な
どの分野において需要が急増している。

【０００３】現在、音声に対する符号・復号方式にはコ
ード励振線形予測（ＣＥＬＰ：ＣｏｄｅＥｘｃｉｔｅ
ｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ）符号化方
式、マルチパルス励振（ＭＰＥ：ＭｕｌｔｉＰｕｌｓ
ｅＥｘｉｃｉｔａｔｉｏｎ）線形予測符号化方式等、
音源情報と声道情報を分離して各々符号化する方式が広
く用いられている。

【０００４】例えば、ＣＥＬＰにおいて、ビットレート
を低減するためには音源だけでなく、ＬＳＰ（Ｌｉｎｅ
ＳｐｅｃｔｒｕｍＰａｉｒ）パラメータの効率的な
量子化法が必要である。ＣＥＬＰ方式では一定間隔のフ
レームを更に分割したサブフレーム毎に処理が行われる
ため、ＬＳＰの量子化において音質を劣化させずにビッ
トレートを下げるためには、フレーム内で定めたＬＳＰ
をサブフレーム毎に補間する方法が重要となる。

【０００５】声道情報の符号化は、例えば下記の文献で
開示されている。文献名：野村、小澤、「ＬＳＰパラメータの効率的な量
子化・補間法の検討」１９９３年電子情報通信学会秋季
大会、Ａ−１４２、ページ１−１４４。

【０００６】上記文献では、フレーム全体の量子化性能
を向上させることを目的として、量子化法と補間法との
組み合わせを検討している。上記文献では、フレーム毎
に声道予測係数（ＬＳＰパラメータ）を量子化し、サブ
フレーム処理では補間値を用いている。即ち、上記文献
においては、現フレームの量子化値の候補を予備選択
し、それぞれの候補と前フレームの量子化値とを用いて
サブフレーム毎に補間している。

【０００７】量子化法においては、フレーム全体の量子
化性能を上げるため補間に多くのビットを割り振るに
は、より少ないビット数で歪みの小さい量子化器が必要
となるので、ベクトル−スカラー量子化と、多段−分割
ベクトル量子化をもとに検討されている。

【０００８】また、高品質な再生音を得るには、サブフ
レーム毎にＬＳＰパラメータを量子化することが良いと
考えられるが、ビットレートが高くなるので、フレーム
毎に量子化を行い、その量子化値と前フレームの量子化
値を用いてサブフレーム毎に補間値を求める。補間法と
して、直接補間値を用いる方法や直接補間誤差をベクト
ル量子化する方法があるが、補間ベクトルｘｉを直線補
間値で表すよりも、ｘｉ＝ａｘｐ＋（１−ａ）ｘｎのよ
うに補間係数ａを用いて表すことが効果的であると考え
られる。ここで、ｘｎは現フレームの量子化値、ｘｐは
前フレームの量子化値である。

【０００９】補間係数ａをスカラー量子化する方法と、
補間係数をスカラー量子化した上でその誤差ベクトルｅ
をベクトル量子化する方法とが検討されている。そし
て、補間ベクトルｘｉは、ｘｉ＝ａｘｐ＋（１−ａ）ｘ
ｎ＋ｅと表される。補間係数と誤差ベクトルを組み合わ
せることによって、誤差ベクトルの量子化性能が直線補
間だけのときの誤差ベクトルよりも良くするものであ
る。

【００１０】

【発明が解決しようとする課題】しかしながら、入力音
声によってはフレーム内においても声道情報が大きく変
動する場合があり、従来の補間処理では充分に声道情報
の変動に追従できず再生音声品質を劣化させてしまうと
いう問題がある。

【００１１】このようなことから、声道予測係数が大き
く変動しても、平均的な符号化レートを余り増加させる
ことなく高い品質で忠実に再生音声を出力することがで
きる声道予測係数符号化・復号化回路、声道予測係数符
号化回路、声道予測係数復号化回路、音声符号化装置及
び音声復号化装置の提供が要請されている。

【００１２】

【課題を解決するための手段】そこで、本発明は、入力
フレーム音声信号から声道予測係数を求めて、これを符
号化する声道予測係数符号化回路と、この声道予測係数
符号化回路からの符号化信号から声道予測係数を再生す
る声道予測係数復号化回路とからなる声道予測係数符号
化・復号化回路であって、上記声道予測係数符号化回路
は、入力フレーム音声信号からいくつかのサブフレーム
に対する声道予測係数を求める声道予測係数生成手段
と、上記各サブフレーム単位の声道予測係数から各ＬＳ
Ｐ係数を求め、これらのＬＳＰ係数をそれぞれ量子化し
た各ＬＳＰ係数量子化値を出力するＬＳＰ係数量子化手
段と、上記各ＬＳＰ係数量子化値から、フレーム内の声
道予測係数の変動状態を分析し、この分析結果から、予
め備えられている声道予測係数の量子化・補間のモード
のいずれを表すか否かを判定する量子化・補間モード判
定処理部の判定処理に従って、量子化・補間モード情報
と、いずれのサブフレームのＬＳＰ係数量子化値を伝送
するかを表すＬＳＰ係数量子化値情報とを生成出力する
符号化モード判定手段とを備える。

【００１３】上記声道予測係数復号化回路は、予め上記
量子化・補間モード判定処理部を備えていて、上記量子
化・補間モード情報とＬＳＰ係数量子化値情報とからフ
レーム内の全サブフレームのＬＳＰ係数を再生するＬＳ
Ｐ係数再生手段と、上記全サブフレームのＬＳＰ係数か
ら対応する全サブフレームの声道予測係数を再生する声
道予測係数再生手段とを備えて、上述の課題を解決する
ものである。

【００１４】このような構成をとることで、フレーム内
声道予測係数の変動状態に応じて量子化・補間モード判
定処理部の判定処理に従って、いずれかのサブフレーム
のＬＳＰ係数量子化値情報と量子化・補間モード情報と
を適応的に選択出力し、声道予測係数復号化回路では、
量子化・補間モード判定処理部を使用してＬＳＰ係数量
子化値情報と量子化・補間モード情報とからフレーム内
の全サブフレームのＬＳＰ係数を再生し、これらのサブ
フレームのＬＳＰ係数から対応する全サブフレームの声
道予測係数を再生するので、声道予測係数の変動が大き
い場合であっても、補間とサブフレームのＬＳＰ係数量
子化値とを使用して、忠実に声道予測係数を再生するこ
とができる。

【００１５】また、サブフレームに対してＬＳＰ係数量
子化値を適用する場合は、ＬＳＰ係数量子化値情報の伝
送情報が必要になるが、サブフレームに対する補間値を
適用する場合は、量子化・補間モード情報を送るだけで
伝送情報が大幅に軽減される。従って、フレームごとの
伝送レートが可変となる。

【００１６】このようなことから、声道予測係数が大き
く変動しても、平均的な符号化レートを余り増加させる
ことなく高い品質で忠実に再生音声を出力することがで
きるのである。

【００１７】

【発明の実施の形態】次に本発明の好適な実施の形態を
図面を用いて説明する。そこで、本実施の形態において
は、フレーム内声道情報の変動具合に応じて、サブフレ
ーム処理で用いる声道予測係数値として量子化値にする
か、補間値にするかを適応的に選択するものである。量
子化値を用いる場合には符号化ビットを必要とし、補間
値を用いる場合は、符号化ビットを必要としないためフ
レーム毎の符号化ビット数は可変となる。

【００１８】具体的には、本実施の形態の声道予測係数
符号化回路は、入力音声信号よりフレーム単位に声道予
測係数を計算し、前記声道予測係数を量子化して量子化
符号を復号器に伝送する声道予測係数符号回路におい
て、入力音声信号よりフレームを更に分割したサブフレ
ーム単位に声道予測係数を計算し、サブフレーム毎に得
られた前記声道予測係数を各々量子化して量子化値及び
量子化符号を計算し、各サブフレームに対する補間値を
計算し、前記量子化値と前記補間値の差分値を計算し、
前記差分値により各サブフレームで前記量子化値を用い
るか前記補間値を用いるかを選択し、前記量子化を用い
ると判断したサブフレームの前記量子化符号と前記選択
結果情報を伝送するように構成するものである。

【００１９】また、声道予測係数符号化回路からの情報
により声道予測係数を復号する声道予測係数復号器にお
いて、声道予測係数符号器からの伝送情報を元に、サブ
フレーム単位に声道予測係数を復号するように構成する
ものである。

【００２０】図１は声道予測係数符号化回路の機能構成
図である。この図１において、声道予測係数符号化回路
は、声道分析部２０１と、声道予測係数変換・量子化部
２０２と、符号化モード判定部２１０とから構成されて
いる。

【００２１】声道分析部２０１は、フレーム単位にまと
められて入力される入力音声信号Ｓに対して、サブフレ
ーム単位で声道予測係数（ＬＰＣ係数）ａを求めて声道
予測係数変換・量子化部２０２に与える。ここで、本実
施の形態においては、サブフレームを４とするため、声
道予測係数（ＬＰＣ係数）ａ１〜ａ４を声道予測係数変
換・量子化部２０２に与えるものである。

【００２２】声道予測係数変換・量子化部２０２は、声
道予測係数（ＬＰＣ係数）ａ１〜ａ４をＬＳＰ（Ｌｉｎ
ｅＳｐｅｃｔｒｕｍＰａｉｒ）係数に変換したのち
量子化し、ＬＳＰ係数量子化値ＬｓｐＱ１、ＬｓｐＱ
２、ＬｓｐＱ３、ＬｓｐＱ４を出力して符号化モード判
定部２１０に与える。また、各量子化値のインデックス
（符号）Ｉ１、Ｉ２、Ｉ３、Ｉ４、を同時に出力して符
号化モード判定部２１０に与える。

【００２３】符号化モード判定部２１０は、ＬＳＰ係数
量子化値ＬｓｐＱ１〜ＬｓｐＱ４と、前フレームの第４
サブフレームのＬＳＰ係数量子化値ＬｓｐＱ４ｐと、各
量子化値のインデックス（符号）Ｉ１〜Ｉ４とから、図
２の三つのモードを仮定し、現フレームをどのモードで
符号化するかを判定して、モード符号情報（量子化・補
間モード情報）と量子化符号情報Ｌ（ＬＳＰ係数量子化
値情報）とを出力する。

【００２４】この図２において、モード１では、第１サ
ブフレームは補間値を使用し、第２サブフレームは補間
値を使用し、第３サブフレームは補間値を使用し、第４
サブフレームは量子化値を使用するものである。

【００２５】更に、モード２では、第１サブフレームは
補間値を使用し、第２サブフレームは量子化値を使用
し、第３サブフレームは補間値を使用し、第４サブフレ
ームは量子化値を使用するものである。

【００２６】更にまた、モード３では、第１サブフレー
ムは量子化値を使用し、第２サブフレームは量子化値を
使用し、第３サブフレームは量子化値を使用し、第４サ
ブフレームは量子化値を使用するものである。このモー
ドの場合は、補間を行わず、全て量子化値を出力するも
のである。

【００２７】ここでのモード判定法は以下の通りであ
る。先ず、前フレームで得られた第４サブフレームのＬ
ＳＰ係数量子化値（ＬｓｐＱ４ｐ）とＬｓｐＱ４とを用
いて、現フレームの第１サブフレーム〜第３サブフレー
ムに対するＬＳＰ係数補間値ＬｓｐＤ１、ＬｓｐＤ２、
ＬｓｐＤ３を計算する。ＬｓｐＤ１〜ＬｓｐＤ３は、例
えば、以下の様にして得る。

【００２８】即ち、ＬｓｐＤ１＝ＬｓｐＱ４ｐ＊３／４
＋ＬｓｐＱ４＊１／４ＬｓｐＤ２＝ＬｓｐＱ４ｐ＊２／４＋ＬｓｐＱ４＊２／
４ＬｓｐＤ３＝ＬｓｐＱ４ｐ＊１／４＋ＬｓｐＱ４＊３／
４更に、以下のようにしてフレームエラーＥ１を計算す
る。即ち、Ｅ１＝Σ（ＬｓｐＱ１ｉ−ＬｓｐＤ１ｉ）^２＋Σ（Ｌｓ
ｐＱ２ｉ−ＬｓｐＤ２ｉ）^２＋Σ（ＬｓｐＱ３ｉ−Ｌｓ
ｐＤ３ｉ）^２ｉ＝１〜ｎ、ｎは例えば、８又は１０程度である。

【００２９】このフレームエラーＥ１が予め定められた
閾値Ｅｔ１より小さい場合は、モード１と判定し、モー
ド符号情報Ｍ（モードが１であるという情報）と量子化
符号情報Ｌ（Ｉ４のみ）を声道予測係数復号回路に伝送
し、符号化モード判定部２１０は、現フレームの声道予
測係数符号化処理を終了する。フレームエラーＥ１が閾
値Ｅｔ１以上のときは引き続き以下の処理を行う。

【００３０】先ず、ＬｓｐＱ４ｐ、ＬｓｐＱ２、Ｌｓｐ
Ｑ４を用いて現フレームの第１サブフレーム、第３サブ
フレームに対するＬＳＰ係数補間値ＬｓｐＤＤ１、Ｌｓ
ｐＤＤ３を計算する。ＬｓｐＤＤ１、ＬｓｐＤＤ３は、
例えば、以下のようにして得られる。

【００３１】ＬｓｐＤＤ１＝ＬｓｐＱ４ｐ＊１／２＋Ｌ
ｓｐＱ２＊１／２ＬｓｐＤＤ３＝ＬｓｐＱ２＊１／２＋ＬｓｐＱ４＊１／
２更に、以下のようにしてフレームエラーＥ２を計算す
る。

【００３２】Ｅ２＝Σ（ＬｓｐＱ１ｉ−ＬｓｐＤＤ１ｉ）^２＋Σ（Ｌ
ｓｐＱ３ｉ−ＬｓｐＤＤ３ｉ）^２ｉ＝１〜ｎ、ｎは例えば、８又は１０程度である。

【００３３】このフレームエラーＥ２が予め定められた
閾値Ｅｔ２より小さい場合は、モード２と判定し、モー
ド符号情報Ｍ（モードが２であるという情報）と量子化
符号情報Ｌ（Ｉ２、Ｉ４）を声道予測係数復号回路に伝
送し、現フレームの声道予測係数符号化処理を終了す
る。フレームエラーＥ２がＥｔ２以上の時は、モード３
と判定し、モード符号情報Ｍ（モードが３であるという
情報）と、量子化符号情報Ｌ（Ｉ１、Ｉ２、Ｉ３、Ｉ
４）とを声道予測係数復号回路に伝送し、現フレームの
声道符号化処理を終了するのである。

【００３４】（動作）：次に図１の動作を説明す
る。図１の声道予測係数符号化回路の入力端子２００よ
りフレーム単位にまとめられて入力される入力音声信号
Ｓは、声道分析部２０１に入力され、サブフレームごと
に声道予測係数（ＬＰＣ係数）が計算される。例えば、
４サブフレームで１フレームとなる場合は、声道予測係
数としてａ１〜ａ４が得られる。

【００３５】声道予測係数ａ１〜ａ４を与えられた声道
予測係数変換・量子化部１０２は、声道予測係数ａ１〜
ａ４をＬＳＰ係数に変換したのち量子化し、ＬＳＰ係数
量子化値ＬｓｐＱ１〜ＬｓｐＱ４を出力する。また、各
量子化値のインデックス（符号）Ｉ１〜Ｉ４を同時に出
力する。

【００３６】ＬＳＰ係数量子化値ＬｓｐＱ１〜ＬｓｐＱ
４と、前フレームの第４サブフレームのＬＳＰ係数量子
化値（ＬｓｐＱ４ｐ）と、インデックスＩ１〜Ｉ４とを
使用して、符号化モード判定部２１０では上述の三つの
モードで、現フレームをどのモードで符号化するかが判
定され、モード符号情報Ｍと量子化符号情報Ｌとが出力
されるのである。

【００３７】（声道予測係数復号化回路）：図３は
声道予測係数復号化回路の機能構成図である。この図３
において、声道予測係数復号化回路は、モード判定逆量
子化部２１６と、声道予測係数逆変換部２１７とから構
成されている。

【００３８】モード判定逆量子化部２１６は、声道予測
係数符号化回路からのモード符号情報Ｍと量子化符号情
報Ｌとから、以下のようにして各サブフレームで用いる
ＬＳＰ係数ＬｓｐＵ１、ＬｓｐＵ２、ＬｓｐＵ３、Ｌｓ
ｐＵ４を求める。

【００３９】即ち、先ず、量子化符号情報Ｌよりインデ
ックスＩ４を分離し、これより第４サブフレームに対す
る逆量子化値ＬｓｐＱ４を求める。

【００４０】モード符号情報からモードが『１』であっ
た場合は、前フレームで得られた第４サブフレームのＬ
ＳＰ係数量子化値（ＬｓｐＱ４ｐ）とＬｓｐＱ４を用い
て、例えば、ＬｓｐＵ１＝ＬｓｐＱ４ｐ＊３／４＋ＬｓｐＱ４＊１／
４ＬｓｐＵ２＝ＬｓｐＱ４ｐ＊２／４＋ＬｓｐＱ４＊２／
４ＬｓｐＵ３＝ＬｓｐＱ４ｐ＊１／４＋ＬｓｐＱ４＊３／
４ＬｓｐＵ４＝ＬｓｐＱ４の様にＬｓｐＵ１〜ＬｓｐＵ４を求めて出力する。

【００４１】モード符号情報Ｍよりモード符号が『２』
であった場合は、量子化符号情報Ｌより更にＩ２を分離
し、これより第２サブフレームに対する逆量子化値Ｌｓ
ｐＱ２を求める。そして、ＬｓｐＱ４ｐ、ＬｓｐＱ２、
ＬｓｐＱ４を用いて、例えば、ＬｓｐＵ１＝ＬｓｐＱ４ｐ＊１／２＋ＬｓｐＱ２＊１／
２ＬｓｐＵ２＝ＬｓｐＱ２ＬｓｐＵ３＝ＬｓｐＱ２＊１／２＋ＬｓｐＱ４＊１／２ＬｓｐＵ４＝ＬｓｐＱ４の様にＬｓｐＵ１〜ＬｓｐＵ４を求めて出力する。

【００４２】モード符号情報Ｍよりモードが『３』であ
った場合は、量子化符号情報Ｌから更にＩ１、Ｉ３を分
離し、これより第１、第３サブフレームに対する逆量子
化値ＬｓｐＱ１、ＬｓｐＱ２、ＬｓｐＱ３を計算する。
そして、ＬｓｐＱ１、ＬｓｐＱ２、ＬｓｐＱ３、Ｌｓｐ
Ｑ４を用いて、例えばＬｓｐＵ１＝ＬｓｐＱ１ＬｓｐＵ２＝ＬｓｐＱ２ＬｓｐＵ３＝ＬｓｐＱ３ＬｓｐＵ４＝ＬｓｐＱ４のようにＬｓｐＵ１〜ＬｓｐＵ４を計算して、声道予測
係数逆変換部２１７へ出力するものである。

【００４３】声道予測係数逆変換部２１７は、上記ＬＳ
Ｐ係数ＬｓｐＵ１〜ＬｓｐＵ４を声道予測係数ａｑ１〜
ａｑ４に変換して出力するものである。

【００４４】（声道予測係数復号化回路の動作）：
図３の声道予測係数復号化回路の動作を説明する。この
図３において、声道予測係数符号化回路からのモード符
号情報Ｍ、量子化符号情報Ｌはモード判定逆量子化部２
０１に与えられると、各サブフレームのＬＳＰ係数Ｌｓ
ｐＵ１、ＬｓｐＵ２、ＬｓｐＵ３、ＬｓｐＵ４が上述の
方法で計算される。これらのＬＳＰ係数ＬｓｐＵ１〜Ｌ
ｓｐＵ４から、声道予測係数逆変換部２１７では、声道
予測係数ａｑ１〜ａｑ４に変換され出力されるのであ
る。

【００４５】（音声符号化装置）：図４は上述の声
道予測係数符号化回路を音声符号化装置に適用した場合
の機能構成図である。この図４において、音声符号化装
置は、声道分析部２０１と、声道予測係数変換・量子化
・逆量子化部２０２Ａと、駆動音源符号帳２０３と、乗
算器２０４と、ゲインテーブル２０５と、合成フィルタ
２０６と、減算器２０７と、聴覚重み付けフィルタ２０
８と、２乗誤差計算回路２０９と、符号化モード判定部
２１０と、多重化回路２１２とから構成されている。図
１と同じ機能部分は、同じ符号を付している。

【００４６】声道予測係数変換・量子化・逆量子化部２
０２Ａは、上述の声道予測係数変換・量子化部２０２に
逆量子化機能を追加したもので、声道分析部２０１から
の声道予測係数（ＬＰＣ係数）ａ１〜ａ４をＬＳＰ係数
に変換したのち量子化し、ＬＳＰ係数量子化値ＬｓｐＱ
１、ＬｓｐＱ２、ＬｓｐＱ３、ＬｓｐＱ４を出力して符
号化モード判定部２１０に与える。また、各量子化値の
インデックス（符号）Ｉ１、Ｉ２、Ｉ３、Ｉ４も同時に
出力して符号化モード判定部２１０に与える。また、量
子化値に対する逆量子化値ａｑをＬＳＰ係数量子化値Ｌ
ｓｐＱ１〜ＬｓｐＱ４と、モード情報Ｍとから求めて合
成フィルタ２０６に与えるものである。

【００４７】駆動音源符号帳２０３は、２乗誤差計算回
路２０９から与えられるインデックス値Ｉ、Ｊによっ
て、対応する駆動音源信号Ｃｉ（ｉ＝１〜Ｎ）を読み出
して乗算器２０４に与えるものである。

【００４８】乗算器２０４は、ゲインテーブル２０５か
ら与えられるゲイン情報ｇｊ（ｊ＝１〜Ｍ）と、駆動音
源符号帳２０３からの駆動音源信号Ｃｉ（ｉ＝１〜Ｎ）
とを乗算して、乗算結果信号Ｃｇｉｊを合成フィルタ２
０６に与えるものである。

【００４９】ゲインテーブル２０５は、２乗誤差計算回
路２０９から与えられるインデックス値ｊによって、対
応するゲイン情報ｇｊ（ｊ＝１〜Ｍ）を読み出して乗算
器２０４に与える。

【００５０】合成フィルタ２０６は、例えば、巡回型の
デジタルフィルタで構成され、声道予測係数量子化・逆
量子化部２０２Ａからの逆量子化値（ＬＰＣ係数を意味
している。）ａｑと、乗算結果信号Ｃｇｉｊとから合成
音声信号Ｓｉｊを求めて減算器２０７に与えるものであ
る。

【００５１】減算器２０７は、入力原音声信号Ｓｏと、
合成音声Ｓｉｊとの差分を求め、この差分信号ｅｉｊを
聴覚重み付けフィルタ２０８に与えるものである。

【００５２】聴覚重み付けフィルタ２０８は、減算器２
０７からの差分信号ｅｉｊに対して、周波数的な重みを
かける、言い換えれば、聴覚特性に応じた重み付け処理
を施してその聴覚重み付け信号ｗｉｊを２乗誤差計算回
路２０９に与えるものである。音声ホルマントや、ピッ
チハーモニクスのパワーの大きい周波数領域の量子化雑
音は、聴覚マスキング効果によって小さく感じる。逆
に、パワーの小さい周波数領域の量子化雑音は、マスク
されずに聞こえてしまう。そこで、符号化時の量子化雑
音をパワーの大きい周波数領域で大きくし、パワーの小
さい周波数領域で小さくするための周波数重み付けを聴
覚重み付けという。

【００５３】人間の聴覚は、ある周波数成分が大きいと
その近くの周波数の音が聞こえにくくなる、マスキング
と呼ばれる特性を持っている。故に、原音声と再生音声
との聴覚上の差、即ち、再生音声の歪み感はそのユーク
リッド距離とは必ずしも対応しない。故に、音声符号化
では、距離尺度として原音声と再生音声との差をマスキ
ング特性に対応した聴覚重み付けフィルタ２０８に通し
た値を用いる。この聴覚重み付けフィルタ２０８は、周
波数軸上において大きな部分の歪みを軽くし、小さな部
分の歪みを重くし、重み付けする特性を持つものであ
る。

【００５４】２乗誤差計算回路２０９は、聴覚重み付け
フィルタ２０８からの聴覚重み付け信号ｗｉｊに基づ
き、この信号の各成分の２乗和信号Ｅｉｊを求めて、こ
の２乗和信号Ｅｉｊの値が、最小となるｉ、ｊの組み合
わせを探索して、最小組み合わせｉ、ｊを最適インデッ
クスｉ、ｊとし、この最適インデックスｉを駆動音源符
号帳２０３に与え、他方の最適インデックスｊをゲイン
テーブル２０５に与え、両方の最適インデックスｉ、ｊ
を多重化回路２１２に与えるものである。

【００５５】多重化回路２１２は、符号化モード判定部
２１０からのモード符号情報Ｍと、量子化符号情報Ｌ
と、最適インデックスｉ、ｊとを多重化して、この多重
化によって得られた信号をトータルコード信号Ｗとして
トータルコード出力端子２１３に出力するものである。

【００５６】（音声符号化装置の動作）：図４の音
声符号化装置の動作を説明する。この図４において、入
力端子２００よりフレーム単位にまとめられて入力され
る入力音声信号Ｓは、声道分析部２０１に入力され、サ
ブフレームごとに声道予測係数（ＬＰＣ係数）ａ１〜ａ
４が得られる。声道予測係数ａ１〜ａ４を与えられた声
道予測係数変換・量子化・逆量子化部２０２Ａでは、声
道予測係数ａ１〜ａ４をＬＳＰ係数に変換したのち量子
化され、ＬＳＰ係数量子化値ＬｓｐＱ１〜ＬｓｐＱ４が
出力される。

【００５７】また、各量子化値のインデックス（符号）
Ｉ１〜Ｉ４も同時に出力される。ＬＳＰ係数量子化値Ｌ
ｓｐＱ１〜ＬｓｐＱ４と、前フレームの第４サブフレー
ムのＬＳＰ係数量子化値（ＬｓｐＱ４ｐ）と、インデッ
クスＩ１〜Ｉ４とを使用して、符号化モード判定部２１
０では上述の三つのモードで、現フレームをどのモード
で符号化するかが判定され、モード符号情報Ｍと量子化
符号情報Ｌとが多重化回路２１２へ出力され、更に、モ
ード符号情報Ｍは、声道予測係数変換・量子化・逆量子
化部２０２Ａにも与えられるのである。

【００５８】一方、駆動音源符号帳２０３は、初期的に
は所定のいずれかの駆動音源信号Ｃｉ（ｉ＝１〜Ｎのい
ずれか）を読み出し、また、ゲインテーブル２０５も同
様に初期的には所定のいずれかのゲイン情報ｇｊ（ｊ＝
１〜Ｍのいずれか）を読み出して乗算器２０４に与える
ので、乗算器２０４によってこれらの乗算が行われて、
乗算結果信号Ｃｇｉｊが合成フィルタ２０６に与えられ
る。

【００５９】乗算結果信号Ｃｇｉｊと、逆量子化値ａｑ
とによって合成フィルタ２０６によってデジタルフィル
タリング処理されて、合成音声信号Ｓｉｊが求められ、
減算器２０７に与えられる。合成音声信号Ｓｉｊと入力
原音声信号Ｓｏとの差分が減算器２０７で求められ、差
分信号ｅｉｊは聴覚重み付けフィルタ２０８に与えられ
る。

【００６０】差分信号ｅｉｊは聴覚重み付けフィルタ２
０８で、聴覚特性に応じた重み付け処理が施こされて、
聴覚重み付け信号ｗｉｊが２乗誤差計算回路２０９に与
えられる。聴覚重み付け信号ｗｉｊは、２乗誤差計算回
路２０９で、信号の各成分に対する２乗和信号Ｅｉｊが
求められて、この２乗和信号Ｅｉｊの値が、最小となる
ｉ、ｊの組み合わせが探索されて、最小組み合わせｉ、
ｊが最適インデックスｉ、ｊとし、この最適インデック
スｉが駆動音源符号帳２０３に与えられ、他方の最適イ
ンデックスｊがゲインテーブル２０５に与えられ、両方
の最適インデックスｉ、ｊが多重化回路２１２に与えら
れるものである。モード符号情報Ｍと量子化符号情報Ｌ
と、最適インデックスｉ、ｊとが多重化されてトータル
コード信号Ｗが形成されてトータルコード出力端子２１
３に出力されるのである。

【００６１】このような構成で、図１の声道予測係数符
号回路を音声符号化装置に適用して、音声信号を効率的
に符号化することができるのである。

【００６２】（音声復号化装置）：図５は上述の声
道予測係数復号化回路を音声復号化装置に適用した場合
の機能構成図である。この図５において、音声復号化装
置は、多重分離回路２１４と、駆動音源符号帳２０３
と、乗算器２０４と、ゲインテーブル２０５と、合成フ
ィルタ２１５と、モード判定逆量子化部２１６と、声道
予測係数逆変換部２１７とから構成されている。図３、
図４と同じ機能構成部分には、同じ符号を付している。

【００６３】（動作）：トータルコード信号Ｗが多
重分離回路２１４に与えられると、多重分離してモード
符号情報Ｍと量子化符号情報Ｌとがモード判定逆量子化
部２１６に与えられる。これによってモード判定逆量子
化部２１６では、各サブフレームフレームのＬＳＰ係数
ＬｓｐＵ１、ＬｓｐＵ２、ＬｓｐＵ３、ＬｓｐＵ４が上
述の方法で計算され、声道予測係数逆変換部２１７に与
えられる。ＬＳＰ係数ＬｓｐＵ１〜ＬｓｐＵ４は、声道
予測係数逆変換部２１７で声道予測係数ａｑ１〜ａｑ４
に変換され、合成フィルタ２１５に与えられる。

【００６４】また、多重分離された最適インデックスｊ
は、ゲインテーブル２０５に与えられ、これによってゲ
イン情報が出力されて乗算器２０４に与えられる。更
に、多重分離された最適インデックスｉは駆動音源符号
帳２０３に与えられて、対応する駆動音源信号が出力さ
れ、乗算器２０４に与えられる。この駆動音源信号とゲ
イン情報とは乗算されて、合成フィルタ２１５に与えら
れる。

【００６５】合成フィルタ２１５では、声道予測係数ａ
ｑ１〜ａｑ４と乗算器２０４からの乗算結果とから音声
合成を行って、再生音声信号を出力するのである。

【００６６】このような構成を採ることで、図３の声道
予測係数復号化回路を音声復号化装置に適用して、効率
的に音声信号に復号することができる。

【００６７】（本発明の実施の形態の効果）：以上の
本発明の実施の形態の声道予測係数符号化回路、声道予
測係数復号化回路、音声符号化装置及び音声復号化装置
によれば、フレーム内声道情報の変動が大きい場合には
量子化値を用い、変動が小さい場合には補間値を用いる
ことにより、平均符号化レートをそれほど増加させるこ
となく声道情報の変化に追従でき、音声符号化・復号化
装置に適用した場合に高品質で忠実に再生音声信号を得
ることができる。

【００６８】（他の実施の形態）：（１）尚、以上
の実施の形態においては、符号化モードを図２に示すよ
うに３のモードを設定したが、１フレームを４サブフレ
ームから構成するものとすると、モードは最大４！（＝
２４）通り作成できるが、伝送符号化量も多くなるの
で、最適なモード種類を設定することが好ましい。

【００６９】（２）また、図４においては、フォワード
型の音声符号化装置の構成を示したが、本発明はＡｂＳ
法を適用するバックワード型の音声符号化装置の構成に
も容易に適用することができる。即ち、図４において、
バックワード型の構成で適用する場合は、声道分析部２
０１に原音声信号を与えず、代わりに合成フィルタ２０
６で生成した合成音声ベクトル信号Ｓｉｊを声道分析部
２０１に与えることで実現することができる。ＶＳＥＬ
Ｐ、ＬＤ−ＣＥＬＰ、ＣＳ−ＣＥＬＰ、ＰＳＩ−ＣＥＬ
Ｐなどにも適用することができる。

【００７０】（３）更に、駆動音源符号帳２０３は、具
体的には、例えば、適応符号コードや、統計符号コード
や、雑音性符号コードなどから構成することが好まし
い。

【００７１】（４）更にまた、受信側の復号化装置の構
成としては、図５の構成の他、例えば、特開平５−７３
０９９号公報、特開平６−１３０９９５号公報、特開平
６−１３０９９８号公報、特開平７−１３４６００号公
報、特開平６−１３０９９６号公報などに開示されてい
る復号化装置の構成を若干修正することで適用すること
ができる。

【００７２】

【発明の効果】以上述べた様に本発明は、声道予測係数
符号化回路が、入力フレーム音声信号からいくつかのサ
ブフレームに対する声道予測係数を求める声道予測係数
生成手段と、上記各サブフレーム単位の声道予測係数か
ら各ＬＳＰ係数を求め、これらのＬＳＰ係数をそれぞ量
子化した各ＬＳＰ係数量子化値を出力するＬＳＰ係数量
子化手段と、上記各ＬＳＰ係数量子化値から、フレーム
内の声道予測係数の変動状態を分析し、この分析結果か
ら、予め備えられている声道予測係数の量子化・補間の
モードのいずれを表すか否か判定する量子化・補間モー
ド判定処理部の判定処理に従って、量子化・補間モード
情報と、いずれのサブフレームのＬＳＰ係数量子化値を
伝送するかを表すＬＳＰ係数量子化値情報とを生成出力
する符号化モード判定手段とを備える。そして、上記声
道予測係数復号化回路は、予め上記量子化・補間モード
判定処理部を備えていて、上記量子化・補間モード情報
とＬＳＰ係数量子化値情報とからフレーム内の全サブフ
レームのＬＳＰ係数を再生するＬＳＰ係数再生手段と、
上記全サブフレームのＬＳＰ係数から対応する全サブフ
レームの声道予測係数を再生する声道予測係数再生手段
とを備えるものである。

【００７３】このような構成を採ることで、声道予測係
数が大きく変動しても、平均的な符号化レートを余り増
加させることなく高い品質で忠実に再生音声を出力する
ことができる声道予測係数符号化・復号化回路、声道予
測係数符号化回路、声道予測係数復号化回路、音声符号
化装置及び音声復号化装置を実現することができるので
ある。

【図面の簡単な説明】

【図１】本発明の実施の形態の声道予測係数符号化回路
の機能構成図である。

【図２】本発明の実施の形態の符号化モードの説明図で
ある。

【図３】本発明の実施の形態の声道予測係数復号化回路
の機能構成図である。

【図４】本発明の実施の形態の音声符号化装置の機能構
成図である。

【図５】本発明の実施の形態の音声復号化装置の機能構
成図である。

【符号の説明】

２００…原音声入力端子、２０１…声道分析部、２０２
…声道予測係数変換・量子化部、２１０…符号化モード
判定部、２１６…モード判定逆量子化部、２１７…声道
予測係数逆変換部。

Claims

【特許請求の範囲】

【請求項１】入力フレーム音声信号から声道予測係数
を求めて、これを符号化する声道予測係数符号化回路
と、この声道予測係数符号化回路からの符号化信号から
声道予測係数を再生する声道予測係数復号化回路とから
なる声道予測係数符号化・復号化回路であって、上記声道予測係数符号化回路は、上記入力フレーム音声信号からいくつかのサブフレーム
に対する声道予測係数を求める声道予測係数生成手段
と、上記サブフレーム単位の声道予測係数から各ＬＳＰ係数
を求め、これらのＬＳＰ係数をそれぞれ量子化した各Ｌ
ＳＰ係数量子化値を出力するＬＳＰ係数量子化手段と、上記各ＬＳＰ係数量子化値からフレーム内の声道予測係
数の変動状態を分析し、この分析結果から、予め備えら
れている声道予測係数の量子化・補間のモードのいずれ
を表すか否かを判定する量子化・補間モード判定処理部
の判定処理に従って、量子化・補間モード情報と、いず
れのサブフレームの上記ＬＳＰ係数量子化値を伝送する
かを表すＬＳＰ係数量子化値情報とを生成出力する符号
化モード判定手段とを備え、上記声道予測係数復号化回路は、予め上記量子化・補間モード判定処理部を備えていて、
上記量子化・補間モード情報とＬＳＰ係数量子化値情報
とからフレーム内の全サブフレームのＬＳＰ係数を再生
するＬＳＰ係数再生手段と、上記全サブフレームのＬＳＰ係数から対応する全サブフ
レームの声道予測係数を再生する声道予測係数再生手段
とを備えることを特徴とする声道予測係数符号化・復号
化回路。
【請求項２】入力フレーム音声信号からいくつかのサ
ブフレームに対する声道予測係数を求める声道予測係数
生成手段と、上記各サブフレーム単位の声道予測係数から各ＬＳＰ係
数を求め、これらのＬＳＰ係数をそれぞれ量子化した各
ＬＳＰ係数量子化値を出力するＬＳＰ係数量子化手段
と、上記各ＬＳＰ係数量子化値から、フレーム内の声道予測
係数の変動状態を分析し、この分析結果から、予め備え
られている声道予測係数の量子化・補間のモードのいず
れを表すか否かを判定する量子化・補間モード判定処理
部の判定処理に従って、量子化・補間モード情報と、い
ずれのサブフレームの上記ＬＳＰ係数量子化値を伝送す
るかを表すＬＳＰ係数量子化値情報とを生成出力する符
号化モード判定手段とを備えることを特徴とする声道予
測係数符号化回路。
【請求項３】上記符号化モード判定手段の上記フレー
ム内の声道予測係数の変動状態の分析は、前フレームの
いずれか一つのサブフレームのＬＳＰ係数量子化値と、
現フレームの同じサブフレームのＬＳＰ係数量子化値と
から、これらのサブフレーム間の補間値を求め、この補
間値と実際に求めた上記各サブフレームのＬＳＰ係数量
子化値との差分値を求め、この差分値が所定閾値以内で
あれば、変動量が少ないものとして、上記分析結果を出
力することを特徴とする請求項２記載の声道予測係数符
号化回路。
【請求項４】上記量子化・補間モード判定処理部は、
声道予測係数の変動量が大きいときは、各サブフレーム
に対するＬＳＰ係数量子化値を優勢的に使用選択するた
めの上記量子化・補間モード情報を出力し、声道予測係
数の変動量が小さいときは、各サブフレームに対する補
間値を優勢的に使用選択するための上記量子化・補間モ
ード情報を出力することを特徴とする請求項２又は３記
載の声道予測係数符号化回路。
【請求項５】請求項２〜４のいずれかに記載の声道予
測係数符号化回路からの量子化・補間モード情報と、Ｌ
ＳＰ係数量子化値情報とから声道予測係数を再生する声
道予測係数復号化回路であって、予め上記量子化・補間モード判定処理部を備えていて、
上記量子化・補間モード情報とＬＳＰ係数量子化値情報
とからフレーム内の全サブフレームのＬＳＰ係数を再生
するＬＳＰ係数再生手段と、上記全サブフレームの上記ＬＳＰ係数から対応する全サ
ブフレームの声道予測係数を再生する声道予測係数再生
手段とを備えたことを特徴とする声道予測係数復号化回
路。
【請求項６】請求項２〜４のいずれかに記載の声道予
測係数符号化回路を備える音声符号化装置であって、上記声道予測係数生成手段は、入力音声信号又は局部再
生の合成音声信号からサブフレーム単位で声道予測係数
を求め、駆動音源符号帳にインデックス対応で格納されている符
号コードと、上記声道予測係数とを用いて、合成音声信
号を得る音声合成手段と、この合成音声信号と上記入力音声信号との比較を行って
差分信号を出力する比較手段と、この差分信号に対して聴覚重み付けを行って聴覚重み付
け信号を得る聴覚重み付け手段と、上記聴覚重み付け信号から上記駆動音源符号帳用の最適
インデックス情報を選定して、上記駆動音源符号帳に与
える符号帳インデックス選定手段とを備えて、上記量子化・補間モード情報と、いずれのサブフレーム
のＬＳＰ係数量子化値を伝送するかを表す上記ＬＳＰ係
数量子化値情報と、上記最適インデックス情報とを出力
することを特徴とする音声符号化装置。
【請求項７】請求項６記載の音声符号化装置からの情
報を受信し、請求項５記載の声道予測係数復号化回路を
備えて音声信号を再生出力する音声復号化装置であっ
て、上記最適インデックス情報から最適駆動音源信号を出力
する駆動音源符号帳と、上記最適駆動音源信号と上記声道予測係数再生手段で再
生した声道予測係数とから音声合成を行い、音声信号を
再生出力する合成フィルタとを備えたことを特徴とする
音声復号化装置。