JP3808270B2

JP3808270B2 - 音声符号化装置、音声復号化装置及び符号語配列方法

Info

Publication number: JP3808270B2
Application number: JP2000040127A
Authority: JP
Inventors: 裕久田崎
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2000-02-17
Filing date: 2000-02-17
Publication date: 2006-08-09
Anticipated expiration: 2020-02-17
Also published as: JP2001228888A

Description

【０００１】
【発明の属する技術分野】
この発明は、ディジタル音声信号の情報量を圧縮する音声符号化装置、その音声符号化装置などにより生成された音声符号を復号化してディジタル音声信号を再生する音声復号化装置、その音声符号化装置や音声復号化装置により使用されるベクトル符号帳中の符号語の格納順序を更新して、音声符号に重畳するビット誤りへの耐性を改善する符号語配列方法に関するものである。
【０００２】
【従来の技術】
従来の音声符号化装置の多くは、入力音声をスペクトル包絡情報と音源に分けて、フレーム単位で各々を符号化して音声符号を生成する構成を採用している。一方、従来の音声復号化装置は、その音声符号を復号化して、合成フィルタによってスペクトル包絡情報と音源を合成することにより、復号音声を生成する構成を採用している。
また、様々な様態を有する音声信号と背景雑音信号の両方の品質を高めるため、複数の符号化モードを用意して、符号化モードを切り換えながら符号化を行う方式（マルチモード符号化方式）を採用するものもある。
【０００３】
図１５は例えば文献「Ｈ．Ｔａｓａｋｉ、”ＨｉｇｈｌｅｖｅｌｄｅｓｃｒｉｐｔｉｏｎｏｆＭｉｔｓｕｂｉｓｈｉ４−ｋｂｉｔ／ｓｓｐｅｅｃｈｃｏｄｅｒ”、ＩＴＵＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎＳｔａｎｄａｒｄｉｚａｔｉｏｎＳｅｃｔｏｒ、ＳｔｕｄｙＧｒｏｕｐ１６、Ｑｕｅｓｔｉｏｎ１９−２１／１６ＲａｐｐｏｒｔｅｕｒＭｅｅｔｉｎｇ、Ｎｏ．ＡＣ−９９−０１６（１９９９年９月）」に示された従来の音声符号化装置を示す構成図である。
【０００４】
図において、１は入力音声に重畳している背景雑音を抑圧する雑音抑圧処理を実行するとともに、入力音声の直流成分をカットする低域阻止フィルタ処理を実行する前処理部、２は前処理部１による前処理後の入力音声を分析して、音声のスペクトル包絡情報である線スペクトル対（以下、ＬＳＰという）を求めるスペクトル分析部、３はスペクトル分析部２により求められたＬＳＰを符号化して、そのＬＳＰ符号を多重化部２０に出力するとともに、そのＬＳＰを量子化して、量子化後のＬＳＰ（ＬＳＰ符号を復号化した結果と同じ）を合成フィルタ４のフィルタ係数（線形予測係数）に変換し、そのフィルタ係数を合成フィルタ４と聴覚重み付け部６に出力するスペクトル符号化部である。
【０００５】
４はスペクトル符号化部３が出力するフィルタ係数を用いて、切換スイッチ１９により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する合成フィルタ、５は合成フィルタ４により生成された合成音と前処理部１による前処理後の入力音声との差信号を出力する減算器、６はスペクトル符号化部３が出力するフィルタ係数に基づいて聴覚重み付けフィルタ係数を算出し、その聴覚重み付けフィルタ係数を用いて、減算器５が出力する差信号に対する聴覚重み付けフィルタ処理を実行して聴覚重み付け差信号を出力する聴覚重み付け部である。
【０００６】
７は聴覚重み付け部６が出力する聴覚重み付け差信号のパワーを計算し、そのパワーの最小化を図るため、インデックス（ゲイン符号、駆動音源符号、適応音源符号）及び符号化モードを示すモード情報を逐次更新する歪み最小化部、８，９は歪み最小化部７による更新後のインデックスに対応する符号語を出力する符号帳を有し、その符号語から仮の音源を生成する音源復号化部である。
【０００７】
１０は過去の音源を所定長記憶し、歪み最小化部７から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルである適応符号ベクトルを出力する適応音源符号帳、１１は非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部７から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、１２はゲインに関する符号語（ゲイン値を示す語）を格納し、歪み最小化部７からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、１３はゲイン符号帳１２が出力するゲイン値を適応音源符号帳１０が出力する適応符号ベクトルに乗算する乗算器、１４はゲイン符号帳１２が出力するゲイン値を駆動音源符号帳１１が出力する駆動符号ベクトルに乗算する乗算器、１５は乗算器１３の乗算結果と乗算器１４の乗算結果を加算し、その加算結果（仮の音源）を出力する加算器である。
【０００８】
１６は雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部７から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、１７はゲインに関する符号語（ゲイン値を示す語）を格納し、歪み最小化部７からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、１８はゲイン符号帳１７が出力するゲイン値を駆動音源符号帳１６が出力する駆動符号ベクトルに乗算し、その乗算結果（仮の音源）を出力する乗算器である。
【０００９】
１９は歪み最小化部７からモード情報を受けると、そのモード情報にしたがって音源復号化部８が出力する仮の音源又は音源復号化部９が出力する仮の音源を選択し、その選択した仮の音源を合成フィルタ４に与える切換スイッチ、２０はスペクトル符号化部３により符号化されたＬＳＰ符号と、歪み最小化部７による更新後のインデックス及びモード情報とを多重化して音声符号を生成し、その音声符号を出力する多重化部である。
【００１０】
図１６は上記文献に示された従来の音声復号化装置を示す構成図であり、図において、２１は音声符号化装置により多重化されたＬＳＰ符号とインデックスとモード情報とを分離する分離部、２２，２３は分離部２１により分離されたインデックスに対応する符号語を出力する符号帳を有し、その符号語から音源を生成する音源復号化部である。
【００１１】
２４は過去の音源を所定長記憶し、分離部２１から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルである適応符号ベクトルを出力する適応音源符号帳、２５は非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部２１から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、２６はゲインに関する符号語（ゲイン値を示す語）を格納し、分離部２１からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、２７はゲイン符号帳２６が出力するゲイン値を適応音源符号帳２４が出力する適応符号ベクトルに乗算する乗算器、２８はゲイン符号帳２６が出力するゲイン値を駆動音源符号帳２５が出力する駆動符号ベクトルに乗算する乗算器、２９は乗算器２７の乗算結果と乗算器２８の乗算結果を加算し、その加算結果（仮の音源）を出力する加算器である。
【００１２】
３０は雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部２１から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、３１はゲインに関する符号語（ゲイン値を示す語）を格納し、分離部２１からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、３２はゲイン符号帳３１が出力するゲイン値を駆動音源符号帳３０が出力する駆動符号ベクトルに乗算し、その乗算結果（仮の音源）を出力する乗算器である。
【００１３】
３３は分離部２１からモード情報を受けると、そのモード情報にしたがって音源復号化部２２が出力する仮の音源又は音源復号化部２３が出力する仮の音源を選択し、その選択した仮の音源を合成フィルタ３５に与える切換スイッチ、３４は分離部２１が出力するＬＳＰ符号を復号化し、その復号結果を合成フィルタ３５のフィルタ係数（線形予測係数）に変換して、そのフィルタ係数を合成フィルタ３５と後処理部３６に出力するスペクトル復号化部、３５はスペクトル復号化部３４が出力するフィルタ係数を用いて、切換スイッチ３３により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する合成フィルタ、３６はスペクトル復号化部３４が出力するフィルタ係数等に基づいて合成フィルタ３５により生成された合成音に対する音声強調処理などの後処理を実行し、入力音声の再生結果（出力音声）を出力する後処理部である。
【００１４】
次に動作について説明する。
従来の音声符号化装置及び音声復号化装置は、５〜５０ｍｓ程度を１フレームとして、フレーム単位に処理を実行する。
【００１５】
まず、音声符号化装置の前処理部１は、入力音声を受けると、その入力音声に重畳している背景雑音を抑圧する雑音抑圧処理を実行するとともに、入力音声の直流成分をカットする低域阻止フィルタ処理を実行する。
スペクトル分析部２は、前処理部１が入力音声に対する前処理を実行すると、前処理後の入力音声を分析して、音声のスペクトル包絡情報であるＬＳＰを求める。
【００１６】
そして、スペクトル符号化部３は、スペクトル分析部２により求められたＬＳＰを符号化して、そのＬＳＰ符号を多重化部２０に出力する。また、そのＬＳＰを量子化して、量子化後のＬＳＰを合成フィルタ４のフィルタ係数に変換し、そのフィルタ係数を合成フィルタ４と聴覚重み付け部６に出力する。
【００１７】
合成フィルタ４は、スペクトル符号化部３からフィルタ係数を受けると、そのフィルタ係数を用いて、切換スイッチ１９により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する。仮の音源の生成処理は後述する。
減算器５は、合成フィルタ４が合成音を生成すると、その合成音と前処理部１による前処理後の入力音声との差信号を出力し、聴覚重み付け部６は、スペクトル符号化部３が出力するフィルタ係数に基づいて聴覚重み付けフィルタ係数を算出し、その聴覚重み付けフィルタ係数を用いて、減算器５が出力する差信号に対する聴覚重み付けフィルタ処理を実行して聴覚重み付け差信号を出力する。
【００１８】
歪み最小化部７は、インデックス及び符号化モードを逐次更新することにより、聴覚重み付け部６が出力する聴覚重み付け差信号のパワーの最小化を図る。
即ち、インデックスとモード情報を適宜選択して、音源復号化部８，９と切換スイッチ１９に出力する毎に、その聴覚重み付け差信号のパワーを計算し、その計算結果であるパワーが最も小さくなるインデックスとモード情報の組合せを検索する。そして、聴覚重み付け差信号のパワーが最小になるインデックスとモード情報が求まると、そのインデックスとモード情報を多重化部２０に出力する。ただし、音源復号化部９には適応音源符号帳が内蔵されていないので、第二の符号化モードを示すモード情報を出力する場合には、適応音源符号を出力しない。
【００１９】
音源復号化部８，９は、歪み最小化部７からインデックスを受けると、そのインデックスに応じて仮の音源を生成する。
具体的には、まず、音源復号化部８の適応音源符号帳１０は、過去の音源を所定長記憶し、歪み最小化部７から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルを適応符号ベクトルとして出力する。なお、適応音源符号帳１０は、歪み最小化部７がインデックス及びモード情報を選択した後で、そのインデックス及びモード情報に対して、切換スイッチ１９が出力した仮の音源を選択して出力すると、その仮の音源を最終的な音源として記憶する。
【００２０】
音源復号化部８の駆動音源符号帳１１は、非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部７から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳１１は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、歪み最小化部７が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
【００２１】
そして、ゲイン符号帳１２がゲイン符号に対応するゲイン値を出力すると、適応音源符号帳１０から出力された適応符号ベクトルと駆動音源符号帳１１から出力された駆動符号ベクトルは、乗算器１３，１４によりゲイン値が乗算され、加算器１５により乗算器１３，１４の乗算結果が相互に加算される。
【００２２】
一方、音源復号化部９の駆動音源符号帳１６は、雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部７から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳１６は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、歪み最小化部７が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
そして、ゲイン符号帳１７がゲイン符号に対応するゲイン値を出力すると、駆動音源符号帳１６から出力された駆動符号ベクトルは、乗算器１８によりゲイン値が乗算される。
【００２３】
このようにして、音源復号化部８の加算器１５から仮の音源が出力され、音源復号化部９の乗算器１８から仮の音源が出力されると、切換スイッチ１９は、歪み最小化部７が出力するモード情報にしたがって音源復号化部８が出力する仮の音源又は音源復号化部９が出力する仮の音源の何れか一方を選択し、その選択した仮の音源を合成フィルタ４に与える。
【００２４】
多重化部２０は、スペクトル符号化部３により符号化されたＬＳＰ符号と、歪み最小化部７による更新後のインデックス及びモード情報（聴覚重み付け差信号のパワーが最小となるインデックス及びモード情報）とを多重化して音声符号を生成し、その音声符号を出力する。
【００２５】
次に、音声復号化装置の分離部２１は、音声符号化装置から出力された音声符号を入力すると、その音声符号に含まれているＬＳＰ符号とインデックスとモード情報とを分離する。
【００２６】
音源復号化部２２，２３は、分離部２１からインデックスを受けると、そのインデックスに応じて仮の音源を生成する。
具体的には、まず、音源復号化部２２の適応音源符号帳２４は、過去の音源を所定長記憶し、分離部２１から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルを適応符号ベクトルとして出力する。なお、適応音源符号帳２４は、切換スイッチ３３が仮の音源を選択して出力すると、その仮の音源を最終的な音源として記憶する。
【００２７】
音源復号化部２２の駆動音源符号帳２５は、非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部２１から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳２５は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、分離部２１が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
【００２８】
そして、ゲイン符号帳２６がゲイン符号に対応するゲイン値を出力すると、適応音源符号帳２４から出力された適応符号ベクトルと駆動音源符号帳２５から出力された駆動符号ベクトルは、乗算器２７，２８によりゲイン値が乗算され、加算器２９により乗算器２７，２８の乗算結果が相互に加算される。
【００２９】
一方、音源復号化部２３の駆動音源符号帳３０は、雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部２１から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳３０は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、分離部２１が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
そして、ゲイン符号帳３１がゲイン符号に対応するゲイン値を出力すると、駆動音源符号帳３０から出力された駆動符号ベクトルは、乗算器３２によりゲイン値が乗算される。
【００３０】
このようにして、音源復号化部２２の加算器２９から仮の音源が出力され、音源復号化部２３の乗算器３２から仮の音源が出力されると、切換スイッチ３３は、分離部２１が出力するモード情報にしたがって音源復号化部２２が出力する仮の音源又は音源復号化部２３が出力する仮の音源の何れか一方を選択し、その選択した仮の音源を合成フィルタ３５に与える。
【００３１】
スペクトル復号化部３４は、分離部２１がＬＳＰ符号を出力すると、そのＬＳＰ符号を復号化し、その復号結果を合成フィルタ３５のフィルタ係数に変換して、そのフィルタ係数を合成フィルタ３５と後処理部３６に出力する。
合成フィルタ３５は、スペクトル復号化部３４からフィルタ係数を受けると、そのフィルタ係数を用いて、切換スイッチ３３により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する。
後処理部３６は、スペクトル復号化部３４が出力するフィルタ係数等に基づいて合成フィルタ３５により生成された合成音に対する音声強調処理などの後処理を実行し、入力音声の再生結果（出力音声）を出力する。
【００３２】
ここで、図１７は従来の音声符号化装置及び音声復号化装置により使用されるゲイン符号帳の一例を示す説明図である。特に、図１７（ａ）はゲイン符号帳１２，２６の一例を示し、図１７（ｂ）はゲイン符号帳１７，３１の一例を示している。
【００３３】
この例の場合、各ゲイン符号帳は１２８個のゲイン符号語を格納している。ただし、ゲイン符号帳１２，２６に格納されているゲイン符号語は、適応符号ベクトルと駆動符号ベクトルに乗じる２個のゲイン値の組を示す符号語から構成され、ゲイン符号帳１７，３１に格納されているゲイン符号語は、駆動符号ベクトルに乗じる１個のゲイン値を示す符号語から構成されている。
インデックスと評価値順位は、各ゲイン符号帳内に実際には格納されていないものであるが、説明の便宜のため記載している。インデックスは上の符号語から順番に０から１２７の値となっている。評価値はゲイン符号語のパワー（２乗和）の値である。例えば、インデックスが「１」の符号語のパワーの順位は「１０２」である。
【００３４】
各ゲイン符号帳の動作としては、あるゲイン符号を入力すると、そのゲイン符号に一致するインデックス位置に格納しているゲイン符号語を出力する。
各ゲイン符号帳に格納されているゲイン符号語は、学習用音声とその符号化音声との歪みが小さくなるように学習して作成される。
そして、音声符号を伝送する際の符号誤りによる出力音声の劣化を最小限に抑えるため、適切にゲイン符号語の並べ換えが行われる。
【００３５】
例えば、ゲイン符号に１ビット誤りを実際に与えたときに生じる劣化の大きさの期待値を計算し、さらに、ランダムに選択した２つのゲイン符号語を交換したときに生じる劣化の大きさの期待値を計算し、前者の期待値と比べて後者の期待値が減少するときに実際にゲイン符号語の格納順序を交換する。
この作業を期待値の減少が微小になるまで繰り返す。
従来の音声符号化装置及び音声復号化装置は、このようなゲイン符号語の並べ換えが行われたゲイン符号帳を使用している。
【００３６】
【発明が解決しようとする課題】
従来の音声符号化装置及び音声復号化装置は以上のように構成されているので、音声符号化装置の歪み最小化部７が、聴覚重み付け差信号のパワーが最小化するように最適なモード情報を選択するが、音声符号に伝送路誤りが重畳して、音声復号化装置がモード情報を誤認すると、入力音声の再生品質が大きく劣化する課題があった。
また、符号誤りによる劣化を最小限に抑えるため、各符号帳毎に符号語の並べ換えを実施しているが、モード情報が誤認される場合があることを考慮した並べ換えを実施していないため、モード情報の誤りに対する耐性を高めることができない課題があった。
【００３７】
具体的には、ゲイン符号帳１２，２６における符号語の並べ換えと、ゲイン符号帳１７，３１における符号語の並べ換えを無関係に実施しているため、ゲイン符号語のパワー（評価値）の順位に着目すると、図１７に示すように、ゲイン符号帳１２，２６とゲイン符号帳１７，３１間の相関関係が全くなくなっている。このため、例えば、インデックスが「０」のゲイン符号を復号する場合、モード情報を誤認して、本来第一の符号化モードが選択されるところを第二の符号化モードが選択されると、評価値順位が「４１」のゲイン値ではなく、「１２１」のゲイン値が選択される。これにより、出力音声の振幅が大きく変化し、局所的な大劣化を引き起こすことになる。
【００３８】
この発明は上記のような課題を解決するためになされたもので、モード情報を誤認しても、音声の再生品質の劣化を抑制することができる音声符号化装置、音声復号化装置及び符号語配列方法を得ることを目的とする。
【００３９】
【課題を解決するための手段】
この発明に係る音声符号化装置は、複数の符号帳が他の符号帳の符号語に関する評価値の順位と相応して、符号語の格納順序が並び換えられているようにしたものである。
【００４０】
この発明に係る音声符号化装置は、符号語に関する評価値として、その符号語のパワー又は平均振幅を用いるようにしたものである。
【００４１】
この発明に係る音声符号化装置は、複数の符号帳が音源ゲインを出力する符号帳であるようにしたものである。
【００４２】
この発明に係る音声符号化装置は、複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値が最小となるように、複数の符号帳の符号語の格納順序が並び換えられているようにしたものである。
【００４３】
この発明に係る音声符号化装置は、符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うようにしたものである。
【００４４】
この発明に係る音声符号化装置は、インデックスをマッピングするマッピング手段を有し、少なくとも１以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の順位を基準にして更新することなく、更新後の格納順序と等価な状態を構築するようにしたものである。
【００４５】
この発明に係る音声符号化装置は、インデックスをマッピングするマッピング手段を有し、少なくとも１以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の偏差の合計値が最小となるように更新することなく、更新後の格納順序と等価な状態を構築するようにしたものである。
【００４６】
この発明に係る音声復号化装置は、複数の符号帳が他の符号帳の符号語に関する評価値の順位と相応して、符号語の格納順序が並び換えられているようにしたものである。
【００４７】
この発明に係る音声復号化装置は、符号語に関する評価値として、その符号語のパワー又は平均振幅を用いるようにしたものである。
【００４８】
この発明に係る音声復号化装置は、複数の符号帳が音源ゲインを出力する符号帳であるようにしたものである。
【００４９】
この発明に係る音声復号化装置は、複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値が最小となるように、複数の符号帳の符号語の格納順序が並び換えられているようにしたものである。
【００５０】
この発明に係る音声復号化装置は、符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うようにしたものである。
【００５１】
この発明に係る音声復号化装置は、インデックスをマッピングするマッピング手段を有し、少なくとも１以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の順位を基準にして更新することなく、更新後の格納順序と等価な状態を構築するようにしたものである。
【００５２】
この発明に係る音声復号化装置は、インデックスをマッピングするマッピング手段を有し、少なくとも１以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の偏差の合計値が最小となるように更新することなく、更新後の格納順序と等価な状態を構築するようにしたものである。
【００５３】
この発明に係る符号語配列方法は、各符号帳の符号語に関する評価値を調査し、他の符号帳の符号語に関する評価値の順位と相応して、少なくとも１以上の符号帳の符号語の格納順序を並び換えるようにしたものである。
【００５４】
この発明に係る符号語配列方法は、符号語に関する評価値として、その符号語のパワー又は平均振幅を用いるようにしたものである。
【００５５】
この発明に係る符号語配列方法は、複数の符号帳が音源ゲインを出力する符号帳であるようにしたものである。
【００５６】
この発明に係る符号語配列方法は、複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値を計算し、その合計値が減少して最小化するまで、少なくとも１以上の符号帳の符号語の格納順序を更新するようにしたものである。
【００５７】
この発明に係る符号語配列方法は、符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うようにしたものである。
【００５８】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態１．
図１はこの発明の実施の形態１による音声符号化装置を示す構成図であり、図において、４１は入力音声に重畳している背景雑音を抑圧する雑音抑圧処理を実行するとともに、入力音声の直流成分をカットする低域阻止フィルタ処理を実行する前処理部、４２は前処理部４１による前処理後の入力音声を分析して、音声のスペクトル包絡情報である線スペクトル対（以下、ＬＳＰという）を求めるスペクトル分析部、４３はスペクトル分析部４２により求められたＬＳＰを符号化して、そのＬＳＰ符号を多重化部６０に出力するとともに、そのＬＳＰを量子化して、量子化後のＬＳＰ（ＬＳＰ符号を復号化した結果と同じ）を合成フィルタ４４のフィルタ係数（線形予測係数）に変換し、そのフィルタ係数を合成フィルタ４４と聴覚重み付け部４６に出力するスペクトル符号化部である。
【００５９】
４４はスペクトル符号化部４３が出力するフィルタ係数を用いて、切換スイッチ５９により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する合成フィルタ、４５は合成フィルタ４４により生成された合成音と前処理部４１による前処理後の入力音声との差信号を出力する減算器、４６はスペクトル符号化部４３が出力するフィルタ係数に基づいて聴覚重み付けフィルタ係数を算出し、その聴覚重み付けフィルタ係数を用いて、減算器４５が出力する差信号に対する聴覚重み付けフィルタ処理を実行して聴覚重み付け差信号を出力する聴覚重み付け部である。
【００６０】
４７は聴覚重み付け部４６が出力する聴覚重み付け差信号のパワーを計算し、そのパワーの最小化を図るため、インデックス（ゲイン符号、駆動音源符号、適応音源符号）及び符号化モードを示すモード情報を逐次更新する歪み最小化部、４８，４９は歪み最小化部４７による更新後のインデックスに対応する符号語を出力する符号帳を有し、その符号語から仮の音源を生成する音源復号化部である。
【００６１】
５０は過去の音源を所定長記憶し、歪み最小化部４７から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルである適応符号ベクトルを出力する適応音源符号帳、５１は非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部４７から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、５２はゲインに関する符号語（ゲイン値を示す語）を格納し、歪み最小化部４７からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、５３はゲイン符号帳５２が出力するゲイン値を適応音源符号帳５０が出力する適応符号ベクトルに乗算する乗算器、５４はゲイン符号帳５２が出力するゲイン値を駆動音源符号帳５１が出力する駆動符号ベクトルに乗算する乗算器、５５は乗算器５３の乗算結果と乗算器５４の乗算結果を加算し、その加算結果（仮の音源）を出力する加算器である。
【００６２】
５６は雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部４７から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、５７はゲインに関する符号語（ゲイン値を示す語）を格納し、歪み最小化部４７からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、５８はゲイン符号帳５７が出力するゲイン値を駆動音源符号帳５６が出力する駆動符号ベクトルに乗算し、その乗算結果（仮の音源）を出力する乗算器である。
【００６３】
５９は歪み最小化部４７からモード情報を受けると、そのモード情報にしたがって音源復号化部４８が出力する仮の音源又は音源復号化部４９が出力する仮の音源を選択し、その選択した仮の音源を合成フィルタ４４に与える切換スイッチである。なお、前処理部４１，スペクトル分析部４２，スペクトル符号化部４３，合成フィルタ４４，減算器４５，聴覚重み付け部４６，歪み最小化部４７，音源復号化部４８，４９及び切換スイッチ５９から符号化手段が構成されている。６０はスペクトル符号化部４３により符号化されたＬＳＰ符号と、歪み最小化部４７による更新後のインデックス及びモード情報とを多重化して音声符号を生成し、その音声符号を出力する多重化部（多重化手段）である。
【００６４】
図２はこの発明の実施の形態１による音声復号化装置を示す構成図であり、図において、６１は音声符号化装置により多重化されたＬＳＰ符号とインデックスとモード情報とを分離する分離部（分離手段）、６２，６３は分離部６１により分離されたインデックスに対応する符号語を出力する符号帳を有し、その符号語から音源を生成する音源復号化部である。
【００６５】
６４は過去の音源を所定長記憶し、分離部６１から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルである適応符号ベクトルを出力する適応音源符号帳、６５は非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部６１から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、６６はゲインに関する符号語（ゲイン値を示す語）を格納し、分離部６１からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、６７はゲイン符号帳６６が出力するゲイン値を適応音源符号帳６４が出力する適応符号ベクトルに乗算する乗算器、６８はゲイン符号帳６６が出力するゲイン値を駆動音源符号帳６５が出力する駆動符号ベクトルに乗算する乗算器、６９は乗算器６７の乗算結果と乗算器６８の乗算結果を加算し、その加算結果（仮の音源）を出力する加算器である。
【００６６】
７０は雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部６１から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、７１はゲインに関する符号語（ゲイン値を示す語）を格納し、分離部６１からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、７２はゲイン符号帳７１が出力するゲイン値を駆動音源符号帳７０が出力する駆動符号ベクトルに乗算し、その乗算結果（仮の音源）を出力する乗算器である。
【００６７】
７３は分離部６１からモード情報を受けると、そのモード情報にしたがって音源復号化部６２が出力する仮の音源又は音源復号化部６３が出力する仮の音源を選択し、その選択した仮の音源を合成フィルタ７５に与える切換スイッチ、７４は分離部６１が出力するＬＳＰ符号を復号化し、その復号結果を合成フィルタ７５のフィルタ係数（線形予測係数）に変換して、そのフィルタ係数を合成フィルタ７５と後処理部７６に出力するスペクトル復号化部である。
【００６８】
７５はスペクトル復号化部７４が出力するフィルタ係数を用いて、切換スイッチ７３により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する合成フィルタ、７６はスペクトル復号化部７４が出力するフィルタ係数等に基づいて合成フィルタ７５により生成された合成音に対する音声強調処理などの後処理を実行し、入力音声の再生結果（出力音声）を出力する後処理部である。
なお、音源復号化部６２，６３，切換スイッチ７３，スペクトル復号化部７４，合成フィルタ７５及び後処理部７６から復号化手段が構成されている。
図３はこの発明の実施の形態１による符号語配列方法を示すフローチャートである。
【００６９】
次に動作について説明する。
従来の音声符号化装置及び音声復号化装置は、５〜５０ｍｓ程度を１フレームとして、フレーム単位に処理を実行する。
【００７０】
まず、音声符号化装置の前処理部４１は、入力音声を受けると、その入力音声に重畳している背景雑音を抑圧する雑音抑圧処理を実行するとともに、入力音声の直流成分をカットする低域阻止フィルタ処理を実行する。
スペクトル分析部４２は、前処理部４１が入力音声に対する前処理を実行すると、前処理後の入力音声を分析して、音声のスペクトル包絡情報であるＬＳＰを求める。
【００７１】
そして、スペクトル符号化部４３は、スペクトル分析部４２により求められたＬＳＰを符号化して、そのＬＳＰ符号を多重化部６０に出力する。また、そのＬＳＰを量子化して、量子化後のＬＳＰを合成フィルタ４４のフィルタ係数に変換し、そのフィルタ係数を合成フィルタ４４と聴覚重み付け部４６に出力する。
【００７２】
合成フィルタ４４は、スペクトル符号化部４３からフィルタ係数を受けると、そのフィルタ係数を用いて、切換スイッチ５９により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する。仮の音源の生成処理は後述する。
減算器４５は、合成フィルタ４４が合成音を生成すると、その合成音と前処理部４１による前処理後の入力音声との差信号を出力し、聴覚重み付け部４６は、スペクトル符号化部４３が出力するフィルタ係数に基づいて聴覚重み付けフィルタ係数を算出し、その聴覚重み付けフィルタ係数を用いて、減算器４５が出力する差信号に対する聴覚重み付けフィルタ処理を実行して聴覚重み付け差信号を出力する。
【００７３】
歪み最小化部４７は、インデックス及び符号化モードを逐次更新することにより、聴覚重み付け部４６が出力する聴覚重み付け差信号のパワーの最小化を図る。
即ち、インデックスとモード情報を適宜選択して、音源復号化部４８，４９と切換スイッチ５９に出力する毎に、その聴覚重み付け差信号のパワーを計算し、その計算結果であるパワーが最も小さくなるインデックスとモード情報の組合せを検索する。そして、聴覚重み付け差信号のパワーが最小になるインデックスとモード情報が求まると、そのインデックスとモード情報を多重化部６０に出力する。ただし、音源復号化部４９には適応音源符号帳が内蔵されていないので、第二の符号化モードを示すモード情報を出力する場合には、適応音源符号を出力しない。
【００７４】
音源復号化部４８，４９は、歪み最小化部４７からインデックスを受けると、そのインデックスに応じて仮の音源を生成する。
具体的には、まず、音源復号化部４８の適応音源符号帳５０は、過去の音源を所定長記憶し、歪み最小化部４７から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルを適応符号ベクトルとして出力する。なお、適応音源符号帳５０は、歪み最小化部４７がインデックス及びモード情報を選択した後で、そのインデックス及びモード情報に対して、切換スイッチ５９が出力した仮の音源を選択して出力すると、その仮の音源を最終的な音源として記憶する。
【００７５】
音源復号化部４８の駆動音源符号帳５１は、非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部４７から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳５１は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、歪み最小化部４７が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
【００７６】
そして、ゲイン符号帳５２がゲイン符号に対応するゲイン値を出力すると、適応音源符号帳５０から出力された適応符号ベクトルと駆動音源符号帳５１から出力された駆動符号ベクトルは、乗算器５３，５４によりゲイン値が乗算され、加算器５５により乗算器５３，５４の乗算結果が相互に加算される。
【００７７】
一方、音源復号化部４９の駆動音源符号帳５６は、雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部４７から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳５６は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、歪み最小化部４７が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
そして、ゲイン符号帳５７がゲイン符号に対応するゲイン値を出力すると、駆動音源符号帳５６から出力された駆動符号ベクトルは、乗算器５８によりゲイン値が乗算される。
【００７８】
このようにして、音源復号化部４８の加算器５５から仮の音源が出力され、音源復号化部４９の乗算器５８から仮の音源が出力されると、切換スイッチ５９は、歪み最小化部４７が出力するモード情報にしたがって音源復号化部４８が出力する仮の音源又は音源復号化部４９が出力する仮の音源の何れか一方を選択し、その選択した仮の音源を合成フィルタ４４に与える。
【００７９】
多重化部６０は、スペクトル符号化部４３により符号化されたＬＳＰ符号と、歪み最小化部４７による更新後のインデックス及びモード情報（聴覚重み付け差信号のパワーが最小となるインデックス及びモード情報）とを多重化して音声符号を生成し、その音声符号を出力する。
【００８０】
次に、音声復号化装置の分離部６１は、音声符号化装置から出力された音声符号を入力すると、その音声符号に含まれているＬＳＰ符号とインデックスとモード情報とを分離する。
【００８１】
音源復号化部６２，６３は、分離部６１からインデックスを受けると、そのインデックスに応じて仮の音源を生成する。
具体的には、まず、音源復号化部６２の適応音源符号帳６４は、過去の音源を所定長記憶し、分離部６１から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルを適応符号ベクトルとして出力する。なお、適応音源符号帳６４は、切換スイッチ７３が仮の音源を選択して出力すると、その仮の音源を最終的な音源として記憶する。
【００８２】
音源復号化部６２の駆動音源符号帳６５は、非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部６１から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳６５は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、分離部６１が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
【００８３】
そして、ゲイン符号帳６６がゲイン符号に対応するゲイン値を出力すると、適応音源符号帳６４から出力された適応符号ベクトルと駆動音源符号帳６５から出力された駆動符号ベクトルは、乗算器６７，６８によりゲイン値が乗算され、加算器６９により乗算器６７，６８の乗算結果が相互に加算される。
【００８４】
一方、音源復号化部６３の駆動音源符号帳７０は、雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部６１から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳７０は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、分離部６１が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
そして、ゲイン符号帳７１がゲイン符号に対応するゲイン値を出力すると、駆動音源符号帳７０から出力された駆動符号ベクトルは、乗算器７２によりゲイン値が乗算される。
【００８５】
このようにして、音源復号化部６２の加算器６９から仮の音源が出力され、音源復号化部６３の乗算器７２から仮の音源が出力されると、切換スイッチ７３は、分離部６１が出力するモード情報にしたがって音源復号化部６２が出力する仮の音源又は音源復号化部６３が出力する仮の音源の何れか一方を選択し、その選択した仮の音源を合成フィルタ７５に与える。
【００８６】
スペクトル復号化部７４は、分離部６１がＬＳＰ符号を出力すると、そのＬＳＰ符号を復号化し、その復号結果を合成フィルタ７５のフィルタ係数に変換して、そのフィルタ係数を合成フィルタ７５と後処理部７６に出力する。
合成フィルタ７５は、スペクトル復号化部７４からフィルタ係数を受けると、そのフィルタ係数を用いて、切換スイッチ７３により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する。
後処理部７６は、スペクトル復号化部７４が出力するフィルタ係数等に基づいて合成フィルタ７５により生成された合成音に対する音声強調処理などの後処理を実行し、入力音声の再生結果（出力音声）を出力する。
【００８７】
ここで、図４は音声符号化装置及び音声復号化装置により使用されるゲイン符号帳の一例を示す説明図である。特に、図４（ａ）はゲイン符号帳５２，６６の一例を示し、図４（ｂ）はゲイン符号帳５７，７１の一例を示している。
【００８８】
この例の場合、各ゲイン符号帳は１２８個のゲイン符号語を格納している。ただし、ゲイン符号帳５２，６６に格納されているゲイン符号語は、適応符号ベクトルと駆動符号ベクトルに乗じる２個のゲイン値の組を示す符号語から構成され、ゲイン符号帳５７，７１に格納されているゲイン符号語は、駆動符号ベクトルに乗じる１個のゲイン値を示す符号語から構成されている。
インデックスと評価値順位は、各ゲイン符号帳内に実際には格納されていないものであるが、説明の便宜のため記載している。インデックスは上の符号語から順番に０から１２７の値となっている。評価値はゲイン符号語のパワー（２乗和）の値である（評価値としては、ゲイン符号語のパワーに限るものではなく、ゲイン符号語の平均振幅などでもよい）。例えば、インデックスが「１」の符号語のパワーの順位は「１０２」である。
【００８９】
各ゲイン符号帳の動作としては、あるゲイン符号を入力すると、そのゲイン符号に一致するインデックス位置に格納しているゲイン符号語を出力する。
各ゲイン符号帳に格納されているゲイン符号語は、学習用音声とその符号化音声との歪みが小さくなるように学習して作成される。
そして、音声符号を伝送する際の符号誤りによる出力音声の劣化を最小限に抑えるため、適切にゲイン符号語の並べ換えが行われる。
【００９０】
例えば、ゲイン符号に１ビット誤りを実際に与えたときに生じる劣化の大きさの期待値を計算し、さらに、ランダムに選択した２つのゲイン符号語を交換したときに生じる劣化の大きさの期待値を計算し、前者の期待値と比べて後者の期待値が減少するときに実際にゲイン符号語の格納順序を交換する。
この作業を期待値の減少が微小になるまで繰り返す。
【００９１】
ただし、ゲイン符号帳５７，７１に格納されているゲイン符号語については、各ゲイン符号語のパワーを調査し、そのパワーを基準にして、ゲイン符号帳５７，７１に格納されているゲイン符号語の格納順序を更新する。
即ち、ゲイン符号帳５７，７１に格納されているゲイン符号語のパワーをそれぞれ調査すると（ステップＳＴ１）、既にゲイン符号語の並べ換えを完了しているゲイン符号帳５２，６６に格納されているゲイン符号語のパワーの順位と同じ順番になるように、ゲイン符号帳５７，７１に格納されているゲイン符号語の格納順序を並べ換える処理を実行する（ステップＳＴ２）。
【００９２】
図４の各ゲイン符号帳は既に並べ換えが完了したものである。ゲイン符号帳５２，６６では、例えば、インデックスが「０」に対応するゲイン符号語のパワー（評価値）順位が「４１」であるので、ゲイン符号帳５７，７１ではパワー（評価値）順位が「４１」のゲイン符号語が「０」のインデックスに対応するように格納されている。
インデックスが「１」以降のゲイン符号語についても同様にして、格納順序が並び換えられる。
【００９３】
図５は多重化部６０から出力される音声符号の一例を示す説明図である。
多重化部６０では、ＬＳＰ符号，モード情報，ゲイン符号，駆動音源符号及び適応音源符号を多重化して（ただし、適応音源符号は第一の符号化モードの場合に限り多重化の対象に含められる）、音声符号を生成するが、この実施の形態１では、符号化モードが第一の符号化モードであっても、第二の符号化モードであっても、ゲイン符号の符号化ビット数と、ゲイン符号の多重化位置とが変化しないように音声符号を生成している。
【００９４】
ここで、音声符号化装置が第一の符号化モードで符号化して生成した音声符号（図５（ａ）を参照）に伝送誤りが重畳することにより、その音声符号が図５（ｂ）に示すように変化した場合を想定する。
この場合、音声復号化装置は、符号化モードが第二の符号化モードであると誤認して、入力音声の復号化処理を実施するが、上述したように、符号化モードが第一の符号化モードであっても、第二の符号化モードであっても、ゲイン符号の符号化ビット数と、ゲイン符号の多重化位置とが変化しないように音声符号を生成しているので、モード情報に伝送誤りが生じても、音声復号化装置はゲイン符号の値を正確に認識することができる。図５の例では、モード情報の誤認の有無に拘わらず、ゲイン符号の値が２になる。
【００９５】
したがって、音声復号化装置におけるゲイン符号帳６６，７１は、モード情報に伝送誤りが生じても、同一値のゲイン符号に対応するゲイン符号語（ゲイン値）を出力することができる。また、ゲイン符号帳６６，７１に格納されているゲイン符号語は、上述したように、パワー値順位が同じ順番になるように並べ換えられているので、モード情報に伝送誤りが生じても、同一値のゲイン符号を入力できれば、出力するゲイン値の大きさが極端に変化することはない。
【００９６】
以上で明らかなように、この実施の形態１によれば、ゲイン符号帳５２，６６（または５７，７１）のゲイン符号語の格納順序が、他のゲイン符号帳５７，７１（または５２，６６）のゲイン符号語に関する評価値の順位と相応して、並び換えられているように構成したので、音声符号化装置においては、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、音声の再生品質の劣化を抑制することが可能な音声符号を生成することができる効果を奏する。一方、音声復号化装置においては、モード情報を誤認しても、音声の再生品質の劣化を抑制することができる効果を奏する。
【００９７】
また、この実施の形態１によれば、ゲイン符号語に関する評価値として、そのゲイン符号語のパワー又は平均振幅を用いるように構成したので、音声符号化装置においては、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、音声復号化装置により再生される音声のパワーや振幅が大きく劣化することのない音声符号を生成することができる効果を奏する。一方、音声復号化装置においては、モード情報を誤認しても、音声のパワーや振幅の大きな劣化を招くことなく、音声を再生することができる効果を奏する。
【００９８】
さらに、この実施の形態１によれば、ゲイン符号帳５２，６６，５７，７１が音源ゲイン（ゲイン値）を出力する符号帳であるように構成したので、音声符号化装置においては、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、音声復号化装置により再生される音声のゲイン値が大きく劣化することのない音声符号を生成することができる効果を奏する。一方、音声復号化装置においては、モード情報を誤認しても、音声のゲイン値の大きな劣化を招くことなく、音声を再生することができる効果を奏する。
【００９９】
実施の形態２．
図６はこの発明の実施の形態２による音声符号化装置を示す構成図であり、図において、図１と同一符号は同一または相当部分を示すので説明を省略する。
８１はスペクトル符号化部４３により量子化されたＬＳＰからモード情報を決定する音源モード選択部、８２は音源モード選択部８１からモード情報を受けると、そのモード情報にしたがって駆動音源符号帳５１が出力する駆動符号ベクトル又は駆動音源符号帳５６が出力する駆動符号ベクトルを選択するとともに、ゲイン符号帳５２が出力するゲイン値又はゲイン符号帳５７が出力するゲイン値を選択する切換スイッチである。
【０１００】
８３は切換スイッチ８２により選択されたゲイン値を適応音源符号帳５０が出力する適応符号ベクトルに乗算する乗算器、８４は切換スイッチ８２により選択されたゲイン値を切換スイッチ８２により選択された駆動符号ベクトルに乗算する乗算器、８５は乗算器８３の乗算結果と乗算器８４の乗算結果を加算し、その加算結果（仮の音源）を出力する加算器である。なお、音源モード選択部８１，切換スイッチ８２，乗算器８３，８４及び加算器８５は符号化手段を構成する。
【０１０１】
図７はこの発明の実施の形態２による音声復号化装置を示す構成図であり、図において、図２と同一符号は同一または相当部分を示すので説明を省略する。
９１はスペクトル復号化部７４により量子化されたＬＳＰからモード情報を決定する音源モード選択部、９２は音源モード選択部９１からモード情報を受けると、そのモード情報にしたがって駆動音源符号帳６５が出力する駆動符号ベクトル又は駆動音源符号帳７０が出力する駆動符号ベクトルを選択するとともに、ゲイン符号帳６６が出力するゲイン値又はゲイン符号帳７１が出力するゲイン値を選択する切換スイッチである。
【０１０２】
９３は切換スイッチ９２により選択されたゲイン値を適応音源符号帳６４が出力する適応符号ベクトルに乗算する乗算器、９４は切換スイッチ９２により選択されたゲイン値を切換スイッチ９２により選択された駆動符号ベクトルに乗算する乗算器、９５は乗算器９３の乗算結果と乗算器９４の乗算結果を加算し、その加算結果（仮の音源）を出力する加算器である。なお、音源モード選択部９１，切換スイッチ９２，乗算器９３，９４及び加算器９５は復号化手段を構成する。
【０１０３】
次に動作について説明する。
上記実施の形態１では、切換スイッチ５９（または７３）が音源復号化部４８（または６２）が出力する仮の音源又は音源復号化部４９（または６３）が出力する仮の音源を選択して、その選択した仮の音源を合成フィルタ４４（または７５）に出力するものについて示したが、図６及び図７に示すように、切換スイッチ８２（または９２）が駆動音源符号帳５１（または６５）の駆動符号ベクトル又は駆動音源符号帳５６（または７０）の駆動符号ベクトルを選択して乗算器８３（または９３）に出力するとともに、ゲイン符号帳５２（または６６）のゲイン値又はゲイン符号帳５７（または７１）のゲイン値を選択して乗算器８４（または９４）に出力し、加算器８５（または９５）が乗算器８３（または９３）の乗算結果と乗算器８４（または９４）の乗算結果を加算し、その加算結果を仮の音源として合成フィルタ４４（または７５）に出力するようにしてもよい。
この場合でも、上記実施の形態１と同様の効果を奏することができる。
【０１０４】
ただし、ゲイン符号帳５７，７１に格納されているゲイン符号語は、ゲイン符号帳５２，６６に格納されているゲイン符号語と同様に、適応符号ベクトルと駆動符号ベクトルに乗じる２個のゲイン値の組を示す符号語から構成されているものとする。
【０１０５】
なお、上記実施の形態１では、各ゲイン符号帳のゲイン符号語の格納順序を並べ換えるものについて示したが、これに限るものではなく、パワー符号帳やＬＳＰ符号帳などのベクトル符号帳についても、モード毎に異なる符号帳を使用する構成であれば、各符号語のパワーや振幅を評価値として、その順位が一致するように並び換えられた符号帳を使用する構成も可能である。
【０１０６】
また、２つの符号帳の評価値順位については、順位の差が小さい範囲であれば、完全に一致していなくてもよく、同様の効果を奏することができる。
また、上記の方法で２つの符号帳の評価値順位を一致させた後に、２つの符号帳中の符号語を同時に並べ換えて、ゲイン符号にビット誤りが重畳したときの劣化を最小限に抑制するなど、様々な方法で並び換えを行うことが可能である。
【０１０７】
実施の形態３．
上記実施の形態１では、ゲイン符号帳５２，６６及びゲイン符号帳５７，７１に格納されているゲイン符号語の格納順序を図４に示すように並べ換えるものについて示したが、図８に示すように並べ換えるようにしてもよい。
【０１０８】
具体的には、ゲイン符号帳５２，６６には１２８個のゲイン符号語を格納し、ゲイン符号帳５７，７１には２５６個のゲイン符号語を格納する。
ゲイン符号帳５２，６６に格納されているゲイン符号語は、適応符号ベクトルと駆動符号ベクトルに乗じる２個のゲイン値の組を示す符号語から構成され、ゲイン符号帳５７，７１に格納されているゲイン符号語は、駆動符号ベクトルに乗じる１個のゲイン値を示す符号語から構成されている。
【０１０９】
インデックスと、インデックスの上位７ビットの値と、評価値順位とは、各ゲイン符号帳内に実際には格納されていないものであるが、説明の便宜のため記載している。インデックスは上の符号語から順番に０から１２７の値、または、０から２５５の値となっている。
インデックスの上位７ビットの値は、例えば、インデックスが「０」又は「１」の場合に「０」となり、インデックスが「２」又は「３」の場合に「１」となるように、２つずつが同じ値を持っている。
【０１１０】
評価値はゲイン符号語のパワー（２乗和）の値であり（評価値としては、ゲイン符号語のパワーに限るものではなく、ゲイン符号語の平均振幅などでもよい）、ゲイン符号帳５２，６６については、各ゲイン符号語の評価値順位が示されている。ゲイン符号帳５７，７１については、インデックスの上位７ビットが同じ値である２つのゲイン符号語における評価値の平均値に関する順位が評価値平均順位として示されている。
【０１１１】
各ゲイン符号帳の動作としては、あるゲイン符号を入力すると、そのゲイン符号に一致するインデックス位置に格納しているゲイン符号語を出力する。
各ゲイン符号帳に格納されているゲイン符号語は、学習用音声とその符号化音声との歪みが小さくなるように学習して作成される。
そして、ゲイン符号帳５２，６６については、音声符号を伝送する際の符号誤りによる出力音声の劣化を最小限に抑えるため、適切にゲイン符号語の並べ換えを行う。
【０１１２】
例えば、ゲイン符号に１ビット誤りを実際に与えたときに生じる劣化の大きさの期待値を計算し、さらに、ランダムに選択した２つのゲイン符号語を交換したときに生じる劣化の大きさの期待値を計算し、前者の期待値と比べて後者の期待値が減少するときに実際にゲイン符号語の格納順序を交換する。
この作業を期待値の減少が微小になるまで繰り返す。
【０１１３】
ゲイン符号帳５７，７１については、最初に、ゲイン符号帳５２，６６と同様に、音声符号を伝送する際の符号誤りによる出力音声の劣化を最小限に抑えるために、適切にゲイン符号語の並べ換えを行う。
次に、その時点でインデックスの上位７ビットが同じ値となる２つのゲイン符号語を対とする。そして、各ゲイン符号語対のパワーの平均値を求め、ゲイン符号帳５７，７１におけるパワーの平均値の順位を調べて、既にゲイン符号語の並べ換えが完了しているゲイン符号帳５２，６６のゲイン符号語のパワー順位と同じ順番になるように、ゲイン符号帳５７，７１中のゲイン符号語対を並べ換える。
【０１１４】
図８の各ゲイン符号帳は既に並べ換えが完了したものである。ゲイン符号帳５２，６６では、例えば、インデックスが「０」に対応するゲイン符号語のパワー（評価値）順位が「４１」であるので、ゲイン符号帳５７，７１ではパワー（評価値）平均順位が「４１」のゲイン符号語対が「０」のインデックスに対応するように格納されている。
インデックスが「１」以降のゲイン符号語についても同様にして、格納順序が並び換えられる。
【０１１５】
図９は多重化部６０から出力される音声符号の一例を示す説明図である。
多重化部６０では、ＬＳＰ符号，モード情報，ゲイン符号，駆動音源符号及び適応音源符号を多重化して（ただし、適応音源符号は第一の符号化モードの場合に限り多重化の対象に含められる）、音声符号を生成するが、この実施の形態３では、符号化モードが第一の符号化モードの場合はゲイン符号の符号化ビット数が「７」であり、第二の符号化モードの場合はゲイン符号の符号化ビット数が「８」である。ただし、第一の符号化モードにおけるゲイン符号７ビットと、第二の符号化モードにおけるゲイン符号の上位７ビットの多重化位置が一致するように音声符号を生成している。
【０１１６】
ここで、音声符号化装置が第一の符号化モードで符号化して生成した音声符号（図９（ａ）を参照）に伝送誤りが重畳することにより、その音声符号が図９（ｂ）に示すように変化した場合を想定する。
この場合、音声復号化装置は、符号化モードが第二の符号化モードであると誤認して、入力音声の復号化処理を実施するが、上述したように、第一の符号化モードにおけるゲイン符号７ビットと、第二の符号化モードにおけるゲイン符号の上位７ビットの多重化位置が一致するように音声符号を生成しているので、モード情報に伝送誤りが生じても、音声復号化装置はゲイン符号の値を正確に認識することができる。
【０１１７】
即ち、符号化モードが第一の符号化モードであるため、図９（ａ）に示すように、ゲイン符号の値が「１」であり、モード情報に伝送誤りがなければ、ゲイン符号帳６６のインデックスが「１」であるゲイン符号語（評価値順位が「１０２」の符号語）を用いて復号処理を行う。
しかし、モード情報に伝送誤りが生じると、符号化モードが第二の符号化モードであると誤認するが、この実施の形態３では、誤認の有無に拘わらず、ゲイン符号帳７１のインデックスの上位７ビットが「１」であるゲイン符号語を用いて復号処理を行うことになる。具体的には、図９（ｂ）に示すように、ゲイン符号の次のビットが「０」であるため、インデックスが「２」（＝１×２＋０）であるゲイン符号語（評価値順位が「１０２」の符号語）を用いて復号処理を行うことになる。
【０１１８】
したがって、音声復号化装置におけるゲイン符号帳６６，７１は、モード情報に伝送誤りが生じても、評価値順位と評価値平均順位が一致又は略一致するゲイン符号に対応するゲイン符号語（ゲイン値）を出力することができるので、モード情報に伝送誤りが生じても、出力するゲイン値の大きさが極端に変化することはない。
【０１１９】
これにより、上記実施の形態１と同様の効果を奏することができる。
なお、この実施の形態３では、図１の音声符号化装置及び図２の音声復号化装置に適用するものについて示したが、上記実施の形態２のように、図６の音声符号化装置及び図７の音声復号化装置に適用するようにしてもよい。
【０１２０】
実施の形態４．
図１０はこの発明の実施の形態４による符号語配列方法が適用する符号語配列装置を示す構成図であり、図において、１０１は駆動音源符号帳５１，６５に相当する駆動音源符号帳、１０２は駆動音源符号帳５６，７０に相当する駆動音源符号帳、１０３，１０４は合成フィルタ、１０５は距離計算部、１０６は距離計算部１０５の計算結果（評価値の偏差の合計値）が減少して最小化するまで、駆動音源符号帳１０２に格納されている符号語である駆動符号ベクトルの格納順序を更新する符号語入れ換え部である。
【０１２１】
次に動作について説明する。
駆動音源符号帳１０１については、上記実施の形態１におけるゲイン符号帳５２等と同様に、音声符号を伝送する際の符号誤りによる出力音声の劣化を最小限に抑えるために、予め適切な符号語の並べ換えを実施する。
また、駆動音源符号帳１０１，１０２を使用して、多くの学習用の音声信号を入力とする音声符号化処理を実施し、各フレーム毎に、合成フィルタ１０３，１０４のためのフィルタ係数、駆動音源符号語、ゲイン値を学習用データとして、別途蓄積する。
【０１２２】
まず、距離計算部１０５は、上記学習用データに含まれる各フレーム毎の駆動音源符号を駆動音源符号帳１０１，１０２に出力し、フィルタ係数を合成フィルタ１０３，１０４に出力する。
【０１２３】
駆動音源符号帳１０１は、距離計算部１０５から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力し、合成フィルタ１０３は、距離計算部１０５から出力されたフィルタ係数を用いて、その駆動符号ベクトルに対する合成フィルタリングを実施して第一の合成音を生成する。
駆動音源符号帳１０２は、距離計算部１０５から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力し、合成フィルタ１０４は、距離計算部１０５から出力されたフィルタ係数を用いて、その駆動符号ベクトルに対する合成フィルタリングを実施して第二の合成音を生成する。
【０１２４】
距離計算部１０５は、合成フィルタ１０３により生成された第一の合成音と合成フィルタ１０４により生成された第二の合成音との距離をフレーム毎に計算し、全フレームの距離値を合計して、その合計距離を符号語入れ換え部１０６に出力する。
【０１２５】
符号語入れ換え部１０６は、距離計算部１０５が合計距離を出力すると、その合計距離を記憶する。ここまでが図１０の符号語配列装置の初期化処理である。続いて行われる繰返し処理は以下の通りである。
【０１２６】
符号語入れ換え部１０６は、ランダムに選択した２つの駆動音源符号に対応する駆動音源符号帳１０２の符号語の入れ換えを実施する。
距離計算部１０５は、再度、上記学習用データに含まれる各フレーム毎の駆動音源符号を駆動音源符号帳１０１と符号語の入れ換えが行われた駆動音源符号帳１０２に出力し、フィルタ係数を合成フィルタ１０３，１０４に出力する。
【０１２７】
そして、距離計算部１０５は、同様にして生成された第一の合成音と第二の合成音を合成フィルタ１０３，１０４から入力し、第一の合成音と第二の合成音との距離をフレーム毎に計算し、全フレームの距離値を合計して、その合計距離を符号語入れ換え部１０６に出力する。
【０１２８】
符号語入れ換え部１０６は、距離計算部１０５から合計距離を受けると、その合計距離と、予め記憶しておいた合計距離とを比較する。合計距離が減少している場合には、今回入力した合計距離を新たに記憶し、合計距離が減少していない場合には、前回の符号語の入れ換えを元に戻す処理を実施する。そして、上記繰返し処理の最初に戻る。
ここまでの繰返し処理を合計距離の減少が少なくなるまで繰り返し、駆動音源符号帳１０２の符号語の並び換えを完了する。
【０１２９】
以上で明らかなように、この実施の形態４によれば、距離計算部１０５により計算された合計距離が減少して最小化するまで、駆動音源符号帳１０２の符号語の入れ換えを実施するように構成したので、音声符号化装置においては、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、所定の評価値に関する劣化の期待値が小さくなり、その結果、音声の再生品質の劣化を抑制することが可能な音声符号を生成することができる効果を奏する。一方、音声復号化装置においては、モード情報を誤認しても、所定の評価値に関する劣化の期待値が小さくなり、その結果、音声の再生品質の劣化を抑制することができる効果を奏する。
また、符号化時と復号化時に異なる駆動音源符号帳が使用された場合でも、所定評価値に関する劣化の期待値が低い復号結果を与えることができるベクトル符号帳が得られる効果も奏する。
【０１３０】
なお、この実施の形態４では、距離計算部１０５における距離としては、２つの合成音におけるサンプル毎の値の差の２乗和、聴覚重み付けを行った２つの合成音におけるサンプル毎の値の差の２乗和、２つの合成音のパワー差など様々なものを適用することができる。
また、ここでは、駆動音源符号帳１０１，１０２に関する並び換えについて説明したが、ゲイン符号帳、ＬＳＰ符号帳などの他の符号帳についても、複数備えてモード切換を実施する場合には、同様な逐次交換処理によって符号語を並べ換えるようにしてもよい。
【０１３１】
実施の形態５．
図１１はこの発明の実施の形態５による音声符号化装置を示す構成図であり、図１２はこの発明の実施の形態５による音声復号化装置を示す構成図である。図において、図１及び図２と同一符号は同一または相当部分を示すので説明を省略する。
１１１は歪み最小化部４７による更新後のゲイン符号をマッピングし、マッピング後のゲイン符号をゲイン符号帳５７に出力するマッピング部、１１２は分離部６１により分離されたゲイン符号をマッピングし、マッピング後のゲイン符号をゲイン符号帳７１に出力するマッピング部である。
なお、マッピング部１１１，１１２はマッピング手段を構成している。
【０１３２】
次に動作について説明する。
まず、音声符号化装置のマッピング部１１１は、歪み最小化部４７からゲイン符号を受けると、所定のルールにしたがって写像処理を実施し、そのゲイン符号に対応する写像ゲイン符号（マッピング後のゲイン符号）をゲイン符号帳５７に出力する。
ただし、この実施の形態５におけるゲイン符号帳５７は、上記実施の形態１におけるゲイン符号帳５７のような評価順位を基準とするゲイン符号語の並べ換えが実施されていないものとする。即ち、ゲイン符号帳５７の格納順序が図１７（ｂ）に示す通りであるとする。
【０１３３】
ゲイン符号帳５７は、マッピング部１１１から写像ゲイン符号を受けると、その写像ゲイン符号に一致するインデックス位置に格納されているゲイン符号語を出力する。
ただし、この実施の形態５では、上記実施の形態１におけるゲイン符号語と同様の並べ換え結果を得ることができるように、マッピング部１１１は、図１３に示すようなマッピング用テーブルを備えている。
【０１３４】
例えば、図１３のマッピング用テーブルの場合、マッピング部１１１が「０」のゲイン符号を入力すると、「１」の写像ゲイン符号を出力する。
これにより、ゲイン符号帳５７は、「１」の写像ゲイン符号に対応する評価値順位が「４１」のゲイン値を出力することになる（図１７（ｂ）を参照）。
したがって、上記実施の形態１におけるゲイン符号帳５７が出力するゲイン値と同一のゲイン値が得られる。
なお、音声符号化装置のその他の動作は上記実施の形態１と同様であるため説明を省略する。
【０１３５】
次に、音声復号化装置のマッピング部１１２は、分離部６１からゲイン符号を受けると、所定のルールにしたがって写像処理を実施し、そのゲイン符号に対応する写像ゲイン符号（マッピング後のゲイン符号）をゲイン符号帳７１に出力する。
ただし、この実施の形態５におけるゲイン符号帳７１は、上記実施の形態１におけるゲイン符号帳７１のような評価順位を基準とするゲイン符号語の並べ換えが実施されていないものとする。即ち、ゲイン符号帳７１の格納順序が図１７（ｂ）に示す通りであるとする。
【０１３６】
ゲイン符号帳７１は、マッピング部１１２から写像ゲイン符号を受けると、その写像ゲイン符号に一致するインデックス位置に格納されているゲイン符号語を出力する。
ただし、この実施の形態５では、上記実施の形態１におけるゲイン符号語と同様の並べ換え結果を得ることができるように、マッピング部１１２は、図１３に示すようなマッピング用テーブルを備えている。
【０１３７】
例えば、図１３のマッピング用テーブルの場合、マッピング部１１２が「０」のゲイン符号を入力すると、「１」の写像ゲイン符号を出力する。
これにより、ゲイン符号帳７１は、「１」の写像ゲイン符号に対応する評価値順位が「４１」のゲイン値を出力することになる（図１７（ｂ）を参照）。
したがって、上記実施の形態１におけるゲイン符号帳７１が出力するゲイン値と同一のゲイン値が得られる。
なお、音声復号化装置のその他の動作は上記実施の形態１と同様であるため説明を省略する。
【０１３８】
以上で明らかなように、この実施の形態５によれば、ゲイン符号をマッピングし、マッピング後のゲイン符号をゲイン符号帳５７，７１に出力するマッピング部１１１，１１２を設けるように構成したので、ゲイン符号語の格納順序を予め評価値を基準にして更新することなく、更新後の格納順序と等価な状態を構築することができる効果を奏する。
【０１３９】
また、マッピング部１１１，１１２の写像を複数用意して、音声符号に重畳する誤り条件に最適な写像を使用するようにした場合には、メモリ量を大きく増やすことなく、幅広い誤り条件下で品質劣化の少ない音声符号化装置と音声復号化装置が得られる効果を奏する。
【０１４０】
なお、この実施の形態５では、ゲイン符号帳５７，７１の前段に限りマッピング部１１１，１１２を設けるものについて示したが、ゲイン符号帳５２，６６の前段にもマッピング部１１１，１１２を設けるようにしてもよい。また、ゲイン符号帳５２，６６の前段に限りマッピング部１１１，１１２を設けるようにしてもよい。
【０１４１】
また、ゲイン符号帳以外の符号帳の前段にマッピング部１１１，１１２を導入する構成も可能であるし、図６の音声符号化装置及び図７の音声復号化装置におけるゲイン符号帳の前段にマッピング部１１１，１１２を導入する構成も可能である。
【０１４２】
さらに、ここで導入したマッピング部１１１，１１２の写像を固定とせず、音声符号に対して外部で適用される誤り訂正符号の条件に従って、複数の写像を切り換えて使用する構成も可能である。例えば、モード情報が強く保護されている場合には、ゲイン符号帳５７，７１を単独でビット誤りに強いように設計した写像を適用し、モード情報の保護が弱い場合には、これまで説明してきた方法によってモード情報を誤ったときの劣化を抑制するように写像を設計すればよい。
【０１４３】
図１４は２つの写像を切り換えて使用する場合の２つのマッピング用テーブルを示す説明図である。第一のマッピング用テーブル（図１４（ａ）を参照）は、モード情報が強く保護されている場合に使用するものであり、ゲイン符号帳５７，７１が既に単独でビット誤りに強いように設計しておくことで、写像によって符号が変化しないようになっている。第二のマッピング用テーブル（図１４（ｂ）を参照）は、モード情報の保護が弱い場合に使用するものであり、図１３のマッピング用テーブルと同じものである。なお、第一のマッピング用テーブルは省略して、写像を行うか否かを切り換える方法でも構わない。
【０１４４】
【発明の効果】
以上のように、この発明によれば、複数の符号帳が他の符号帳の符号語に関する評価値の順位と相応して、符号語の格納順序が並び換えられているように構成したので、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、音声の再生品質の劣化を抑制することが可能な音声符号を生成することができる効果がある。
【０１４５】
この発明によれば、符号語に関する評価値として、その符号語のパワー又は平均振幅を用いるように構成したので、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、音声復号化装置により再生される音声のパワーや振幅が大きく劣化することのない音声符号を生成することができる効果がある。
【０１４６】
この発明によれば、複数の符号帳が音源ゲインを出力する符号帳であるように構成したので、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、音声復号化装置により再生される音声のゲイン値が大きく劣化することのない音声符号を生成することができる効果がある。
【０１４７】
この発明によれば、複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値が最小となるように、複数の符号帳の符号語の格納順序が並び換えられているように構成したので、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、所定の評価値に関する劣化の期待値が小さくなり、その結果、音声の再生品質の劣化を抑制することが可能な音声符号を生成することができる効果がある。
【０１４８】
この発明によれば、符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うように構成したので、音声の再生品質の劣化を抑制することが可能な音声符号を生成することができる効果がある。
【０１４９】
この発明によれば、インデックスをマッピングするマッピング手段を有し、少なくとも１以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の順位を基準にして更新することなく、更新後の格納順序と等価な状態を構築するように構成したので、事前にゲイン符号語の格納順序を更新する処理が不要になる効果がある。
【０１５０】
この発明によれば、インデックスをマッピングするマッピング手段を有し、少なくとも１以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の偏差の合計値が最小となるように更新することなく、更新後の格納順序と等価な状態を構築するように構成したので、事前にゲイン符号語の格納順序を更新する処理が不要になる効果がある。
【０１５１】
この発明によれば、複数の符号帳が他の符号帳の符号語に関する評価値の順位と相応して、符号語の格納順序が並び換えられているように構成したので、モード情報を誤認しても、音声の再生品質の劣化を抑制することができる効果がある。
【０１５２】
この発明によれば、符号語に関する評価値として、その符号語のパワー又は平均振幅を用いるように構成したので、モード情報を誤認しても、音声のパワーや振幅の大きな劣化を招くことなく、音声を再生することができる効果がある。
【０１５３】
この発明によれば、複数の符号帳が音源ゲインを出力する符号帳であるように構成したので、モード情報を誤認しても、音声のゲイン値の大きな劣化を招くことなく、音声を再生することができる効果がある。
【０１５４】
この発明によれば、複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値が最小となるように、複数の符号帳の符号語の格納順序が並び換えられているように構成したので、モード情報を誤認しても、所定の評価値に関する劣化の期待値が小さくなり、その結果、音声の再生品質の劣化を抑制することができる効果がある。
【０１５５】
この発明によれば、符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うように構成したので、音声の再生品質の劣化を抑制することができる効果がある。
【０１５６】
この発明によれば、インデックスをマッピングするマッピング手段を有し、少なくとも１以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の順位を基準にして更新することなく、更新後の格納順序と等価な状態を構築するように構成したので、事前にゲイン符号語の格納順序を更新する処理が不要になる効果がある。
【０１５７】
この発明によれば、インデックスをマッピングするマッピング手段を有し、少なくとも１以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の偏差の合計値が最小となるように更新することなく、更新後の格納順序と等価な状態を構築するように構成したので、事前にゲイン符号語の格納順序を更新する処理が不要になる効果がある。
【０１５８】
この発明によれば、各符号帳の符号語に関する評価値を調査し、他の符号帳の符号語に関する評価値の順位と相応して、少なくとも１以上の符号帳の符号語の格納順序を並び換えるように構成したので、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、音声の再生品質の劣化を抑制することができる符号帳が得られる効果がある。
【０１５９】
この発明によれば、符号語に関する評価値として、その符号語のパワー又は平均振幅を用いるように構成したので、音声のパワーや振幅の大きな劣化を招くことなく、音声を再生することができる符号帳が得られる効果がある。
【０１６０】
この発明によれば、複数の符号帳が音源ゲインを出力する符号帳であるように構成したので、音声のゲイン値の大きな劣化を招くことなく、音声を再生することができる符号帳が得られる効果がある。
【０１６１】
この発明によれば、複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値を計算し、その合計値が減少して最小化するまで、少なくとも１以上の符号帳の符号語の格納順序を更新するように構成したので、モード情報を誤認しても、所定の評価値に関する劣化の期待値が小さくなり、その結果、音声の再生品質の劣化を抑制することができる符号帳が得られる効果がある。
【０１６２】
この発明によれば、符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うように構成したので、音声の再生品質の劣化を抑制することができる符号帳が得られる効果がある。
【図面の簡単な説明】
【図１】この発明の実施の形態１による音声符号化装置を示す構成図である。
【図２】この発明の実施の形態１による音声復号化装置を示す構成図である。
【図３】この発明の実施の形態１による符号語配列方法を示すフローチャートである。
【図４】音声符号化装置及び音声復号化装置により使用されるゲイン符号帳の一例を示す説明図である。
【図５】多重化部から出力される音声符号の一例を示す説明図である。
【図６】この発明の実施の形態２による音声符号化装置を示す構成図である。
【図７】この発明の実施の形態２による音声復号化装置を示す構成図である。
【図８】ゲイン符号帳の一例を示す説明図である。
【図９】多重化部から出力される音声符号の一例を示す説明図である。
【図１０】この発明の実施の形態４による符号語配列方法が適用する符号語配列装置を示す構成図である。
【図１１】この発明の実施の形態５による音声符号化装置を示す構成図である。
【図１２】この発明の実施の形態５による音声復号化装置を示す構成図である。
【図１３】マッピング用テーブルを示す説明図である。
【図１４】マッピング用テーブルを示す説明図である。
【図１５】従来の音声符号化装置を示す構成図である。
【図１６】従来の音声復号化装置を示す構成図である。
【図１７】従来の音声符号化装置及び音声復号化装置により使用されるゲイン符号帳の一例を示す説明図である。
【符号の説明】
４１前処理部（符号化手段）、４２スペクトル分析部（符号化手段）、４３スペクトル符号化部（符号化手段）、４４合成フィルタ（符号化手段）、４５減算器（符号化手段）、４６聴覚重み付け部（符号化手段）、４７歪み最小化部（符号化手段）、４８音源復号化部（符号化手段）、４９音源復号化部（符号化手段）、５０適応音源符号帳、５１駆動音源符号帳、５２ゲイン符号帳、５３乗算器、５４乗算器、５５加算器、５６駆動音源符号帳、５７ゲイン符号帳、５８乗算器、５９切換スイッチ（符号化手段）、６０多重化部（多重化手段）、６１分離部（分離手段）、６２音源復号化部（復号化手段）、６３音源復号化部（復号化手段）、６４適応音源符号帳、６５駆動音源符号帳、６６ゲイン符号帳、６７乗算器、６８乗算器、６９加算器、７０駆動音源符号帳、７１ゲイン符号帳、７２乗算器、７３切換スイッチ（復号化手段）、７４スペクトル復号化部（復号化手段）、７５合成フィルタ（復号化手段）、７６後処理部（復号化手段）、８１音源モード選択部（符号化手段）、８２切換スイッチ（符号化手段）、８３乗算器（符号化手段）、８４乗算器（符号化手段）、８５加算器（符号化手段）、９１音源モード選択部（復号化手段）、９２切換スイッチ（復号化手段）、９３乗算器（復号化手段）、９４乗算器（復号化手段）、９５加算器（復号化手段）、１０１駆動音源符号帳、１０２駆動音源符号帳、１０３合成フィルタ、１０４合成フィルタ、１０５距離計算部、１０６符号語入れ換え部、１１１マッピング部（マッピング手段）、１１２マッピング部（マッピング手段）。

Claims

インデックスに対応する符号語を出力する複数の符号帳のうち、モード情報に対応する符号帳を選択し、その符号帳が出力する符号語を用いて、入力音声をフレーム毎に符号化する符号化手段と、上記符号化手段の符号化結果をビット列に多重化する多重化手段とを備えた音声符号化装置において、上記複数の符号帳は、他の符号帳の符号語に関する評価値の順位と相応して、符号語の格納順序が並び換えられていることを特徴とする音声符号化装置。
符号語に関する評価値として、その符号語のパワー又は平均振幅を用いることを特徴とする請求項１記載の音声符号化装置。
複数の符号帳は、音源ゲインを出力する符号帳であることを特徴とする請求項１または請求項２記載の音声符号化装置。
インデックスに対応する符号語を出力する複数の符号帳のうち、モード情報に対応する符号帳を選択し、その符号帳が出力する符号語を用いて、入力音声をフレーム毎に符号化する符号化手段と、上記符号化手段の符号化結果をビット列に多重化する多重化手段とを備えた音声符号化装置において、上記複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値が最小となるように、上記複数の符号帳の符号語の格納順序が並び換えられていることを特徴とする音声符号化装置。
符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うことを特徴とする請求項１から請求項４のうちのいずれか１項記載の音声符号化装置。
インデックスをマッピングするマッピング手段を有し、少なくとも１以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の順位を基準にして更新することなく、更新後の格納順序と等価な状態を構築することを特徴とする請求項１記載の音声符号化装置。
インデックスをマッピングするマッピング手段を有し、少なくとも１以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の偏差の合計値が最小となるように更新することなく、更新後の格納順序と等価な状態を構築することを特徴とする請求項４記載の音声符号化装置。
ビット列に多重化された符号化結果からインデックスを分離する分離手段と、上記分離手段により分離されたインデックスに対応する符号語を出力する複数の符号帳のうち、任意の符号帳を選択し、その符号帳が出力する符号語を用いて、その符号化結果を復号化する復号化手段とを備えた音声復号化装置において、上記複数の符号帳は、他の符号帳の符号語に関する評価値の順位と相応して、符号語の格納順序が並び換えられていることを特徴とする音声復号化装置。
符号語に関する評価値として、その符号語のパワー又は平均振幅を用いることを特徴とする請求項８記載の音声復号化装置。
複数の符号帳は、音源ゲインを出力する符号帳であることを特徴とする請求項８または請求項９記載の音声復号化装置。
ビット列に多重化された符号化結果からインデックスを分離する分離手段と、上記分離手段により分離されたインデックスに対応する符号語を出力する複数の符号帳のうち、任意の符号帳を選択し、その符号帳が出力する符号語を用いて、その符号化結果を復号化する復号化手段とを備えた音声復号化装置において、上記複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値が最小となるように、上記複数の符号帳の符号語の格納順序が並び換えられていることを特徴とする音声復号化装置。
符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うことを特徴とする請求項８から請求項１１のうちのいずれか１項記載の音声復号化装置。
インデックスをマッピングするマッピング手段を有し、少なくとも１以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の順位を基準にして更新することなく、更新後の格納順序と等価な状態を構築することを特徴とする請求項８記載の音声復号化装置。
インデックスをマッピングするマッピング手段を有し、少なくとも１以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の偏差の合計値が最小となるように更新することなく、更新後の格納順序と等価な状態を構築することを特徴とする請求項１１記載の音声復号化装置。
インデックスに対応する符号語を出力する複数の符号帳のうち、モード情報に対応する符号帳を選択し、その符号帳が出力する符号語を用いて、入力音声をフレーム毎に符号化し、その符号化結果をビット列に多重化する音声符号化装置、または、ビット列に多重化された符号化結果からインデックスを分離し、そのインデックスに対応する符号語を出力する複数の符号帳のうち、任意の符号帳を選択し、その符号帳が出力する符号語を用いて、その符号化結果を復号化する音声復号化装置に対して、上記複数の符号帳を搭載する際、各符号帳の符号語に関する評価値を調査し、他の符号帳の符号語に関する評価値の順位と相応して、少なくとも１以上の符号帳の符号語の格納順序を並び換える符号語配列方法。
符号語に関する評価値として、その符号語のパワー又は平均振幅を用いることを特徴とする請求項１５記載の符号語配列方法。
複数の符号帳が音源ゲインを出力する符号帳であることを特徴とする請求項１５または請求項１６記載の符号語配列方法。
インデックスに対応する符号語を出力する複数の符号帳のうち、モード情報に対応する符号帳を選択し、その符号帳が出力する符号語を用いて、入力音声をフレーム毎に符号化し、その符号化結果をビット列に多重化する音声符号化装置、または、ビット列に多重化された符号化結果からインデックスを分離し、そのインデックスに対応する符号語を出力する複数の符号帳のうち、任意の符号帳を選択し、その符号帳が出力する符号語を用いて、その符号化結果を復号化する音声復号化装置に対して、上記複数の符号帳を搭載する際、上記複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値を計算し、その合計値が減少して最小化するまで、少なくとも１以上の符号帳の符号語の格納順序を更新する符号語配列方法。
符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うことを特徴とする請求項１５または請求項１８記載の符号語配列方法。