JP3808270B2 - 音声符号化装置、音声復号化装置及び符号語配列方法 - Google Patents

音声符号化装置、音声復号化装置及び符号語配列方法 Download PDF

Info

Publication number
JP3808270B2
JP3808270B2 JP2000040127A JP2000040127A JP3808270B2 JP 3808270 B2 JP3808270 B2 JP 3808270B2 JP 2000040127 A JP2000040127 A JP 2000040127A JP 2000040127 A JP2000040127 A JP 2000040127A JP 3808270 B2 JP3808270 B2 JP 3808270B2
Authority
JP
Japan
Prior art keywords
gain
code
codebooks
codebook
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000040127A
Other languages
English (en)
Other versions
JP2001228888A (ja
Inventor
裕久 田崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2000040127A priority Critical patent/JP3808270B2/ja
Publication of JP2001228888A publication Critical patent/JP2001228888A/ja
Application granted granted Critical
Publication of JP3808270B2 publication Critical patent/JP3808270B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、ディジタル音声信号の情報量を圧縮する音声符号化装置、その音声符号化装置などにより生成された音声符号を復号化してディジタル音声信号を再生する音声復号化装置、その音声符号化装置や音声復号化装置により使用されるベクトル符号帳中の符号語の格納順序を更新して、音声符号に重畳するビット誤りへの耐性を改善する符号語配列方法に関するものである。
【0002】
【従来の技術】
従来の音声符号化装置の多くは、入力音声をスペクトル包絡情報と音源に分けて、フレーム単位で各々を符号化して音声符号を生成する構成を採用している。一方、従来の音声復号化装置は、その音声符号を復号化して、合成フィルタによってスペクトル包絡情報と音源を合成することにより、復号音声を生成する構成を採用している。
また、様々な様態を有する音声信号と背景雑音信号の両方の品質を高めるため、複数の符号化モードを用意して、符号化モードを切り換えながら符号化を行う方式(マルチモード符号化方式)を採用するものもある。
【0003】
図15は例えば文献「H.Tasaki、”High level description of Mitsubishi 4−kbit/s speech coder”、ITU Telecommunication Standardization Sector、Study Group 16、Question 19−21/16 Rapporteur Meeting、No.AC−99−016 (1999年9月)」に示された従来の音声符号化装置を示す構成図である。
【0004】
図において、1は入力音声に重畳している背景雑音を抑圧する雑音抑圧処理を実行するとともに、入力音声の直流成分をカットする低域阻止フィルタ処理を実行する前処理部、2は前処理部1による前処理後の入力音声を分析して、音声のスペクトル包絡情報である線スペクトル対(以下、LSPという)を求めるスペクトル分析部、3はスペクトル分析部2により求められたLSPを符号化して、そのLSP符号を多重化部20に出力するとともに、そのLSPを量子化して、量子化後のLSP(LSP符号を復号化した結果と同じ)を合成フィルタ4のフィルタ係数(線形予測係数)に変換し、そのフィルタ係数を合成フィルタ4と聴覚重み付け部6に出力するスペクトル符号化部である。
【0005】
4はスペクトル符号化部3が出力するフィルタ係数を用いて、切換スイッチ19により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する合成フィルタ、5は合成フィルタ4により生成された合成音と前処理部1による前処理後の入力音声との差信号を出力する減算器、6はスペクトル符号化部3が出力するフィルタ係数に基づいて聴覚重み付けフィルタ係数を算出し、その聴覚重み付けフィルタ係数を用いて、減算器5が出力する差信号に対する聴覚重み付けフィルタ処理を実行して聴覚重み付け差信号を出力する聴覚重み付け部である。
【0006】
7は聴覚重み付け部6が出力する聴覚重み付け差信号のパワーを計算し、そのパワーの最小化を図るため、インデックス(ゲイン符号、駆動音源符号、適応音源符号)及び符号化モードを示すモード情報を逐次更新する歪み最小化部、8,9は歪み最小化部7による更新後のインデックスに対応する符号語を出力する符号帳を有し、その符号語から仮の音源を生成する音源復号化部である。
【0007】
10は過去の音源を所定長記憶し、歪み最小化部7から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルである適応符号ベクトルを出力する適応音源符号帳、11は非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部7から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、12はゲインに関する符号語(ゲイン値を示す語)を格納し、歪み最小化部7からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、13はゲイン符号帳12が出力するゲイン値を適応音源符号帳10が出力する適応符号ベクトルに乗算する乗算器、14はゲイン符号帳12が出力するゲイン値を駆動音源符号帳11が出力する駆動符号ベクトルに乗算する乗算器、15は乗算器13の乗算結果と乗算器14の乗算結果を加算し、その加算結果(仮の音源)を出力する加算器である。
【0008】
16は雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部7から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、17はゲインに関する符号語(ゲイン値を示す語)を格納し、歪み最小化部7からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、18はゲイン符号帳17が出力するゲイン値を駆動音源符号帳16が出力する駆動符号ベクトルに乗算し、その乗算結果(仮の音源)を出力する乗算器である。
【0009】
19は歪み最小化部7からモード情報を受けると、そのモード情報にしたがって音源復号化部8が出力する仮の音源又は音源復号化部9が出力する仮の音源を選択し、その選択した仮の音源を合成フィルタ4に与える切換スイッチ、20はスペクトル符号化部3により符号化されたLSP符号と、歪み最小化部7による更新後のインデックス及びモード情報とを多重化して音声符号を生成し、その音声符号を出力する多重化部である。
【0010】
図16は上記文献に示された従来の音声復号化装置を示す構成図であり、図において、21は音声符号化装置により多重化されたLSP符号とインデックスとモード情報とを分離する分離部、22,23は分離部21により分離されたインデックスに対応する符号語を出力する符号帳を有し、その符号語から音源を生成する音源復号化部である。
【0011】
24は過去の音源を所定長記憶し、分離部21から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルである適応符号ベクトルを出力する適応音源符号帳、25は非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部21から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、26はゲインに関する符号語(ゲイン値を示す語)を格納し、分離部21からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、27はゲイン符号帳26が出力するゲイン値を適応音源符号帳24が出力する適応符号ベクトルに乗算する乗算器、28はゲイン符号帳26が出力するゲイン値を駆動音源符号帳25が出力する駆動符号ベクトルに乗算する乗算器、29は乗算器27の乗算結果と乗算器28の乗算結果を加算し、その加算結果(仮の音源)を出力する加算器である。
【0012】
30は雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部21から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、31はゲインに関する符号語(ゲイン値を示す語)を格納し、分離部21からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、32はゲイン符号帳31が出力するゲイン値を駆動音源符号帳30が出力する駆動符号ベクトルに乗算し、その乗算結果(仮の音源)を出力する乗算器である。
【0013】
33は分離部21からモード情報を受けると、そのモード情報にしたがって音源復号化部22が出力する仮の音源又は音源復号化部23が出力する仮の音源を選択し、その選択した仮の音源を合成フィルタ35に与える切換スイッチ、34は分離部21が出力するLSP符号を復号化し、その復号結果を合成フィルタ35のフィルタ係数(線形予測係数)に変換して、そのフィルタ係数を合成フィルタ35と後処理部36に出力するスペクトル復号化部、35はスペクトル復号化部34が出力するフィルタ係数を用いて、切換スイッチ33により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する合成フィルタ、36はスペクトル復号化部34が出力するフィルタ係数等に基づいて合成フィルタ35により生成された合成音に対する音声強調処理などの後処理を実行し、入力音声の再生結果(出力音声)を出力する後処理部である。
【0014】
次に動作について説明する。
従来の音声符号化装置及び音声復号化装置は、5〜50ms程度を1フレームとして、フレーム単位に処理を実行する。
【0015】
まず、音声符号化装置の前処理部1は、入力音声を受けると、その入力音声に重畳している背景雑音を抑圧する雑音抑圧処理を実行するとともに、入力音声の直流成分をカットする低域阻止フィルタ処理を実行する。
スペクトル分析部2は、前処理部1が入力音声に対する前処理を実行すると、前処理後の入力音声を分析して、音声のスペクトル包絡情報であるLSPを求める。
【0016】
そして、スペクトル符号化部3は、スペクトル分析部2により求められたLSPを符号化して、そのLSP符号を多重化部20に出力する。また、そのLSPを量子化して、量子化後のLSPを合成フィルタ4のフィルタ係数に変換し、そのフィルタ係数を合成フィルタ4と聴覚重み付け部6に出力する。
【0017】
合成フィルタ4は、スペクトル符号化部3からフィルタ係数を受けると、そのフィルタ係数を用いて、切換スイッチ19により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する。仮の音源の生成処理は後述する。
減算器5は、合成フィルタ4が合成音を生成すると、その合成音と前処理部1による前処理後の入力音声との差信号を出力し、聴覚重み付け部6は、スペクトル符号化部3が出力するフィルタ係数に基づいて聴覚重み付けフィルタ係数を算出し、その聴覚重み付けフィルタ係数を用いて、減算器5が出力する差信号に対する聴覚重み付けフィルタ処理を実行して聴覚重み付け差信号を出力する。
【0018】
歪み最小化部7は、インデックス及び符号化モードを逐次更新することにより、聴覚重み付け部6が出力する聴覚重み付け差信号のパワーの最小化を図る。
即ち、インデックスとモード情報を適宜選択して、音源復号化部8,9と切換スイッチ19に出力する毎に、その聴覚重み付け差信号のパワーを計算し、その計算結果であるパワーが最も小さくなるインデックスとモード情報の組合せを検索する。そして、聴覚重み付け差信号のパワーが最小になるインデックスとモード情報が求まると、そのインデックスとモード情報を多重化部20に出力する。ただし、音源復号化部9には適応音源符号帳が内蔵されていないので、第二の符号化モードを示すモード情報を出力する場合には、適応音源符号を出力しない。
【0019】
音源復号化部8,9は、歪み最小化部7からインデックスを受けると、そのインデックスに応じて仮の音源を生成する。
具体的には、まず、音源復号化部8の適応音源符号帳10は、過去の音源を所定長記憶し、歪み最小化部7から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルを適応符号ベクトルとして出力する。なお、適応音源符号帳10は、歪み最小化部7がインデックス及びモード情報を選択した後で、そのインデックス及びモード情報に対して、切換スイッチ19が出力した仮の音源を選択して出力すると、その仮の音源を最終的な音源として記憶する。
【0020】
音源復号化部8の駆動音源符号帳11は、非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部7から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳11は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、歪み最小化部7が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
【0021】
そして、ゲイン符号帳12がゲイン符号に対応するゲイン値を出力すると、適応音源符号帳10から出力された適応符号ベクトルと駆動音源符号帳11から出力された駆動符号ベクトルは、乗算器13,14によりゲイン値が乗算され、加算器15により乗算器13,14の乗算結果が相互に加算される。
【0022】
一方、音源復号化部9の駆動音源符号帳16は、雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部7から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳16は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、歪み最小化部7が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
そして、ゲイン符号帳17がゲイン符号に対応するゲイン値を出力すると、駆動音源符号帳16から出力された駆動符号ベクトルは、乗算器18によりゲイン値が乗算される。
【0023】
このようにして、音源復号化部8の加算器15から仮の音源が出力され、音源復号化部9の乗算器18から仮の音源が出力されると、切換スイッチ19は、歪み最小化部7が出力するモード情報にしたがって音源復号化部8が出力する仮の音源又は音源復号化部9が出力する仮の音源の何れか一方を選択し、その選択した仮の音源を合成フィルタ4に与える。
【0024】
多重化部20は、スペクトル符号化部3により符号化されたLSP符号と、歪み最小化部7による更新後のインデックス及びモード情報(聴覚重み付け差信号のパワーが最小となるインデックス及びモード情報)とを多重化して音声符号を生成し、その音声符号を出力する。
【0025】
次に、音声復号化装置の分離部21は、音声符号化装置から出力された音声符号を入力すると、その音声符号に含まれているLSP符号とインデックスとモード情報とを分離する。
【0026】
音源復号化部22,23は、分離部21からインデックスを受けると、そのインデックスに応じて仮の音源を生成する。
具体的には、まず、音源復号化部22の適応音源符号帳24は、過去の音源を所定長記憶し、分離部21から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルを適応符号ベクトルとして出力する。なお、適応音源符号帳24は、切換スイッチ33が仮の音源を選択して出力すると、その仮の音源を最終的な音源として記憶する。
【0027】
音源復号化部22の駆動音源符号帳25は、非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部21から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳25は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、分離部21が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
【0028】
そして、ゲイン符号帳26がゲイン符号に対応するゲイン値を出力すると、適応音源符号帳24から出力された適応符号ベクトルと駆動音源符号帳25から出力された駆動符号ベクトルは、乗算器27,28によりゲイン値が乗算され、加算器29により乗算器27,28の乗算結果が相互に加算される。
【0029】
一方、音源復号化部23の駆動音源符号帳30は、雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部21から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳30は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、分離部21が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
そして、ゲイン符号帳31がゲイン符号に対応するゲイン値を出力すると、駆動音源符号帳30から出力された駆動符号ベクトルは、乗算器32によりゲイン値が乗算される。
【0030】
このようにして、音源復号化部22の加算器29から仮の音源が出力され、音源復号化部23の乗算器32から仮の音源が出力されると、切換スイッチ33は、分離部21が出力するモード情報にしたがって音源復号化部22が出力する仮の音源又は音源復号化部23が出力する仮の音源の何れか一方を選択し、その選択した仮の音源を合成フィルタ35に与える。
【0031】
スペクトル復号化部34は、分離部21がLSP符号を出力すると、そのLSP符号を復号化し、その復号結果を合成フィルタ35のフィルタ係数に変換して、そのフィルタ係数を合成フィルタ35と後処理部36に出力する。
合成フィルタ35は、スペクトル復号化部34からフィルタ係数を受けると、そのフィルタ係数を用いて、切換スイッチ33により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する。
後処理部36は、スペクトル復号化部34が出力するフィルタ係数等に基づいて合成フィルタ35により生成された合成音に対する音声強調処理などの後処理を実行し、入力音声の再生結果(出力音声)を出力する。
【0032】
ここで、図17は従来の音声符号化装置及び音声復号化装置により使用されるゲイン符号帳の一例を示す説明図である。特に、図17(a)はゲイン符号帳12,26の一例を示し、図17(b)はゲイン符号帳17,31の一例を示している。
【0033】
この例の場合、各ゲイン符号帳は128個のゲイン符号語を格納している。ただし、ゲイン符号帳12,26に格納されているゲイン符号語は、適応符号ベクトルと駆動符号ベクトルに乗じる2個のゲイン値の組を示す符号語から構成され、ゲイン符号帳17,31に格納されているゲイン符号語は、駆動符号ベクトルに乗じる1個のゲイン値を示す符号語から構成されている。
インデックスと評価値順位は、各ゲイン符号帳内に実際には格納されていないものであるが、説明の便宜のため記載している。インデックスは上の符号語から順番に0から127の値となっている。評価値はゲイン符号語のパワー(2乗和)の値である。例えば、インデックスが「1」の符号語のパワーの順位は「102」である。
【0034】
各ゲイン符号帳の動作としては、あるゲイン符号を入力すると、そのゲイン符号に一致するインデックス位置に格納しているゲイン符号語を出力する。
各ゲイン符号帳に格納されているゲイン符号語は、学習用音声とその符号化音声との歪みが小さくなるように学習して作成される。
そして、音声符号を伝送する際の符号誤りによる出力音声の劣化を最小限に抑えるため、適切にゲイン符号語の並べ換えが行われる。
【0035】
例えば、ゲイン符号に1ビット誤りを実際に与えたときに生じる劣化の大きさの期待値を計算し、さらに、ランダムに選択した2つのゲイン符号語を交換したときに生じる劣化の大きさの期待値を計算し、前者の期待値と比べて後者の期待値が減少するときに実際にゲイン符号語の格納順序を交換する。
この作業を期待値の減少が微小になるまで繰り返す。
従来の音声符号化装置及び音声復号化装置は、このようなゲイン符号語の並べ換えが行われたゲイン符号帳を使用している。
【0036】
【発明が解決しようとする課題】
従来の音声符号化装置及び音声復号化装置は以上のように構成されているので、音声符号化装置の歪み最小化部7が、聴覚重み付け差信号のパワーが最小化するように最適なモード情報を選択するが、音声符号に伝送路誤りが重畳して、音声復号化装置がモード情報を誤認すると、入力音声の再生品質が大きく劣化する課題があった。
また、符号誤りによる劣化を最小限に抑えるため、各符号帳毎に符号語の並べ換えを実施しているが、モード情報が誤認される場合があることを考慮した並べ換えを実施していないため、モード情報の誤りに対する耐性を高めることができない課題があった。
【0037】
具体的には、ゲイン符号帳12,26における符号語の並べ換えと、ゲイン符号帳17,31における符号語の並べ換えを無関係に実施しているため、ゲイン符号語のパワー(評価値)の順位に着目すると、図17に示すように、ゲイン符号帳12,26とゲイン符号帳17,31間の相関関係が全くなくなっている。このため、例えば、インデックスが「0」のゲイン符号を復号する場合、モード情報を誤認して、本来第一の符号化モードが選択されるところを第二の符号化モードが選択されると、評価値順位が「41」のゲイン値ではなく、「121」のゲイン値が選択される。これにより、出力音声の振幅が大きく変化し、局所的な大劣化を引き起こすことになる。
【0038】
この発明は上記のような課題を解決するためになされたもので、モード情報を誤認しても、音声の再生品質の劣化を抑制することができる音声符号化装置、音声復号化装置及び符号語配列方法を得ることを目的とする。
【0039】
【課題を解決するための手段】
この発明に係る音声符号化装置は、複数の符号帳が他の符号帳の符号語に関する評価値の順位と相応して、符号語の格納順序が並び換えられているようにしたものである。
【0040】
この発明に係る音声符号化装置は、符号語に関する評価値として、その符号語のパワー又は平均振幅を用いるようにしたものである。
【0041】
この発明に係る音声符号化装置は、複数の符号帳が音源ゲインを出力する符号帳であるようにしたものである。
【0042】
この発明に係る音声符号化装置は、複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値が最小となるように、複数の符号帳の符号語の格納順序が並び換えられているようにしたものである。
【0043】
この発明に係る音声符号化装置は、符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うようにしたものである。
【0044】
この発明に係る音声符号化装置は、インデックスをマッピングするマッピング手段を有し、少なくとも1以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の順位を基準にして更新することなく、更新後の格納順序と等価な状態を構築するようにしたものである。
【0045】
この発明に係る音声符号化装置は、インデックスをマッピングするマッピング手段を有し、少なくとも1以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の偏差の合計値が最小となるように更新することなく、更新後の格納順序と等価な状態を構築するようにしたものである。
【0046】
この発明に係る音声復号化装置は、複数の符号帳が他の符号帳の符号語に関する評価値の順位と相応して、符号語の格納順序が並び換えられているようにしたものである。
【0047】
この発明に係る音声復号化装置は、符号語に関する評価値として、その符号語のパワー又は平均振幅を用いるようにしたものである。
【0048】
この発明に係る音声復号化装置は、複数の符号帳が音源ゲインを出力する符号帳であるようにしたものである。
【0049】
この発明に係る音声復号化装置は、複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値が最小となるように、複数の符号帳の符号語の格納順序が並び換えられているようにしたものである。
【0050】
この発明に係る音声復号化装置は、符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うようにしたものである。
【0051】
この発明に係る音声復号化装置は、インデックスをマッピングするマッピング手段を有し、少なくとも1以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の順位を基準にして更新することなく、更新後の格納順序と等価な状態を構築するようにしたものである。
【0052】
この発明に係る音声復号化装置は、インデックスをマッピングするマッピング手段を有し、少なくとも1以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の偏差の合計値が最小となるように更新することなく、更新後の格納順序と等価な状態を構築するようにしたものである。
【0053】
この発明に係る符号語配列方法は、各符号帳の符号語に関する評価値を調査し、他の符号帳の符号語に関する評価値の順位と相応して、少なくとも1以上の符号帳の符号語の格納順序を並び換えるようにしたものである。
【0054】
この発明に係る符号語配列方法は、符号語に関する評価値として、その符号語のパワー又は平均振幅を用いるようにしたものである。
【0055】
この発明に係る符号語配列方法は、複数の符号帳が音源ゲインを出力する符号帳であるようにしたものである。
【0056】
この発明に係る符号語配列方法は、複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値を計算し、その合計値が減少して最小化するまで、少なくとも1以上の符号帳の符号語の格納順序を更新するようにしたものである。
【0057】
この発明に係る符号語配列方法は、符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うようにしたものである。
【0058】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態1.
図1はこの発明の実施の形態1による音声符号化装置を示す構成図であり、図において、41は入力音声に重畳している背景雑音を抑圧する雑音抑圧処理を実行するとともに、入力音声の直流成分をカットする低域阻止フィルタ処理を実行する前処理部、42は前処理部41による前処理後の入力音声を分析して、音声のスペクトル包絡情報である線スペクトル対(以下、LSPという)を求めるスペクトル分析部、43はスペクトル分析部42により求められたLSPを符号化して、そのLSP符号を多重化部60に出力するとともに、そのLSPを量子化して、量子化後のLSP(LSP符号を復号化した結果と同じ)を合成フィルタ44のフィルタ係数(線形予測係数)に変換し、そのフィルタ係数を合成フィルタ44と聴覚重み付け部46に出力するスペクトル符号化部である。
【0059】
44はスペクトル符号化部43が出力するフィルタ係数を用いて、切換スイッチ59により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する合成フィルタ、45は合成フィルタ44により生成された合成音と前処理部41による前処理後の入力音声との差信号を出力する減算器、46はスペクトル符号化部43が出力するフィルタ係数に基づいて聴覚重み付けフィルタ係数を算出し、その聴覚重み付けフィルタ係数を用いて、減算器45が出力する差信号に対する聴覚重み付けフィルタ処理を実行して聴覚重み付け差信号を出力する聴覚重み付け部である。
【0060】
47は聴覚重み付け部46が出力する聴覚重み付け差信号のパワーを計算し、そのパワーの最小化を図るため、インデックス(ゲイン符号、駆動音源符号、適応音源符号)及び符号化モードを示すモード情報を逐次更新する歪み最小化部、48,49は歪み最小化部47による更新後のインデックスに対応する符号語を出力する符号帳を有し、その符号語から仮の音源を生成する音源復号化部である。
【0061】
50は過去の音源を所定長記憶し、歪み最小化部47から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルである適応符号ベクトルを出力する適応音源符号帳、51は非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部47から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、52はゲインに関する符号語(ゲイン値を示す語)を格納し、歪み最小化部47からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、53はゲイン符号帳52が出力するゲイン値を適応音源符号帳50が出力する適応符号ベクトルに乗算する乗算器、54はゲイン符号帳52が出力するゲイン値を駆動音源符号帳51が出力する駆動符号ベクトルに乗算する乗算器、55は乗算器53の乗算結果と乗算器54の乗算結果を加算し、その加算結果(仮の音源)を出力する加算器である。
【0062】
56は雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部47から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、57はゲインに関する符号語(ゲイン値を示す語)を格納し、歪み最小化部47からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、58はゲイン符号帳57が出力するゲイン値を駆動音源符号帳56が出力する駆動符号ベクトルに乗算し、その乗算結果(仮の音源)を出力する乗算器である。
【0063】
59は歪み最小化部47からモード情報を受けると、そのモード情報にしたがって音源復号化部48が出力する仮の音源又は音源復号化部49が出力する仮の音源を選択し、その選択した仮の音源を合成フィルタ44に与える切換スイッチである。なお、前処理部41,スペクトル分析部42,スペクトル符号化部43,合成フィルタ44,減算器45,聴覚重み付け部46,歪み最小化部47,音源復号化部48,49及び切換スイッチ59から符号化手段が構成されている。60はスペクトル符号化部43により符号化されたLSP符号と、歪み最小化部47による更新後のインデックス及びモード情報とを多重化して音声符号を生成し、その音声符号を出力する多重化部(多重化手段)である。
【0064】
図2はこの発明の実施の形態1による音声復号化装置を示す構成図であり、図において、61は音声符号化装置により多重化されたLSP符号とインデックスとモード情報とを分離する分離部(分離手段)、62,63は分離部61により分離されたインデックスに対応する符号語を出力する符号帳を有し、その符号語から音源を生成する音源復号化部である。
【0065】
64は過去の音源を所定長記憶し、分離部61から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルである適応符号ベクトルを出力する適応音源符号帳、65は非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部61から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、66はゲインに関する符号語(ゲイン値を示す語)を格納し、分離部61からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、67はゲイン符号帳66が出力するゲイン値を適応音源符号帳64が出力する適応符号ベクトルに乗算する乗算器、68はゲイン符号帳66が出力するゲイン値を駆動音源符号帳65が出力する駆動符号ベクトルに乗算する乗算器、69は乗算器67の乗算結果と乗算器68の乗算結果を加算し、その加算結果(仮の音源)を出力する加算器である。
【0066】
70は雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部61から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する駆動音源符号帳、71はゲインに関する符号語(ゲイン値を示す語)を格納し、分離部61からゲイン符号を受けると、そのゲイン符号に対応するゲイン値を出力するゲイン符号帳、72はゲイン符号帳71が出力するゲイン値を駆動音源符号帳70が出力する駆動符号ベクトルに乗算し、その乗算結果(仮の音源)を出力する乗算器である。
【0067】
73は分離部61からモード情報を受けると、そのモード情報にしたがって音源復号化部62が出力する仮の音源又は音源復号化部63が出力する仮の音源を選択し、その選択した仮の音源を合成フィルタ75に与える切換スイッチ、74は分離部61が出力するLSP符号を復号化し、その復号結果を合成フィルタ75のフィルタ係数(線形予測係数)に変換して、そのフィルタ係数を合成フィルタ75と後処理部76に出力するスペクトル復号化部である。
【0068】
75はスペクトル復号化部74が出力するフィルタ係数を用いて、切換スイッチ73により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する合成フィルタ、76はスペクトル復号化部74が出力するフィルタ係数等に基づいて合成フィルタ75により生成された合成音に対する音声強調処理などの後処理を実行し、入力音声の再生結果(出力音声)を出力する後処理部である。
なお、音源復号化部62,63,切換スイッチ73,スペクトル復号化部74,合成フィルタ75及び後処理部76から復号化手段が構成されている。
図3はこの発明の実施の形態1による符号語配列方法を示すフローチャートである。
【0069】
次に動作について説明する。
従来の音声符号化装置及び音声復号化装置は、5〜50ms程度を1フレームとして、フレーム単位に処理を実行する。
【0070】
まず、音声符号化装置の前処理部41は、入力音声を受けると、その入力音声に重畳している背景雑音を抑圧する雑音抑圧処理を実行するとともに、入力音声の直流成分をカットする低域阻止フィルタ処理を実行する。
スペクトル分析部42は、前処理部41が入力音声に対する前処理を実行すると、前処理後の入力音声を分析して、音声のスペクトル包絡情報であるLSPを求める。
【0071】
そして、スペクトル符号化部43は、スペクトル分析部42により求められたLSPを符号化して、そのLSP符号を多重化部60に出力する。また、そのLSPを量子化して、量子化後のLSPを合成フィルタ44のフィルタ係数に変換し、そのフィルタ係数を合成フィルタ44と聴覚重み付け部46に出力する。
【0072】
合成フィルタ44は、スペクトル符号化部43からフィルタ係数を受けると、そのフィルタ係数を用いて、切換スイッチ59により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する。仮の音源の生成処理は後述する。
減算器45は、合成フィルタ44が合成音を生成すると、その合成音と前処理部41による前処理後の入力音声との差信号を出力し、聴覚重み付け部46は、スペクトル符号化部43が出力するフィルタ係数に基づいて聴覚重み付けフィルタ係数を算出し、その聴覚重み付けフィルタ係数を用いて、減算器45が出力する差信号に対する聴覚重み付けフィルタ処理を実行して聴覚重み付け差信号を出力する。
【0073】
歪み最小化部47は、インデックス及び符号化モードを逐次更新することにより、聴覚重み付け部46が出力する聴覚重み付け差信号のパワーの最小化を図る。
即ち、インデックスとモード情報を適宜選択して、音源復号化部48,49と切換スイッチ59に出力する毎に、その聴覚重み付け差信号のパワーを計算し、その計算結果であるパワーが最も小さくなるインデックスとモード情報の組合せを検索する。そして、聴覚重み付け差信号のパワーが最小になるインデックスとモード情報が求まると、そのインデックスとモード情報を多重化部60に出力する。ただし、音源復号化部49には適応音源符号帳が内蔵されていないので、第二の符号化モードを示すモード情報を出力する場合には、適応音源符号を出力しない。
【0074】
音源復号化部48,49は、歪み最小化部47からインデックスを受けると、そのインデックスに応じて仮の音源を生成する。
具体的には、まず、音源復号化部48の適応音源符号帳50は、過去の音源を所定長記憶し、歪み最小化部47から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルを適応符号ベクトルとして出力する。なお、適応音源符号帳50は、歪み最小化部47がインデックス及びモード情報を選択した後で、そのインデックス及びモード情報に対して、切換スイッチ59が出力した仮の音源を選択して出力すると、その仮の音源を最終的な音源として記憶する。
【0075】
音源復号化部48の駆動音源符号帳51は、非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部47から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳51は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、歪み最小化部47が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
【0076】
そして、ゲイン符号帳52がゲイン符号に対応するゲイン値を出力すると、適応音源符号帳50から出力された適応符号ベクトルと駆動音源符号帳51から出力された駆動符号ベクトルは、乗算器53,54によりゲイン値が乗算され、加算器55により乗算器53,54の乗算結果が相互に加算される。
【0077】
一方、音源復号化部49の駆動音源符号帳56は、雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み最小化部47から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳56は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、歪み最小化部47が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
そして、ゲイン符号帳57がゲイン符号に対応するゲイン値を出力すると、駆動音源符号帳56から出力された駆動符号ベクトルは、乗算器58によりゲイン値が乗算される。
【0078】
このようにして、音源復号化部48の加算器55から仮の音源が出力され、音源復号化部49の乗算器58から仮の音源が出力されると、切換スイッチ59は、歪み最小化部47が出力するモード情報にしたがって音源復号化部48が出力する仮の音源又は音源復号化部49が出力する仮の音源の何れか一方を選択し、その選択した仮の音源を合成フィルタ44に与える。
【0079】
多重化部60は、スペクトル符号化部43により符号化されたLSP符号と、歪み最小化部47による更新後のインデックス及びモード情報(聴覚重み付け差信号のパワーが最小となるインデックス及びモード情報)とを多重化して音声符号を生成し、その音声符号を出力する。
【0080】
次に、音声復号化装置の分離部61は、音声符号化装置から出力された音声符号を入力すると、その音声符号に含まれているLSP符号とインデックスとモード情報とを分離する。
【0081】
音源復号化部62,63は、分離部61からインデックスを受けると、そのインデックスに応じて仮の音源を生成する。
具体的には、まず、音源復号化部62の適応音源符号帳64は、過去の音源を所定長記憶し、分離部61から適応音源符号を受けると、その適応音源符号に対応する過去の音源を周期的に繰り返す時系列ベクトルを適応符号ベクトルとして出力する。なお、適応音源符号帳64は、切換スイッチ73が仮の音源を選択して出力すると、その仮の音源を最終的な音源として記憶する。
【0082】
音源復号化部62の駆動音源符号帳65は、非雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部61から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳65は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、分離部61が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
【0083】
そして、ゲイン符号帳66がゲイン符号に対応するゲイン値を出力すると、適応音源符号帳64から出力された適応符号ベクトルと駆動音源符号帳65から出力された駆動符号ベクトルは、乗算器67,68によりゲイン値が乗算され、加算器69により乗算器67,68の乗算結果が相互に加算される。
【0084】
一方、音源復号化部63の駆動音源符号帳70は、雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離部61から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力する。ただし、駆動音源符号帳70は、予め、各時系列ベクトルを複数のパルス位置と極性で表現する代数的音源テーブルを備えることにより、分離部61が出力する駆動音源符号に基づいて代数的音源を生成し、その代数的音源を駆動符号ベクトルとして出力するようにしてもよい。
そして、ゲイン符号帳71がゲイン符号に対応するゲイン値を出力すると、駆動音源符号帳70から出力された駆動符号ベクトルは、乗算器72によりゲイン値が乗算される。
【0085】
このようにして、音源復号化部62の加算器69から仮の音源が出力され、音源復号化部63の乗算器72から仮の音源が出力されると、切換スイッチ73は、分離部61が出力するモード情報にしたがって音源復号化部62が出力する仮の音源又は音源復号化部63が出力する仮の音源の何れか一方を選択し、その選択した仮の音源を合成フィルタ75に与える。
【0086】
スペクトル復号化部74は、分離部61がLSP符号を出力すると、そのLSP符号を復号化し、その復号結果を合成フィルタ75のフィルタ係数に変換して、そのフィルタ係数を合成フィルタ75と後処理部76に出力する。
合成フィルタ75は、スペクトル復号化部74からフィルタ係数を受けると、そのフィルタ係数を用いて、切換スイッチ73により選択された仮の音源に対するフィルタリング処理を実行し、仮の合成音を生成する。
後処理部76は、スペクトル復号化部74が出力するフィルタ係数等に基づいて合成フィルタ75により生成された合成音に対する音声強調処理などの後処理を実行し、入力音声の再生結果(出力音声)を出力する。
【0087】
ここで、図4は音声符号化装置及び音声復号化装置により使用されるゲイン符号帳の一例を示す説明図である。特に、図4(a)はゲイン符号帳52,66の一例を示し、図4(b)はゲイン符号帳57,71の一例を示している。
【0088】
この例の場合、各ゲイン符号帳は128個のゲイン符号語を格納している。ただし、ゲイン符号帳52,66に格納されているゲイン符号語は、適応符号ベクトルと駆動符号ベクトルに乗じる2個のゲイン値の組を示す符号語から構成され、ゲイン符号帳57,71に格納されているゲイン符号語は、駆動符号ベクトルに乗じる1個のゲイン値を示す符号語から構成されている。
インデックスと評価値順位は、各ゲイン符号帳内に実際には格納されていないものであるが、説明の便宜のため記載している。インデックスは上の符号語から順番に0から127の値となっている。評価値はゲイン符号語のパワー(2乗和)の値である(評価値としては、ゲイン符号語のパワーに限るものではなく、ゲイン符号語の平均振幅などでもよい)。例えば、インデックスが「1」の符号語のパワーの順位は「102」である。
【0089】
各ゲイン符号帳の動作としては、あるゲイン符号を入力すると、そのゲイン符号に一致するインデックス位置に格納しているゲイン符号語を出力する。
各ゲイン符号帳に格納されているゲイン符号語は、学習用音声とその符号化音声との歪みが小さくなるように学習して作成される。
そして、音声符号を伝送する際の符号誤りによる出力音声の劣化を最小限に抑えるため、適切にゲイン符号語の並べ換えが行われる。
【0090】
例えば、ゲイン符号に1ビット誤りを実際に与えたときに生じる劣化の大きさの期待値を計算し、さらに、ランダムに選択した2つのゲイン符号語を交換したときに生じる劣化の大きさの期待値を計算し、前者の期待値と比べて後者の期待値が減少するときに実際にゲイン符号語の格納順序を交換する。
この作業を期待値の減少が微小になるまで繰り返す。
【0091】
ただし、ゲイン符号帳57,71に格納されているゲイン符号語については、各ゲイン符号語のパワーを調査し、そのパワーを基準にして、ゲイン符号帳57,71に格納されているゲイン符号語の格納順序を更新する。
即ち、ゲイン符号帳57,71に格納されているゲイン符号語のパワーをそれぞれ調査すると(ステップST1)、既にゲイン符号語の並べ換えを完了しているゲイン符号帳52,66に格納されているゲイン符号語のパワーの順位と同じ順番になるように、ゲイン符号帳57,71に格納されているゲイン符号語の格納順序を並べ換える処理を実行する(ステップST2)。
【0092】
図4の各ゲイン符号帳は既に並べ換えが完了したものである。ゲイン符号帳52,66では、例えば、インデックスが「0」に対応するゲイン符号語のパワー(評価値)順位が「41」であるので、ゲイン符号帳57,71ではパワー(評価値)順位が「41」のゲイン符号語が「0」のインデックスに対応するように格納されている。
インデックスが「1」以降のゲイン符号語についても同様にして、格納順序が並び換えられる。
【0093】
図5は多重化部60から出力される音声符号の一例を示す説明図である。
多重化部60では、LSP符号,モード情報,ゲイン符号,駆動音源符号及び適応音源符号を多重化して(ただし、適応音源符号は第一の符号化モードの場合に限り多重化の対象に含められる)、音声符号を生成するが、この実施の形態1では、符号化モードが第一の符号化モードであっても、第二の符号化モードであっても、ゲイン符号の符号化ビット数と、ゲイン符号の多重化位置とが変化しないように音声符号を生成している。
【0094】
ここで、音声符号化装置が第一の符号化モードで符号化して生成した音声符号(図5(a)を参照)に伝送誤りが重畳することにより、その音声符号が図5(b)に示すように変化した場合を想定する。
この場合、音声復号化装置は、符号化モードが第二の符号化モードであると誤認して、入力音声の復号化処理を実施するが、上述したように、符号化モードが第一の符号化モードであっても、第二の符号化モードであっても、ゲイン符号の符号化ビット数と、ゲイン符号の多重化位置とが変化しないように音声符号を生成しているので、モード情報に伝送誤りが生じても、音声復号化装置はゲイン符号の値を正確に認識することができる。図5の例では、モード情報の誤認の有無に拘わらず、ゲイン符号の値が2になる。
【0095】
したがって、音声復号化装置におけるゲイン符号帳66,71は、モード情報に伝送誤りが生じても、同一値のゲイン符号に対応するゲイン符号語(ゲイン値)を出力することができる。また、ゲイン符号帳66,71に格納されているゲイン符号語は、上述したように、パワー値順位が同じ順番になるように並べ換えられているので、モード情報に伝送誤りが生じても、同一値のゲイン符号を入力できれば、出力するゲイン値の大きさが極端に変化することはない。
【0096】
以上で明らかなように、この実施の形態1によれば、ゲイン符号帳52,66(または57,71)のゲイン符号語の格納順序が、他のゲイン符号帳57,71(または52,66)のゲイン符号語に関する評価値の順位と相応して、並び換えられているように構成したので、音声符号化装置においては、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、音声の再生品質の劣化を抑制することが可能な音声符号を生成することができる効果を奏する。一方、音声復号化装置においては、モード情報を誤認しても、音声の再生品質の劣化を抑制することができる効果を奏する。
【0097】
また、この実施の形態1によれば、ゲイン符号語に関する評価値として、そのゲイン符号語のパワー又は平均振幅を用いるように構成したので、音声符号化装置においては、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、音声復号化装置により再生される音声のパワーや振幅が大きく劣化することのない音声符号を生成することができる効果を奏する。一方、音声復号化装置においては、モード情報を誤認しても、音声のパワーや振幅の大きな劣化を招くことなく、音声を再生することができる効果を奏する。
【0098】
さらに、この実施の形態1によれば、ゲイン符号帳52,66,57,71が音源ゲイン(ゲイン値)を出力する符号帳であるように構成したので、音声符号化装置においては、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、音声復号化装置により再生される音声のゲイン値が大きく劣化することのない音声符号を生成することができる効果を奏する。一方、音声復号化装置においては、モード情報を誤認しても、音声のゲイン値の大きな劣化を招くことなく、音声を再生することができる効果を奏する。
【0099】
実施の形態2.
図6はこの発明の実施の形態2による音声符号化装置を示す構成図であり、図において、図1と同一符号は同一または相当部分を示すので説明を省略する。
81はスペクトル符号化部43により量子化されたLSPからモード情報を決定する音源モード選択部、82は音源モード選択部81からモード情報を受けると、そのモード情報にしたがって駆動音源符号帳51が出力する駆動符号ベクトル又は駆動音源符号帳56が出力する駆動符号ベクトルを選択するとともに、ゲイン符号帳52が出力するゲイン値又はゲイン符号帳57が出力するゲイン値を選択する切換スイッチである。
【0100】
83は切換スイッチ82により選択されたゲイン値を適応音源符号帳50が出力する適応符号ベクトルに乗算する乗算器、84は切換スイッチ82により選択されたゲイン値を切換スイッチ82により選択された駆動符号ベクトルに乗算する乗算器、85は乗算器83の乗算結果と乗算器84の乗算結果を加算し、その加算結果(仮の音源)を出力する加算器である。なお、音源モード選択部81,切換スイッチ82,乗算器83,84及び加算器85は符号化手段を構成する。
【0101】
図7はこの発明の実施の形態2による音声復号化装置を示す構成図であり、図において、図2と同一符号は同一または相当部分を示すので説明を省略する。
91はスペクトル復号化部74により量子化されたLSPからモード情報を決定する音源モード選択部、92は音源モード選択部91からモード情報を受けると、そのモード情報にしたがって駆動音源符号帳65が出力する駆動符号ベクトル又は駆動音源符号帳70が出力する駆動符号ベクトルを選択するとともに、ゲイン符号帳66が出力するゲイン値又はゲイン符号帳71が出力するゲイン値を選択する切換スイッチである。
【0102】
93は切換スイッチ92により選択されたゲイン値を適応音源符号帳64が出力する適応符号ベクトルに乗算する乗算器、94は切換スイッチ92により選択されたゲイン値を切換スイッチ92により選択された駆動符号ベクトルに乗算する乗算器、95は乗算器93の乗算結果と乗算器94の乗算結果を加算し、その加算結果(仮の音源)を出力する加算器である。なお、音源モード選択部91,切換スイッチ92,乗算器93,94及び加算器95は復号化手段を構成する。
【0103】
次に動作について説明する。
上記実施の形態1では、切換スイッチ59(または73)が音源復号化部48(または62)が出力する仮の音源又は音源復号化部49(または63)が出力する仮の音源を選択して、その選択した仮の音源を合成フィルタ44(または75)に出力するものについて示したが、図6及び図7に示すように、切換スイッチ82(または92)が駆動音源符号帳51(または65)の駆動符号ベクトル又は駆動音源符号帳56(または70)の駆動符号ベクトルを選択して乗算器83(または93)に出力するとともに、ゲイン符号帳52(または66)のゲイン値又はゲイン符号帳57(または71)のゲイン値を選択して乗算器84(または94)に出力し、加算器85(または95)が乗算器83(または93)の乗算結果と乗算器84(または94)の乗算結果を加算し、その加算結果を仮の音源として合成フィルタ44(または75)に出力するようにしてもよい。
この場合でも、上記実施の形態1と同様の効果を奏することができる。
【0104】
ただし、ゲイン符号帳57,71に格納されているゲイン符号語は、ゲイン符号帳52,66に格納されているゲイン符号語と同様に、適応符号ベクトルと駆動符号ベクトルに乗じる2個のゲイン値の組を示す符号語から構成されているものとする。
【0105】
なお、上記実施の形態1では、各ゲイン符号帳のゲイン符号語の格納順序を並べ換えるものについて示したが、これに限るものではなく、パワー符号帳やLSP符号帳などのベクトル符号帳についても、モード毎に異なる符号帳を使用する構成であれば、各符号語のパワーや振幅を評価値として、その順位が一致するように並び換えられた符号帳を使用する構成も可能である。
【0106】
また、2つの符号帳の評価値順位については、順位の差が小さい範囲であれば、完全に一致していなくてもよく、同様の効果を奏することができる。
また、上記の方法で2つの符号帳の評価値順位を一致させた後に、2つの符号帳中の符号語を同時に並べ換えて、ゲイン符号にビット誤りが重畳したときの劣化を最小限に抑制するなど、様々な方法で並び換えを行うことが可能である。
【0107】
実施の形態3.
上記実施の形態1では、ゲイン符号帳52,66及びゲイン符号帳57,71に格納されているゲイン符号語の格納順序を図4に示すように並べ換えるものについて示したが、図8に示すように並べ換えるようにしてもよい。
【0108】
具体的には、ゲイン符号帳52,66には128個のゲイン符号語を格納し、ゲイン符号帳57,71には256個のゲイン符号語を格納する。
ゲイン符号帳52,66に格納されているゲイン符号語は、適応符号ベクトルと駆動符号ベクトルに乗じる2個のゲイン値の組を示す符号語から構成され、ゲイン符号帳57,71に格納されているゲイン符号語は、駆動符号ベクトルに乗じる1個のゲイン値を示す符号語から構成されている。
【0109】
インデックスと、インデックスの上位7ビットの値と、評価値順位とは、各ゲイン符号帳内に実際には格納されていないものであるが、説明の便宜のため記載している。インデックスは上の符号語から順番に0から127の値、または、0から255の値となっている。
インデックスの上位7ビットの値は、例えば、インデックスが「0」又は「1」の場合に「0」となり、インデックスが「2」又は「3」の場合に「1」となるように、2つずつが同じ値を持っている。
【0110】
評価値はゲイン符号語のパワー(2乗和)の値であり(評価値としては、ゲイン符号語のパワーに限るものではなく、ゲイン符号語の平均振幅などでもよい)、ゲイン符号帳52,66については、各ゲイン符号語の評価値順位が示されている。ゲイン符号帳57,71については、インデックスの上位7ビットが同じ値である2つのゲイン符号語における評価値の平均値に関する順位が評価値平均順位として示されている。
【0111】
各ゲイン符号帳の動作としては、あるゲイン符号を入力すると、そのゲイン符号に一致するインデックス位置に格納しているゲイン符号語を出力する。
各ゲイン符号帳に格納されているゲイン符号語は、学習用音声とその符号化音声との歪みが小さくなるように学習して作成される。
そして、ゲイン符号帳52,66については、音声符号を伝送する際の符号誤りによる出力音声の劣化を最小限に抑えるため、適切にゲイン符号語の並べ換えを行う。
【0112】
例えば、ゲイン符号に1ビット誤りを実際に与えたときに生じる劣化の大きさの期待値を計算し、さらに、ランダムに選択した2つのゲイン符号語を交換したときに生じる劣化の大きさの期待値を計算し、前者の期待値と比べて後者の期待値が減少するときに実際にゲイン符号語の格納順序を交換する。
この作業を期待値の減少が微小になるまで繰り返す。
【0113】
ゲイン符号帳57,71については、最初に、ゲイン符号帳52,66と同様に、音声符号を伝送する際の符号誤りによる出力音声の劣化を最小限に抑えるために、適切にゲイン符号語の並べ換えを行う。
次に、その時点でインデックスの上位7ビットが同じ値となる2つのゲイン符号語を対とする。そして、各ゲイン符号語対のパワーの平均値を求め、ゲイン符号帳57,71におけるパワーの平均値の順位を調べて、既にゲイン符号語の並べ換えが完了しているゲイン符号帳52,66のゲイン符号語のパワー順位と同じ順番になるように、ゲイン符号帳57,71中のゲイン符号語対を並べ換える。
【0114】
図8の各ゲイン符号帳は既に並べ換えが完了したものである。ゲイン符号帳52,66では、例えば、インデックスが「0」に対応するゲイン符号語のパワー(評価値)順位が「41」であるので、ゲイン符号帳57,71ではパワー(評価値)平均順位が「41」のゲイン符号語対が「0」のインデックスに対応するように格納されている。
インデックスが「1」以降のゲイン符号語についても同様にして、格納順序が並び換えられる。
【0115】
図9は多重化部60から出力される音声符号の一例を示す説明図である。
多重化部60では、LSP符号,モード情報,ゲイン符号,駆動音源符号及び適応音源符号を多重化して(ただし、適応音源符号は第一の符号化モードの場合に限り多重化の対象に含められる)、音声符号を生成するが、この実施の形態3では、符号化モードが第一の符号化モードの場合はゲイン符号の符号化ビット数が「7」であり、第二の符号化モードの場合はゲイン符号の符号化ビット数が「8」である。ただし、第一の符号化モードにおけるゲイン符号7ビットと、第二の符号化モードにおけるゲイン符号の上位7ビットの多重化位置が一致するように音声符号を生成している。
【0116】
ここで、音声符号化装置が第一の符号化モードで符号化して生成した音声符号(図9(a)を参照)に伝送誤りが重畳することにより、その音声符号が図9(b)に示すように変化した場合を想定する。
この場合、音声復号化装置は、符号化モードが第二の符号化モードであると誤認して、入力音声の復号化処理を実施するが、上述したように、第一の符号化モードにおけるゲイン符号7ビットと、第二の符号化モードにおけるゲイン符号の上位7ビットの多重化位置が一致するように音声符号を生成しているので、モード情報に伝送誤りが生じても、音声復号化装置はゲイン符号の値を正確に認識することができる。
【0117】
即ち、符号化モードが第一の符号化モードであるため、図9(a)に示すように、ゲイン符号の値が「1」であり、モード情報に伝送誤りがなければ、ゲイン符号帳66のインデックスが「1」であるゲイン符号語(評価値順位が「102」の符号語)を用いて復号処理を行う。
しかし、モード情報に伝送誤りが生じると、符号化モードが第二の符号化モードであると誤認するが、この実施の形態3では、誤認の有無に拘わらず、ゲイン符号帳71のインデックスの上位7ビットが「1」であるゲイン符号語を用いて復号処理を行うことになる。具体的には、図9(b)に示すように、ゲイン符号の次のビットが「0」であるため、インデックスが「2」(=1×2+0)であるゲイン符号語(評価値順位が「102」の符号語)を用いて復号処理を行うことになる。
【0118】
したがって、音声復号化装置におけるゲイン符号帳66,71は、モード情報に伝送誤りが生じても、評価値順位と評価値平均順位が一致又は略一致するゲイン符号に対応するゲイン符号語(ゲイン値)を出力することができるので、モード情報に伝送誤りが生じても、出力するゲイン値の大きさが極端に変化することはない。
【0119】
これにより、上記実施の形態1と同様の効果を奏することができる。
なお、この実施の形態3では、図1の音声符号化装置及び図2の音声復号化装置に適用するものについて示したが、上記実施の形態2のように、図6の音声符号化装置及び図7の音声復号化装置に適用するようにしてもよい。
【0120】
実施の形態4.
図10はこの発明の実施の形態4による符号語配列方法が適用する符号語配列装置を示す構成図であり、図において、101は駆動音源符号帳51,65に相当する駆動音源符号帳、102は駆動音源符号帳56,70に相当する駆動音源符号帳、103,104は合成フィルタ、105は距離計算部、106は距離計算部105の計算結果(評価値の偏差の合計値)が減少して最小化するまで、駆動音源符号帳102に格納されている符号語である駆動符号ベクトルの格納順序を更新する符号語入れ換え部である。
【0121】
次に動作について説明する。
駆動音源符号帳101については、上記実施の形態1におけるゲイン符号帳52等と同様に、音声符号を伝送する際の符号誤りによる出力音声の劣化を最小限に抑えるために、予め適切な符号語の並べ換えを実施する。
また、駆動音源符号帳101,102を使用して、多くの学習用の音声信号を入力とする音声符号化処理を実施し、各フレーム毎に、合成フィルタ103,104のためのフィルタ係数、駆動音源符号語、ゲイン値を学習用データとして、別途蓄積する。
【0122】
まず、距離計算部105は、上記学習用データに含まれる各フレーム毎の駆動音源符号を駆動音源符号帳101,102に出力し、フィルタ係数を合成フィルタ103,104に出力する。
【0123】
駆動音源符号帳101は、距離計算部105から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力し、合成フィルタ103は、距離計算部105から出力されたフィルタ係数を用いて、その駆動符号ベクトルに対する合成フィルタリングを実施して第一の合成音を生成する。
駆動音源符号帳102は、距離計算部105から駆動音源符号を受けると、その駆動音源符号に対応する駆動符号ベクトルを出力し、合成フィルタ104は、距離計算部105から出力されたフィルタ係数を用いて、その駆動符号ベクトルに対する合成フィルタリングを実施して第二の合成音を生成する。
【0124】
距離計算部105は、合成フィルタ103により生成された第一の合成音と合成フィルタ104により生成された第二の合成音との距離をフレーム毎に計算し、全フレームの距離値を合計して、その合計距離を符号語入れ換え部106に出力する。
【0125】
符号語入れ換え部106は、距離計算部105が合計距離を出力すると、その合計距離を記憶する。ここまでが図10の符号語配列装置の初期化処理である。続いて行われる繰返し処理は以下の通りである。
【0126】
符号語入れ換え部106は、ランダムに選択した2つの駆動音源符号に対応する駆動音源符号帳102の符号語の入れ換えを実施する。
距離計算部105は、再度、上記学習用データに含まれる各フレーム毎の駆動音源符号を駆動音源符号帳101と符号語の入れ換えが行われた駆動音源符号帳102に出力し、フィルタ係数を合成フィルタ103,104に出力する。
【0127】
そして、距離計算部105は、同様にして生成された第一の合成音と第二の合成音を合成フィルタ103,104から入力し、第一の合成音と第二の合成音との距離をフレーム毎に計算し、全フレームの距離値を合計して、その合計距離を符号語入れ換え部106に出力する。
【0128】
符号語入れ換え部106は、距離計算部105から合計距離を受けると、その合計距離と、予め記憶しておいた合計距離とを比較する。合計距離が減少している場合には、今回入力した合計距離を新たに記憶し、合計距離が減少していない場合には、前回の符号語の入れ換えを元に戻す処理を実施する。そして、上記繰返し処理の最初に戻る。
ここまでの繰返し処理を合計距離の減少が少なくなるまで繰り返し、駆動音源符号帳102の符号語の並び換えを完了する。
【0129】
以上で明らかなように、この実施の形態4によれば、距離計算部105により計算された合計距離が減少して最小化するまで、駆動音源符号帳102の符号語の入れ換えを実施するように構成したので、音声符号化装置においては、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、所定の評価値に関する劣化の期待値が小さくなり、その結果、音声の再生品質の劣化を抑制することが可能な音声符号を生成することができる効果を奏する。一方、音声復号化装置においては、モード情報を誤認しても、所定の評価値に関する劣化の期待値が小さくなり、その結果、音声の再生品質の劣化を抑制することができる効果を奏する。
また、符号化時と復号化時に異なる駆動音源符号帳が使用された場合でも、所定評価値に関する劣化の期待値が低い復号結果を与えることができるベクトル符号帳が得られる効果も奏する。
【0130】
なお、この実施の形態4では、距離計算部105における距離としては、2つの合成音におけるサンプル毎の値の差の2乗和、聴覚重み付けを行った2つの合成音におけるサンプル毎の値の差の2乗和、2つの合成音のパワー差など様々なものを適用することができる。
また、ここでは、駆動音源符号帳101,102に関する並び換えについて説明したが、ゲイン符号帳、LSP符号帳などの他の符号帳についても、複数備えてモード切換を実施する場合には、同様な逐次交換処理によって符号語を並べ換えるようにしてもよい。
【0131】
実施の形態5.
図11はこの発明の実施の形態5による音声符号化装置を示す構成図であり、図12はこの発明の実施の形態5による音声復号化装置を示す構成図である。図において、図1及び図2と同一符号は同一または相当部分を示すので説明を省略する。
111は歪み最小化部47による更新後のゲイン符号をマッピングし、マッピング後のゲイン符号をゲイン符号帳57に出力するマッピング部、112は分離部61により分離されたゲイン符号をマッピングし、マッピング後のゲイン符号をゲイン符号帳71に出力するマッピング部である。
なお、マッピング部111,112はマッピング手段を構成している。
【0132】
次に動作について説明する。
まず、音声符号化装置のマッピング部111は、歪み最小化部47からゲイン符号を受けると、所定のルールにしたがって写像処理を実施し、そのゲイン符号に対応する写像ゲイン符号(マッピング後のゲイン符号)をゲイン符号帳57に出力する。
ただし、この実施の形態5におけるゲイン符号帳57は、上記実施の形態1におけるゲイン符号帳57のような評価順位を基準とするゲイン符号語の並べ換えが実施されていないものとする。即ち、ゲイン符号帳57の格納順序が図17(b)に示す通りであるとする。
【0133】
ゲイン符号帳57は、マッピング部111から写像ゲイン符号を受けると、その写像ゲイン符号に一致するインデックス位置に格納されているゲイン符号語を出力する。
ただし、この実施の形態5では、上記実施の形態1におけるゲイン符号語と同様の並べ換え結果を得ることができるように、マッピング部111は、図13に示すようなマッピング用テーブルを備えている。
【0134】
例えば、図13のマッピング用テーブルの場合、マッピング部111が「0」のゲイン符号を入力すると、「1」の写像ゲイン符号を出力する。
これにより、ゲイン符号帳57は、「1」の写像ゲイン符号に対応する評価値順位が「41」のゲイン値を出力することになる(図17(b)を参照)。
したがって、上記実施の形態1におけるゲイン符号帳57が出力するゲイン値と同一のゲイン値が得られる。
なお、音声符号化装置のその他の動作は上記実施の形態1と同様であるため説明を省略する。
【0135】
次に、音声復号化装置のマッピング部112は、分離部61からゲイン符号を受けると、所定のルールにしたがって写像処理を実施し、そのゲイン符号に対応する写像ゲイン符号(マッピング後のゲイン符号)をゲイン符号帳71に出力する。
ただし、この実施の形態5におけるゲイン符号帳71は、上記実施の形態1におけるゲイン符号帳71のような評価順位を基準とするゲイン符号語の並べ換えが実施されていないものとする。即ち、ゲイン符号帳71の格納順序が図17(b)に示す通りであるとする。
【0136】
ゲイン符号帳71は、マッピング部112から写像ゲイン符号を受けると、その写像ゲイン符号に一致するインデックス位置に格納されているゲイン符号語を出力する。
ただし、この実施の形態5では、上記実施の形態1におけるゲイン符号語と同様の並べ換え結果を得ることができるように、マッピング部112は、図13に示すようなマッピング用テーブルを備えている。
【0137】
例えば、図13のマッピング用テーブルの場合、マッピング部112が「0」のゲイン符号を入力すると、「1」の写像ゲイン符号を出力する。
これにより、ゲイン符号帳71は、「1」の写像ゲイン符号に対応する評価値順位が「41」のゲイン値を出力することになる(図17(b)を参照)。
したがって、上記実施の形態1におけるゲイン符号帳71が出力するゲイン値と同一のゲイン値が得られる。
なお、音声復号化装置のその他の動作は上記実施の形態1と同様であるため説明を省略する。
【0138】
以上で明らかなように、この実施の形態5によれば、ゲイン符号をマッピングし、マッピング後のゲイン符号をゲイン符号帳57,71に出力するマッピング部111,112を設けるように構成したので、ゲイン符号語の格納順序を予め評価値を基準にして更新することなく、更新後の格納順序と等価な状態を構築することができる効果を奏する。
【0139】
また、マッピング部111,112の写像を複数用意して、音声符号に重畳する誤り条件に最適な写像を使用するようにした場合には、メモリ量を大きく増やすことなく、幅広い誤り条件下で品質劣化の少ない音声符号化装置と音声復号化装置が得られる効果を奏する。
【0140】
なお、この実施の形態5では、ゲイン符号帳57,71の前段に限りマッピング部111,112を設けるものについて示したが、ゲイン符号帳52,66の前段にもマッピング部111,112を設けるようにしてもよい。また、ゲイン符号帳52,66の前段に限りマッピング部111,112を設けるようにしてもよい。
【0141】
また、ゲイン符号帳以外の符号帳の前段にマッピング部111,112を導入する構成も可能であるし、図6の音声符号化装置及び図7の音声復号化装置におけるゲイン符号帳の前段にマッピング部111,112を導入する構成も可能である。
【0142】
さらに、ここで導入したマッピング部111,112の写像を固定とせず、音声符号に対して外部で適用される誤り訂正符号の条件に従って、複数の写像を切り換えて使用する構成も可能である。例えば、モード情報が強く保護されている場合には、ゲイン符号帳57,71を単独でビット誤りに強いように設計した写像を適用し、モード情報の保護が弱い場合には、これまで説明してきた方法によってモード情報を誤ったときの劣化を抑制するように写像を設計すればよい。
【0143】
図14は2つの写像を切り換えて使用する場合の2つのマッピング用テーブルを示す説明図である。第一のマッピング用テーブル(図14(a)を参照)は、モード情報が強く保護されている場合に使用するものであり、ゲイン符号帳57,71が既に単独でビット誤りに強いように設計しておくことで、写像によって符号が変化しないようになっている。第二のマッピング用テーブル(図14(b)を参照)は、モード情報の保護が弱い場合に使用するものであり、図13のマッピング用テーブルと同じものである。なお、第一のマッピング用テーブルは省略して、写像を行うか否かを切り換える方法でも構わない。
【0144】
【発明の効果】
以上のように、この発明によれば、複数の符号帳が他の符号帳の符号語に関する評価値の順位と相応して、符号語の格納順序が並び換えられているように構成したので、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、音声の再生品質の劣化を抑制することが可能な音声符号を生成することができる効果がある。
【0145】
この発明によれば、符号語に関する評価値として、その符号語のパワー又は平均振幅を用いるように構成したので、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、音声復号化装置により再生される音声のパワーや振幅が大きく劣化することのない音声符号を生成することができる効果がある。
【0146】
この発明によれば、複数の符号帳が音源ゲインを出力する符号帳であるように構成したので、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、音声復号化装置により再生される音声のゲイン値が大きく劣化することのない音声符号を生成することができる効果がある。
【0147】
この発明によれば、複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値が最小となるように、複数の符号帳の符号語の格納順序が並び換えられているように構成したので、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、所定の評価値に関する劣化の期待値が小さくなり、その結果、音声の再生品質の劣化を抑制することが可能な音声符号を生成することができる効果がある。
【0148】
この発明によれば、符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うように構成したので、音声の再生品質の劣化を抑制することが可能な音声符号を生成することができる効果がある。
【0149】
この発明によれば、インデックスをマッピングするマッピング手段を有し、少なくとも1以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の順位を基準にして更新することなく、更新後の格納順序と等価な状態を構築するように構成したので、事前にゲイン符号語の格納順序を更新する処理が不要になる効果がある。
【0150】
この発明によれば、インデックスをマッピングするマッピング手段を有し、少なくとも1以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の偏差の合計値が最小となるように更新することなく、更新後の格納順序と等価な状態を構築するように構成したので、事前にゲイン符号語の格納順序を更新する処理が不要になる効果がある。
【0151】
この発明によれば、複数の符号帳が他の符号帳の符号語に関する評価値の順位と相応して、符号語の格納順序が並び換えられているように構成したので、モード情報を誤認しても、音声の再生品質の劣化を抑制することができる効果がある。
【0152】
この発明によれば、符号語に関する評価値として、その符号語のパワー又は平均振幅を用いるように構成したので、モード情報を誤認しても、音声のパワーや振幅の大きな劣化を招くことなく、音声を再生することができる効果がある。
【0153】
この発明によれば、複数の符号帳が音源ゲインを出力する符号帳であるように構成したので、モード情報を誤認しても、音声のゲイン値の大きな劣化を招くことなく、音声を再生することができる効果がある。
【0154】
この発明によれば、複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値が最小となるように、複数の符号帳の符号語の格納順序が並び換えられているように構成したので、モード情報を誤認しても、所定の評価値に関する劣化の期待値が小さくなり、その結果、音声の再生品質の劣化を抑制することができる効果がある。
【0155】
この発明によれば、符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うように構成したので、音声の再生品質の劣化を抑制することができる効果がある。
【0156】
この発明によれば、インデックスをマッピングするマッピング手段を有し、少なくとも1以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の順位を基準にして更新することなく、更新後の格納順序と等価な状態を構築するように構成したので、事前にゲイン符号語の格納順序を更新する処理が不要になる効果がある。
【0157】
この発明によれば、インデックスをマッピングするマッピング手段を有し、少なくとも1以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の偏差の合計値が最小となるように更新することなく、更新後の格納順序と等価な状態を構築するように構成したので、事前にゲイン符号語の格納順序を更新する処理が不要になる効果がある。
【0158】
この発明によれば、各符号帳の符号語に関する評価値を調査し、他の符号帳の符号語に関する評価値の順位と相応して、少なくとも1以上の符号帳の符号語の格納順序を並び換えるように構成したので、伝送誤りが発生して、音声復号化装置がモード情報を誤認しても、音声の再生品質の劣化を抑制することができる符号帳が得られる効果がある。
【0159】
この発明によれば、符号語に関する評価値として、その符号語のパワー又は平均振幅を用いるように構成したので、音声のパワーや振幅の大きな劣化を招くことなく、音声を再生することができる符号帳が得られる効果がある。
【0160】
この発明によれば、複数の符号帳が音源ゲインを出力する符号帳であるように構成したので、音声のゲイン値の大きな劣化を招くことなく、音声を再生することができる符号帳が得られる効果がある。
【0161】
この発明によれば、複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値を計算し、その合計値が減少して最小化するまで、少なくとも1以上の符号帳の符号語の格納順序を更新するように構成したので、モード情報を誤認しても、所定の評価値に関する劣化の期待値が小さくなり、その結果、音声の再生品質の劣化を抑制することができる符号帳が得られる効果がある。
【0162】
この発明によれば、符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うように構成したので、音声の再生品質の劣化を抑制することができる符号帳が得られる効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による音声符号化装置を示す構成図である。
【図2】 この発明の実施の形態1による音声復号化装置を示す構成図である。
【図3】 この発明の実施の形態1による符号語配列方法を示すフローチャートである。
【図4】 音声符号化装置及び音声復号化装置により使用されるゲイン符号帳の一例を示す説明図である。
【図5】 多重化部から出力される音声符号の一例を示す説明図である。
【図6】 この発明の実施の形態2による音声符号化装置を示す構成図である。
【図7】 この発明の実施の形態2による音声復号化装置を示す構成図である。
【図8】 ゲイン符号帳の一例を示す説明図である。
【図9】 多重化部から出力される音声符号の一例を示す説明図である。
【図10】 この発明の実施の形態4による符号語配列方法が適用する符号語配列装置を示す構成図である。
【図11】 この発明の実施の形態5による音声符号化装置を示す構成図である。
【図12】 この発明の実施の形態5による音声復号化装置を示す構成図である。
【図13】 マッピング用テーブルを示す説明図である。
【図14】 マッピング用テーブルを示す説明図である。
【図15】 従来の音声符号化装置を示す構成図である。
【図16】 従来の音声復号化装置を示す構成図である。
【図17】 従来の音声符号化装置及び音声復号化装置により使用されるゲイン符号帳の一例を示す説明図である。
【符号の説明】
41 前処理部(符号化手段)、42 スペクトル分析部(符号化手段)、43 スペクトル符号化部(符号化手段)、44 合成フィルタ(符号化手段)、45 減算器(符号化手段)、46 聴覚重み付け部(符号化手段)、47 歪み最小化部(符号化手段)、48 音源復号化部(符号化手段)、49 音源復号化部(符号化手段)、50 適応音源符号帳、51 駆動音源符号帳、52 ゲイン符号帳、53 乗算器、54 乗算器、55 加算器、56 駆動音源符号帳、57 ゲイン符号帳、58 乗算器、59 切換スイッチ(符号化手段)、60 多重化部(多重化手段)、61 分離部(分離手段)、62 音源復号化部(復号化手段)、63 音源復号化部(復号化手段)、64 適応音源符号帳、65 駆動音源符号帳、66 ゲイン符号帳、67 乗算器、68 乗算器、69 加算器、70 駆動音源符号帳、71 ゲイン符号帳、72 乗算器、73 切換スイッチ(復号化手段)、74 スペクトル復号化部(復号化手段)、75 合成フィルタ(復号化手段)、76 後処理部(復号化手段)、81 音源モード選択部(符号化手段)、82 切換スイッチ(符号化手段)、83 乗算器(符号化手段)、84 乗算器(符号化手段)、85 加算器(符号化手段)、91 音源モード選択部(復号化手段)、92 切換スイッチ(復号化手段)、93 乗算器(復号化手段)、94 乗算器(復号化手段)、95 加算器(復号化手段)、101 駆動音源符号帳、102 駆動音源符号帳、103合成フィルタ、104 合成フィルタ、105 距離計算部、106 符号語入れ換え部、111 マッピング部(マッピング手段)、112 マッピング部(マッピング手段)。

Claims (19)

  1. インデックスに対応する符号語を出力する複数の符号帳のうち、モード情報に対応する符号帳を選択し、その符号帳が出力する符号語を用いて、入力音声をフレーム毎に符号化する符号化手段と、上記符号化手段の符号化結果をビット列に多重化する多重化手段とを備えた音声符号化装置において、上記複数の符号帳は、他の符号帳の符号語に関する評価値の順位と相応して、符号語の格納順序が並び換えられていることを特徴とする音声符号化装置。
  2. 符号語に関する評価値として、その符号語のパワー又は平均振幅を用いることを特徴とする請求項1記載の音声符号化装置。
  3. 複数の符号帳は、音源ゲインを出力する符号帳であることを特徴とする請求項1または請求項2記載の音声符号化装置。
  4. インデックスに対応する符号語を出力する複数の符号帳のうち、モード情報に対応する符号帳を選択し、その符号帳が出力する符号語を用いて、入力音声をフレーム毎に符号化する符号化手段と、上記符号化手段の符号化結果をビット列に多重化する多重化手段とを備えた音声符号化装置において、上記複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値が最小となるように、上記複数の符号帳の符号語の格納順序が並び換えられていることを特徴とする音声符号化装置。
  5. 符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うことを特徴とする請求項1から請求項4のうちのいずれか1項記載の音声符号化装置。
  6. インデックスをマッピングするマッピング手段を有し、少なくとも1以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の順位を基準にして更新することなく、更新後の格納順序と等価な状態を構築することを特徴とする請求項1記載の音声符号化装置。
  7. インデックスをマッピングするマッピング手段を有し、少なくとも1以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の偏差の合計値が最小となるように更新することなく、更新後の格納順序と等価な状態を構築することを特徴とする請求項4記載の音声符号化装置。
  8. ビット列に多重化された符号化結果からインデックスを分離する分離手段と、上記分離手段により分離されたインデックスに対応する符号語を出力する複数の符号帳のうち、任意の符号帳を選択し、その符号帳が出力する符号語を用いて、その符号化結果を復号化する復号化手段とを備えた音声復号化装置において、上記複数の符号帳は、他の符号帳の符号語に関する評価値の順位と相応して、符号語の格納順序が並び換えられていることを特徴とする音声復号化装置。
  9. 符号語に関する評価値として、その符号語のパワー又は平均振幅を用いることを特徴とする請求項8記載の音声復号化装置。
  10. 複数の符号帳は、音源ゲインを出力する符号帳であることを特徴とする請求項8または請求項9記載の音声復号化装置。
  11. ビット列に多重化された符号化結果からインデックスを分離する分離手段と、上記分離手段により分離されたインデックスに対応する符号語を出力する複数の符号帳のうち、任意の符号帳を選択し、その符号帳が出力する符号語を用いて、その符号化結果を復号化する復号化手段とを備えた音声復号化装置において、上記複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値が最小となるように、上記複数の符号帳の符号語の格納順序が並び換えられていることを特徴とする音声復号化装置。
  12. 符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うことを特徴とする請求項8から請求項11のうちのいずれか1項記載の音声復号化装置。
  13. インデックスをマッピングするマッピング手段を有し、少なくとも1以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の順位を基準にして更新することなく、更新後の格納順序と等価な状態を構築することを特徴とする請求項8記載の音声復号化装置。
  14. インデックスをマッピングするマッピング手段を有し、少なくとも1以上の符号帳がマッピング後のインデックスに対応する符号語を出力することにより、複数の符号帳の符号語の格納順序を予め評価値の偏差の合計値が最小となるように更新することなく、更新後の格納順序と等価な状態を構築することを特徴とする請求項11記載の音声復号化装置。
  15. インデックスに対応する符号語を出力する複数の符号帳のうち、モード情報に対応する符号帳を選択し、その符号帳が出力する符号語を用いて、入力音声をフレーム毎に符号化し、その符号化結果をビット列に多重化する音声符号化装置、または、ビット列に多重化された符号化結果からインデックスを分離し、そのインデックスに対応する符号語を出力する複数の符号帳のうち、任意の符号帳を選択し、その符号帳が出力する符号語を用いて、その符号化結果を復号化する音声復号化装置に対して、上記複数の符号帳を搭載する際、各符号帳の符号語に関する評価値を調査し、他の符号帳の符号語に関する評価値の順位と相応して、少なくとも1以上の符号帳の符号語の格納順序を並び換える符号語配列方法。
  16. 符号語に関する評価値として、その符号語のパワー又は平均振幅を用いることを特徴とする請求項15記載の符号語配列方法。
  17. 複数の符号帳が音源ゲインを出力する符号帳であることを特徴とする請求項15または請求項16記載の符号語配列方法。
  18. インデックスに対応する符号語を出力する複数の符号帳のうち、モード情報に対応する符号帳を選択し、その符号帳が出力する符号語を用いて、入力音声をフレーム毎に符号化し、その符号化結果をビット列に多重化する音声符号化装置、または、ビット列に多重化された符号化結果からインデックスを分離し、そのインデックスに対応する符号語を出力する複数の符号帳のうち、任意の符号帳を選択し、その符号帳が出力する符号語を用いて、その符号化結果を復号化する音声復号化装置に対して、上記複数の符号帳を搭載する際、上記複数の符号帳間の対応する各符号語に関する評価値の偏差の合計値を計算し、その合計値が減少して最小化するまで、少なくとも1以上の符号帳の符号語の格納順序を更新する符号語配列方法。
  19. 符号語から音源を生成して、その音源から合成音を生成する場合、その合成音に関する期待値を評価値として取り扱うことを特徴とする請求項15または請求項18記載の符号語配列方法。
JP2000040127A 2000-02-17 2000-02-17 音声符号化装置、音声復号化装置及び符号語配列方法 Expired - Fee Related JP3808270B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000040127A JP3808270B2 (ja) 2000-02-17 2000-02-17 音声符号化装置、音声復号化装置及び符号語配列方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000040127A JP3808270B2 (ja) 2000-02-17 2000-02-17 音声符号化装置、音声復号化装置及び符号語配列方法

Publications (2)

Publication Number Publication Date
JP2001228888A JP2001228888A (ja) 2001-08-24
JP3808270B2 true JP3808270B2 (ja) 2006-08-09

Family

ID=18563570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000040127A Expired - Fee Related JP3808270B2 (ja) 2000-02-17 2000-02-17 音声符号化装置、音声復号化装置及び符号語配列方法

Country Status (1)

Country Link
JP (1) JP3808270B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7752052B2 (en) 2002-04-26 2010-07-06 Panasonic Corporation Scalable coder and decoder performing amplitude flattening for error spectrum estimation
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
WO2009016816A1 (ja) * 2007-07-27 2009-02-05 Panasonic Corporation 音声符号化装置および音声符号化方法

Also Published As

Publication number Publication date
JP2001228888A (ja) 2001-08-24

Similar Documents

Publication Publication Date Title
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
JP3134817B2 (ja) 音声符号化復号装置
JP4958780B2 (ja) 符号化装置、復号化装置及びこれらの方法
US20080297380A1 (en) Signal decoding apparatus and signal decoding method
JPH11249698A (ja) 音声音楽信号の符号化装置および復号装置
JPH1091194A (ja) 音声復号化方法及び装置
KR20070029754A (ko) 음성 부호화 장치 및 그 방법과, 음성 복호화 장치 및 그방법
JP3357795B2 (ja) 音声符号化方法および装置
JP2005338200A (ja) 音声・楽音復号化装置および音声・楽音復号化方法
US5970444A (en) Speech coding method
US6768978B2 (en) Speech coding/decoding method and apparatus
JP2002268696A (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JP3746067B2 (ja) 音声復号化方法及び音声復号化装置
JP3808270B2 (ja) 音声符号化装置、音声復号化装置及び符号語配列方法
WO2000063878A1 (fr) Codeur de parole, processeur de parole et procede de traitement de la parole
US6842732B2 (en) Speech encoding and decoding method and electronic apparatus for synthesizing speech signals using excitation signals
JP3088163B2 (ja) Lsp係数の量子化方法
KR100341398B1 (ko) 씨이엘피형 보코더의 코드북 검색 방법
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JPH11259098A (ja) 音声符号化/復号化方法
JPH06202697A (ja) 励振信号の利得量子化方法
JP2004101588A (ja) 音声符号化方法及び音声符号化装置
JP3102017B2 (ja) 音声符号化方法
JP3166697B2 (ja) 音声符号化・復号装置及びシステム
WO2000003385A1 (fr) Codeur/decodeur vocal

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060418

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060517

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees